
Введение:
В данном проекте исследуется, как менялась цена кроссовок бренда Nike с течением времени. Анализ проводится в контексте дизайна, используемых технологий и категорий моделей.
Кроссовки Nike являются не только спортивным продуктом, но и культурным феноменом, находящимся на пересечении дизайна, технологий и рынка. Изменение цен позволяет проследить, как трансформировалась ценность продукта и его позиционирование.
Данные:
Для анализа использован табличный датасет в формате CSV, содержащий информацию о моделях кроссовок Nike, годе выпуска, категории, используемых технологиях и цене.
Работа с данными выполнялась в среде Google Colab с использованием библиотеки Pandas.
Этапы работы:
Загрузка датасета в Google Colab.
Создание датафрейма и первичный анализ данных.
Группировка данных по годам, категориям и технологиям.
Расчёт средних значений цен.
Визуализация данных различными типами графиков.
Интерпретация полученных результатов.
1 — Картинка графика 2 — Короткий код (5–7 строк) 3 — Текстовое объяснение (2–3 предложения)

Средняя цена кроссовок Nike по годам
avg_price = df.groupby ('year')['price_usd'].mean ()
plt.plot (avg_price) plt.xlabel ('Год') plt.ylabel ('Цена (USD)')
Пояснение:
«Линейный график демонстрирует устойчивый рост средней цены кроссовок Nike с течением времени. Этот тренд может быть связан с развитием технологий, усложнением дизайна и изменением рыночного позиционирования бренда.»
Распределение цен по категориям
df.boxplot (column='price_usd', by='category') plt.xlabel ('Категория') plt.ylabel ('Цена (USD)')
Пояснение:
«Boxplot показывает различия в ценах между категориями кроссовок (basketball, running, lifestyle). Спортивные категории в среднем имеют более высокий ценовой диапазон.»
Средняя цена по технологиям
tech_price = df.groupby ('technology')['price_usd'].mean () tech_price.plot (kind='bar')
Пояснение:
«График отражает влияние используемых технологий на стоимость моделей. Более сложные технологические решения связаны с более высокой средней ценой.»
Связь года выпуска и цены
plt.scatter (df['year'], df['price_usd'], alpha=0.3) plt.xlabel ('Год') plt.ylabel ('Цена (USD)')
Пояснение:
«Диаграмма рассеяния иллюстрирует зависимость между годом выпуска и ценой модели. Более новые модели чаще находятся в более высоком ценовом диапазоне.»
Топ-10 самых дорогих моделей Nike
top_models = ( df.groupby ('model')['price_usd'] .mean () .sort_values (ascending=False) .head (10) )
top_models.plot (kind='bar')
Пояснение:
«График выделяет модели Nike с наибольшей средней ценой. Это позволяет определить ключевые силуэты, занимающие премиальное положение в линейке бренда.»
Статистические методы:
В проекте использовались методы описательной статистики:
1)вычисление средних значений
2)группировка данных
3)анализ распределений
Также применялся визуальный анализ данных для выявления тенденций и закономерностей.
Выводы:
«Анализ показал, что цена кроссовок Nike со временем возрастает. На стоимость моделей влияют как временной фактор, так и категория и используемые технологии.
Результаты подтверждают, что дизайн и технологические инновации играют ключевую роль в формировании ценности продукта.»
Описание применения генеративной модели:
В проекте использовалась генеративная модель ChatGPT (OpenAI) для помощи в структурировании анализа данных и формулировке текстовых пояснений. Все вычисления, визуализации и интерпретации данных были выполнены автором проекта.
Материалы проекта:
Все материалы проекта (датасет, код анализа и визуализации, итоговые графики)—
https://drive.google.com/file/d/1iUJLiuFLm9_YToKPH06ScGxcfc6nED7r/view?usp=sharing
Google Colab — https://colab.research.google.com/
Pandas — https://pandas.pydata.org/
Matplotlib — https://matplotlib.org/
ChatGPT (OpenAI) — https://openai.com/chatgpt