
Для анализа я выбрала тему: «Мировые привычки потребления мороженого».

Описание проекта:
Основная цель проекта — изучить, как сезон, температура, вкусовые предпочтения и состав продуктов влияют на продажи мороженого, а также найти необычные и редкие продукты с экзотическими ингредиентами.
Я выбрала эту тему по нескольким причинам: Во-первых, это связано с моим личным интересом. Я очень люблю мороженое и хотела узнать о нём больше. Во-вторых, мороженое пользуется популярностью во всём мире, но его потребление сильно варьируется в зависимости от климата и культурных особенностей. В-третьих, анализ данных о продажах, ингредиентах и рейтингах позволяет выявить скрытые закономерности, такие как сезонные пики, популярные вкусы или влияние состава продукта на его востребованность.

Я использовала два датасета для анализа этой темы. Мне пришлось расширить их количество до двух, чтобы провести более полный и интересный анализ. Первый набор данных содержит почасовые записи о продажах мороженого и соответствующие показания температуры. Он позволяет понять взаимосвязь между температурой и продажами мороженого в течение дня, а также проанализировать структуру продаж и влияние температуры на поведение потребителей.
Второй набор данных содержит подробную информацию (включая состав), изображения и отзывы о 241 вкусе мороженого четырёх брендов (Ben & Jerry’s, Häagen-Dazs, Breyers и Talenti).
Оба набора были найдены в интернет-ресурсе Кaggle.

Типы графиков:
1. Точечная диаграмма — связь продаж мороженого с температурой. Демонстрирует прямую зависимость между климатическими условиями и спросом. 2. Гистограмма продаж — позволяет выявить, есть ли аномально высокие пики продаж. 3. Горизонтальная столбчатая диаграмма — топ-10 продуктов по количеству отзывов. Наглядно показывает, какие товары наиболее востребованы у покупателей. 4. точечная диаграмма — корреляция рейтинга с числом ингредиентов. Помогает определить, влияет ли сложность рецептуры на популярность продукта. 5. Столбчатая диаграмма топ-10 редких ингредиентов — популярность сладостей с уникальными компонентами. Показывает редкие и экзотические блюда, их рейтинг и востребованность.
Для анализа данных временные параметры были агрегированы по часам и месяцам, что позволило выявить сезонные колебания в продажах. Для каждого продукта было подсчитано количество ингредиентов, а также выделены уникальные и «экзотические» компоненты.
При построении графиков использовались ключевые метрики: среднее значение, медиана и количество оценок. Статистические методы включали расчёт среднего (mean) и стандартного отклонения (std) для оценки среднего потребления, а также 95%-й доверительный интервал для обеспечения надёжности средних значений. Дополнительно был проведён корреляционный анализ для определения зависимости продаж от температуры. Сравнительный анализ по категориям и числу ингредиентов позволил выявить закономерности в предпочтениях потребителей и их предпочтениях.
Этапы работы
Загрузка и подготовка данных
Данные были загружены из CSV-файлов через платформу Google Colab. Для преобразования столбцов с числовыми значениями, таких как рейтинг, количество оценок и потребление, в числовой тип использовался метод pd.to_numeric библиотеки Pandas.
В ходе проекта применялся язык программирования Python совместно с библиотеками Pandas для анализа данных и визуализации. На начальном этапе была создана цветовая палитра, которая впоследствии использовалась для оформления графиков. Программа осуществляла загрузку данных и их последующее сохранение.
Для повышения эффективности работы над проектом я обращалась к ChatGPT, что позволило оптимизировать код и рассмотреть различные подходы к анализу данных.
Стилистика и оформление графиков
Все графики стилизованы в единой цветовой палитре, вдохновленной мороженым: Бежевый (цвет вафельного рожка) #FFF5E6 Кремовый #FFF1C8 Нежно-зеленый #A3C9A8 Нежно-розовый #F7D1D1 Шоколадный #4B3621
Цветовая палитра
Пример кода для настройки стиля
График 1: Зависимость продаж мороженого от температуры
График \ Пример кода
Исследование продаж мороженого в зависимости от температуры выявило чёткую положительную связь: при повышении температуры воздуха объёмы продаж увеличиваются. На графике видно, что в жаркие дни количество проданного мороженого значительно возрастает, тогда как в холодные дни продажи ощутимо снижаются. Это подтверждает традиционную закономерность потребления холодных десертов в летний период и подчёркивает важность учёта погодных условий при планировании производства и маркетинговых мероприятий.
График 2: Гистограмма распределения продаж
График \ Код
Гистограмма показывает распределение объёмов продаж мороженого за весь период наблюдения. На графике заметно, что основная масса продаж сконцентрирована вокруг среднего значения, но также есть дни с аномально высокими показателями. Эти всплески обычно приходятся на особенно жаркие дни или праздники, что подтверждает влияние внешних факторов на уровень спроса.
Анализ гистограммы помогает понять, насколько стабильны продажи в будние дни и как они могут значительно изменяться в определённые периоды. Это позволяет более точно прогнозировать запасы и планировать производство, а также выявлять «горячие» дни, когда спрос резко возрастает.
Таким образом, можно сделать вывод, что продажи мороженого характеризуются стабильным средним уровнем с редкими, но заметными всплесками. Это подчёркивает важность учёта сезонности и погодных условий при планировании бизнес-стратегии.
График 3: Топ-10 продуктов по количеству оценок
График \ Код
Горизонтальная столбчатая диаграмма демонстрирует, какие продукты пользуются наибольшей популярностью среди потребителей по количеству оценок. Как правило, это классические вкусы и известные бренды, которые широко известны и узнаваемы. Высокий уровень оценок указывает на доверие потребителей и значительную узнаваемость продукта. Такой анализ помогает выявить, какие товары привлекают наибольшее внимание аудитории и могут стать лидерами продаж.
График 4: Связь рейтинга с количеством ингредиентов
График \ Код
Точечная диаграмма показывает связь между рейтингом продукта и количеством используемых ингредиентов. На графике можно заметить слабую тенденцию: продукты с большим числом компонентов иногда имеют более высокие оценки, но не всегда. Размер точек, который отражает количество отзывов, позволяет увидеть, что наиболее популярные и высоко оцененные продукты сочетают как разнообразие ингредиентов, так и узнаваемость бренда. Это указывает на то, что разнообразие компонентов может влиять на рейтинг, однако главным фактором остаются качество и вкус продукта.
График 5: Популярность сладостей с редкими ингредиентами
График \ Код
Исследование топ-10 продуктов, содержащих необычные или редкие компоненты (такие как лаванда, сироп агавы и мятные кристаллы), показывает, что они редко пользуются массовым спросом. Это подтверждается небольшим числом оценок. Однако некоторые из этих продуктов получают высокие оценки, что свидетельствует о высоком качестве и удовлетворении потребностей узкой аудитории. Эти данные указывают на потенциал нишевых товаров для рынка ценителей необычных вкусов и открывают возможности для создания уникальных продуктов.
Вывод

В рамках исследования «Мировые привычки потребления мороженого» был проведен анализ спроса и вкусовых предпочтений с использованием двух датасетов: один включал данные о продажах в зависимости от времени и температуры, другой — оценки и состав популярных продуктов.
Исследование показало, что продажи мороженого напрямую зависят от температуры и времени года: в жаркие дни и в праздники спрос значительно возрастает. Гистограмма распределения продаж выявила, что большинство дней характеризуются средними объемами продаж, а экстремальные значения встречаются редко.
Анализ топ-10 продуктов, оцененных пользователями, позволил определить самые популярные вкусы и бренды. Исследование связи рейтинга с количеством ингредиентов показало, что разнообразие компонентов может повысить среднюю оценку продукта, а редкие ингредиенты привлекают внимание нишевой аудитории.
Проект позволил выявить основные тенденции в потреблении мороженого: влияние климатических условий и времени года, позиции ведущих компаний на рынке и потенциал для разработки уникальных продуктов. Эти данные могут быть полезны производителям при разработке производственных планов, маркетинговых стратегий и создании новых вкусов.