
Введение
Этот проект посвящён анализу данных цветочного магазина. Меня заинтересовала эта тема, потому что цветочный бизнес имеет ярко выраженную сезонность и интересные экономические закономерности.
Что хочу выяснить:
Какие категории цветов приносят больше всего выручки? Как распределены продажи по сезонам? Есть ли закономерности в поведении клиентов? Какова маржинальность разных категорий?
Типы графиков:
Горизонтальная столбчатая диаграмма Линейный график с заливкой Сгруппированная диаграмма Box plot Кольцевая диаграмма Тепловая карта Кривая Парето
Подготовка среды
Загрузка данных

Обработка данных
В датасете только числовые Product_id, поэтому разобью их на категории цветов по диапазонам
Описательная статистика


Выручка по категориям
Лилии, пионы и хризантемы — лидеры по выручке. Выручка распределена достаточно равномерно между основными категориями
Динамика продаж
Выручка и прибыль идут параллельно — маржинальность стабильна. Заметны колебания, но без явного тренда
Сезонность
Средний чек стабилен, а вот количество выше в ноябре — предпраздничный период
Анализ маржинальности
Box plot показывает разброс маржи по категориям. Пионы и тюльпаны — с большим разбросом
Структура выручки
Топ-5 категорий формируют около 99% выручки. Распределение достаточно равномерное
Тепловая карта
Тепловая карта выявляет закономерности: март выделяется повышенными продажами, особенно во вторник
Анализ Парето
Правило Парето: около 58% клиентов формируют 80% выручки. Есть группа лояльных покупателей
Итоги
Проанализировав данные цветочного магазина, могу сделать такие выводы:
Лидеры — лилии, пионы и хризантемы. Выручка распределена равномерно между категориями
Сезонность — ноябрь и март показывают повышенную активность
Стабильная маржа — около 40%, колебания незначительные
Правило Парето — 58% клиентов дают 80% выручки
Активные дни — вторник и понедельник показывают повышенную активность
Для помощи с кодом и оформлением использовалась модель GPT-5.2 (OpenAI)