Original size 1140x1600

Продажи Fujifilm Instax. Как продаются моменты?

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

В проекте я использовала нейросети как вспомогательный инструмент: чтобы быстрее разобраться с pandas и matplotlib и улучшить внешний вид графиков. С их помощью я подбирала более читаемые подписи, сетку, легенды и общее оформление графиков. Все расчёты и анализ данных я выполняла самостоятельно в коде, а нейросети использовала только для улучшения визуализации.

Датасет был взят с платформы Kaggle, так как там удобно работать с готовыми табличными данными и их описанием. Я выбрала датасет с продажами Fujifilm Instax, потому что он похож на реальные розничные данные и содержит информацию о датах покупок, товарах, категориях, ценах, скидках, количестве и каналах продаж.

Этапы работы

1.1 Какие данные выбраны и где найдены

Датасет: Fujifilm Instax Sales Transaction Data (Synthetic) Источник: Kaggle (датасет про транзакции продаж Instax, синтетический).

Почему он интересен:

• Это типичный формат данных из ритейла/интернет-магазина: каждая строка — транзакция/покупка товара. • По нему можно решать реальные бизнес-вопросы: • как меняется выручка по времени (тренды/пики); • какие категории и товары дают основной вклад; • как часто применяются скидки и как они «участвуют» в выручке; • как устроена структура продаж по месяцам.

big
Original size 2480x1750
Original size 2480x418

Предобработка и создание новых признаков

Зачем каждая фича нужна:

• Tanggal в datetime — чтобы нормально группировать по времени и строить графики. • gross — сумма «до скидки» (цена × количество). • is_discounted — бинарный признак «есть скидка или нет», нужен для сравнения со скидкой vs без. • discount_rate — относительная скидка в процентах (через np.where, чтобы не делить на 0). • YearMonth — удобный ключ «месяц» для временных рядов: • .dt.to_period («M») берёт месяц, • .dt.to_timestamp () превращает обратно в дату (удобно для Matplotlib).

Original size 2480x1750

После df.info () видно:

• Всего строк: 12 334 • Пропусков нет (Non-Null Count везде 12334) → удобно для анализа. • Типы: • даты: Tanggal (datetime) • числовые: Harga_Satuan, Qty, Diskon_IDR, Total_Penjualan и т. д. • категориальные: Kategori, Nama_Produk, Lokasi_Toko, Metode_Bayar, Hari

Основные колонки (бизнес-смысл)

• Tanggal — дата покупки • Kategori — категория товара (например Kamera / Film / Aksesoris) • Nama_Produk — конкретный товар • Lokasi_Toko — канал продаж/магазин • Metode_Bayar — метод оплаты • Harga_Satuan — цена за единицу • Qty — количество • Diskon_IDR — скидка в IDR • Total_Penjualan — итоговая сумма продажи

Вывод EDA из info: пропусков нет → не нужно чистить NaN и типы данных корректные → можно группировать/агрегировать без проблем.

KPI

• Период: 01.05.2022 — 01.05.2025 • Транзакций: 12 334 • Выручка: 6 420 725 500 IDR • Продано единиц: 23 938 • Средний чек: ~520 571 IDR • Медианный чек: 270 750 IDR • Доля заказов со скидкой: ~0.291 (≈ 29%)

Как это интерпретировать:

• Средний чек сильно выше медианного → распределение чеков асимметричное: есть «дорогие» покупки (например камеры), которые тянут среднее вверх. • Примерно 29% заказов со скидкой → скидки используются заметно, и их влияние стоит анализировать отдельно (что ты и сделал в графике «со скидкой vs без скидки»).

Динамика и структура выручки

0

Структура выручки по категориям

0

ТОП-8 товаров по выручке

0

Выручка по месяцам: со скидкой и без скидки

0

ВЫВОД

В работе были построены несколько графиков, чтобы проанализировать выручку с разных сторон: её динамику, структуру, ключевые товары и влияние скидок. График динамики выручки по месяцам показывает общий тренд продаж, а также периоды роста и спада. Дополнительно выделен месяц с максимальной выручкой, чтобы определить пиковый период.

График структуры выручки по категориям позволяет увидеть, какие категории вносят наибольший вклад в общую выручку и как меняется их доля со временем. График топ-8 товаров по выручке помогает определить товары-лидеры, которые приносят основную часть дохода. График выручки со скидкой и без скидки показывает, какую роль скидки играют в формировании общей выручки и в какие месяцы их влияние становится более заметным.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more