Original size 1024x1536

Анализ косметических продуктов

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

Популярность косметических продуктов за последние несколько лет резко возросла. В связи с этим на рынке, особенно в интернете, появилось гораздо больше брендов и косметических продуктов. Мне было интересно изучить тенденций онлайн-маркетинга в косметической индустрии, поэтому я начала искать датасеты на сайте Kaggle.com. По России датасетов не нашлось, поэтому я решила изучить Индийскую косметическую индустрию. Это для меня актуально, ведь многие люди моего возраста за последний год побывали в Индии и даже привозили мне какие-то косметические продукты. Все они говорили, что Индия — это другой мир. Поэтому мне интересно было бы изучить эту тему.

Для анализа я использовала такие типы визуализаций: 1. Столбчатый график 2. Гистограмма 3. Диаграмма рассеивания 4. График boxplot 5. Горизонтальная столбчатая диаграмма

Именно эти типы визуализаций помогли максимально раскрыть предоставляемый анализ данных и помочь в структурировании повествования.

Цветовая палитра

Цвета для визуализаций я взяла исходя из собственного представления о косметических средствах. Хотелось создать ощущение чистоты, но при этом не забывать про яркость Индии. Эта яркость вылилась в основной цвет графиков — розовый цвет.

big
Original size 1385x389

Этапы работы

Сначала я загрузила датасет в Google.colab и начала обработку данных. Проверила датасет на нулевые значения, они там оказались. Поэтому пришлось их очистить для оптимизации обработки данных. После этого я перешла к визуализации данных.

Визуализация данных

Визуализация данных идет по логичному ходу анализа данных. Так, например, вторая и третья диаграммы напрямую связаны с темой цен. А последняя точечная диаграмма говорит уже не о косметических средствах, как таковых, а о ТОП десяти популярных брендов.

Столбчатый график

В графике были использованы: - Частотный анализ категориальных данных. Для каждой категории косметических товаров было подсчитано количество представленных продуктов. - Сравнительный анализ категорий ассортимента. Диаграмма позволяет выявить доминирующие товарные категории (например, уход за кожей) и менее представленные сегменты рынка.

0

На графике представлен столбчатый график, отображающий количество товаров по категориям. По нему видно, что наибольшее число продуктов относится к категории skincare, тогда как категория hair представлена значительно слабее остальных. Это говорит о том, что основной фокус ассортимента косметических товаров смещён в сторону средств по уходу за кожей, в то время как товары для волос занимают меньшую долю рынка.

Гистограмма

В графике были использованы:

- Частотный анализ количественной переменной (price).Это позволило выявить форму распределения цен на индийском рынке косметики. - Анализ формы распределения. Гистограмма используется для выявления асимметрии распределения, концентрации наблюдений в определённых ценовых сегментах и наличия «длинного хвоста» (редких, но очень дорогих товаров).

0

Это гистограмма распределения цен косметических продуктов.

Она показывает, что большая часть товаров сосредоточена в нижнем ценовом диапазоне, а по мере роста цены, количество продуктов резко снижается. Также видно, что число дорогих товаров значительно меньше, что означает что основной массив потребителей предпочитают более доступную косметику, чем премиальный сегмент.

Диаграмма рассеивания

В графике были использованы: — Анализ взаимосвязи между количественными переменными. Диаграмма рассеяния применялась для исследования зависимости между ценой продукта и его пользовательским рейтингом. - Исследовательский корреляционный анализ. Без построения формальной регрессионной модели график позволяет визуально оценить наличие или отсутствие положительной корреляции между ценой и качеством.

0

Диаграмма рассеивания иллюстрирует связь между ценой и рейтингом продукта. Точки на графике показывают, что высокая цена не гарантирует высокий рейтинг, так как большинство оценок сосредоточено в диапазоне 3–5 вне зависимости от стоимости, что не удевительно, поскольку и товаров в данной ценовой категории гораздо больше. При этом основная масса товаров с высокими рейтингами находится в среднем и низком ценовом сегменте, а среди дорогих продуктов встречаются как высоко, так и низко оценённые товары. Это еще раз подтверждает вывод из второго графика о том, что больше всего люди пользуются косметикой среднего и низкого ценового сегмента. Отсюда большее количество отзывов и оценок, следовательно меньший разброс по шкале.

График boxplot

В графике были использованы: — Квартильный анализ рейтингов. Для каждой товарной категории были рассчитаны медиана, первый и третий квартили, что позволило сравнить центральные тенденции и вариативность рейтингов между категориями. — Межкатегориальный сравнительный анализ. Boxplot даёт возможность сопоставить распределения рейтингов разных категорий (уход за кожей, волосы, лицо и т. д.), выявляя категории с более устойчиво высокими или, наоборот, неоднородными оценками.

0

График boxplot отражает распределение пользовательских рейтингов по категориям. На нём видно, что медианные значения рейтингов во всех категориях находятся в диапазоне от 4 до 4.5, что в целом говорит о высокой удовлетворённости покупателей. При этом присутствуют выбросы как с низкими, так и с высокими оценками, особенно в категориях body и lips, что показывает неоднородность качества продуктов внутри категорий.

Горизонтальная столбчатая диаграмма

В графике использовались: — Агрегация данных по брендам. Для каждого бренда было рассчитано общее количество представленных товаров, что позволило оценить масштабы присутствия брендов на индийском рынке косметики. — Анализ структуры предложения. График отражает концентрацию ассортимента и позволяет оценить уровень рыночной конкуренции: наличие брендов с большим ассортиментом не исключает существование множества менее крупных, но активных игроков.

0

Горизонтальная столбчатая диаграмма, показывает топ-10 брендов по количеству представленных товаров. На нём отчётливо видно доминирование бренда Sephora Collection, который явно опережает остальные бренды по числу продуктов. Остальные участники рейтинга представлены более равномерно, что указывает на высокую конкуренцию между брендами среднего масштаба. При этом продукты Sephora все еще достаточно доступные, в то время как косметические средства бренда Dior это люкс сегмент, который доступен не каждому.

Вывод

В ходе анализа было выяснено, что ассортимент косметических товаров очень широкий и разнообразный. Больше всего продуктов относится к категории ухода за кожей, а меньше всего — к товарам для волос. Основная часть косметики продаётся по относительно низким и средним ценам, а дорогие товары встречаются редко. Стоит отметить, что высокая цена не гарантирует высокий рейтинг. В целом данные говорят о том, что покупатели чаще выбирают доступную косметику с хорошими отзывами, а не просто дорогие продукты. Рейтинги у большинства продуктов высокие, обычно в диапазоне от 4 до 5, что говорит о хорошем качестве товаров. Самые крупные бренды представлены большим количеством товаров, но рынок остаётся конкурентным. Данный анализ, подкрепляемый визуализациями в виде диаграмм, помог показать тенденции онлайн-маркетинга в косметической индустрии в Индии.

Описание применения генеративной модели

Adobe Color использовался для создания цветовой палитры и определения цветов, используемых в проекте.

ChatGPT 5.2 использовался для оптимизации и генерации фрагментов кода. Примеры вопросов: «Графики в python, с чего начать анализ датасета?», «Функции для рисования графиков?», «Помоги изменить цвет графика на розовый.», «Что такое boxplot?». А также для выявления используемых статистических методов в диаграммах и помощи при описании графиков. Также с помощью ChatGPT я создала обложку. Промт: Преобразуй данный кусок графика в более качественное изображение с фоном потемнее. Убери пунктирные линии, но оставь прозрачность эллементов

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more