
Описание проекта
Мой проект по визуализации данных посвящён исследованию ценовых категорий и характеристик продукции знаменитого ювелирного дома Cartier. В качестве исходных данных для анализа я использовала набор информации о ценах и атрибутах изделий бренда, который был опубликован на платформе Kaggle. Этот датасет (ссылка на датасет) содержит подробные данные о различных ювелирных украшениях Cartier, включая материалы, стоимость, количество каратов и другие параметры, которые играют ключевую роль при определении цен на изделия.
Тема этого проекта мне близка, поскольку я всегда интересовалась миром ювелирных брендов. Cartier, как символ высокого качества и эксклюзивности, стал идеальным объектом для анализа, ведь его продукция сочетает в себе искусство и сложную экономику.
Целью работы было проанализировать и понять, какие категории изделий Cartier популярны среди покупателей. Я также пыталась выявить закономерности, которые помогут лучше понять структуру цен и спрос на продукцию компании.
Для визуализации данных я использовала несколько различных типов графиков:
1. Range Plot 2. Точечная диаграмма 3. Круговая диаграмма 4. Pyramid Chart
Кроме того, для оформления проекта была использована нейросеть recraft.ai (https://recraft.ai/) (https://www.recraft.ai/projects), с помощью которой я создала обложку с элементами, подчеркивающими изысканный стиль и престижность бренда. promt: Сartier jewelry. Elegant hands adorned with shimmering rings and bracelets, typing on a sleek laptop against a rich, red backdrop.
Серия фотографий ниже сделана с помощью recraft.ai. Я хотела узнать, как видит Сartier нейросеть
Цветовая палитра
Для создания визуальной концепции проекта я разработала собственную цветовую палитру, которая сочетает в себе элегантность и роскошь, соответствующие духу Cartier. Для этого я использовала инструменты Adobe Color (https://color.adobe.com/ru/ ), где собрала палитру на основе фирменного красного и других акцентных оттенков.
В процессе работы над палитрой я использовала следующие оттенки:
Для всего текста проекта был выбран шрифт CormorantGaramond, который гармонично сочетается с темой элегантности.
График 1: Линейный график — зависимость цены от материала
На этом графике показана зависимость цены ювелирных изделий Cartier от материала, из которого они изготовлены (платина, белое золото, розовое золото, желтое золото). Линейная тенденция помогает наглядно увидеть, как изменяется стоимость в зависимости от материала. Изделия из платины имеют значительно более высокую цену, что подтверждает их эксклюзивность и ценность.
График 1 Самые дешёвые, самые дорогие товары в категориях и их средняя цен
код график 1
График 2: Диаграмма рассеяния — влияние количества каратов на цену
На графике рассеяния отображена связь между количеством каратов и ценой изделий Cartier. Точки на графике демонстрируют, как увеличение количества каратов ведёт к росту стоимости изделий. Прямая зависимость между количеством каратов и ценой подтверждает, что более крупные бриллианты и драгоценные камни значительно увеличивают стоимость украшений.
График 2 Насколько сильно величина в каратах влияет на цену изделия
код график 2
График 3: Круговая диаграмма — распределение продукции по категориям
Этот график показывает, как распределяются различные типы изделий Cartier (кольца, браслеты, ожерелья и серьги) по количеству и популярности. Каждый сектор диаграммы представляет долю каждого типа изделия в ассортименте бренда. Наибольшая доля приходится на кольца, что указывает на их высокую популярность среди покупателей.
График 3 Распределение продукции Cartier по категориям
код график 3
График 4: Столбчатая диаграмма — сегментация ценовых категорий
Столбчатая диаграмма отображает распределение продукции Cartier по ценовым сегментам: низкий, средний и высокий. Этот график помогает понять, в каких сегментах рынка компания доминирует. Большинство изделий находятся в высоком ценовом сегменте, что подчеркивает ориентированность бренда на премиум-рынок.
График 4 Распределение изделий Cartier по ценовым сегмента
код график 4
Вывод по результатам исследования
В ходе анализа данных о продукции Cartier были выявлены несколько ключевых закономерностей, отвечающих на вопрос, как материалы, количество каратов и категории изделий влияют на цену и спрос. Во-первых, изделия из платины оказываются самыми дорогими, что подтверждает их высокий статус в ювелирной индустрии. Во-вторых, увеличение количества каратов значительно повышает цену, что подтверждает общую закономерность на рынке дорогих украшений. Третий важный вывод: кольца составляют наибольшую долю в ассортименте, что указывает на их высокую востребованность среди покупателей, особенно в контексте помолвок и свадеб. Наконец, большинство продукции ориентировано на премиум-сегмент, что подтверждает статус Cartier как люксового бренда.
В целом, исследование показало, что Cartier продолжает быть лидером среди эксклюзивных ювелирных брендов, фокусируясь на высококачественных материалах и продуктах для состоятельных клиентов.
Описание применения генеративной модели и вспомогательных инструментов 1. Google Colab — Весь процесс работы: обработка данных и визуализация.
2. Kaggle — Платформа была использована для поиска и загрузки датасета.
3. Цветовая палитра (Adobe Color)
4. Библиотеки Python pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — для расчёта трендовых линий и математических операций. kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта re — для обработки строковых данных.
5. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
6. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.
Использованные статистические методы
В ходе анализа данных были применены методы описательной и разведочной статистики:
Описательная статистика и анализ диапазонов — использовались для оценки минимальных, медианных и максимальных значений цен изделий Cartier в разрезе используемых материалов. Это позволило охарактеризовать ценовой диапазон и типичный уровень стоимости для каждого материала.
Сравнительный анализ категорий — реализован путём сопоставления ценовых характеристик изделий из различных материалов (жёлтое золото, белое золото, розовое золото, платина), что позволило выявить различия в ценовых профилях материалов.
Анализ распределений и устойчивых характеристик — применялся при использовании медианы в качестве центральной меры, что позволило снизить влияние экстремальных значений и получить более устойчивую оценку типичного уровня цен.
Визуальный анализ диапазонов значений — выполнен с помощью диапазонной (range) диаграммы, отображающей минимум, медиану и максимум цен, что обеспечило наглядное сравнение разброса цен между материалами.
Текстовый анализ и извлечение признаков — использовались для выделения информации о каратности изделий из текстовых описаний. Регулярные выражения позволили извлечь количественный признак из неструктурированных текстовых данных.
Визуальный анализ взаимосвязей — реализован с помощью диаграммы рассеяния для изучения зависимости между ценой изделия и его каратностью. Это позволило оценить характер связи между размером драгоценного камня и стоимостью изделия.
Анализ экстремальных наблюдений — применялся для идентификации наиболее дорогих изделий, которые были дополнительно выделены на диаграмме рассеяния, что позволило акцентировать внимание на верхнем ценовом сегменте.
Структурный анализ категориальных данных — использовался для изучения распределения продукции Cartier по категориям. Круговая диаграмма позволила оценить доли различных категорий изделий в общем ассортименте.
Квантильный анализ — применялся для сегментации изделий по ценовым уровням на основе медианы и верхних квантилей распределения цен. Такой подход позволил сформировать ценовые сегменты с учётом реальной структуры данных.
Сегментационный анализ — реализован путём распределения изделий по ценовым сегментам (низкий, средний, высокий и ультравысокий), что позволило оценить структуру ассортимента с точки зрения ценового позиционирования бренда.
Анализ долей и структурных показателей — использовался для расчёта относительных долей изделий в каждом ценовом сегменте, что позволило наглядно представить баланс между массовыми и премиальными категориями продукции.