Original size 1140x1600

Анализ потребителей в электронной коммерции

PROTECT STATUS: not protected
4

Описание

Для поиска темы я изучила сайт Kaggle и выбрала из существующих баз данных наиболее актуальную для меня, которая содержит информацию о поведении потребителей в сфере электронной коммерции.

Поскольку я сама непосредственно создаю сайты для e-commerce, мне стало интересным глубже изучить покупательское поведение.

Выбранный датасет включает в себя различные факторы, такие как демографические данные (возраст, пол, уровень дохода), покупательское поведение (категории покупок, суммы покупок, частота покупок), предпочтения (способ доставки, способ оплаты), взаимодействие с рекламой, лояльность к бренду и другие.

Цель моего анализа — выявить факторы, влияющие на покупательское поведение и лояльность клиентов в сфере электронной коммерции, чтобы предоставить рекомендации по улучшению маркетинговых стратегий, увеличению продаж и повышению удовлетворенности клиентов.

Для достижения цели анализа и проверки гипотезы, я предположила, что следующие виды графиков будут наиболее наглядны:

01 Гистограмма 02 Тепловая карта 03 Линейная диаграмма 04 Столбчатая диаграмма 05 Круговая диаграмма

big
Original size 1202x163

Цветовая гамма

Для визуализации данных я выбрала нейтральную холодную палитру, которая отлично подходит под тематику e-commerce. Выбор был составлен на основе личных ассоциаций и ни к чему не привязан.

Все графики были стилизованны под текстуру плотной бумаги, тем самым подчеркивая контраст с электронной коммерцией

Обработка данных

Первым шагом в анализе данных я импортировала библиотеку Pandas для работы с таблицами и загрузила данные из таблицы.

Далее с помощью кода вывожу начало таблицы (первые 5 строк), с целью: - увидеть, какие данные находятся в таблице. - проверить, правильно ли загрузились данные. - получить общее представление о данных, прежде чем начать их анализировать более детально.

Original size 1200x587

Следующим этапом я изучила и проанализировала данные

Представленный код: - перебирает каждый столбец в DataFrame df - выводит информацию о столбце Имя столбца. Тип данных столбца. Количество уникальных значений в столбце. Первые 5 уникальных значений в столбце (чтобы увидеть примеры значений)

По каждому столбцу я составила описание: Что означает этот столбец? Какие значения он может принимать? Является ли он числовым, категориальным или текстовым? Есть ли в этом столбце пропущенные значения? Единицы измерения (если есть)

Например, для столбца «Age»:

Столбец: Age - возраст покупателя - целые числа, возраст в годах - числовой тип данных - нужно проверить - годы

Original size 1200x474

ПРЕОБРАЗОВАНИЕ ДАННЫХ 1 Удалила символ $ в столбце Сумма покупки и преобразовала его в числовой тип, для удобства выполнения операций 2 Преобразовала столбец, в котором хранится информация о времени покупки в формат даты 3-4 Заменила часто встречающимся значением пропущенные 5-6 Проверила, что пропущенных значений больше нет. Чтобы в этом убедиться еще раз вывела первые строки

Когда все данные преобразованы и отсутствуют пропущенные строки, можно переходить к визуализации данных

Original size 1200x654

Визуализация данных

График № 1

0

Стандартная гистограмма, отражающая зависимость частоты совершаемых покупок от 1) возрастной категории, 2) суммы покупки

Original size 1200x614

Код для графика № 1

Стандартные гистограммы показывают, что значения распределены примерно одинаково по всему диапазону, то есть частота покупок не так сильно зависит от возраста или суммы покупки.

Однако на графике распределения по возрасту присутствуют небольшие пики в районе 25-30 и 35-40 лет. Это означает, что определенные возрастные группы все-таки активнее совершают покупки.

Что касается стоимости, то активнее покупают продукты с наименьшей стоимостью, затем со стоимостью выше среднего уровня и наиболее высокой.

График № 2

0

Тепловая карта, визуализирующая взаимосвязь времени, потраченного на изучение продукта, и суммы покупки | код для графика № 2

Тепловая диаграмма дает представление о том, как влияет количество времени, потраченного на изучение продукта, на на сумму покупки. На графике видно, что увеличение времени, проведенного за изучением, коррелирует с ростом суммы покупки. Максимум значения достигается на этом уровне. Однако, даже при минимальном времени, затраченном на изучение продукта, довольно активно совершаются импульсивные покупки.

График № 3

0

Линейная диаграмма, отображает объем покупок в течение года

В зависимости от месяца, покупатели совершают больше или меньше покупок. Это связано с количеством рабочих дней и сезонностью, соответственно платёжеспособность клиентов может меняться. Из графика видно, что начале года средний чек покупок находится на высоком уровне, что может свидетельствует о высоком интересе пользователей и большей платежеспособности, в отличие от летних и осенних месяцев, когда наблюдается резкий спад.

График № 4

0

Столбчатая диаграмма, показывающая зависимость частоты покупок в разных категориях необходимости товаров от уровня взаимодействия с рекламой

Столбчатая диаграмма сгруппирована по уровню взаимодействия с рекламой: от высокого до низкого. Наибольшая частота покупок в электронной коммерции приходится на продукты первой необходимости, при условии высокого уровня взаимодействия с рекламой. Однако импульсивные покупки совершаются практически одинаково часто, вне зависимости от контакта с рекламой бренда, а базовые «хотелки» приобретаются намного чаще при среднем уровне, в отличие от высокого.

График № 5

0

Круговая диаграмма для определения уровня зависимости количества покупок от степени образования покупателя

На круговой диаграмме наглядно показана зависимость частоты совершаемых в e-commerce покупок от уровня образования. По этим данным видно, что уровень образования практически не влияет на выбранный критерий. Но все же люди со степенью магистра на пару процентов реже совершают покупки. Предположу, что это связано с некой степенью осознанности, позволяющей (или нет) контролировать и анализировать свои траты. Но в целом, уровень образования не является критерием, по которому можно выявить статистику.

Заключение и выводы

Благодаря визуализации данных удалось наглядно продемонстрировать и проанализировать некоторые аспекты покупательского поведения:

- возрастная категория людей 25-30 и 35-40 лет наиболее активно покупает в e-commerce, по сравнению с остальными - самый дешевый и самый дорогой товар покупают одинаково часто — увеличение времени, проведенного за изучением, коррелирует с ростом суммы покупки, но имеют место импульсивные покупки - самые высокие чеки оставляют примерно весной, в середине лета и в начале осени, это самые высокооплачиваемые месяцы - уровень образования никак не влияет на то, сколько денег оставляют люди в интернет-магазинах. Значения практически одинаковы.

Надеюсь, эти выводы помогут применить новые стратегии в развитии продаж. Однако стоит учитывать, что эти данные могут отличаться в зависимости от направления. В любом случае, стоит помнить, что уровень вовлеченности в рекламу, чувствительность к скидкам, членство в программе лояльности и предпочтительный способ доставки оказывают значительное влияние на сумму покупок и частоту покупок клиентов.

Recraft.AI — генерация обложки

Chat GPT версия 4.0 — генерация инструкций и рекомендаций по улучшению кода, а также наиболее интересных векторов для анализа

Adobe Color — создание цветовой палитры

Анализ потребителей в электронной коммерции
4
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more