
Введения
Для анализа были выбраны два набора данных: данные о времени, проведенном в социальных сетях, количестве лайков, постов и подписок (файл social_media_usage.csv), а также данные о возрасте пользователей, их стране и времени, проведенном в приложениях (файл social-media.csv). Эти данные были найдены в открытых источниках и содержат информацию о поведении пользователей в социальных сетях. Мне было интересно проанализировать эти данные, так как я веду блог и активно использую социальные сети. Понимание того, как пользователи взаимодействуют с платформами, помогает улучшить контент и стратегию продвижения. Эти данные также имеют ценность для маркетологов, разработчиков и владельцев платформ.
Для визуализации данных были выбраны следующие типы графиков: гистограмма распределения пользователей по возрасту, круговая диаграмма популярности платформ, тепловая карта активности пользователей по платформам, пузырьковая диаграмма зависимости лайков и постов от времени и линейный график изменения активности пользователей по возрасту. Эти графики были выбраны, так как они позволяют наглядно представить сложные зависимости и сделать выводы о поведении пользователей.
Данные были обработаны с использованием библиотек Python, таких как pandas, matplotlib и seaborn.Для обработки данных и корректировки кода использовались инструменты, такие как DeepSeek, которые помогли ускорить процесс и улучшить качество визуализации. Графики были стилизованы с использованием определенной палитры цветов (#DE4616, #FFBAC2, #AAA9D5, #165938, #358198), чтобы сделать их визуально привлекательными и согласованными. Эта палитра была выбрана для создания единого стиля всех графиков.
Гистограмма распределения пользователей по возрасту

Этот график показывает, как распределены пользователи по возрастным группам. Анализ показал, что наибольшая активность наблюдается среди пользователей в возрасте 18–30 лет. Это говорит о том, что молодежь является основной аудиторией социальных сетей. Вывод: Для привлечения большего числа пользователей стоит сосредоточиться на создании контента, который будет интересен именно этой возрастной группе.
Круговая диаграмма распределения пользователей по полу
Этот график демонстрирует долю пользователей, предпочитающих разные платформы. Анализ показал, что Instagram и TikTok являются самыми популярными платформами. Вывод: Instagram и TikTok — ключевые платформы для продвижения, и именно на них стоит сосредоточить основные усилия.
Тепловая карта среднего времени, проведенного пользователями на платформах
Этот график визуализирует, сколько времени пользователи проводят на разных платформах. Анализ показал, что пользователи проводят больше всего времени на TikTok и Instagram. Вывод: TikTok и Instagram не только популярны, но и удерживают пользователей дольше, что делает их идеальными платформами для вовлечения аудитории.
Пузырьковая диаграмма зависимости лайков и постов от времени, проведенного в приложении
Этот график показывает, как количество лайков и постов зависит от времени, проведенного в приложении. Анализ показал, что пользователи, которые проводят больше времени в приложении, оставляют больше лайков и постов. Вывод: Вовлеченность пользователей напрямую связана с временем, проведенным в приложении. Увеличение времени, которое пользователи проводят на платформе, может повысить их активность.
Линейный график изменения активности пользователей по возрасту
Этот график показывает, как активность пользователей меняется с возрастом. Анализ показал, что активность снижается с возрастом, особенно после 40 лет. Вывод: Пользователи старше 40 лет менее активны, что может быть связано с изменением интересов или привычек.
Заключение
Основные выводы проекта заключаются в том, что пользователи в возрасте 18–30 лет являются наиболее активной аудиторией, Instagram и TikTok — самые популярные платформы, на которых пользователи проводят больше всего времени, вовлеченность пользователей (лайки, посты) напрямую связана с временем, проведенным в приложении, а активность пользователей снижается с возрастом, что может быть связано с изменением интересов или привычек. На основе этих выводов можно дать рекомендации: уделить больше внимания платформам Instagram и TikTok, так как они наиболее популярны среди пользователей, разработать стратегии для удержания пользователей старше 40 лет, чтобы повысить их активность, и улучшить контент и функциональность приложений, чтобы стимулировать большее взаимодействие (лайки, посты).
Этот проект позволил проанализировать поведение пользователей в социальных сетях и сделать важные выводы для улучшения стратегий продвижения и взаимодействия с аудиторией. Визуализация данных с помощью графиков помогла наглядно представить сложные зависимости и сделать проект более понятным и информативным. Использование инструментов, таких как DeepSeek, значительно ускорило процесс обработки данных и улучшило качество визуализации. В будущем можно расширить анализ, включив больше данных о поведении пользователей в разных странах или на разных платформах, чтобы получить еще более глубокие insights.
Блокнот с кодом: https://disk.yandex.com/d/gmKsTwdrREJv7w
В проекте использовалась генеративная модель DeepSeek-V3 для ускорения обработки данных и улучшения качества визуализации. https://www.deepseek.com/
В проекте также использовался инструмент Perplexity для поиска открытых источников данных и ссылок на наборы данных, необходимых для анализа. https://www.perplexity.ai/