Original size 1140x1600

Как залететь в тренды? Анализ данных по вирусному контенту в соцсетях

PROTECT STATUS: not protected

Концепция

Сейчас, пожалуй, каждый из нас является активным пользователем социальных сетей, а многие и вовсе ведут и развивают свой блог, в качестве развлечения или работы. Однако фактом остается одно, главная валюта социальных сетей — это внимание пользователей. В связи с этим, мне стало интересно, что делает контент вирусным? Ответить на этот вопрос мне помог анализ базы данных с сайта Kaggle «Viral Social Media Trends & Engagement Analysis».

big
Original size 1664x928

В этой базе я нашла данные о динамике вирусных трендов в социальных сетях TikTok, Instagram, Twitter и YouTube, а также данные о популярных хештегах, типах контента и вовлеченности пользователей. Поэтому, я решила проследить зависимость популярности публикаций от платформы, на которой они публикуются, сопровождающих их хештегов и типа формата.

Для визуализации я использовала различные типы графиков, например линейную диаграмму для демонстрации динамики числа просмотров в зависимости от платформы, или круговую для показа процентного соотношения просмотров приходящийся на тот или иной хештег. Также были использованы столбчатые диаграммы и бабл чарт.

Подготовка к работе

Прежде всего, я загрузила датасет в Google Colab, чтобы с ним можно было работать, а затем подобрала цветовую палитру с помощью Adobe Color для будущих графиков и внедрила ее с помощью переменных.

big
Original size 1677x607

Загрузка датасета

Original size 1681x682

Создание кастомной палитры

Для своей работы я выбрала яркие цвета, которые ассоциируются с соц-сетями и отсылают к трендовому, «кричащему» контенту.

Original size 1871x881

цветовая палитра

График № 1

Прежде всего я решила выяснить, на какой платформе публикации увидит наибольшее количество людей. Для этого в линейной диаграмме были сопоставлены социальные сети и среднее количество просмотров на каждой из них. Выяснилось, что лидером, пусть и с небольшим отрывом, в этой категории является YouTube.

Original size 1189x690
Original size 1650x457

График № 2

Затем мне стало интересно, какие хештеги присвоены самым популярным видео. Для этого я составила круговую диаграмму с процентным соотношением в зависимости от количества просмотров.

Original size 992x876
Original size 1682x503

Данная диаграмма показала, что все хештеги находятся в примерно в равном соотношение в около 10%, однако в топ 3 по миру входят Fitness, Education и Challenge.

Original size 1376x768

График № 3

Однако рекомендации пользователей довольно сильно зависят не только от личных предпочтений, но и от региона, в котором они находятся. В связи с этим я также решила выделить самые популярные хештеги в разных странах, чтобы понять, что больше интересует людей там. Бабл чарт помог мне отследить количество просмотров, приходящееся на самый популярный хэштег в каждом регионе.

Original size 1180x790
Original size 1722x704
Original size 1738x441

Благодаря этому графику можно предположить какой контент стоит снимать для аудитории той или иной страны.

Графики № 4 и № 5

Далее я задалась вопросом: что больше влияет на вовлеченность пользователей, хештеги или тип формата? Чтобы ответить на него, я построила две гистограммы, которые иллюстрируют колебания уровня вовлеченности пользователей в зависимости от тегов и формы контента.

Original size 1189x690
Original size 1698x535
Original size 1189x690
Original size 1702x539

Судя по графикам, больший диапазон значений среднего уровня вовлеченности для различных хештегов, по сравнению с категориями типов контента, указывает на то, что хештеги оказывают более значительное влияние на уровень вовлеченности, чем типы контента. И хотя оба фактора играют роль, выбор хештега, по-видимому, приводит к более широкому спектру результатов среднего уровня вовлеченности.

Вывод

С помощью анализа датасета удалось выяснить, какой контент, где, и с какими тегами чаще становится популярен. Теперь можно смело идти покорять просторы интернета!

Ознакомиться с блокнотом можно здесь.

Original size 1152x836

Описание применения генеративных моделей

В ходе работы для написания кодов была использована встроенная в Google Colab модель Gemini, генерация всех изображений сделана с помощью Qwen.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more