
Этот проект посвящен аналитике видео MrBeast на YouTube и показателям его канала. Датасет был найден на платформе kaggle. Я выбрала данный датасет из интереса к аналитике платформы YouTube и персоны Mr.Beast как феномена в интернете.

Цветовая палитра была выбрана с помощью Adobe Color по моим ощущениям она соответствует атмосфере Mr.Beast’a.
Первое что я создала это столбчатая диаграмма топ-10 видео по просмотрам с названием. Столбчатый график удобно отображает сравнение нескольких количественных показателей, что позволяет быстро оценить разброс и выделить лидеров.

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
df = pd.read_csv («/content/Mr Beast YT data.csv») top_10_videos = df.nlargest (10, 'views') plt.figure (figsize=(12, 6)) sns.barplot (x='views', y='title', data=top_10_videos, color='#FA9E73') plt.title ('Топ-10 видео по просмотрам') plt.xlabel ('Количество просмотров') plt.ylabel ('Название видео') plt.show ()
Следующим я создала точечную диаграмму. Точечная диаграмма отлично подходит для анализа взаимосвязи между двумя числовыми переменными. Такой график дает возможность визуально заметить корреляции или их отсутствие, выявить кластеры или необычные случаи.

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
df = pd.read_csv («/content/Mr Beast YT data.csv») df['published_time'] = pd.to_datetime (df['published_time'], errors='coerce')
plt.figure (figsize=(12, 6)) sns.scatterplot (x='published_time', y='views', data=df, alpha=0.5, color='#FAC873') plt.title ('Зависимость количества просмотров от времени публикации') plt.xlabel ('Время публикации') plt.ylabel ('Количество просмотров') plt.xticks (rotation=45) plt.tight_layout () plt.show ()
Следующий график решила сделать линейным. Он исследует зависимость количества просмотров и лайков. На данном графике можно заметить как увеличение просмотров увеличивает скачки в статистике и делает ее менее стабильной.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
df = pd.read_csv («/content/Mr Beast YT data.csv»)
plt.figure (figsize=(12, 6)) sns.lineplot (x='likes', y='views', data=df) plt.title ('Связь между количеством лайков и просмотрами') plt.xlabel ('Количество лайков') plt.ylabel ('Количество просмотров') plt.grid (True) plt.show ()
Следующий график который я сделала группированный столбчатый график, где для каждого видео отображаются две вертикальные полосы: одна указывает отношение лайков к просмотрам (FA9E73), другая — отношение комментариев к просмотрам (7A6D67). Использование боковых (группированных) столбцов позволяет сравнить показатели внутри одного видео и среди разных видео одновременно. В данном случае мы можем заметить как количество комментариев увеличивается, но не так сильно как лайки.
import pandas as pd import matplotlib.pyplot as plt
df = pd.read_csv («/content/Mr Beast YT data.csv») df['likes_ratio'] = df['likes'] / df['views'] df['comments_ratio'] = df['comments'] / df['views'] plt.figure (figsize=(12, 8)) bar_width = 0.4 indices = range (len (df)) plt.bar (indices, df['likes_ratio'], width=bar_width, color='#FA9E73', label='Лайки к просмотрам') plt.bar ([i + bar_width for i in indices], df['comments_ratio'], width=bar_width, color='#7A6D67', label='Комментарии к просмотрам') plt.xlabel ('Видео') plt.ylabel ('Отношение к просмотрам') plt.title ('Обратная связь аудитории: лайки и комментарии как показатель вовлеченности') plt.xticks ([i + bar_width / 2 for i in indices], videos, rotation=90) plt.legend () plt.tight_layout () plt.show ()
На основе данного анализа можно сделать вывод, что для продвижения важна комплексная работа над каналом, с чем Мистер Бит прекрасно справился.