Original size 1140x1600

Анализ YouTube каналов

PROTECT STATUS: not protected

Описание проекта

В своем проекте я анализировала каналы на YouTube 2023 году с целью выяснить какие каналы и ютуберы самые востребованные. Обложка для проекта была сгенерирована при помощи Leonardo Ai. Датасет содержаший информацию о ютубе за 2023 год https://www.google.com/url?q=https%3A%2F%2Fwww.kaggle.com%2Fdatasets%2Fnelgiriyewithana%2Fglobal-youtube-statistics-2023

df = pd.read_csv («Global YouTube Statistics.csv», delimiter=', ', encoding='windows-1251') df.head (10)

big
Original size 2818x790

Создаем палитру цветов для стилизации графиков и меняем семейство шрифтов на Pacifico

big
Original size 1404x664

Выведем количество юутберов для каждой категории

data = df['category'].value_counts () print (data)category Entertainment 241 Music 202 People & Blogs 132 Gaming 94 Comedy 69 Film & Animation 46 Education 45 Howto & Style 40 News & Politics 26 Science & Technology 17 Shows 13 Sports 11 Pets & Animals 4 Trailers 2 Nonprofits & Activism 2 Movies 2 Autos & Vehicles 2 Travel & Events 1 Name: count, dtype: int64

Отобразим на графиках «скрипка» топ 5 категорий, из них видно популярную и какие значения в сренднем подписчиков она набирает за месяц.

data = df.query («category in ('Entertainment', 'Music', 'People & Blogs', 'Gaming', 'Comedy')»)

fig = plt.figure (figsize=(10,10)) viol = sns.violinplot (data=data, x="subscribers_for_last_30_days», y="category», fill=False, palette=palette) plt.title ('Кол-во подписчиков за месяц для категории') plt.xlabel ('Кол-во подписчиков') plt.ylabel ('Категория') plt.show ()

Original size 1536x914

Отобразим этот же график в виде пончика, он красивый и более наглядно показывает разницу в процентах

data = df['category'].value_counts ()[: 5]

plt.pie (x=data.values, labels = data.index, colors = palette[2:], wedgeprops=dict (width=0.5), explode=[0.2]+[0]*(len (data) — 1), autopct='%.02f%%') plt.title ('Процент популярности категорий') plt.show ()

Original size 644x426

Точечный график показывает в каком году какой калан был создан с определнной категорией

plt.figure (figsize=(10,8)) scatter = sns.scatterplot (data=df.query ('created_year > 2000'), y="category», x="created_year», hue="category») scatter.set_xticklabels (scatter.get_xticklabels (), rotation=90) scatter.legend_.remove () plt.title ('В каком году был создан канал с определенной категорией') plt.xlabel ('Год создания') plt.ylabel ('Категория') plt.show ()

Original size 1290x794

Узнаем общее кол-во подписчиках на каналах с определенными категориями, для этого хорошо подойдет столбчатая диаграмма

categoryes = df['category'].unique ()

labels = [] values = [] for i in categoryes: data = df.query (f"category == '{i}'»)

sum = data['subscribers'].sum ()

values.append (sum) labels.append (i) fig = plt.figure (figsize=(10,10)) sns.barplot (x = values, y = labels, palette=palette) plt.title ('Кол-во подписчиков в категории') plt.xlabel ('Кол-во подписчиков') plt.ylabel ('Категория') plt.show ()

Original size 1250x922

В заключении используя круговую диаграмму можно посмотреть распределение каналов по странам

data_1 = df['Country'].value_counts ()[: 10]

fig = plt.figure (figsize=(5,10)) plt.pie (x=data_1.values, labels = data_1.index, colors = palette[2:], explode=[0]+[0.3]+[0.4]*(len (data_1) — 2), autopct='%.02f%%') plt.title ('Отношение кол-во видео в стране') plt.show ()

Original size 646x494
Анализ YouTube каналов
Project created at 08.10.2024
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more