Original size 1157x1600

HBO: Анализ контента, рейтингов и трендов 2010–2022 годов

PROTECT STATUS: not protected
6

Концепция

Недавно я пересматривала зарубежный сериал и поняла, что за всё время его просмотра, я смотрела не привычный для меня Netflix, а HBO, и именно это меня сподвигло провести анализ данного сервиса

Палитру я использовала чёрно-белую, вдохновляясь логотипом сервиса — черный текст на белом фоне, и подумала, что стоит сохранить этот минималистичный стиль в анализе

big
Original size 1414x765

Исследование проведено на основе данных с ресурса Kuggle — HBO and HBO Max Content Dataset. Датасет содержит в себе данные о каждом фильме или сериале, который выпустила компания с 2010 до 2022 года: его название, тип, описание, год релиза, жанр, страна производства, IMDb-рейтинг.

Для визуализации данных я выбрала линейный график динамики выпуска контента, показывающий количество выпущенных фильмов и сериалов по годам, круговую диаграмму, показывающую разницу между количествами фильмов и сериалов в процентах, гистограмму для демонстрации оценок IMDb, словесное облако самых популярных жанров и столбчатую диаграмму, показывающую страны производства контента

Использование библиотек

Для работы с датасетом была использована библиотека pandas для работы с CSV-файлом, matplotlib.pyplot для визуализации данных, seaborn для стилизации графиков, wordcloud для создания словесного облака и kagglehub для работы с датасетом

big
Original size 1200x600

Обработка данных

В датасете было значительное количество пропусков, поэтому была произведена обработка данных, чтобы убрать лишние пропуски и также отсортировать данные

Original size 1200x600

Визуализация

На линейном графике мы видим количество выпущенных фильмов и сериалов по годам. Мы можем заметить, что количество выпускаемых фильмов сильно больше сериалов, но к 2022 году произошел их сильный спад

0

Круговая диаграмма демонстрирует нам соотношение фильмов и сериалов: сериалы составляют 32% контента, а фильмы — 68%, что удивляет, ведь многие сериалы HBO обладают огромной популярностью, а фильмы не так сильно на слуху

0

Гистограмма показывает нам распределение рейтингов IMDb для всего контента HBO, из чего можно сделать вывод, что большинство оценок сосредоточено в диапазоне 6.5–7.5

0

Облако слов изображает самые популярные жанры HBO: мы видим, что драма, комедия и драма занимают лидирующие позиции

0

Столбчатая диаграмма показывает нам стран-лидеров по производству контента HBO: США с огромным отрывом занимает первое место

0

Подводя итог, меня удивило, во-первых, то, что фильмы занимают значительную часть контента HBO, хотя я думала, что они вкладываются больше в сериалы, во-вторых рейтинги не самые высокие: 6,5-7,5 — достаточно средний показатель для такого популярного сервиса, а в-третьих — контрастность между жанрами — драма и комедия выпускалась больше всего

Описание применения генеративной модели

Для помощи с кодом был использован DeepSeek (https://chat.deepseek.com/) Обложка leonardo.ai (URL: https://app.leonardo.ai/image-generation) промпт: generate a black and white picture with a laptop on it with black writing on a white background HBO

Блокнот с кодом и датасет: https://drive.google.com/drive/folders/1fTev4e2aezx4qX38BpqBMgj6iubz-3WH

HBO: Анализ контента, рейтингов и трендов 2010–2022 годов
6
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more