
Концепция
Недавно я пересматривала зарубежный сериал и поняла, что за всё время его просмотра, я смотрела не привычный для меня Netflix, а HBO, и именно это меня сподвигло провести анализ данного сервиса
Палитру я использовала чёрно-белую, вдохновляясь логотипом сервиса — черный текст на белом фоне, и подумала, что стоит сохранить этот минималистичный стиль в анализе

Исследование проведено на основе данных с ресурса Kuggle — HBO and HBO Max Content Dataset. Датасет содержит в себе данные о каждом фильме или сериале, который выпустила компания с 2010 до 2022 года: его название, тип, описание, год релиза, жанр, страна производства, IMDb-рейтинг.
Для визуализации данных я выбрала линейный график динамики выпуска контента, показывающий количество выпущенных фильмов и сериалов по годам, круговую диаграмму, показывающую разницу между количествами фильмов и сериалов в процентах, гистограмму для демонстрации оценок IMDb, словесное облако самых популярных жанров и столбчатую диаграмму, показывающую страны производства контента
Использование библиотек
Для работы с датасетом была использована библиотека pandas для работы с CSV-файлом, matplotlib.pyplot для визуализации данных, seaborn для стилизации графиков, wordcloud для создания словесного облака и kagglehub для работы с датасетом

Обработка данных
В датасете было значительное количество пропусков, поэтому была произведена обработка данных, чтобы убрать лишние пропуски и также отсортировать данные
Визуализация
На линейном графике мы видим количество выпущенных фильмов и сериалов по годам. Мы можем заметить, что количество выпускаемых фильмов сильно больше сериалов, но к 2022 году произошел их сильный спад
Круговая диаграмма демонстрирует нам соотношение фильмов и сериалов: сериалы составляют 32% контента, а фильмы — 68%, что удивляет, ведь многие сериалы HBO обладают огромной популярностью, а фильмы не так сильно на слуху
Гистограмма показывает нам распределение рейтингов IMDb для всего контента HBO, из чего можно сделать вывод, что большинство оценок сосредоточено в диапазоне 6.5–7.5
Облако слов изображает самые популярные жанры HBO: мы видим, что драма, комедия и драма занимают лидирующие позиции
Столбчатая диаграмма показывает нам стран-лидеров по производству контента HBO: США с огромным отрывом занимает первое место
Подводя итог, меня удивило, во-первых, то, что фильмы занимают значительную часть контента HBO, хотя я думала, что они вкладываются больше в сериалы, во-вторых рейтинги не самые высокие: 6,5-7,5 — достаточно средний показатель для такого популярного сервиса, а в-третьих — контрастность между жанрами — драма и комедия выпускалась больше всего
Описание применения генеративной модели
Для помощи с кодом был использован DeepSeek (https://chat.deepseek.com/) Обложка leonardo.ai (URL: https://app.leonardo.ai/image-generation) промпт: generate a black and white picture with a laptop on it with black writing on a white background HBO
Блокнот с кодом и датасет: https://drive.google.com/drive/folders/1fTev4e2aezx4qX38BpqBMgj6iubz-3WH