Original size 1140x1600

Анализ фильмов и сериалов Netflix

PROTECT STATUS: not protected
The project is taking part in the competition

В этом проекте проанализирован открытый датасет о фильмах и сериалах, представленных на стриминговой платформе Netflix. Анализ позволил проследить, как менялся каталог платформы со временем, какие жанры преобладают, как различаются фильмы и сериалы по продолжительности, а также какие страны вносят наибольший вклад в производство контента.

big
Original size 1024x1024

Внешний вид графиков и стиль проекта в целом вдохновлён интерфейсом Netflix и атмосферой вечернего просмотра фильмов. Тёмный фон и контрастные акценты отсылают к ситуации, когда пользователь выбирает фильм в затемнённой комнате, а каждый тайтл в каталоге воспринимается как отдельный светящийся элемент. При этом, как и сами фильмы и сериалы, визуальные элементы графиков отличаются по характеру и настроению.

big
Original size 1344x768

В исследовании использованы данные из открытого датасета Netflix Movies and TV Shows, опубликованного на платформе Kaggle. Датасет содержит информацию о каждом фильме и сериале, представленном на платформе: тип контента, год выпуска, дату добавления на Netflix, страну производства, жанры, возрастной рейтинг и продолжительность.

Для анализа применены такие данные, как тип контента (фильм или сериал), год выпуска, год добавления на платформу, продолжительность, жанры и страна производства.

Данные представлены в виде гистограмм с разным масштабом, чтобы наглядно показать распределения значений и выделить как наиболее массовые, так и редкие категории, линейной диаграммы для анализа изменения объёма контента во времени, а также точечной диаграммы для отображения взаимосвязей между количественными показателями, например между годом выпуска и продолжительностью фильмов.

Использование библиотек

В коде использованы библиотека pandas для работы с CSV-файлом и предварительной обработки данных, matplotlib.pyplot для построения основной визуализации, seaborn для дополнительной стилизации графиков, matplotlib.colors для работы с цветовой палитрой и прозрачностью элементов, а также matplotlib.patches для более детальной стилизации столбцов и акцентных элементов визуализации.

Original size 1904x1300

Обработка данных

В данных Netflix значения года выпуска (release_year) могут содержать различные проблемы: текстовые записи, специальные символы, слишком ранние или поздние годы, а также пропуски. Чтобы обеспечить точность анализа временной динамики контента, выполняется строгая проверка и фильтрация данных.

Original size 1996x708

В данных Netflix поле country часто содержит несколько стран через запятую (например, «United States, United Kingdom, Canada»), что затрудняет анализ. Для упрощения и стандартизации данных извлекается только первая (основная) страна производства.

Original size 1558x754

В данных Netflix продолжительность контента хранится в текстовом формате с указанием единиц измерения: «120 min» для фильмов или «2 Seasons» для сериалов. Для численного анализа необходимо преобразовать эти данные в чистые числа.

Original size 1818x1234

Для анализа временной динамики контента Netflix выполняется группировка данных по годам выпуска. Этот этап позволяет подготовить данные для построения графиков, показывающих как общую динамику, так и отдельные тренды для фильмов и сериалов.

Original size 2048x850

Далее — построение основы графика.

Original size 938x288

И подробная настройка внешнего вида графика — фон, оси, метки, значения, заливка и другая стилизация.

Original size 1056x548

Визуализация

0

Динамика добавления контента на Netflix по годам

На графике видна четкая тенденция резкого роста после 2015 года, когда Netflix начал активно инвестировать в собственное производство.

Фильмы (синие точки) всегда преобладают над сериалами (оранжевые точки), что соответствует общей структуре видеоконтента. Однако интересно отметить, что в последние годы разрыв сокращается — растет популярность сериального формата.

Красная линия тренда показывает экспоненциальный рост производства: если в начале 2000-х годов добавлялось несколько десятков позиций в год, то к 2020-м годам это число выросло до сотен и тысяч.

Особенно заметен скачок после 2013 года — периода начала «стриминговой революции», когда Netflix стал глобальным сервисом и начал активно конкурировать с традиционными студиями.

График демонстрирует как Netflix превратился из простого агрегатора контента в крупнейшего производителя фильмов и сериалов в мире, выпуская больше контента, чем любая традиционная студия.

0

Распределение фильмов и сериалов

Двойной график показывает соотношение между фильмами и сериалами в библиотеке Netflix. Слева — столбчатая диаграмма с точными цифрами, справа — круговая диаграмма с процентным соотношением.

На графике видно, что фильмы составляют около 65% всего контента Netflix (примерно 2/3), а сериалы — около 35% (1/3). Это соответствует общей структуре видеоконтента в индустрии развлечений, где полнометражные фильмы традиционно доминируют.

Однако важно отметить, что сериалы получают все большую популярность и инвестиции. Хотя их количественно меньше, они часто привлекают больше внимания зрителей и создают более лояльную аудиторию благодаря серийному формату.

Это распределение также отражает производственные особенности: создание одного фильма обычно занимает меньше времени и ресурсов, чем съемка целого сезона сериала, что объясняет количественное преобладание фильмов.

График показывает баланс между разными форматами контента на крупнейшей стриминговой платформе, что помогает понять стратегию Netflix по привлечению разнообразной аудитории.

0

Топ стран-производителей контент

График показывает страны, производящие больше всего контента для Netflix. США лидируют с огромным отрывом — производят примерно в 3 раза больше, чем Индия на втором месте.

Это отражает реальное положение Голливуда как мировой столицы киноиндустрии. Индия на втором месте соответствует Болливуду — самой продуктивной киноиндустрии мира.

Также видно влияние Азии: Япония и Южная Корея в топ-5 благодаря популярности аниме и «корейского бума» (Korean Wave) в мировой культуре.

График показывает, где сосредоточена современная индустрия развлечений и какие страны формируют мировой видеоконтент.

0

Анализ рейтингов и продолжительности

Двойной график слева показывает возрастные рейтинги контента, справа — распределение продолжительности фильмов.Netflix ориентирован в первую очередь на взрослую и молодёжную аудиторию с контентом средней продолжительности, что соответствует стратегии массового стримингового сервиса, а не нишевой платформы.

Описание применения генеративной модели

Для работы были использованы изображения, сгенерированные в, чтобы подобрать референсы и проиллюстрировать тему исследования.

Промпт: A sleek Netflix-style cover. A dark, gradient black to charcoal background with a subtle textured feel. The iconic Netflix «N» logo, glowing with its signature red neon gradient, is the central focal point. Emerging from or dissolving into the logo are numerous, minimalist semi-transparent icons of film strips, clapperboards, and TV screens in shades of dark red and grey, representing the vast library. The overall vibe is sophisticated, digital, and instantly recognizable as the Netflix brand. Sharp focus, cinematic lighting. --ar 2:3 --style raw

Ссылка на модель: C:\Users\User\Desktop\resized-ideogram-v3.0_A_sleek_Netflix-style_cover._A_dark_gradient_black_to_charcoal_background_with_a-0.jpg

Список источников

[1] Выгрузка данных с Netflix Titles Dataset v2 26.09.2021 (URL:https://www.kaggle.com/datasets/shivamb/netflix-sh)Просмотрено: 17.12.2025.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more