
В этом проекте проанализирован открытый датасет о фильмах и сериалах, представленных на стриминговой платформе Netflix. Анализ позволил проследить, как менялся каталог платформы со временем, какие жанры преобладают, как различаются фильмы и сериалы по продолжительности, а также какие страны вносят наибольший вклад в производство контента.

Внешний вид графиков и стиль проекта в целом вдохновлён интерфейсом Netflix и атмосферой вечернего просмотра фильмов. Тёмный фон и контрастные акценты отсылают к ситуации, когда пользователь выбирает фильм в затемнённой комнате, а каждый тайтл в каталоге воспринимается как отдельный светящийся элемент. При этом, как и сами фильмы и сериалы, визуальные элементы графиков отличаются по характеру и настроению.

В исследовании использованы данные из открытого датасета Netflix Movies and TV Shows, опубликованного на платформе Kaggle. Датасет содержит информацию о каждом фильме и сериале, представленном на платформе: тип контента, год выпуска, дату добавления на Netflix, страну производства, жанры, возрастной рейтинг и продолжительность.
Для анализа применены такие данные, как тип контента (фильм или сериал), год выпуска, год добавления на платформу, продолжительность, жанры и страна производства.
Данные представлены в виде гистограмм с разным масштабом, чтобы наглядно показать распределения значений и выделить как наиболее массовые, так и редкие категории, линейной диаграммы для анализа изменения объёма контента во времени, а также точечной диаграммы для отображения взаимосвязей между количественными показателями, например между годом выпуска и продолжительностью фильмов.
Использование библиотек
В коде использованы библиотека pandas для работы с CSV-файлом и предварительной обработки данных, matplotlib.pyplot для построения основной визуализации, seaborn для дополнительной стилизации графиков, matplotlib.colors для работы с цветовой палитрой и прозрачностью элементов, а также matplotlib.patches для более детальной стилизации столбцов и акцентных элементов визуализации.
Обработка данных
В данных Netflix значения года выпуска (release_year) могут содержать различные проблемы: текстовые записи, специальные символы, слишком ранние или поздние годы, а также пропуски. Чтобы обеспечить точность анализа временной динамики контента, выполняется строгая проверка и фильтрация данных.
В данных Netflix поле country часто содержит несколько стран через запятую (например, «United States, United Kingdom, Canada»), что затрудняет анализ. Для упрощения и стандартизации данных извлекается только первая (основная) страна производства.
В данных Netflix продолжительность контента хранится в текстовом формате с указанием единиц измерения: «120 min» для фильмов или «2 Seasons» для сериалов. Для численного анализа необходимо преобразовать эти данные в чистые числа.
Для анализа временной динамики контента Netflix выполняется группировка данных по годам выпуска. Этот этап позволяет подготовить данные для построения графиков, показывающих как общую динамику, так и отдельные тренды для фильмов и сериалов.
Далее — построение основы графика.
И подробная настройка внешнего вида графика — фон, оси, метки, значения, заливка и другая стилизация.
Визуализация
Динамика добавления контента на Netflix по годам
На графике видна четкая тенденция резкого роста после 2015 года, когда Netflix начал активно инвестировать в собственное производство.
Фильмы (синие точки) всегда преобладают над сериалами (оранжевые точки), что соответствует общей структуре видеоконтента. Однако интересно отметить, что в последние годы разрыв сокращается — растет популярность сериального формата.
Красная линия тренда показывает экспоненциальный рост производства: если в начале 2000-х годов добавлялось несколько десятков позиций в год, то к 2020-м годам это число выросло до сотен и тысяч.
Особенно заметен скачок после 2013 года — периода начала «стриминговой революции», когда Netflix стал глобальным сервисом и начал активно конкурировать с традиционными студиями.
График демонстрирует как Netflix превратился из простого агрегатора контента в крупнейшего производителя фильмов и сериалов в мире, выпуская больше контента, чем любая традиционная студия.
Распределение фильмов и сериалов
Двойной график показывает соотношение между фильмами и сериалами в библиотеке Netflix. Слева — столбчатая диаграмма с точными цифрами, справа — круговая диаграмма с процентным соотношением.
На графике видно, что фильмы составляют около 65% всего контента Netflix (примерно 2/3), а сериалы — около 35% (1/3). Это соответствует общей структуре видеоконтента в индустрии развлечений, где полнометражные фильмы традиционно доминируют.
Однако важно отметить, что сериалы получают все большую популярность и инвестиции. Хотя их количественно меньше, они часто привлекают больше внимания зрителей и создают более лояльную аудиторию благодаря серийному формату.
Это распределение также отражает производственные особенности: создание одного фильма обычно занимает меньше времени и ресурсов, чем съемка целого сезона сериала, что объясняет количественное преобладание фильмов.
График показывает баланс между разными форматами контента на крупнейшей стриминговой платформе, что помогает понять стратегию Netflix по привлечению разнообразной аудитории.
Топ стран-производителей контент
График показывает страны, производящие больше всего контента для Netflix. США лидируют с огромным отрывом — производят примерно в 3 раза больше, чем Индия на втором месте.
Это отражает реальное положение Голливуда как мировой столицы киноиндустрии. Индия на втором месте соответствует Болливуду — самой продуктивной киноиндустрии мира.
Также видно влияние Азии: Япония и Южная Корея в топ-5 благодаря популярности аниме и «корейского бума» (Korean Wave) в мировой культуре.
График показывает, где сосредоточена современная индустрия развлечений и какие страны формируют мировой видеоконтент.
Анализ рейтингов и продолжительности
Двойной график слева показывает возрастные рейтинги контента, справа — распределение продолжительности фильмов.Netflix ориентирован в первую очередь на взрослую и молодёжную аудиторию с контентом средней продолжительности, что соответствует стратегии массового стримингового сервиса, а не нишевой платформы.
Описание применения генеративной модели
Для работы были использованы изображения, сгенерированные в, чтобы подобрать референсы и проиллюстрировать тему исследования.
Промпт: A sleek Netflix-style cover. A dark, gradient black to charcoal background with a subtle textured feel. The iconic Netflix «N» logo, glowing with its signature red neon gradient, is the central focal point. Emerging from or dissolving into the logo are numerous, minimalist semi-transparent icons of film strips, clapperboards, and TV screens in shades of dark red and grey, representing the vast library. The overall vibe is sophisticated, digital, and instantly recognizable as the Netflix brand. Sharp focus, cinematic lighting. --ar 2:3 --style raw
Ссылка на модель: C:\Users\User\Desktop\resized-ideogram-v3.0_A_sleek_Netflix-style_cover._A_dark_gradient_black_to_charcoal_background_with_a-0.jpg
Список источников
[1] Выгрузка данных с Netflix Titles Dataset v2 26.09.2021 (URL:https://www.kaggle.com/datasets/shivamb/netflix-sh)Просмотрено: 17.12.2025.