
ОПИСАНИЕ ПРОЕКТА
В проекте я решила сосредоточиться на теме стриминговых сервисах. Музыка, фильмы и сериалы стали частью моей жизни и формирования личности, и мне было интересно посмотреть, как эта индустрия выглядит в цифрах.
Для анализа я использовала датасет Global Streaming Services Dataset, доступный на платформе Kaggle (https://www.kaggle.com/datasets/sureshkumarpalus/global-streaming-services-dataset?select=paid_video_streaming_services.csv). В нём собрана информация о крупнейших стриминговых сервисах: количестве подписчиков, ценах на подписку, динамике роста и возрастной структуре пользователей. Данные позволили собрать целостную картину рынка и посмотреть, как разные показатели связаны между собой.
Лично для меня эта тема оказалась особенно интересной, потому что я сама активно пользуюсь несколькими сервисами и никогда раньше не задумывалась, насколько сильно различается их аудитория и масштаб влияния.
ВИЗУАЛИЗАЦИИ
Для исследования я выбрала несколько типов графиков, каждый из которых решает свою задачу: 1. Горизонтальная столбчатая диаграмма 2. Гистограмма с кривой плотности распределения 3. Многосерийный линейный график 4. Круговая диаграмма
Визуал
Работая над визуальной частью проекта, я сначала сделала несколько экспериментальных иллюстраций, в которых попыталась передать стриминговые сервисы как абстрактное цифровое пространство.
Prompt
Conceptual digital environment inspired by streaming culture, large abstract spaces, subtle glowing surfaces, muted purple tones, feeling of immersion and quiet scale, minimal details, atmospheric and modern visual style, no literal objects or logos
Для финальной обложки проекта я выбрала более понятное и читаемое изображение. В нём стриминг показан уже не так абстрактно, а в более ясной форме, чтобы обложка сразу задавала тему проекта и была легко воспринимаемой.
Prompt
Clean and clear illustration representing streaming services, modern digital environment with screens and content tiles, soft purple and pink color palette, minimalistic and structured composition, sense of accessibility and everyday use, modern flat–cinematic style, easy to read and visually balanced, no specific brand logos
Нейросеть — recraft.ai

Иллюстрации
ЦВЕТОВАЯ ПАЛИТРА
Цветовую палитру для проекта я создала в Adobe Color, подбирая оттенки так, чтобы они передавали тёплую и уютную атмосферу, связанную со стримингом и домашним просмотром контента. Мне хотелось уйти от холодных и резких цветов и сделать палитру более мягкой и спокойной.
В основу легли приглушённые фиолетово-розовые оттенки в сочетании со светлым текстом на тёмном фоне. Такое сочетание напоминает мягкий свет экрана вечером и создаёт ощущение «лампового» настроения — момента, когда стриминг становится частью личного времени.
Используемые цвета:
#5A405D
#865E76
#B27F84
#E79E98
#A18FA2
#C2C2CC
Шрифт— BIZUDPMincho
ГРАФИК 1. ТОП-10 СТРИМИНГОВЫХ СЕРВИСОВ ПО ЧИСЛУ ПОДПИСЧИКОВ
Первый график показывает десятку крупнейших стриминговых сервисов по количеству подписчиков. Формат горизонтальной столбчатой диаграммы выбран специально, чтобы было удобно сравнивать масштабы платформ между собой.
Здесь сразу заметен явный лидер — Netflix, который значительно опережает остальных по числу пользователей. За ним следует Amazon Prime Video, а далее уже идёт более плотная группа сервисов, где разница между позициями не такая большая. Интересно, что в рейтинге представлены не только западные платформы, но и крупные азиатские сервисы, что подчёркивает глобальный характер рынка стриминга.
График 1 // код
ГРАФИК 2. РАСПРЕДЕЛЕНИЕ МЕСЯЧНОЙ ЦЕНЫ ПОДПИСКИ
На втором этапе я обратилась к стоимости подписки. Здесь используется гистограмма с наложенной кривой плотности распределения (KDE), которая помогает увидеть общую картину цен.
График показывает, что большинство стриминговых сервисов сосредоточены в диапазоне невысоких цен — это делает подписку доступной для массовой аудитории. При этом заметны отдельные выбросы с очень высокой стоимостью, которые сильно отличаются от основной массы. Такие значения, скорее всего, связаны с региональными особенностями или специфическими пакетами услуг.
График 2 // код
ГРАФИК 3. ДИНАМИКА РОСТА ПОДПИСЧИКОВ (2020–2024)
Третий график показывает, как менялось количество подписчиков у крупнейших сервисов за последние несколько лет. Линейный формат позволяет проследить динамику и сравнить темпы роста разных платформ.
Здесь видно, что почти все представленные сервисы демонстрируют устойчивый рост, особенно в период после 2020 года. У лидеров рынка рост более плавный, но стабильный, тогда как у некоторых платформ заметен более резкий скачок, особенно на ранних этапах. Это может говорить о выходе на новые рынки или быстром расширении аудитории.
График подчёркивает, что стриминг продолжает активно развиваться и остаётся растущей индустрией, а не временным трендом.
График 3 // код
ГРАФИК 4. СРЕДНЕЕ РАСПРЕДЕЛЕНИЕ ВОЗРАСТНЫХ ГРУПП ПОЛЬЗОВАТЕЛЕЙ
Заключительный график посвящён аудитории. Круговая диаграмма показывает среднее распределение пользователей по возрастным группам среди всех стриминговых сервисов.
Основную долю аудитории составляют пользователи в возрасте от 25 до 44 лет — именно эта группа чаще всего оформляет подписки и активно потребляет цифровой контент. Молодая аудитория 18–24 также занимает заметную часть, тогда как доля пользователей старше 55 лет существенно меньше.
График 4 // код
ЗАКЛЮЧЕНИЕ
В результате анализа становится понятно, что рынок стриминговых сервисов — это сочетание огромных масштабов, доступных цен и чётко выраженной целевой аудитории. Лидеры рынка аккумулируют сотни миллионов подписчиков, но при этом индустрия остаётся разнообразной и глобальной. Ценовая политика большинства сервисов направлена на массового пользователя, что объясняет их быстрый рост. Динамика подписчиков показывает, что стриминг продолжает набирать популярность, а возрастное распределение подчёркивает важность аудитории активного, «цифрового» поколения.
Для меня этот проект стал возможностью по-новому взглянуть на привычные стриминговые сервисы и разобраться, что стоит за тем удобством, к которому мы привыкли как пользователи. В процессе работы я узнала, насколько сильно различаются масштабы платформ, как формируется их аудитория и почему одни сервисы растут быстрее других. Анализ данных помог увидеть, как мой собственный пользовательский опыт отражается в цифрах и общих тенденциях рынка, и сделал тему стриминга для меня более осознанной.
Использованные статистические методы
В ходе анализа данных о стриминговых сервисах были применены следующие статистические методы и аналитические подходы:
• Ранжирование и сравнительный анализ — использовались для выявления крупнейших стриминговых сервисов по числу подписчиков. Сортировка и визуальное сравнение позволили определить лидеров рынка и оценить разрыв между ними.
• Анализ распределений — применялся для исследования распределения месячных цен подписки. Гистограмма позволила оценить форму распределения и вариативность цен, а кривая ядерной оценки плотности (KDE) — выявить основные моды и сглаженную структуру распределения.
• Анализ временных рядов — использовался для изучения динамики роста числа подписчиков стриминговых сервисов в период 2020–2024 годов. Линейные графики позволили наглядно сравнить темпы роста различных платформ и выявить различия в траекториях развития.
• Агрегационный анализ — применялся для расчёта средних значений возрастных долей аудитории по всем сервисам. Это позволило получить обобщённый профиль возрастной структуры пользователей стриминговых платформ.
• Структурный анализ долей — реализован с помощью круговой диаграммы, что позволило визуально оценить вклад каждой возрастной группы в общую аудиторию и сравнить относительную представленность различных возрастных сегментов.
Описание применения генеративной модели и вспомогательных инструментов 1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация графиков.
3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. seaborn — использовалась для построения гистограммы и сглаженной кривой распределения (KDE)
4. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.
5. Цветовая палитра (Adobe Color)
6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.