
Выбор базы данных
Для анализа был выбран датасет, посвященный сериалу Friends («Друзья»). Датасет был найден на платформе Kaggle и представлен в формате CSV (https://www.kaggle.com/datasets/rezaghari/friends-series-dataset). Датасет представляет собой таблицу с информацией об эпизодах сериала, собранной на основе пользовательских оценок IMDb.
Датасет состоит из 235 строк, каждая из которых соответствует одному эпизоду сериала, и нескольких столбцов, описывающих характеристики эпизодов. Среди них — номер сезона, название эпизода, год выхода, рейтинг IMDb и количество пользовательских голосов.
Я выбрала данный датасет, так как являюсь фанатом сериала, а также он является одним из самых популярных телевизионных шоу в истории, а данные о зрительских оценках позволяют проанализировать, как менялось восприятие сериала аудиторией на протяжении времени.
Визуализация
Для визуализации данных о сериале «Друзья» были выбраны следующие типы графиков:
1. Линейный график для отображения изменения среднего рейтинга эпизодов по сезонам. Данный тип визуализации позволяет наглядно проследить динамику восприятия сериала зрителями на протяжении всего периода его выхода.
2. Столбчатая диаграмма для представления десяти эпизодов с наивысшим рейтингом IMDb. Этот график помогает выделить наиболее высоко оцененные серии и перейти от общего анализа к рассмотрению конкретных эпизодов.
3. Гистограмма для анализа распределения рейтингов всех эпизодов сериала. Использование гистограммы позволяет оценить стабильность качества сериала и определить, в каком диапазоне сосредоточено большинство оценок.
4. Точечная диаграмма для демонстрации зависимости рейтинга эпизодов от года их выхода. Такой формат визуализации помогает выявить возможные временные тренды и изменения зрительского восприятия сериала с течением времени.
Стилистика
Для визуализации выбрана светлая тема, белый фон и данные оттенки:
HEX 048104 HEX 8B4513 HEX FC4949 HEX 1515FD
такое сочетание придает контрастность визуализации, а также указывает на разнохарактерность главных персонажей сериала.
Подготовка
Сначала я загрузила файл с данными о сериале «Друзья» в формате csv, а затем импортировала библиотеку pandas.
Затем я задала единый стиль графикам.
График № 1
1. df.groupby («Season») — группируем все эпизоды по сезонам 2. [«Stars»].mean () — для каждого сезона вычисляем средний рейтинг 3. season_rating.index — номера сезонов (ось X) season_rating.values — средние рейтинги (ось Y) 4. plt.plot () — строим линейный график 5. marker="o» — выделяет каждую точку сезона 6. plt.title, plt.xlabel, plt.ylabel — добавляем подписи
График № 2
1. sort_values («Stars», ascending=False) — сортируем эпизоды по рейтингу от большего к меньшему 2. head (10) — выбираем 10 эпизодов с наивысшими оценками 3. plt.barh () — строим горизонтальную столбчатую диаграмму 4. invert_yaxis () — разворачивает порядок, чтобы лучший эпизод был сверху
График № 3
1. df[«Stars»] — используем рейтинги всех эпизодов 2. bins=15 — делим диапазон рейтингов на 15 интервалов 3. plt.hist () — строим гистограмму распределения 4. alpha=0.7 — делает точки полупрозрачными, чтобы они не перекрывали друг друга
График № 4
1. df[«Year_of_prod»] — годы выхода эпизодов (ось X) 2. df[«Stars»] — рейтинги эпизодов (ось Y) 3. plt.scatter () — строим точечный график 4. alpha=0.6 — делает точки полупрозрачными, чтобы они не перекрывали друг друга
Выводы
В результате анализа данных были получены следующие выводы:
1. рейтинги эпизодов сериала Friends в целом находятся в высоком диапазоне, что говорит о стабильном качестве проекта 2. некоторые сезоны демонстрируют более высокие средние оценки, что позволяет выделить наиболее удачные периоды сериала 3. отдельные эпизоды значительно выделяются по рейтингу и могут считаться культовыми 4. анализ по годам выхода показывает, что восприятие сериала зрителями оставалось относительно стабильным, с отдельными пиками качества
Описание применения генеративной модели
Для создания обложки я использовала Chat GPT 5.0 (https://chatgpt.com). Промт:
сгенерируй вертикальное изображение, на котором изображены все главные герои сериала друзья, в стилистике сериала, на фоне Нью Йорка, в мультяшном стиле.
Папка