Original size 1881x2625

Анализ и визуализация данных по сериалу «Друзья»

PROTECT STATUS: not protected
The project is taking part in the competition

Выбор базы данных

Для анализа был выбран датасет, посвященный сериалу Friends («Друзья»). Датасет был найден на платформе Kaggle и представлен в формате CSV (https://www.kaggle.com/datasets/rezaghari/friends-series-dataset). Датасет представляет собой таблицу с информацией об эпизодах сериала, собранной на основе пользовательских оценок IMDb.

Датасет состоит из 235 строк, каждая из которых соответствует одному эпизоду сериала, и нескольких столбцов, описывающих характеристики эпизодов. Среди них — номер сезона, название эпизода, год выхода, рейтинг IMDb и количество пользовательских голосов.

Я выбрала данный датасет, так как являюсь фанатом сериала, а также он является одним из самых популярных телевизионных шоу в истории, а данные о зрительских оценках позволяют проанализировать, как менялось восприятие сериала аудиторией на протяжении времени.

Визуализация

Для визуализации данных о сериале «Друзья» были выбраны следующие типы графиков:

1. Линейный график для отображения изменения среднего рейтинга эпизодов по сезонам. Данный тип визуализации позволяет наглядно проследить динамику восприятия сериала зрителями на протяжении всего периода его выхода.

2. Столбчатая диаграмма для представления десяти эпизодов с наивысшим рейтингом IMDb. Этот график помогает выделить наиболее высоко оцененные серии и перейти от общего анализа к рассмотрению конкретных эпизодов.

3. Гистограмма для анализа распределения рейтингов всех эпизодов сериала. Использование гистограммы позволяет оценить стабильность качества сериала и определить, в каком диапазоне сосредоточено большинство оценок.

4. Точечная диаграмма для демонстрации зависимости рейтинга эпизодов от года их выхода. Такой формат визуализации помогает выявить возможные временные тренды и изменения зрительского восприятия сериала с течением времени.

Стилистика

Для визуализации выбрана светлая тема, белый фон и данные оттенки:

HEX 048104 HEX 8B4513 HEX FC4949 HEX 1515FD

такое сочетание придает контрастность визуализации, а также указывает на разнохарактерность главных персонажей сериала.

Original size 2834x615

Подготовка

Сначала я загрузила файл с данными о сериале «Друзья» в формате csv, а затем импортировала библиотеку pandas.

Original size 1370x133
Original size 1195x197

Затем я задала единый стиль графикам.

Original size 1596x570

График № 1

1. df.groupby («Season») — группируем все эпизоды по сезонам 2. [«Stars»].mean () — для каждого сезона вычисляем средний рейтинг 3. season_rating.index — номера сезонов (ось X) season_rating.values — средние рейтинги (ось Y) 4. plt.plot () — строим линейный график 5. marker="o» — выделяет каждую точку сезона 6. plt.title, plt.xlabel, plt.ylabel — добавляем подписи

Original size 2144x613
Original size 855x547

График № 2

1. sort_values («Stars», ascending=False) — сортируем эпизоды по рейтингу от большего к меньшему 2. head (10) — выбираем 10 эпизодов с наивысшими оценками 3. plt.barh () — строим горизонтальную столбчатую диаграмму 4. invert_yaxis () — разворачивает порядок, чтобы лучший эпизод был сверху

Original size 1874x581
Original size 1193x547

График № 3

1. df[«Stars»] — используем рейтинги всех эпизодов 2. bins=15 — делим диапазон рейтингов на 15 интервалов 3. plt.hist () — строим гистограмму распределения 4. alpha=0.7 — делает точки полупрозрачными, чтобы они не перекрывали друг друга

Original size 2172x484
Original size 841x547

График № 4

1. df[«Year_of_prod»] — годы выхода эпизодов (ось X) 2. df[«Stars»] — рейтинги эпизодов (ось Y) 3. plt.scatter () — строим точечный график 4. alpha=0.6 — делает точки полупрозрачными, чтобы они не перекрывали друг друга

Original size 1834x485
Original size 846x547

Выводы

В результате анализа данных были получены следующие выводы:

1. рейтинги эпизодов сериала Friends в целом находятся в высоком диапазоне, что говорит о стабильном качестве проекта 2. некоторые сезоны демонстрируют более высокие средние оценки, что позволяет выделить наиболее удачные периоды сериала 3. отдельные эпизоды значительно выделяются по рейтингу и могут считаться культовыми 4. анализ по годам выхода показывает, что восприятие сериала зрителями оставалось относительно стабильным, с отдельными пиками качества

Описание применения генеративной модели

Для создания обложки я использовала Chat GPT 5.0 (https://chatgpt.com). Промт:

сгенерируй вертикальное изображение, на котором изображены все главные герои сериала друзья, в стилистике сериала, на фоне Нью Йорка, в мультяшном стиле.

Папка

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more