Original size 1140x1600

Rotten Tomatoes и рейтинги

PROTECT STATUS: not protected
4

Для анализа мной была взята из общего доступа (kaggle.com) чудесная табличка в формате scv со статистикой и рейтингом фильмов от Rotten Tomatoes. Выбрала именно эту табличку потому что часто слышу про эти Томаты (на самом деле впервые увидела в новостях про Аркейн), а еще потому что другие варианты мне не понравились.

Просмотрев все материалы курса, я пришла в ужас: никогда еще столько жуткой информации на голову в один момент мне не падало. Но! Я смогла избежать всепоглощающего отчаяния с помощью интернета. Выбрала относительно интересную тему про относительно интересующий меня сервис с относительно интересующими меня данными. Самую малость покумекав, я поняла, что надо что-то делать и села перелопачивать неизвестный мне сайт с нужным датасетом, чтобы найти хотя бы какие-то намёки на то, что нужно мне для моего проекта. И я нашла. Эти находки очень помогли мне в моем проекте, а потому можно листать ниже, ведь там лежат коды для анализа!

import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import warnings warnings.filterwarnings ('ignore') %matplotlib inline

#загрузить датасет file_path = 'Rotten Tomatoes Movies.csv' df = pd.read_csv (file_path)

df.head ()

big
Original size 1121x667

первая половинка получившейся таблицы

big
Original size 1098x662

вторая половинка получившейся таблицы

Теперь у меня есть таблица с названиями фильмов, режиссёрами и прочим стаффом, а также с рейтингом как от самого сервиса, так и от зрителей

sns.histplot (df['tomatometer_rating'], bins=20, kde=True) plt.title ('Распределение рейтинга на Tomatoes') plt.xlabel ('Рейтинг по Rotten Tomatoes') plt.ylabel ('Частота оценок') plt.show ()

Original size 627x460

Отсюда мы видим, что ребята в Rotten Tomatoes либо очень добрые и ставят большую оценку фильмам, либо фильмы и в самом деле очень хороши. Больно уж много фильмов со стопроцентным рейтингом

import seaborn as sns import matplotlib.pyplot as plt

#Получаем топ 10 директоров top_directors = df['directors'].value_counts ().head (10)

#Создаем график с изменением цвета столбцов sns.barplot (x=top_directors.values, y=top_directors.index, palette='viridis') #Здесь 'viridis' — это название палитры

plt.title ('Топ 10 режиссёров по количеству фильмов') plt.xlabel ('Количество фильмов') plt.ylabel ('Режиссёр') plt.show ()

Original size 694x454

Таблица говорит, что Альфред Хичкок снял фильмов больше всех! Но Вуди Аллен от него не отстает. Клинт Иствуд сдаёт позиции, и уже видна разница в количестве.

import seaborn as sns import matplotlib.pyplot as plt

top_studios = df['studio_name'].value_counts ().head (10)

colors = sns.color_palette ('viridis', n_colors=len (top_studios))

sns.barplot (x=top_studios.values, y=top_studios.index, palette=colors)

plt.title ('Топ 10 студий по количеству фильмов') plt.xlabel ('Число фильмов') plt.ylabel ('Студия') plt.show ()

Original size 811x454

Еще одна красивая табличка! На ней можно посмотреть, какие студии отличаются своим умением клепать много фильмов.

Итог: фильмов много, оценки высокие, режиссёры работают. И это здорово

Источники

Датасет взят с сайта Kaggle, коды для табличек и прочего — оттуда же. Ссылка: https://www.kaggle.com/code/devraai/analyzing-rotten-tomatoes-ratings-and-trends

Описание применения генеративной модели

Нейросети были использованы для возможности кастомизации табличек (изменение цвета столбцов). Промпт: 1. При вводе кода выводится таблица, как можно поменять цвет столбцов?

Использованная нейросеть — ChatGPT (https://trychatgpt.ru/)

Rotten Tomatoes и рейтинги
4
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more