Концепция и выбор данных
Я выбрала проект по анализу фильмов Pixar, потому что это студия с ярко выраженным культурным влиянием: её фильмы стабильно обсуждаются, получают оценки критиков и зрителей, а также выходят на протяжении нескольких десятилетий. Это делает Pixar удобным объектом для анализа, где можно изучать не только «успех в прокате», но и восприятие аудитории и то, как оно менялось со временем.


В ходе исследования были использованы данные с сайта Kaggle. Датасет представляет собой таблицу, где 1 строка = 1 фильм (всего 28 фильмов) и 16 столбцов, включающие в себя оценки критиков и зрителей, возрастной рейтинг, информацию о бюджете и сборах мультфильмов по всему миру.
На графиках ко всем элементам визуализации применялся единый стиль, все цвета взяты с выбранной мною палитры.
Также с написанием кода помогал ChatGPT, он дополнял их на несколько строчек исключительно для защиты от возможных ошибок и оптимизации программы
Цели и исследовательские вопросы
У меня был достаточно большой простор для изучения и исследования, так как выбранный датасет предлагал большой объем информации о мультфильмах Pixar. Мне хотелось не просто выделить какие-то топы
1. Чем отличаются оценки критиков и зрителей? 2. На какие MPAA-рейтинги Pixar получает более высокие оценки? 3. Как менялся средний уровень оценок по годам/десятилетиям? 4. Какие фильмы самые «спорные» и какие самые успешные? 5. Есть ли влияние эпохи (десятилетия) на оценки и их разброс?
Начало работы
Для начала я импортировала все нужные библиотеки для работы с графиками, датасетами и массивами, ChatGPT помог написать код для разархивирования zip-архива с шрифтом в мою программу
Далее загружается датасет из файла pixar_films new.csv в таблицу DataFrame (df). После этого рассчитываются несколько новых столбцов, которые нужны для анализа: оценка зрителей приводится к шкале 0–100 (audience_score_100 = imdb_score * 10), оценка критиков берётся как среднее Rotten Tomatoes и Metacritic (critics_score_100). Также высчитаем здесь разрыв мнений зрителей и критиков — gap, а также его модуль abs_gap, чтобы находить самые «спорные» фильмы независимо от знака.
Ниже записываю все коды цветов для удобства и делаю примерный макет графиков (размер шрифта, цвет, положение и тд), который буду использовать на протяжении всего проекта
Графики и исследование
Теперь перейдем к основному этапу,
По графику видно, что в большинстве случаев критики оценивают фильмы Pixar выше, чем зрители. Ситуации, когда разрыв положительный (то есть зрители ставят выше критиков), встречаются существенно реже и представлены меньшим числом картин. В рамках этого датасета складывается устойчивое впечатление, что критическое сообщество в среднем более благосклонно к Pixar, чем массовая аудитория.
Следующий график, который я построила, показывает распределение оценок фильмов Pixar в зависимости от MPAA-рейтинга (G — все возраста, PG — 13+). Визуализация включает несколько слоёв. Полупрозрачное «облако» вокруг центральной части (violin) показывает форму распределения: где оно шире, там больше фильмов с такими значениями, а где уже — таких фильмов меньше. Прямоугольник внутри облака (boxplot) отображает основную зону значений, а линия внутри прямоугольника показывает медиану — наиболее типичную оценку в данной категории. Точки на графике обозначают отдельные фильмы, благодаря чему видно, насколько оценки внутри каждой группы однородны или, наоборот, сильно разбросаны. Чтобы распределения читались лучше, шкала оценок ограничена диапазоном 40–100, так как ниже этого уровня значений в данных практически нет. В данной выборке MPAA-рейтинг действительно связан с оценками: фильмы с рейтингом G в среднем и по медиане оцениваются чуть выше, чем фильмы PG, причём это видно и у критиков, и у зрителей.
Для общей картины, я решила добавить круговую диаграмму, показывающую количество мультфильмов с рейтингом G и PG. Как показывает график, Pixar ориентируется на семейную аудиторию, но при этом часть историй делает максимально универсальными для самых маленьких (G), а часть — с чуть более сложными темами, юмором и эмоциональными моментами, которые лучше подходят для просмотра с родителями (PG).