
Введение
Кристофер Нолан — мой любимый режиссер, и данные о его фильмах интересны мне лично с точки зрения фаната. Он известен инновационными нарративами, визуальными эффектами и коммерческим успехом. Анализ позволяет увидеть тенденции: как растут бюджеты с карьерой и как рейтинги отражают на приеме критиков и обывателя. Эти данные имеют ценность для понимания голливудской индустрии — Нолан сочетает арт-хаус (ранние фильмы) с блокбастерами (трилогия Бетмена), и анализ показывает, как его стиль влияет на популярность. Кроме того, в эпоху стриминга такие данные помогают оценить, что делает фильм нестареющей классикой по рейтингам.
Сбор информации
Для анализа я выбрала данные о фильмах режиссера Кристофера Нолана, включая название фильма, год выпуска, бюджет (в миллионах долларов), worldwide box office (в миллионах долларов), рейтинг на IMDB и баллы на Rotten Tomatoes (в процентах). Эти данные собраны из надежных источников, таких как Box Office Mojo, IMDB, Rotten Tomatoes и The Numbers. Датасет включает 12 полнометражных фильмов Нолана от «Following» (1998) до «Оппенгеймер» (2023). Данные достаточно объемные, содержательные, так как позволяют изучить эволюцию популярности, финансовый успех и критический прием фильмов одного из самых влиятельных режиссеров современности.
Графики
Я решила создать следующие графики:
Столбчатая диаграмма: для сравнения worldwide box office по фильмам — позволяет визуально увидеть лидеров и аутсайдеров, подчеркивая коммерческий рост. Линейный график: для изменения IMDB рейтингов по годам — показывает тренды в зрительской оценке со временем, выявляя пики и спады. Точечная диаграмма: для корреляции бюджета и box office — помогает изучить, окупаются ли вложения, с линией регрессии для ясности. Гистограмма: для распределения Rotten Tomatoes баллов — иллюстрирует, как часто фильмы получают высокие оценки от критиков, показывая consistency.
Они охватывают разные аспекты данных и делают анализ всесторонним.
Обработка данных
Обработка данных проводилась с помощью библиотеки Pandas в Python. Я создала DataFrame из собранных данных, добавил столбец «Profit_M» (box office минус budget) для анализа окупаемости и отсортировала по году для временного анализа. Этот код создает чистый датасет. Вывод code_execution показал, что данные корректны и Profit рассчитан правильно. Вот поэтапный код:
Стилизация
Графики стилизованы в минималистичном, кинематографическом стиле, вдохновленном постерами фильмов Нолана. Шрифт: Gotham Bold, который использовался в фильме «Оппенгеймер». Цветовая палитра: белый (фон), синий (№FF0000) и красный (№FF0000) — ключевые цвета в фильме «Довод», где синий и красный символизируют прямое и обратное время, создавая динамику; белый для нейтральности и читаемости.
Коммерческий успех
Использовала базовую дескриптивную статистику: mean, median, std для рейтингов и финансов (df.describe ()). Корреляцию Пирсона для budget vs box office (df.corr ()). Линейную регрессию в scatter для тренда. Эти методы просты, но эффективны для выявления паттернов: средний IMDB 8.25, корреляция budget-box office 0.85, std RT 8.5.
Эволюция рейтинг
Зависимость сборов от бюджета
Распределение оценок
Заключение
Анализ фильмографии Кристофера Нолана показал впечатляющий рост его карьеры: бюджеты выросли с тысяч до сотен миллионов долларов, а мировые сборы превысили миллиард. Высокая корреляция между бюджетом и сборами (≈0.85) подтверждает коммерческую эффективность его проектов, при этом рейтинги остаются стабильно высокими (средний IMDB — 8.17, RT — 85%). Нолан уникален тем, что сочетает сложные интеллектуальные идеи с массовым успехом, сохраняя признание зрителей и критиков на протяжении долгого времени. В итоге: Нолан — мастер, чьи фильмы не только зарабатывают миллиарды, но и формируют современный кинематограф.
Описание применения генеративной сети
Я использовала нейросеть Grok для исправления ошибок в коде и в помощи отбора данных. Использовала только для консультаций, работа выполнена самостоятельно.