
Описание проекта
Этот проект — визуальный анализ фильмов франшизы Spider-Man за период с 2002 по 2021 год. Основной акцент сделан на сравнении разных «эпох» франшизы, связанных со сменой актёров в роли Человека-паука, и на том, как менялись масштаб кассовых сборов, эффективность бюджета и значение международного проката в успехе фильмов.

кадр из фильма «Человек-паук: Нет пути домой»
Загрузка библиотек
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from matplotlib import rcParams import matplotlib.font_manager as fm
Код шрифта
import matplotlib.pyplot as plt import matplotlib.font_manager as fm from matplotlib import rcParams import os
if os.path.exists ('Orbitron-Regular.ttf'): font_path = 'Orbitron-Regular.ttf' try: fm.fontManager.addfont (font_path) prop = fm.FontProperties (fname=font_path) rcParams['font.family'] = prop.get_name () rcParams['font.sans-serif'] = [prop.get_name ()] rcParams['axes.unicode_minus'] = False except: pass
Код палитры и общего оформления
import matplotlib.pyplot as plt import seaborn as sns from matplotlib import rcParams
SPIDEY_RED = '#D50000' SPIDEY_BLUE = '#0047AB' BLACK = '#000000' WHITE = '#FFFFFF'
SPIDEY_RED_DARK = '#8F0000' SPIDEY_BLUE_DARK = '#002A66' WHITE_DIM = '#D9D9D9'
extended_palette = [SPIDEY_RED, SPIDEY_BLUE, WHITE, WHITE_DIM, SPIDEY_RED_DARK, SPIDEY_BLUE_DARK]
sns.set_palette (extended_palette) sns.set_style ('dark')
rcParams.update ({ 'axes.facecolor': BLACK, 'figure.facecolor': BLACK, 'axes.edgecolor': WHITE, 'xtick.color': WHITE, 'ytick.color': WHITE, 'axes.labelcolor': WHITE, 'text.color': WHITE, 'axes.titlecolor': SPIDEY_RED, 'legend.labelcolor': WHITE, 'font.size': 12, 'axes.titlesize': 16, 'axes.labelsize': 13, 'xtick.labelsize': 12, 'ytick.labelsize': 12, 'legend.fontsize': 12, 'figure.titlesize': 18 })
Выбор шрифта
Для проекта выбран шрифт Orbitron — техно-геометрический sans-serif с «ретро-футуристической» эстетикой, которая хорошо попадает в визуальный язык Spider-Man (киношные логотипы, город, технологии, динамика). Он чётко читается в заголовках, шкалах и подписях, поэтому подходит для инфографики: даже при тёмном фоне остаётся контраст и аккуратная типографика. Шрифт подключается в matplotlib через .ttf, поэтому стиль полностью воспроизводим в коде и сохраняется одинаковым во всех графиках.
кадр из фильма «Человек-паук: Нет пути домой»
Код для палитры и общих характеристик оформления
Для визуализаций выбрана палитра, основанная на классических цветах костюма Spider-Man: красный
кадр из фильма «Человек-паук» 2002
График A — Timeline: «Эпохи Spider-Man по актёрам»
С помощью кода я построила линейный график с точками, который показывает, как менялись мировые сборы фильмов Spider-Man со временем и где визуально начинаются новые «фазы» франшизы при смене актёра. По оси X указан год выхода, по оси Y — мировые сборы (в том числе можно использовать скорректированные на инфляцию). Цветом выделены эпохи Tobey Maguire / Andrew Garfield / Tom Holland, чтобы видно было, как именно смена актёра совпадает с изменением масштаба кассы и динамики.
кадр из фильма «Человек-паук: Нет пути домой»
График B — Bar ranking: «Кто принёс больше всего денег и кто эффективнее»
С помощью кода я построила два столбчатых сравнения по актёрам. В первой части показана сумма мировых сборов по каждому актёру — это простой ответ на вопрос «чья эпоха заработала больше всего в абсолютных цифрах». Во второй части я сравниваю эффективность через показатель ROI (окупаемость бюджета): сколько прибыли приносит фильм относительно вложений. Дополнительно под каждым актёром указано, сколько фильмов (n) есть в выборке — это важно, потому что при маленьком количестве фильмов любые сравнения становятся менее устойчивыми.
кадр из фильма «Человек-паук: Нет пути домой»
График C — Distribution: «Рейтинги IMDb по актёрам (стабильность эпохи)»
С помощью кода я построила boxplot с точками поверх, чтобы сравнить как распределяются IMDb-оценки у фильмов каждого актёра. Этот график нужен не про «самый высокий рейтинг», а про стабильность эпохи: насколько ровно воспринимаются фильмы одной франшизной фазы. Чем компактнее коробка и чем меньше разброс точек, тем более «ровная» эпоха по качеству; если разброс сильный — значит внутри эпохи есть заметные провалы или, наоборот, один очень сильный пик.
кадр из фильма «Человек-паук 3: Враг в отражении»
График D — Correlation: «Оценки зрителей связаны с кассой?»
С помощью кода я построила диаграмму рассеяния (bubble-scatter), где каждая точка — отдельный фильм. По оси X стоит IMDb rating, по оси Y — мировые сборы, а цвет точки показывает актёра. Этот график нужен, чтобы визуально проверить гипотезу: «если фильм нравится зрителям, собирает ли он больше денег?» Также здесь хорошо видны аномалии: фильмы, которые собрали очень много при средних оценках, или наоборот — получили высокие оценки, но не стали кассовыми гигантами. Линия тренда помогает увидеть общую направленность связи, но главная ценность — именно в сравнении эпох и поиске выбросов.
кадр из фильма «Человек-паук» 2002
График E — 100% stacked bar: «Мировой рынок: США vs международный прокат по актёрам»
С помощью кода я построил 100% stacked bar, где каждый столбец — это 100% кассы эпохи актёра, разделённые на долю Domestic (США/Канада) и International (остальной мир). Такой график показывает, насколько каждая эпоха зависит от международной аудитории. Обычно у более новых релизов международная доля выше — это признак глобализации проката и того, что касса всё сильнее определяется рынками за пределами США.
Заключение
Анализ фильмов Spider-Man (2002–2021) показал, что франшиза развивается «фазами», и смена актёра действительно совпадает со сменой масштаба и поведения метрик. Timeline-график показывает переходы между эпохами и то, как менялся уровень сборов по годам. Ранжирование по суммарной кассе и ROI разделяет два разных понятия успеха: абсолютные деньги и эффективность бюджета, причём для корректного сравнения важно учитывать размер выборки (сколько фильмов у актёра). Распределения IMDb-оценок добавляют «качественный слой» к финансовым метрикам: можно увидеть, какая эпоха выглядит более ровной и где были заметные провалы или пики. Scatter-график рейтинга против сборов позволяет проверить интуитивную гипотезу «любят → больше собирает», а также выделить фильмы-аномалии, которые выбиваются из общего тренда. Наконец, 100% stacked bar по domestic/international показывает, что успех Spider-Man всё сильнее опирается на международный рынок, а значит касса современных фильмов определяется не только локальной аудиторией США, но и глобальным спросом.
Применимая генеративная модель https://chatgpt.com/