Original size 1240x1750

Анализ фильмов «Человек-паук»

PROTECT STATUS: not protected
The project is taking part in the competition
Post_Malone_Swae_Lee_-_Sunflower_59804834
3 min

Описание проекта

Этот проект — визуальный анализ фильмов франшизы Spider-Man за период с 2002 по 2021 год. Основной акцент сделан на сравнении разных «эпох» франшизы, связанных со сменой актёров в роли Человека-паука, и на том, как менялись масштаб кассовых сборов, эффективность бюджета и значение международного проката в успехе фильмов.

big
Original size 480x198

кадр из фильма «Человек-паук: Нет пути домой»

Загрузка библиотек

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from matplotlib import rcParams import matplotlib.font_manager as fm

Код шрифта

import matplotlib.pyplot as plt import matplotlib.font_manager as fm from matplotlib import rcParams import os

if os.path.exists ('Orbitron-Regular.ttf'): font_path = 'Orbitron-Regular.ttf' try: fm.fontManager.addfont (font_path) prop = fm.FontProperties (fname=font_path) rcParams['font.family'] = prop.get_name () rcParams['font.sans-serif'] = [prop.get_name ()] rcParams['axes.unicode_minus'] = False except: pass

Код палитры и общего оформления

import matplotlib.pyplot as plt import seaborn as sns from matplotlib import rcParams

SPIDEY_RED = '#D50000' SPIDEY_BLUE = '#0047AB' BLACK = '#000000' WHITE = '#FFFFFF'

SPIDEY_RED_DARK = '#8F0000' SPIDEY_BLUE_DARK = '#002A66' WHITE_DIM = '#D9D9D9'

extended_palette = [SPIDEY_RED, SPIDEY_BLUE, WHITE, WHITE_DIM, SPIDEY_RED_DARK, SPIDEY_BLUE_DARK]

sns.set_palette (extended_palette) sns.set_style ('dark')

rcParams.update ({ 'axes.facecolor': BLACK, 'figure.facecolor': BLACK, 'axes.edgecolor': WHITE, 'xtick.color': WHITE, 'ytick.color': WHITE, 'axes.labelcolor': WHITE, 'text.color': WHITE, 'axes.titlecolor': SPIDEY_RED, 'legend.labelcolor': WHITE, 'font.size': 12, 'axes.titlesize': 16, 'axes.labelsize': 13, 'xtick.labelsize': 12, 'ytick.labelsize': 12, 'legend.fontsize': 12, 'figure.titlesize': 18 })

Выбор шрифта

Для проекта выбран шрифт Orbitron — техно-геометрический sans-serif с «ретро-футуристической» эстетикой, которая хорошо попадает в визуальный язык Spider-Man (киношные логотипы, город, технологии, динамика). Он чётко читается в заголовках, шкалах и подписях, поэтому подходит для инфографики: даже при тёмном фоне остаётся контраст и аккуратная типографика. Шрифт подключается в matplotlib через .ttf, поэтому стиль полностью воспроизводим в коде и сохраняется одинаковым во всех графиках.

Original size 498x250

кадр из фильма «Человек-паук: Нет пути домой»

Код для палитры и общих характеристик оформления

Для визуализаций выбрана палитра, основанная на классических цветах костюма Spider-Man: красный

D50000, синий

0047AB, чёрный

000000, белый

FFFFFF. Чёрный используется как основной фон, чтобы графики выглядели «киношно» и давали высокий контраст. Красный и синий работают как главные акценты (категории, элементы внимания), а белый — для текста, осей и важных выделений. Благодаря ограниченной палитре все графики выглядят цельно и как часть одной инфографической серии.

Original size 600x338

кадр из фильма «Человек-паук» 2002

График A — Timeline: «Эпохи Spider-Man по актёрам»

Original size 1184x584
Original size 984x886

С помощью кода я построила линейный график с точками, который показывает, как менялись мировые сборы фильмов Spider-Man со временем и где визуально начинаются новые «фазы» франшизы при смене актёра. По оси X указан год выхода, по оси Y — мировые сборы (в том числе можно использовать скорректированные на инфляцию). Цветом выделены эпохи Tobey Maguire / Andrew Garfield / Tom Holland, чтобы видно было, как именно смена актёра совпадает с изменением масштаба кассы и динамики.

Original size 542x319

кадр из фильма «Человек-паук: Нет пути домой»

График B — Bar ranking: «Кто принёс больше всего денег и кто эффективнее»

Original size 1280x548
Original size 1159x975

С помощью кода я построила два столбчатых сравнения по актёрам. В первой части показана сумма мировых сборов по каждому актёру — это простой ответ на вопрос «чья эпоха заработала больше всего в абсолютных цифрах». Во второй части я сравниваю эффективность через показатель ROI (окупаемость бюджета): сколько прибыли приносит фильм относительно вложений. Дополнительно под каждым актёром указано, сколько фильмов (n) есть в выборке — это важно, потому что при маленьком количестве фильмов любые сравнения становятся менее устойчивыми.

Original size 498x381

кадр из фильма «Человек-паук: Нет пути домой»

График C — Distribution: «Рейтинги IMDb по актёрам (стабильность эпохи)»

Original size 1280x429
Original size 1260x1046

С помощью кода я построила boxplot с точками поверх, чтобы сравнить как распределяются IMDb-оценки у фильмов каждого актёра. Этот график нужен не про «самый высокий рейтинг», а про стабильность эпохи: насколько ровно воспринимаются фильмы одной франшизной фазы. Чем компактнее коробка и чем меньше разброс точек, тем более «ровная» эпоха по качеству; если разброс сильный — значит внутри эпохи есть заметные провалы или, наоборот, один очень сильный пик.

Original size 640x314

кадр из фильма «Человек-паук 3: Враг в отражении»

График D — Correlation: «Оценки зрителей связаны с кассой?»

Original size 1123x641
Original size 1130x1073

С помощью кода я построила диаграмму рассеяния (bubble-scatter), где каждая точка — отдельный фильм. По оси X стоит IMDb rating, по оси Y — мировые сборы, а цвет точки показывает актёра. Этот график нужен, чтобы визуально проверить гипотезу: «если фильм нравится зрителям, собирает ли он больше денег?» Также здесь хорошо видны аномалии: фильмы, которые собрали очень много при средних оценках, или наоборот — получили высокие оценки, но не стали кассовыми гигантами. Линия тренда помогает увидеть общую направленность связи, но главная ценность — именно в сравнении эпох и поиске выбросов.

Original size 498x387

кадр из фильма «Человек-паук» 2002

График E — 100% stacked bar: «Мировой рынок: США vs международный прокат по актёрам»

Original size 1204x623
Original size 1124x1002

С помощью кода я построил 100% stacked bar, где каждый столбец — это 100% кассы эпохи актёра, разделённые на долю Domestic (США/Канада) и International (остальной мир). Такой график показывает, насколько каждая эпоха зависит от международной аудитории. Обычно у более новых релизов международная доля выше — это признак глобализации проката и того, что касса всё сильнее определяется рынками за пределами США.

Заключение

Анализ фильмов Spider-Man (2002–2021) показал, что франшиза развивается «фазами», и смена актёра действительно совпадает со сменой масштаба и поведения метрик. Timeline-график показывает переходы между эпохами и то, как менялся уровень сборов по годам. Ранжирование по суммарной кассе и ROI разделяет два разных понятия успеха: абсолютные деньги и эффективность бюджета, причём для корректного сравнения важно учитывать размер выборки (сколько фильмов у актёра). Распределения IMDb-оценок добавляют «качественный слой» к финансовым метрикам: можно увидеть, какая эпоха выглядит более ровной и где были заметные провалы или пики. Scatter-график рейтинга против сборов позволяет проверить интуитивную гипотезу «любят → больше собирает», а также выделить фильмы-аномалии, которые выбиваются из общего тренда. Наконец, 100% stacked bar по domestic/international показывает, что успех Spider-Man всё сильнее опирается на международный рынок, а значит касса современных фильмов определяется не только локальной аудиторией США, но и глобальным спросом.

Применимая генеративная модель https://chatgpt.com/

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more