
ВЫБОР ДАННЫХ
Для данного проекта был выбран набор данных о кассовых сборах фильмов Disney (disney_movies_total_gross.csv). Этот датасет был найден на платформе Kaggle.
Выбор этой темы обусловлен несколькими факторами.
Во-первых, Disney является не просто киностудией, а глобальным культурным феноменом, формировавшим и продолжающим формировать поколения зрителей. Лично для меня это возможность взглянуть на знакомые истории под аналитическим углом.
Во-вторых, анализ таких данных позволяет не только выявить финансовые закономерности, но и понять, как менялась контентная стратегия студии, адаптируясь к меняющимся предпочтениям аудитории и общественным запросам.
Для всестороннего анализа и наглядной демонстрации результатов были выбраны следующие виды графиков: - Гистограмма. Для анализа распределения кассовых сборов фильмов — Линейный график. Для демонстрации динамики суммарных кассовых сборов по годам - Горизонтальная столбчатая диаграмма. Для сравнения суммарных кассовых сборов по различным жанрам - Сложенная столбчатая диаграмма. Для анализа эволюции возрастных рейтингов по десятилетиям
Для обработки данных была применена библиотека pandas, обеспечивающая эффективную работу с табличной информацией в CSV-формате. Первоначально проводилось знакомство с датасетом: анализировались его структуры, типы полей и фиксировались пропущенные значения.
ЭТАПЫ РАБОТЫ

А вот тут я начала анализ с загрузки основного набора данных — таблицы с кассовыми сборами мультфильмов Disney. Я импортировала файл CSV и сразу же посмотрела на первые несколько строк, чтобы убедиться, что данные загрузились корректно, и ознакомиться со структурой таблицы: названиями фильмов, датами выхода, жанрами, возрастными рейтингами и двумя показателями сборов.
На данном этапе проверила структуру данных и обнаружила пропуски в жанрах и рейтингах, а также необходимость преобразования дат. Это помогло спланировать следующий этап обработки.
Здесь я задала единый стиль для всех графиков проекта, чтобы они выглядели аккуратно и профессионально. Я установила размеры, шрифты, цвета фона и сетку, а также подобрала гармоничную цветовую палитру в сине-фиолетовых тонах.
В этом фрагменте я подготовила данные для анализа по временным периодам. Преобразовала текстовые даты выхода в формат, понятный Python, а затем создала два новых столбца: год и десятилетие выпуска. Это позволило мне в дальнейшем строить графики и анализировать тренды как по годам, так и по более крупным временным отрезкам.
ГРАФИК 1
Тут я проанализировала, как менялись средние кассовые сборы мультфильмов Disney от года к году. Я сгруппировала фильмы по году выпуска, рассчитала средние сборы с учётом инфляции для каждого года и представила результат в виде линейного графика. Это позволило увидеть долгосрочные тренды и выделить периоды наибольшей финансовой успешности студии.
На этом графике я наглядно увидела, как менялась финансовая успешность Disney с 1940-х годов до 2010-х. Чётко видны периоды взлётов и падений — особенно заметны пики в середине века и устойчивый рост с 1980-х годов. Это подтвердило, что анимационная студия переживала разные эпохи, но в целом её коммерческая эффективность со временем росла.
ГРАФИК 2
Этот код строит горизонтальную диаграмму, показывающую 10 самых прибыльных жанров Disney по суммарным кассовым сборам с учётом инфляции. Он группирует фильмы по жанрам, суммирует их сборы и сортирует результаты. Для визуализации используется единый стиль проекта, что делает график наглядным и профессиональным.
На этой диаграмме я наглядно увидела, какие жанры принесли Disney наибольший суммарный доход. Лидерами оказались приключения и комедии, что подтверждает ориентацию студии на развлекательное семейное кино. График также показал значительный разрыв между топовыми жанрами и остальными, что помогло оценить стратегический фокус компании на определённых тематиках.
ГРАФИК 3
В этих фрагментах я построила гистограмму, чтобы увидеть, как распределены кассовые сборы мультфильмов. График показывает, что у Disney много фильмов со скромными сборами — они образуют высокий столбик слева. При этом несколько настоящих хитов собрали огромные суммы, создав длинный «хвост» справа — это обычная ситуация в киноиндустрии, где успех часто сосредоточен в единичных проектах.
ГРАФИК 4
Здесь я подготовила данные и визуализировала, как менялась возрастная аудитория Disney по десятилетиям. Сначала я определила структуру будущего графика: на оси X — десятилетия, на оси Y — количество фильмов, разбитых по рейтингам MPAA (G, PG, PG-13 и другие). Затем с помощью кросс-таблицы и стекированной столбчатой диаграммы я наглядно показала, как рейтинг G доминировал в ранние десятилетия, а позже начали появляться фильмы с более взрослыми рейтингами PG и PG-13, что отражает эволюцию аудитории студии.
СТИЛИЗАЦИЯ ГРАФИКОВ
Для визуального оформления графиков мы разработали собственный стиль, взяв за основу цветовую палитру и настроение классической анимации Disney. Были подобраны оттенки, которые сразу создают сказочную, тёплую атмосферу: глубокий небесно-голубой. Этот цвет стал основой для всех диаграмм.
ИСПОЛЬЗОВАНИЕ НЕЙРОСЕТЕЙ
При работе над проектом применялись специализированные инструменты, такие как ChatGPT, которые помогали в формулировке текстов, описании визуализаций, структурировании материалов и оформлении итоговых результатов. Их использование способствовало повышению качества и согласованности представления данных.
Проведённый анализ показал, что наибольший кассовый успех Disney обеспечивают фильмы в жанрах приключений и комедий. С течением времени студия постепенно расширяет возрастной диапазон, добавляя рейтинги PG и PG-13, сохраняя при этом основную ориентацию на категорию G. Распределение сборов соответствует отраслевой закономерности, где основную прибыль приносят единичные кассовые хиты.