
О проекте
IMDb Top-250 Movies — это больше, чем просто рейтинг фильмов. Это коллективный портрет зрительского вкуса, сформированный миллионами голосов по всему миру. Список, в котором соседствуют классика и современное кино, авторские драмы и жанровые хиты, а высокая оценка становится знаком долговременной значимости. Попасть в Top-250 — значит выйти за пределы момента и остаться в истории массового кинематографа.
Но из чего на самом деле состоит этот канон? Какие фильмы и эпохи в нём доминируют, какие жанры оказываются наиболее востребованными, существует ли «идеальная» длительность фильма для зрительского признания и насколько узок диапазон по-настоящему высоких рейтингов? Чтобы ответить на эти вопросы, я проанализировала датасет IMDb Top-250 с платформы Kaggle и попыталась рассмотреть рейтинг не как список названий, а как структурированную систему.
Визуально проект опирается на фирменную эстетику IMDb: контрастный чёрный фон, белую типографику и насыщенный жёлтый цвет как акцент. Эта палитра подчёркивает статусность и лаконичность рейтинга, превращая сухие данные в цельное визуальное повествование.

В анализе я сосредоточилась на четырёх ключевых характеристиках: распределении рейтингов внутри Top-250, представлении фильмов по десятилетиям выпуска, жанровой структуре списка и длительности фильмов. Вместе эти параметры позволяют взглянуть на IMDb Top-250 как на живой канон — отражение того, какие истории зрители считают по-настоящему важными и достойными долгой памяти.
План работы
В ходе работы был выбран и загружен датасет IMDb Top-250 Movies в формате CSV и проанализирован с помощью библиотеки Pandas в среде Google Colab. Были выполнены базовая обработка данных, группировка и подсчёт частот для изучения рейтингов, годов выпуска, жанров, длительности фильмов и режиссёров. Для визуализации использовалась библиотека Matplotlib, с помощью которой были построены объясняющие аналитические графики. Все визуализации оформлены в едином стиле, вдохновлённом айдентикой IMDb, что позволило создать целостную и наглядную инфографику.
Для создания единого стиля графиков я использовала следующий код:
Анализ визуализаций
Распределение рейтингов IMDb
График распределения рейтингов показывает, что IMDb Top-250 — это крайне «плотное» пространство высоких оценок. Подавляющее большинство фильмов сосредоточено в узком диапазоне примерно от 8.1 до 8.5 балла, что говорит о высоком, но не экстремальном уровне зрительского признания. Фильмы с рейтингами выше 9.0 встречаются редко и выглядят скорее как исключения, формируя символическую вершину списка. Таким образом, Top-250 — это не собрание рекордсменов, а скорее отбор стабильно сильных работ, получивших широкое и устойчивое одобрение аудитории.
Фильмы по десятилетиям выпуска
Распределение фильмов по десятилетиям ясно показывает смещение списка в сторону современного кино. Начиная с 1980–1990-х годов количество фильмов в Top-250 резко возрастает, а наибольшее представительство приходится на 1990-е, 2000-е и 2010-е годы. Более ранние периоды, особенно 1920–1950-е, представлены значительно скромнее. Это отражает не только рост объёма кинопроизводства, но и эффект зрительской памяти: современные фильмы активнее пересматриваются, обсуждаются и оцениваются, что повышает их шансы закрепиться в рейтинге.
Топ-10 жанров
Анализ жанрового состава Top-250 показывает явное доминирование драмы, которая значительно опережает все остальные жанры по количеству фильмов. За ней следуют приключения, криминал, боевик и комедия, однако их вклад заметно меньше. Остальные жанры — такие как триллер, биография, военный фильм и анимация — присутствуют, но играют второстепенную роль. Это указывает на то, что зрители IMDb чаще всего ценят фильмы за эмоциональную глубину, сложные конфликты и развитие персонажей, даже если эти элементы встроены в жанровые формы.
Длительность фильмов
Гистограмма длительности фильмов демонстрирует, что IMDb Top-250 формирует довольно чёткий стандарт хронометража. Большинство фильмов укладывается в интервал от примерно 1 часа 40 минут до 2 часов 40 минут, что соответствует классическому представлению о полнометражном кино. Короткие фильмы встречаются крайне редко, а очень длинные картины (более трёх часов) выглядят как осознанные исключения. Это говорит о том, что для зрителей важен баланс: фильм должен быть достаточно продолжительным, чтобы раскрыть историю, но не перегружать её хронометражем.
Заключение
Анализ IMDb Top-250 показывает, что этот рейтинг формируется не как собрание единичных шедевров, а как устойчивый канон массово признанного кино. В список преимущественно входят фильмы последних десятилетий, что отражает как рост индустрии, так и активное участие современной аудитории в формировании рейтингов. Жанрово Top-250 тяготеет к драме и связанным с ней формам, подчёркивая ценность эмоциональной глубины и проработанных персонажей. При этом фильмы имеют схожий, «классический» хронометраж, что указывает на негласные ожидания зрителей относительно структуры и темпа повествования. В совокупности эти характеристики позволяют рассматривать IMDb Top-250 как срез зрительского вкуса, где высоко ценятся не эксперимент и крайности, а баланс между качеством, доступностью и долговременной значимостью.
Использованные инструменты
— Kaggle С этого сайта взяла датасет IMDb Top 250 Movies
— Google Colab Выполняла код, строила графики и обрабатывала данные
— Python и его библиотеки pandas — работы с таблицей matplotlib — создание графиков numpy — вспомогательные вычисления
— Палитра проекта Для визуализаций я использовала фирменные цвета IMDb: #F5C518 — цветовой акцент #FFFFFF — надписи и подписи #000000 — фон