
Описание
В поисках интересного датасета на сайте kaggle.com, я сразу обратила внимание на список топ-250 фильмов по версии Кинопоиска. Я очень люблю кинематограф и давно пользуюсь самим сервисом, а этот список — настоящий ориентир, к которому я не раз возвращалась, выбирая, что посмотреть вечером. Недолго думая, я выбрала именно этот датасет для анализа.

Генерация в Recraft
Для визуального представления данных были выбраны такие типы диаграмм, которые обеспечивают максимальную наглядность и позволяют быстро уловить основные тенденции. 1. Линейный график 2. Диаграмма рассеяния 3. Столбчатая диаграмма 4-5. Линейчатая диаграмма 6. Круговая диаграмма
Оформление

В оформлении визуальной части проекта использовалась фирменная цветовая палитра платформы, обеспечивающая узнаваемость и стилистическое единство. В качестве фона и основного цвета типографики был выбран чёрный #000000, создающий нейтральную и контрастную основу для представления данных.
Для обводки и ключевых элементов интерфейса использован белый цвет #FFFFFF, обеспечивающий визуальную чёткость и высокую читаемость.
Основные акценты в визуализациях заданы с помощью ярких, контрастных цветов: — оранжевый #FF5500 — салатовый #BBFF00
Эти оттенки применяются в диаграммах и градиентных заливках, подчеркивая ключевые значения и создавая динамичный, современный визуальный образ.
Загрузка данных и форматирование
В проекте использовались следующие библиотеки: pandas — для обработки табличных данных, numpy — для числовых операций, matplotlib.pyplot — для построения графиков, seaborn — для визуализации статистических данных, matplotlib.colors — для настройки цветовых схем и градиентов, matplotlib.patches — для добавления графических элементов на диаграммы.
1. Просмотр первых строк; 2. Просмотр общей информации о датасете; 3. Приведение типов и фильтрация данных; 4. Настройка фирменных цветов
[1] Рейтинг по годам
На этой диаграмме отображается, как менялся средний рейтинг фильмов из топ-250 Кинопоиска в зависимости от года их выпуска. Линия позволяет проследить общую тенденцию: в какие периоды выходило больше высоко оценённых фильмов, а когда — меньше. Такой график помогает увидеть динамику зрительских предпочтений во времени и оценить, как менялось качество популярных фильмов с годами.
[2] Рейтинг и год выпуска
Этот график показывает, как соотносятся оценки фильмов с годами их выхода. Каждый кружок — это отдельный фильм из топ-250 Кинопоиска. По горизонтали — год выпуска, по вертикали — рейтинг.
Такой тип графика позволяет сразу увидеть, когда выходило больше популярных фильмов, а когда — меньше. Он хорошо показывает, что высоко оценённые фильмы есть как среди старых, так и среди относительно новых. Благодаря форме диаграммы легко заметить общее распределение и разброс данных — без усреднения или сглаживания.
[3] Страны и фильмы
Этот график показывает, какие страны чаще всего представлены в списке топ-250 фильмов на Кинопоиске. В нём отображены топ-10 стран с наибольшим количеством фильмов в рейтинге.
Каждый столбик — это страна, а его высота показывает, сколько фильмов из этой страны попали в список. Такой график помогает сразу понять, какие кинематографии доминируют: например, США, СССР или Франция. Это наглядный способ увидеть географию кинематографического влияния в глазах зрителей Кинопоиска.
Формат столбчатой диаграммы выбран не случайно — он идеально подходит для сравнения категорий между собой по количественным показателям.
[4] Фильмы и год выпуска
График показывает, сколько фильмов было выпущено в каждый год. По сути, это гистограмма, где каждый столбик — это год, а его высота указывает, сколько фильмов из этого списка вышло в тот период.
В отличие от стандартной гистограммы, здесь каждый фильм изображён как отдельная цветная плитка, уложенная вертикально — благодаря этому становится видно не просто количество, а буквально «массу» фильмов по годам. Градиент внутри столбиков делает график более живым и помогает визуально различать плотность.
Этот тип визуализации интересен тем, что позволяет заметить кинематографические волны — периоды повышенной активности или спадов в выпуске культовых фильмов. Также можно увидеть, какие десятилетия особенно богаты на популярное кино, и как с годами изменялось количество знаковых релизов.
[5-6] Режиссёры и фильмы
Этот график показывает, какие режиссёры чаще всего представлены в списке. Он построен в виде горизонтальной столбчатой диаграммы, где каждая строка — это фамилия режиссёра, а длина полосы отражает, сколько его фильмов вошло в список.
Такой тип графика особенно удобен, когда названия категорий — в данном случае имена — достаточно длинные. Он позволяет легко сравнивать значения между участниками и быстро понять, какие режиссёры наиболее влиятельны в глазах зрителей. Это своеобразный рейтинг самых «успешных» авторов по количеству вошедших в топ фильмов.
Круговая диаграмма отражает, какую долю от топ-250 занимают фильмы режиссёров-лидеров по количеству работ. В неё включены 10 самых часто встречающихся имён, и каждый сектор показывает, какую часть от общего числа фильмов составляют их работы.
Такая визуализация хороша тем, что сразу даёт представление о распределении «влияния»: видно, у кого из режиссёров вклад наиболее значительный, а у кого — скромнее. Размер сектора интуитивно передаёт масштаб — чем он больше, тем заметнее режиссёр в общем рейтинге.
Генерация в Recraft
Применения ИИ
В процессе работы над проектом использовались инструменты генеративного искусственного интеллекта: — ChatGPT (модель GPT-4) — применялся для генерации идей по визуальному оформлению проекта; составления промтов для визуального генератора. — Recraft.ai — использовался для генерации изображений, созданных на основе заранее подготовленных промтов. Промты формировались с помощью ChatGPT.