
Описание проекта
Для меня советские фильмы стали важным этапом формирования моей личности. До сих пор я с большим удовольствием смотрю разнообразные кинокартины, которые родились в период существования СССР. Однако многие из моих друзей и знакомых никогда не видели данные шедевры, несмотря на популярность многих фильмов. Именно поэтому мне захотелось сделать анализ советских кинофильмов в современных реалиях.

кадр из фильма «Служебный роман» (реж. Эльдар Рязанов, 1977 г.)
Для своего анализа я выбрала подробный датасет с рейтингом Топ-250 лучших фильмов на платформе Кинопоиск за 2020 год, куда входили фильмы, снятые в СССР. Данный набор данных взят с с сайта соревнований для специалистов по Data Science Kaggle.
В ходе анализа датасет для визуализации данных я решила сгенерировать следующие виды графиков, поскольку нашла их наиболее релевантными и наглядными:
Круговая диаграмма (наглядно демонстрирует процентное соотношение советского кино и фильмов из других стран/из России в рейтинге)
Столбчатая диаграмма (показывает наиболее успешных советских режиссёров)
Тепловая карта (Heatmap) (отображает средний рейтинг фильмов по годам)
Линейный график (отображает фильмы каких периодов СССР были наиболее популярны в 2020 году).

При оформлении графиков я хотела продемонстрировать разнообразие советского кинематографа. Цветовая палитра построена на контрасте: чёрный и бежево-серый цвета (отсылка к ч/б кино), голубой (олицетворение голубого неба — частого символа свободы), розовый (олицетворение любовной линии в кинофильме) и ярко-оранжевый (огонь или приключения).
Предварительная подготовка
В самом начале я загрузила найденные данные в среду Google Colab.
Для того, чтобы начать работу, я подготовила необходимый инструментарий: библиотеку pandas для обработки табличных данных, а также matplotlib.pyplot для построения графиков.
Затем я загрузила основной файл с датасетом: kinopoisk-top250.csv (данные из рейтинга топ-250 Кинопоиска), а также задала определённую палитру цветов.
Для обнаружения советских фильмов среди других в рейтинге я задала, чтобы в колонке со страной было указано СССР.
Итоговые графики
График № 1
круговая диаграмма
График № 2
столбчатая диаграмма
График № 3
тепловая карта
График № 4
линейный график
Заключение
Таким образом, в рамках проекта я провела детальный анализ данных о советских фильмах в российском рейтинге 2020 года. Моя работа включала несколько этапов, а именно: выбор и загрузка данных в блокнот Google Colab, предобработка, статистический анализ датасета и создание инфографики.
По итогам анализа я пришла к следующим выводам: 1. Советские фильмы всё ещё остаются популярными и актуальными в современных реалиях, в топе из 250 кинокартин они составляют 16,8%, что является довольно хорошим показателем; 2. Самым успешным советским режиссёром является Игорь Масленников, так как сразу семь его фильмов попали в рейтинг; 3. Самые высокие рейтинги фильмов (>8,7) были в 1965 и в 1973 годах; 4. Фильмы начального периода существования СССР не вошли в рейтинг платформы Кинопоиска, но, начиная с эпохи оттепели, советские кинокартины стали более успешными, пик выпуска популярных фильмов пришёлся на эпоху застоя (1966–1979 гг.).
Описание применения генеративной модели
Chat gpt запросы, связанные с разработкой и оптимизацией компьютерного кода
Adobe color алгоритм для автоматического создания цветовой палитры, используя загруженное изображение в качестве основы
Midjorney генерация обложки проекта с помощью промта (a child’s drawing of the text «soviet films " written in crayon, on top of an abstract background with bold colors and shapes. the word is large and centered at eye level, surrounded by various doodles and patterns that resemble graffiti-style lettering. there’s a sense of energy and movement to it, as if the artist was expressing their thoughts or ideas onto paper. it has a playful yet slightly chaotic feel to it, in the style of jean dubuffet) и референса