
В этом году я сдаю диплом, который связан с культурой и языками. Поэтому в качестве материала по проекту я решила проанализировать что-то, связанное с такой же темой.
Проект построен по определенной структуре — сначала я начинаю анализ культурных привычек, традиций и мероприятий. Потом уже плавно перехожу к языковой теме — какой язык наиболее распространен и т. п.
Я собрала 5-6 датасетов с сайта Kaggle и в них проанализировала определенные типы информации, которые наиболее подходили моей теме и задачам.
В результате удалось выявить:
Данные представлены в виде гистограмм. С учетом того, что чаще всего материал был достаточно обширный (по странам, много типологий и т.п), я решила, что подобный тип графиков самый удобный для использования.
Обработка данных

Сначала я скачала все датасеты и выгрузила их отдельно на Гугл диск. Далее с помощью кода перед генерацией графиков запускала нужную мне базу данных.
Визуализация данных
Далее я перешла к визуализации данных. В кодах к графикам я отдельно задавала фон и цвет.
В своем дипломе я использую палитру голубого/белого, поэтому именно в таких цветах и сделано оформление.
Использование генеративной модели
С написанием кодов и проверкой ошибок помогала нейросеть ChatGPT
Промты: 1. Что значит ошибка KeyError: «None of ['country'] are in the columns»
2. у меня есть датасет мне нужно построить в Гугл коллабе график — гистограмму с анализом того что для людей важно (семья и т.п) данные находятся в столбце Label пример кода: df.plot (kind='bar', colors=[], title=' ') сделай так еще чтобы фон графика был черный, сам график в голубых оттенках
Вот по такому принципу работа и шла. Сначала я попросила сгенерировать по своему шаблону нужный код, потом копировала и меняла столбцы. В случае ошибок — просила нейросеть разъяснить где конкретно недочет и как его решить.
Обложка сгенерирована в нейросети Reve, промт: Generate a 1600×1100 image on the theme of culture, language and traditions. The palette is blue and white, no other colors. Retro futuristic atmosphere, highlights, glow and gradients, soap images. The graphics should be based on the example of what is included in the reference