
Описание проекта
Для анализа я выбрала базу данных «Рейтинг книг, пользовавшихся наибольшим спросом у читателей библиотек по годам», который представлен в портале открытых данных Правительства Москвы, раздел «Культура». Анализ этих данных и визуализация позволяет проанализировать тренды и изменения в предпочтениях читателей. Для визуализации были использованы столбчатые диаграммы, так как они наиболее наглядно демонстрируют тенденции популярности и позволяют сравнить показатели в разные временные периоды. Также визуально столбцы диаграммы напоминают полку с книгами, что соответствует рассматриваемой теме.
Анализ данных и визуализация
Для начала необходимо импортировать необходимые библиотеки — pandas для работы с данными, matplotlib.pyplot и seaborn для визуализации данных, matplotlib.cm для создания цветовых палитр и numpy для работы с числовыми данными, а также подключиться к Google Drive, чтобы получить доступ к файлу, который будем анализировать. Далее происходит загрузка данных из CSV файла в DataFrame с помощью функции pd.read_csv () из библиотеки pandas. Для этого указан путь к файлу в Google Drive и разделитель, используемый в файле. После загрузки данных выполняется преобразование некоторых столбцов в тип int для того, чтобы можно было выполнять арифметические операции с этими столбцами и использовать их в дальнейшем для анализа данных.

Создадим график, отображающий количество книг по жанрам. Необходимо указать столбцы для отображения на осях x и y — количество книг и жанр, а также задать цветовую палитру. Добавим подписи осей, заголовок и поворот меток оси x.
код № 1
график № 1
Далее проанализируем средний рейтинг популярности книг по жанрам. Для этого сначала посчитаем средний рейтинг для каждого жанра, а затем отсортируем их по убыванию. Добавим цветовую палитру, подписи осей и заголовок.
код № 2
график № 2
Для построения графика, который иллюстрирует средний рейтинг книг каждой страны необходимо сгруппировать данные по странам, вычислить средний рейтинг для каждой страны и отсортировать в порядке убывания.
код № 3
график № 3
В следующем графике представлен рейтинг популярности книг по издательствам. Для его создания необходимо для каждого издательства вычислить средний рейтинг популярности и далее отсортировать полученные данные в порядке убывания рейтинга.
код № 4
график № 4
Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: Minimalist photograph of a wooden bookshelf on which a collection of bright, colorful books are neatly arranged. The background is simple and clean.