Original size 720x1008

Анализ данных популярности книг в библиотеках

PROTECT STATUS: not protected
10

Описание проекта

Для анализа я выбрала базу данных «Рейтинг книг, пользовавшихся наибольшим спросом у читателей библиотек по годам», который представлен в портале открытых данных Правительства Москвы, раздел «Культура». Анализ этих данных и визуализация позволяет проанализировать тренды и изменения в предпочтениях читателей. Для визуализации были использованы столбчатые диаграммы, так как они наиболее наглядно демонстрируют тенденции популярности и позволяют сравнить показатели в разные временные периоды. Также визуально столбцы диаграммы напоминают полку с книгами, что соответствует рассматриваемой теме.

Анализ данных и визуализация

Для начала необходимо импортировать необходимые библиотеки — pandas для работы с данными, matplotlib.pyplot и seaborn для визуализации данных, matplotlib.cm для создания цветовых палитр и numpy для работы с числовыми данными, а также подключиться к Google Drive, чтобы получить доступ к файлу, который будем анализировать. Далее происходит загрузка данных из CSV файла в DataFrame с помощью функции pd.read_csv () из библиотеки pandas. Для этого указан путь к файлу в Google Drive и разделитель, используемый в файле. После загрузки данных выполняется преобразование некоторых столбцов в тип int для того, чтобы можно было выполнять арифметические операции с этими столбцами и использовать их в дальнейшем для анализа данных.

big
Original size 1654x885

Создадим график, отображающий количество книг по жанрам. Необходимо указать столбцы для отображения на осях x и y — количество книг и жанр, а также задать цветовую палитру. Добавим подписи осей, заголовок и поворот меток оси x.

Original size 1500x622

код № 1

Original size 842x674

график № 1

Далее проанализируем средний рейтинг популярности книг по жанрам. Для этого сначала посчитаем средний рейтинг для каждого жанра, а затем отсортируем их по убыванию. Добавим цветовую палитру, подписи осей и заголовок.

Original size 1498x850

код № 2

Original size 833x674

график № 2

Для построения графика, который иллюстрирует средний рейтинг книг каждой страны необходимо сгруппировать данные по странам, вычислить средний рейтинг для каждой страны и отсортировать в порядке убывания.

Original size 1569x846

код № 3

Original size 833x753

график № 3

В следующем графике представлен рейтинг популярности книг по издательствам. Для его создания необходимо для каждого издательства вычислить средний рейтинг популярности и далее отсортировать полученные данные в порядке убывания рейтинга.

Original size 1644x849

код № 4

Original size 842x761

график № 4

Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: Minimalist photograph of a wooden bookshelf on which a collection of bright, colorful books are neatly arranged. The background is simple and clean.

Анализ данных популярности книг в библиотеках
10
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more