Original size 735x1036

Анализ популярных книг для обмена

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Для анализа я выбрала датасет с популярными книгами для обмена, доступный на платформе Kaggle: The Most Popular Books for Exchanging. Датасет содержит более 1000 книг с различными характеристиками: название, автор, год публикации, жанр, язык, рейтинг, наличие экранизации, возрастная категория, теги и прочее.

Меня заинтересовали именно эти данные, потому что они позволяют изучить культурные предпочтения читателей и закономерности популярности книг. Можно понять, какие жанры и темы чаще всего обмениваются, какие книги получают высокие рейтинги, а также выявить закономерности по языку, году публикации и возрастной категории. Эти данные имеют ценность для визуального анализа культурного контента и позволяют создавать интересные инфографики, отражающие реальные предпочтения пользователей.

Для проекта я решила использовать следующие виды визуализации: Гистограммы: для анализа распределения рейтингов. Горизонтальные столбчатые диаграммы: для топ-5 книг по рейтингу, чтобы выделить конкретные объекты. Круговые диаграммы: для наглядного сравнения распределения популярных годов публикации. Word Cloud: для визуализации самых частых тегов книг и выявления ключевых тем.

Распределение рейтингов популярных книг

big
Original size 788x490
big
Original size 914x664

Гистограмма показывает распределение средних рейтингов всех книг в датасете. Видно, что большинство популярных книг имеют высокий рейтинг, а крайне низкие оценки встречаются редко. Такой график помогает быстро оценить общую оценку книг и понять, какие произведения наиболее популярны среди читателей.

Топ-5 книг по среднему рейтингу

Original size 790x490
Original size 1144x930

Горизонтальная столбчатая диаграмма отображает топ-5 книг с наивысшим средним рейтингом. Каждый бар окрашен в отдельный цвет, чтобы выделить конкретные книги, и позволяет сразу увидеть, какие произведения лидируют по популярности и оценкам читателей.

Самые популярные теги книг

Original size 944x506
Original size 1044x816

Word Cloud визуализирует самые часто встречающиеся теги книг в датасете. Размер слова соответствует частоте его появления, что позволяет быстро увидеть основные темы и интересы читателей, а цвета делают графику наглядной и привлекательной.

Самые популярные годы публикации книг

Original size 667x690
Original size 1308x828

Круговая диаграмма показывает распределение книг по самым популярным годам публикации. Проценты на графике позволяют оценить, в какие годы выходило наибольшее количество популярных книг, а разные цвета помогают быстро сравнивать доли каждого года.

Заключение

В результате анализа датасета популярных книг удалось выявить ключевые закономерности: какие книги получают высокие рейтинги, какие годы и темы наиболее популярны, какие теги чаще всего встречаются. Визуализации помогли наглядно показать эти тенденции и сделали данные более понятными и информативными. Проект демонстрирует, как с помощью анализа и визуализации можно быстро понять структуру и особенности большого массива информации.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more