
Концепция
Я выбрала тему визуализации данных по лучшим книгам всех времен, потому что сама очень люблю читать и всегда восхищалась силой литературы. Книги для меня — это не просто источник знаний или развлечение, это окно в другие миры, возможность понять разные культуры и эпохи. Создавая этот проект, я хочу показать, как книги, оказавшие влияние на человечество, переплетаются с историей, жанрами и авторскими стилями. Для меня важно, чтобы люди, как и я, могли легко исследовать самые значимые произведения, понять, что они значат для разных поколений, и найти для себя что-то новое, что вдохновит на чтение.
Мудборд

Цвета

1 график
Этот график отображает зависимость между средней оценкой книг и количеством рецензий. На оси X показано количество рецензий, а на оси Y — средняя оценка книг. Каждая точка на графике представляет отдельную книгу, цвет точек варьируется от светло-коричневого до темного, что помогает визуализировать книги с разными оценками. График показывает, что большинство книг с большим количеством рецензий имеют высокие оценки, хотя есть и книги с меньшим количеством рецензий и низкими оценками.
2 график
На этом тепловом графике представлена средняя оценка книг по популярным авторам. По оси X отображены авторы, а по оси Y — их средняя оценка. Каждый автор представлен в виде цветного столбца, где более темные оттенки коричневого (красный и темный) указывают на более низкие оценки, а более светлые оттенки — на высокие оценки. Этот график позволяет легко сравнить, какие авторы получают более высокие или низкие средние оценки для своих книг. Гистограмма дает представление о распределении оценок среди различных авторов, что помогает понять, кто из них имеет большую популярность среди читателей.
3 график
Этот график представляет распределение книг по диапазонам средней оценки. По оси X указаны диапазоны оценок (например, от 1.0 до 1.5, от 1.5 до 2.0 и так далее), а по оси Y — количество книг, попавших в каждый диапазон. На графике видно, что большинство книг имеют оценки от 4.0 до 4.5, что подтверждается высокими столбцами в этих диапазонах. Наименьшее количество книг находится в диапазоне от 4.5 до 5.0. Также видно, что в низкие диапазоны (от 1.0 до 2.5) попало очень мало книг, что указывает на высокую общую оценку книг в базе данных. В правой части графика приведены детали: всего книг, средняя оценка и медианная оценка.
4 график
Эта таблица представляет Топ-10 книг по количеству 5-звездочных оценок. В таблице отображаются книги с наибольшим количеством 5-звездочных оценок, что является важным показателем их популярности среди читателей.
Включены следующие данные: — Название книги (первые 40 символов): Обрезанная версия названия книги. — Автор: Имя автора книги. — Средняя оценка: Средняя оценка, полученная книгой от всех пользователей. — 5★: Количество 5-звездочных оценок, которые получила книга. — % 5★: Процент 5-звездочных оценок от общего числа.
Таблица позволяет быстро определить, какие книги наиболее высоко оценены и популярны среди читателей.
5 график
Эта таблица представляет Топ-10 книг с самыми низкими средними оценками. В таблице представлены книги с наименьшими средними оценками, что позволяет оценить, какие книги получили наибольшее количество негативных отзывов. Включены следующие данные: — Книга: Название книги. — Средняя оценка: Средняя оценка книги по данным пользователей. — Всего оценок: Количество всех оценок, которые были оставлены для книги. — % 1★: Процент 1-звездочных оценок от общего числа оценок, что указывает на наибольшую степень недовольства читателей.
Таблица показывает, что книги с самыми низкими оценками, такие как «Scientology: The Fundamentals of T» и «Plain Girl», имеют высокие проценты 1-звездочных оценок, что указывает на большое количество разочарованных читателей.
6 график
Это облако слов, отображающее наиболее часто встречающиеся слова в названиях книг. Визуально, чем чаще слово встречается, тем больше его размер на облаке. На этом графике видно, что наиболее часто встречаются слова, такие как «World», «Stories», «Man», «Life», «King», «Death» и «History». Эти слова могут указывать на популярные темы в книгах, такие как приключения, философия, личные истории и исторические события. Облако слов помогает быстро выявить ключевые слова и темы.
Заключение
В рамках данного проекта был проведен всесторонний анализ набора данных о книгах с использованием различных методов визуализации. Мы использовали гистограмму для распределения книг по диапазонам средней оценки, чтобы увидеть, как книги распределяются по разным уровням оценок. Также была построена тепловая карта, которая позволила выявить корреляцию между жанрами книг и их средней оценкой, что дало нам понимание, какие жанры получали более высокие или низкие оценки. Кроме того, мы проанализировали Топ-10 книг по количеству 5-звездочных оценок, что позволило выделить наиболее популярные и любимые книги среди читателей. Для книг с низкими оценками была создана таблица, показывающая, какие произведения имеют самые низкие оценки, и какие книги вызвали наибольшее количество негативных отзывов. Результаты анализа наглядно показывают предпочтения и разочарования читателей, помогая выявить успешные и неудачные произведения. Этот проект демонстрирует, как визуализация данных может быть использована для понимания и анализа больших объемов информации, а также для выявления ключевых трендов в отзывах и оценках пользователей.
Источники и данные
Нейросети: Chatgpt5.1 Генерация картинки:
Помощь в коде: Deepseek Chatgpt5.1
Пример промта: Помоги найти ошибки в коде на языке программирования PYTON для визуализации данных при помощи гистограммы в Google Colab.