
Вводная часть

Книга — это хороший подарок и просто вещь которую приятно получить. Используя данные «Book swapping community» представленные Kaggle, можно увидеть статистику произведений, которыми чаще всего обмениваются люди.

Датасет с платформы Kaggle. В нём представлена разнообразная информация от автора до года экранизации. Мой выбор пал на эти данные потому, что мне интересны книги, что это интересная и одновременно приятная тема для анализа, и кроме того, мне стало любопытно, какой литературой чаще обмениваются люди.

Для визуализации я использовала круговую, столбчатую и рассеянную диаграммы, а также тепловую карту.
Ход работы
Сначала я загрузила нужные библиотеки, а потом импортировала датасет из Гугл диска для дальнейшей работы с ним в Pandas.
Дальше нужно было определить и выделить необходимые данные или их диапазон, записав значения в переменные.
Потом задавались основные параметры для таблицы: её размеры, положение элементов внутри, расположение, размер и характер текста и других дополнительных данных вроде линий, количественных значений и подписей.
При выборе палитры я вдохновлялась атмосферой чтения: бледными жёлтыми страницами старых книг и тёмными вечерами, когда тени становятся фиолетовыми или бордовыми от желтоватого света лампы. Для фона я выбрала тусклый бордовый цвет: 61484d. Текст и линии в основном белого цвета. А для основных элементов использовался персиковый: fcc8a9.
Полученные графики
Круговая диаграмма. Самые популярные страны для обмена самыми популярными книгами.
Круговая диаграмма наглядно показывает разницу между странами, в которых часто обмениваются книгами из списка. Как видно, это наиболее распространено в США и Англии, что может быть связано с распространённостью английского языка.
Тепловая карта. Распределение жанров по трём возрастным категориям.
Тепловая карта показывает топ-7 жанров книг для обмена и их популярность среди трёх возрастных категорий: детей, подростков и взрослых. Как видно, среди подростков наиболее популярно фэнтези, также как и у взрослой аудитории, наряду с научной фантастикой. Самый большой контраст можно увидеть в детской литературе: взрослые и подростки ей не интересуются, что, в принципе, довольно предсказуемо.
Диаграмма рассеяния. Соотношение страниц и рейтинга детских книг.
Можно углубиться в более подробное изучение статистики детской литературы. График рассеяния позволяет увидеть одновременно количество страниц и рейтинг книг для теской аудитории. Можно обратить внимание, что размер книг редко превышает 400 страниц, а рейтинг в основном находится в районе 4-4.25.
Столбчатая диаграмма. Топ тегов в книгах для детей.
Столбчатая диаграмма показывает топ-10 тегов в детской литературе. Можно увидеть, что наиболее популярной среди детей является классика.
Описание применения генеративной модели
Для создания изображений, в том числе и обложки, я использовала нейросеть Ideogram.Ai 3.0 Пример промпта: Create a realistic image in a cinematic style, as if it were a frame from a movie, with a hand offering a book for two other hands. The book is closed. Camera captures the scene from above. The lighting is pleasant and warm, with burgundy shadows. The scene takes place in a room, background is blurry.
В качестве консультанта по некоторым затруднительным вопросам, вроде как сделать пунктирную линию, или диаграмму-пончик с текстом в середине, или как поменять местами индексы в тепловой карте, я обращалась к чату DeepSeek. Сначала я присылала в чат свой код, затем задавала по нему вопрос. Промпты: Как в этом коде развернуть метки age_category из вертикального положения в горизонтальное. Напиши код, который будет выводить в центре круговой диаграммы значение суммы всех книг. Объедини страны с процентным значением меньше 2.0 в Other countries. Поменяй местами строки «Children» и «Young Adult».