
Концепция
Аниме является важной частью современной медиакультуры. Рост стриминговых платформ и онлайн-сообществ приводит к росту больших массивов пользовательских данных (оценки, рейтинги, просмотры), которые можно проанализировать чтобы составить топ популярности тех или иных сериалов в разные периоды, в разных жанрах и так далее. Анализ популярности аниме позволяет выявить культурные тренды, предпочтения аудитории и влияние жанров и времени выхода на успех сериала.

Чтобы проанализировать данные я использовала базу данных «Top 10,000 Anime (Popularity Index of 2024)» размещенный на сайте Kaggle. Датасет включает в себя информацию о более чем 10 000 аниме фильмов и сериалов, включающие в себя полнометражные аниме, аниме-сериалы, спешелы и другие разновидности аниме мультфильмов.
Для анализа я буду использовать различные визуализации (графики) для наглядного примера популярности тех или иных тайтлов.
Для визуальной статистики я взяла за основу фиолетово-синюю гамму, так как Япония у меня ассоциируется с неоновым, ночным, цветочным городом. Обложка сгенерированна в нейросети Recraft с изображением популярных персонажей из аниме Сейлор Мун

Анализ данных и визуализация
Для того чтобы начать работу нужно сперва загрузить дата сет, а так же основные библиотеки для работы с данными. В данном случае будут использоваться Pandas / Matplotlib.pyplot / Numpy
Для наглядности создаю круговую диаграмму чтобы сравнить соотношение популярности и типа выпуска аниме (ТВ сериалы, OVA, ONА, полный метр и другие)
Чтобы создать круговую диаграмму для начала надо было подсчитать популярность того или иного сериала и его тип выпуска.
Круговая диаграмма: соотношение популярности и жанра аниме
Исходя из представленной диаграммы можно сделать вывод что большую популярность занимает сериалы показывающиеся по ТВ
Столбчатая диаграмма
Столбчатая диаграмма: соотношение названия аниме по рейтингу от пользователей
Код для создания столбчатой диаграммы
Благодаря диаграмме удалось выявить топ 10 лучших по рейтингу аниме. В него вошли все аниме с отметкой от 9 и выше.
Горизонтальная столбчатой диаграммы
Затем я решила соотнести аниме сериалы и количество людей, которые добавили это аниме в свое избранное
Горизонтальная столбчатая диаграмма Соотношение аниме сериала и количества пользователей добавивших в избранное
Код для горизонтальной столбчатой диаграммы
Столбчатая гистограмма (по времени)
Столбчатая гистограмма: Пик популярности среди пользователей аниме сериалов по годам
Код для гистограммы
Исходя из данного графика можно сделать вывод что пик популярности аниме по годам приходился примерно на середину 2010-х годов.
Точечный график
Точечная диаграмма Соотношение рейтинга у сериала и количество человек добавивших сериал в избранное
Исходя из данного графика можно сделать вывод что высота рейтинга не сильно влияет на то, как много людей добавляет аниме в избранное
Заключение
Благодаря визуальному анализу дата сета по популярности аниме удалось выявить самые популярные сериалы, узнать их рейтинг. Благодаря графикам можно наглядно изучить популярность тех или иных форматов аниме сериалов, подчеркнуть для себя названия интересных сериалов.
Ссылка на папку с дата сетом и блокнотом: https://drive.google.com/drive/folders/1b3Wd06m7DyD49oYgYRblWWkFxaupaqIq?usp=sharing
Ссылка на сайт с дата сетом: https://www.kaggle.com/datasets/praneshchowdhury/top-10000-anime-dataset-2024?resource=download
Использованные нейросети
Для данного анализа были использованы следующие нейросети:
Chat GPT и Perplexity— подсказки и помощь с выявлением ошибок в коде
Recraft — генерация изображения для обложки