Original size 3646x5167

The Top 5,000 Most Popular Albums

PROTECT STATUS: not protected

Описание

Музыка — это неотъемлемая часть человеческой культуры, которая отражает настроения, тренды и ценности общества на протяжении десятилетий. В рамках данного проекта я провожу анализ датасета «The Top 5,000 Most Popular Albums» с сайта kaggle, Дата сет основан на информации с сайта Rate Your Music — одной из самых авторитетных платформ для оценки и обсуждения музыки. Этот датасет содержит информацию о 5 000 самых популярных альбомах по версии пользователей сайта, включая такие параметры, как год выпуска, жанры, продолжительность, рейтинг и другие характеристики.

Цель проекта — изучить, как менялись музыкальные предпочтения слушателей с течением времени, выявить самые популярные жанры и исполнители, а также понять, какие факторы влияют на успех альбома. Данный анализ позволит не только глубже понять эволюцию музыкальной индустрии, но и выявить интересные закономерности, которые могут быть полезны как для любителей музыки, так и для профессионалов индустрии.

При создании графиков были использованы следующая цветовая палитра, вдохновленная виниловыми пластинками и старыми обложками альбомов: #FF9F1C, #2EC4B6, #E71D36, #011627.

Для визуализации данных были использованы следующие графики:

Круговая диаграмма Столбчатая диаграмма Линейный график График рассеивания

big
Original size 2781x463

График 1. Топ жанров.

В первом графике я решила проанализировать, какие топ-5 жанров самые встречающиеся среди 5000 лучших альбомов. Из датасета были взяты данные по каждому альбому и их основным жанрам — #primary_genres. Для визуализации данных я выбрала круговую диаграмму. С помощью value_counts () было подсчитано количество альбомов для каждого жанра.

На основе получившейся диаграммы мы можем увидеть, что топ-5 жанров занимает альтернативная музыка: рок и метал.

big
Original size 782x790

Круговая диаграмма топ-5 самых часто встречающихся жанров за все время.

Original size 3472x1952

Код для анализа датасета и создания диаграммы.

График 2. Сколько популярных альбомов вышло в каждом десятилетии.

Во втором графике я решила опять проанализировать популярность жанров, но в этот раз по десятилетиям и сколько было выпущено альбомов самого популярного в том-или ином десятилетии жанра. Для визуализации данных я выбрала столбчатую диаграмму.

С помощью кода я добавила столбцы с десятилетиями, например, 1983 -> 1980, 1995 -> 1990 и тд. Посчитала количество альбомов для каждого жанра в каждом десятилетии. И нашла самый популярный жанр в каждом десятилетии, с помощью groupby и idxmax ().

Original size 1189x590

Столбчатая диаграмма самых популярных жанров по десятилетиям.

Original size 3472x2715

Код для анализа данных и создания столбчатой диаграммы.

График 3. Самые популярные альбомы по годам.

Для анализа трендов популярности по годам и построения третьего графика, показывающего, сколько альбомов из топ-5000 было выпущено в каждом году, я использовала библиотеки pandas для обработки данных и matplotlib или seaborn для визуализации. С помощью groupby и size () подсчитывается количество альбомов, выпущенных в каждом году.

Исходя из полученных данных, можно сделать вывод, что 1970-е является первым десятилетием, в котором было выпущено большое количество популярных в последствии альбомов. Это десятилетие пришлось на пик хард-рок групп (Black Sabbath, Led Zeppelin, Deep Purple, AC/DC). Следующий большой скачок произошел в 1990-х, этот период выдался на необычайную славу гранжа (Nirvana, Soundgarden, Radiohead). И еще один огромный скачок пришелся на вторую половину 2010-х. Это время многообразия жанров, а такое большое количество успешных альбомов можно также объяснить приходом стриминговых сервисов и независимых лейблов, талантливым исполнителям стало легче продвигать свою музыку. Упадок в 2020-х связан с тем, что датасет включает в себя информацию до 2021 года, поэтому информация по количеству альбомов выпущенных за этот период неполная.

Original size 1010x554
Original size 3468x2646

Код для анализа и построения графика.

График 4. Самые высоко оцененные альбомы.

Для анализа альбомов, которые были оценены выше всего, и прослеживания исполнителей с самыми высокими рейтингами, мы я использовала данные из столбцов artist_name и avg_rating. Я сгруппировала данные по исполнителям, рассчитала средний рейтинг для каждого из них и простроила график рассеивания, чтобы визуализировать топ исполнителей по рейтингу.

Несмотря на то, что другие графики показывали преобладание таких жанров, как рок и метал, в топ-10 исполнителей вошли и другие жанры. Первое место занял Чарльз Мингус — американский джазовый контрабасист и композитор. Второе место заняла музыкальная хип-хоп группа Madvillian. Вы можете знать рэпера оттуда — MF Doom. Третье и четвертое место делят знаменитые рок группы. Пятое и шестое делят рэпер Гэри Эрл Грайс и Акира Ямаока, который написал саундтрэк для популярной серии игр Silent Hill. Седьмое место занял дуэт бразильских эстрадных исполнителей: Милтон Насименту и Ло Борджес. Восьмое заняла небезызвестная рок группы The Zombies. Девятое место занял великий гитарист Джимми Хендрикс, а десятое итальянский композитор Эннио Морриконе.

Original size 990x590

График рассеивания.

Original size 3468x2254

Код для анализа датасета и создания графика.

В рамках данного проекта был проведен анализ датасета «The Top 5,000 Most Popular Albums», который позволил изучить ключевые тренды и закономерности в мире музыки. Благодаря использованию современных методов анализа данных и визуализации, удалось ответить на ряд важных вопросов о популярности жанров, влиянии времени выпуска на успех альбомов, а также выявить самых успешных исполнителей и их работы.

The Top 5,000 Most Popular Albums
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more