Original size 1200x1760

Анализ текстов песен Bob Dylan

PROTECT STATUS: not protected
The project is taking part in the competition

Творчество Боба Дилана занимает особое место в истории популярной музыки XX века. Его песни выходят за рамки привычной песенной формы и часто воспринимаются как самостоятельные литературные высказывания. Певец работает с текстом как с поэтическим материалом, а музыка в его композициях нередко служит средством усиления смысла, а не самоцелью.

На протяжении десятилетий его творчество существенно менялось: от акустического фолка и баллад к электрическому звучанию, блюзу, кантри и более экспериментальным формам. При этом ключевой особенностью певца остаётся внимание к слову, интонации и настроению, что делает его дискографию удобной для анализа не только с культурной, но и с аналитической точки зрения. В отличие от многих других исполнителей, творчество Боба Дилана охватывает длительный временной период и включает большое количество текстов, что позволяет проследить динамику изменений и выявить устойчивые закономерности на основе количественных методов.

big
Original size 618x434

Bob Dylan — Just Like Tom Thumb’s Blues (Official Video).

Мне было интересно обратиться к творчеству Боба Дилана, поскольку его тексты создают ощущение внутреннего диалога с слушателем и они не сводятся к однозначным интерпретациям. Его песни часто оставляют пространство для размышлений и осмысления, что со временем побудило меня внимательнее относиться именно к текстовой стороне его музыки. Такое сочетание личного интереса и выразительной работы со словом стало для меня ключевой причиной выбора данного автора в рамках проекта.

Такой подход позволяет проследить, как менялись темы, настроение и структура песен Боба Дилана на протяжении его карьеры и сопоставить субъективное впечатление с результатами анализа.

Для проведения анализа в работе используется открытый датасет, размещённый на платформе Kaggle, который позволяет рассматривать тексты песен Боба Дилана в структурированном виде и применять к ним количественные методы анализа.

Содержание датасета:

Song Title — название песни, позволяющее идентифицировать отдельные композиции.

Album — альбом, в рамках которого была выпущена песня, что даёт возможность анализировать тексты в контексте отдельных периодов творчества.

Release Year — год релиза, позволяющий проследить изменения тематики и настроений во времени.

Lyrics — полный текст песни, являющийся основным материалом для количественного и смыслового анализа.

post

Цветовая палитра проекта основана на обложке альбома Blonde on Blonde и извлечена с помощью Adobe Color (режим извлечения цветов из изображения). Приглушённые тёплые оттенки отражают эмоциональную неоднозначность и внутреннее напряжение, характерные для альбома. Выбор данного ориентира также связан с моим личным интересом к нему.

Original size 1246x386

Создано с помощью Adobe Color (режим извлечения цветов из изображения).

Первичный анализ датасета

(1) После загрузки файла с данными в среду Google Colab датасет был считан в формат DataFrame с использованием библиотеки pandas. Для первичного знакомства с данными были выведены первые строки таблицы с помощью метода head ().

Original size 1836x170

Данный шаг позволил убедиться в корректности загрузки данных, а также получить общее представление о структуре датасета, названиях столбцов и типе содержащейся информации.

Уже на этом этапе видно, что каждая строка датасета соответствует отдельной песне Боба Дилана и содержит информацию о годе релиза, альбоме, названии композиции и тексте песни.

(2) Далее был проведён анализ размеров и структуры датасета с использованием методов .shape и .info ().

Original size 1308x356

Анализ показал, что датасет содержит 345 записей, каждая из которых соответствует отдельной песне Боба Дилана, и 4 основных признака: год релиза, альбом, название композиции и текст песни.

Корректная структура данных и отсутствие пропусков в сочетании с текстами песен и годами релиза позволяют анализировать изменения лексики и структуры текстов во времени.

Детальный анализ

(1) Как менялась лексика песен со временем

Линейный график

Данный график выбран, поскольку он наглядно показывает изменение среднего числа слов в тексте песен по годам и позволяет проследить динамику усложнения или упрощения структуры текстов со временем.

Original size 1089x490

Линейный график.

Original size 1822x964

График показывает, что в разные годы среднее число слов в тексте песен варьируется примерно от 150–200 до более чем 500 слов. Особенно заметный рост приходится на середину 1980-х годов, тогда как в конце 1960-х и около 2010 года наблюдаются выраженные спады. Эти данные позволяют предположить, что изменения в средней длине текстов связаны с различными этапами творческого пути исполнителя и сменой музыкальных форм.

(2) Тематические мотивы в текстах песен

Столбчатая диаграмма:

Такая диаграмма выбрана, поскольку в данном блоке проводится сравнение частоты различных тематических мотивов, таких как любовь, время, дорога, дом и одиночество. Подобный формат позволяет чётко отразить различия в частоте упоминаний разных тем и сразу увидеть, какие из них встречаются чаще, а какие реже. Диаграмма хорошо подходит для сравнения смысловых категорий и делает структуру тем понятной даже без дополнительного пояснения.

Original size 989x490

Столбчатая диаграмма.

Original size 1638x1194

График показывает, что в текстах песен чаще всего встречаются мотивы любви и времени, тогда как темы дома и одиночества выражены заметно слабее. Это говорит о том, что тексты в большей степени сосредоточены на эмоциональных и внутренних переживаниях, а не на бытовых сюжетах.

(3) Эмоциональная окраска текстов

Накопительная диаграмма с областями:

Данная диаграмма выбрана, потому что она позволяет проследить изменения эмоциональной окраски текстов со временем и сравнить долю положительной и негативной лексики. Такой формат помогает увидеть общий характер эмоциональных изменений по годам.

Original size 1089x490

Накопительная диаграмма с областями.

Original size 1458x946

График показывает, что эмоциональная окраска текстов со временем менялась неравномерно. В разные периоды наблюдаются колебания между преобладанием положительной и негативной лексики, с особенно резкими всплесками негативной окраски в середине 1980-х и середине 1990-х годов. В более поздние годы заметен рост обеих категорий, при этом положительная лексика в целом сохраняет более стабильный характер, тогда как негативная выражена скачкообразно.

(4) Самые длинные песни

Точечный график:

Выбран подобный график, потому что он позволяет наглядно показать длину текстов отдельных песен и сравнить их между собой без объединения в группы. Такой формат делает акцент на различиях между конкретными композициями и не перегружает визуализацию, что особенно важно при работе с небольшим количеством объектов и длинными названиями песен.

Original size 989x490

Точечный график.

Original size 1576x724

График показывает, что самые длинные тексты в дискографии Боба Дилана представлены отдельными композициями и не являются характерной особенностью его творчества в целом. Эти песни значительно выделяются по количеству слов и, как правило, имеют повествовательную структуру, близкую к развернутому рассказу. Такой результат подчёркивает, что в отдельных случаях Дилан использует формат длинного текста как осознанный художественный приём, а не как устойчивую тенденцию.

(5) Облако слов

Облако слов отражает наиболее часто встречающиеся слова в названиях песен. Самыми заметными оказываются слова blue, love, man, baby, one, tonight, gonna, day, dream, talkin.

0

Облако слов.

При этом визуализация показывает, что в названиях доминируют общие и часто повторяющиеся слова, которые сами по себе не дают глубокого представления о тематике песен.

Это делает облако слов скорее иллюстративным элементом, чем полноценным аналитическим инструментом. Такой результат связан с тем, что названия песен являются короткими и содержат ограниченное количество информации, из-за чего данный метод анализа оказывается менее эффективным.

Заключение

Полученные результаты показывают, что тексты песен Боба Дилана значительно различаются по длине и структуре в разные периоды его творчества. Среднее число слов в тексте меняется со временем, что указывает на отсутствие единого устойчивого формата и на постоянный поиск новых выразительных форм. В одни годы Дилан обращается к развернутым, повествовательным композициям, в другие — к более лаконичным и сдержанным по объёму песням.

Тематический анализ демонстрирует преобладание универсальных мотивов, таких как любовь, время и личные переживания, тогда как конкретные бытовые сюжеты встречаются реже. Это позволяет говорить о том, что тексты Дилана чаще направлены на передачу внутреннего состояния и размышлений, а не на описание повседневных событий. При этом эмоциональная окраска песен остаётся неоднородной: соотношение позитивной и негативной лексики меняется, формируя сложное и многослойное настроение.

Анализ самых длинных песен и облако слов по названиям композиций дополняют общее представление о творчестве исполнителя, но одновременно подчёркивают ограничения отдельных методов. В частности, облако слов выполняет скорее иллюстративную функцию, поскольку названия песен не всегда напрямую отражают их содержание и смысловую глубину.

Original size 1196x224

Инструменты

ChatGPT — для корректировки и уточнения кода, а также редактирования и улучшения формулировок текстовой части проекта

Google Colab — для работы с данными и выполнения кода

Kaggle — для поиска и получения исходного датасета

Adobe Photoshop  — для обработки и оформления обложки проекта

Adobe Color — для подбора и формирования цветовой палитры визуализаций

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more