
Творчество Боба Дилана занимает особое место в истории популярной музыки XX века. Его песни выходят за рамки привычной песенной формы и часто воспринимаются как самостоятельные литературные высказывания. Певец работает с текстом как с поэтическим материалом, а музыка в его композициях нередко служит средством усиления смысла, а не самоцелью.
На протяжении десятилетий его творчество существенно менялось: от акустического фолка и баллад к электрическому звучанию, блюзу, кантри и более экспериментальным формам. При этом ключевой особенностью певца остаётся внимание к слову, интонации и настроению, что делает его дискографию удобной для анализа не только с культурной, но и с аналитической точки зрения. В отличие от многих других исполнителей, творчество Боба Дилана охватывает длительный временной период и включает большое количество текстов, что позволяет проследить динамику изменений и выявить устойчивые закономерности на основе количественных методов.

Bob Dylan — Just Like Tom Thumb’s Blues (Official Video).
Мне было интересно обратиться к творчеству Боба Дилана, поскольку его тексты создают ощущение внутреннего диалога с слушателем и они не сводятся к однозначным интерпретациям. Его песни часто оставляют пространство для размышлений и осмысления, что со временем побудило меня внимательнее относиться именно к текстовой стороне его музыки. Такое сочетание личного интереса и выразительной работы со словом стало для меня ключевой причиной выбора данного автора в рамках проекта.
Такой подход позволяет проследить, как менялись темы, настроение и структура песен Боба Дилана на протяжении его карьеры и сопоставить субъективное впечатление с результатами анализа.
Для проведения анализа в работе используется открытый датасет, размещённый на платформе Kaggle, который позволяет рассматривать тексты песен Боба Дилана в структурированном виде и применять к ним количественные методы анализа.
Содержание датасета:
Song Title — название песни, позволяющее идентифицировать отдельные композиции.
Album — альбом, в рамках которого была выпущена песня, что даёт возможность анализировать тексты в контексте отдельных периодов творчества.
Release Year — год релиза, позволяющий проследить изменения тематики и настроений во времени.
Lyrics — полный текст песни, являющийся основным материалом для количественного и смыслового анализа.

Цветовая палитра проекта основана на обложке альбома Blonde on Blonde и извлечена с помощью Adobe Color (режим извлечения цветов из изображения). Приглушённые тёплые оттенки отражают эмоциональную неоднозначность и внутреннее напряжение, характерные для альбома. Выбор данного ориентира также связан с моим личным интересом к нему.
Создано с помощью Adobe Color (режим извлечения цветов из изображения).
Первичный анализ датасета
(1) После загрузки файла с данными в среду Google Colab датасет был считан в формат DataFrame с использованием библиотеки pandas. Для первичного знакомства с данными были выведены первые строки таблицы с помощью метода head ().
Данный шаг позволил убедиться в корректности загрузки данных, а также получить общее представление о структуре датасета, названиях столбцов и типе содержащейся информации.
Уже на этом этапе видно, что каждая строка датасета соответствует отдельной песне Боба Дилана и содержит информацию о годе релиза, альбоме, названии композиции и тексте песни.
(2) Далее был проведён анализ размеров и структуры датасета с использованием методов .shape и .info ().
Анализ показал, что датасет содержит 345 записей, каждая из которых соответствует отдельной песне Боба Дилана, и 4 основных признака: год релиза, альбом, название композиции и текст песни.
Корректная структура данных и отсутствие пропусков в сочетании с текстами песен и годами релиза позволяют анализировать изменения лексики и структуры текстов во времени.
Детальный анализ
(1) Как менялась лексика песен со временем
Линейный график
Данный график выбран, поскольку он наглядно показывает изменение среднего числа слов в тексте песен по годам и позволяет проследить динамику усложнения или упрощения структуры текстов со временем.
Линейный график.
График показывает, что в разные годы среднее число слов в тексте песен варьируется примерно от 150–200 до более чем 500 слов. Особенно заметный рост приходится на середину 1980-х годов, тогда как в конце 1960-х и около 2010 года наблюдаются выраженные спады. Эти данные позволяют предположить, что изменения в средней длине текстов связаны с различными этапами творческого пути исполнителя и сменой музыкальных форм.
(2) Тематические мотивы в текстах песен
Столбчатая диаграмма:
Такая диаграмма выбрана, поскольку в данном блоке проводится сравнение частоты различных тематических мотивов, таких как любовь, время, дорога, дом и одиночество. Подобный формат позволяет чётко отразить различия в частоте упоминаний разных тем и сразу увидеть, какие из них встречаются чаще, а какие реже. Диаграмма хорошо подходит для сравнения смысловых категорий и делает структуру тем понятной даже без дополнительного пояснения.
Столбчатая диаграмма.
График показывает, что в текстах песен чаще всего встречаются мотивы любви и времени, тогда как темы дома и одиночества выражены заметно слабее. Это говорит о том, что тексты в большей степени сосредоточены на эмоциональных и внутренних переживаниях, а не на бытовых сюжетах.
(3) Эмоциональная окраска текстов
Накопительная диаграмма с областями:
Данная диаграмма выбрана, потому что она позволяет проследить изменения эмоциональной окраски текстов со временем и сравнить долю положительной и негативной лексики. Такой формат помогает увидеть общий характер эмоциональных изменений по годам.
Накопительная диаграмма с областями.
График показывает, что эмоциональная окраска текстов со временем менялась неравномерно. В разные периоды наблюдаются колебания между преобладанием положительной и негативной лексики, с особенно резкими всплесками негативной окраски в середине 1980-х и середине 1990-х годов. В более поздние годы заметен рост обеих категорий, при этом положительная лексика в целом сохраняет более стабильный характер, тогда как негативная выражена скачкообразно.
(4) Самые длинные песни
Точечный график:
Выбран подобный график, потому что он позволяет наглядно показать длину текстов отдельных песен и сравнить их между собой без объединения в группы. Такой формат делает акцент на различиях между конкретными композициями и не перегружает визуализацию, что особенно важно при работе с небольшим количеством объектов и длинными названиями песен.
Точечный график.
График показывает, что самые длинные тексты в дискографии Боба Дилана представлены отдельными композициями и не являются характерной особенностью его творчества в целом. Эти песни значительно выделяются по количеству слов и, как правило, имеют повествовательную структуру, близкую к развернутому рассказу. Такой результат подчёркивает, что в отдельных случаях Дилан использует формат длинного текста как осознанный художественный приём, а не как устойчивую тенденцию.
(5) Облако слов
Облако слов отражает наиболее часто встречающиеся слова в названиях песен. Самыми заметными оказываются слова blue, love, man, baby, one, tonight, gonna, day, dream, talkin.
Облако слов.
При этом визуализация показывает, что в названиях доминируют общие и часто повторяющиеся слова, которые сами по себе не дают глубокого представления о тематике песен.
Это делает облако слов скорее иллюстративным элементом, чем полноценным аналитическим инструментом. Такой результат связан с тем, что названия песен являются короткими и содержат ограниченное количество информации, из-за чего данный метод анализа оказывается менее эффективным.
Заключение
Полученные результаты показывают, что тексты песен Боба Дилана значительно различаются по длине и структуре в разные периоды его творчества. Среднее число слов в тексте меняется со временем, что указывает на отсутствие единого устойчивого формата и на постоянный поиск новых выразительных форм. В одни годы Дилан обращается к развернутым, повествовательным композициям, в другие — к более лаконичным и сдержанным по объёму песням.
Тематический анализ демонстрирует преобладание универсальных мотивов, таких как любовь, время и личные переживания, тогда как конкретные бытовые сюжеты встречаются реже. Это позволяет говорить о том, что тексты Дилана чаще направлены на передачу внутреннего состояния и размышлений, а не на описание повседневных событий. При этом эмоциональная окраска песен остаётся неоднородной: соотношение позитивной и негативной лексики меняется, формируя сложное и многослойное настроение.
Анализ самых длинных песен и облако слов по названиям композиций дополняют общее представление о творчестве исполнителя, но одновременно подчёркивают ограничения отдельных методов. В частности, облако слов выполняет скорее иллюстративную функцию, поскольку названия песен не всегда напрямую отражают их содержание и смысловую глубину.
Инструменты
ChatGPT — для корректировки и уточнения кода, а также редактирования и улучшения формулировок текстовой части проекта
Google Colab — для работы с данными и выполнения кода
Kaggle — для поиска и получения исходного датасета
Adobe Photoshop — для обработки и оформления обложки проекта
Adobe Color — для подбора и формирования цветовой палитры визуализаций