Original size 1140x1600

Stranger Things: язык, ритм и эмоции сериала

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Для анализа я выбрала датасет Stranger Things All Dialogue, в котором собраны все субтитры четырёх сезонов «Stranger Things»: от первой реплики в лаборатории Хоукинса до последних слов финала четвёртого сезона. В таблице содержатся ключевые элементы каждой фразы: номер сезона и эпизода, порядок строки, её текст и временные метки. Фактически, этот датасет = «скелет» всего сериала, через который можно увидеть, как развивается сюжет, изменяется настроение сцен и растёт драматическое напряжение.

big
Original size 1280x716

Kling AI: Slow-moving storm clouds glowing red in the sky. Subtle lightning flashes inside the clouds, softly illuminating the scene. The black shadowy hands slightly move and stretch forward.

Промт к иллюстрации: {Dark cinematic illustration inspired by Stranger Things, ominous red storm clouds swirling in the night sky, dramatic lightning illuminating the clouds, multiple long black shadowy monster hands with sharp claws reaching down from the sky, eerie supernatural atmosphere, small town horror vibe. In the foreground a road sign reading «WELCOME TO HAWKINS», slightly tilted, illuminated by lightning. High contrast lighting, deep reds and blacks, cinematic composition, horror fantasy art, detailed digital painting, moody, apocalyptic, 1980s sci-fi horror aesthetic, ultra-detailed, 4k quality. --ar 16:9 --style raw --v 6 --sref https://s.mj.run/siJC-W6QxKU} *Midjourney

Мне было интересно работать именно с этим сериалом, потому что «Stranger Things» — один из тех проектов, где атмосфера создаётся не только визуально, но и ритмом диалогов, короткими эмоциональными фразами и постоянным переключением между персонажами.

Если посмотреть на текстовую сторону сериала, можно заметить множество скрытых закономерностей: в каких сезонах герои говорят больше, где увеличивается динамика, какие темы звучат чаще, и как реплики подчёркивают изменения в тоне повествования.

И самое интересное: сейчас, в конце декабря, выходит весь 5 сезон «Stranger Things» — финальный, самый ожидаемый и самый обсуждаемый. Поэтому исследование предыдущих сезонов именно в 2025 году оказывается особенно актуальным: мы можем увидеть, каким был «диалоговый ритм» сериала до финала и как изменилась его структура за годы существования.

Этот проект = попытка посмотреть на любимый сериал глазами аналитика: не как зритель, а как исследователь, который может измерить атмосферу Хоукинса цифрами и графиками.

Визуализация

Original size 960x960

Kling AI: slow cinematic camera push-in toward a cozy 1980s living room, lights on the alphabet wall softly flicker, some letters briefly glow brighter, minimal motion, slow and smooth animation.

Я использовала разные типы графиков, чтобы посмотреть на сериал с нескольких аналитических ракурсов:

— Столбчатые графики показывают различия в количестве реплик между сезонами и эпизодами. — Линейные графики отражают темп повествования — как меняется количество реплик в минуту от серии к серии. — Heatmap и boxplot помогают проанализировать длину реплик и выявить, где диалоги становятся более развёрнутыми и напряжёнными. — Частотный анализ и WordCloud показывают ключевую лексику и повторяющиеся смысловые маркеры сериала. — Анализ тональности отражает изменения эмоционального характера диалогов по сезонам.

Original size 2560x1574

Мудборд, который лег в основу оформления блоков с кодом.

Загрузка данных

Для начала работы я подготовила необходимый инструментарий: библиотеку pandas — для обработки табличных данных, numpy — для математических расчётов, а также matplotlib.pyplot и seaborn для построения визуализаций. Дополнительно я подключила библиотеки wordcloud для генерации облака слов и TextBlob для базового анализа тональности диалогов.

Затем я загрузила основной файл датасета stranger_things_all_dialogue.csv, содержащий субтитры четырёх сезонов сериала Stranger Things: номер сезона и эпизода, порядок реплик, текст диалогов и временные метки внутри серии.

Original size 4388x641
Original size 4388x2063

Предобработка данных

Original size 4388x1488

Для начала я выделила из датасета только те строки, где действительно содержится текст диалога. Это позволяет исключить пустые строки и технические элементы субтитров. После этого я посчитала количество слов в каждой реплике — эта метрика нужна мне для анализа темпа сериала, средней длины высказываний и общей динамики диалогов.

Затем я отсортировала данные по сезону, эпизоду и порядковому номеру строки. Это важно, потому что диалоги должны идти в хронологическом порядке.

Стилизация графиков

Original size 2568x766

Далее я настроила стиль визуализаций, чтобы привести графики к единой эстетике, вдохновлённой атмосферой сериала Stranger Things.

Я выбрала тёмную тему, передающую настроение Upside Down (изнанки), и задала собственные параметры цветов. Фон графиков сделан полностью чёрным, а акцентные элементы — красные, напоминают фирменный неоновый стиль логотипа сериала.

Я также изменила цвета текста, подписей осей и делений, чтобы визуализация хорошо читалась на тёмном фоне и выглядела цельной.

Original size 4388x2181

Изучающий и объясняющий формат визуализации

Часть визуализаций носит изучающий характер: — столбчатые диаграммы по сезонам и эпизодам показывают общую структуру диалогов; — линейные графики по сериям позволяют увидеть, где сериал становится более «разговорчивым» и динамичным; — графики темпа (реплик в минуту) помогают проанализировать ритм повествования.

Другая часть визуализаций выполняет объясняющую функцию: — heatmap и boxplot показывают распределение и среднюю длину реплик, помогая сравнить сезоны и эпизоды по уровню напряжённости и эмоциональности диалогов; — частотный анализ слов и WordCloud отражают лексику и атмосферу сериала; — график средней тональности по сезонам демонстрирует изменения эмоционального фона.

Используемые статистические методы

В проекте я использовала базовые и интерпретируемые статистические методы: — описательную статистику (подсчёт реплик, среднюю длину реплики, оценку длительности эпизодов); — нормировку показателей через метрику «реплик в минуту» для анализа темпа повествования; — частотный анализ лексики с подсчётом встречаемости слов и их визуализацией; — анализ тональности с помощью TextBlob, где рассчитывается полярность реплик и её средние значения по сезонам.

Количество реплик по сезонам

Original size 4388x1425

На этом этапе я сгруппировала все диалоги по номеру сезона с помощью функции groupby ('season') и посчитала количество реплик в каждом сезоне.

Мне важно было понять общую динамику сериала: как меняется «говорливость» от сезона к сезону, становится ли сериал более насыщенным диалогами или, наоборот, менее текстовым.

Эта метрика = фундамент для первого визуального сравнения сезонов и отправная точка для дальнейшего анализа ритма сериала.

Original size 4388x1607
Original size 1179x780

С каждым сезоном количество реплик увеличивается, особенно резко в 4-м сезоне, что отражает расширение сюжета по мере развития сериала.

Количество реплик по сериям во всех сезонах

Original size 4388x1848

На этом этапе я перешла от анализа сезонов к более детальному уровню — сериям. Мне важно было увидеть внутрисезонную динамику, какие серии самые «разговорчивые», где сюжет идёт быстрее или медленнее. Чтобы подсчитать количество реплик в каждой отдельной серии, я сгруппировала данные сразу по двум колонкам: season и episode.

Команда groupby (['season', 'episode']) позволила мне собрать все диалоги серии вместе, а .count () — вычислить их общее количество.

После этого я создала удобную метку серий формата S1E01, S2E05 и т. д. Эта строка формируется из номера сезона и эпизода, дополненного ведущим нулём, чтобы всё выглядело одинаково и легко сортировалось.

Original size 4388x2231
Original size 2779x980

Количество реплик на эпизод постепенно растёт от ранних сезонов к финальным, с резким пиком в последней серии 4-го сезона — это отражает усложнение сюжета.

Средняя длина реплики по сезонам и сериям

Original size 4388x1344

На этом этапе я агрегировала данные, сгруппировав реплики по сезону и серии, и рассчитала среднюю длину реплики в словах. Это позволило перейти от отдельных диалогов к обобщённым показателям и сравнивать структуру диалогов между эпизодами и сезонами. Полученные значения используются далее для визуального анализа ритма и насыщенности диалогов в сериале.

Original size 4388x1220

Затем я преобразовала агрегированные данные в матричный формат с помощью pivot, где строки соответствуют сезонам, столбцы — сериям, а значения отражают среднюю длину реплики, чтобы построить heatmap.

Original size 4388x1992

В итоге я построила тепловую карту, где цвет ячейки отражает среднюю длину реплики в конкретной серии и сезоне. Чем интенсивнее оттенок, тем более развёрнутыми являются реплики в эпизоде.

Original size 2572x1580

Самые длинные реплики сосредоточены во 2-м и 4-м сезонах (особенно эпизоды 2–4), тогда как в 3-м сезоне диалоги в среднем короче: сериал становится более динамичным и «рваным» по речи.

Распределение длительности диалогов по сезонам

Original size 4388x2150

Для этой главы я использовала boxplot для анализа распределения длины реплик в каждом сезоне. Такой тип диаграммы позволяет оценить не только среднее значение, но и медиану, к примеру. Это помогает понять, насколько однородны диалоги внутри сезонов и в каких сезонах чаще встречаются особенно длинные/короткие реплики.

Original size 989x590

Во всех сезонах медианная длина реплик остаётся близкой, но в поздних сезонах увеличивается разброс, что говорит о более контрастных по длине и эмоциональности диалогах.

«Темп» эпизода: количество реплик в минуту

Original size 3720x3189

Чтобы оценить динамику повествования в сериале, я рассчитала темп эпизода — количество реплик в минуту. Для этого время окончания реплик было переведено в секунды, после чего для каждой серии определялась её фактическая продолжительность как момент последней реплики. Затем длительность эпизодов была объединена с количеством реплик, что позволило вычислить показатель реплик в минуту.

Темп эпизода отражает скорость развития сюжета и позволяет выявить, какие серии отличаются повышенной динамикой, а также как меняется стиль сериала от ранних эпизодов к более поздним за счёт ускорения или замедления диалогов.

Original size 4388x2313
Original size 2779x980

Темп диалогов заметно возрастает к середине сериала, достигая пика в третьем сезоне, после чего становится более неравномерным, отражая чередование напряжённых и спокойных эпизодов.

Частотный анализ слов: топ-слова сериала

Original size 4388x3703

На этом этапе я провела частотный анализ диалогов, чтобы понять, какие слова чаще всего используются в сериале. Частотный анализ позволяет увидеть лексический «почерк» сериала: повторяющиеся мотивы, характер речи героев и общую атмосферу диалогов.

Перед анализом я очистила текст: задала список стоп-слов (служебные и разговорные слова без смысловой нагрузки) и привела диалоги к единому формату. Я использовала функцию tokenize (), которая переводит текст в нижний регистр, удаляет пунктуацию, разбивает строки на слова и отфильтровывает лишние элементы. После этого все очищенные слова из реплик были собраны в единый список.

В результате получился массив из десятков тысяч слов, который использовался для построения топа самых частотных слов и wordcloud.

Original size 4388x1042

После подготовки очищенного набора слов я перешла к подсчёту частотности. Для этого я использовала класс Counter из библиотеки collections, который удобно считает количество вхождений каждого слова.

Я передала список всех слов (all_words) в Counter, чтобы получить частоту каждого уникального слова в диалогах. Затем с помощью метода .most_common (20) я извлекла 20 самых употребляемых слов в сериале: от самых частых к менее частым.

В итоге получился список слов и их количественных значений, который лёг в основу отдельной таблицы и последующей визуализации.

Original size 4388x1380
Original size 1580x980

В топе — слова know, sorry, really, maybe, stop, что указывает на сюжет, построенный вокруг неопределённости, сомнений и эмоциональных реакций персонажей.

WordCloud по всем репликам

Original size 4388x2063

После частотного анализа я решила визуализировать лексику сериала более наглядно — с помощью облака слов.

Я объединила все реплики в одну большую строку, используя " «.join (…), и привела её к нижнему регистру, чтобы одинаковые слова не дублировались („Hello“ и „hello“). После сгенерировала облако слов по всему тексту и вывела его как изображение через matplotlib. На графике слова с большей частотой отображаются крупнее, а редкие — меньше, что помогает уловить атмосферу Stranger Things через повторяющиеся слова.

Original size 1888x964

Доминируют разговорные слова know, want, sorry, think, help, что подчёркивает повседневную, эмоционально насыщенную и диалоговую природу речи персонажей в сериале.

Тональность по сезонам

Original size 4388x2063

Чтобы оценить эмоциональный оттенок диалогов в разных сезонах, я провела анализ тональности с помощью библиотеки TextBlob. Эмоциональный анализ позволяет понять настроение сериала на уровне реплик: были ли сезоны более мрачными и напряжёнными и насколько диалоги становились эмоциональнее.

Я использовала функцию get_sentiment (), которая принимает текст реплики и возвращает показатель полярности: от -1 (негативная речь) до +1 (позитивная речь), 0 — нейтральная реплика.

К каждой выбранной реплике я применила функцию анализа тональности и сохранила результат в новый столбец sentiment. Далее я сгруппировала данные по сезону (groupby ('season')) и вычислила среднюю тональность для каждого сезона.

Original size 4388x2063
Original size 590x390

Тональность диалогов растёт от первого к третьему сезону, а в четвёртом немного снижается, возвращая сериал к более мрачному и напряжённому настроению.

Заключение

Original size 1280x716

Kling AI: slow cinematic animation, massive shadowy spider-like creature silhouette slowly forming inside red storm clouds, realistic volumetric clouds, tension buildup, minimal motion.

Промт к иллюстрации: {wide cinematic shot, apocalyptic red storm sky with massive shadowy spider-like monster silhouette emerging from clouds, lightning tearing through crimson clouds, empty rural road leading into darkness, telephone poles on the sides, ominous scale, supernatural horror atmosphere, Stranger Things inspired aesthetic, deep red and black color palette, volumetric fog, dramatic lighting, high contrast, ultra cinematic, realistic clouds, epic sense of dread --ar 16:9 --style raw --v 6 --sref https://s.mj.run/fz0awAe2OFM} *Midjourney

В рамках проекта я провела количественный анализ диалогов сериала Stranger Things, чтобы понять, как через речь героев формируются динамика сюжета и общее настроение сериала.

Анализ показал, что от сезона к сезону общее число реплик заметно растёт, особенно в четвёртом сезоне, что указывает на усложнение сюжета и увеличение плотности событий.

Boxplot и тепловая карта показали, что структура диалогов меняется от коротких и быстрых реплик к более длинным и развёрнутым высказываниям, особенно в ключевых эпизодах. Это отражает переход от простой подростковой коммуникации к более драматичному и эмоционально насыщенному повествованию. Частотный анализ слов и WordCloud выявили лексику, формирующую атмосферу сериала, — в диалогах доминируют слова, связанные с неопределённостью, поиском, страхом и взаимодействием между персонажами.

Дополнительно был проведён анализ тональности реплик. Усреднённая полярность по сезонам показала, что эмоциональный фон меняется неравномерно: от более нейтрального и «лёгкого» в начале сериала к более напряжённому и мрачному в последующих сезонах.

В итоге проект доказывает, что диалоги Stranger Things — это не просто текст, а важный инструмент повествования. Анализ данных позволил зафиксировать эти изменения количественно и наглядно, подтвердив связь между развитием сюжета и языком персонажей.

*напоследок самая лучшая песня сериала за просмотр проекта ↓ спасибо!

Running Up That Hill (a deal with god)
5 min

Описание применения генеративной модели

Midjourney: генерация обложки и нескольких изображений (v. 6)

Chat GPT: обращения с целью генерации инструкций и рекомендаций по улучшению кода, вопросы по тому, как правильно имплементировать те или иные функции, библиотеки и т.д (v. 5.2)

Kling AI: генерация видео из изображений (v. 2.1)

Topaz Gigapixel AI: увеличение сгенерированных картинок (v. 8)

Промт к обложке: {a lone teenage boy with dark hair riding a bicycle down an empty rural road, massive red storm clouds forming a monstrous creature in the sky, supernatural horror atmosphere, glowing crimson clouds, lightning inside the storm, 1980s small town america, cinematic perspective from behind, apocalyptic mood, dark fantasy, dramatic lighting, volumetric clouds, eerie silence, high contrast, ultra detailed, cinematic realism, movie still, inspired by Stranger Things --ar 2:3 --style raw --v 6 --sref https://s.mj.run/BAFDFDxB_eE} *Midjourney

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more