Original size 1268x1800

«Солнечная линия»: инфографика и визуальные метафоры

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть

Данные: -Источник: текст пьесы Ивана Вырыпаева «Солнечная линия», формат .txt, UTF-8, размер 112 448 байт

Виды графиков: -Облако слов — визуально показывает повторяющиеся и ключевые слова, разбавляет обычные графики -Топ-5 самых частых слов — концентрируется на наиболее значимых словах, используется столбчатая диаграмма -Распределение длин слов — анализирует структуру языка текста, столбчатая диаграмма. -Частота букв — позволяет изучить фонетику и стиль письма, столбчатая диаграмма

Недавно для режиссуры разбирал эту пьесу, был вдохновлен ее минимализмом. Поэтому выбрал ее, такой же минималистичный стиль сортировки и презентации данных, простой и самый полезный на мой взгляд анализ характеристик текста, чб палитру без перегруза, легкий шрифт по типу гельветики

Этапы работы

Обработка данных: -Загрузил текст пьесы -Привет к нижнему регистру и очистил от лишних символов -Для анализа слов использованы регулярные выражения (re) и collections.Counter -Для визуализации использовал библиотеки matplotlib и wordcloud

Стиль графиков: -Градации серого -Единый стиль графиков для визуальной гармонии, легкости и литературности

Статистические методы: -Подсчёт частоты слов и букв -Ранжирование для выделения топа слов -Распределение длин слов для анализа структуры текста

big
Original size 2618x1176

Импорт файла с текстом через Гугл драйв

Итоговые графики

Original size 2606x908

Код для облака слов

Original size 1800x1268

Облако слов

Original size 2620x1006

Код для графика слов

Original size 1388x904

График популярных слов

Original size 2608x892

Код для анализа длины слов

Original size 1568x938

График слов и количества символов в них

Original size 2612x978

Код для графика с буквами

Original size 2030x938

График букв по популярности

Выводы и анализ результатов

Облако слов Позволило быстро увидеть ключевые слова и повторяющиеся мотивы пьесы, выделить основные темы текста визуально (особенно красиво)

Топ популярных слов Показал, какие слова автор использует чаще всего, что помогает определить основные предметы и действия в тексте

Распределение длин слов Демонстрирует преобладание коротких слов, что отражает минималистичный и разговорный стиль пьесы (особенно информативно)

Частота букв Полезна для изучения фонетики и ритма текста, выявления наиболее и наименее используемых букв

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more