
Дисклеймер
Данное исследование и выводы, сделанные по его результатам, носят исследовательский характер и сделаны исключительно для выявления любопытных закономерностей и взаимосвязей.
Однако не являются основанием для постановки какого-либо диагноза — для этого необходимого обратиться к квалифицированному и компетентному специалисту.
Моя цель — повысить осведомленность к теме психологического и психического здоровья!
Выбор данных и темы проекта
Открыв kaggle, я практически сразу определилась с тематикой и данными для анализа.
Dataset, который лег в основу проекта, называется Mental Disorder Classification и содержит в себе данные 120 респондентов.
Их ответы — оценка 17 симптомов физического и эмоционального состояния, позволяющая определить возможный психический диагноз.
6 лет назад я впервые с ней столкнулась, а 3 года назад нашла своего специалиста.
И, вот, за последние 2 года эта сфера стала мне еще ближе: я стала соавтором комедийно-психологического шоу, где гости в компании комика, психолога и иногда другого эксперта обсуждают свои анонимные истории, делятся переживаниями и получают поддержку.
За время существования проекта и 84 проведенных мероприятия я осознала всю важность повышения осведомленности в обществе о психологическом и психическом здоровье.
Загрузка данных в Google Collab
Данные (датасет) в Google Collab я загрузила, импортировав кagglehub прямо в блокнот.
Далее загрузила библиотеку pandas для их отображения, а после — matplotlib.pyplot, с помощью которого впоследствии и создавала все графики.
Далее загрузила в Google Collab файлы шрифтов с ноутбука и с помощью команды также импортировала их.
Это был стандартный порядок первичных действий для создания всех графиков проекта.
начало каждого кода
Для анализа общих данных: (1) показался мне наиболее подходящим для иллюстрации всего объема данных без погружения в нюансы (2) уже более детальная выборка, при этом все еще позволяющая взглянуть на данные в целом, но уже под другим углом
Для анализа точечной выборки данных: (3) анализ пересечений нескольких показателей (4) среднестатистическое значение нескольких показателей (5) процентное соотношение количества нескольких показателей
(1) Работа с kaggle: — поиск данных выбранной темы — сравнение нескольких датасетов
(2) Работа с coolors: — выбор одного цвета и поиск подходящих сочетаний к нему — формирование цветовой палитры
(3) Работа с ChatGPT (написание запросов от целых к частным): — написание код для создания графика определенного вида (поиск подходящего для конкретного сочетания данных) — итерации сравнения и поиск наиболее интересного (виды, количество, выборки) — анализ, какой вывод хочу и могу получить, исходя из результата данных — оформление (цвета, шрифт, композиция, подписи) — исправление грамматики (в датасете некоторые слова были написаны с ошибками) — упрощение кода путем удаления лишнего/потворяющегося
(4) оформление кода через Carbon.now.sh
(5) загрузка изображений графика и кода в проект
(1) Heatmap: соотношение симптомов и диагнозов
Heatmap позволяет увидеть, какие признаки концентрируются внутри конкретных диагнозов и какие сочетания симптомов формируют устойчивые профили состояний.
В такой ситуации иные представления данных теряют наглядность и возможность комплексно оценить их структуру. Heatmap позволяет сразу выделить зоны концентрации симптомов, визуально уловить повторяющиеся паттерны и сравнить диагнозы целиком, а не по одному изолированному признаку.
Этот тип визуализации особенно удобен на этапе первичного анализа, когда важно понять общую структуру данных.
Биполярный спектр (bipolar type-1 и bipolar type-2), напротив, характеризуется выраженными поведенческими и эмоциональными скачками, отражающими резкие колебания состояния (mood swing, agressive response, sexual activity, optimism и suicidal thoughts).
Группа нормы (normal) не является однородной, однако в ней отсутствуют выраженные пики, что подчеркивает различие между наличием отдельных симптомов и формированием клинического профиля. Наибольшим отличием является отсутствие явной перемены настроения и деструктивных мыслей (mood swing и suicidal thoughts).
В целом данный график позволяет рассматривать диагноз как целостный профиль, а не как наличие или отсутствие одного маркера.


(2) Bullet chart: сравнение симптомов между группами
В отличие от тепловой карты, здесь акцент смещается на количественную разницу между группами по каждому отдельному признаку.
Например, становится очевидно, что грусть (sadness) встречается практически повсеместно и не является специфическим маркером, тогда как деструктивные мысли (suicidal thoughts) и руминация мыслей (overthinking) резко смещены в сторону депрессии (depression).
В то же время выраженные колебания настроения (mood swing) оказываются характерными именно для биполярного спектра (bipolar type-1 и bipolar type-2) и при депрессии (depression) вообще не встречаются.


(3) Stacked bar chart: симптомы внутри депрессии
В данном случае анализ сосредоточен не на сравнении с другими группами, а на внутреннем устройстве самой категории.
Стековая столбчатая диаграмма (stacked bar chart) хорошо подходит для этой цели, поскольку наглядно отображает доли и позволяет увидеть вариативность симптомов внутри одной группы.
Такой формат позволяет увидеть разнообразие клинических проявлений.
Благодаря графику можно заметить, что не всегда при депрессии (depression) встречаются исключительно те эмоциональные проявления, которые свойственно считать негативными.
Показатель чувства эйфории (euphoric) превалирует в сравнении с агрессивной реакцией (aggressive response).
Это означает, что присутствие/отсутствие отдельного симптома одновременно и не гарантирует, и не отменяет диагноз, а также — не снижает клиническую значимость состояния. Ведь для его корректной оценки важна совокупность факторов.
(4) Boxplot: выявление интенсивности сочетания двух показателей
В основе графика лежит не среднее значение, а характер распределения данных.
box: — медиана (50%) — квартиль (нижняя отметка) (25%) — квартиль (верхняя отметка) (75%)
«усы» — линии, идущие вверх и вниз от бокса (box) и показывающие диапазон данных.
Слева график — без симптома; Справа график — с симптомом.
Важное значение имеют медиана, диапазон значений и наличие выбросов.
Boxplot позволяет увидеть нестабильность показателя, сравнить формы распределений между состояниями и зафиксировать асимметрию, что особенно важно при анализе поведенческих характеристик.
Результаты демонстрируют, что сексуальная активность (sexual activity) не привязана к какому-либо одному состоянию, однако…
Агрессивная реакция (aggressive response): — при отсутствии симптома: показатели и разброс ниже — при наличии симптома: показатели и разброс выше
Нервный срыв (nervous break-down): — при отсутствии симптома: разброс показателей ниже, результаты более стабильны — при наличии симптома: разброс выше
Эйфория (euphoric) — при отсутствии симптома и при его наличии: показатели абсолютно идентичны.
Основываясь на вышесказанном, можно сделать вывод, что при нервных срывах (nervous break-down) и агрессивных реакциях (aggressive response) распределение становится более хаотичным. Это подчеркивает, что сексуальная активность (sexual activity) в данном контексте выступает динамическим индикатором эмоциональной нестабильности.
(5) Pie chart: анализ одного показателя из выборки
Такой тип графика хорошо подходит для иллюстрации простых категориальных различий.
График наглядно показывает, что хоть и не подавляющая, но значительная часть людей использует стратегию избегания.
Такой результат указывает на то, что внешняя адаптация и функциональность не всегда означают отсутствие проблемы.
Вывод
Полученные результаты исследования показывают, что различия между депрессией, биполярным спектром и нормой определяются не отдельными симптомами, а их сочетанием, выраженностью и характером взаимодействия.
Депрессия преимущественно связана с внутренней когнитивно-эмоциональной перегрузкой, проявляющейся через подавленное настроение, склонность к руминации, деструктивные мысли и эмоциональную истощенность.
Биполярный спектр, в свою очередь, характеризуется выраженной амплитудой эмоциональных и поведенческих колебаний. Ключевым отличием выступают резкие изменения настроения, импульсивные и агрессивные реакции, а также колебания уровня активности и оптимизма. При этом отдельные симптомы, присущие депрессии, также могут проявляться, однако они не формируют доминирующего паттерна, а являются частью общей нестабильности состояния.
Основываясь на построенных графиках, можно заметить, что, например, депрессивное состояние не всегда сопровождается исключительно негативными или пассивными эмоциональными реакциями. Оно также может включать в себя чувство эйфории или повышенную эмоциональную реактивность. Это говорит о том, что отсутствие или наличие отдельного симптома не гарантирует и не отменяет диагноз, а клиническая значимость состояния определяется совокупностью факторов.
А при состояниях, сопровождающихся агрессивными реакциями и нервными срывами, поведенческие реакции становятся менее предсказуемыми — это также видно из графиков исследования.
Наконец, выявленная распространенность стратегии избегания у части респондентов указывает на возможное расхождение между внешней адаптацией и внутренним состоянием.
Это подчеркивает риск скрытого психологического неблагополучия и необходимость учитывать не только выраженность симптомов, но и способы совладания при интерпретации состояния.
Целью моего исследования было привлечь внимание к теме психологического и психического здоровья и продемонстрировать, что не всегда можно узнать о состоянии человека со стороны.
Люди склонны нарочно или бессознательно скрывать свои беспокойства и проявлять себя в общении совершенно не в том виде, в каком себя ощущают на самом деле.
Важно быть внимательным к себе и людям вокруг; обращаться вовремя к специалистам и оценивать свое состояние комплексно, а не по одному превалирующему симптому!
Цветовая палитра
Одним из основных цветов я взяла салатовый — как вариант основного цвета международного дня психического здоровья (зеленый).
создана с помощью coolors.com