
Вводная часть
Для поиска данных, которые я буду анализировать, я выбрал список баз данных на сайте Kaggle.com. Я хотел анализировать что-то, связанное с ментальным здоровьем, и остановился на базе данных, посвящённой связи фибромиалгии и аутичного поведения и сенсорной чувствительности.
Фибромиалгия — это хроническое заболевание, характеризующееся болями в мышцах и мягких тканях. Цель анализа — исследовать взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Для этого я проанализировал данные контрольной группы и группы пациентов с фибромиалгией. Расстройства аутистического спектра (РАС) — это группа нейроразвивающих состояний, характеризующихся различными степенями трудностей в социальной коммуникации, повторяющимся поведением и ограниченными интересами. РАС охватывает широкий спектр симптомов и уровней функционирования, от серьезных нарушений, требующих значительной поддержки, до состояний, при которых человек может жить самостоятельно.

В этом наборе данных исследуется взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Данные включают различные показатели, полученные как в контрольной группе, так и в группах, страдающих фибромиалгией. Я выбрал для анализа именно эти данные, потому что: - Мне показалось, что это достаточно неисследованная тема; я никогда прежде не слышал про фибромиалгию и не знал, что она может быть связана с расстройством аутистического спектра; - У меня самого есть РАС, поэтому я подумал, что в процессе анализа могу узнать что-то новое о себе и своём состоянии;
Для анализа данных я решил использовать boxplot (ящиковые диаграммы).
Почему Boxplot? 1. Отображение распределения данных: Boxplot позволяет визуализировать распределение данных по группам, показывая медиану, квартили и возможные выбросы. Это полезно для понимания диапазона значений и симметричности распределения.
2. Сравнение групп: Boxplot хорошо подходит для сравнения нескольких групп. В данном случае мы сравниваем группы «Контроль» и «Фибромиалгия», а также пол (мужчины и женщины). Он позволяет легко увидеть различия между группами в отношении центральной тенденции и вариативности.
3. Идентификация выбросов: Boxplot отображает выбросы, что помогает выявить аномальные значения в данных. Это важно для дальнейшего анализа и принятия решений по обработке данных.
Этапы работы
В этой таблице содержатся данные из 399 записей с 74 столбцами, включающими такие переменные, как группа (контроль или фибромиалгия), пол, возраст, различные индексы и показатели. Для дальнейшего анализа и визуализации я выбрал несколько показателей: решил сравнить показатели CSI_total (общий индекс CSI) и SAT_total (общий индекс SAT) в зависимости от группы и пола.
Анализ данных - Распределение общего индекса CSI и SAT по группам (контроль и фибромиалгия). - Распределение общего индекса CSI и SAT по полу.
Сначала я загрузил файл с помощью функции files.upload () в Colab. Более подробный процесс описан на скриншотах через пояснения в самом коде.
Затем нужно было прочитать загруженный файл, используя его имя. При запуске кода появилось окошко, в котором нужно было выбрать нужный файл в формате csv из проводника.
Дальше нужно было создать новый DataFrame с интересующими меня столбцами и переименовать их для удобства.
Здесь отображено использование seaborn и matplotlib для построения графиков.
Вывод из анализа Этот анализ позволяет визуально оценить различия в показателях CSI и SAT между разными группами и полами.
Такие графики получились на выходе при запуске этого кода.
Затем последовал этап первичной стилизации полученных данных. У меня не нашлось никаких референсов, но я хотел сделать что-то приятное глазу.
Я переименовал столбцы для удобства, установил стиль и палитру (whitegrid и coolwarm). Функция внизу скриншота сверху отвечает за улучшение внешнего вида графика.
Здесь происходит визуализация распределения общего индекса CSI и SAT по группам и по полу.
В итоге получились такие графики. Здесь видно, что изменены размеры шрифтов, цветовая палитра, начертание. А также сетка была сделана пунктирной.
Ещё я попробовал поиграть с другими цветовыми гаммами, но как итоговый вариант решил оставить предыдущий.
Я захотел стилизовать график под что-то похожее на референсы, которые я приложу ниже. Потребовалось написать новый код. Этот код использует библиотеку mplcyberpunk: он добавляет к графикам неоновые эффекты и создаёт новый стиль в приятных тёмных тонах.
Загрузка библиотеки происходит в отдельном терминале. Затем, уже в другом, пишется код стилизации графика. Он во многом повторяет предыдущие варианты, но прибавляются усложнённые функции для создания улучшенного стиля.
Второй скриншот в этом слайдере содержит код, который помог мне внести финальные штрихи в палитру моего графика.
На этих скриншотах изображено то, что у меня получилось. А в разделе «Итоговые графики» будет показан вариант, который получился в итоге, после второго кода на слайдере выше.
Подытожим проведённую работу После загрузки данных были проведены следующие этапы обработки:
- Проверка данных на наличие пропущенных значений и выбросов. - Приведение названий столбцов к удобочитаемому виду. - Проведение описательной статистики для ключевых переменных, таких как CSI_total и SAT_total.
Визуализация данных Было создано несколько визуализаций, чтобы понять распределение ключевых показателей по группам и полу:
- Boxplot распределения CSI_total по группам показал, что группа с фибромиалгией имеет более высокие значения CSI_total по сравнению с контрольной группой, что указывает на более высокую чувствительность к сенсорным процессам. - Boxplot распределения SAT_total по группам выявил, что группа с фибромиалгией также имеет более высокие значения SAT_total, что свидетельствует о более высоком уровне аутистических черт. - Boxplot распределения CSI_total и SAT_total по полу помог выявить, есть ли различия между мужчинами и женщинами в обеих группах.
Статистический анализ Для проверки значимости различий между группами и полами были проведены следующие этапы кода и тесты:
- Тест для CSI_total по группам показал, что различия между контрольной группой и группой с фибромиалгией статистически значимы. - Тест для SAT_total по группам также подтвердил значимые различия между группами. - Анализ по полу не выявил значимых различий, что позволяет сделать вывод о том, что пол не оказывает существенного влияния на показатели CSI_total и SAT_total.
Вывод
Анализ показал, что фибромиалгия связана с повышенной чувствительностью к сенсорным процессам и увеличением черт аутистического спектра. Это подтверждает гипотезу о взаимосвязи между фибромиалгией и поведением, похожим на аутизм. Данные результаты в теории могут быть полезны для дальнейших исследований и разработки методов лечения, направленных на снижение сенсорной чувствительности у пациентов с фибромиалгией.
Итоговые графики
Второй скриншот в моём слайдере выше посвящён коду, который помог мне стилизовать графики в неоновом стиле в синих тонах. Этот код сделал следующее: - Добавил цветные сетки и контурные линии; - Изменил шрифт на более современный; - Добавил свечения к боксплотам; - Использовал более яркие цвета и градиенты.
А это варианты в более ярких цветах, но всё ещё подходящих под выбранные референсы графиков.
Также были сделаны столбчатая диаграмма и график плотности. Столбчатая диаграмма показывает средние значения CSI Total с ошибками в каждой группе. График плотности отображает распределение значений CSI Total в каждой группе.
Как и предыдущий график, они визуализированы под неоновый стиль.
Также был создан график распределения CSI Total по группам и точечная диаграмма, показывающая связь между CSI Total и SAT Total по группам.
Описание применения генеративной модели
Я использовал нейросеть на базе Midjourney, чтобы создать обложку для проекта. Написанный промпт: «Сгенерируй обложку к следующему проекту: Финальный проект: Анализ данных — связь фибромиалгии и аутичного поведения. В этом наборе данных исследуется взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Данные включают различные показатели, полученные как в контрольной группе, так и в группах, страдающих фибромиалгией.»
Нейросеть: @chromic666_bot