Original size 2480x3500

Финальный проект: Анализ данных — связь фибромиалгии и аутичного поведения

PROTECT STATUS: not protected
248

Вводная часть

Для поиска данных, которые я буду анализировать, я выбрал список баз данных на сайте Kaggle.com. Я хотел анализировать что-то, связанное с ментальным здоровьем, и остановился на базе данных, посвящённой связи фибромиалгии и аутичного поведения и сенсорной чувствительности.

Фибромиалгия — это хроническое заболевание, характеризующееся болями в мышцах и мягких тканях. Цель анализа — исследовать взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Для этого я проанализировал данные контрольной группы и группы пациентов с фибромиалгией. Расстройства аутистического спектра (РАС) — это группа нейроразвивающих состояний, характеризующихся различными степенями трудностей в социальной коммуникации, повторяющимся поведением и ограниченными интересами. РАС охватывает широкий спектр симптомов и уровней функционирования, от серьезных нарушений, требующих значительной поддержки, до состояний, при которых человек может жить самостоятельно.

big
Original size 1912x475

Датасет на Kaggle.com

В этом наборе данных исследуется взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Данные включают различные показатели, полученные как в контрольной группе, так и в группах, страдающих фибромиалгией. Я выбрал для анализа именно эти данные, потому что: - Мне показалось, что это достаточно неисследованная тема; я никогда прежде не слышал про фибромиалгию и не знал, что она может быть связана с расстройством аутистического спектра; - У меня самого есть РАС, поэтому я подумал, что в процессе анализа могу узнать что-то новое о себе и своём состоянии;

Для анализа данных я решил использовать boxplot (ящиковые диаграммы).

Почему Boxplot? 1. Отображение распределения данных: Boxplot позволяет визуализировать распределение данных по группам, показывая медиану, квартили и возможные выбросы. Это полезно для понимания диапазона значений и симметричности распределения.

2. Сравнение групп: Boxplot хорошо подходит для сравнения нескольких групп. В данном случае мы сравниваем группы «Контроль» и «Фибромиалгия», а также пол (мужчины и женщины). Он позволяет легко увидеть различия между группами в отношении центральной тенденции и вариативности.

3. Идентификация выбросов: Boxplot отображает выбросы, что помогает выявить аномальные значения в данных. Это важно для дальнейшего анализа и принятия решений по обработке данных.

Этапы работы

В этой таблице содержатся данные из 399 записей с 74 столбцами, включающими такие переменные, как группа (контроль или фибромиалгия), пол, возраст, различные индексы и показатели. Для дальнейшего анализа и визуализации я выбрал несколько показателей: решил сравнить показатели CSI_total (общий индекс CSI) и SAT_total (общий индекс SAT) в зависимости от группы и пола.

Анализ данных - Распределение общего индекса CSI и SAT по группам (контроль и фибромиалгия). - Распределение общего индекса CSI и SAT по полу.

Сначала я загрузил файл с помощью функции files.upload () в Colab. Более подробный процесс описан на скриншотах через пояснения в самом коде.

Original size 598x262

Элемент моего кода из Google Colab

Затем нужно было прочитать загруженный файл, используя его имя. При запуске кода появилось окошко, в котором нужно было выбрать нужный файл в формате csv из проводника.

Original size 760x319

Элемент моего кода из Google Colab

Дальше нужно было создать новый DataFrame с интересующими меня столбцами и переименовать их для удобства.

Original size 1384x163

Элемент моего кода из Google Colab

Здесь отображено использование seaborn и matplotlib для построения графиков.

Original size 1276x1116

Элемент моего кода из Google Colab

Вывод из анализа Этот анализ позволяет визуально оценить различия в показателях CSI и SAT между разными группами и полами.

Такие графики получились на выходе при запуске этого кода.

0

Первичные графики до стилизации

Затем последовал этап первичной стилизации полученных данных. У меня не нашлось никаких референсов, но я хотел сделать что-то приятное глазу.

Original size 1371x586

Элемент моего кода стилизации

Я переименовал столбцы для удобства, установил стиль и палитру (whitegrid и coolwarm). Функция внизу скриншота сверху отвечает за улучшение внешнего вида графика.

Original size 1276x753

Элемент моего кода стилизации

Здесь происходит визуализация распределения общего индекса CSI и SAT по группам и по полу.

В итоге получились такие графики. Здесь видно, что изменены размеры шрифтов, цветовая палитра, начертание. А также сетка была сделана пунктирной.

0

Итоговые графики

Ещё я попробовал поиграть с другими цветовыми гаммами, но как итоговый вариант решил оставить предыдущий.

Original size 1189x676

Ещё вариант графика

Я захотел стилизовать график под что-то похожее на референсы, которые я приложу ниже. Потребовалось написать новый код. Этот код использует библиотеку mplcyberpunk: он добавляет к графикам неоновые эффекты и создаёт новый стиль в приятных тёмных тонах.

Original size 1269x765

Референс графиков

Original size 785x576

Референс графиков

Original size 1795x520

Загрузка библиотеки

Загрузка библиотеки происходит в отдельном терминале. Затем, уже в другом, пишется код стилизации графика. Он во многом повторяет предыдущие варианты, но прибавляются усложнённые функции для создания улучшенного стиля.

0

Код в Google Colab

Второй скриншот в этом слайдере содержит код, который помог мне внести финальные штрихи в палитру моего графика.

Original size 1178x679
Original size 1189x679
Original size 1178x679

На этих скриншотах изображено то, что у меня получилось. А в разделе «Итоговые графики» будет показан вариант, который получился в итоге, после второго кода на слайдере выше.

Подытожим проведённую работу После загрузки данных были проведены следующие этапы обработки:

- Проверка данных на наличие пропущенных значений и выбросов. - Приведение названий столбцов к удобочитаемому виду. - Проведение описательной статистики для ключевых переменных, таких как CSI_total и SAT_total.

Визуализация данных Было создано несколько визуализаций, чтобы понять распределение ключевых показателей по группам и полу:

- Boxplot распределения CSI_total по группам показал, что группа с фибромиалгией имеет более высокие значения CSI_total по сравнению с контрольной группой, что указывает на более высокую чувствительность к сенсорным процессам. - Boxplot распределения SAT_total по группам выявил, что группа с фибромиалгией также имеет более высокие значения SAT_total, что свидетельствует о более высоком уровне аутистических черт. - Boxplot распределения CSI_total и SAT_total по полу помог выявить, есть ли различия между мужчинами и женщинами в обеих группах.

Статистический анализ Для проверки значимости различий между группами и полами были проведены следующие этапы кода и тесты:

- Тест для CSI_total по группам показал, что различия между контрольной группой и группой с фибромиалгией статистически значимы. - Тест для SAT_total по группам также подтвердил значимые различия между группами. - Анализ по полу не выявил значимых различий, что позволяет сделать вывод о том, что пол не оказывает существенного влияния на показатели CSI_total и SAT_total.

Вывод

Анализ показал, что фибромиалгия связана с повышенной чувствительностью к сенсорным процессам и увеличением черт аутистического спектра. Это подтверждает гипотезу о взаимосвязи между фибромиалгией и поведением, похожим на аутизм. Данные результаты в теории могут быть полезны для дальнейших исследований и разработки методов лечения, направленных на снижение сенсорной чувствительности у пациентов с фибромиалгией.

Итоговые графики

Второй скриншот в моём слайдере выше посвящён коду, который помог мне стилизовать графики в неоновом стиле в синих тонах. Этот код сделал следующее: - Добавил цветные сетки и контурные линии; - Изменил шрифт на более современный; - Добавил свечения к боксплотам; - Использовал более яркие цвета и градиенты.

0

Итоговые графики

А это варианты в более ярких цветах, но всё ещё подходящих под выбранные референсы графиков.

0

Ещё варианты итоговых графиков

Также были сделаны столбчатая диаграмма и график плотности. Столбчатая диаграмма показывает средние значения CSI Total с ошибками в каждой группе. График плотности отображает распределение значений CSI Total в каждой группе.

Как и предыдущий график, они визуализированы под неоновый стиль.

Original size 1222x240

Код создания столбчатой диаграммы

Original size 991x545

Столбчатая диаграмма

Original size 1600x256

Код графика плотности

Original size 1010x545

График плотности (мой любимый график, такие красивые холмики вышли!)

Также был создан график распределения CSI Total по группам и точечная диаграмма, показывающая связь между CSI Total и SAT Total по группам.

Original size 1846x252

Код графика распределения

Original size 1018x545

График распределения

Original size 1774x234

Код точечной диаграммы

Original size 998x545

Точечная диаграмма

Описание применения генеративной модели

Я использовал нейросеть на базе Midjourney, чтобы создать обложку для проекта. Написанный промпт: «Сгенерируй обложку к следующему проекту: Финальный проект: Анализ данных — связь фибромиалгии и аутичного поведения. В этом наборе данных исследуется взаимосвязь между фибромиалгией и поведением, похожим на аутизм, с акцентом на повышенную чувствительность к сенсорным процессам. Данные включают различные показатели, полученные как в контрольной группе, так и в группах, страдающих фибромиалгией.»

Нейросеть: @chromic666_bot

Финальный проект: Анализ данных — связь фибромиалгии и аутичного поведения
248
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more