Original size 1750x2480

Визуализация данных

PROTECT STATUS: not protected
3

Вводная часть

Я решила проанализировать датасет, посвященный тревожности и депрессии, на который наткнулась на сайте kaggle.com. Мне было интересно проанализировать данный датасет, так как он заинтересовал меня своим содержанием. В наше время депрессия — довольно популярное расстройство. Его можно обнаружить практически у каждого человека. Поэтому я решила проанализировать первых 500 участников опроса и выяснить, какие факторы ведут к развитию депрессии, а какие наоборот, снижают риск её развития. Для своего исследования я выбрала 4 фактора: сон, физическая активность, стресс на работе и финансовый стресс. Для демонстрации я решила использовать столбчатые диаграммы, так как в моём случае они были наиболее удобны.

Этапы работы

Я решила каждый фактор обрабатывать по отдельности, и для начала проанализировала как время сна влияет на уровень депрессии. Для начала я создала датафрейм, выделила первых 500 человек и далее выделила из фрейма 2 столбца: время сна и уровень депрессии:

big
Original size 1604x329

Далее я создала несколько массивов и прошлась с помощью цикла for по строкам датасета, добавив условия для добавления в массивы с помощью if/elif/else. В сами массивы я добавила показатели уровня депрессии:

big
Original size 1132x776

После я создала еще 2 массива, один с помощью numpy и его функции array. В него я добавила средние значения уровня депрессии с каждой группы, которые я получила с помощью функции mean. Во второй массив я добавила время сна участников:

Original size 1601x74

Далее я прикрепила картинку, создала и вывела диаграмму и задний фон, задав цвет столбцов и прикрепив названия самой диаграммы и её осей:

Original size 1488x532

С последующими факторами я проделала все те же действия. В качестве заднего фона я решила использовать минималистичный черный фон, так как он фокусирует внимание на диаграмме и позволяет легче воспринимать информацию.

Итоговые графики

Original size 1223x910
Original size 1155x902
Original size 1181x894
Original size 1217x909

Вывод

Исходя из полученных данных, я сделала вывод, что большая физическая активность и здоровый сон имеют большое влияние на уровень депрессии у участников опроса, в то время как стресс на работе и финансовый стресс оказывают не столь сильный эффект на развитие депрессии.

Облако с датасетом и блокнотом с кодом доступно по ссылке: https://disk.yandex.ru/d/N2PRwdnszg8J-A

Визуализация данных
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more