Original size 1728x2304

Исследование уровня стресса среди студентов

PROTECT STATUS: not protected
9

(1)Описание

Стресс во время учебного процесса, увы, частая проблема с которой сталкиваются студенты.

В процессе поиска датасета для проекта на Kaggle, я нашла student lifestyle dataset, в котором представлены данные о том, на какие активности (учеба, общение, активный отдых и тд) сколько времени тратят студенты, а также приведен их уровень стресса и средний балл. Эта тема меня заинтересовала не только своей актуальностью, но и тем, что мой с командой проект на исследовании по майнору очень тесно связан с темой стресса среди студентов, а значит анализ этих данных может пригодиться для работы в дальнейшем. Поэтому, недолго думая, я взяла этот именно этот датасет для анализа.

(2)Выбор стиля

Стиль графиков я подстроила под параметры стиля проекта по майнору. В стиле используются цвета: розовый — #FEBBF6 светло-зеленый — #E5FB94 фиолетовый — #817AE5 темно-синий — #2B428B голубой — #C7E3FD А также шрифты Benzin Regular и CoFoWeather Normal Light.

(3)Начало работы

big
Original size 1902x716

Я начала работу с того, что загрузила все необходимые мне файлы в collab и подключила нужные мне библиотеки (1 блок кода из картинки сверху). После этого, я попросила ChatGPT написать мне код для того, чтобы я могла использовать загруженные шрифты в оформлении графиков (2 блок кода). И, наконец, в переменную df подключила считывание самого датасета (3 блок кода). Дополнительно для своего удобства выписала текстом себе коды цветов, чтобы было быстрее к ним обращаться.

(3)Графики

0

Итак, первым делом я создала pie chart, показывающий процентное соотношение студентов с разными уровнями стресса: высоким (high), средним (moderate) и низким (low). Как я и ожидала, оказалось, что бОльшая часть студентов испытывает высокий и средний уровень стресса и лишь чуть менее 15% испытывают низкий. Грустная статистика, однако это было именно то, что подтолкнуло попробовать выяснить причины стресса в следующих графиках.

Касаемо самого кода для создания графика, из столбца Stress_level с помощью value_counts () были извлечены и подсчитаны все уникальные значения, процентное содержание которых было сокращено до одной цифры после запятой (autopct). На этом графике (и на всех последующих аналогичным образом) все подписи и заголовок были приведены к одним шрифтам с помощью fontproperties=custom_font и fontproperties=custom_font_2, а также были использованы выбранные мой для дизайна цвета.

0

Следующий созданный мной график отражает взаимосвязь среднего балла и часов, потраченных на учебу. Закономерным образом этот график имеет восходящий тренд, то есть с повышением затраченных часов возрастает и средний балл студентов.

Здесь был использован достаточно стандартный ко для создания графика типа scatter, однако, с помощью ChatGPT я добавила в этот код строки ax.spines, которые регулируют цвет границы графика и убирают ненужные (на мой взгляд) границы сверху и справа, оставляя видимыми только сами оси х и у. (Эту часть кода я использовала в построении и других графиков с аналогичным строением).

Original size 3123x1021
0

Далее я создала графики, отражающие какое количество студентов сколько часов спит и какое количество студентов сколько часов учится. Оказалось, что график сна имеет 2 пика: чуть менее 6 часов и 8 часов. В часах учебы самого высокого показателя по количеству человек достигло значение чуть менее 10 часов. Особо интересного вывода из этих данных я не смогла сделать и подумала о том, что стоит попробовать сделать полученные графики для каждого уровня стресса. (см. ниже)

0
0
0

Эти графики получились очень интересными, для наглядности сравнения данных я попросила DeepSeek помочь мне совместить два полученных графика (часы на сон и часы на учебу). Таким образом, мы видим, что люди с высоким уровнем стресса в большинстве случаев тратят от 8 часов в день на учебу, а спят менее 6 часов. (откуда стресс интересно)). Люди со среднем уровнем стресса тратят до 8 часов на учебу, причем преобладающее большинство тратит как раз 8 часов на учебу, спят же все разное количество часов, здесь нет особой закономерности, однако стоит отметить, что в отличие от первого графика никто не спит меньше 6 часов. Из студентов с низким уровнем стресса никто не тратит на учебу более 6 часов и спят все также не менее 6 часов, а большинство даже спит по 10 часов. Вывод получается достаточно забавный: меньше стресса испытывают те люди, которые тратят больше времени на сон и меньше времени на учебу.

0

Следующий график, который я сделала представляет собой распределение среднего балла у людей с разным уровнем стресса. В прямоугольниках представлены основные скопления gpa в данной группе стресса, вся выборка по группе ограничена горизонтальными линиями сверху и снизу, а необычные, выбивающиеся из общей статистики случаи показаны точками. Достаточно предсказуемым образом (особенно после предыдущих графиков) у студентов с высоким уровнем стресса самые высокие показатели среднего балла, а у людей с низким уровнем стресса — самые низкие.

Original size 3123x907
0

После распределения gpa по уровню стресса я решила посмотреть на средний уровень gpa в каждой группе стресса. Получилось снова увидеть похожее на предыдущее распределение. То же самое проделала и для часов физической активности: тут оказалось интересно — люди с низким уровнем стресса больше занимаются спортом. А потом я вспомнила, что у меня есть еще 4 столбца в таблице и можно было бы сделать для каждого такой график, однако это было бы не очень эффективно, учитывая, что каждый график сравнивает значения только внутри одного столбца, поэтому я решила создать матрицу, которая наглядно сравнивает абсолютно все средние значения по каждой из активностей для отдельного уровня стресса. (см. ниже)

0

Итак, повозившись на разных сайтах с документацией и побеседовав с DeepSeek, я написала код для визуализации матрицы в нужном мне стиле. Получилось достаточно много данных, которые можно сравнивать между собой, но я бы хотела обратить внимание лишь на пару моментов. Первое, что привлекло мое внимание — это то, что шаг между средним значениям gpa для каждой группы стресса равен всего 0.2. То есть люди, которые тратят в среднем около 9 часов на учебу получают (в среднем) оценку всего на 0.4 балла выше тех, кто тратит на учебу в 2 раза меньше. Удивительным для меня также стало то, что на внеурочные занятия (Extracurricular) в среднем в каждой группе стресса тратят одинаковое количество часов.

0

Продолжая изучение датасета, я наткнулась на интересный способ визуализации данных — параллельные координаты. Каждая вертикальная ось представляет собой один из параметров (например, часы учебы, часы сна, GPA и т. д.), а каждая линия на графике представляет собой одного студента с определёнными значениями по каждому параметру. Хотя получилось не совсем аккуратно, все же информативно. Из этого графика можно сделать следующие выводы: студенты с высоким уровнем стресса (high): тратят больше времени на учёбу, спят меньше, меньше занимаются физической активностью, имеют более высокий GPA; студенты с низким уровнем стресса (low): тратят меньше времени на учёбу, спят больше, больше занимаются физической активностью, имеют более низкий GPA. Ну а у людей со среднем уровнем стресса нет корреляции между собой.

0

И последний график: он снова отражает количество потраченного времени на разные активности для людей с разным уровнем стресса. Зачем мне 3 графика с изображением одного и того же? Для разных людей, разные типы графиков будут более понятны, а так как я собираюсь использовать эти находки в другом проекте, мне было важно попробовать несколько альтернативных способов вывода сложных данных.

Вывод

На самом деле исследование в очередной раз показало, что хороший сон и физическая активность положительно сказываются на самочувствии студентов и снижают уровень стресса, а высокая учебная нагрузка и отсутствие отдыха приводят к очень высокому уровню стресса. Хотя большие затраты по количеству часов на учебу и приводят к более высоким оценкам, у меня в голове все это время держался риторический вопрос: а стоит ли оно того? Каждый, конечно, ответит на этот вопрос по своему. В заключение, хочу всем, кто прочитал этот текст найти work-life balance и жить в гармонии с собой!

Описание применения генеративных моделей.

Обложка: Ideogram

Промт для обложки: «A digital illustration depicting a group of students in a study environment, visually representing different levels of stress. One student is overwhelmed, holding their head with papers scattered around, while another is calmly meditating or listening to music. Another student is focused on studying with a laptop or books. The background subtly integrates symbolic elements like a brain with stress indicators (e.g., waves or pressure lines) and a clock to represent time pressure. Use a harmonious color palette of pink, blue, light green, dark blue, light blue, and purple, blending smoothly for a visually engaging yet calming effect»

Генерация промта для обложки: Chat GPT

Генерация отдельных функций для кода (упомянуто в тексте работы): Chat GPT

Исправление ошибок в работе кода, создание матрицы и параллельных координат: DeepSeek

Ссылки

Исследование уровня стресса среди студентов
9
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more