
Концепция
Всем живым организмам требуется сон, и человек — не исключение. Сон является фундаментальным аспектом, влияющим на здоровье и благополучие. Многие люди пренебрегают сном по разным причинам, поэтому необходимо обратить внимание на изучение взаимосвязи сна и здоровья.
В исследовании я использовала датасет «Sleep health and lifestyle» с сайта Kaggle, который содержит данные о качестве сна и состоянии здоровья опрашиваемых. Он включает информацию о возрасте, поле, образе жизни, наличии болезней и т. д.
Для анализа я взяла информацию о поле, возрасте, профессии и уровне стресса, чтобы изучить качество сна среди взрослых людей с разными условиями жизни.
Данные я решила визуализировать в виде столбчатой диаграммы, диаграммы рассеяния, круговой диаграммы.

Для своей работы я хотела подобрать цвета, которые, на мой взгляд, способствуют расслабленному состоянию, поэтому я подобрала палитру в нежных пастельных цветах, ассоциирующихся со спокойствием и умиротворением.
Подготовка
Для начала я открыла Jupyter, импортировала библиотеки pandas для работы с датафреймами и matplotlib для визуализации, загрузила датасет и отобразила последние 5 строчек.

В датасете содержатся 374 наблюдения. Нужно убедиться, что нет пропусков.

Последний признак содержит слишком много пропущенных значений, я решила удалить всю колонку целиков, так как она неинформативна.
Анализ данных
Сперва я решила узнать, кого в выборке больше — женщин или мужчин. Для этого лучше всего подойдет круговая диаграмма.
В выборе почти одинаковое количество мужчин и женщин, теперь посмотрим кто из них в среднем больше спит. Для этого я сгруппировала данные по полу и подсчитала среднее по продолжительности сна.
График демонстрирует, что женщины в выборке в среднем спят чуть-чуть больше, чем мужчины. При этом среднее количество часов сна и у женщин, и у мужчин — менее 8 часов.
Следующим шагом я решила узнать, как продолжительность сна влияет на уровень стресса. Лучше всего для отображения зависимости подходит график рассеяния. Я добавила большой размер точек для наглядности.
На данном графике показана зависимость уровня стресса от количества сна. Мы видим, что для большинства наблюдений уровень стресса колеблется в пределах от 3 до 7, при этом с увеличением количества сна наблюдается уменьшение уровня стресса. Однако на графике также присутствуют точные скопления данных, которые могут указывать на группы людей с аналогичным уровнем стресса и продолжительностью сна.
Я предположила, что количество сна также зависит от рода деятельности. Возможно, врачи спят больше, чем остальные, поскольку знают о важности сна? Я вывела на столбчатой диаграмме топ-5 профессий из датасета, а высота столбика определяется среднем количеством сна.
Больше всего в графике представлено людей по профессии медсестра и врач, но среднее количество сна у них меньше, чем у инженера и адвоката, но выше, чем у учителя.
Затем я решила узнать, как в датасете распределяется возраст и какая средняя продолжительность сна в каждом возрасте.
Больше всего в графике представлено людей по профессии медсестра и врач, но среднее количество сна у них меньше, чем у инженера и адвоката, но выше, чем у учителя. Затем я решила узнать, как в датасете распределяется возраст и какая средняя продолжительность сна в каждом возрасте.
Большинство людей в возрасте около 40 лет имеют значительно большее количество наблюдений, в то время как уровень сна остаётся стабильным, с небольшими колебаниями по возрастным группам. Линия среднего сна показывает небольшие изменения в зависимости от возраста, что может свидетельствовать о постоянстве потребности во сне в разных возрастных группах. Наблюдается тенденция увеличения среднего количества сна с повышением возраста.
Заключение
В ходе работы был проведен анализ данных о здоровье и образе жизни, с фокусом на возрасте, уровне стресса, профессии и поле. Были использованы различные методы визуализации для понимания закономерностей и зависимости между этими параметрами. Основные выводы показали, что продолжительность сна в основном стабильна в зависимости от возраста. Созданные графики помогли наглядно представить информацию, выделяя ключевые тренды в данных. Визуализация позволила лучше понять взаимосвязи между различными факторами, что может быть полезно для разработки рекомендаций по улучшению качества жизни и здоровья.
Ссылки на использованные нейросети
Recraft.ai: https://www.recraft.ai/ Ideogram: https://ideogram.ai/