
Описание проекта

Сон — это важнейший биологический процесс, необходимый для здоровья и производительности всех живых существ, включая животных. Подобно тому, как у разных людей могут быть различные режимы сна, у животных тоже существуют разные характеристики сна.
Датасет (с платформы Kaggle), который был выбран для проекта, позволяет изучить модели сна у животных и факторы, влияющие на его качество, и помогает лучше понять, как внешние условия (например, окружающая среда сна или образ жизни) влияют на отдых. Анализируя эти данные, мы можем провести параллели между человеческим и животным сном и выявить интересные наблюдения.

Палитра представляет собой гармоничное сочетание натуральных и теплых оттенков, вдохновленных природой и землей. Она включает глубокие и насыщенные цвета, такие как зеленый и коричневый, которые ассоциируются с жизнью, стабильностью и уютом. Такая палитра создает ощущение спокойствия, уверенности и связи с природой, что делает ее идеальной для тем, связанных с отдыхом, сном и гармонией.
Для графиков выбран шрифт Comic Sans MS, потому что он обладает игривым и непринужденным стилем, который создает дружелюбную атмосферу. Он хорошо читается и придает графикам легкость и доступность, что идеально для визуализаций, направленных на простое восприятие данных.

Палитра: темно-зеленый #114F28, ярко-зеленый #36AB41, золотисто-коричневый #C6993D, темно-коричневый #2E231B, пыльно-розовый #C09E91
погружаемся в сон… 85%… 95%… 100%
ФАЗА 1. Импорт библиотек


pandas — для работы с табличными данными (DataFrame)
matplotlib.pyplot — для создания графиков и визуализаций
font_manager — для установки шрифта
ФАЗА 2. Загрузка и анализ данных
2.1 Данные

Краткая справка о столбцах:
name — название вида животного genus — род животного vore — тип питания (плотоядный, травоядный и др.) order — порядок животных (млекопитающие, птицы и др.) conservation — статус охраны (уязвимый вид, не угрожаем) sleep_total — общее время сна в часах в день sleep_rem — время REM-сна в часах sleep_cycle — продолжительность одного цикла сна awake — время бодрствования brainwt — масса мозга (в кг) bodywt — масса тела (в кг)
Всего в датасете 83 наблюдения и 11 признаков.
2.2 Типы данных

Из вывода df.dtypes видно, что:
Столбцы name, genus, vore, order, conservation содержат текстовые данные (тип object), что означает, что это категориальные переменные, такие как название вида, род, тип питания и другие классификации.
Столбцы sleep_total, sleep_rem, sleep_cycle, awake, brainwt, bodywt имеют тип float64, что означает, что это числовые переменные с плавающей точкой, представляющие данные о сне и физическом состоянии животных.
2.3 Пропуски

Пропуски в данных могут быть случайными или значимыми, и важно понимать их природу.
Например: Пропуски в столбцах типа sleep_rem могут означать, что для некоторых видов не удалось измерить или зафиксировать этот параметр. Пропуски в brainwt и bodywt могут быть критичными, так как они важны для анализа связи между массой тела и сном.
2.4 Новый признак

Мы используем метод apply (), чтобы применить логику перекодировки к каждому значению в столбце vore.
Если значение в vore — «carni» или «insecti», то для этого животного мы назначаем 1 (опасен).
Для остальных типов питания (например, «omni», «herbi») присваиваем 0 (не опасен).
ФАЗА 3. Построение графиков
3.1 Чем питаются животные?
График 1. Круговая диаграмма

Эта круговая диаграмма показывает распределение типов питания среди животных в датасете. Видно, что большинство животных являются травоядными (herbi — 42,1%), что составляет большую часть выборки. Примерно четверть животных питаются плотью (carni — 25%), а 26,3% — всеядные (omni). Небольшая доля (6.6%) составляют насекомоядные (insecti).
Таким образом, наибольшее количество животных в исследуемой выборке — травоядные, что может отражать особенности экосистемы или данные, доступные для исследования.
3.2 Как сон зависит от массы тела?
График 2. Диаграмма рассеяния

На графике рассеяния показана зависимость общего времени сна от массы тела у животных в пределах от 0 до 1000 кг. Мы видим, что для большинства животных с меньшей массой тела время сна варьируется от 5 до 10 часов, и наблюдается большое количество таких значений. Однако по мере увеличения массы тела количество животных с более длительным временем сна становится меньше. Также видно, что для крупных животных (с массой тела больше 200 кг) время сна в целом стабильно и не превышает 20 часов.
Это может свидетельствовать о том, что для большинства мелких животных время сна более разнообразно, в то время как крупные животные имеют фиксированное количество сна, вне зависимости от массы.
3.3 Какой порядок у животных?
График 3. Столбчатая диаграмма

На столбчатой диаграмме показано распределение животных по порядкам. Видно, что большинство животных принадлежат порядку Rodentia (грызуны), за ним следуют Carnivora (плотоядные) и Primates (млекопитающие). Другие порядки представлены значительно меньшим количеством видов.
Столбчатая диаграмма отлично подходит для визуализации категориальных данных, таких как распределение животных по порядкам. Она позволяет легко сравнивать количество видов в разных категориях и четко показывает, какие категории имеют большее или меньшее количество представителей.
3.4 Сколько в среднем спят опасные и неопасные животные?
График 4. Ящик-с-усами

На ящичной диаграмме показано распределение времени сна в зависимости от опасности для человека. Среднее время сна для опасных животных (11.33 часа) немного выше, чем для неопасных животных (10.07 часа). Это может свидетельствовать о том, что животные, представляющие потенциальную опасность для человека, могут иметь различные адаптивные потребности в отдыхе, в том числе для восстановления энергии.
Ящичная диаграмма идеально подходит для сравнения распределений данных между двумя группами (в данном случае, опасными и неопасными животными). Она позволяет наглядно увидеть медиану, квартили, а также разброс данных, что помогает выявить различия в продолжительности сна между группами.
ФАЗА 4. Выводы по работе

В ходе работы использовались различные методы анализа данных и визуализации.
Кроме того, вычислять статистические значения (среднее время сна по группам опасности).
Эти методы помогли выявить ключевые зависимости и наглядно представить данные для дальнейшего анализа.
Исследование показало, что опасность для человека может влиять на продолжительность сна. Например, опасные для человека животные спят немного больше, чем неопасные. Также выявлено, что для мелких животных время сна варьируется, в то время как крупные животные имеют более стабильное время сна.
Большинство животных спят от 5 до 10 часов в день, с некоторыми исключениями для крупных видов, однако мы должны учитывать, что в данных было представлено мало крупных видов, поэтому выводы касательно них могут быть неточны.
Все изображения, в том числе и обложка, размещены в открытом доступе в Яндекс.Картинки.
Для генерации видео был использован RunwayML. Промпт: «Realistic subtle animation: two lions sleeping on a large tree branch. Gentle breathing, minimal ear movement. The branch slowly sways in a light breeze, leaves softly moving. Calm, peaceful mood. Static camera, no scene changes, photorealistic».
При написании промпта был использован ChatGPT.