Original size 780x1170

Сон в мире животных: анализ и визуализации

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

post

Сон — это важнейший биологический процесс, необходимый для здоровья и производительности всех живых существ, включая животных. Подобно тому, как у разных людей могут быть различные режимы сна, у животных тоже существуют разные характеристики сна.

Датасет (с платформы Kaggle), который был выбран для проекта, позволяет изучить модели сна у животных и факторы, влияющие на его качество, и помогает лучше понять, как внешние условия (например, окружающая среда сна или образ жизни) влияют на отдых. Анализируя эти данные, мы можем провести параллели между человеческим и животным сном и выявить интересные наблюдения.

post

Палитра представляет собой гармоничное сочетание натуральных и теплых оттенков, вдохновленных природой и землей. Она включает глубокие и насыщенные цвета, такие как зеленый и коричневый, которые ассоциируются с жизнью, стабильностью и уютом. Такая палитра создает ощущение спокойствия, уверенности и связи с природой, что делает ее идеальной для тем, связанных с отдыхом, сном и гармонией.

Для графиков выбран шрифт Comic Sans MS, потому что он обладает игривым и непринужденным стилем, который создает дружелюбную атмосферу. Он хорошо читается и придает графикам легкость и доступность, что идеально для визуализаций, направленных на простое восприятие данных.

big
Original size 1280x419

Палитра: темно-зеленый #114F28, ярко-зеленый #36AB41, золотисто-коричневый #C6993D, темно-коричневый #2E231B, пыльно-розовый #C09E91

погружаемся в сон… 85%… 95%… 100%

ФАЗА 1. Импорт библиотек

big
Original size 1010x220
post

pandas — для работы с табличными данными (DataFrame)

matplotlib.pyplot — для создания графиков и визуализаций

font_manager — для установки шрифта

ФАЗА 2. Загрузка и анализ данных

2.1 Данные

post

Краткая справка о столбцах:

name — название вида животного genus — род животного vore — тип питания (плотоядный, травоядный и др.) order — порядок животных (млекопитающие, птицы и др.) conservation — статус охраны (уязвимый вид, не угрожаем) sleep_total — общее время сна в часах в день sleep_rem — время REM-сна в часах sleep_cycle — продолжительность одного цикла сна awake — время бодрствования brainwt — масса мозга (в кг) bodywt — масса тела (в кг)

Всего в датасете 83 наблюдения и 11 признаков.

2.2 Типы данных

post

Из вывода df.dtypes видно, что:

Столбцы name, genus, vore, order, conservation содержат текстовые данные (тип object), что означает, что это категориальные переменные, такие как название вида, род, тип питания и другие классификации.

Столбцы sleep_total, sleep_rem, sleep_cycle, awake, brainwt, bodywt имеют тип float64, что означает, что это числовые переменные с плавающей точкой, представляющие данные о сне и физическом состоянии животных.

2.3 Пропуски

post

Пропуски в данных могут быть случайными или значимыми, и важно понимать их природу.

Например: Пропуски в столбцах типа sleep_rem могут означать, что для некоторых видов не удалось измерить или зафиксировать этот параметр. Пропуски в brainwt и bodywt могут быть критичными, так как они важны для анализа связи между массой тела и сном.

2.4 Новый признак

Original size 983x302
post

Мы используем метод apply (), чтобы применить логику перекодировки к каждому значению в столбце vore.

Если значение в vore — «carni» или «insecti», то для этого животного мы назначаем 1 (опасен).

Для остальных типов питания (например, «omni», «herbi») присваиваем 0 (не опасен).

ФАЗА 3. Построение графиков

3.1 Чем питаются животные?

Original size 640x505

График 1. Круговая диаграмма

post

Эта круговая диаграмма показывает распределение типов питания среди животных в датасете. Видно, что большинство животных являются травоядными (herbi — 42,1%), что составляет большую часть выборки. Примерно четверть животных питаются плотью (carni — 25%), а 26,3% — всеядные (omni). Небольшая доля (6.6%) составляют насекомоядные (insecti).

Таким образом, наибольшее количество животных в исследуемой выборке — травоядные, что может отражать особенности экосистемы или данные, доступные для исследования.

3.2 Как сон зависит от массы тела?

Original size 701x553

График 2. Диаграмма рассеяния

post

На графике рассеяния показана зависимость общего времени сна от массы тела у животных в пределах от 0 до 1000 кг. Мы видим, что для большинства животных с меньшей массой тела время сна варьируется от 5 до 10 часов, и наблюдается большое количество таких значений. Однако по мере увеличения массы тела количество животных с более длительным временем сна становится меньше. Также видно, что для крупных животных (с массой тела больше 200 кг) время сна в целом стабильно и не превышает 20 часов.

Это может свидетельствовать о том, что для большинства мелких животных время сна более разнообразно, в то время как крупные животные имеют фиксированное количество сна, вне зависимости от массы.

3.3 Какой порядок у животных?

Original size 845x622

График 3. Столбчатая диаграмма

post

На столбчатой диаграмме показано распределение животных по порядкам. Видно, что большинство животных принадлежат порядку Rodentia (грызуны), за ним следуют Carnivora (плотоядные) и Primates (млекопитающие). Другие порядки представлены значительно меньшим количеством видов.

Столбчатая диаграмма отлично подходит для визуализации категориальных данных, таких как распределение животных по порядкам. Она позволяет легко сравнивать количество видов в разных категориях и четко показывает, какие категории имеют большее или меньшее количество представителей.

3.4 Сколько в среднем спят опасные и неопасные животные?

Original size 624x449

График 4. Ящик-с-усами

post

На ящичной диаграмме показано распределение времени сна в зависимости от опасности для человека. Среднее время сна для опасных животных (11.33 часа) немного выше, чем для неопасных животных (10.07 часа). Это может свидетельствовать о том, что животные, представляющие потенциальную опасность для человека, могут иметь различные адаптивные потребности в отдыхе, в том числе для восстановления энергии.

Ящичная диаграмма идеально подходит для сравнения распределений данных между двумя группами (в данном случае, опасными и неопасными животными). Она позволяет наглядно увидеть медиану, квартили, а также разброс данных, что помогает выявить различия в продолжительности сна между группами.

ФАЗА 4. Выводы по работе

post

В ходе работы использовались различные методы анализа данных и визуализации.

Кроме того, вычислять статистические значения (среднее время сна по группам опасности).

Эти методы помогли выявить ключевые зависимости и наглядно представить данные для дальнейшего анализа.

Исследование показало, что опасность для человека может влиять на продолжительность сна. Например, опасные для человека животные спят немного больше, чем неопасные. Также выявлено, что для мелких животных время сна варьируется, в то время как крупные животные имеют более стабильное время сна.

Большинство животных спят от 5 до 10 часов в день, с некоторыми исключениями для крупных видов, однако мы должны учитывать, что в данных было представлено мало крупных видов, поэтому выводы касательно них могут быть неточны.

Original size 1336x672

Все изображения, в том числе и обложка, размещены в открытом доступе в Яндекс.Картинки.

Для генерации видео был использован RunwayML. Промпт: «Realistic subtle animation: two lions sleeping on a large tree branch. Gentle breathing, minimal ear movement. The branch slowly sways in a light breeze, leaves softly moving. Calm, peaceful mood. Static camera, no scene changes, photorealistic».

При написании промпта был использован ChatGPT.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more