Original size 1140x1516

Анализ классификаций животных

PROTECT STATUS: not protected
The project is taking part in the competition

Братья наши меньшие

Представьте, что вы — исследователь, который хочет сравнить всех хищников Африки или понять, какие семейства животных наиболее разнообразны. Как быстро найти ответ, не листая огромные энциклопедии с каждым семейством?

Мой проект — это анализ «Animal Dataset», и он отвечает именно на этот вопрос, используя данные и визуализацию.

Для визуализации данных я планирую использовать следующие типы графиков: • Круговая диаграмма. • Тепловая карта. • Столбчатая диаграмма. • Точечный график (scatter plots).

Визуальное оформление

big
Original size 3017x1319

Для визуального оформления я использовала броскую палитру, чтобы передать те яркие эмоции, которые дарят нам животные.

Загрузка данных

Для работы я использовала такие библиотеки: - pandas для работы с данными; - matplotlib.pyplot и seaborn для построения графиков. Далее я загрузила свой датасет.

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns

df = pd.read_csv ('/main/Animal%20Dataset.csv')

Круговая диаграма

Original size 1021x790

Круговая диаграмма по статусу сохранения видов животных

Была построена круговая диаграмма статуса сохранения видов животных. Для этого нужно было отфильтровать таблицу по этому критерию, а также объединить редкие категории в отдельную группу.

df['Conservation Status'] = df['Conservation Status'].str.strip ()

status_counts = df['Conservation Status'].value_counts ()

threshold = 5 main_statuses = status_counts[status_counts >= threshold] other_count = status_counts[status_counts < threshold].sum ()

if other_count > 0: main_statuses = pd.concat ([main_statuses, pd.Series ({'Other': other_count})])

В итоге была сделана круговая диаграмма в виде пончика. Для оформления использовалась ранее представленная цветовая палитра. Также были созданы и изменены проценты на секциях диаграммы.

Original size 1458x908

Из данных диаграммы можно понять, что 33% животных из датасета относятся к категории «least concern» — наименьшее беспокойство. Что не может не радовать.

Тепловая карта

Original size 870x790

Тепловая карта статуса сохранения относительно среды обитания

Далее быта сделана тепловая карта, чтобы соотнести статусы выживаемости и среды обитания животных. После фильтрации топа сред обитания, я начала построение диаграммы.

Original size 1442x648

Также для более легкого восприятия тепловой карты я сделала бар, который изменение цвета клеток от количества видов, проживающих в среде.

Original size 1542x946

Из данных диаграммы можно понять, что большинство видов животных, которые проживают в лесах и лугах относятся к категории, о которой стоит наименьше всего беспокоиться.

Внимание же стоит обратить на виды, которые живут в тропических лесах, потому что большинство из них считается под угрозой и даже критической.

Столбчатая диаграмма

Original size 989x589

Столбчатая диаграмма наибольшее количество семейств животных

Чтобы построить столбчатую диаграмму, я снова сделала фильтр топа семейств животных и сделала вертикальный барчат.

Original size 2048x908

Также для более понятного визуального соотношения были созданы пунктирные полоски, чтобы было легче понять разницу между столбцами.

Original size 1610x536

Из данных диаграммы можно понять, что самое популярное семейство среди животных — это собачьи. Остальные семейства имеют примерно одинаковое количество.

Точечный график

Original size 785x590

Точечный график соотношения скорости и веса среди собачьих

Последний код строит точечный график, который соотносится вес со скоростью среди пресдтавителей семейства собачьих.

Original size 1508x798

Для того, чтобы можно было обратиться к конкретного вида из семейства также была сделана легенда, где указано каждое именование.

Original size 1358x946

Из данных диаграммы можно понять, есть значительный разброс характеристик внутри одного семейства. Данные не образуют четкую линию, что указывает на влияние факторов — особенностей охоты, типа добычи, строения тела и адаптации к конкретной среде обитания.

Заключение

Благодаря анализу данного датасета и визуализации результатов исследования через различные графики и диаграммы, получилось решить проблему систематизации знаний о разнообразии животного мира и взаимосвязях их характеристик.

Теперь, благодаря проведённому анализу, можно не только наглядно увидеть ключевые закономерности в животном мире, но и использовать эти данные для более глубокой оценки рисков для видов и понимания их адаптаций.

Для генерации обложки я использовала нейросеть Jay Flow.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more