
Братья наши меньшие
Представьте, что вы — исследователь, который хочет сравнить всех хищников Африки или понять, какие семейства животных наиболее разнообразны. Как быстро найти ответ, не листая огромные энциклопедии с каждым семейством?
Мой проект — это анализ «Animal Dataset», и он отвечает именно на этот вопрос, используя данные и визуализацию.
Для визуализации данных я планирую использовать следующие типы графиков: • Круговая диаграмма. • Тепловая карта. • Столбчатая диаграмма. • Точечный график (scatter plots).
Визуальное оформление

Для визуального оформления я использовала броскую палитру, чтобы передать те яркие эмоции, которые дарят нам животные.
Загрузка данных
Для работы я использовала такие библиотеки: - pandas для работы с данными; - matplotlib.pyplot и seaborn для построения графиков. Далее я загрузила свой датасет.
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
df = pd.read_csv ('/main/Animal%20Dataset.csv')
Круговая диаграма
Круговая диаграмма по статусу сохранения видов животных
Была построена круговая диаграмма статуса сохранения видов животных. Для этого нужно было отфильтровать таблицу по этому критерию, а также объединить редкие категории в отдельную группу.
df['Conservation Status'] = df['Conservation Status'].str.strip ()
status_counts = df['Conservation Status'].value_counts ()
threshold = 5 main_statuses = status_counts[status_counts >= threshold] other_count = status_counts[status_counts < threshold].sum ()
if other_count > 0: main_statuses = pd.concat ([main_statuses, pd.Series ({'Other': other_count})])
В итоге была сделана круговая диаграмма в виде пончика. Для оформления использовалась ранее представленная цветовая палитра. Также были созданы и изменены проценты на секциях диаграммы.
Из данных диаграммы можно понять, что 33% животных из датасета относятся к категории «least concern» — наименьшее беспокойство. Что не может не радовать.
Тепловая карта
Тепловая карта статуса сохранения относительно среды обитания
Далее быта сделана тепловая карта, чтобы соотнести статусы выживаемости и среды обитания животных. После фильтрации топа сред обитания, я начала построение диаграммы.
Также для более легкого восприятия тепловой карты я сделала бар, который изменение цвета клеток от количества видов, проживающих в среде.
Из данных диаграммы можно понять, что большинство видов животных, которые проживают в лесах и лугах относятся к категории, о которой стоит наименьше всего беспокоиться.
Внимание же стоит обратить на виды, которые живут в тропических лесах, потому что большинство из них считается под угрозой и даже критической.
Столбчатая диаграмма
Столбчатая диаграмма наибольшее количество семейств животных
Чтобы построить столбчатую диаграмму, я снова сделала фильтр топа семейств животных и сделала вертикальный барчат.
Также для более понятного визуального соотношения были созданы пунктирные полоски, чтобы было легче понять разницу между столбцами.
Из данных диаграммы можно понять, что самое популярное семейство среди животных — это собачьи. Остальные семейства имеют примерно одинаковое количество.
Точечный график
Точечный график соотношения скорости и веса среди собачьих
Последний код строит точечный график, который соотносится вес со скоростью среди пресдтавителей семейства собачьих.
Для того, чтобы можно было обратиться к конкретного вида из семейства также была сделана легенда, где указано каждое именование.
Из данных диаграммы можно понять, есть значительный разброс характеристик внутри одного семейства. Данные не образуют четкую линию, что указывает на влияние факторов — особенностей охоты, типа добычи, строения тела и адаптации к конкретной среде обитания.
Заключение
Благодаря анализу данного датасета и визуализации результатов исследования через различные графики и диаграммы, получилось решить проблему систематизации знаний о разнообразии животного мира и взаимосвязях их характеристик.
Теперь, благодаря проведённому анализу, можно не только наглядно увидеть ключевые закономерности в животном мире, но и использовать эти данные для более глубокой оценки рисков для видов и понимания их адаптаций.
Для генерации обложки я использовала нейросеть Jay Flow.