Original size 1240x1750

Визуализация данных о кошках

The project is taking part in the competition
big
Original size 2996x810

ПОЧЕМУ ИМЕННО ЭТИ ДАННЫЕ?

Кошки — понятная и близкая тема. Почти у каждого есть домашний питомец или знакомые с кошками, поэтому сразу возникает интерес: какая порода самая популярная, какие кошки живут дольше, какие обычно тяжелее, а какие окрасы встречаются чаще. Хотелось не просто посмотреть цифры, а наглядно показать эти различия.

ВЫБОР ДАННЫХ

Типы графиков

В проекте используются столбчатые диаграммы, тепловая карта, круговая диаграмма и treemap. Каждый тип выбран под конкретную задачу: сравнение средних значений, анализ долей, выявление взаимосвязей и демонстрация структуры распределений.

Для проекта был использован датасет, содержащий информацию о кошках: порода, возраст, вес, пол, окрас и другие характеристики. Данные были выбраны как удобный пример для анализа биологических и демографических признаков в рамках одной популяции, где можно проследить связи между параметрами.

ВИЗУАЛИЗАЦИЯ ДАННЫХ

big
Original size 2750x572

Для всех графиков выбран единый визуальный стиль: тёплая оранжево-бежевая палитра, закруглённые формы и минималистичное оформление без лишних сеток и рамок. Также использовался декоративный элемент (иконка лапки) для поддержания характера темы и ее дружелюбности.

Original size 1714x774

Цветовая палитра

Original size 2864x491

Также сначала датасет был очищен от пустых значений, чтобы графики были корректными. Далее данные группировались по породам, полу и окрасу, высчитывались средние значения и количество кошек.

Original size 989x962

Интереснее всего было узнать, какие породы самые популярные, исходя из количества их в датасете. Круговая диаграмма демонстрирует долю самых распространённых пород и объединяет все остальные в категорию «Other», что позволяет не перегружать визуализацию.

Original size 950x678

Данный тип графика был выбран для визуализации самых частых окрасов котов, так как он хорошо подходит для отображения иерархий и относительных размеров категорий, позволяя быстро оценить, какие данные встречаются чаще всего.

Original size 1189x790

Горизонтальная диаграмма отображает долю самцов и самок в десяти самых популярных породах. Формат выбран для удобного сравнения пропорций внутри каждой породы, а не абсолютных значений. Это подчёркивает баланс полов и их возможные перекосы.

Original size 1189x790

Было интересно узнать какие породы дольше всех живут, что могло бы помочь будущим хозяевам при выборе пушистого друга-долгожителя.

Была выбрана столбчатая диаграмма, которая показывает породы кошек, средний возраст которых выше среднего по датасету. Такой отбор позволяет сфокусироваться не на всех породах сразу, а только на тех, которые выделяются по продолжительности жизни. График помогает визуально сравнить средние значения и быстро определить лидеров.

Original size 1111x790

Тепловая карта показывает, в каких диапазонах возраста и веса наблюдается наибольшее количество кошек. Этот формат позволяет увидеть концентрации данных и выявить типичные сочетания параметров, которые сложно заметить в таблице, а также является фактором здоровья питомцев и выявляет связан ли набор веса у кошек с возрастом.

Original size 1189x790

Столбчатая диаграмма отражает средний вес топ-10 пород. Она используется для сравнения физических характеристик разных пород и подчёркивает разницу между более лёгкими и более тяжёлыми кошками. Таким образом, можно понять индивидуальные особенности пород и какова их норма веса.

ИТОГИ

post

Датасет позволил узнать, как распределяются основные характеристики кошек: возраст, вес и пол, и какие значения можно считать типичными для большинства кошек.

Анализ также показал различия между породами — по среднему весу и продолжительности жизни и популярности отдельных пород. Визуализация помогла быстро сравнить данные и превратить набор чисел в понятную картину, которая даёт общее представление о структуре и особенностях выборки.

ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

Для работы над визуализацией данных в этом проекте использовался ChatGPT (https://chatgpt.com) в качестве помощника для исправления ошибок в коде и решения некоторых стилистических задач.

Original size 2207x440
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more