
Описание
В поиске подходящего мне датасета на сайте kaggle.com, меня заинтересовали данные о тренировках посетителей спортзала, я сама регулярно туда хожу, поэтому подумала, что интересно было бы изучить их статистику.
Типы диаграмм, которые я использовала:
(01) Круговая диаграмма (02) Гистограмма (03) Точечный график (04) Линейный график (05) Тепловая карта
Выбор пал на диаграммы, наиболее наглядно визуализирующие разницу между данными, чтобы все было очевидно с первого взгляда!
(00) Этапы работы
Для создания цветовой палитры диаграмм были использованы цвета, которые чаще всего преобладают в спортзалах, а так же у многих людей ассоциируются с ним.

В качестве шрифтового решения я выбрал одну из самых известных гарнитур — Verdana.

(01) Соотношение мужчин и женщин, посещающих спортзал

(01) Круговая диаграмма
Рассмотрим соотношение мужчин и женщин, посещающих спортзал. Для этого построим круговую диаграмму. Сохраним данные, настроим шрифты, цвета. Далее построим круговую диаграмму с помощью plt.pie, укажем параметры, цвет, а также контрастную линию (wedgeprops)
(02) Распределения мужчин и женщин по разным типам нагрузки
(02) Гистограмма
Для анализа распределения мужчин и женщин по разным типам нагрузки построим гистограмму. Сохраним данные по каждому типу нагрузки по полу, также определим цвет для каждого пола. Отдельно пропишем шрифты. Указываем в plot тип bar и stacked=True (чтобы и то, и другое было в одном столбце).
(03) Распределение веса от роста по полу
(03) Точечный график
На точечной диаграмме продемонстрируем распределение веса от роста по полу. Шрифты и цветовую палитру оставим те же. Используем plt.scatter для построения точечного графика. Для этого сохраним данные по каждому полу и используем их для графика.
(04) Зависимость потери калорий от длительности тренировки у мужчин и женщин
(04) Линейный график
Построим 2 линейных графика и линии тренда для мужчин и женщин зависимости потери калорий от длительности тренировки. Понадобится стандартная функция plot, в качестве x и y укажем часы и калории. Для тренда используем np.polyfit и np.poly1d
(05) Процентное содержания жира и количество сожжённых калорий
(05) Тепловая карта
Тепловая карта построена на данных процентного содержания жира и количестве сожжённых калорий. Шрифты и цвета те же. Для настройки своей цветовой гаммы используем дополнительный метод ListedColormap.
Заключение
Мы узнали, что доля мужчин (53%) немного превышает долю женщин (47%). Это говорит о том, что спортзал пользуется популярностью среди обеих групп, с небольшим перевесом в сторону мужской аудитории.
Мы увидели, что мужчины и женщины активно участвуют в силовых тренировках и кардио, при этом йога и HIIT-тренировки популярны среди обеих групп, но с небольшим перевесом в пользу женщин.
Точечный график показал распределение веса относительно роста среди посетителей спортзала. Видно, что мужчины (синие точки) в среднем выше и тяжелее, чем женщины (красные точки). Также можно заметить, что у мужчин более широкий диапазон значений веса, в то время как у женщин показатели веса более сконцентрированы в нижнем диапазоне.
Кроме того, мы увидели зависимость количества сожженных калорий от продолжительности тренировки. Видно, что чем дольше длится тренировка, тем больше калорий сжигают посетители.
А на тепловой карте мы увидели зависимость между процентом жира и количеством сожженных калорий. Видно, что при увеличении количества сожженных калорий процент жира у посетителей спортзала снижается.
Описание применения генеративной модели
Midjourney — генерация обложки Adobe Color — генерация цветовой палитры и ее редактирование на основе загруженного изображения