Original size 1240x1750

Анализ данных о звёздах

PROTECT STATUS: not protected

В данном исследовании используется набор данных, представленный в табличной форме в открытом доступе на сайте «Gigasheet», и содержащий информацию о звездах. Таблица включает числовые параметры: светимость, радиус, звездная величина и тип, а также категориальные признаки: цвет и класс.

Original size 736x292

Я выбрала данные о звездах для анализа, потому что меня всегда интересовала астрономия, и этот набор данных позволяет практиковаться в анализе без нужды в глубоких астрономических знаниях. Цель — проверить на практике различные методы анализа данных на доступном и понятном примере.

Выбор данных для каждого типа графика обусловлен целесообразностью их визуализации с помощью именно этого типа графика. Например, распределение по классам лучше всего иллюстрируется столбчатой или круговой диаграммой, а взаимосвязь между двумя числовыми параметрами — точечной диаграммой.

Этапы

В первую очередь для написания кода были загружены библиотеки для работы с графиками и шрифтами, файл с таблицей и кастомный шрифт. Также для всех графиков была подобрана цветовая палитра с помощью Adobe Colour, напоминающая звёздное небо. Также с промптом «звёздное небо» была сгенерирована обложка проекта в нейросети Playground.

Original size 1130x291
Original size 1696x521

Палитра, созданная с помощью Adobe Color

Затем необходимо было обработать данные, убрав из них пустые ячейки, некорректные значения и изменить формат данных в подходящия для анализа, например перевести строки в числа и так далее.

Original size 1284x170

Далее необходимо было перейти к построению графиков. На дланном этапе использовался чат GPT для решения возникающих проблем, нахождения ошибок в коде и подборе оптимальных методов построения. Например, поиск способов убрать сетку графика, белую обводку столбцов, создать легенду графика и переместить её в необходимое место. Далее этот же шаблон применялся при построении каждого графика.

Original size 1298x255
Original size 1343x443

В конце осталось лишь разместить код более удачно в рамках картинки и сохранить её в хорошем разрешении.

Original size 1212x257

Графики

Original size 1080x731

Частота встречаемости разных классов звёзд

Этот график показывсает, что чаще всего встречаются звёзды класса М — самого низкого из всех, а затем классы В и О — которые напротив занимают первое и второе место в классификации.

При этом следующий график демонстрирует, что звёзды класса M являются самыми маленькими, тогда как А имеют самый большой средний радиус.

Original size 907x726

Соотношение среднего радиуса звёзд и их класса

Original size 965x737

Зависимость цвета звёзд от температуры

Это т график показывает, как температура звёзд напрямую влияет на их цвет.

Original size 951x804

Как изменяется количество звезд в зависимости от свечения

И последней зависимостью, которую я исследую, является уровень светимости звёзд. Для этого я разделила все данные о светимости на пять равных интервалов и подсчитала количество звёзд в каждом.

Ссылки

Анализ данных о звёздах
Project created at 30.12.2024
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more