
ВВЕДЕНИЕ
Космос всегда был источником вдохновения и загадок для человечества. Его неизведанные просторы и возможности постоянно побуждают науку и технологии к новым открытиям, изменяющим наше понимание Вселенной и нашего места в ней.
В последние десятилетия исследования экзопланет стали одним из ключевых направлений астрономии. Изучение планет за пределами Солнечной системы позволяет не только глубже понять процессы формирования планетных систем, но и приблизиться к ответу на вопросы о возможности существования жизни за пределами Земли. Эти исследования вдохновляют на переосмысление нашего восприятия жизни и природы космоса.
НАЧАЛО РАБОТЫ
Для анализа я использовала данные о экзопланетах из датасета Exoplanets (Planets Outside Our Galaxy), скачанного с Kaggle. В этом датасете представлены ключевые параметры экзопланет, такие как их масса, радиус, температура, год открытия и расстояние от Земли.
Эти данные имеют исключительную научную ценность, так как позволяют углубиться в изучение миров за пределами нашей Солнечной системы. Анализируя их, можно не только понять, какие экзопланеты потенциально пригодны для жизни, но и выявить закономерности формирования планетных систем. Исследование экзопланет — это не просто астрономия, это попытка понять наше место во Вселенной.
Для визуализации я решила использовать следующие типы графиков:
Гистограмма — для анализа распределения температуры экзопланет. Точечный график (scatter plot) — чтобы показать взаимосвязь между радиусом и массой экзопланет. Столбчатая диаграмма — для распределения методов открытия экзопланет. Линейный график — для распределения экзопланет по годам открытия. Эти виды графиков позволяют наглядно представить разнообразие данных и выявить ключевые тенденции.
Для оформления проекта я вдохновлялась инфографиками NASA и научными публикациями о космосе. Главным ориентиром стало создание минималистичных, но выразительных визуализаций с космическими элементами, такими как звёздное небо на фоне.

ЛИНЕЙНЫЙ ГРАФИК
График показывает расстояние до 20 ближайших экзопланет от Земли, измеренное в световых годах. Самой близкой является Proxima Centauri b, расположенная на расстоянии чуть более 4 световых лет. Другие экзопланеты, такие как Barnard’s Star b и Tau Ceti f, находятся в пределах 5–15 световых лет.
Этот график важен для определения перспективных кандидатов для дальнейших исследований и миссий. Ближайшие экзопланеты, как Proxima Centauri b, являются основными целями для изучения обитаемости и потенциальных межзвёздных путешествий. Визуализация также подчёркивает масштабы космических расстояний, делая данные более доступными для восприятия.
СТОЛБЧАТАЯ ДИАГРАММА
График показывает распределение экзопланет по методам их открытия. Большинство экзопланет обнаружено с помощью транзитного метода, за которым следует метод радиальной скорости. Другие методы, такие как микрогравитационное линзирование, прямое изображение и астрометрия, используются значительно реже.
Использование логарифмической шкалы на вертикальной оси подчёркивает огромную разницу в частоте применения различных методов. Фон со звёздным небом усиливает «космическую» атмосферу визуализации, подчёркивая научный характер анализа.
Этот график важен для понимания того, как современные технологии и инструменты астрономии способствуют открытию новых миров. Лидирующая роль транзитного метода объясняется успехом миссий, таких как Kepler и TESS, и подчёркивает, насколько целенаправленные наблюдения могут быть эффективными для обнаружения экзопланет.
ТОЧЕЧНАЯ ДИАГРАММА
График отображает распределение экзопланет по годам открытия. Видно, что до 1995 года открытия экзопланет были редкими, но с развитием технологий количество обнаруженных миров начало стремительно расти. Начиная с 2000-х годов, наблюдается значительное увеличение числа открытий, что связано с запуском специализированных миссий, таких как Kepler и TESS.
Точки на графике показывают количество экзопланет, открытых в каждый конкретный год, а фон со звёздным небом создаёт атмосферу, подчёркивая связь графика с космической тематикой.
Этот график важен для анализа прогресса в астрономии: он демонстрирует, как быстро развиваются методы обнаружения экзопланет и какие временные периоды были наиболее продуктивными для науки. Рост числа открытий также свидетельствует о совершенствовании технологий и расширении наших возможностей изучения космоса.
ГИСТОГРАММА
График отображает распределение температур экзопланет в кельвинах. На нём видно, что большая часть экзопланет имеет температуру в диапазоне от 500 до 2000 K, что характерно для горячих газовых гигантов или близко расположенных к звёздам планет. Температуры свыше 3000 K встречаются крайне редко, так же как и планеты с температурами ниже 500 K.
Использование гистограммы позволяет наглядно увидеть частотное распределение температур в массиве данных. Добавление фона в виде звёздного неба подчёркивает «космическую» тематику и создаёт визуальную связь с тематикой исследования.
График помогает понять, как температура экзопланет варьируется в зависимости от их положения относительно звезды-хозяина и других факторов. Это важно для определения потенциальной обитаемости планет, так как температура — один из ключевых параметров, определяющих возможность существования воды в жидком состоянии.
ПРОЦЕСС РАБОТЫ
Для анализа данных о экзопланетах я использовала датасет, содержащий такие параметры, как температура, радиус, масса, метод открытия и год обнаружения. Обработка данных включала несколько этапов
Загрузка и изучение структуры данных
import pandas as pd data = pd.read_csv (’exoplanets.csv’) print (data.info ())
Очистка данных
Удаление строк с отсутствующими значениями в ключевых столбцах. Преобразование данных, таких как температура и масса, в числовой формат.
data[’Temp. (K)’] = data[’Temp. (K)’].replace (’, ’, ’’, regex=True) # Удаление запятых data[’Temp. (K)’] = pd.to_numeric (data[’Temp. (K)’], errors=’coerce’) # Преобразование в числовой формат data = data.dropna () # Удаление строк с NaN
Фильтрация и сортировка данных
Для анализа использовались только ключевые параметры. Например, для графика распределения расстояний я отбирала 20 ближайших экзопланет
distance_data = data[[’Name’, ’Distance (ly)’]].dropna () distance_data = distance_data.sort_values (by=’Distance (ly)’).head (20)
Объединение данных
В некоторых случаях я объединяла несколько параметров, чтобы создать более сложные взаимосвязи для анализа, например, зависимость массы от радиуса экзопланет.
Использованные нейросети: ChatGPT