Original size 799x1125

UFO sight / анализ данных

PROTECT STATUS: not protected
The project is taking part in the competition

описание проекта

Для анализа был выбран датасет UFO Sights 2016 US and Canada с data.world. Он содержит информацию о частоте наблюдений, их местоположении и времени, короткие заметки о том, что люди видели.

Эта тема показалась мне интересной, так как позволяет с помощью анализа данных и визуализации исследовать, как люди описывают необычные наблюдения, выявляя повторяющиеся паттерны в субъективных и неструктурированных данных.

виды графов

[1] — Scatter plot [2] — Line plot [3] — Pie chart [4,5] — Bar chart [6] — Word cloud

этапы работы

Для визуализации данных я намерено выбрала темный фон с яркими элементами, что отсылает нас к эстетике sci-fi, с которой могут ассоциироваться наблюдения за нло.

big
Original size 2400x1000

В начале работы я импортировала все необходимые библиотеки, которые понадобятся для анализа и визуализации данных.

После я задала единый визуальный стиль для всех графиков — задала цветовую палитру, загрузила и подключила шрифт, а также добавила ко всем графикам шум и небольшое свечение.

0

[1]

Сначала я решила посмотреть, как территориально распределяются сообщения об НЛО. Для этого я построила Scatter plot, оси которого отражают долготу и широту.

Original size 2400x797
Original size 2400x1000

На карте отчётливо видны скопления сообщений вокруг густонаселённых регионов США и Канады. Это отражает смещение выборки: сообщения — не объективная частота явлений, а активность пользователей в доступных местах.

[2]

Затем, сгруппировав сообщения по месяцу, в который они были зафиксированы, я построила LIne PLot, чтобы наглядно изобразить, в какие месяцы люди чаще всего замечали что-то странное в небе.

Original size 2400x756
Original size 2400x1000

На графике видно, что в 2016 году количество наблюдений достигло своего пика в тёплое время года. Это может отражать сезонность — люди чаще наблюдают объекты под открытым небом в тёплые месяцы.

[3]

Чтобы наглядно сравнить, когда чаще всего фиксировались НЛО — днем или ночью, — был построен Pie chart.

Original size 2400x1371
Original size 2400x1000

Ночные наблюдения доминируют в отчетах, что соответствует ожиданиям наблюдений в темное время суток.

[4]

Далее я посчитала, сколько раз люди видели объекты разных форм и построила Bar chart.

Original size 2400x756
Original size 2400x1000

Значительное количество наблюдателей описывают НЛО как вспышку света. Подобное распределение может быть связано как с ограниченными условиями наблюдения, так и с субъективным восприятием быстро движущихся или удалённых объектов.

[5]

Чтобы посмотреть, о чем чаще всего говорят (форме, движении или свете) описывая НЛО, я сначала сгруппировала слова, похожие по смыслам в группы (также форма, движение и свет), а затем посчитала, как часто люди используют слова той или иной группы. Для визуализации этих данных я также использовала Bar chart.

0
Original size 2400x1000

Наиболее популярные описания относятся к категории «свет», что можно связать с преобладающим количеством ночных наблюдений.

[6]

Ну и последним я решила построить Word cloud самых частых слов из сообщений. Для этого я выделила основные смысловые слова, и исключила из анализа различные местоимения, предлоги и междометия, благодаря чему будет получена более «чистая» семантика.

Затем я импортировала Word cloud и уже построила сам график.

0
Original size 2400x1412
Original size 2400x1000

Облако слов выявило ключевые термины, такие как «moving», «light», «round», «hovering», отражающие визуальные и динамические характеристики наблюдений. Описывая НЛО, наблюдатели чаще всего обращают внимание на то, как он двигается на его внешний вид.

использование нейросетей

ChatGPT— исправление ошибок в кодах, анализ графиков

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more