
Введение
В своей работе я провела исследование и анализ популярных туристических направлений по странам и континентам, изучила виды достопримечательностей, их стоимость, посещаемость и сезонность. Я выбрала именно эту тему поскольку люблю путешествовать и считаю, что такие данные и их визуализация могут помочь путешественникам и туристическим фирмам, чтобы полностью разобраться в плане и бюджете путешествия.
Почему эта информация полезна?
1. Туристические компании и путешественники могут использовать данные для планирования поездок.
2. Анализ показывает, какие страны и виды достопримечательностей наиболее популярны.
3. Помогает визуально увидеть взаимосвязь между стоимостью, посещаемостью и временем года.
Обработка данных
Для анализа я использовала данные с платформы Kaggle в формате таблицы CSV. Я пользовалась сервисом Google Colab, где сначала установила библиотеки: Pandas, Matplotlib, Seaborn. Я занесла файл с таблицой в код, проанализировала первые пять строк таблицы, чтобы определиться с контекстом моих графиков и отсортировала данные. Анализ был сделан на языке Python по данным характеристикам: Destination Name, Country, Continent, Type, Avg Cost (USD/day), Best Season, Avg Rating, Annual Visitors (M), UNESCO Site.
Стилистика графиков
Цветовая гамма: #ffe1d7 — светло-розовый / персиковый оттенок, #84affb — светло-голубой, #0259dd — насыщенный синий, #ff6648 — яркий оранжево-красный.
Решила использовать данные цвета, чтобы передать яркость путешествий и новых горизонтов, но при этом сохранить спокойствие в своей визуализации, чтобы графики были понятными и не кричащими.
Размеры графиков и шрифты: plt.rcParams['figure.figsize'] = (12,6), plt.rcParams['font.size'] = 12.
Все графики подписаны на английском языке, чтобы зритель сразу понимал смысл анализа.

Цветовая гамма
Мною были выбраны следующие типы графиков:
Barplot — показывает топ стран с наибольшим количеством направлений.
Pie chart — демонстрирует доли категорий достопримечательностей.
Bubble chart — визуализирует зависимость между стоимостью и посещаемостью, размер точек отражает популярность.
Boxplot — показывает распределение посещаемости по сезонам, выявляет средние значения и выбросы.
Stacked bar — отображает количество достопримечательностей по типам для каждого континента, чтобы сравнить регионы.
Данные типы графиков были выбраны не просто так, я посчитала их самыми простыми для понимания и визуально привлекательными для зрителя.
Используемые статистические методы
Каждый график сопровождается подписями и ясно показывает итоговые выводы анализа. Все графики объединены единым стилем, что упрощает анализ и делает визуализацию эстетически приятной.
В своем анализе использовала: value_counts () — частотный анализ (Barplot, Pie chart).
groupby ().size () — подсчёт количества элементов в группах (Stacked bar).
График 1
1. Barplot (Топ 10 стран по количеству туристических направлений)
Этот график показывает, какие страны имеют наибольшее количество популярных туристических мест. Каждый столбец соответствует стране, высота отражает число достопримечательностей. Можно быстро увидеть лидеров по туризму и страны с разнообразными направлениями, например, Германия, Греция и Тайланд. График помогает сравнивать страны между собой и выявлять основные точки притяжения туристов.
График 2
2. Pie chart (Доли категорий достопримечательностей)
Диаграмма распределяет туристические направления по типам: исторические объекты, музеи, природные достопримечательности, религиозные локации, необычные достопримечательности, пляжный отдых. Размер сектора показывает долю категории, несколько оттенков выбранной палитры различают типы. График помогает формировать выводы о предпочтениях туристов.
График 3
3. Bubble chart (Популярность vs стоимость)
Показывает связь между средней стоимостью и посещаемостью. По оси X — стоимость, по оси Y — количество туристов, а размер точек обозначает популярность. Цвета отражают тип достопримечательности. График помогает выявить тренды: дорогие направления с высокой посещаемостью или бюджетные объекты с низкой популярностью. Bubble chart визуально сравнивает числовые переменные и показывает зависимость между ними.
График 4
4. Boxplot (Лучший сезон для посещения и посещаемость)
Коробчатая диаграмма показывает распределение посещаемости по сезонам. Каждая коробка отражает медиану и значения, которые показывают минимальные и максимальные значения. График помогает выявить сезонные пиковые нагрузки. Легко определить, в какие сезоны туристический поток максимален и минимален.
График 5
5. Stacked bar (Количество достопримечательностей по типам для каждого континента)
Сравнивает континенты по количеству туристических направлений разных типов. Каждый столбец разделён на сегменты по типу достопримечательности, высота столбца обозначает общее число объектов. График позволяет одновременно сравнивать континенты и типы объектов. Легко выявить уникальные особенности туризма в разных регионах.
Вывод
Проект наглядно показал распределение туристических направлений по странам, типам, стоимости и сезонам. Графики выявили популярные страны и виды достопримечательностей, зависимость посещаемости от стоимости и сезонные пики туристического потока, что является очень интересной и полезной информацией. Работа демонстрирует, как визуализация данных помогает выявлять тренды и принимать решения в сфере туризма.
Описание применения генеративной модели
В своем проекте я воспользовалась ChatGPT для создания обложки моего анализа и консультаций по использованию библиотеки Pandas.