
Описание проекта
Будучи студентом, полеты домой, на разные мероприятия участились и я стала замечать, как люди по-разному отзываются об авиакомпании и ее услугах, ведь удовлетворенность пассажиров является ключевым показателем для авиакомпаний, так как она напрямую влияет на их репутацию, именно поэтому меня заинтересовал данный датасет. Анализ данных сможет показать какие аспекты обслуживания наиболее важны для клиентов и как можно улучшить качество услуг для повышения удовлетворенности и лояльности пассажиров.
Для анализа я выбрала датасет с сайта Kaggle.com, а именно удовлетворенность пассажиров авиакомпании. Данные оказались достаточно объемными, поэтому, чтобы наглядно показать информацию, я использовала:
-Гистограмму -Столбчатую диаграмму -Тепловую карту -Круговую диаграмму -Линейный график
Для генерации обложки я использовала нейросеть Krea.ai. Prompt: The room where luggage is checked in. Airport during the day, lots of bright things. Young man in formal setting standing next to suitcase.
Цветовая палитра
Аэропорт это место, где сменяется день с ночью, где время замирает и становиться спокойно на душе, поэтому стилем проекта, цветовой палитрой, послужили пастельные светлые и темные цвета. При помощи Krea.ai была сгенерированна картинка, где видны разные приглушенные цвета чемоданов, а с помощью сервиса coolors.co цвета, взятые из картинки.
Prompt: there are many different suitcases in one place at the airport. there are many of them, they are colorful. Цвета: #374849, #456D7B, #8F8B85, #7D3451, #7BA3AE, #CAE4E9, #B691AC, #E8A6AF

Начало работы
Обработка данных была выполнена с использованием библиотек Pandas (для работы с данными), Matplotlib (для создания графиков и визуализации данных), Numpy (для числовых вычислений) и Seaborn (для статистической визуализации). Сначала я загрузила базу данных, после чего приступила к ее анализу и созданию визуализаций. В таблице содержится информация о поле, возрасте, типе клиента, путешествия, расстояния и услуг.
Далее я определяю стиль графиков. С использованием библиотеки matplotlib: создается пользовательская цветовая палитра my_palette, на ее основе формируется цветовая карта pallete, задаются параметры для отображения графиков, включая размер фигуры, включение сетки и стиль линий.
Гистограмма
Код создает гистограмму, которая показывает распределение возраста пассажиров. Гистограмма показывает, сколько пассажиров находится в каждом из 5 возрастных интервалов. График распределения возраста пассажиров показывает, что наибольшее количество людей, удовлетворенных услугами авиакомпании, находится в возрастной группе 40–50 лет. Это может свидетельствовать о том, что данная категория пассажиров чаще пользуется услугами авиакомпании, возможно, из-за активного периода жизни, связанного с деловыми поездками или семейными путешествиями. Также это может указывать на то, что услуги авиакомпании лучше всего соответствуют потребностям и ожиданиям именно этой возрастной группы. Кроме этого, стоит отметить группу 20-30 лет, то есть среди пассажиров много молодых людей: студентов или молодых специалистов, которые часто путешествуют по делам или для отдыха.
В коде использую массив bins, который будет использоваться для группировки возрастов. Также использую округление: np.floor (min_age / step) * step (округляет минимальный возраст вниз до ближайшего кратного step) и np.ceil (max_age / step) * step: (округляет максимальный возраст вверх до ближайшего кратного step) А step устанавливает шаг между значениями в массиве bins.
Столбчатая диаграмма
Столбчатая диаграмма сравнивает удовлетворенность пассажиров в зависимости от типа путешествия и класса обслуживания: оценки аспектов сервиса в зависимости от типа клиента. График показывает, что пассажиры бизнес-класса наиболее удовлетворены, возможно, из-за повышенного комфорта и сервиса, а пассажиры эконом-класса — чуть меньше, так как получают базовые услуги, но остаются лояльными.
Первым делом заменяю английские текстовые значения на русские в столбцах. Далее группирую данные по столбцам, визуализирую и настраиваю график.
Тепловая карта
Тепловая карта средних оценок сервиса показывает, что лояльные клиенты больше всего неудовлетворены комфортом сидений, упаковкой багажа и сервисом на борту, а нелояльные клиенты — упаковкой багажа и сервисом на борту. Это может быть связано с тем, что лояльные клиенты, чаще пользующиеся услугами авиакомпании, имеют более высокие ожидания и замечают недостатки, особенно в комфорте, который для них является ключевым фактором. Нелояльные клиенты, вероятно, менее требовательны к комфорту, но их недовольство упаковкой багажа и сервисом на борту может быть связано с разовым негативным опытом, который повлиял на их общее восприятие.
Первым делом также занимаюсь переводом текстовых значений.
sns.heatmap создаёт тепловую карту для визуализации средних оценок, annot=True показывает числовые значения в каждой ячейке, а cmap=pallete устанавливает цветовую палитру.
Круговая диаграмма
Круговая диаграмма распределения пассажиров по типу путешествия показывает, что 69% поездок совершаются по бизнесу, а остальные — по личным причинам. Это может быть связано с тем, что авиакомпания активно сотрудничает с корпоративными клиентами, предлагая выгодные условия для деловых поездок. Кроме того, пассажиры, путешествующие по работе, часто летают чаще и регулярнее, что увеличивает их долю в общем распределении.
Линейный график
Линейный график показывает, что наибольшие оценки принадлежат пассажирам в возрасте 40–60 лет. Данная возрастная группа чаще путешествует по работе, что делает их более требовательными к качеству услуг, но при этом они лучше адаптируются к условиям перелетов и ценят комфорт. Также их опыт путешествий позволяет более объективно оценивать сервис, что может объяснить более высокие оценки по сравнению с другими возрастными группами.
Заключение
В результате анализа удовлетворенность пассажиров авиакомпаний было выявлено, что наибольший уровень удовлетворенности наблюдается среди пассажиров бизнес-класса — объясняется повышенным комфортом и качеством сервиса, а также среди возрастной группы 40–60 лет, которая чаще путешествует по работе и имеет высокие, но реалистичные ожидания. Основные замечания пассажиров касались комфорта сидений, упаковки багажа и сервиса на борту, причем лояльные клиенты были более критичны к комфорту, а нелояльные — к упаковке багажа и обслуживанию. Распределение пассажиров по типу путешествия показало, что 69% поездок совершаются по бизнесу, что подчеркивает важность корпоративного сегмента для авиакомпании. Результаты исследования указывают на необходимость улучшения качества услуг, особенно для пассажиров эконом-класса, а также работы над устранением замечаний, связанных с комфортом и сервисом, чтобы повысить общую удовлетворенность и укрепить лояльность клиентов.
Нейросети
Krea. ai (https://www.krea.ai/) Coolors. co (https://coolors.co/)