
Описание
В этом проекте проанализирован датасет о теннисных матчах WTA за 2016 год. Мне интересна данная тема для анализа, поскольку я занималась теннисом на протяжении 11 лет, и мне всегда было интересно, какие факторы влияют на успех в этом виде спорта. В рамках работы я изучила, кто чаще выигрывает матчи и проследила закономерности, которые могут быть полезны в игре. Для анализа данных я использовала библиотеки pandas, matplotlib и seaborn.
Типы диаграмм: (01) Гистограмма «Распределение побед по возрасту» (02) Столбчатая диаграмма «Соотношение побед и поражений по странам» (03) Круговая диаграмма «Соотношение побед правшей, левшей и амбидекстеров» (04) Точечный график с линией тренда «Зависимость количества выигранных матчей от процента эйсов» (05) Столбчатая диаграмма «Топ-10 теннисисток по количеству побед в 2016 году»
Данные взяты с сайта: https://www.kaggle.com/

Для создания цветовой палитры диаграмм были использованы яркие, насыщенные оттенки, которые ассоциируются с теннисом. Они символизируют энергию, драйв и динамику данного вида спорта.

Использование библиотек

В проекте я использую следующие библиотеки: kagglehub для загрузки данных с Kaggle, pandas для обработки и анализа данных, matplotlib для визуализации графиков, а также seaborn для улучшения визуализации и создания статистических графиков. rcParams из matplotlib используется для настройки шрифтов и внешнего вида графиков.
(01) Распределение побед по возрасту
Гистограмма показывает, как распределяются победы в теннисных матчах среди спортсменов разного возраста. График позволяет определить, в каком возрасте игроки чаще всего выигрывают матчи. Таким образом, видно, что основное количество побед приходится на теннисистов в возрасте 25-27 лет, что подтверждает, что пик формы у спортсменов приходится именно на этот период.
(02) Соотношение побед и поражений по странам
Столбчатая диаграмма отображает количество побед и поражений у игроков из 35 стран стран. Победы и поражения обозначены разными оттенками, что помогает легко сравнить результаты стран. Например, видно, что у некоторых стран (например, США и Германия) побед заметно больше, чем поражений, это говорит о высоком уровне теннисистов из этой страны. Спортсменки из России, к сожалению, в сезоне 2016 года чаще проигрывали. А спортсменки из Польши и Беларуси хоть и имели меньшее количество матчей, но им удалось не проиграть ни в одном.
(03) Соотношение побед правшей, левшей и амбидекстеров
Круговая диаграмма показывает, какой процент победителей теннисных матчей играют правой, левой рукой или являются амбидекстрами (одинаково хорошо владеют обеими руками). Большая часть игроков — правши, что подтверждает распространенность праворукости в теннисе. Однако также среди победителей есть и значительное количество левшей, которые могут иметь тактические преимущества на корте.
(04) Зависимость количества побед от количества выигранных геймов на своей подаче
Точечная диаграмма показывает, как процент выигранных геймов на своей подаче влияет на общее количество побед у теннисистов. Таким образом, видно, что игроки с высоким процентом выигранных подач чаще побеждают в матчах, что подчеркивает важность сильной подачи в теннисе. Также это подтверждается восходящим уровнем тренда.
(05) Топ-10 теннисисток по количеству побед в 2016 году
Диаграмма представляет собой горизонтальную столбчатую диаграмму, которая показывает топ-10 теннисисток по количеству побед в 2016 году. Для её построения выбираются 10 спортсменок с наибольшим числом побед. По оси X расположено количество побед, а по оси Y — имена теннисисток. Этот анализ помогает определить, какие игроки доминировали в женском туре в 2016 году, и выявить лидеров.
Вывод
Таким образом, анализ женского тенниса в 2016 году выявляет ключевые тенденции, которые влияют на успешность игроков. Победы распределяются по возрасту, странам и игровым характеристикам, что показывает значимость физических, тактических и географических факторов. Определённые показатели, такие как эффективность подачи, также оказывают влияние на результаты. В целом, успешность теннисисток определяется сочетанием различных факторов, это отражается в статистике лидеров. Полученные данные могут использоваться для прогнозирования будущих результатов, оценки перспективных игроков и выявления сильных и слабых сторон спортсменок.
Список источников
Обложка сгенерирована в Midjourney: https://www.midjourney.com/home WTA URL: https://www.wtatennis.com/tournaments (дата обращения: 15.03.2025). Фотография URL: https://ru.avkgroup.at/shared/files/202109/368_8972.jpg (дата обращения: 18.03.2025). Фотография URL: https://i.eurosport.com/2019/06/07/2609423-54087170-2560-1440.jpg (дата обращения: 15.03.2025). Eurosport URL: https://espanol.eurosport.com/tenis/ (дата обращения: 14.03.2025).