Original size 1140x1600

Стоит ли надеяться на победу Новака Джоковича?

PROTECT STATUS: not protected
The project is taking part in the competition

Описание

В своём проекте я сосредоточилась на профессиональном мужском теннисе и его статистике за последние полтора десятилетия.

big
Original size 640x358

В качестве основы был использован датасет ATP Tennis Data , собранный с платформы Kaggle и охватывающий период с 2008 по 2022 год. Эти данные были самыми свежими из предложенных. Теннис тех лет имеет особую эстетику для меня, так как именно там собраны все культовые спортсмены этого вида спорта. В наборе данных представлены сведения о матчах, игроках, количестве побед, коэффициентах ставок, а также игровых характеристиках спортсменов.

Работа позволяет рассмотреть теннис как систему, в которой спортивные достижения, стабильность формы и вероятностные модели тесно переплетаются. Центральной фигурой исследования стал Новак Джокович — один из самых доминирующих игроков современного тенниса. Мне было интересно проследить, как менялось количество его побед со временем, какие игроки составляли ему конкуренцию, а также проверить, насколько рациональной могла бы быть стратегия ставок, основанная на его стабильных результатах.

Типы графиков в проекте

1. Горизонтальная столбчатая диаграмма 2. Линейный график с заливкой 3. Линейный график временного ряда с логарифмической шкалой 4. Точечная диаграмма 5. Круговая диаграмма

Обложка и фото по теме сгенерированы через recraft.ai

Мне стало интересно, как может видеть мою тему нейросеть и поэтому я решила воспользоваться recraft.ai, составив запрос:

«Create a modern tennis data visualization inspired by professional sports analytics, focused on performance and competition.»

0

Цветовая палитра

Работая над визуальным стилем проекта, я хотела передать ощущение спортивной динамики и эстетики тенниса. Основой палитры стали приглушённые оттенки, которые ассоциируются с кортами, теннисными мячами и визуальной эстетикой спортивной статистики. Чтобы собрать нужную цветовую палитру я использовала Adobe Color. Эти цвета используются в графиках и общем визуальном решении проекта.

В набор вошли эти цвета: #E7E5D7 #65AAC2 #ADBA5E #869A69 #000000

Шрифт в графиках — Inter.

Original size 2632x983

Использованные статистические методы

В ходе анализа данных матчей ATP-тура за период с 2008 по 2022 год были применены методы описательной статистики, анализа временных рядов, сравнительного анализа и имитационного моделирования:

• Описательная статистика (частотный анализ)

Использовалась для подсчёта количества побед отдельных теннисистов за рассматриваемый период. Это позволило выявить наиболее успешных игроков по суммарному числу выигранных матчей и определить лидеров тура.

• Ранжирование и сравнительный анализ

Применялся для формирования топ-15 теннисистов по числу побед. Сравнение абсолютных значений позволило оценить разрыв между лидерами и основной группой игроков.

• Анализ временных рядов

Использовался для изучения динамики побед Новака Джоковича по сезонам. Группировка данных по годам позволила выявить периоды пиковых результатов, спады и общую стабильность выступлений на протяжении карьеры.

• Анализ трендов и сезонной вариативности

Визуализация годовой динамики побед позволила оценить изменчивость результатов по сезонам и выявить годы с аномально высокой или низкой результативностью.

• Имитационное моделирование стратегии ставок

Применялся для оценки гипотетической стратегии ставок на победы Новака Джоковича с использованием средних коэффициентов букмекеров. Модель учитывала последовательность матчей, перезапуск стратегии после поражений и динамику размера банка во времени.

• Анализ накопленных величин

Использовался для сопоставления роста условного банка и суммарных вложенных средств. Это позволило оценить потенциальную прибыльность стратегии и риск накопления капитала при длительных победных сериях.

• Логарифмическое масштабирование

Применялось для визуализации динамики банка и вложений, что позволило корректно сравнивать значения, отличающиеся на порядки, и избежать визуального искажения данных.

• Сравнительный анализ физических характеристик

Использовался для изучения физического профиля соперников, обыгрывавших Новака Джоковича. Анализ распределения роста и веса в сочетании с игровой рукой позволил выявить возможные паттерны среди игроков, представлявших наибольшую сложность.

• Анализ распределений категориальных данных

Применялся для оценки доли побед Новака Джоковича на различных типах покрытий (Hard, Clay, Grass). Это позволило количественно сравнить его успешность в разных игровых условиях.

• Структурный анализ специализации

Распределение побед по типу покрытия использовалось для выявления предпочтительной игровой среды и оценки универсальности игрока на разных кортах.

Горизонтальная столбчатая диаграмма

График 1

Первый график посвящён сравнению теннисистов с наибольшим количеством побед за период с 2008 по 2022 год. Диаграмма показывает разрыв между лидерами тура и остальными игроками. Визуализация помогает оценить масштаб доминирования отдельных спортсменов и увидеть, насколько стабильно они удерживали высокие позиции на протяжении многих сезонов. Исходя из данных, меня заинтересовал игрок первой строки Новак Джокович, так как у него самый сильный показатель из всех. Его карьера стала главным фактором в моем интересе к данному виду спорта, поэтому далее более детально рассмотрим его спортивные достижения.

Original size 5120x3260
0

Линейный график с заливкой

График 2

Во второй визуализации я сосредоточилась на динамике побед Новака Джоковича. График отражает изменение количества выигранных матчей по годам и показывает, что успех игрока не является равномерным, а формируется волнообразно — с периодами подъёма и относительного спада. Тем не менее общий тренд остаётся восходящим, что подчёркивает исключительную устойчивость его карьеры.

Original size 5120x3260
0

Линейный график временного ряда с логарифмической шкалой

График 3

Третий график моделирует гипотетическую ситуацию: что произошло бы, если бы ставки всегда делались на победу Джоковича. Здесь используется логарифмическая шкала, так как значения банка могут расти экспоненциально. Визуализация показывает чередование резких скачков и затяжных периодов стагнации, подчёркивая, что даже стратегия, основанная на сильном фаворите, остаётся зависимой от серий побед и поражений, а не гарантирует стабильный рост.

Original size 1280x815
0

Точечная диаграмма

График 4

Заключительный график посвящён анализу характеристик игроков, которым удавалось обыгрывать Новака Джоковича. На нём сопоставляются различные параметры матчей и соперников, что позволяет предположить, какие факторы могут играть ключевую роль в победе над одним из сильнейших теннисистов в истории. Анализ смещает фокус с абсолютных результатов на условия и контекст отдельных матчей.

Original size 1280x815
0

Круговая диаграмма

График 5

График показывает распределение побед Новака Джоковича в зависимости от типа покрытия. Наибольшая доля выигрышей приходится на хард — почти две трети всех побед, что подчёркивает его стабильность и универсальность на этом покрытии. Грунт занимает второе место, демонстрируя уверенные, но менее доминирующие результаты. На траве доля побед минимальна, что объясняется меньшим количеством турниров на этом типе покрытия по сравнению с остальными.
Original size 1280x815
0

Выводы по результатам исследования

Заключение

Проведённый анализ данных ATP показывает, что современный теннис — это не только соревнование физических и технических навыков, но и сложная система, в которой важную роль играют стабильность, стратегия и вероятностные закономерности. Сравнение количества побед ведущих игроков подчёркивает масштаб доминирования отдельных фигур, а динамика карьеры Новака Джоковича демонстрирует редкое сочетание высокой результативности и долгосрочной стабильности. Моделирование ставок на основе его побед наглядно показывает ограничения даже самых очевидных стратегий и напоминает о рисках, присущих любым вероятностным моделям.

Анализ характеристик соперников, в свою очередь, подчёркивает, что даже самые сильные игроки могут быть уязвимы при определённом сочетании игровых факторов.

Дополнительный анализ распределения побед Джоковича по типам покрытий показывает, что его наибольшая эффективность приходится на хард, где сосредоточена основная часть турниров и матчей. Более высокая доля побед на этом покрытии подчёркивает его универсальность и способность адаптироваться к разным игровым условиям, тогда как результаты на грунте и траве отражают как специфику покрытий, так и различия в количестве проводимых соревнований.

Мой проект демонстрирует, как визуализация данных может помочь глубже понять спортивные процессы, выявить скрытые паттерны и по-новому взглянуть на привычные статистические показатели профессионального спорта.

Original size 640x358

Описание применения генеративной модели и вспомогательных инструментов

1. Kaggle — Платформа была использована для поиска и загрузки датасета.

2. Google Colab — Весь процесс работы: обработка данных и визуализация.

3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте.

4. Цветовая палитра (Adobe Color)

5. recraft.ai — Использовала для генерации обложки и иллюстраций.

6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.

7. Tenor — для выбора GIF

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more