
Концепция

В процессе обучения студентов часто возникает вопрос, от чего на самом деле зависит успеваемость: от количества часов учёбы, качества сна, способа обучения или внешних условий. Как студент, я регулярно сталкиваюсь с этими факторами, поэтому хочу понять, какие из них действительно оказывают наибольшее влияние на итоговые оценки. Данный датасет показался мне интересным, потому что он отражает реальные аспекты студенческой жизни: режим сна, формат обучения, посещаемость занятий и подготовку к экзаменам. Анализ таких данных позволяет сделать выводы, которые могут быть полезны студентам.
Анализ в данной работе проводится на основе представленного набора данных, содержащего 20 000 наблюдений. Каждый объект выборки описывает учащегося и включает совокупность показателей, отражающих его академическое поведение, учебные привычки, образ жизни, а также условия проведения экзамена. В набор данных входят такие переменные, как количество часов, затрачиваемых на ежедневную подготовку, процент посещаемости занятий, продолжительность и качество сна, наличие доступа к интернету, используемый метод обучения, рейтинг образовательного учреждения и уровень сложности экзамена. Указанные факторы охватывают широкий спектр условий, характерных для образовательной среды, и позволяют комплексно оценить влияние различных аспектов повседневной жизни и обучения на академические результаты учащихся. Итоговая оценка за экзамен представлена в виде числового показателя в диапазоне от 0 до 100 и рассчитывается на основе взвешенной формулы, имитирующей реальную систему оценки академической успеваемости. Использование данного набора данных позволяет провести всесторонний анализ факторов, влияющих на результаты экзаменов, и выявить ключевые закономерности между условиями обучения и уровнем успеваемости.

Гипотезы
Студенты, которые больше времени уделяют обучению, получают более высокие оценки; качество сна положительно влияет на результаты экзаменов; формат обучения может влиять на эффективность усвоения материала; регулярная посещаемость занятий связана с более высоким рейтингом.
Стиль
В работе использовались методы описательной статистики и визуального анализа данных. Для сравнения групп применялись столбчатые диаграммы stripplot и boxplot, для анализа зависимостей — точечные диаграммы, а для отображения структуры выборки — круговые диаграммы. Такой набор методов позволил наглядно выявить влияние различных факторов на академическую успеваемость студентов.
Доступ в интернет
Зависимость баллов от сложности экзамена
Формы обучения
Важность сна
Битва полов
Полученный результат оказался для меня показателен: несмотря на распространённость онлайн-обучения, наилучшие результаты демонстрируют студенты, обучающиеся с наставником. Самообучение, напротив, оказалось наименее эффективным, что подчёркивает важность обратной связи и поддержки в процессе обучения.
Применение генеративных моделей
Для создания изображений был использован Google gemini
В процессе работы ChatGPT использовался как вспомогательный инструмент для объяснения синтаксиса Python