Original size 1140x1600

Анализ успеваемости учащихся

PROTECT STATUS: not protected
10

Концепция

Для своего проекта я выбрала Students Performance Dataset, которые взяла с рекомендованного сайта Kaggle. Эти данные заинтересовали меня, поскольку в них присутствовала информация не только об успеваемости учащихся, но также и о количестве времени, проведённом ими за учёбой; об образовании их родителей; о всевозможных внеучебных активностях и тп. Мне показался такой пласт данных достаточно интересным, поскольку благодаря им можно выяснить, «какова формула отличника», какие посторонние факторы имеют особое влияние на результат.

Виды графиков

- Матрица корреляции, посвящённая выявлению взаимосвязи факторов - Точечная диаграмма «Связь между количеством отсутствий и учебного времени ученика на его оценку» - Столбчатая диаграмма «Связь между уровнем образования родителей и средней оценкой ребёнка» - Круговая диаграмма «Топ внеклассной деятельности среди отличников»

Этапы работы

Работу над проектом я начала с того, что загрузила данные из выбранного мною файла Student_performance_data _.csv, а также были загружены библиотеки Pandas и Matplotlib, которые помогут в анализе и визуализации данных. Позже я отформатировала таблицу под удобный мне вид, сделав так, чтобы отображались первые 10 строк с информацией.

big
Original size 1068x412

Матрица корреляции

Позже, перейдя к анализу таблицы, я решила посмотреть, взаимосвязь каких факторов является наиболее выраженной, чтобы понять что именно влияет на результаты учащихся. При оформлении матрицы корреляции для чистоты результата, я сделала выборку интересующих меня признаков в списке features, а также удалила столбец с ID студентов, поскольку эта информация ни на что не влияет.

Original size 1138x202
Original size 780x483

После получения матрицы я заметила положительную корреляцию между переменными под названием «Absences» (пропуски) и «GradeClass"(средний балл учащегося). Судя по красному участку на стыке данных, можно сказать, что между ними есть прямолинейная связь.

Точечная диаграмма

Исходя из полученной ранее информации, я решила проверить, как влияет большое количество пропусков на балл ученика. Поскольку возможен вариант более усердной работы по средству отработки упущенного материала во время недели, или, наоборот, полного отсутствия какого-либо учебного процесса. Потому я создала точечную диаграмму, где ось X отвечает за количество пропусков, ось Y — за средний балл. Цветовое же оформление зависит от времени, проведённого за учёбой в течении недели. Также я импортировала библиотеку Seaborn, которая позволила найти взаимосвязь между данными, а также сделать сетку на фоне графика для ясности чтения.

Original size 1163x400
Original size 1045x678

При взгляде на диаграмму можно заметить, как стремительно движется вниз значение средней оценки с увеличением количества пропусков. А стоит отметить, что чем меньше времени на подготовку затрачивает ученик, тем ниже его результат становится.

Столбчатая диаграмма

Далее я решила разобрать другие факторы, которые могут повлиять на успеваемость студента. Меня заинтересовали данные об образовании родителей, потому с помощью столбчатой диаграммы я пыталась узнать, есть ли зависимость среднего балла учащегося от образованности его родственников, которые могли бы оказывать на него влияние. Потому на этом этапе происходит вычисление средней оценки ученика для каждой группы, созданной в зависимости от образования родителя.

Original size 1156x162
Original size 1007x543

Глядя на график, можно увидеть, что высокие результаты, свойственны для учеников, выросших в семьях, в которых родители закончили лишь среднюю школу. Возможно, это говорит о том, что такие дети, видя трудный путь взрослых, хотят для себя иной жизни, потому работают усерднее.

Круговая диаграмма

Также в таблице была представлена информация о внеклассной деятельности учащихся. С помощью круговой диаграммы я решила посмотреть, какие виды активности более популярны среди студентов с высокими результатами. Из данных можно сделать вывод, что, например, спорт, воспитывая в человеке дисциплину, может иметь благоприятное влияние на его деятельность, также работает и с волонтёрством и музыкой. В этой части кода рассматриваются все студенты, чей балл равен 4.0, их мы считаем за отличников.

Original size 1168x280
Original size 846x677

Описание применения генеративной модели

Никак не могла справиться с созданием корреляционную матрицы, за неимением знаний, потому обратилась к Chat GPT (https://chatgpt.com/c/dca9b17a-ceff-4d21-b370-1e676917daa1). Промт: «Создай корреляционную матрицу на основе таких признаков, как возраст, время обучения, пропуски, GPA и GradeClass, взятых из CSV файл, который я прикрепила». Также Chat GPT (https://chatgpt.com/c/dca9b17a-ceff-4d21-b370-1e676917daa1) был использован для выбора библиотеки Seaborn, диаграмма из которой позволила найти взаимосвязь между данными. Промт: «С помощью какой библиотеки можно стилизовать диаграмму, чтобы она показывала взаимосвязь между количеством пропусков занятий, часов учёбы и средним баллом студентов». Для генерации обложки я использовала Ideogram (https://ideogram.ai/g/ciw_VwnSQKaow3HydDJO_A/2). Промт: «generate a tired student leaning on his desk. color scheme purple, photo, cinematic»

Ссылки

Анализ успеваемости учащихся
10
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more