
Описание проекта
Тема образования и психологического благополучия учащихся является актуальной, так как академическая успеваемость напрямую влияет на будущие возможности студентов, а ментальное состояние может существенно сказываться на результатах обучения. Анализ этих данных позволяет выявить возможные зависимости между психологическими факторами, демографическими характеристиками и экзаменационными результатами.
Меня заинтересовала тема как раз актуальностью, кроме того, подобные исследования могут быть использованы для улучшения образовательной среды и поддержки учащихся в учебном процессе, что немало важно.
Выбор данных для анализа
Для выполнения проекта были использованы открытые наборы данных, размещённые на платформе Kaggle:
Students Performance in Exams — содержит информацию об экзаменационных баллах учащихся по математике, чтению и письму, а также демографические характеристики.
Students Mental Health Assessments — включает числовые показатели, отражающие ментальное состояние студентов (психологические и эмоциональные факторы).
Students’ Academic Performance (xAPI-Edu-Data) — содержит данные об учащихся, включая пол, образовательные характеристики и учебную активность.
Какие нейросети помогали в процессе
Для выявления и расшифровок ошибок в коде использовался ChatGPT
А для генерации обложки была использована нейросеть krea.ai (https://www.krea.ai/app):
Editorial-style cover illustration for a student data visualization project. Silhouettes of students studying, abstract charts floating around them (graphs, statistics, dashboards). Focus on education, learning, mental well-being. Soft warm color palette (
Какие виды графиков были использованы
В проекте были использованы следующие виды визуализации:
1. Линейный график — для анализа зависимости между показателями ментального состояния и средней успеваемостью.
2. Столбчатая диаграмма — для сравнения средних экзаменационных баллов по различным предметам.
3. Pie chart — для отображения распределения учащихся по полу.
4. Boxplot — для анализа разброса оценок и выявления выбросов в данных.
Выбор различных типов графиков позволил рассмотреть данные с нескольких аналитических точек зрения и повысить наглядность результатов.
Этапы работы
Работа с данными проводилась в среде Google Colab с использованием языка программирования Python и библиотек Pandas и Matplotlib.
Основные этапы обработки данных включали:
Загрузку CSV-файлов в рабочую среду.
Проверку структуры данных и типов столбцов.
Очистку данных (отбор числовых признаков).
Агрегацию данных (расчёт средних значений, группировка по категориям).
Подготовку данных для визуализации.
Цветовая гамма
При разработке визуальных данных я выбрала следующую цветовую палитру:
#C85A25 #2F2523 #EAE1DC #C69B8A
Гамма хороша тем, что есть как нейтральные цвета, так и акцентные, а графитовый оттенок ассоциативно напоминает цвет школьной доски, что коррелируется с концепцией и темой образования.
Шрифт был выбран также по принципу сходства с темой, поэтому Sriracha оказался самым подходящим. Он напоминает шрифт, используемый учениками в процессе учебы.
График № 1: Линейный график
Для анализа был автоматически выбран количественный показатель ментального состояния студентов, что позволило обеспечить универсальность обработки данных и построить визуализацию зависимости академической успеваемости от психологических факторов.
Код для создания графика № 1
График № 2: Столбчатая диаграмма
На диаграмме представлены средние значения экзаменационных баллов учащихся по трём предметам: математике, чтению и письму. Видно, что наибольший средний результат наблюдается по чтению, в то время как математика является наиболее сложным предметом для учащихся. Полученная визуализация позволяет наглядно сравнить уровень успеваемости по различным дисциплинам.
Код для графика № 2
График № 3: Pie chart
Круговая диаграмма отражает распределение учащихся по полу в исследуемом наборе данных. Можно заметить, что доли мужчин и женщин представлены относительно равномерно, что говорит о сбалансированности выборки. Данный факт важен для дальнейшего анализа академической успеваемости, так как снижает вероятность смещения результатов, связанного с гендерным фактором.
Код для графика № 3
График № 4: Boxplot
Boxplot демонстрирует распределение оценок по математике среди учащихся в зависимости от пола. Видно, что медианное значение у девушек несколько выше, чем у юношей, а также наблюдается различие в разбросе оценок. Наличие выбросов указывает на индивидуальные случаи крайне низких или высоких результатов. Данная визуализация позволяет наглядно оценить различия в успеваемости между группами.
Код для графика № 4
Вывод
Проведённый анализ показал, что академическая успеваемость является комплексным показателем, зависящим не только от учебной деятельности, но и от психологического состояния и индивидуальных особенностей учащихся.
Блокнот с кодами и датасет