
Данные
Для анализа я выбрала датасет «Personalized_Learning_Dataset», который содержит информацию о характеристиках обучения людей различного возраста по техническим направлениям.
В датасете есть такие данные, как возраст учащихся, пол, уровень обучения, название курса, стиль обучения и тд.
Источник: датасет был найден на платфоре Kaggle.
Почему эти данные интересны?
Актуальность: Анализ больших данных в области образования способствует улучшению качества обучения и помогает принимать более обоснованные решения на всех уровнях образовательного процесса.
Ценность данных: Изучение больших объемов данных, в которых представлены различные характеристики обучения может стать основой для создания новых методик и технологий в образовании, что в итоге улучшает качество обучения.

Типы графиков
— Круговая диаграмма: чтобы показать соотношение популярности учебных курсов. Круговая диаграмма удобно иллюстрирует визуализацию долевого распределения.
— Лепестковая диаграмма: чтобы отразить популярность стилей обучения среди студентов. Лепестковая диаграмма полезна для отражения процентного соотношения категорий данных.
— Линейный график: чтобы визуализировать динамику просмотра видео-уроков в зависимости от возраста. Линейный график хорошо подходит для отображения частых изменений какого-то значения.
— Столбчатая диаграмма: чтобы сравнить распределение учеников в зависимости от их пола и уровня образования. Столбчатая диаграмма прекрасно отражает значения категорий.
— Тепловая карта: чтобы показать распределение студентов по курсу и полу. Тепловая карта помогает визуализировать взаимосвязи между категориями данных.
— Гистограмма: чтобы показать уровень вовлеченности студентов относительно разных курсов обучения. Гистограммы идеально подходят для отображения категорий данных относительно друг друга.
Этапы работы
Мой путь обработки данных:
Загрузка данных: import pandas as pd df = pd.read_csv ('/content/personalized_learning_dataset.csv')
Удаление дубликатов: df_cleaned = df.drop_duplicates ()
Сортировка столбцов с числовыми значениями: sorted_df = df.sort_values (by='Age', ascending=True) sorted_df = df.sort_values (by='Time_Spent_on_Videos', ascending=True) и тд.
Использование нейросетей
Модель: для генерации идей по стилизации графиков и исправления ошибок в коде я использовала ChatGPT (Open AI)
Промпты:
«Как стилизовать графики про обучение?»
«Какие цвета использовать для стилизации графиков с большими данными про образование?»
Стилизация графиков
При выборе стиля для своих графиков я вдохновилась современным интерьерным дизайном в учебных заведениях. Использовала светлый фон и спокойные цвета.
Код для стилизации: plt.gca ().set_facecolor ('#FFFACD')
Итоговые графики
Круговая диаграмма
Описание: Показывает соотношение популярности учебных курсов среди всех студентов.
Узнав результаты данного соотношения, можно предположить, в какую сторону движется развитие технологий и создать новые обучающие курсы, которые будут востребованы.
Популярность курсов среди учащихся
Лепестковая диаграмма
Описание: отражает популярность стилей обучения среди студентов.
Проанализировав эти данные, обучение можно создавать в формате, который более предпочтителен учащимися, что повысит вовлечённость и интерес к образованию.
Популярность стилей обучения
Столбчатая диаграмма
Описание: сравнивает распределение учеников в зависимости от их пола и уровня образования.
Результаты этого графика позволяют сделать вывод о том, что большинство людей уже имеют оконченное образование.
Распределение учащихся по полу и уровню образования
Линейный график
Описание: визуализирует динамику просмотра видео-уроков в зависимости от возраста.
Проанализировав данный график, можно понять, что ученикам школьного возраста предпочтительнее преподавать информацию в формате очных лекций. А люди, которые по возрасту, скорее всего, уже работают, с удовольствием будут обучаться на видео-уроках.
Динамика просмотра видео-уроков в зависимости от возраста учащихся
Тепловая карта
Описание: показывает распределение студентов по курсу и полу.
Узнав результаты данного соотношения, можно понять, какие технические направления более интересны определенному полу и преподавать данные курсы с учётом приоритетной аудитории.
Распределение количества студентов по курсу и полу
Гистограмма
Описание: показывает уровень вовлеченности студентов относительно разных курсов обучения.
Проанализировав эта диаграмму, заметно, что большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста, следовательно, имеет значение улучшать преподавание в определенных направлениях.
Уровень вовлеченности учащихся по курсам
Выводы
— Большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста. Получается, обучение техническим направлением нужно менять так, чтобы оно больше вовлекало и мотивировало обучаться. — Ученики в возрасте 25-ти лет большего всего уделяют времени на просмотр видео-уроков, а школьники меньше. Соответственно, ученикам школьного возраста предпочтительнее преподавать информацию в формате отличном от просмотров обучающих видео. — Обучающихся мужского пола больше, следовательно обучение может быть гибким и подстраиваться под большую аудиторию.
Вся проанализированная информация помогает точечно улучшать существующее образование, предугадывать развитие в определенных направлениях и создавать новые методики обучения.