Original size 1143x1600

Анализ данных и визуализация датасета «Personalized Learning Dataset»

PROTECT STATUS: not protected
3

Данные

Для анализа я выбрала датасет «Personalized_Learning_Dataset», который содержит информацию о характеристиках обучения людей различного возраста по техническим направлениям.

В датасете есть такие данные, как возраст учащихся, пол, уровень обучения, название курса, стиль обучения и тд.

Источник: датасет был найден на платфоре Kaggle.

Почему эти данные интересны?

Актуальность: Анализ больших данных в области образования способствует улучшению качества обучения и помогает принимать более обоснованные решения на всех уровнях образовательного процесса.

Ценность данных: Изучение больших объемов данных, в которых представлены различные характеристики обучения может стать основой для создания новых методик и технологий в образовании, что в итоге улучшает качество обучения.

big
Original size 2049x1134

Типы графиков

— Круговая диаграмма: чтобы показать соотношение популярности учебных курсов. Круговая диаграмма удобно иллюстрирует визуализацию долевого распределения.

— Лепестковая диаграмма: чтобы отразить популярность стилей обучения среди студентов. Лепестковая диаграмма полезна для отражения процентного соотношения категорий данных.

— Линейный график: чтобы визуализировать динамику просмотра видео-уроков в зависимости от возраста. Линейный график хорошо подходит для отображения частых изменений какого-то значения.

— Столбчатая диаграмма: чтобы сравнить распределение учеников в зависимости от их пола и уровня образования. Столбчатая диаграмма прекрасно отражает значения категорий.

— Тепловая карта: чтобы показать распределение студентов по курсу и полу. Тепловая карта помогает визуализировать взаимосвязи между категориями данных.

— Гистограмма: чтобы показать уровень вовлеченности студентов относительно разных курсов обучения. Гистограммы идеально подходят для отображения категорий данных относительно друг друга.

Этапы работы

Мой путь обработки данных:

Загрузка данных: import pandas as pd df = pd.read_csv ('/content/personalized_learning_dataset.csv')

Удаление дубликатов: df_cleaned = df.drop_duplicates ()

Сортировка столбцов с числовыми значениями: sorted_df = df.sort_values (by='Age', ascending=True) sorted_df = df.sort_values (by='Time_Spent_on_Videos', ascending=True) и тд.

Использование нейросетей

Модель: для генерации идей по стилизации графиков и исправления ошибок в коде я использовала ChatGPT (Open AI)

Промпты:

«Как стилизовать графики про обучение?»

«Какие цвета использовать для стилизации графиков с большими данными про образование?»

Стилизация графиков

При выборе стиля для своих графиков я вдохновилась современным интерьерным дизайном в учебных заведениях. Использовала светлый фон и спокойные цвета.

Original size 1728x641

Код для стилизации: plt.gca ().set_facecolor ('#FFFACD')

Итоговые графики

Круговая диаграмма

Описание: Показывает соотношение популярности учебных курсов среди всех студентов.

Узнав результаты данного соотношения, можно предположить, в какую сторону движется развитие технологий и создать новые обучающие курсы, которые будут востребованы.

0

Популярность курсов среди учащихся

Лепестковая диаграмма

Описание: отражает популярность стилей обучения среди студентов.

Проанализировав эти данные, обучение можно создавать в формате, который более предпочтителен учащимися, что повысит вовлечённость и интерес к образованию.

0

Популярность стилей обучения

Столбчатая диаграмма

Описание: сравнивает распределение учеников в зависимости от их пола и уровня образования.

Результаты этого графика позволяют сделать вывод о том, что большинство людей уже имеют оконченное образование.

0

Распределение учащихся по полу и уровню образования

Линейный график

Описание: визуализирует динамику просмотра видео-уроков в зависимости от возраста.

Проанализировав данный график, можно понять, что ученикам школьного возраста предпочтительнее преподавать информацию в формате очных лекций. А люди, которые по возрасту, скорее всего, уже работают, с удовольствием будут обучаться на видео-уроках.

0

Динамика просмотра видео-уроков в зависимости от возраста учащихся

Тепловая карта

Описание: показывает распределение студентов по курсу и полу.

Узнав результаты данного соотношения, можно понять, какие технические направления более интересны определенному полу и преподавать данные курсы с учётом приоритетной аудитории.

0

Распределение количества студентов по курсу и полу

Гистограмма

Описание: показывает уровень вовлеченности студентов относительно разных курсов обучения.

Проанализировав эта диаграмму, заметно, что большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста, следовательно, имеет значение улучшать преподавание в определенных направлениях.

0

Уровень вовлеченности учащихся по курсам

Выводы

— Большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста. Получается, обучение техническим направлением нужно менять так, чтобы оно больше вовлекало и мотивировало обучаться. — Ученики в возрасте 25-ти лет большего всего уделяют времени на просмотр видео-уроков, а школьники меньше. Соответственно, ученикам школьного возраста предпочтительнее преподавать информацию в формате отличном от просмотров обучающих видео. — Обучающихся мужского пола больше, следовательно обучение может быть гибким и подстраиваться под большую аудиторию.

Вся проанализированная информация помогает точечно улучшать существующее образование, предугадывать развитие в определенных направлениях и создавать новые методики обучения.

Анализ данных и визуализация датасета «Personalized Learning Dataset»
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more