
В 2023 году на сайт portfolio.hse.ru было загружено 26395 проектов.
Это 72 проекта каждый день — очень много информации. Я решил проанализировать ее, чтобы понять, какой путь прошла ШД, и что ее (и всех нас) может ждать дальше.
Все данные взяты из открытых источников (сайт portfolio.hse.ru).
Работу можно условно поделить на три этапа: получение, предобработка и обработка данных. Для получения я написал парсер html страниц портфолио, после чего убрал из данных невалидные и ошибочные значения, и впоследствии использовал pandas для обработки и создания графиков.
177 152 проекта проанализировано
Самые базовые данные — общая доля оценок. Из них видно, что самая популярная оценка — 8, а оценок ниже 4 пренебрежительно мало (троек 56, двоек 6, а единиц — всего 3).
Шестерок в ШД больше, чем десяток.

Следующие интересные данные — количество проектов, загружаемых на портфолио ежегодно. Если первые 4 года с момента открытия ШД в 2013 году оно росло естественным путем (переходом студентов на курс выше и приходом новых первокурсников), то после — прирост уже дополнительный.
Количество проектов, которые ежегодно делаются в Школе дизайна растет на 2-3 тысячи каждый год.

Еще одна интересная выборка: разница между оценками за предпросмотр и просмотр. Видно, что в подавляющем большинстве случаев она не меняется. Реже — меняется на 1 балл в большую или меньшую сторону.
Другая не менее интересная разница — между просмотром и финальной оценкой. Тут, в отличие от предыдущего сравнения, разница почти всегда нулевая. Лишь изредка оценку повышают на балл (причина таких кейсов мне неизвестна), и еще реже — снижают на балл (за посещаемость, наверное).
Дальше — интереснее. Тренд оценок и количества десяток за все время. Как видим, с самого открытия ШД десяток было довольно много — около 20%, а средняя оценка превышала 8. Но после ковида показатели значительно снизились — средняя оценка опустилась ниже 7.8, а процент десяток стал меньше 3%.
За последние три года средняя оценка падает, а процент десяток растет, и приближается к 5%.
Следующий график — мой любимый. Он отображает среднюю разницу в самой первой оценке, которую получает пришедший в ШД человек, и самой последней, с которой выпускается. Для чистоты эксперимента я исключал кейсы, когда за время обучения человек делал незначительное количество проектов.
Как видим, чаще всего самая первая и самая последняя оценки студентов Школы Дизайна равны.
Мой второй любимый график — средний тренд четырех модулей каждого года Школы Дизайна. Загружаемых проектов становится меньше, оценка снижается почти на 0,2.
Следующий график тоже люблю: это объединенный тренд загрузок проектов за все года вместе. Видно четыре характерных спайка во время просмотров, по которым видно, как год от года сдвигались их временные промежутки, а еще периоды пересдач и идеально нулевое плато летом (признайтесь, захотелось).
Дальше — еще некоторые интересные графики, которые не требуют описания.
Ну и напоследок — облака слов по названиям, описаниям и тегам проектов, сделанные через wordcloud.