
Концепция
В данном проекте я анализирую рынок жилой недвижимости с точки зрения нестабильности цен. В отличие от классического подхода, основанного на сравнении средних цен, в работе делается акцент на разбросе значений и неоднородности рынка.
Источник данных: Utrecht housing dataset, предоставленный ICT Institute.
Цель исследования — проанализировать нестабильность цен на рынке жилья и выявить районы, в которых стоимость недвижимости характеризуется наибольшей вариативностью.
Используемый датасет представляет собой табличные данные с информацией о жилых объектах недвижимости в городе Утрехт. В датасете содержатся как числовые, так и категориальные признаки.
Ключевые переменные, используемые в дальнейшем анализе: taxvalue — стоимость объекта недвижимости, house-area — площадь дома, zipcode — территориальная принадлежность объекта, - дополнительные характеристики (год постройки, участок, удобства).
Исследование


Тут мы можем наблюдать распределение цены за квадратный метр на рынке жилья Утрехта. Распределение имеет выраженную асимметрию и длинный правый хвост, что указывает на наличие объектов с существенно более высокой стоимостью по сравнению с основной массой предложений.
Рынок неоднороден: большинство объектов сосредоточено в относительно узком ценовом диапазоне, однако присутствуют дорогие объекты, которые значительно смещают среднее значение. В связи с этим использование только средней цены может вводить в заблуждение, и для анализа рынка более устойчивым показателем является медиана.
График демонстрирует уровень нестабильности цен в различных районах города, измеренный с помощью коэффициента вариации (CV). Коэффициент вариации показывает относительный разброс цен и позволяет сравнивать районы с разным уровнем средней стоимости.
Видно, что уровень нестабильности существенно различается между районами. Некоторые районы характеризуются заметно более высоким разбросом цен, что делает рынок в этих локациях менее предсказуемым.
Высокая нестабильность не всегда связана с высокой стоимостью жилья. Это указывает на то, что цена сама по себе не является надёжным индикатором стабильности рынка.
На графике показана связь между медианной ценой за квадратный метр и коэффициентом вариации по районам. Каждая точка соответствует отдельному району. Продемонстрировано отсутствие простой линейной зависимости между уровнем цен и стабильностью рынка. Некоторые дорогие районы оказываются достаточно нестабильными, в то время как более доступные районы могут иметь относительно устойчивые цены.
Результат подтверждает гипотезу о том, что анализ рынка недвижимости не может ограничиваться только сравнением цен — для корректной оценки необходимо учитывать разброс и вариативность.
Boxplot позволяет более детально рассмотреть распределение цен за квадратный метр внутри отдельных районов. Он показывает медиану, межквартильный размах и наличие выбросов. Видно, что даже внутри одного района цены могут значительно различаться. В некоторых районах наблюдается широкий межквартильный диапазон и большое количество выбросов, что свидетельствует о высокой неоднородности предложения.
Выходит, что нестабильность цен формируется не только за счёт различий между районами, но и из-за внутреннего разнообразия объектов в пределах одной локации.
Заключение
В совокупности все графики показывают, что рынок жилья Утрехта характеризуется заметной ценовой нестабильностью. Использование коэффициента вариации и анализ распределений позволяют выявить районы с повышенным риском и лучше понять структуру рынка, чем при использовании только средних цен.
Блокнот