
ОПИСАНИЕ ПРОЕКТА
Мой проект посвящён исследованию арт-рынка и попытке разобраться, какие факторы влияют на формирование стоимости произведений искусства и почему одни работы оказываются в разы дороже других

Тема арт-рынка показалась мне особенно интересной, потому что в ней постоянно пересекаются рациональные факторы (год создания, стиль, имя художника) и субъективные — вкус, статус и культурная ценность. Отдельное внимание я решила уделить таким деталям, как наличие и расположение подписи художника, чтобы посмотреть, может ли даже этот, на первый взгляд второстепенный элемент, быть частью восприятия ценности работы.
Мне было любопытно понять, какие произведения попадают в самый дорогой сегмент, какие художественные направления чаще ассоциируются с высокими ценами, существует ли связь между возрастом работы и её стоимостью, а также как такие детали, как подпись, вписываются в общую систему формирования цены.
В качестве основы я использовала датасет Art Price Dataset на Kaggle (https://www.kaggle.com/datasets/flkuhm/art-price-dataset?select=artDataset.csv), в котором собрана информация о произведениях искусства, их стоимости, художественных направлениях, времени создания и других характеристиках.
Для анализа были выбраны данные формы визуализации: 1. Гистограмма с логарифмической шкалой 2. Box Plot 3. Горизонтальная столбчатая диаграмма 4. Диаграмма рассеяния 5. Круговая диаграмма
В дополнении к проекту мне стало интересно поэкспериментировать с тем, как нейросеть может визуально представить произведения искусства в зависимости от их стоимости. Я решила посмотреть, меняется ли образ искусства в глазах ИИ, если задать разный ценовой уровень.
Обложка проекта: Create a conceptual art scene representing the art market and value. Museum-like space, single artwork in focus, minimal composition, dramatic soft lighting, dark refined color palette, atmosphere of prestige and cultural significance.
Все изображения были сгенерированы с помощью нейросети recraft.ai.
Prompt 1: Create an artwork representing a lower-priced art piece. Simple composition, softer lighting, minimal details, accessible and calm atmosphere, neutral color palette, modest scale, contempora
Prompt 2: Create an artwork representing a mid-priced art piece from the art market. More complex composition, richer textures, balanced lighting, increased detail, confident artistic expression, sens
Prompt 3: Create an artwork representing a high-priced, exclusive art piece. Dramatic lighting, deep shadows, complex composition, rich textures, dark and elegant color palette, cinematic framing, sen
Самые дешёвые произведения представлены как светлые пейзажи с простой композицией. Средний ценовой сегмент выглядит как выразительные картины с подчёркнутой художественностью и музейной визуальной подачей. Самые дорогие работы сведены к минималистичному образу, где важнее идея и статус, чем визуальная детализация.
На графике видно, как произведения искусства распределяются по ценовым категориям. Больше всего работ находится в нижнем и среднем ценовом сегменте, тогда как дорогие произведения встречаются значительно реже. По мере роста цены количество объектов резко сокращается, что хорошо показывает неравномерную структуру арт-рынка.
На графике видно распределение цен произведений по художественным направлениям. У каждого стиля показан диапазон цен: основная масса работ сосредоточена внутри «коробки», а отдельные точки справа обозначают дорогие исключения.
Хорошо заметно, что у концептуального искусства и поп-арт медианная цена выше и разброс значений шире, что говорит о большем количестве дорогих работ. Направления абстракционизм, сюрреализм и экспрессионизм выглядят более компактными по цене, с меньшим смещением в сторону высоких значений.
На графике видно, что лидером является Алекс Кац, чья самая дорогая работа заметно превышает остальные. Далее следуют VВия Целминьш и Джон Балдессари с близкими, но более низкими значениями. В нижней части рейтинга разница между художниками становится менее выраженной, что показывает постепенное снижение максимальных цен.
На графике видно связь между ценой произведения и годом его создания. Точки сильно разбросаны, что говорит о большом разнообразии цен в разные периоды. При этом трендовая линия показывает общий рост стоимости: в среднем более старые работы оцениваются ниже, а ближе к современности цены становятся выше, хотя разброс остаётся значительным
На графике видно, где художники чаще всего размещают подпись на своих произведениях. Самую большую долю занимает категория «другое / не уточнено», что говорит о неполноте или вариативности данных. Среди конкретных вариантов чаще всего подпись располагается на лицевой стороне (recto) и на обороте (verso). Подписи в правом нижнем углу встречаются реже, а левый нижний угол используется минимально, что делает его наименее распространённым вариантом.
ЗАКЛЮЧЕНИЕ
Анализ показал, что рынок распределён крайне неравномерно: большинство работ находится в нижнем и среднем ценовом сегменте, тогда как самые дорогие произведения составляют небольшую, но заметную часть и сильно выделяются по стоимости.
Исследование художественных направлений подтвердило, что стиль действительно влияет на цену. Некоторые направления чаще ассоциируются с высокими стоимостями, в то время как другие остаются более доступными, хотя в каждом стиле встречаются отдельные дорогие исключения.
Анализ возраста произведений показал, что прямая зависимость между годом создания и ценой отсутствует, однако в среднем более поздние и современные работы чаще попадают в высокий ценовой диапазон. Это говорит о том, что актуальность, контекст и репутация художника играют не меньшую роль, чем возраст произведения.
Дополнительно рассмотрение подписи художника показало, что её наличие и расположение чаще всего фиксируются нестрого и не всегда стандартизированы, однако сама подпись остаётся важным элементом авторства и может влиять на восприятие ценности работы.


Визуальный эксперимент с нейросетью стал логичным дополнением анализа и показал, что даже в ассоциативном восприятии стоимость связывается с уровнем выразительности и символичности образа. Проект помог мне понять, что цена произведения искусства формируется на пересечении объективных данных и субъективных факторов, а арт-рынок остаётся сложной системой, где цифры и культурный контекст взаимосвязаны
Описание применения генеративной модели и вспомогательных инструментов
1. Kaggle — Платформа была использована для поиска и загрузки датасета.
2. Google Colab — Весь процесс работы: обработка данных и визуализация.
3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — применялась для работы с числовыми данными и расчёта вспомогательных величин при построении графиков.
4. Цветовая палитра (Adobe Color)
5. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.
6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.
Использованные статистические методы
В ходе анализа данных о рынке произведений искусства были применены следующие статистические и аналитические методы:
• Анализ распределений с логарифмическим масштабированием — использовался для исследования распределения цен на произведения искусства. Применение логарифмической шкалы позволило корректно визуализировать данные с сильной асимметрией и длинным «хвостом» высоких цен, а также выявить типичную медианную стоимость работ.
• Описательная статистика (медиана) — применялась для расчёта центральной тенденции цен, что позволило получить устойчивую оценку «типичной» стоимости произведений, менее чувствительную к экстремально дорогим объектам.
• Сравнительный анализ распределений по категориям — реализован через диаграммы размаха для различных художественных направлений. Это позволило сравнить медианные цены, разброс значений, межквартильные интервалы и наличие выбросов между художественными движениями.
• Ранжирование и анализ экстремальных значений — использовались для выявления топ-10 художников по максимальной цене проданной работы. Такой подход позволил сфокусироваться на верхнем сегменте арт-рынка и оценить концентрацию рекордных продаж.
• Корреляционно-регрессионный анализ во временном разрезе — применялся для изучения связи между годом создания произведения и его ценой. Линейная регрессия в логарифмическом пространстве позволила выявить общий долгосрочный тренд роста стоимости работ в зависимости от исторического периода.
• Визуальный анализ взаимосвязей — реализован с помощью диаграмм рассеяния, что позволило оценить характер зависимости цен от времени создания и выявить области наибольшей концентрации наблюдений.
• Частотный анализ категориальных признаков — использовался для исследования расположения подписи художника на произведении. Подсчёт частот и визуализация долей категорий позволили выявить наиболее распространённые и наименее типичные места подписи.
• Выделение редких категорий — применялось при визуальном анализе мест подписей, где наименее распространённая категория была дополнительно акцентирована цветом для облегчения интерпретации результатов.