
Вступление
Для проведения анализа был использован набор данных, посвящённый рынку искусства, который был найден на платформе Kaggle — одном из крупнейших открытых источников датасетов для аналитических и исследовательских задач. База данных включает более 2500 записей, в которых содержится разносторонняя информация: от художественных характеристик работ до параметров, связанных с продажами и логистикой. Такой состав данных делает возможным комплексное изучение рынка и факторов, влияющих на формирование спроса и цен, позволяет глубже понять предпочтения покупателей, методы ценообразования и оптимизировать операционные процессы.

Концепция
Интерес к анализу именно этого набора данных обусловлен несколькими причинами. Прежде всего, рынок искусства, особенно в контексте цифровых платформ и онлайн-продаж, активно развивается и представляет собой актуальное направление для исследования. Кроме того, выбранная база данных обладает достаточным объёмом и разнообразием показателей, что позволяет выявлять устойчивые закономерности, анализировать тренды и находить нестандартные зависимости.
Анализ реальных данных о произведениях, их характеристиках и продажах позволяет лучше ориентироваться в современных тенденциях, предпочтениях аудитории и факторах, влияющих на ценность визуального продукта. Кроме того, исследование рынка искусства даёт практическое понимание того, как визуальные решения, стиль, формат и другие характеристики работ могут влиять на их востребованность и коммерческий успех. Эти знания могут быть использованы в дальнейшей дизайнерской и художественной практике — при создании собственных проектов, формировании портфолио и выборе направлений для профессионального развития.
Основная концепция проекта заключается в использовании графиков как инструмента интерпретации данных, позволяющего наглядно представить поведение рынка, особенности продаж и взаимосвязи между показателями.
В ходе анализа данных были выбраны следующие виды графиков, поскольку они оказались наиболее релевантными и наглядными для визуализации необходимых параметров:
- круговая диаграмма - столбчатая диаграмма - точечный график - площадной график - тепловая карта - линейный график
Выбор таких визуальных инструментов объясняется их наглядностью и удобством для сравнения показателей, анализа распределений и отслеживания изменений во времени. Использование нескольких видов графиков позволяет рассмотреть данные с разных сторон и сделать выводы более обоснованными.
Начало работы
Данные были загружены из CSV-файла с помощью библиотеки Pandas. Для стилизации графиков были использованы библиотеки Matplotlib и Seaborn, а так же Numpy и Itertools.
Цветовая гамма
Цвета представлены сочетанием глубоких, приглушённых оттенков зелёного, тёмно-серого, бордового и красного, а также светло-серого.
Приглушённость оттенков позволяет избежать излишней агрессивности, сохраняя стиль и элегантность, что важно для визуализации данных и легкого восприятия.
Контраст светлого серого цвета улучшает читаемость текста и делает инфографику удобной для понимания, при этом поддерживая минимализм и современность дизайна.
Такая палитра помогает передать более интеллектуальный и художественный характер инфографики, соответствующий теме современного искусства.
Шрифт
Шрифт TT Norms выбран для оформления графиков благодаря высокой читаемости и современному минималистичному дизайну. Он обеспечивает аккуратное и профессиональное восприятие информации, не отвлекая внимание от самих данных.
График 1.
Распределение цен по категориям
Круговая диаграмма показывает, что ценовой диапазон $500–900 доминирует, поскольку именно в этом сегменте сходятся ожидания художников и возможности покупателей. Это можно воспринимать как компромисс между доступностью и ощущением ценности произведения.
Низкий сегмент (до $300) представлен слабо, что говорит о том, что рынок искусства не конкурирует напрямую с массовым декором. Покупатели, приходящие на арт-рынок, готовы платить больше за уникальность.
Высокий сегмент (свыше $900) также ограничен — дорогие работы покупаются реже, поскольку требуют либо инвестиционного интереса, либо статуса коллекционера. Это подтверждает, что рынок в целом не элитарный, а умеренно коммерческий.
Круговая диаграмма.
Для корректной визуализации распределения цен по категориям в удобном виде в коде выполнены следующие шаги:
- Созданы интервалы цен и назначены им категории для группировки. - С помощью pd.cut цены распределены по этим категориям и сохранены в новый столбец. - Подсчитано количество значений в каждой категории и отсортировано. - Построена круговая диаграмма с цветами, подписями и процентами.
График 2.
Соотношение материала и количество продаж
График показывает, как влияет техника выполнения работы на продажи.
Акварель демонстрирует наибольшее количество продаж, что объясняется сразу несколькими факторами: сравнительно невысокой себестоимостью, доступной ценой для покупателя и высокой декоративной привлекательностью. Акварельные работы часто приобретаются для интерьеров и в качестве подарков, что расширяет аудиторию.
Масляная живопись занимает второе место — несмотря на более высокую цену, масло по-прежнему ассоциируется с «настоящим искусством» и инвестиционной ценностью. Уголь и графика продаются стабильно, но в меньших объемах, поскольку воспринимаются как более нишевый продукт.
Смешанная техника и акрил показывают низкие продажи, что может говорить о консервативности спроса: покупатели чаще выбирают привычные и легко интерпретируемые материалы, избегая экспериментальных форм.
Столбчатая диаграмма
Для наглядной демонстрации популярности разных материалов и облегчения восприятия данных, были проделаны определенные действие. В этом коде происходит подсчёт количества продаж для каждого вида художественного материала, затем индексы переводятся на русский с помощью словаря для более понятного отображения. Значения количества продаж и их переведённые названия используются для построения столбчатой диаграммы, где по оси X располагаются техники, а по оси Y — число продаж.
График 3
Топ-8 городов США по количеству продаж
График показывает уровень продаж в восьми городах, представлен топовыми по объему продаж.
Монреаль уверенно лидирует, что указывает на развитую локальную арт-среду, активную выставочную деятельность и высокую вовлеченность населения в культурное потребление. Вероятно, рынок там поддерживается как туристическим спросом, так и местными коллекционерами.
Другие города — Ванкувер, Торонто, Нью-Йорк и Майами — показывают сопоставимые, но более низкие значения. Это говорит о высокой конкуренции между художниками и галереями в глобальных мегаполисах.
В целом график демонстрирует, что продажи концентрируются в культурных городах, тогда как небольшие города практически не формируют значимый спрос.
Точечный график
В этом коде происходит анализ и визуализация данных по количеству продаж в разных городах. Сначала создаётся словарь city_translation для перевода названий городов на русский язык, поскольку это облегчает восприятие графика. Затем из датасета берутся 8 городов с наибольшим количеством продаж. Их названия переводятся с помощью словаря. Для визуализации создаётся scatter plot, где по оси X откладывается количество продаж, а по оси Y — названия городов на русском. Цвета точек циклично выбираются из списка GRAPH_COLORS для улучшения визуального восприятия. Цвета и фон графика задаются для единого стиля.
График 4
Популярность сюжетов картин
График показывает количество картин по различным сюжетам.
Пейзажи и портреты стабильно лидируют, так как они универсальны и эмоционально понятны широкой аудитории. Эти сюжеты легко вписываются в интерьер и не требуют специальной подготовки для восприятия.
Абстрактное искусство занимает среднюю позицию: интерес к нему есть, но он ограничен определенной аудиторией. Натюрморты сохраняют умеренную популярность, часто выступая «безопасным выбором» для покупателей.
Исторические и городские сцены имеют наименьший спрос, поскольку они более контекстуальны и сложны для интерпретации, а значит — менее универсальны для массового покупателя.
Площадная диаграмма
В данном коде создаётся визуализация популярности сюжетов картин. Сначала определяется цветовая палитра для графика, включая фон, текст и линии. Подсчитывается количество каждой уникальной категории из столбца 'Subject of Painting' и сортирует данные по убыванию количества появлений каждого сюжета в столбце с данными.
График 5
Средняя цена произведений искусства по сюжетам и стилям
Тепловая карта наглядно показывает, что средняя стоимость произведений искусства существенно зависит от сочетания художественного стиля и сюжета. Наиболее дорогими в целом оказываются работы портретного и натюрмортного жанров, особенно когда они выполнены в концептуальных и выразительных стилях, таких как абстракционизм и кубизм. Это указывает на высокую ценность сложных и индивидуализированных художественных решений.
В то же время более доступные по цене работы чаще встречаются среди пейзажей, фэнтези и изображений животных, особенно в рамках импрессионизма и модерна. Такие сочетания, вероятно, ориентированы на массового покупателя и воспринимаются как более декоративные.
В целом график подтверждает, что цена формируется не только стилем или сюжетом по отдельности, а их комбинацией. Использование тепловой карты позволило наглядно выявить премиальные и массовые сегменты рынка и подчеркнуть роль художественного контекста в формировании стоимости произведений искусства.
Тепловая карта
Для создания тепловой карты в коде отбираются записи только с определёнными сюжетами (например, Абстракция, Фэнтези) и стилями (Кубизм, Модерн и др.). Цены преобразуются в числовой формат, а записи с отсутствующими значениями цен удаляются. Английские названия сюжетов и стилей заменяются на русские для удобства восприятия. Создаётся сводная таблица, в которой рассчитывается средняя цена картин по сочетаниям сюжета и стиля. В результате получается наглядная визуализация, позволяющая легко сравнивать средние цены картин в зависимости от их сюжета и стиля. Это помогает выявлять тенденции и особенности рынка художественных произведений.
График 6
Средняя цена произведений искусства по целевой аудитории
График показывает среднюю цену картин в долларах для разных групп покупателей.
Самую высокую стоимость картины готовы платить коллекционеры и корпоративные клиенты, что связано с профессиональными или инвестиционными интересами. Они ориентируются не только на эстетику, но и на статус художника и потенциал роста стоимости.
Декораторы интерьеров занимают среднюю позицию: для них важен баланс между ценой и визуальным эффектом. Массовая аудитория и онлайн-покупатели демонстрируют самый низкий средний чек, что объясняется ограниченным бюджетом и импульсивным характером покупок. Молодые специалисты и семьи предпочитают более доступные варианты, что отражает их ограниченный бюджет или разные приоритеты.
Линейный график
Этот код выполняет анализ и визуализацию данных по средним ценам произведений искусства для разных целевых аудиторий. Сначала задаётся порядок категорий целевых аудиторий на английском языке для правильной сортировки данных и оформления графика. Затем создаются русские подписи для удобства восприятия. С помощью группировки в DataFrame вычисляется среднее значение цены для каждой целевой аудитории. Полученные данные сортируются согласно заданному порядку, что обеспечивает корректное отображение на оси X. В итоге график позволяет наглядно сравнить средние цены по разным группам покупателей и сделать выводы о рынке.
Вывод
В результате анализа можно сделать вывод, что рынок искусства представляет собой сложную систему, в которой цена формируется под воздействием как количественных факторов, таких как география и логистика, так и качественных характеристик, включая стиль и эмоциональное содержание произведения.
Рынок искусства характеризуется устойчивым спросом и чёткой сегментацией. Основная доля продаж приходится на средний ценовой сегмент, традиционные материалы и понятные сюжеты, такие как пейзажи и портреты. Покупатели в большинстве своём ориентированы на эстетическую универсальность и доступность, а не на радикальные эксперименты. Географически рынок сосредоточен в крупных культурных центрах, при этом уровень цен сильно зависит от региона и целевой аудитории. Наиболее высокие цены формируются в сегменте коллекционеров и корпоративных клиентов, где искусство воспринимается как инвестиция и элемент статуса.
Таким образом, использование графиков позволило не только структурировать данные, но и выявить реальные закономерности рынка онлайн-продаж искусства, подтвердив эффективность визуального анализа как инструмента исследования.
Художникам, работающим на современном арт-рынке, прежде всего стоит ориентироваться на средний ценовой сегмент, поскольку именно он обеспечивает наибольшую стабильность продаж и наиболее широкую аудиторию покупателей. Формирование собственного стиля целесообразно строить вокруг традиционных материалов и визуально понятных сюжетов, таких как пейзажи и портреты, дополняя их более авторскими и экспериментальными работами.
Важно учитывать сегментацию аудитории: для массового покупателя и онлайн-продаж акцент следует делать на эстетическую привлекательность, универсальность и доступную цену, тогда как для коллекционеров и корпоративных клиентов — на концептуальную глубину, ограниченные серии и уникальность работ.
С точки зрения продвижения наибольший потенциал имеют крупные культурные центры и международные онлайн-платформы, где сосредоточен платежеспособный спрос. При этом участие в выставках, коллаборации с галереями и работа над личным брендом повышают доверие к художнику и позволяют со временем увеличивать стоимость работ. Экспериментальные и нишевые проекты целесообразно развивать постепенно, используя их как средство профессионального роста и дифференциации, а не как основной источник дохода.
Описание применения генеративной модели