
В качестве объекта для анализа я выбрала коллекцию произведений искусства из MoMA (Museum of Modern Art), содержащую данные о более чем 130 000 произведений и около 15 000 художников. Меня заинтересовала тема репрезентации женщин в искусстве и дизайне. Целью проекта стало исследование роли женщин в коллекции MoMA: насколько они представлены среди художников, как менялось соотношение полов по годам рождения, в каких художественных направлениях женщины были наиболее активны. Датасет представлен ниже.
Визуализация данных
В зависимости от типа данных я использовала разные виды графиков: столбчатые диаграммы — для отображения количественного распределения, линейные и точечные — для выявления динамики и трендов по годам, круговую диаграмму — для визуализации долей и пропорций, а также комбинированные графики — для акцентирования ключевых наблюдений. В коде для анализа данных я использовала библиотеку: Pandas — для загрузки и обработки табличных данных: фильтрации, объединения таблиц, преобразования типов и выполнения вычислений.

Доля женщин и мужчин среди художников

График отражает гендерное распределение среди художников, представленных в коллекции MoMA. Для его создания я использовала круговую диаграмму, предварительно сгруппировав данные по признаку пола и подсчитав процентное соотношение каждой категории. Затем оформила график с помощью библиотек matplotlibи seaborn, настроив цветовую палитру и подписи. Из визуализации видно, что около 65% художников — мужчины, 14,5% — женщины, а в 20,4% случаев пол не указан. Это подчёркивает недостаточную репрезентацию женщин в коллекции и большое количество неидентифицированных данных.
Динамика женщин-художниц по годам рождения
На этом графике я визуализировала количество женщин-художниц, представленных в коллекции MoMA, в зависимости от года их рождения. Для этого я отфильтровала данные, оставив только женщин, у которых указан год рождения, и подсчитала, сколько художниц родилось в каждый год. Затем построила линейный график с помощью библиотеки matplotlib, добавив цвет и стилизацию с помощью seaborn. Из графика видно, что количество женщин-художниц начинает заметно расти с конца XIX века и достигает пика в середине XX века. Это отражает исторические сдвиги в сторону большей видимости и участия женщин в искусстве, а также возможные институциональные изменения в музейной политике.
Топ-10 стран женщин-художниц
В следующем графике я решила проанализировать географию художниц, представленных в коллекции MoMA. Для этого я отфильтровала данные, оставив только женщин с указанной страной происхождения, после чего сгруппировала данные по странам и выбрала топ-10 по количеству художниц. Затем построила горизонтальную столбчатую диаграмму с помощью seaborn, настроив цветовую палитру и подписи. График показал, что больше всего женщин-художниц в коллекции MoMA представляют США, Великобританию и Германию. Это может отражать как реальное количество художниц в этих странах, так и институциональные приоритеты музея.
Количество произведений женщин-художниц по медиа
На последнем графике я визуализировала, какими медиа чаще всего пользуются женщины-художницы в коллекции MoMA. Для этого я отфильтровала данные по полу, оставив только женщин, а затем сгруппировала произведения по медиуму (media) и подсчитала количество работ в каждой категории. С помощью seaborn я построила столбчатую диаграмму, отсортировав медиумы по убыванию. График показал, что наиболее распространёнными среди женщин-художниц являются такие медиа, как гравюра, фотография и рисунок. Это может указывать на исторически сложившиеся роли и доступность определённых художественных практик для женщин в разные периоды.
Анализ показал, что женщины остаются заметно менее представленными в коллекции MoMA — их доля составляет менее 25%. Основной рост активности приходится на XX век, когда женщины получили больше возможностей для самореализации в искусстве. География художниц сосредоточена преимущественно в США и Великобритании. Среди предпочитаемых медиумов преобладают гравюра, литография, рисунок и фотография — доступные и широко используемые формы художественного выражения.
Описание применения генеративной модели
Для генерации обложки проекта использовала Stable Diffusion XL. Модель: https://huggingface.co/spaces/google/sdxl
Для помощи с написанием кода и в случае ошибок использовала chatgpt и deepsick. Модель: https://chatgpt.com https://chat.deepseek.com