Original size 1140x1600

Анализ данных о взаимоотношениях на работе

PROTECT STATUS: not protected

1. Описание проекта

Введение

Рабочие взаимоотношения и общение с коллективом — ключевой аспект в продуктивном выстраивании общих трудовых процессов и получении эффективного результата.

Выпускники и студенты — как наиболее уязвимая категория людей, начинающих выстраивать карьеру — часто сталкивается со множеством неприятных факторов на рабочем месте: дискриминация по половому, возрастному и расовому признакам, домогательства, ущемление, намеренное занижение оплаты труда и обман.

Данные опасения чаще всего небезосновательны: личный опыт трудоустройства, громкие новости и заявления, обвинения разного рода в различных медиа, частные расследования дают понять, что данная проблема шире, чем кажется.

В связи с этим я решила провести подробный анализ того, как в действительности выстроены взаимоотношения коллег друг с другом и с руководством в других странах.

В основе исследования я взяла три датасета из Евростата, в которых отражены сравнительные показатели по возрасту, полу и региону.

Одна из доступных баз данных представляет статистику на предмет психологического и сексуализированного насилия по отношению к работникам. Я решила включить эти сведения для более глубокого анализа поставленного вопроса.

Таким образом, посредством трех датасетов я смогу выявить масштаб проблематики и понять, среди каких групп населения и регионов данная тема проявляется наиболее остро и по какой причине.

К сожалению, доступные данные отражают сравнительно давний период — с 2006 по 2015 года. Мировая практика такова, что исследования, связанные с дискриминацией и разным опытом насилия, актуализируются нечасто.

Тем не менее, даже на этом этапе длиною почти в 10 лет можно проследить некоторые закономерности, которые, как правило, редко претерпевают значительные изменения спустя время.

2. Предварительный этап: оформление данных

Оформление графиков и поиск стиля

Для визуальной эстетики я сгенерировала несколько изображений в Recraft на офисную тему в яркой палитре, которая подчеркивает эмоциональнй характер любых взаимоотношений.

Данные цвета стали основой в колористическом оформлении графиков и фотографий, благодаря чему представленный анализ данных выглядит стилистически единым.

В качестве основного шрифта для графиков и фрагментов кода я использовала строгий, но стильный JetBrains Mono.

Original size 1000x330

Промт для обложки в Chat GPT для Recraft:

A stylish modern office interior with three women of European appearance talking on the phone and smiling. Bright, vibrant color tones dominate the scene with a strong red accent in the environment or accessories. Soft natural lighting, clean contemporary design, dynamic yet friendly atmosphere, detailed textures, and a professional look.

На основе полученного изображения через Adobe Color я сделала основную палитру для дальнейших генераций и визуализации графиков.

Промты для изображений в Chat GPT:

Слева: Close-up shot of a hand picking up a telephone receiver, with the soft silhouette of a woman in the background. Maintain the exact same muted, industrial-style color palette as in the reference image — warm, subdued tones, soft contrast, atmospheric lighting, realistic textures, and shallow depth of field.

Справа: A highly detailed modern office interior with exposed industrial pipes along the ceiling, scattered documents and papers on desks, multiple computer workstations with glowing screens, office supplies, cables, shelves with folders, soft ambient lighting, realistic textures, high-resolution, professional environment, slight clutter for realism.

В ходе анализа данных наиболее подходящими видами графиков для результатов я нашла следующие 4 вида:

Гистограммы Круговые диаграммы Линейные графики Столбчатые диаграммы

Также для удобства и дальнейшего описания работы в проекте я оставила короткие комментарии возле некоторых строк кода с пояснением действий.

Данные ремарки помогают мне и читателю легко соотнести текстовую часть с нужной частью кода, а также проследить логику действий.

3. Обработка данных

3. 1 Импорт библиотек. Общие настройки

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration of a modern office interior. Several young women standing together, holding papers and documents, casually talking to each other. Calm, professional atmosphere, natural interaction, teamwork and communication. Clean workspace, minimalist furniture, soft lighting.

Первыйм этапом я импортировала и разархивировала нужный шрифт, чтобы дальнейшие графики были в едином визуальном стиле с кодом.

Original size 2852x925

Далее я импортировала необходимые библиотеки (numpy, matplotlib.pyplot, pandas) и задала им пути к данным из датасетов, где каждый индификатор отвечает за конкретный файл:

7А1 — Хорошие отношения с коллегами 7А2 — Хорошие отношения с начальством 7А3 — Подверженность одному из видов насилия

Также в перечень библиотек внесла matplotlib.font_manager, чтобы установить выбранный шрифт для последующего использования в коде.

Также обозначила в коде цветовую палитру для дальнейшей визуализации. Для удобства чтения графиков каждый цвет соотвествует полу, возрасту или другим отдельным параметрам.

Original size 1893x1423

Поскольку данные представлены с сайта Евростата, для удобства чтения графиков я переименовала обозначение возраста на русский язык. Теперь все диаграммы будут с понятными обозначениями на одном языке.

Исключение составляют рейтинги стран.

Original size 1415x343

3.2 Загрузка данных и сортировка

Далее я применила функцию для загрузки данных из файлов и преобразовала их в tidy-формат. Таким образом, метаданные исходного датасета с нужными параметрами высвечиваются в одной строке.

После — переименовала первую колонку для удобства чтения данных, разделила ее для возможности группировки по конкретному параметру и наконец — объединила с основной таблицей.

Теперь каждая строка определяет пол, возраст и страну респондента.

Original size 1781x751

3.3 Очистка значений

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration, close-up view. Feminine hands with neatly painted nails typing on a laptop keyboard. Elegant, professional mood, soft and confident gesture. A green indoor plant placed next to the laptop, adding freshness and balance to the composition.

Я заметила, что в датасете встречаются отсутствующие значения в виде пустых ячеек или знаков «:», спецсимволы (или флаги качества) и текст вместо чисел. Чтобы графики отображались с корректной информацией, лишние данные необходимо устранить.

Поэтому я применила функцию очистки сlean_value с соотвестствущей заменой значений. Например, теперь флаги качества заменяются только на числа.

Original size 1781x751

Также видим, что в исходном файле годы представлены колонками, а не строками. Соотвественно — необходимо писать новый код для каждой колонки.

Чтобы упростить фильтрацию и агрегацию, преобразовываем первоначальный формат wide в tidy.

Для удобства я также использовала форматы int и indicator, чтобы преобразовать год в целое число и объединить несколько файлов соотвественно.

Original size 1781x559

3.4 Объединение параметров и фильтр данных

Объединяем все три датасета в один датафрейм и фильтруем исходные данные по трем ключевым параметрам: пол, год и проценты.

Original size 1743x1038

Линейные графики

Первоначально я поставила задачу идти от более широких данных к более конкретным.

Линейные диаграммы демонстрируют, как выглядит общая картина мира по каждому из трех датасетов.

В итоге я отразила средние значения по трем категориям среди наиболее активного трудоустроенного возраста, который был представлен в датасете — от 15 до 24 лет.

Original size 1743x1327
Original size 889x489

Так, вполне предсказуемой становится результат относительно подверженности насилия по полу: доля женщин среди жертв значительно выше, чем среди мужчин.

Диаграмма демонстрирует, что в период с 2010 по 2015 год доля пострадавших женщин увеличилась почти на 43%, тогда как среди мужчин этот показатель снизился на 18%.

Данный перевес во многом связан с их большей социальной и профессиональной уязвимостью, а также с повышенными рисками в сферах с высокой социальной нагрузкой.

При этом стоит учитывать, что мужчины значительно реже сообщают о фактах или попытках насилия в их сторону, что может занижать статистические данные.

Original size 889x489

Неожиданными стали результаты, связанные со взаимоотношениями между коллегами.

На протяжение всего исследуемого периода у мужчин и женщин наблюдается похожая динамика в данном показателе: с 2006 до 2010 года фиксриуется его снижение, более ощутимое у мужчин (с 80, 8% до 77, 8%) и почти незаметное у женщин (c 79% до 78,4%). Однако после 2010 года показатели начинают возрастать по обеим осям: у мужчин — на 3,3%, у женщин — на 6,3%.

Я решила изучить этот вопрос с помощью других текстовых источников: выяснить причину спада в 2010 году и последующего роста показателей. И я нашла закономерность.

Экономический кризис в 2008 и 2009 годах привел к росту стресса и усиленной конкуренции между сотрудниками из-за угрозы сокращения или увольнения. Как итог — происходят резкие ухудшения в коммуникации между сотрудниками: снижается уровень доверия друг к другу, взаимовыручки, обостряются конфликты.

Учитывая, что респондентами выступают молодые специалисты, выстраивающие карьеру, данная реакция на мировую ситуацию вполне обоснована.

С 2010 года по мере стабилизации экономики обстановка в коллективе налаживается: в условиях большей стабильности коллеги учатся уважению и слаженной работе.

Original size 889x489

Данные графика также подтвердили мои ожидания.

Доля женщин по данному показателю почти неизменна: за период с 2006 года по 2014 год прирост составил лишь 0,1%. В то же время процент мужчин выделяется нестабильностью значений: до 2010 года заметно снижение на 1,8%, а после обозначенного года — прирост на 3,3%.

Женщины в профессиональной среде, как правило, демонстрируют более предсказуемое и сдержанное поведение, что способствует стабильным взаимоотношениям с руководством. Особенно в кризисный период, когда женщины-сотрудники стараются сохранить свое место.

Мужчины же в условиях повышенного давления со стороны руководства (как правило — в кризисное время) чаще сталкиваются с конфликтами.

Это же обоснование валидно и в отношении к предыдушему графику о взаимоотношениях с коллегами.

Столбчатые диаграммы

При дальнейшем исследовании я решила затронуть последний исследуемый год — 2015 и сравнить те же категории, взяв за основу возраст и пол.

Таким образом, я смогу понять, как данная ситуация отражается не только на гендерном, но и на возрастном уровне.

В качестве индикатора изменений я взяла разность между полами (F — M). На графиках она обозначена дельтой.

В данном разделе анализа я представила данные с помощью столбчатых диаграмм: на них сравнение двух параметров и понимание различий между показателями выглядит максимально наглядным.

Original size 2503x991
Original size 2437x1423
Original size 989x489

Наибольший разрыв показателей в подверженности насилию наблюдается у самой молодой и социально-уязвимой возрастной группы — от 15 до 24 лет — и составляет 3,7 процентных пункта (п.п.)

Это указывает на значительное влияние факторов физической силы и психологического давления в отношении одной из сторон.

По мере взросления данный разрыв сокращается. С возрастом и накоплением социального опыта усиливаются позиции каждой из сторон: расширяется доступ к ресурсам, укрепляется социальный статус и повышается способность защитить себя, свои интересы.

Данные условия снижают степень уязвимости даже среди женщин и способствуют более равномерному распределению показателей между группами.

Именно поэтому колебание показателей у более старших групп по сравнению с самой молодой незначительное — от 1,7 до 1,1 п. п.

Original size 989x489

В данной категории наблюдается более позитивная статистика: с возрастом вероятность конфликтов сводится практически к нулю и ниже (точнее — от 0,3 до -0,1 п. п.).

На ранних этапах профессионального пути значительная разница показателей (2.2 п. п.), вероятно, связана с конкуренцией за карьерный рост, повышение или иные социальные блага.

Original size 989x489

В данном разделе сохраняется относительное преимущество женской доли во взаимоотношениях с руководством.

Разность показателей по мере возраста незначительно уменьшается (с 2.1 до 1.8 п. п.), но в общем виде остается стабильной.

Согласно вышеописанному предположению, данная корреляция обоснована более «социально ожидаемому» поведению женщин по сравнению с мужчинами.

Original size 1024x1280

Промт для Chat GPT: Office core aesthetic illustration, close-up view. A man’s hand in a classic business suit gently holding a woman’s hand while passing her a pen. Subtle professional interaction, calm and respectful gesture, collaboration and trust in a corporate environment. Focus on hands and details, soft natural movement, elegant composition.

Круговые диаграммы

Особый интерес у меня вызвали данные по подверженности насилию. Если неудачные отношения с коллективом или руководством еще можно пережить, то случаи психологического давления или домогательств в той или иной форме являются недопустимыми.

На небольших выборках категорий круговые диаграммы наглядно отражают доли в процентах: даже без чтения точных чисел можно увидеть различия и сравнить показатели.

К сожалению, представленные датасеты не позволяют различить каждый из видов насилия. Зато нам доступна статистика по полу и возрасту, которая позволяет провести анализ.

Original size 2236x1903

На основе данных двух диаграмм можно подтвердить, что среди женщин самая молодая группа остается наиболее уязвимой, где доля пострадавших составляет 30%. С возрастом этот показатель постепенно снижается: к периоду от 55 до 64 лет он составляет 19%.

У мужчин, напротив, большая часть пострадавших сосредоточена в категории от 25 до 64 лет (29%), а в группе от 15 до 64 лет доля пострадавших ниже — 27%.

Почему у мужчин сменилась категория с наиболее уязвимой группой?

Во-первых, более молодые мужчины значительно реже сообщают о случаях насилия из-за страха осуждения, потери работы или высокого социального положения (которое традиционно закрепляется за мужчинами).

Во-вторых, по другим данным из Евростата и OECD женщины чаще мужчин вовремя заканчивают высшее образование, что позволяет им раньше вступать в рабочие должности и, следовательно, раньше подвергаться социальным рискам, связанным с насилием.

Гистограммы

В последнем разделе я проанализировала, в каких странах за 2015 год уровень подверженности насилию на рабочем месте был наибольшим и наименьшим.

Для итоговой визуализации я выбрала гистограммы, которые позволяют наглядно сравнивать и прослеживать распределение значений от максимального к минимальному.

Чтобы графики оставались понятными и неперегруженными, я сузила круг параметров. В анализ были включены гендер и наиболее уязвимая возрастная группа среди респондентов — от 15 до 24 лет.

Также в датасете был обнаружен агрегат «ЕС», который уже подразумевает среднее значение по всем странам ЕвроСоюза.

Чтобы избежать серьезных искажений в итоговых графиках, исключаем агрегат и оставляем расчет среднего значения только по отдельным странам.

Original size 2503x2191

Сравнивая данные, мы видим, что наибольшая доля мужчин, подвергшихся насилию, приходится на Бельгию (13,8%), Грецию (13,3%) и Румынию (13%). В этих странах мужчины часто задействованы в производстве и в транспортной сфере, где возможны конфликты с коллегами, руководством или клиентами.

Кроме того, статистика может отражать развитие корпоративной культуры. Например, в Бельгии и в Нидерландах мужчины чаще фиксируют случаи насилия, что влияет на итоговую картину данных.

Среди стран с наименьшей долей пострадавших — отдельные страны Средиземноморья (Кипр, Хорватия, Португалия, Италия) и страны Центральной Европы (Германия, Чехия и Венгрия).

В Центральном районе мужчины в основном заняты в административной, финансовой и IT-сферах, где меньше физического контакта и, следовательно, низкий риск насилия.

Стоит заметить, что развитие в некоторых странах корпоративной этики, внедрение системы жалоб и иных мер способствует снижению агресии и предотвращает потенциальные инциденты.

У женщин наибольшая доля пострадавших приходится на следующие страны: Люксембург (27%), Швеция (22%), Великбритания (17%) и Литва (16%). В этих странах женщины чаще работают в отраслях здравоохранения, медицины и социальной работы, что повышает социальные риски.

Помимо этого, в странах с развитой системой государственной поддержки, как, например, в Великобритании и Швеции, женщины чаще сообщают о случаях домогательств, что также отражается в статистике.

Среди стран с минимальной подверженностью насилию выделяются Эстония, Финляндия в Северной Европе, а также Словакия, Польша, Венгрия в Центральной части.

В этих странах женщины тоже отдают предпочтение офисной работе, где выстроена лояльная корпоративная этика, или в сферах производства со строгими корпоративными нормами.

Однако в Финляндии и в Эстонии как женщины, так и мужчины реже открыто заявляют о случах агрессии, что может исказить статистику.

Заключение

В ходе проведенного анализа большинство моих предположений и личных ожиданий оправдались: несмотря на социальные изменения, пооисходившие за последние 10 — 15 лет, распределение показателей по различным категориям остается практически неизменным, что определяет выявленные результаты как устойчиво закономерные или социально принятые.

Женщины в целом показывают себя как более спокойные и, вероятно, терпеливые сотрудники, что отражается на их высоких показателях во взаимоотношениях с начальством. Наравне с этим на женскую часть приходится и значительный перевес по приверженности насилию.

Мужчины, в свою очередь, чаще вступают в конфликты с руководством и острее реагируют на кризисные моменты, однако в условиях стабильной среды чувствуют себя уверенно и безопасно.

Также я выяснила, что большая часть женщин и мужчин подвергается насилию в сферах с высокими социальными контактами: конфликты с клиентами или коллективом могут приводить к агресссии и неприятным ситуациям. Тогда как государственный сектор считается наиболее безопасным благодаря корпоративным нормам и более систематизированной работе.

Общим фактором для всех категорий стал возраст: наиболее молодые респонденты в силу недостатка ресурсов и опыта становятся самой уязвимой группой людей среди всех участников исследования.

Описание применения генеративной модели

Chat GPT: 1. Оформление промтов для генерации стилистических изображений 2. Оформление инструкций по внедрению конкретных функций и улучшению кода 3. Проверка фактических данных из промежуточных результатов визуального анализа

Recraft: 1. Генерация стилистически единых изображений

Adobe Color: 1. Составление цветовой палитры на основе генеративного фото.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more