
Я выбрал датасет с сайта Kaggle. В датасете находятся данные по иностранным компаниям в России и их статусу, ушли ли они из России или остались.
Мне было интересно проанализировать состояние рынка сегодня и какой состав ушедших компаний на самом деле.
Для визуализации я выбрал гистограммы и стековые гистограммы.
Этапы работы
Сначала я изучил сам датасет. Там были следующие виды данных: - название компании - деятельность компании (свернули бизнес, остались, продали и т. д.) - категория по шкале университета Йеля - код страны - название страны - индустрия, в которой работает компания
Затем я писал промпты в нейросеть ChatGPT для обработки данных: - распределение компаний по категориям YaleGrade - топ-10 стран с наибольшим количеством компаний - распределение компаний по индустриям - сравнение количества компаний, ушедших из РФ и оставшихся
Пример визуализации:
plt.figure (figsize=(12, 8)) data['country'].value_counts ().plot (kind='bar', color='teal', edgecolor='black') plt.title ('Распределение компаний по странам', fontsize=14) plt.xlabel ('Страна', fontsize=12) plt.ylabel ('Количество компаний', fontsize=12) plt.xticks (rotation=90) plt.tight_layout () plt.show ()


Описание применения генеративной модели
Использовалась модель ChatGPT для генерирования Python кода обработки и визуализации данных.
Использовалась модель Kandinsky для генерирования обложки