
ВВЕДЕНИЕ
В современном мире образование рассматривается как фундамент для будущей карьеры человека. В этой работе будут проанализированы факторы (как личные, так и в области образования) и их влияние на карьерный рост.
Цель исследования: Выявить ключевые факторы, влияющие на успеваемость студента и его успешную карьеру, а также дать определенные рекомендации по её улучшению
Актуальность: Исследование факторов, влияющих на успеваемость студентов и их успешную карьеру, важно для улучшения качества образования. Понимание причин низкой или высокой успеваемости помогает преподавателям лучше поддерживать студентов. Сегодня это особенно актуально из-за роста нагрузки и стресса у учащихся. Также важно учитывать влияние семьи, окружения и учебной мотивации. Результаты помогут разработать меры для повышения успеваемости в вузах.
ПОЛУЧЕНИЕ И ОБРАБОТКА ДАННЫХ
Данные для анализа я взяла с портала Kaggle.com, название датасета: education_career_success.csv. Его размер составил 5000 строк и 20 колонок. Каждая колонка отвечает за свою переменную.

Обозначение каждой переменной:
Student_ID: Уникальный идентификатор студента. Age: Возраст студента. Gender: Пол студента (Male, Female, Other). High_School_GPA: Средний балл в старшей школе. SAT_Score: Балл за SAT (стандартизированный тест). University_Ranking: Рейтинг университета. University_GPA: Средний балл в университете. Field_of_Study: Область изучения (например, Computer Science, Arts). Internships_Completed: Количество завершенных стажировок. Projects_Completed: Количество завершенных проектов. Certifications: Количество полученных сертификатов. Soft_Skills_Score: Оценка мягких навыков (например, коммуникация). Networking_Score: Оценка навыков networking (сетевого взаимодействия). Job_Offers: Количество предложений о работе. Starting_Salary: Начальная зарплата после выпуска. Career_Satisfaction: Удовлетворенность карьерой (оценка от 1 до 10). Years_to_Promotion: Количество лет до повышения. Current_Job_Level: Текущий уровень должности (Entry, Mid, Senior, Executive). Work_Life_Balance: Баланс между работой и личной жизнью (оценка от 1 до 10). Entrepreneurship: Участие в предпринимательской деятельности (Yes/No).
После этого я перекодировала некоторые переменные для удобства дальнейшего использования и анализа
В колонке Gender поменяем значение 'Male' на 1, значение 'Female' на 0, значение 'Other' на 2
В колонке Entrepreneurship поменяем значения 'YES' на 1, а 'NO' на 0
В колонке Current Job Level поменяем 'Entry' на 0, 'Mid' на 1, 'Senior' на 2, 'Executive' на 3
ГРАФИКИ
График 1: Зависимость начальной зарплаты от среднего балла в университете
Вывод: GPA оказывает слабое влияние на стартовую зарплату во всех специальностях. Основным фактором, определяющим уровень начального дохода, остаётся область изучения: студенты из Art, Medicine и Computer Science стабильно получают более высокие зарплаты, независимо от GPA. В то время как выпускники Mathematics имеют меньший и менее стабильный доход, даже при высоком среднем балле. Это говорит о том, что рынок труда ценит специальность больше, чем академическую успеваемость.
График 2: Распределение начальной зарплаты по полу
Вывод: График показывает, что медианная зарплата у мужчин, женщин и представителей «других гендеров» примерно одинаковая, но у мужчин больше выбросов с высокими зарплатами.
График 3: Распределение среднего балла в университете по областям изучения
Вывод: График показывает, что в некоторых областях, таких как Mathematics и Engineering, средний балл выше, чем в других, например, в Computer Science. Это может быть связано с более высокой академической нагрузкой или строгостью оценивания в этих областях.
График 4: Зависимость пола от среднего балла SAT
Вывод: График показывает, что нет большой разницы в среднем значении SAT в зависимости от пола.
График 5: Матрица корреляции
Корреляционный анализ для Starting_Salary: На тепловой карте видно, что связь между Starting_Salary и другими переменными очень слабая — коэффициенты корреляции находятся в пределах от ~-0.03 до ~+0.03. Вот несколько ключевых наблюдений: - University_Ranking: +0.021 Незначительно положительная корреляция. Это довольно странно, т. к. логично ожидать, что чем лучше университет (меньше ранг), тем выше зарплата. Но здесь связь почти отсутствует. - University_GPA: -0.0045 Почти нулевая отрицательная корреляция. Получается, высокий GPA сам по себе не гарантирует высокую зарплату. - Internships_Completed: +0.018, Projects_Completed: +0.015, Certifications: +0.018 Эти показатели немного положительно связаны с зарплатой, но связь всё равно очень слабая. То есть, наличие практики или сертификатов не даёт автоматического прироста зарплаты. - Soft_Skills_Score: +0.0049, Networking_Score: +0.0026 Мягкие навыки и нетворкинг тоже не имеют заметного влияния на стартовую зарплату по данным корреляции. - Job_Offers: -0.034 Очень слабая обратная связь. Это скорее индивидуальные случаи, когда человек получает много предложений, но выбирает работу по другим критериям (например, карьерный рост)
Вывод: как показывает корреляционный анализ, ни одна из количественных переменных не демонстрирует заметной связи со стартовой зарплатой. Это подчёркивает, что: - Успех в карьере и уровень зарплаты не зависят строго от формальных показателей — таких как баллы, оценки или даже количество проектов. - Личное стремление, мотивация, адаптивность имеют большее значение. - Нет универсального рецепта: два человека с одинаковым бэкграундом могут иметь совершенно разную зарплату, карьерный путь и удовлетворённость работой — потому что всё зависит от того, как они себя проявят, с кем свяжутся, что выберут. - Даже такие «жёсткие» метрики как GPA или SAT теряют силу вне академической среды, особенно на реальной работе.
ВЫБОР ГРАФИКОВ
1. Линейный график: GPA vs Starting Salary по специальностям Линейный график позволяет отследить динамику стартовой зарплаты в зависимости от университетского GPA внутри каждой специальности. Это удобно для сравнения тенденций между направлениями, даже если данные немного шумные. 2. Boxplot: Начальная зарплата по полу Boxplot идеально подходит для анализа распределения значений и выявления медианы, разброса и выбросов по группам. Это помогает понять, существуют ли систематические различия в зарплате между полами. 3. Boxplot: GPA по специальностям Boxplot здесь даёт визуальное представление о разбросе и медианном уровне GPA среди студентов разных направлений. Он позволяет легко сравнить академическую успеваемость между специальностями. 4. Barplot: Средний SAT Score по полу Столбчатая диаграмма наглядно показывает средние значения SAT для каждой категории пола, что удобно для сравнительного анализа без акцента на выбросы или разброс. Такой тип графика хорошо передаёт общие различия между группами. 5. Heatmap: Матрица корреляций Тепловая карта визуализирует степень взаимосвязи между всеми числовыми переменными, позволяя быстро определить, какие из них связаны между собой.
ИСТОЧНИКИ ИССЛЕДОВАНИЯ, ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ
- Портал Kaggle.com предоставил данные для анализа (https://www.kaggle.com/) - DeepSeek (https://www.deepseek.com/) помог разобраться с основными функциями библиотек для анализа данных в Python: Matplotlib, Seaborn и т. д. - с помощью Leonardo.ai (https://leonardo.ai/) была создана обложка
ССЫЛКА НА БЛОКНОТ С КОДОМ И ДАТАСЕТ
ВЫВОД
Успеваемость студента зависит не от одного конкретного показателя, а от комплекса факторов, включая: - Личную мотивацию, - Умение справляться со стрессом, - Поддержку со стороны семьи и окружения, - Баланс между учёбой и жизнью, - Постоянную вовлечённость в практические и внеучебные активности.
Следовательно, универсальный рецепт для повышения успеваемости — это не только «учиться больше», но и развивать гибкие навыки, заботиться о психоэмоциональном состоянии, работать над самодисциплиной.