Алматы, комплекс Нурлы-Тау
Подготовка данных для скоринга: сбор, очистка, EDA, фичеинжиниринг, контроль утечек.
Построение и валидация моделей (LR, XGBoost/LightGBM/CatBoost), настройка гиперпараметров.
Оценка качества и стабильности моделей (ROC-AUC, Gini, KS, OOT, PSI).
Explainability (SHAP), подготовка отчётов, презентаций и model card.
Поддержка моделей в проде: проверки данных, мониторинг метрик, работа с MLOps.
Документация фич и экспериментов, поддержка репозиториев.
0,5–2 года в DS/анализе данных
или сильные учебные/пет-проекты/стажировки.
Технические навыки
Python (pandas, sklearn), Jupyter; базовый ООП, виртуальные окружения.
Табличные модели: LR, LGBM/XGB/CatBoost.
Опыт работы с метриками риска (ROC-AUC, Gini, KS).
SQL: джойны, оконные функции, агрегаты.
Feature engineering, обработка пропусков/выбросов, работа с несбалансированными классами.
Основы статистики: распределения, тесты, доверительные интервалы.
Git и принципы reproducibility.
Будет плюсом
Docker, Airflow/Dagster, Spark.
SHAP, Scorecard, PSI.
Базовые знания кредитных продуктов (PD/LGD/EAD).
Личные качества
Внимательность к данным, аккуратность в коде.
Умение самостоятельно проводить анализ и объяснять результаты.
Готовность работать в кросс-функциональной команде.
EY (Ernst & Young)
Алматы
Не указана
Публичная Компания «Freedom Finance Global PLC»
Алматы
Не указана
Народный банк Казахстана
Алматы
Не указана
Colliers Kazakhstan
Алматы
Не указана