Разрабатывать и поддерживать модели кредитного риска для направления выпуска ЭБГ (PD, anti-fraud) с помощью методов машинного обучения (логистическая регрессия, градиентный бустинг и др.);
Анализировать слабоструктурированные данные в Hadoop;
Создавать новые признаки и применять их в моделях;
Хорошее знание теории вероятностей и математической статистики, методов машинного обучения;
Развитое логическое мышление;
Опыт аналитической работы от 3 лет, в том числе опыт разработки статистических моделей;
Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов;
Знание Python (в частности, библиотек, применяемых для анализа данных: pandas, scikit-learn, xgboost, lightgbm, pyspark и т.п.);
Умение работать с Git;
Навыки и опыт презентации результатов контрагентам;
Опыт с работы с Hadoop (Hive, Impala, Apache Spark);
Желателен опыт работы с юридическими лицами, а также с данными с госзакупок;
Опыт внедрения моделей в промышленную среду;
Владение английским языком на уровне, как минимум, позволяющем свободно читать специализированную литературу.
Условия:
Стабильную работу в одном из крупнейших банков страны
Сильное DS community, большое разнообразие рабочих и внерабочих активностей. telegram: @aaanalytics;
Конкурентную заработную плату, соцпакет;
Условия для роста и развития (в т.ч. конференции, тренинги, внутренние программы развития);
Дружный коллектив единомышленников (все специалисты, занимающиеся машинным обучением объединены одним департаментом для максимально плотного и продуктивного обмена знаниями);
Возможность решать разнообразные прикладные задачи с выводом в промышленную эксплуатацию, возможность существенно влиять на результат (в т.ч. в бизнес-смысле) и способы его достижения (вплоть до внесения изменений в архитектуру);