ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее.
Ждем именно тебя!
Мы - Команда SberAds - создаем предиктивные модели и высоконагруженные сервисы по их применению для показа рекламы в интернете. Все модели используются в real-time аукционах на показ рекламы:
* начиная с того, чтобы идентифицировать пользователя
* потом оценив, стоит ли участвовать в запросе на показ рекламы
* затем определяя интересы пользователя
* далее выбирая релевантные объявления для показа
* и наконец определяя с какой рекламой и с какой ставкой мы идем участвовать в аукционе.
Команда напрямую влияет на качество показываемой рекламы, удовлетворенность рекламодателей и эффективность SberAds.
Ищем Middle Data Scientist
Наш стек: Python, Go, S3, Spark, Hive, Airflow, MLFlow, Kafka, ClickHouse.
* строить/улучшать модели для разных частей всего пайплайна;
* заниматься полным циклом DS/ML задач;
* участвовать в создании и развитии платформы рекламы;
* улучшать процесс построения моделей (от выдвижения гипотез до мониторинга работы модели).
Примеры задач:
* Построить эмбеддинги на основе описания рекламных объявлений. Добавить эти данные в модели прогнозирования конверсии;
* Обучить модель для прогнозирования распределения ставок в аукционах. Совместить модель с текущим алгоритмом определения ставки;
* Ппровести эксперименты с новыми офлайн/онлайн признаками в моделях. Доставить признаки до сервиса на Go (тут если что помогут коллеги);
* Внедрить модель, которая фильтрует подозрительный входящий трафик.
* знание классического ML и Deep Learning подходов
* понимание основных методов RecSys;
* уверенный опыт разработки на Python, в том числе знание библиотек pandas, numpy, sklearn, torch, catboost/xgboost/lightgbm;
* умение принимать решения на основании данных и аргументировать свою позицию;
* понимание принципов распределенной обработки данных, опыт работы со Spark;
* умеете выходить за рамки jupyter ноутбука и не боитесь писать подакшн-код (git, pytest, airflow).
Будет плюсом:
* опыт решения задач ранжирования, поиска или RTB;
* опыт разработки на Go;
* успешный опыт на kaggle.