Команда AVO SERVICES AND TECHNOLOGY создает новый технологичный розничный банк на рынке Узбекистана. Основная концепция сервиса - клиент самостоятельно может получить все услуги банка через мобильное приложение и устройства самообслуживания.
Наш сегодняшний вызов - создать самый продвинутый digital банк в Узбекистане.
Мы ищем Data Scientist с опытом в должности от 5 лет.
Обязанности
- Фичи и Feature Platform: проектировать, разрабатывать и валидировать признаки; обеспечивать их корректную доступность в обучении и на инференсе (offline/online), поддерживать документацию и жизненный цикл фичей.
- Качество фичей: оценивать значимость, устойчивость и влияние признаков (статистика, leakage, drift), оптимизировать существующие и добавлять новые.
- Модели end-to-end: разрабатывать и улучшать ML-модели, проводить эксперименты, валидацию и интерпретацию результатов.
- Шипмент в прод: доводить решение до production-уровня совместно с ML/Engineering: пайплайны, CI/CD, MLOps, мониторинг качества и данных после релиза.
Требования
Feature Platform / Feature Engineering
- Понимает, что такое фича в продуктовой и технической логике: определение, окно агрегации, гранулярность, entity key, правила обновления, offline/online.
- Умеет разрабатывать фичи в платформе/feature store (Feast или аналог): источники данных, материализация, контроль качества, версионирование и повторяемость расчётов.
- Знает типовые риски: data leakage, смещение, дубли, несогласованность ключей, временные сдвиги, корректная работа с time-aware данными.
Моделирование
- Уверенно строит ML-модели на табличных данных: постановка задачи, разметка таргета, валидация (CV/Time-split), подбор метрик, тюнинг.
- Умеет объяснять вклад факторов и принимать решения по фичам/модели на основе данных (importance, SHAP/аналоги, ablation, стабильность по сегментам).
Технический стек: Python + SQL + DWH
- Сильный Python для продакшн-кода: pandas/NumPy, sklearn, CatBoost/LightGBM (или аналоги), аккуратная структура проекта, тестируемость.
- Сильный SQL: сложные join’ы, оконные функции, агрегации, оптимизация запросов; уверенная работа с DWH (Greenplum/PostgreSQL).
- Понимает, как строить воспроизводимые датасеты и расчёты на больших данных (производительность, профилирование, контроль ресурсов).
Production mindset: CI/CD и MLOps
- Понимает полный ML-цикл: подготовка данных → обучение → артефакты → деплой → инференс → мониторинг.
-
Имеет опыт/понимание: Git, CI/CD, контейнеризация (Docker), трекинг экспериментов/артефактов (MLflow или аналог), базовый мониторинг (качество модели, drift, data quality, latency).
Плюсом будет
- Практика в задачах маркетинга/поведения клиентов: churn/retention, uplift/таргетинг, сегментации, LTV, A/B-мышление.
- Опыт продуктовой аналитики и коммуникации: формулировать гипотезы, переводить результат в действие для бизнеса.
Условия работы
- Трудоустройство в соответствии с ТК Республики Узбекистан.
- Оплачиваемый отпуск и больничные.
- Помощь с релокацией для тех, кто захочет переехать в солнечный Ташкент.
- Выдаем технику.
- Высокая конкурентная заработная плата.
- Амбициозный проект, в котором ты будешь играть одну из важнейших ролей.