О проекте:
Продажи топливных карт в США (все продажи осуществляются на территории Соединённых Штатов).
Запуск проекта: март 2024 года.
Часть логистической группы: проект является подразделением американской логистической группы грузоперевозок, которая является лидером рынка в Узбекистане.
Компания является зарегистрированным резидентом IT Park и имеет офисы в Ташкенте (два офиса), Чикаго и Орландо.
Цель роли
Основная цель данной позиции — разработать и внедрить набор моделей ценообразования на основе рисков, которые определяют индивидуальные скидки на топливо ($/галлон) для клиентов на основе 20–30 финансовых, поведенческих и отраслевых факторов. Модели должны охватывать новых, существующих и клиентов с риском оттока, с чёткой оценкой бизнес-эффекта.
Основные обязанности:
- Анализ и очистка больших исторических датасетов (2–3 ГБ в формате Excel).
- Разработка и внедрение нескольких моделей ценообразования для разных категорий клиентов.
- Инжиниринг признаков и отбор переменных (20–30 факторов: финансы, поведение, отрасль и т.д.).
- Обучение и калибровка моделей с использованием алгоритмов LightGBM, XGBoost, Logistic Regression.
- Построение интерпретируемых моделей с использованием SHAP, важности признаков и других инструментов объяснимости.
- Разработка методологии оценки бизнес-эффекта (uplift-анализ, анализ чувствительности).
- Подготовка моделей для использования финансовым департаментом и возможной автоматизации через API.
- Документирование гипотез, логики моделей, отбора признаков и интерпретаций.
- Предоставление рекомендаций по внедрению (batch-оценка, интеграция через API, обновление моделей).
- Планирование ежеквартальной перекалибровки и мониторинга моделей.
Требования:
- 3–5+ лет практического опыта в Data Science или прикладном машинном обучении.
- Подтверждённый опыт разработки скоринговых, риск- или ценовых моделей.
- Сильные навыки Python (pandas, scikit-learn, XGBoost/LightGBM).
- Опыт feature engineering и построения объяснимых моделей (например, SHAP).
- Понимание логики ценообразования, механизмов скидок и анализа чувствительности.
- Умение работать с большими Excel-датасетами и извлекать из них инсайты.
- Высокая самостоятельность в управлении полным циклом работы: от анализа до рекомендаций по внедрению.
Будет преимуществом:
- Опыт в fintech, e-commerce или системах динамического ценообразования.
- Опыт внедрения ML-моделей (FastAPI, Docker, MLflow).
- Знание разработки скоринговых карт (scorecard models).
- Опыт работы с инструментами визуализации (Plotly, Streamlit).
Технологии и инструменты:
- Python (pandas, scikit-learn, XGBoost, LightGBM, SHAP)
- Excel, Jupyter, SQL (опционально)
- MLflow, Streamlit (при необходимости)
- FastAPI (для промышленного внедрения при необходимости)
Мы предлагаем:
- Конкурентную оплату труда (обсуждается индивидуально в зависимости от компетенций).
- Прямой доступ к руководству компании — ваши идеи и экспертиза будут востребованы.
- График 5/2 по производственному календарю США (выходные и праздники).
- Рабочее время: 18:00–02:00 (по времени Ташкента).
- Офисная работа в Ташкенте.