Разработка и обучение ML-моделей (классификация, регрессия, сегментация, прогнозирование).
Применение и доработка готовых LLM (Large Language Models) для задач автоматизации бизнес-процессов (например, обработка обращений, генерация текстов, поддержка рекомендаций).
Интеграция ML- и LLM-моделей в бизнес-процессы компании (рекомендательные системы, динамическое ценообразование, персонализация коммуникаций).
Проектирование feature engineering и формирование экспериментальных витрин (на основе Gold/Platinum слоёв, совместно с Data Engineers)
Валидация моделей, A/B тестирование, мониторинг качества моделей в production.
Визуализация результатов, подготовка аналитических выводов для бизнеса.
Взаимодействие с Data Engineers для построения стабильных пайплайнов обучения и inference (Airflow, Spark).
Подготовка технической документации по моделям и их интеграции.
Требования:
Опыт работы Data Scientist от 3 лет, успешный опыт внедрения ML-моделей в production.
Глубокое знание Python и основных ML-библиотек (scikit-learn, XGBoost, LightGBM, PyTorch/TensorFlow).
Опыт работы с большими данными (Spark, SQL, ClickHouse, GreenPlum).
Практический опыт применения LLM (Transformers, OpenAI API, LLaMA и др.).
Навыки построения и автоматизации пайплайнов обучения и предсказаний.
Опыт проведения A/B тестов и оценки бизнес-эффекта от ML/LLM решений.
Умение разрабатывать и документировать архитектуру моделей.
Знание принципов feature engineering и построения дата-витрин.
Будет плюсом:
Опыт интеграции LLM в интерфейсы и бизнес-процессы (чат-боты, контент-генерация, автоматическая аналитика).
Знание ML Ops практик (CI/CD для моделей, мониторинг, откаты версий).
Опыт работы с объектными хранилищами (S3, MinIO), знание форматов Parquet/ORC.