О проекте
Наша команда разрабатывает интеллектуальные сервисы, автоматизирующие обработку текстов, аудио и другой информации с использованием современных методов обработки естественного языка (NLP) и генеративного ИИ.
В зону нашей ответственности входят задачи извлечения сущностей, структурирования и аннотирования данных, преобразования аудио в текст, а также генерация вспомогательного контента на основе пользовательских и системных запросов.
Вы станете Team Lead группы из 3–5 человек.
Основные обязанности:
Архитектура и техническое руководство
- проектирование модульной архитектуры AI-сервисов: обработка данных, обучение/дообучение моделей, inference-пайплайны
- участие в выборе (совместно с архитекторами) и внедрение фреймворков (PyTorch, TensorFlow, Hugging Face Transformers) и инфраструктуры (ONNX, Triton Inference Server)
- определение стандартов кодирования, review моделей и API, обеспечение качества и воспроизводимости экспериментов
- MLOps & CI/CD для моделей
- Настройка конвейеров подготовки данных, обучения и валидации моделей (MLflow, DVC, Airflow).
- Настройка и поддержка пайплайнов (GitLab CI, GitHub Actions, Jenkins).
- Контейнеризация сервисов (Docker, Docker Compose), оркестрация (Kubernetes).
- Infrastructure as Code (Ansible/Terraform), мониторинг и алертинг (Prometheus, Grafana, ELK Stack).
- Мониторинг качества моделей в продакшене: дрейфт данных, метрики качества, логирование запросов.
- Интеграция и оркестрация моделей (OpenAI/GPT-семейство, LLaMA, BERT, Whisper и др.) внутри микросервисной архитектуры.
Разработка и оптимизация
- создание высокопроизводительных endpoint’ов для inference: асинхронные очереди (RabbitMQ/Kafka), масштабирование
- оптимизация моделей и сервисов: квантование, distillation, предпринятие мер по снижению задержек
- интеграция prompt-инженеринга: разработка, тестирование и хранение промтов, тонкая настройка prompt-шаблонов и вспомогательных подсказок
Управление командой и процессы
- оценка задач, приоритизация в контексте AI-дорожной карты, распределение между разработчиками, ML-инженерами и prompt-инженерами
- проведение stand-up, спринт-планирования, ретроспектив и one-on-one
- Постепенный переход к people management: наставничество, карьерное развитие, формирование сильной междисциплинарной команды
Документация и взаимодействие
- поддержка технической документации: архитектурные схемы, ER-диаграммы, схемы данных, API-гайдлайны (REST/WebSocket/gRPC), схемы ML-конвейеров, описание моделей
- взаимодействие с продуктовой командой, UX/UI-дизайнерами, бизнес-аналитиками, специалистами по безопасности и compliance
Наши ожидания:
Опыт и образование
- опыт разработки ПО ≥ 5 лет, из них Python ≥ 3 лет
- опыт внедрения AI/ML/Deep Learning решений ≥ 2 лет
- опыт в роли ведущего разработчика или архитектора ≥ 1 года; опыт Tech/Team Lead — плюс
- высшее образование в компьютерных науках, прикладной математике, лингвистике или смежных областях — преимущество
Ключевые технические навыки
- Python & ML: уверенное владение, опыт с PyTorch, TensorFlow, Hugging Face Transformers
- NLP & Speech: знакомство с методами токенизации, BERT-подобными моделями, Whisper, Speech-to-Text
- Prompt-инженеринг: создание и оптимизация промтов, A/B-тестирование подсказок, управление версиями промтов
- MLOps: DVC/MLflow, Airflow, Kubernetes, Docker, Helm, CI/CD (GitLab CI, GitHub Actions)
- Data-pipelines: ETL-процессы для сбора и препроцессинга (Pandas, Spark, Apache Beam)
- Inference-оптимизация: ONNX, TensorRT, Triton Inference Server; профилирование и снижение задержек
- API & Microservices: FastAPI, gRPC, REST; опыт проектирования высоконагруженных endpoint’ов
- Monitoring & Observability: Prometheus, Grafana, ELK/EFK, OpenTelemetry
Лидерские и коммуникативные качества
- умение объяснять сложные AI-концепции нетехническим стейкхолдерам
- опыт наставничества ML-инженеров и prompt-инженеров
- способность принимать решения в условиях неопределённости и быстро адаптироваться
- эмпатия, умение разрешать конфликты и мотивировать команду
Личные качества
- проактивность: ищете новые возможности применения AI и предлагаете решения
- самостоятельность: планируете эксперименты и релизы, соблюдая дедлайны
- гибкость: адаптация под новые модели, фреймворки и требования
- открытость в коммуникации, готовность к честному фидбэку и «нетоксичная» атмосфера
Мы готовы предложить:
- льготы аккредитованной IT-компании
- оформление в соответствии с трудовым законодательством РФ
- удаленный формат работы с предоставлением техники
- ДМС, доступ к сервису "Понимаю", подписка на РБК
- гибкие методы управления: мы используем Agile, SCRUM и OKR, чтобы каждый день создавать новое и быстро реагировать на изменения
Если вы хотите строить и развивать AI-сервисы, руководить мультидисциплинарной командой и внедрять инновации — присылайте резюме!