Москва, Подсосенский переулок, 23с5
Метро: КурскаяЛидировать команду из 8-10 full-stack/ml-инженеров, проводить code review и архитектурные сессии
Определять архитектуру решения
Выбирать стек open-source моделей (LLM, diffusion, TTS) и способ их версионирования
Проектировать архитектуру надежного, масштабируемого и воспроизводимого ML пайплайна (deterministic → fast preview → final render)
Разрабатывать архитектуру сценарного LLM ядра, агентный планировщик сцен (LLM-to-task graph), модуль «Story Graph ⇄ renderer» с RAG-feedback-loop
Совместно с CTO формировать roadmap, балансировать техдолг
Управлять надежностью и стоимостью решения:
– GPU-budgeting, mixed-precision, batch-ing, stream-ing
– Observability: tracing генераций до исходного prompt/версии модели)
Мы ждем от вас:
Плюсом будет:
Что мы предлагаем:
Удобный формат работы на ваш выбор - офис, гибрид или удаленка
Комфортный офис в 5 минутах пешком от метро Курская/Чкаловкая (Москва)
Медицинскую страховку с 1 месяца, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой
Компенсацию мобильной связи
Участие во внешних IT конференциях и обучающих программах
Полезные курсы и вебинары в корпоративном университете и электронные библиотеки
Единую подписку МТС Premium — KION light в онлайн-кинотеатре KION, сервис МТС Music
Скидки и предложения от партнеров на фитнес, занятия английским и прочее