Разработчик ML/RL

Разработчик ML/RL

Описание вакансии

На данный момент мы ищем Разработчик ML/RL ​​​​​​​, который будет работать с продуктом «ВкусВилл».​​​​​​​

Обязанности:
  • ​​​​​​​​​​​​​​Разработка и обучение RL-моделей: cоздание и тренировка агентов для решения задач манипуляции (сборка, сортировка, захват, откручивание/закручивание) в симуляции с последующим переносом на реального робота (Sim2Real).
  • Проектирование и построение симуляционных сред: разработка высокодетализированных и физически достоверных сред (Isaac Sim / MuJoCo / PyBullet) для ускоренного обучения и тестирования алгоритмов.
  • Проектирование и реализация end-to-end пайплайнов сбора данных для Imitation Learning (включая Behaviour Cloning и DAgger).
  • Разработка стратегий, инструментов телеоперации и инфраструктуры для записи, хранения, обработки и аугментации демонстраций.
  • Создание представлений состояния (State Representation): разработка методов преобразования сырых данных с сенсоров (камер, тактильных датчиков) в информативные embedding для агента.
  • Исследование и внедрение современных методов: применение таких подходов, как Imitation Learning, Inverse Reinforcement Learning, Diffusion Policies, Transformer-based policies для улучшения данных и ускорения сходимости обучения.
  • Анализ и обеспечение качества данных: постоянный мониторинг покрытия пространства состояний, выявление и устранение bias в данных, итеративное улучшение процесса сбора для повышения эффективности обучения моделей.
  • Разработка и оптимизация архитектур нейросетей: создание эффективных policy и value networks, работающих в режиме реального времени на бортовом компьютере робота.
  • Тесная работа с инженерами-робототехниками: интеграция разработанных ML-моделей в низкоуровневые системы управления (через ROS/ROS 2), анализ сбоев и итеративное улучшение производительности на реальном "железе".
  • Менторство и руководство: лидерство в технических решениях внутри ML-команды, передача знаний, проведение код-ревью, участие в планировании roadmap.

Знание следующего стека технологий:

  • Языки: Python (основной), C++ (для продакшен-оптимизациии интеграции).
  • ML-фреймворки: PyTorch, JAX, TensorFlow.
  • RL-библиотеки: Stable-Baselines3, RLLib, др.
  • Симуляция: NVIDIA Isaac Sim, Mujoco, PyBullet, Drake.
  • Инфраструктура: Docker, Git, MLflow/Weights & Biases, SLURM/Kubernetes для управления вычислениями.
  • Робототехника: ROS/ROS 2, управление роботами-манипуляторами.
  • Данные: инструменты для сбора данных,,телеоп, базы данных для хранения демонстраций.
Требования:
  • ​​​​​​​Практический опыт (от 3+ лет) в разработке и тренировке ML/RL-моделей.
  • Понимание и практический опыт применения Imitation Learning, включая проектирование пайплайнов сбора данных для Behaviour Cloning. Понимание проблем распределенного сдвига (distribution shift) и методов их митигации (например, DAgger).
  • Опыт реализации проектов, по разработке и обучению RL-агента для решения прикладной задачи с ноля.
  • Свободное владение PyTorch.
  • Глубокое понимание архитектур нейронных сетей (CNN, RNN, Transformers).
  • Опыт работы с физическими симуляторами (любой из MuJoCo, PyBullet, Isaac Sim) и понимание и опыт преодоления проблем Sim2Real.
  • Понимание фундаментальных принципов робототехники: кинематика, динамика, проблемы управления.
  • Опыт работы с инструментами теледоперации и создания программного обеспечения для записи демонстраций.
  • Продвинутые навыки Python и инженерии ML-систем (чистый код, тестирование, воспроизводимость, пайплайны обучения).
  • Уверенные математические знания в области теории вероятностей, линейной алгебры и оптимизации.
  • Способность вести исследовательские и инженерные проекты от идеи до внедрения.
Условия:
  • Работу в аккредитованной IT-компании.
  • Удалёнка. Для нас важны результаты работы без привязки к месту.
  • Официальное оформление с первого дня работы.
  • Поддержку куратора во время адаптации.
  • Внутреннее обучение soft & hard skills, создание индивидуального плана развития;
  • Социальная ответственность. Поощряем донорство, оказываем материальную помощь при рождении ребёнка.
  • Компенсируем затраты на любые медицинские услуги или ДМС.
  • Поддержка здорового образа жизни. Компенсация фитнес-абонементов, тренировок.
  • Партнерскую программу «Зелёный свет»: за рекомендации знакомых специалистов можно получить до 50 000 руб.
  • Богатый опыт сплоченной и профессиональной команды.
Навыки
  • Python
  • MLflow
Посмотреть контакты работодателя

Похожие вакансии

Удаленная работа
  • Москва

  • до 470000 RUR

Рекомендуем
Макошь

R&D ML-инженер

Макошь

Удаленная работа
  • Москва

  • до 600000 RUR

Рекомендуем
МИЛТИ
Удаленная работа
  • Москва

  • до 600000 RUR

Рекомендуем
Kodix
Удаленная работа
  • Москва

  • до 200000 RUR

SkillStaff
Удаленная работа
  • Москва

  • до 200000 RUR

Октопустех

ML-инженер

Октопустех

Удаленная работа
  • Москва

  • до 200000 RUR

Звук
Удаленная работа
  • Москва

  • до 200000 RUR

HFLabs
Удаленная работа
  • Москва

  • до 400000 RUR

СИНЕРГИЯ
Удаленная работа
  • Москва

  • до 400000 RUR

Удаленная работа
  • Москва

  • до 400000 RUR

Делимобиль
Удаленная работа
  • Москва

  • до 400000 RUR

Альфа-Банк

ML-инженер

Альфа-Банк

Удаленная работа
  • Москва

  • до 160000 RUR

IT Solutions Management International Pte. Ltd.

ML Engineer

IT Solutions Management International Pte. Ltd.

Удаленная работа
  • Москва

  • до 117000 RUR

Фабрика Решений
Удаленная работа
  • Москва

  • до 380000 RUR

WILDBERRIES
Удаленная работа
  • Москва

  • до 380000 RUR

Excdev
Удаленная работа
  • Москва

  • до 380000 RUR

Богданов Денис Александрович
Удаленная работа
  • Москва

  • до 350000 RUR

ДВ СМАРТ
Удаленная работа
  • Москва

  • до 350000 RUR

STARTRIBE LTD

Lead ML Engineer

STARTRIBE LTD

Удаленная работа
  • Москва

  • до 350000 RUR

The Skolkovo Institute of Science and Technology

Senior ML

The Skolkovo Institute of Science and Technology

Удаленная работа
  • Москва

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию