Machine Learning Engineer в команду SDT Pretrain

Navio

Machine Learning Engineer в команду SDT Pretrain

Москва, проспект Андропова, 10А

Метро: Автозаводская

Описание вакансии

О команде и задаче:
Мы создаем технологии беспилотного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а построить «фабрику» по автоматической разметке сложных дорожных ситуаций (Scenario Mining) с использованием современных подходов (LLM, VLM, CV) и масштабировать это решение на весь наш архив данных.

Чем предстоит заниматься:

  • Разработка методов авторазметки: создание новых и адаптация существующих моделей (в т.ч. VLM и LLM) для семантического поиска событий в проездах (например, «найти все нерегулируемые левые повороты с пешеходами»);
  • Пайплайны обработки данных: оборачивание ML-моделей в воспроизводимые пайплайны для массовой обработки исторических и новых данных;
  • Работа с данными: организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.

Что мы ждем от кандидата:

Отличное знание Python, PyTorch, понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги). Нам нужно, чтобы модель «понимала» сцену Fine-tuning;

База по Computer Vision (детектирование, сегментация, трекинг объектов).

MLOps & Engineering (Важно):

  • опыт работы с объектными хранилищами (S3);
  • умение писать эффективный код, который не кладет сеть и сторадж при массовом чтении);
  • работа с данными, опыт обработки больших объёмов данных (pandas, numpy, SQL или аналоги);
  • умение строить ETL/ELT пайплайны;
  • умение работать с SQL, Docker

4. Инструментарий:

  • опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
  • JupyterHub как среда для прототипирования.

Будет плюсом++

  • Опыт в Autonomous Driving: понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
  • Data Engineering: опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для записи и поиска данных, с оркестраторами - Dagster.
Навыки
  • Python
  • PyTorch
  • Transformers
  • LLM
  • VLM
  • Computer Vision
  • S3
  • SQL
  • ETL
  • ELT
  • Docker
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Navio
  • Москва

  • Не указана

Рекомендуем
СИГМА

ML Engineer

СИГМА

  • Москва

  • Не указана

Рекомендуем
Тануки, японский ресторан

Data Scientist / ML Engineer (широкий профиль)

Тануки, японский ресторан

  • Москва

  • до 300000 RUR

Рекомендуем
Леста Игры

AI Engineer

Леста Игры

  • Москва

  • до 300000 RUR

Информтехника

ML-инженер

Информтехника

  • Москва

  • до 300000 RUR

Центральный банк Российской Федерации (Банк России)

Lead ML Engineer (NLP)

Центральный банк Российской Федерации (Банк России)

  • Москва

  • до 300000 RUR

BostonGene Technologies

Generative AI Engineer (Yerevan)

BostonGene Technologies

  • Москва

  • до 300000 RUR

МАГНИТ, Розничная сеть

ML Engineer / Senior Data Scientis

МАГНИТ, Розничная сеть

  • Москва

  • до 300000 RUR

Лучи
  • Москва

  • до 300000 RUR

BostonGene Technologies

LLM Engineer (to Yerevan)

BostonGene Technologies

  • Москва

  • до 300000 RUR

Ростелеком
  • Москва

  • до 300000 RUR

Онлайн-школа Тетрика

ML Engineer

Онлайн-школа Тетрика

  • Москва

  • до 300000 RUR

Азиатско-Тихоокеанский Банк

Инженер по машинному обучению (Блок ИИ)

Азиатско-Тихоокеанский Банк

  • Москва

  • до 300000 RUR

СБЕР
  • Москва

  • до 300000 RUR

HeadHunter
  • Москва

  • до 300000 RUR

BostonGene Technologies

Lead AI Engineer (to Yerevan)

BostonGene Technologies

  • Москва

  • до 300000 RUR

СБЕР
  • Москва

  • до 300000 RUR

СБЕР
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию