Data Scientist в команду SDT Pretrain

Navio

Data Scientist в команду SDT Pretrain

Москва, проспект Андропова, 10А

Метро: Автозаводская

Описание вакансии

Мы создаем технологии автономного вождения. У нас накоплены петабайты данных с проездов, которые нужно превратить в полезный датасет для обучения. Твоя задача — не просто сидеть в Jupyter, а провести анализ и реализовать пайплайны для тегирования сложных дорожных ситуаций.

Чем предстоит заниматься:

  • Разработка пайплайнов и эвристик: разработка пайплайнов с использованием методов математической статистики, ML/DL, CV, LLM/VLM и программирования (Python, SQL) для тегирования данных;
  • Пайплайны обработки данных: Оборачивание разработанных алгоритмов обработки в воспроизводимые пайплайны для массовой обработки исторических и новых данных (Dagster);
  • Работа с данными: Организация эффективного чтения/записи результатов в S3, версионирование экспериментов и датасетов через ClearML.

Что мы ждем от кандидата:

Python & ML Core & CV:

  • Отличное знание Python, PyTorch;
  • База по Computer Vision (детектирование, сегментация, трекинг объектов).

Работа с данными:

  • Опыт обработки больших объёмов данных: pandas, numpy, Scikit-learn, XGBoost, SQL или аналоги;
  • Опыт использования библиотек визуализации (Matplotlib, Seaborn);
  • Умение работать с Docker.

Инструментарий:

  • Опыт работы с системами трекинга экспериментов (ClearML / MLFlow);
  • Опыт работы с оркестраторами: Dagster;
  • JupyterHub, как среда для прототипирования.

Будет плюсом:

  • ML: Понимание архитектур трансформеров и опыт работы с LLM / VLM (CLIP, LLaVA, GPT-4V API или open-source аналоги);
  • Опыт в Autonomous Driving: Понимание сенсорики (Lidar, Radar, Camera) и специфики данных (rosbag, pcap и т.д.);
  • Data Engineering: Опыт работы с Spark для препроцессинга данных, ClickHouse/Metabase для поиска и записи данных.
Навыки
  • Python
  • PyTorch
  • Jupyter Notebook
  • Clickhouse
  • Computer Vision
  • pandas
  • Numpy
  • Scikit-learn
  • XGBoost
  • SQL
  • Docker
  • ClearML
  • MLflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

ЛАНИТ

Data Scientist

ЛАНИТ

  • Москва

  • Не указана

Рекомендуем
Леста Игры

Data Scientist

Леста Игры

  • Москва

  • Не указана

Рекомендуем
Институт искусственного интеллекта AIRI

Исследователь (Research Scientist) в области RL

Институт искусственного интеллекта AIRI

  • Москва

  • Не указана

Рекомендуем
Домклик
  • Москва

  • Не указана

МКК ДеньгиОК

Senior Data Scientist

МКК ДеньгиОК

  • Москва

  • Не указана

Лучи
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

ML Engineer / Senior Data Scientis

МАГНИТ, Розничная сеть

  • Москва

  • Не указана

СВОЙ
  • Москва

  • Не указана

ТЕКОН-Инжиниринг

Data Scientist

ТЕКОН-Инжиниринг

  • Москва

  • Не указана

Сбер Бизнес Софт

Data Science / ML Engineer / NLP Engineer

Сбер Бизнес Софт

  • Москва

  • до 459000 RUR

ФАЙВДЖЕН

Data Engineer (CV)

ФАЙВДЖЕН

  • Москва

  • от 100000 RUR

МАГНИТ, Розничная сеть

Team Lead ML / Data Science

МАГНИТ, Розничная сеть

  • Москва

  • от 100000 RUR

АО «ОТП Банк» (JSC «OTP Bank»)

Junior / Middle Analyst / ML Scientist (Risk Collection)

АО «ОТП Банк» (JSC «OTP Bank»)

  • Москва

  • от 100000 RUR

Navio
  • Москва

  • от 100000 RUR

Московская Биржа

Data аналитик

Московская Биржа

  • Москва

  • от 100000 RUR

ТехВилл
  • Москва

  • от 100000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию