NLP Engineer со знанием Reinforcement Learning

СБЕР

NLP Engineer со знанием Reinforcement Learning

Описание вакансии

Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.

Направления

Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов.

Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей.

Улучшение продукта Deep Research

На эти роли мы ищем талантливого NLP Engineer со знанием и опытом в Reinforcement Learning. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • Улучшать качество работы GigaChat Reasoning на русском и английском языках
  • Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг.
  • Тестировать новые Loss-функции и подходы к обучению
  • Помогать выводить в прод всё, что мы обучим.
  • Постоянно держаться up-to-date со свежими статьями.

Требования

  • Опыт в online RL и хорошие теоретические знания
  • Уверенное владение Python, PyTorch.
  • Знание базовых алгоритмов и математики.
  • Знания в DL, опыт обучения простых и больших моделей.
  • Опыт обучения моделей для продакшена.
  • Понимание текущего состояния эволюции больших LLM'ов.
  • Будет плюсом наличие публикаций.

Условия

* Удалённо.

* Возможность оформления в акктеритованную IT-компанию.

* Годовая премия по итогам работы до 6 окладов.

* Регулярный пересмотр зарплат.

* Корпоративный спортзал и зоны отдыха.

* Более 400 программ СберУниверситета для роста.

* Программа адаптации и помощь руководителя на старте.

* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.

* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.

* Ипотека для сотрудников по дисконтной программе.

* СберПрайм+ и скидки у партнёров.

* Бонус за рекомендации в команду.

Посмотреть контакты работодателя

Похожие вакансии

СБЕР
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Программный Продукт, ИТ-компания

ML-инженер / NLP-специалист

Программный Продукт, ИТ-компания

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
2ГИС
Удаленная работа
  • Москва

  • Не указана

Innovative People

Senior ML Engineer (RecSys)

Innovative People

Удаленная работа
  • Москва

  • Не указана

СБЕР
Удаленная работа
  • Москва

  • Не указана

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Tech Lead NLP

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Удаленная работа
  • Москва

  • Не указана

БУРГЕР КИНГ РОССИЯ
Удаленная работа
  • Москва

  • Не указана

Ростелеком Информационные Технологии

Data Scientist NLP

Ростелеком Информационные Технологии

Удаленная работа
  • Москва

  • Не указана

Октопустех
Удаленная работа
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

ML инженер

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

Senior NLP инженер

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • Не указана

Ингосстрах
Удаленная работа
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

Senior ML Engineer

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • Не указана

AdSensor
Удаленная работа
  • Москва

  • Не указана

NLP Data Scientist Преподаватель NLP/LLM

Низов Александр Сергеевич

Удаленная работа
  • Москва

  • Не указана

ML-инженер (видеохостинг, highload)

NM TEAM SOCIAL MEDIA APPLICATIONS DEVELOPMENT & MANAGEMENT CO. L.L.C

Удаленная работа
  • Москва

  • от 350000 RUR

Синхро
Удаленная работа
  • Москва

  • от 350000 RUR

Рафт Диджитал Солюшенс

AI инженер (английский язык)

Рафт Диджитал Солюшенс

Удаленная работа
  • Москва

  • от 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию