NLP Engineer (GigaChat)

NLP Engineer (GigaChat)

Показать контакты

Описание вакансии

Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а работать с реально большими данными, то вот твой шанс :)

Обязанности

чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) → LLM-парсинг + Code Execution Feedback
делать пайплайны для экспериментов (модели 400M – 32B), всё красиво в wandb
фильтровать данные так, чтобы метрики росли
доставать из книг задачи по математике → сиды для синтетики
генерить синтетические данные → на тысячах GPU
разбираться с токенизацией → сколько букв "r" в "strawberry"?
кластеризовать данные → чистим данные от мусора, прежде чем модель начнёт верить в астрологию
писать дедупликацию на Rust → миллиарды документов, но не за O(n²)
оптимизировать MapReduce → Spark, тысячи ядер (опыт с YTsaurus - плюс)
экспериментировать с SFT и RL → DPO, DRPO, увеличиваем качество синтетики.

Требования

выпускник ШАД/ ВШЭ Факультета компьютерных наук/ МФТИ Факультета инноваций и высоких технологий и/или имеешь коммерческий релевантный опыт в роли NLP Engineer от двух лет.

Условия

комфортный современный офис рядом с м. Кутузовская
гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
система обучения для профессионального и карьерного развития
расширенный полис ДМС с первого дня работы и страхование для семьи
льготная программа ипотеки для сотрудников
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.

Посмотреть контакты работодателя

Зарплата
Не указана
Занятость
Полная занятость, Полный день
Опыт работы
От 3 до 6 лет
Дата размещения:
28.08.2025 06:57:00

Похожие вакансии

Senior/Lead NLP/PLP Researcher (GigaCode R&D)

СБЕР

Полный день

Москва
Не указана

Рекомендуем

Senior ML Engineer (TTS Text-to-speech)

СБЕР

Полный день

Москва
Не указана

Рекомендуем

Middle Research Engineer

СБЕР

Полный день

Москва
Не указана

Рекомендуем

Research Engineer (Kandinsky)

СБЕР

Полный день

Москва
Не указана

Senior NLP Engineer (Центр практического искусственного интеллекта)

СБЕР

Полный день

Москва
Не указана

Effective-DL Engineer (GigaChat)

СБЕР

Полный день

Москва
Не указана

NLP Engineer

Атом

Полный день

Москва
Не указана

NLP Engineer (Gigaсhat)

СБЕР

Полный день

Москва
Не указана

Senior Deep Learning Engineer в Recsys Lab

WILDBERRIES

Полный день

Москва
Не указана

Junior NLP-engineer (RnD для B2C)

СБЕР

Полный день

Москва
Не указана

Senior Deep Learning Engineer (GigaChat Prod)

СБЕР

Полный день

Москва
Не указана

Middle ML Engineer (Computer Vision & NLP, Python / Golang, on-premise)

Anykey

Полный день

Москва
от 350000 RUR

Middle ML Engineer (Computer Operator)

СБЕР

Полный день

Москва
от 350000 RUR

Data Scientist NLP (AI-Агенты)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Удаленная работа

Москва
от 350000 RUR

AI инженер (создание и внедрение AI-агентов)

СБЕР

Полный день

Москва
от 350000 RUR

Senior CUDA Engineer (Kandinsky)

СБЕР

Полный день

Москва
от 350000 RUR

ML Engineer (recommendations)

Звук

Удаленная работа

Москва
от 350000 RUR

Senior/Lead ML Engineer [CICADA8]

МТС

Полный день

Москва
от 350000 RUR

MLOps инженер

HeadHunter

Удаленная работа

Москва
от 350000 RUR

LLM Engineer \ ML инженер

CoIT

Полный день

Москва
до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.

Оставить вакансию