Lead Backend Developer (команда GigaChat Pretrain)

SberTech

Lead Backend Developer (команда GigaChat Pretrain)

Описание вакансии

Мы в GigaChat делаем core-технологию генеративной языковой модели: она пишет тексты, генерирует изображения, пишет код, отвечает на вопросы и ведёт диалоги.

Прошлой осенью мы выпустили сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики — в статье на Habr). Зимой выложили в открытый доступ одну из наших MoE-моделей. И на этом не остановились — двигаемся дальше!

Сейчас у нас фокус в несколько направлений:

1. Исследования и эксперименты

— стабилизация и развитие архитектур (новые виды attention, улучшение тестового стенда изменений)

— методы улучшения обучения (оптимизация, лоссы и режимы вроде FIM/MTP, балансировка MoE)

— скейлинг-законы (для гиперпараметров, качества и стоимости)

— постоянный разбор свежих статей и идей индустрии

2. Инфраструктура и параллельные тренировки

5-D параллелизм, ускорение мультимодальных и гигантских MoE-моделей на больших кластерах.

3. Фреймворк распределённого обучения

Разработка GigaFSDP, эксперименты с FP8/mixed-precision, устойчивость и эффективность обучения на больших масштабах.

4. Низкоуровневые оптимизации

Оптимизация операций на уровне CUDA/triton ядер, улучшение производительности NCCL, профилирование и устранение узких мест.

5. Качество и метрики

Развитие оценки GigaChat: от международных олимпиадных задач до метрик, специфичных для русского языка.

Ищем Lead Backend Developer , с которым будем делать GigaChat умнее. Для экспериментов у нас — кластер с большим числом A100/H100.

Обязанности

Чем предстоит заниматься

* Доводить качество на русском до уровня ChatGPT и выше.

* Придумывать и проверять идеи, которые дают практический выигрыш.

* Помогать решать задачи внутренних клиентов Сбера — с прицелом на внешних пользователей.

* Следить за индустрией: читать статьи, быстро проверять гипотезы, делиться результатами.

Требования

Что важно

* Уверенный Python и PyTorch.

* База по алгоритмам и математике (линейная алгебра, оптимизация, вероятности).

* Представление о текущем ландшафте LLM и трендах будет плюсом

Даже если у тебя нет опыта с LLM — не стесняйся откликнуться!

Условия

* Удалённо

* Возможность оформления в акктеритованную IT-компанию.

* Годовая премия по итогам работы до 6 окладов.

* Регулярный пересмотр зарплат.

* Корпоративный спортзал и зоны отдыха.

* Более 400 программ СберУниверситета для роста.

* Программа адаптации и помощь руководителя на старте.

* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.

* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.

* Ипотека для сотрудников по дисконтной программе.

* СберПрайм+ и скидки у партнёров.

* Бонус за рекомендации в команду.

Посмотреть контакты работодателя

Похожие вакансии

Team Lead (Golang)

Мамаева Ирина Анатольевна

Удаленная работа
  • Москва

  • до 430000 RUR

Рекомендуем

Senior EVM developer (Blockchain developer)

Евсеев Сергей Владимирович

Удаленная работа
  • Москва

  • до 430000 RUR

Рекомендуем
Островок
Удаленная работа
  • Москва

  • до 430000 RUR

Рекомендуем
Клируэй Текнолоджис

Tech Lead Golang

Клируэй Текнолоджис

Удаленная работа
  • Москва

  • до 450000 RUR

Флант
Удаленная работа
  • Москва

  • до 450000 RUR

МойОфис
Удаленная работа
  • Москва

  • до 450000 RUR

Ростелеком Информационные Технологии

Goland-разработчик (senior/teamlead)

Ростелеком Информационные Технологии

Удаленная работа
  • Москва

  • до 450000 RUR

Have Marketing
Удаленная работа
  • Москва

  • от 3000 USD

Стрит Фалькон
Удаленная работа
  • Москва

  • от 250000 RUR

Форк ИТ

Senior Backend developer

Форк ИТ

Удаленная работа
  • Москва

  • от 250000 RUR

METASCAN
Удаленная работа
  • Москва

  • от 250000 RUR

HFLabs
Удаленная работа
  • Москва

  • от 300000 RUR

Leads For Finance S.L
Удаленная работа
  • Москва

  • до 5500 EUR

Удаленная работа
  • Москва

  • до 5500 EUR

X5 Tech
Удаленная работа
  • Москва

  • до 5500 EUR

ПАПА ДЖОНС
Удаленная работа
  • Москва

  • до 5500 EUR

Playerok
Удаленная работа
  • Москва

  • от 400000 RUR

Платформа Сейлз Чейн

Middle+/Senior Backend Engineer

Платформа Сейлз Чейн

Удаленная работа
  • Москва

  • от 400000 RUR

Киберпротект
Удаленная работа
  • Москва

  • от 400000 RUR

FIX
Удаленная работа
  • Москва

  • от 400000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию