Data scientist NLP

Описание вакансии

DataOffice - это драйвер DataDriven культуры в Ростелекоме, один из лидеров отрасли управления данными в России. DataOffice объединяет 300 профессионалов в области ИТ-технологий.

В компании расширяется команда для разработки сервисов на базе больших языковых моделей: прикладные настольные приложения для повышения эффективности сотрудников и внедрение ИИ в программные продукты РТК (Яга/Ежка, аналоги Jira/Trello/Confluence, ITSM и т.д.).

Примеры сервисов:

  • Виртуальный помощник на базе LLM;
  • Генерация формального текста или шаблона задачи из свободного описания;
  • Формирование саммари текстов;
  • Построение RAG систем по документам, базам данных;
  • Интеллектуальная нарезка историй и задач на подзадачи или пункты и выделение именованных сущностей из них.

Что мы ожидаем от кандидата:

  • Опыт работы в роли Data scientist от 2 лет;
  • Работа с одним из фреймворков PyTorch/TensorFlow;
  • Знание основных подходов для предобработки и векторизации текста;
  • Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization);
  • Знакомство и понимание основных принципов современных SOTA моделей NLP;
  • Владение: git, docker, sql и одним из фреймворков для реализации api.

Будет плюсом:

  • Участие в соревнованиях по ML/DL;
  • Практический опыт до обучения и работы с open source LLM;
  • Публикации по NLP;
  • Собственные проекты по NLP.

Мы предлагаем:

  • Работа в крупнейшем в России интегрированном провайдере цифровых решений;
  • Возможна полная или частичная удаленная работа из России;
  • В Москве - БЦ Академик, победивший в номинации лучший проект «Бизнес-центр класса А. Москва» Возможность работать из офисов в городе Краснодар и Новосибирск.
  • Официальное оформление в аккредитованную Ит компанию — согласно ТК РФ (полный соц. пакет: ежегодный оплачиваемый отпуск 28 календарных дней, оплата больничных);
  • Официальная заработная плата (оклад и годовая премия);
  • Кафетерий льгот с 1 рабочего дня: ДМС, компенсация транспорта, интернета, спорта, обучения и др.;
  • Корпоративное обучение: внутренние митапы, участие в конференциях, доступ к корпоративным библиотекам технической и бизнес литературы.
Навыки
  • PyTorch
  • Python
  • TensorFlow
  • Deep Learning
  • Big Data
  • LLM
  • NLP
  • NER
  • Text Classification
  • Text Summarization
Посмотреть контакты работодателя

Похожие вакансии

Ozon
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
HeadHunter
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Rubius
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Social Media Holding

ML Engineer/Data Science

Social Media Holding

Удаленная работа
  • Москва

  • до 350000 RUR

Ozon
Удаленная работа
  • Москва

  • до 350000 RUR

СберЗдоровье

Senior ML Engineer (NLP)

СберЗдоровье

Удаленная работа
  • Москва

  • до 350000 RUR

билайн
Удаленная работа
  • Москва

  • до 350000 RUR

Циан
Удаленная работа
  • Москва

  • до 350000 RUR

LAD labs Ltd

Data Infra Engineer

LAD labs Ltd

Удаленная работа
  • Москва

  • до 350000 RUR

ИНИТИ
Удаленная работа
  • Москва

  • от 351000 RUR

Ozon
Удаленная работа
  • Москва

  • от 351000 RUR

JAMI LUP

Data Engineer

JAMI LUP

Удаленная работа
  • Москва

  • от 351000 RUR

АйТиИ Экспо Интернешнл

Data Engineer/Инженер данных

АйТиИ Экспо Интернешнл

Удаленная работа
  • Москва

  • от 351000 RUR

Ozon
Удаленная работа
  • Москва

  • от 351000 RUR

Corporate Performance Systems

Data Engineer

Corporate Performance Systems

Удаленная работа
  • Москва

  • от 351000 RUR

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • от 351000 RUR

Linki
Удаленная работа
  • Москва

  • до 200000 RUR

ЕГЭLand
Удаленная работа
  • Москва

  • до 200000 RUR

Appie.tech
Удаленная работа
  • Москва

  • до 4000 USD

«UZUM TECHNOLOGIES»
Удаленная работа
  • Москва

  • до 4000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию