Data Scientist (NLP)

СимбирСофт

Data Scientist (NLP)

Описание вакансии

Вам предстоит:

Создание чат ботов (RAG подход), настройка моделей LLM, выполнение задач полного цикла от постановки задачи, до деплоя моделей.


Ключевые компетенции и требования:

1. Опыт работы с Large Language Models (LLM):

- Практический опыт работы с современными LLM (GPT, Llama, Mistral, Claude и др.).

- Понимание архитектуры, возможностей и ограничений различных моделей.

2. Реализация RAG (Retrieval-Augmented Generation):

- Опыт проектирования и оптимизации RAG-систем для улучшения генеративных моделей.

- Умение работать с векторными базами данных (Pinecone, Weaviate, FAISS, Chroma и др.).

- Навыки интеграции retrieval-механизмов с генеративными моделями.

3. Разработка и улучшение AI-ассистентов:

- Опыт создания чат-ботов, виртуальных ассистентов и диалоговых систем на основе LLM.

- Оптимизация качества ответов, управление контекстом диалога, снижение галлюцинаций.

- Работа с инструментами оценки качества ассистентов (человеческая оценка, автоматические метрики).

4. Fine-Tuning LLM:

- Опыт дообучения и адаптации LLM под специфические задачи (LoRA, QLoRA, полный fine-tuning).

- Умение работать с фреймворками для тонкой настройки (Hugging Face Transformers, PyTorch, TensorFlow).

- Понимание методов эффективного обучения (distillation, quantization, RLHF).

5. Программирование и инструменты:

- Свободное владение Python и библиотеками для ML (PyTorch, TensorFlow, Hugging Face).

- Опыт работы с API LLM (OpenAI, Anthropic, локальные модели через Ollama, vLLM и др.).

- Знание SQL и NoSQL для работы с данными.

6. Обработка данных и инженерия признаков:

- Навыки предобработки текстовых данных (токенизация, нормализация, augmentation).

- Опыт работы с датасетами для NLP (разметка, балансировка, аугментация).

7. MLOps и деплой моделей:

- Опыт развертывания LLM в production (FastAPI, Flask, Docker, Kubernetes).

- Знание методов мониторинга и обслуживания моделей (логирование, A/B-тестирование).

Желательные навыки (плюсы):

- Разговорный уровень английского языка

- Опыт работы с мультимодальными моделями (текст + изображение/аудио).

- Знание методов оптимизации LLM (квантзация, pruning, ускорение инференса).

- Опыт работы с фреймворками для RLHF (например, TRL от Hugging Face).

- Участие в open-source проектах или публикации в NLP/ML.

Мы предлагаем:

  • Работу в команде экспертов;
  • Широкий технологический стек, сотни проектов;
  • Гибкий график работы, который позволяет высыпаться и выделять время на хобби;
  • Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*);
  • Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии;
  • У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи;
  • Возможность прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком full-stack;
  • Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка;
  • Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills;
  • 50+ клубов по интересам и профессиональных сообществ внутри компании;
  • Уютный мерч;
  • Полный соцпакет и «белую» зарплату;
  • Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1700+ сотрудников;
  • Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, компенсация обучения или занятий любыми видами спорта;
  • Заботу о ментальном здоровье: онлайн-консультации с психологом.
  • * Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 №АО-20220309-3771014210-3

    Приходите в SimbirSoft за прокачкой хард-скиллов и интересными проектами!

    Знаете кого-то, кто идеально сможет подойти? Расскажите им о нашей вакансии!

Посмотреть контакты работодателя

Похожие вакансии

Data Scientist

We are an Innovation hub based, which creates vibrant startup ecosystems and technologies for AdTech & MarTech projects.

Полный день
  • Санкт-Петербург

  • Не указана

Рекомендуем
Интеллектуальные Системы Управления

Data Scientist / Researcher

Интеллектуальные Системы Управления

Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
Университет ИТМО
Полный день
  • Санкт-Петербург

  • от 120000 RUR

Рекомендуем
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Леста Игры
Полный день
  • Санкт-Петербург

  • от 120000 RUR

Леста Игры

Data Engineer

Леста Игры

Полный день
  • Санкт-Петербург

  • от 120000 RUR

Gravity Field

Product Data Analyst

Gravity Field

Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Ozon
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

2ГИС
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Интеллектуальные Системы Управления

Data Engineer

Интеллектуальные Системы Управления

Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Норд Клан
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

СБЕР
Полный день
  • Санкт-Петербург

  • от 120000 RUR

ATI.SU
Полный день
  • Санкт-Петербург

  • от 120000 RUR

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

Data Engineer

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

Полный день
  • Санкт-Петербург

  • от 120000 RUR

DM365
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

IBS
Полный день
  • Санкт-Петербург

  • от 120000 RUR

СП Солюшен

Senior Data Engineer

СП Солюшен

Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Aston
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Альфа-Банк
Удаленная работа
  • Санкт-Петербург

  • от 120000 RUR

Nesco
Полный день
  • Санкт-Петербург

  • до 160000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию