Data Scientist (LLM/NLP)

LOYMAX AI

Data Scientist (LLM/NLP)

Описание вакансии

Мы создаём интеллектуального AI-консультанта нового поколения, который способен:
• Отвечать на сложные бизнес-вопросы на основе внутренних документов (RAG),
• Помогать пользователям через диалоговую систему,
• Генерировать специализированный код
• Проект совмещает передовые LLM-технологии , архитектуру Retrieval-Augmented Generation (RAG) и code generation models

Обязанности:

  • Разработка и оптимизация RAG-архитектуры (retriever + generator)
  • Интеграция LLM с векторными БД (FAISS, Qdrant, Weaviate и др.)
  • Обработка и семантический поиск по корпоративным базам знаний, PDF, Wiki, API-документации и т.д.
  • Разработка бота-помощника по генерации кода на основе user prompt'ов
  • Подбор и настройка моделей генерации кода (CodeLlama, Starcoder, DeepSeekCoder и др.)
  • Тестирование качества генерации: relevance, correctness, hallucination rate
  • Построение пайплайнов для извлечения, разметки и дообучения на кастомных датасетах
  • Визуализация результатов и сбор фидбэка от пользователей
  • Участие в A/B тестировании LLM-решений и построении метрик качества

Требования:

Обязательные:

  • Опыт в работе с LLM
  • Навыки разработки RAG-систем: опыт с LangChain, LlamaIndex или аналогичными
  • Знание Python, особенно в контексте NLP / ML / AI
  • Опыт работы с embedding-моделями (sentence-transformers, Instructor, E5, text-embedding)
  • Умение работать с векторными хранилищами (FAISS / Qdrant / Chroma)
  • Знание архитектуры генерации кода (CodeLlama, Codex, StarCoder и пр.)
  • Навыки работы с Rest API и умение работать с форматами JSON, Markdown, YAML
  • Знание Git, Docker, Linux[ЮГ1] , Flask / FastAPI

Желательно:

  • Опыт fine-tuning или LoRA-донастройки моделей
  • Знания в области Information Retrieval: BM25, hybrid search
  • Опыт работы с CI/CD, оркестрацией на Airflow или Dagster.
  • Опыт генерации и тестирования кода LLM-моделями (unit tests, code quality metrics)
  • Знание английского языка на уровне чтения технической документации и общения

Мы предлагаем:

  • Участие в прикладных и исследовательских LLM-проектах
  • Гибкий график, удалённую работу и команду, открытую к экспериментам
  • Поддержку в обучении: менторство, материалы, доступ к GPU
  • Быстрый рост и развитие компетенций
Посмотреть контакты работодателя

Похожие вакансии

Ингосстрах

Data Scientist (OCR)

Ингосстрах

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Эйайэксперт
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Icons8
Удаленная работа
  • Москва

  • от 2500 USD

Рекомендуем
Лемана ПРО
Удаленная работа
  • Москва

  • от 2500 USD

М.Видео-Эльдорадо
Удаленная работа
  • Москва

  • от 2500 USD

Диджитал Лайн

Senior Data Scientist

Диджитал Лайн

Удаленная работа
  • Москва

  • от 200000 RUR

Х5 Group
Удаленная работа
  • Москва

  • от 200000 RUR

Мегахант
Удаленная работа
  • Москва

  • от 200000 RUR

Центр Методического Обеспечения Оптимизации Процессов Государственного Управления в Московской области

Data Scientist (OCR)

Центр Методического Обеспечения Оптимизации Процессов Государственного Управления в Московской области

Удаленная работа
  • Москва

  • от 200000 RUR

Effective
Удаленная работа
  • Москва

  • до 320000 RUR

Оператор Газпром ИД

ML-инженер (search engine, NLP)

Оператор Газпром ИД

Удаленная работа
  • Москва

  • до 320000 RUR

Платформа Третье Мнение

NLP Engineer

Платформа Третье Мнение

Удаленная работа
  • Москва

  • до 320000 RUR

SCORISTA
Удаленная работа
  • Москва

  • до 320000 RUR

InternetUrok
Удаленная работа
  • Москва

  • до 250000 RUR

GRI
Удаленная работа
  • Москва

  • до 250000 RUR

KD-systems
Удаленная работа
  • Москва

  • до 250000 RUR

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 250000 RUR

GRI
Удаленная работа
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию