AI-инженер (LLM / Generative AI)

Эйайэксперт

AI-инженер (LLM / Generative AI)

Описание вакансии

Обязанности:
  • Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph.
  • Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных (Qdrant — наш основной стек).
  • Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде.
  • Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантнности ответов.
  • MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности.
  • Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании.
  • Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI.
Требования:
  • Уверенное владение Python и опыт коммерческой разработки от 3 лет.
  • Практический опыт работы с фреймворками LangChain и LangGraph.
  • Опыт работы с векторными базами данных, в первую очередь с Qdrant.
  • Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering.
  • Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio).
  • Опыт файн-тюнинга (fine-tuning) open-source LLM.
  • Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач.
  • Будет большим плюсом:

  • Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL).
  • Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM).
  • Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами.
  • Понимание классических алгоритмов и структур данных.
  • Вклад в open-source проекты.
Условия:
  • Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи.
  • Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально).
  • Сильную команду инженеров, увлеченных своим делом.
  • Гибкий график и возможность работать удаленно из любой точки мира.
Посмотреть контакты работодателя

Похожие вакансии

Icons8
Удаленная работа
  • Москва

  • от 2500 USD

Рекомендуем
LOYMAX AI
Удаленная работа
  • Москва

  • от 2500 USD

Рекомендуем
AIPeople

AI Engineer

AIPeople

Удаленная работа
  • Москва

  • от 2500 USD

Рекомендуем
Мегахант
Удаленная работа
  • Москва

  • от 2500 USD

Squadmate.dev
Удаленная работа
  • Москва

  • от 2500 USD

KD-systems
Удаленная работа
  • Москва

  • от 2500 USD

Рафт Диджитал Солюшенс

Архитектор AI решений

Рафт Диджитал Солюшенс

Удаленная работа
  • Москва

  • от 2500 USD

GRI
Удаленная работа
  • Москва

  • до 320000 RUR

Программный Продукт, ИТ-компания

Технический лидер (AI Team Lead)

Программный Продукт, ИТ-компания

Удаленная работа
  • Москва

  • до 320000 RUR

ГК Орбита

Python ML-инженер (LLM)

ГК Орбита

Удаленная работа
  • Москва

  • до 320000 RUR

ПРОКАТТ
Удаленная работа
  • Москва

  • до 320000 RUR

Americor Funding Inc

Senior Applied AI Engineer

Americor Funding Inc

Удаленная работа
  • Москва

  • от 3800 USD

STARTRIBE LTD

Team Lead (AI, NLP, LLM)

STARTRIBE LTD

Удаленная работа
  • Москва

  • от 3800 USD

SL Soft
Удаленная работа
  • Москва

  • от 3800 USD

4BLANC
Удаленная работа
  • Москва

  • от 140000 RUR

SL Soft
Удаленная работа
  • Москва

  • от 140000 RUR

IT Solutions Management International Pte. Ltd.

Python LLM Engineer

IT Solutions Management International Pte. Ltd.

Удаленная работа
  • Москва

  • до 117000 RUR

Unimatch AI
Удаленная работа
  • Москва

  • от 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию