AI-инженер

Эйайэксперт

AI-инженер

Москва, 1-я Тверская-Ямская улица, 25с2

Метро: Белорусская

Описание вакансии

aiXpert - команда российских IT-разработчиков . Основной фокус - разработка собственного кросс-платформенного superApp aiXpert с экосистемой AI и Legal Tech приложений для розницы и бизнеса. Интеграция on-premise AI решений для крупных корпоративных заказчиков.

Резидент инновационного центра "Сколково".
Аккредитованная в Минцифры РФ IT компания.

К нам в команду нужен AI-инженер.

Обязанности:
  • Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph.
  • Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных (Qdrant — наш основной стек).
  • Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде.
  • Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантности ответов.
  • MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности.
  • Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании.
  • Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI.
Требования:
  • Уверенное владение Python и опыт коммерческой разработки от 3 лет.
  • Практический опыт работы с фреймворками LangChain и LangGraph.
  • Опыт работы с векторными базами данных, в первую очередь с Qdrant.
  • Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering.
  • Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio).
  • Опыт файн-тюнинга (fine-tuning) open-source LLM.
  • Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач.
  • Будет большим плюсом:

  • Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL).
  • Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM).
  • Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами.
  • Понимание классических алгоритмов и структур данных.
  • Вклад в open-source проекты.
Условия:
  • Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи.
  • Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально).
  • Сильную команду инженеров, увлеченных своим делом.
  • Гибкий график и возможность работать удаленно из любой точки мира.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

evrone.ru
Удаленная работа
  • Москва

  • до 360000 RUR

Рекомендуем
Алфарма
Удаленная работа
  • Москва

  • до 360000 RUR

Рекомендуем
ЕГЭLand
Удаленная работа
  • Москва

  • от 150000 RUR

Рекомендуем
Ингосстрах
Удаленная работа
  • Москва

  • от 150000 RUR

Aston
Удаленная работа
  • Москва

  • от 150000 RUR

РЕЦИКЛЕН
Удаленная работа
  • Москва

  • до 400000 RUR

СИНТАКСИС
Удаленная работа
  • Москва

  • до 400000 RUR

Aston

AI Engineer

Aston

Удаленная работа
  • Москва

  • до 400000 RUR

Интернет-энциклопедия РУВИКИ

AI-инженер

Интернет-энциклопедия РУВИКИ

Удаленная работа
  • Москва

  • до 400000 RUR

Marfatech
Удаленная работа
  • Москва

  • до 400000 RUR

AI Engineer (web agents)

EmFi Technologies Limited

Удаленная работа
  • Москва

  • до 3500 USD

Алонг
Удаленная работа
  • Москва

  • до 3500 USD

Voximplant
Удаленная работа
  • Москва

  • до 3500 USD

KOMANDA.PRO
Удаленная работа
  • Москва

  • от 100000 RUR

Voice AI Engineer (Middle / Senior Track)

ЛОМИДЗЕ МАРИАМ МАМУКОВНА

Удаленная работа
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию