LLM инженер

Эйчар Рокет

LLM инженер

Москва

Метро: Библиотека им.Ленина

Описание вакансии

HR Rocket — технологическая AI / HR Tech платформа, автоматизирующая управление HR-рекламой.

Помогаем крупным компаниям снижать стоимость отклика, оптимизировать бюджеты и делать найм прогнозируемым с помощью ML/AI. Среди наших клиентов — лидеры ритейла, логистики, производства, телеком и других отраслей с массовым подбором.

Кого ищем

Мы ищем LLM‑специалиста, который усилит наш AI‑стек, выстроит архитектуру LLM‑модулей и поможет развивать генеративные продукты внутри HR Rocket.

Чем предстоит заниматься:

  • Проектировать архитектуру LLM‑модулей и AI‑сервисов внутри платформы;

  • Разрабатывать и оптимизировать пайплайны: inference, finetuning, RAG, векторные базы;

  • Строить системы генерации и обработки вакансий, откликов, диалогов, резюме;

  • Настраивать и улучшать качество LLM‑моделей (evals, safety, data curation);

  • Встраивать LLM‑функциональность в backend через асинхронные вызовы, очереди и API;

  • Работать с ML‑модулями, аналитикой и системами прогноза;

  • Участвовать в разработке AI‑продуктов: автогенерация объявлений, интеллектуальные чат‑боты, умные интерфейсы для рекрутеров;

  • Оптимизировать стоимость и скорость inference (quantization, batching, caching);

  • Поддерживать интеграции с внешними LLM‑провайдерами и локальными моделями.

Что от тебя ждем:

  • 5–6+ лет опыта в ML/AI или backend‑разработке;

  • Опыт работы с LLM: GPT, Claude, Llama, GigaChat, Qwen и др.

  • Умение проектировать RAG‑архитектуры, опыт со векторными БД (Chroma, Qdrant, Milvus);

  • Опыт обучения или дообучения моделей (PEFT, LoRA, SFT);

  • Владение Python (FastAPI);

  • Глубокое понимание ML‑инфраструктуры, пайплайнов, оптимизации inference;

  • Опыт работы с Postgres, Redis, очередями, async вызовами;

  • Знание Docker, Docker Compose; умение работать в CI/CD;

  • Навыки работы с Git, code review, хорошая инженерная культура;

  • Опыт работы с Cursor, ClaudeCode или аналогичными инструментами обязателен.

Будет плюсом:

  • Опыт разработки recommendation systems, ML‑инфраструктуры или data pipelines;

  • Знание PyTorch, Transformers, vLLM, Llama.cpp, OpenAI‑совместимых API

  • Навыки DevOps или MLOps.

Что предлагаем:

  • Возможность строить ключевые AI‑модули первой HR‑маркетинговой платформы в России;

  • Влияние на архитектуру и продуктовые решения;

  • Работа в быстрорастущем стартапе с коротким циклом принятия решений;

  • Современный AI‑стек: LLM, RAG, векторные базы, ML‑интеграции, Python, FastAPI;

  • Гибкий формат — удалёнка.

Навыки
  • LLM
  • RAG‑архитектуры
  • Claude
  • GigaChat
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Senior ML engineer

Филиал компании Лист Ренталс Лимитед

Удаленная работа
  • Москва

  • до 5000 USD

Рекомендуем

Senior Backend Engineer (AI/ML)

Аудит-Партнёр

Удаленная работа
  • Москва

  • до 5000 USD

Рекомендуем
evrone.ru
Удаленная работа
  • Москва

  • до 360000 RUR

Рекомендуем
ТехВилл
Удаленная работа
  • Москва

  • до 500000 RUR

Национальная система платежных карт

AI Engineer (RAG / LLM)

Национальная система платежных карт

Удаленная работа
  • Москва

  • до 500000 RUR

Selecty
Удаленная работа
  • Москва

  • до 500000 RUR

Bright Pattern, Inc

Applied ML engineer

Bright Pattern, Inc

Удаленная работа
  • Москва

  • до 500000 RUR

ВкусВилл
Удаленная работа
  • Москва

  • до 250000 RUR

Удаленная работа
  • Москва

  • до 250000 RUR

Онлайн-школа Тетрика

Lead ML Engineer

Онлайн-школа Тетрика

Удаленная работа
  • Москва

  • до 250000 RUR

ТехВилл
Удаленная работа
  • Москва

  • до 250000 RUR

Gradient
Удаленная работа
  • Москва

  • от 450000 RUR

High Sky
Удаленная работа
  • Москва

  • от 15000 USD

VK
Удаленная работа
  • Москва

  • от 15000 USD

Октопустех
Удаленная работа
  • Москва

  • от 15000 USD

Леусова Екатерина Сергеевна

Senior Python Developer / Backend Architect (AI/LLM, FastAPI)

Леусова Екатерина Сергеевна

Удаленная работа
  • Москва

  • от 300000 RUR

Цифровые привычки

ML Engineer / Data Scientist (NLP, CV)

Цифровые привычки

Удаленная работа
  • Москва

  • от 300000 RUR

Вэб3.0
Удаленная работа
  • Москва

  • от 300000 RUR

JSA Group
Удаленная работа
  • Москва

  • от 300000 RUR

iiko, Компания Айко

Senior DevOps Engineer

iiko, Компания Айко

Удаленная работа
  • Москва

  • от 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию