Ведущий инженер по разработке AI-агентов

Кибертех-Сигнал

Ведущий инженер по разработке AI-агентов

Москва, улица Лётчика Бабушкина, 1с3

Метро: Свиблово

Описание вакансии

Мы — аккредитованная IT-компания.

Что мы делаем? Разрабатываем микропроцессорные устройства для: железнодорожной автоматики и телемеханики Общепромышленного применения Цифровых платформ (таких как «Цифровая Платформа 2020» — единый стандарт для микропроцессорных систем).

Мы сотрудничаем с ведущими российскими производителями электроники (МЦСТ, Миландр, НИИЭТ, Элвис), чтобы создавать продукты, которые не уступают, а превосходят зарубежные аналоги.

Наши преимущества: Собственная R&D-база — от идеи до готового продукта. Современные инструменты (CAD, IDE, CI) для разработки электроники и ПО, команда экспертов — конструкторы, программисты, электронщики, тестировщики, специалисты по безопасности. Фокус на импортозамещение — наши решения минимизируют зависимость от иностранных технологий.

Ведущий инженер по разработке AI-агентов on-prem / self-hosted

Чем предстоит заниматься:

  • Проектирование и разработка AI-агентов с использованием self-hosted LLM (Mistral, LLaMA, Falcon и др.).
  • Интеграция агентов с локальными источниками данных (векторные базы, базы знаний, корпоративные API и т.п.).
  • Развёртывание и оптимизация моделей в on-prem среде (GPU-кластеры, Docker, Kubernetes).
  • Реализация инструментов и логики агентов: планирование, инструменты (tool usage), памяти (memory) и долговременного контекста.
  • Создание безопасных, изолированных и отказоустойчивых LLM-сервисов.
  • Мониторинг, логирование, трейсинг и аудит поведения агентов.
  • Участие в выборе архитектурных решений: мультиагентность, task orchestration, toolchains.

Что мы ожидаем от кандидата:

  • Опыт работы с open-source LLM: Mistral, LLaMA, Falcon, RWKV, Yi, Mixtral и пр.
  • Опыт развёртывания моделей в локальной инфраструктуре: Docker, Kubernetes, vLLM, Text Generation WebUI, Ollama и др.
  • Отличное знание Python и опыт с фреймворками LangChain, LlamaIndex, Haystack или аналогичными.
  • Знание основ работы с векторными базами: Faiss, Qdrant, Weaviate, Milvus и пр.
  • Понимание концепций Tool-usage, Planning, Memory и Prompt Chaining.
  • Умение организовать pipeline от данных до inference и интеграции с агентом.
  • Навыки работы с GPU-инфраструктурой и трекинга ресурсов.
  • Опыт построения RAG-систем на локальных LLM (Retriever-Augmented Generation).
  • Участие в разработке корпоративных ассистентов, чат-ботов или экспертных систем.
  • Приветствуется если есть:

  • Опыт настройки, fine-tuning или quantization моделей (LoRA, GGUF, QLoRA).
  • Понимание ограничений и мер безопасности в изолированных средах.
  • Знание принципов MLOps: CI/CD для ML, мониторинг, observability.
  • Знакомство с фреймворками мультиагентных систем (AutoGen, CrewAI, OpenAgents).

А что от нас:

  • Отсутствие зависимости от внешних API: контроль, приватность, безопасность.
  • Доступ к локальной инфраструктуре с GPU/TPU, поддержка экспериментов.
  • Возможность заниматься как applied, так и research-задачами.
  • Мы строго соблюдаем гарантии установленные Трудовым законодательством РФ;
  • Мы заботимся о комфортных условиях для работы наших сотрудников - у нас современный офис (не open-space!!), рабочее место оборудовано всем необходимым для эффективной работы;
  • У нас гибкое начало рабочего дня;
  • Мы заботимся о здоровье наших сотрудников - предоставляем расширенное ДМС (со стоматологией и обслуживанием в лучших клиниках города);
  • Мы заинтересованы в развитии пришедших к нам специалистов - наша команда профессионалов готова делиться своим опытом;
  • У нас уютная обеденная зона с бесплатными чаем, кофе. Она же для нас место, где можно собраться после работы - поиграть в настольные игры ;
  • Мы предоставляем мобильную связь для сотрудников компании;
  • Платформа корпоративного обучения Lerna;

  • Доплата до оклада за время больничного;

  • Достойный уровень заработной платы, премия по итогам года;

  • Работа в аккредитованной IT Компании с возможностью карьерного и функционального роста;

  • У нас стабильный и прозрачный доход!

Мы находимся в пешей доступности от м."Свиблово",станции"Лосиноостровская", МЦК "Ростокино".

Навыки
  • C++
  • FastAPI
  • Flask
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Кибертех-Сигнал
Полный день
  • Москва

  • Не указана

Рекомендуем
Flowwow
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
red_mad_robot
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Flowwow
Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Ростелеком

ML Engineer

Ростелеком

Полный день
  • Москва

  • Не указана

X5 Digital
Удаленная работа
  • Москва

  • Не указана

Оператор Газпром ИД

ML-инженер (search engine, NLP)

Оператор Газпром ИД

Полный день
  • Москва

  • Не указана

Okko
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Navio (ООО Автотех)

Senior Data Scientist NLP

Navio (ООО Автотех)

Полный день
  • Москва

  • Не указана

STARTRIBE LTD

Team Lead (AI, NLP, LLM)

STARTRIBE LTD

Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Ирбикон
Удаленная работа
  • Москва

  • Не указана

Okko
Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Страховая компания Сбербанк страхование

Старший инженер машинного обучения (Senior MLOps Engineer)

Страховая компания Сбербанк страхование

Полный день
  • Москва

  • Не указана

SL Soft
Удаленная работа
  • Москва

  • Не указана

ЭЙП ТЕКНОЛОДЖИ
Удаленная работа
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию