LLMOps / AI Engineer

РУСАЛ

LLMOps / AI Engineer

Москва, улица Василисы Кожиной, 1

Метро: Багратионовская

Описание вакансии

Мы ищем LLMOps/AI инженера для построения и управления инфраструктурой AI-решений. Вы будете отвечать за создание пайплайнов обработки данных, развертывание LLM-моделей и автоматизацию AI-процессов.

Обязанности:

Разработка и автоматизация:

  • Создание и оптимизация no-code/low-code пайплайнов в n8n (workflow automation);
  • Проектирование и внедрение RAG (Retrieval-Augmented Generation) решений;
  • Проектирование и внедрение MCP серверов;
  • Интеграция AI-моделей (локальные модели на vllm\ollama) в бизнес-процессы;
  • Настройка и оптимизация взаимодействия с различными API (разработка API).

DevOps и инфраструктура:

  • Развертывание и управление контейнеризованными приложениями с использованием Docker и Kubernetes;
  • Управление векторными базами данных (Qdrant или аналоги: Pinecone, Weaviate, ChromaDB);
  • Мониторинг производительности и оптимизация инфраструктуры.

LLM Infrastructure:

  • Работа с LiteLLM или аналогичными решениями для унификации доступа к LLM;
  • Развертывание и настройка Ollama для локального запуска моделей;
  • Конфигурация vLLM для высокопроизводительного inference;
  • Настройка и кастомизация Open WebUI, в том числе пайплайнов.

Разработка и расширение функциональности:

  • Создание кастомных нод для n8n;
  • Разработка микросервисов и API интеграций;
  • Написание скриптов для автоматизации процессов;
  • Написание конфигураций для разных моделей и сервисов.

Требования:

  • Уверенное владение Python (для написания скриптов, автоматизации, разработки нод);

  • DevOps практики: Docker, Kubernetes, базовые знания оркестрации;
  • Опыт работы с n8n или аналогичными системами автоматизации (Zapier, Make, Airflow, Flowise);
  • LiteLLM или аналогичные инструменты для работы с множественными LLM провайдерами;
  • Практический опыт настройки и развертывания RAG пайплайнов;
  • Понимание принципов работы LLM (промпт-инжиниринг);
  • Знание векторных баз данных и embedding моделей;
  • Опыт интеграции AI/ML сервисов через API.

Будет значительным плюсом:

  • Создание кастомных нод для n8n (JavaScript/TypeScript);
  • Опыт разработки плагинов и расширений для LLM инструментов;
  • Знание LangChain, LlamaIndex для построения сложных AI пайплайнов;
  • Опыт работы с одним из фреймворков: SinaraML, MLFlow, DVC, ClearML;
  • Опыт оптимизации моделей (квантование, прунинг, ONNX/TensorRT).

Также будет плюсом:

  • Опыт работы с базами данных (PostgreSQL, MongoDB);
  • Системами очередей (Kafka, RabbitMQ, Redis);
  • Знание систем мониторинга (Prometheus, Grafana);
  • Английский язык на уровне чтения технической документации.

Условия:

  • Возможность присоединиться к команде, работающей над цифровизацией реального сектора экономики;

  • Возможность участвовать в интересных и сложных проектах с ведущими специалистами индустрии;

  • Пятидневная рабочая неделя (5/2) с 9:00 до 18:00;

  • Работа в крупной международной компании (69 тыс. сотрудников, 1-е место по объему производства алюминия в мире), официальное трудоустройство (белая ЗП, отпуск, больничный);

  • Оформление, оплата отпусков и больничных в соответствии с ТК РФ.

Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию