О КОМПАНИИ:
ServerICT— мы эксперты в области передовых AI-решений. Специализируемся на поставках современных GPU-систем от Lenovo, Supermicro, NVIDIA, Dell и других ведущих производителей, предлагая полный цикл услуг — от подбора серверов до внедрения промышленных ML-систем. Наши клиенты — банки, телеком и промышленные предприятия.
Сейчас мы ищем в нашу команду MLOps инженера/консультанта (AI/GPU Solutions Architect) — технического эксперта, который поможет клиентам подбирать и внедрять GPU-решения для задач искусственного интеллекта.
---
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
Развертывать и оптимизировать LLM на GPU-кластерах
- Строить end-to-end MLOps пайплайны (обучение → мониторинг);
- Внедрять RAG-системы с векторными БД (Qdrant, FAISS);
- Консультировать клиентов по выбору железа под их задачи.
---
ЧТО ДЛЯ НАС ВАЖНО :
Опыт работы с LLM и MLOps (от 1 года);
- Глубокие знания PyTorch и GPU-оптимизации (CUDA/TensorRT);
- Навыки работы с Kubernetes, Docker и Triton Inference Server;
- Умение объяснять техрешения нетехническим специалистам.
---
ТЕХСТЕК:
- Обязательно: PyTorch, Kubernetes, Triton, Prometheus;
- Желательно: vLLM, TensorRT-LLM, LoRA/PEFT.
---
ЧТО МЫ ПРЕДЛАГАЕМ:
- Конкурентную зарплату (с сильным кандидатом обсуждается индивидуально);
- Возможность гибридного формата работы (офис в Москве + удаленная работа), рассмотрим кандидатов на неполную занятость;
- Работу с передовым железом (B200/Н200);
- Реальные кейсы (внедрение LLM, RAG, MLOps в промышленных проектах);
- Профессиональный рост до Tech Lead направления;
- Обучение за счет компании;
- Офис в бизнес-центре класса А;
- Насыщенная корпоративная жизнь, дружный и профессиональный коллектив.
Оставляйте отклик — будем рады видеть вас частью нашей команды :)