Москва, 2-я Брестская улица, 39с4
Метро: Белорусская
ServerFlow — компания, специализирующаяся на продаже и интеграции серверного оборудования. В частности, мы работаем с современными GPU-платформами, создавая высокопроизводительные решения для бизнеса и науки в сфере искусственного интеллекта.
Сегодня рынок резко смещается в сторону AI-инфраструктуры, и спрос на локальное внедрение моделей ИИ растёт. Мы запускаем новое направление — развёртывание и оптимизация open-source-моделей на наших серверах. Для этого нам нужен ML-инженер, который поможет соединить вычислительное «железо» и реальные AI-решения.
Развёртывание open-source-моделей (DeepSeek, LLaMA, Qwen, Mistral, Gemma, Stable Diffusion и др.) на серверном оборудовании компании.
Проектирование архитектуры развёртывания — от выбора дистрибутива Linux до настройки движков инференса (vLLM, SGLang, Llama-cpp, TensorRT-LLM и др.).
Подбор оптимальной конфигурации под конкретные модели: GPU, CPU, память, накопители и др..
Интеграция RAG-систем (Retrieval-Augmented Generation): LangChain, LlamaIndex, RAGFlow, GraphRAG, Agentic RAG и др.
Настройка пайплайнов, квантизации (FP16, FP8, INT4, Q4_K_M и др.), а также базовых параметров нейронок для инференса и fine-tuning.
Подготовка и дообучение моделей (LoRA, QLoRA, PEFT), настройка форматов весов (safetensors, GGUF, bin, pt и др.).
Работа с backend-ами и фреймворками: PyTorch, TensorFlow, ONNX Runtimee.
При необходимости — автоматизация рутинных задач на Python (скрипты, пайплайны, API-обвязки).
Опыт развёртывания или сопровождения open-source-LLM (DeepSeek, LLaMA, Mistral, Qwen и др.).
Понимание принципов работы трансформеров и диффузионных сетей.
Уверенное владение Linux (Ubuntu/Debian или RHEL подобные дистрибутивы).
Знание основ Docker, venv, conda, систем версионирования.
Базовые навыки Python (автоматизация, API, bash-скрипты).
Желательно — понимание RAG-архитектуры и инструментов (LangChain, LlamaIndex, RAGFlow).
Будет плюсом: опыт fine-tuning, знание форматов хранения весов, участие в проектах Hugging Face.
Если вы внимательно прочитали анкету, напишите слово "Gemma" в сопроводительном, так мы поймем, насколько вы погрузились :)
В 5 минутной доступности от офиса имеются всевозможные кафе и магазины.
Москва
до 117000 RUR
Национальное Бюро Информатизации
Москва
до 117000 RUR
Отраслевой центр разработки и внедрения информационных систем / ОЦРВ
Москва
до 117000 RUR
Москва
до 350000 RUR
Инвестиционный дом D8
Москва
до 350000 RUR