Казань, Петербургская, 52
Метро: Суконная слободаТребуется LLM-инженер на проекты регионального масштаба, направленные на улучшение качества жизни жителей Республики Татарстан
Обязанности:
Деплой, конфигурирование и поддержка LLM-сервисов в продакшне (vLLM, SGLang, TGI и др.);
Оптимизация inference-пайплайнов для высоконагруженных систем (3k+ concurrent users);
Квантизация моделей (GPTQ, AWQ, GGUF, SmoothQuant и пр.);
Fine-tuning и дообучение LLM (SFT, LoRA/QLoRA, RLHF/DPO);
Подбор, эксперименты и исследования в сфере LLM;
Разработка и реализация алгоритмов на основе LLM (RAG, agents, function calling и пр.);
Улучшение существующих решений и мониторинг качества моделей в проде.
Основной язык Python. Будет плюсом знание GoLang или C++;
Уверенное знание LLM-serving фреймворков: vLLM, SGLang и других фреймворков для Text Generation Inference— понимание их архитектурных отличий, сценариев применения, преимуществ и ограничений;
Глубокое понимание механизмов оптимизации инференса: continuous batching, PagedAttention, speculative decoding, flash attention, tensor parallelism, pipeline parallelism;
Опыт квантизации LLM: GPTQ, AWQ, GGUF, INT4/INT8, SmoothQuant;
Опыт дообучения LLM: SFT, LoRA / QLoRA, DPO, RLHF — понимание когда и что применять;
Работа с популярными open-source моделями (LLaMA, Mistral, Qwen, DeepSeek, GPT OSS) и их весами (HuggingFace Transformers);
Понимание и практический опыт построения RAG-систем, цепочек промптов, agentic-пайплайнов;
Опыт работы с высоконагруженными системами: оценка throughput/latency, профилирование, горизонтальное масштабирование, балансировка запросов;
Базовое понимание аппаратной части: GPU-архитектуры (NVIDIA A100/H100/B200), VRAM management, NVLink, multi-GPU setups;
Понимание и изучение SOTA-решений в сфере LLM для последующей имплементации в проект;
Знания базовых алгоритмов машинного обучения и основ трансформерных архитектур (attention, MoE, RoPE и пр.);
Знание OpenAI-совместимых API;
Опыт с multimodal LLM (Kimi K2.5, Qwen-VL и пр.).
Знание NLP:
Будет плюсом:
Опыт работы от 3 лет.
Условия:
Официальное трудоустройство, стабильная «белая» заработная плата (выплаты 2 раза в месяц);
Оставляй свой отклик, и мы обязательно рассмотрим твое резюме!
Университет Иннополис
Казань
до 210000 RUR
Казань
от 70000 RUR