Москва, Пресненская набережная, 8с1
Метро: Деловой центр🚀 Миссия: Стань частью цифровой ИИ-революции в промышленности!
Мы в BIOS создаём интеллектуальную платформу, которая трансформирует промышленные предприятия России.
Наш ИИ — это не просто код или надстройка над LLM. Это умный помощник и сеть агентов, способная предсказывать сбои оборудования, оптимизировать производство и превращать техническую документацию в структурированные знания, доступные в один клик.
Мы ищем Middle/Senior ML Engineer, который разбирается в RAG, LLM и NLP, умеет доводить модели до продакшна и хочет создавать реальные решения, меняющие промышленность.
🎯 Что мы делаем
BIOS — это AI-платформа для промышленных предприятий, которая:
🔧 Прогнозирует отказы оборудования и аварии заранее, на основе поведенческих паттернов данных.
📊 Оптимизирует техническое обслуживание и сокращает затраты, повышая надёжность систем.
📚 Превращает массивы инженерных PDF, схем и отчётов в структурированные базы знаний с помощью RAG.
🧠 Создаёт LLM-агентов, которые понимают технические тексты и отвечают на инженерные вопросы.
🌐 Объединяет данные предприятий в единую интеллектуальную экосистему.
Мы используем большие языковые модели, Retrieval-Augmented Generation, Model Context Protocol и агентские сети, чтобы делать промышленность умнее и безопаснее.
💻 Чем ты будешь заниматься
Ты станешь одним из ключевых инженеров, отвечающих за развитие RAG-архитектуры BIOS, объединяющей поиск, понимание и генерацию знаний из промышленных данных.
Основные направления работы:
🔍 Разработка ядра RAG-системы: проектирование и улучшение retriever-модулей, настройка связки retriever–reranker–generator, повышение точности и устойчивости поиска.
🧩 Оптимизация моделей эмбеддингов: обучение и адаптация моделей представления текстов и документов под специфику технических данных, схем и инженерных отчётов.
🧠 Fine-tuning LLM: дообучение языковых моделей под промышленные задачи — понимание документации, извлечение данных, генерация технических пояснений и отчётов.
📊 Оценка моделей: разработка пайплайнов и метрик для измерения качества RAG — от поиска до генерации (retrieval recall, reranker precision, NDCG, MMR, MAP, factual accuracy, LLM-as-a-Judge).
⚙️ Оптимизация inference: ускорение обработки запросов, настройка кэширования, батчинга и контекстных стратегий для снижения латентности при высоких нагрузках.
🔬 Исследования и эксперименты: тестирование новых подходов к retrieval, reranking и генерации, интеграция современных решений в продакшн-архитектуру платформы.
🛠 Требования
Мы ищем Middle/Senior ML-инженера, который:
Имеет 3+ года опыта в ML/NLP и применении нейросетей в продакшне.
Отлично знает Python (3.13), PyTorch, Transformers, Hugging Face, scikit-learn.
Работал с векторными базами данных (Milvus, FAISS, Chroma).
Имеет опыт fine-tuning LLM или embedding-моделей под прикладные задачи.
Понимает, как устроен retriever–reranker–generator стек и умеет повышать его качество.
Умеет готовить и обрабатывать большие текстовые корпуса для обучения и тестирования.
Знаком с подходами к оценке RAG и генерации, включая:
Метрики поиска и ранжирования: recall, precision, MRR, MAP, NDCG, MMR;
Метрики генерации: BLEU, ROUGE, BERTScore, semantic similarity, factual consistency;
Подходы LLM-оценки: LLM-as-a-Judge, pairwise comparison, preference alignment.
Понимает, как интерпретировать метрики и использовать их для итеративного улучшения retriever и генератора.
Будет плюсом, если ты:
Оптимизировал retrievers или rerankers (cross-encoder, bi-encoder, hybrid search).
Экспериментировал с многоагентными LLM-системами (LangGraph, MCP и т.п.).
Работал с MLFlow, Weights & Biases или аналогичными трекерами экспериментов.
Интересуешься data-centric AI — улучшением данных, а не только моделей.
⚙️ Наш технологический стек
ML / NLP:
Python 3.13, PyTorch, Transformers, Hugging Face, Sentence-Transformers, FAISS, Milvus, MLFlow.
Инфраструктура:
Docker, Kubernetes, GitLab CI/CD, Grafana, ELK Stack.
Code quality:
black, flake8, isort, mypy, pytest, pre-commit.
Мы поддерживаем высокую культуру кодинга и
экспериментов — чистый код, воспроизводимые пайплайны и единые стандарты качества.
🌟 Почему стоит работать с нами
💥 Реальное влияние: твои модели будут предотвращать аварии и оптимизировать реальные производственные процессы.
🧠 Инновации: ты будешь строить одну из первых промышленных RAG-систем в России.
🚀 Рост: возможность расти от ML-инженера до архитектора RAG/LLM-направления.
🤝 Команда: инженеры, которые реально понимают, что делают, и двигают AI в промышленность.
🏙 Офис в Москва-Сити: современное пространство, где приятно работать и обсуждать архитектуру за кофе.
🕓 Гибкий формат: гибрид, минимум бюрократии, максимум смысла.
Расскажи о своих проектах, опыте с NLP, fine-tuning или retrieval.
Стань частью команды, которая делает интеллект настоящим преимуществом промышленности.
Москва
до 470000 RUR