Минск, улица Максима Богдановича, 153Б
Мы — XPGraph, компания, создающая инновационные IT-решения для бизнеса и сотрудничающая со стартапами и крупными европейскими корпорациями. Для одного из наших проектов мы ищем AI Engineer (LLM / RAG).
О проекте
Вы будете разрабатывать систему, которая автоматизирует рутинные задачи через анализ данных с экранов приложений. Платформа сочетает компьютерное зрение (WMUSE), LLM и векторный поиск для создания автономных агентов (MCP/Tools).
Ключевые требования — ваша локация Польша или готовность к переезду.
Чем вам предстоит заниматься:
Разработка и оптимизация AI/ML-решений и конвейеров данных с использованием Python и современных фреймворков, библиотек, инструментов и сервисов.
Проектирование и построение ETL/ELT-конвейеров для данных от источников до векторной БД: парсинг, очистка, чанкинг, построение эмбеддингов.
Участие в создании и доработке ML-моделей, feature engineering, обработка и подготовка данных для RAG-систем.
Реализация и оптимизация пайплайнов для работы с векторными базами данных (Qdrant), включая версионирование, маршрутизацию и управление коллекциями.
Обеспечение качества данных и ML-пайплайнов: внедрение DQ-проверок, мониторинг дрифта, оценка качества retriever'а (recall@k, mAP).
Работа в распределенной команде профессионалов (AI, Dev, DevOps, QA).
Участие в ежедневных митингах, общение на английском языке.
Мы ожидаем, что вы:
Имеете опыт коммерческой разработки на Python от 3 лет.
Отлично знаете Python Core, стандартные библиотеки и один из фреймворков (Django/Flask/FastAPI).
Имеете опыт работы с SQL (PostgreSQL, MySQL) и NoSQL (MongoDB, Redis).
Имеете опыт в ML/AI и обработке данных: построение ETL/ELT-конвейеров, работа с текстовыми/полуструктурированными данными (PDF, JSON, Markdown).
Работали/изучали: PyTorch, TensorFlow, Keras, Scikit-learn, NumPy, Pandas, spaCy / transformers (BERT, T5).
Разбираетесь в ML Ops (DVC, MLflow, Airflow/Prefect) и принципах идемпотентности, версионирования данных и схема-эволюции.
Имеете понимание RAG-архитектур: чанкинг, эмбеддинги, оценка качества.
Понимаете и применяете принципы OOP, SOLID, DRY.
Уровень английского не ниже B1 (для чтения и написания технической документации).
Будет большим плюсом, если вы:
Имеете опыт с векторными БД (Qdrant, Weaviate, Pinecone) и пайплайнами эмбеддингов.
Работали с облачными платформами, предпочтительно Azure (Blob/Files, Key Vault, AKS, Monitor).
Знакомы с LLM и соответствующими инструментами (LangChain, LlamaIndex, Hugging Face, RAG, rerank-модели).
Имеете опыт с OCR (Tesseract, EasyOCR) и компьютерным зрением.
Знакомы с Docker, Kubernetes (K8S), RabbitMQ/Kafka, CI/CD (GitLab CI/CD).
Имеете опыт работы с unittest/pytest.
Обладаете знаниями в области онтологий и схем данных (JSON-LD, SKOS), а также практикой data privacy/PII редактирования.
Мы предлагаем:
Официальное оформление в Польше.
Помощь с оформление всех документов для рабочей визы.
Гибкий и удаленный формат работы.
Корпоративные курсы английского языка онлайн.
Другие условия обсуждаемые персонально.
*Вакансия на перспективу