ML Engineer (Computer Vision / OCR / Anti-Fraud)

Показать контакты

Описание вакансии

Ищем ML Engineer для работы с мультимодальными моделями и развития антифрод-модуля

Обязанности:

OCR и модели
Исследование, обучение и fine-tuning VLM-моделей (InternVL, Qwen-VL и др.) под задачи document understanding.
Дообучение моделей (LoRA / Multi-LoRA) под специфику разных стран и языков.
Подготовка данных: сбор, разметка, аугментация датасетов по гео.
Оптимизация пайплайна инференса: квантование, batching, параллелизация.
Антифрод
Проектирование и разработка ML-модуля антифрода.
Разработка методов выявления мошенничества.
Разработка скоринговой модели подозрительности клиента (Supervised, Unsupervised подходы) с интеграцией в существующий OCR-пайплайн и callback API.
Мониторинг и адаптация моделей к новым схемам мошенничества, анализ false positive / false negative.
Участие в поддержке и развитии production-сервиса (API, мониторинг, деплой).

Требования:

Обязательно:

ML / Deep Learning

Опыт работы с PyTorch от 2 лет.
Практический опыт обучения и fine-tuning моделей компьютерного зрения (классификация, детекция, OCR).
Понимание архитектур трансформеров (Vision Transformer, encoder-decoder).
Опыт работы с техниками parameter-efficient fine-tuning (LoRA, QLoRA).
Умение проводить эксперименты, отслеживать метрики, сравнивать модели.
Computer Vision / NLP
Опыт работы с задачами OCR или document understanding.
Понимание пайплайнов обработки изображений (детекция текста, распознавание, постобработка).
Базовое понимание NLP-задач (извлечение сущностей, парсинг структурированных данных).
Антифрод / Anomaly Detection
Опыт или понимание задач anomaly detection / binary classification в условиях дисбаланса классов.
Понимание метрик fraud-систем: precision/recall trade-off, стоимость ошибок первого и второго рода в контексте финансовых операций.
Engineering
Python: уверенное владение, умение писать чистый production-код.
Опыт работы с GPU-инференсом (CUDA, управление VRAM, профилирование).
Опыт работы с Docker (контейнеры, docker-compose).
Linux: уверенная работа в терминале, SSH, базовое администрирование.

Будет плюсом:

Опыт работы с vLLM, SGlang или аналогичными inference-серверами.
Опыт работы с мультимодальными моделями (VLM: LLaVA, InternVL, Qwen-VL).
Опыт квантования моделей (GPTQ, AWQ, bitsandbytes).
Практический опыт fraud detection в финтехе или платёжных системах.
Опыт работы с image forensics / document forgery detection.
Опыт работы с EasyOCR, PaddleOCR, Tesseract или аналогами.
Опыт работы с LayoutLM / Document AI моделями.
Опыт разработки REST API (FastAPI / Flask).

Условия:

Стек: Python, PyTorch, vLLM, Docker, NVIDIA A100.
Работа с state-of-the-art моделями (InternVL2, Qwen3-VL, LayoutLMv2).
Задачи на стыке research и production: от экспериментов с моделями до разработки антифрод-системы в реальной платёжной системе.
Возможность влиять на архитектурные решения.
Удаленный формат работы из любого города или страны
График работы 5/2
Отпуск - 28 календарных дней.