Что предстоит делать
Направление
Коротко о задаче
Документы
OCR + KIE: извлекать структурированные данные из PDF-сканов паспортов, счет-фактур и пр.
Перевод
Построить пайплайн текст → другой язык (MT) и речь → текст → перевод → субтитры (ASR + MT + subtitle).
Биометрия
Сравнивать лицо на низкокачественном фото документа с селфи со смартфона.
Модерация контента
Автоматически проверять, соответствует ли изображение текстовому описанию (пример: «есть ли на фото футболист?»).
MLOps
Упаковывать модели в сервисы (REST/gRPC), писать тесты, метрики, поддерживать CI/CD в закрытом контуре.
Обязательные требования
- 2+ года коммерческого опыта в applied ML / CV / NLP.
- Английский B2 и выше — умение читать техническую документацию, писать комментарии, тикеты, описания PR.
- Уверенный Python 3.11+ (typing, OOP) и базовые знания Golang либо готовность освоить.
- PyTorch (или TensorFlow) и Hugging Face: fine-tuning, inference, оптимизация на GPU/CPU.
- OCR: Tesseract, PaddleOCR.
- KIE: LayoutLMv3, Donut, TrOCR или аналоги (локальный fine-tune).
- ASR: Open-source Whisper, Vosk, Coqui STT.
- MT: MarianMT, M2M-100, OPUS-MT, T5, Argos Translate — всё локально.
- Face recognition: InsightFace (ArcFace), Dlib, FaceNet, MediaPipe.
- Мультимодальные/zero-shot модели: CLIP, BLIP-2, OWL-ViT (локальный inference).
- Контейнеры: Docker; оркестрация: Kubernetes (on-prem), Helm.
- Git, Linux, базовые принципы CI/CD и сетевой безопасности.
Будет плюсом
- Английский устная коммуникация на уровне B2+/C1 — участие в звонках, ability to explain design decisions clearly
Участие в production-проектах на Golang (gRPC, concurrency). - MLflow, DVC, Airflow, Kubeflow — трекинг экспериментов и оркестрация.
- Работа с облачными GPU-инфраструктурами (AWS SageMaker, GCP AI Platform, Azure ML).
- Оптимизация моделей: ONNX, TensorRT, quantization, pruning.
- Знание стандартов потокового аудио (WebRTC, HLS).
- Опыт prompt-engineering / интеграции LLM (OpenAI, Llama 2/3).
- Публикации на Kaggle, участие в open-source.
Что мы предлагаем
- Задачи уровня R&D с возможностью влиять на выбор моделей и архитектур.
- Доступ к выделенным GPU-нодам и бюджет на облачные эксперименты.
- Оформление по ТК РФ, гибкий график, 28 дней отпуска.
- Прозрачная грейд-матрица и ревью каждые 6 мес.