ИИ-проектов в областях:
- Распознавания финансовых документов с использованием нейросетей и VLM (Vision-Language Models);
- Создания чат-ботов с подключением к финансовым системам;
- Проведения глобального интернет-поиска с элементами OSINT;
- Взаимодействия с сайтами через Computer User Agent (CUA);
- Разработки локальных переводчиков (offline/он-премис) на различные языки мира.
Общие требования
- Опыт: от 5+ лет в AI/ML, из них не менее 2 лет — в роли тимлида;
- Образование: высшее техническое (информатика, ИИ, прикладная математика, кибербезопасность);
- Уровень: senior/lead ML engineer + опыт управленца (Tech Lead / AI Team Lead);
- Владение английским: не ниже B2–C1 (техническая и деловая переписка, чтение научных статей);
- Способность вести проекты от идеи до внедрения, включая исследование, архитектуру, разработку, деплой и мониторинг.
Управленческие компетенции
- Управление распределённой командой: ML-инженеры, data-инженеры, QA;
- Постановка задач, контроль качества, ревью кода, архитектурные решения;
- Взаимодействие с бизнесом, аналитиками и заказчиком, умение переводить бизнес-задачи в технические решения;
- Менторство и развитие команды.
Глубокие технические компетенции
1. Распознавание финансовых документов (Document AI)
- Опыт работы с OCR/ICR системами: LayoutLM, Tesseract, ABBYY, Google Vision API и др;
- Обработка полуструктурированных данных: банковские выписки, чеки, квитанции, счета;
- Финтюн и кастомизация моделей для извлечения сущностей (NER) и структур;
- Интеграция с downstream системами (например, автоматическая классификация и хранение документов).
2. Vision-Language Models (VLM)
- Практическое использование VLM: LLaVA, MiniGPT-4, Flamingo и др;
- Настройка мультимодальных пайплайнов (PDF/Image + Text);
- Векторизация, embedding, сравнение и кластеризация документов/вопросов;
- Интеграция VLM в системы распознавания, чат-ботов и поиска.
3. Разработка чат-ботов и интеллектуальных агентов
- Использование LLM (GPT, Mistral, Claude, LLaMA и др) и фреймворков: LangChain, Rasa, BotPress, LlamaIndex;
- Интеграция с backend-системами (финансовые API, CRM, HelpDesk, ERP);
- Построение RAG-ботов с доступом к внутренним данным, корпоративным базам;
- Обработка интентов, диалоговых контекстов, использование memory и tool-агентов.
4. OSINT и глобальный поиск
- Разработка агентов для поиска данных о физ. и юр. лицах через открытые источники;
- Приветствуется опыт в использовании инструментов: SpiderFoot, Maltego, Recon-ng, Scylla, OpenCorporates, OpenSanctions и др;
- Парсинг и анализ структурированных и неструктурированных источников;
- Интеграция с публичными API (госреестры, судебные базы, санкционные списки);
5. Работа с веб-сайтами через Computer User Agent
- Построение автоматизированных агентов, имитирующих поведение реального пользователя;
- Опыт использования: Playwright, Puppeteer, Selenium, Browser Automation Studio, undetected-chromedriver;
- Браузерная автоматизация: обход капч, анти-бот-защиты, поведенческие паттерны, cookie/session spoofing;
- Адаптация CUAs к многоязычным интерфейсам и защищённым сайтам (включая банковские/госресурсы).
6. Разработка локальных переводчиков
- Разработка или fine-tune собственных моделей перевода;
- Поддержка локальных (offline) сценариев перевода — без доступа к облаку;
- Оптимизация моделей под низкоресурсные языки (low-resource);
- Применение подходов knowledge distillation и quantization для on-prem deployment.
Архитектура и инфраструктура
- CI/CD для ML;
- Контейнеризация и оркестрация: Docker, Kubernetes;
- Хранилища: PostgreSQL, MongoDB, Redis, Elasticsearch, S3;
- Векторные БД: FAISS, Pinecone, Weaviate, Milvus;
- Интеграция с Kafka/RabbitMQ и API-шинами (REST, gRPC, WebSocket).
Безопасность и работа с данными
- Навыки шифрования, управления доступом, работы с конфиденциальной финансовой информацией;
- Журналирование действий агентов и пользователей.
Дополнительные плюсы
- Участие в проектах для банков, финтеха
- Опыт разработки NLP-систем на low-resource языках;
- Участие в открытых исследованиях, публикации, хакатоны