Москва, улица Красная Пресня, 22
Цель позиции: Разработка, внедрение и поддержка корпоративной ИИ-платформы на базе современных open-source инструментов для создания интеллектуальных агентов и обработки корпоративных данных.
Обязанности:
Разработка и поддержка ИИ-платформы:
Проектирование, разработка и поддержка бекенд-сервисов платформы на базе Python и выбранных технологий (Ollama, FastAPI/Flask/Django, PgVector).
Разработка и интеграция фронтенд-интерфейсов для взаимодействия с платформой.
Интеграция и настройка ключевых компонентов платформы: Ollama (работа с локальными LLM), Langflow (визуальное создание цепочек/агентов), n8n (оркестрация рабочих процессов, интеграции), PgVector (векторные базы данных), S3 (хранение моделей, данных, документов).
Обеспечение отказоустойчивости, масштабируемости и производительности платформы, особенно при работе с GPU-интенсивными LLM.
Разработка и оптимизация пайплайнов обработки данных:
Создание и совершенствование ETL/ELT пайплайнов для обработки структурированных и неструктурированных данных (текст, документы).
Реализация и оптимизация векторного поиска и семантической категоризации данных с использованием PgVector и техник Embedding.
Интеграция и настройка OCR (Optical Character Recognition) и ASR (Automatic Speech Recognition) сервисов для извлечения текста из изображений, PDF и аудио/видео контента.
Разработка и автоматизация ИИ-агентов и RAG-систем:
Проектирование, разработка и внедрение интеллектуальных агентов для решения бизнес-задач (управление проектами, анализ рисков, поддержка принятия решений) с использованием Langchain, LlamaIndex или аналогичных фреймворков.
Реализация и оптимизация RAG (Retrieval-Augmented Generation) систем для обеспечения агентов и чат-интерфейсов релевантной контекстной информацией из корпоративных источников.
Автоматизация рабочих процессов агентов и интеграция их с другими системами.
Интеграция и безопасность:
Интеграция платформы с корпоративными системами: LDAP/Active Directory (аутентификация/авторизация), базы данных, системы документооборота (1С).
Разработка и поддержка безопасных API (REST, gRPC) для взаимодействия с платформой и ее компонентами.
Обеспечение соответствия платформы корпоративным стандартам безопасности (RBAC, шифрование данных, аудит).
Работа с данными и инфраструктурой:
Проектирование, разработка и оптимизация баз данных (PostgreSQL с PgVector, возможно другие) для эффективного хранения и поиска: чатов, пользовательских данных, векторных эмбеддингов, документации, метаданных.
Контейнеризация сервисов платформы с использованием Docker.
Участие в развертывании и управлении платформой в Kubernetes-кластерах.
Настройка и оптимизация использования GPU-серверов для работы с локальными LLM (Ollama).
Мониторинг и эксплуатация:
Внедрение и настройка систем мониторинга (Prometheus, Grafana) и логирования (ELK stack, Loki) для отслеживания состояния, производительности и использования платформы.
Оперативное выявление, диагностика и устранение сбоев и узких мест производительности.
Обеспечение резервного копирования и восстановления критических данных платформы.
Разработка дополнительных AI-модулей:
Исследование, прототипирование и внедрение новых AI-возможностей в платформу, таких как расширенные решения для Voice-to-Text (ASR), Text-to-Speech (TTS), анализа тональности, извлечения сущностей и др.
Требования (Основные):
Опыт и знания:
Практический опыт полного цикла разработки и внедрения промышленных ИИ-решений или платформ.
Глубокое знание Python и его экосистемы для AI/ML (NumPy, Pandas, PyTorch/TensorFlow).
Опыт работы с современными backend-фреймворками (FastAPI, Flask, Django, Node.js).
Опыт интеграции или разработки фронтенд-интерфейсов (React.js, понимание принципов работы SPA) и взаимодействия с бекендом.
Практический опыт работы с векторными базами данных, обязательно PgVector (или аналоги: FAISS, ChromaDB, Milvus, Weaviate).
Опыт разработки и интеграции API (REST, gRPC).
Навыки работы с реляционными (PostgreSQL) и NoSQL (MongoDB, Redis) БД.
Инфраструктура и DevOps:
Опыт работы с Docker и контейнеризацией приложений.
Опыт работы с Kubernetes (развертывание, управление подами/сервисами)
Опыт настройки, развертывания и оптимизации серверов с GPU для запуска LLM.
AI/ML Специализация:
Практический опыт реализации RAG (Retrieval-Augmented Generation) систем.
Понимание архитектур и принципов работы современных LLM.
Опыт работы с фреймворками для построения LLM-пайплайнов и агентов (Langchain, LlamaIndex, Haystack и др.).
Знание принципов обработки естественного языка (NLP).
Системное проектирование и эксплуатация:
Знание принципов построения высоконагруженных, масштабируемых и отказоустойчивых распределенных систем.
Опыт интеграции с корпоративными системами (LDAP/AD, базы данных, REST/SOAP API).
Опыт разработки с учетом требований безопасности (аутентификация, авторизация, шифрование).
Опыт настройки и использования систем мониторинга (Prometheus, Grafana) и логирования (ELK stack - Elasticsearch, Logstash, Kibana; или Loki/Promtail/Grafana).
Требования (Дополнительные / Желательные):
Опыт работы с технологиями и фремворками типа Ollama, OpenWebUI, Langflow, n8n.
Опыт fine-tuning языковых моделей под специфические задачи.
Опыт проектирования и разработки микросервисных архитектур и масштабируемых API-шлюзов.
Навыки DevOps: построение CI/CD пайплайнов (GitLab CI/CD, Jenkins, GitHub Actions), управление инфраструктурой как код (Terraform, Ansible) – как плюс.
Опыт работы с системами очередей сообщений (Kafka, RabbitMQ, Redis Streams) – как плюс.
Опыт работы с графовыми базами данных (Neo4j) – как плюс.
Опыт работы с библиотеками/сервисами OCR (Tesseract, PaddleOCR, AWS Textract) и ASR (Whisper).
Понимание MLOps практик.
Дартс рекрутинг сервисез
Москва
от 230000 RUR
Группа компаний Астра
Москва
до 300000 RUR