Наша команда занимается задачами, связанными с извлечением информации из неструктурированного контента: документов, диалогов, текстов различной природы.
Главной задачей для нас является создание готовых продуктов с LLM под капотом, а также создание self-service для бизнеса, где каждый может создать нужный ему сценарий обработки данных (скилл) в режиме no-code. Недавно у нас появился инструмент, в котором пользователь может вести чат с документом в режиме копилота, повышая эффективность своей работы.
Мы ждем заинтересованных в NLP коллег, которым интересно как RnD, так и создание E2E-систем для автоматизации бизнес-процессов.
Помимо этого, мы занимаемся AI-агентами для решения комплексных многостадийных задач, связанных с анализом информации из разных источников. Для этих целей разрабатываем собственные инструменты (SDK, библиотеку функций, бенчмарки для оценки агентов).
• Развитие прикладных LLM-технологий для задач извлечения и генеративного поиска (RAG)
• Дообучение (LoRA) мультимодальных больших языковых моделей с фокусом на домене документов
• Разработка AI-агентов и мультиагентных систем
• Организация и автоматизация процесса разметки (от поиска и подготовки данных до анализа ошибок разметки)
• Релизы новых моделей в среды исполнения для наших пользователей
• Опыт работы с LLM, промпт-инжиниринг, дообучение трансформерных моделей
• Опыт в ML-разработке одной или нескольких типов моделей: Text classification, NER, QA
• Отличное знание PyTorch, Numpy, Sklearn, Pandas
• Python3, ООП, SOLID
• LLMOps: LangChain, LlamaIndex, опыт работы с инструментами для LLM
• Желание изучать новые подходы, модели и технологии
Плюсом будет:
- Хороший профиль на GitHub
- Медальки на Kaggle
- Статьи по NLP/LLM на международных конференциях
- Участие в open-source проектах с LLM
- Опыт оптимизации и ускорения моделей для прода (прунинг, квантование, ONNX/TensorRT)
- MLOps: Git, Docker, MLFlow/DVC/ClearML, Airflow
- Хорошее знание алгоритмов и структур данных
Москва
Не указана
Москва
до 5000 USD