Вакансия компании: ООО Террикса
Название вакансии: NLP-инженер (Domain-Specific, Классификация текстов)
О компании: Наша компания разрабатывает передовые интеллектуальные системы для трансформации работы с данными в нефтегазовой отрасли. Мы создаем продукты, которые помогают специалистам принимать точные и обоснованные решения.
О продукте:
Вы будете работать над ключевым элементом нашей платформы — «Семантическим роутером». Это высоконагруженный микросервис, который в реальном времени анализирует и классифицирует текстовые запросы пользователей для их дальнейшей обработки сложными системами поиска и AI.
Задача:
Провести глубокий анализ и полный редизайн системы классификации запросов.
Наш текущий MVP-подход с 4 классами показал точность на живых данных ~34%, в то время как на тестовых данных она достигает 97%. Ваша задача — закрыть этот разрыв, спроектировав и внедрив новую, детализированную систему классификации, учитывающую всю сложность и специфику предметной области.
Чем предстоит заниматься:
- * Проведение анализа реальных пользовательских запросов для выявления паттернов, интентов и специфической терминологии.
- * Разработка иерархической (многоуровневой) классификационной схемы и доменной онтологии для нефтегазовой отрасли.
- * Создание и обучение моделей NLP/NLU для точного определения намерений пользователя (Intent Classification) и извлечения сущностей (NER).
- * Разработка алгоритмов для обработки комбинированных и неоднозначных запросов.
- * Интеграция новых моделей в существующую production-систему, обеспечение обратной совместимости и мониторинг качества.
- * Постоянная работа над улучшением метрик точности и пользовательского опыта.
Мы ищем специалиста, который имеет:
- * Опыт работы в области NLP/NLU от 2-х лет.
- * Уверенные знания и практический опыт работы с Python и основными библиотеками (Transformers, spaCy, NLTK, Scikit-learn и т.д.).
- * Опыт обучения и тонкой настройки (fine-tuning) языковых моделей (BERT/RoBERTa и аналоги).
- * Понимание задач классификации текстов, извлечения сущностей (NER), работы с онтологиями и таксономиями.
- * Опыт работы с реальными production-данными (обработка несбалансированных выборок, работа с шумом, опечатками).
- * Способность к глубокому анализу и системному мышлению.
Будет огромным плюсом:
- * Опыт работы со специфическими предметными областями (domain-specific NLP): медицина, юриспруденция, нефтегазовая/геологоразведочная отрасль и т.д.
- * Знание основ лингвистики.
- * Опыт работы с векторными и графовыми базами данных.
- * Навыки работы с Docker, Kubernetes, системами мониторинга ML-моделей.
Мы предлагаем:
- * Возможность решить сложную и интересную задачу с огромным impact на конечный продукт.
- * Работу в команде экспертов, где ваше мнение будет ключевым.
- * Современный технологический стек и полный цикл реализации своих идей — от анализа до внедрения в продакшен.
- * Конкурентную «белую» заработную плату, гибкий график и возможность удаленной работы.
- * Корпоративный ДМС и другие бенефиты.
Ключевые метрики вашего успеха:
* Повышение точности классификации на живых данных с 34% до 85%+.
* Снижение доли необработанных запросов до ≤5%.
Готовы стать нашим экспертом в области NLP?
Откликайтесь на вакансию!