Чем предстоит заниматься
Разрабатывать и поддерживать модели классификации тендеров по справочникам (ECLASS, UNSPSC, GS1 GPC, ЕНСТРУ)
Строить пайплайны извлечения и нормализации атрибутов (бренд, тех‑характеристики, единицы) из неструктурированного текста (тендерные ТЗ, инвойсы, описания товаров)
Проектировать эмбеддинги и метрики сходства для product‑matching и атрибутивного выравнивания
Создавать решения RAG с LLM (Azure) для автоматической разметки и валидации
Плотно взаимодействовать с бэкендом для интеграции в MCP/API
Стек и инструменты
Python 3.10+
PyTorch или TensorFlow, HuggingFace Transformers — плюс
Azure Cosmos DB, Data Factory, AI Search, Functions — плюс
spaCy / FastText / Textract или аналоги — плюс
LangChain/LangGraph или аналоги — плюс
Neo4j, PostgreSQL, или RDF‑triple‑store (Fuseki, Blazegraph) — плюс
Ожидаемый опыт
2+ года в ML/NLP‑проектах для e‑commerce или каталогов товаров
Практика обучения классификаторов с тысячами классов (hierarchical softmax, label‑embeddings, zero‑shot)
Опыт автоматического сопоставления товаров между различными справочниками
Навыки построения пайплайнов NER / attribute extraction
Английский B1+ (чтение стандартов, общение с OSS‑комьюнити)
Что предлагаем
Свобода выбора архитектуры
Свободный график
Удаленная работа
Процесс отбора
Короткая Google‑форма (ссылка приходит автоматически)
Оплачиваемое тест‑задание (4‑6 ч): парсинг и классификация 1 000 строк описаний товаров
Google Meet‑интервью: 30 мин тех
Экс-Форма, Производственно-коммерческая фирма
Астана
до 180000 RUR
СПОРТИНДУСТРИЯ
Астана
до 150000 RUR
Auslogics Labs Pty Ltd
Астана
до 750000 KZT
Астана
до 150000 RUR
Астана
до 150000 RUR
KEME animation
Астана
до 150000 RUR
Астана
до 1500000 KZT
Студия Дедяева Максима
Астана
до 750000 KZT
Корпоративный фонд Национальный аналитический центр
Астана
до 766000 KZT
Астана
до 800000 KZT
Агентство безопасности Platinum
Астана
до 1500000 KZT
Казахстанский Институт Остеопатической Медицины
Астана
до 1000000 KZT