Мы ищем высококвалифицированного специалиста по семантическому поиску для работы в нашей команде разработки AI. Ваша основная задача – разработка и оптимизация интеллектуального агента, способного выполнять комплексные обзоры научных публикаций на платформе ArXiv. Агент будет использовать передовые методы семантического поиска, обработки естественного языка (NLP) и машинного обучения для извлечения, суммирования и синтеза релевантной информации в области материаловедения.
Обязанности:
- проектирование и реализация алгоритмов семантического поиска, адаптированных для поиска научных публикаций на ArXiv;
- разработка NLP-pipelines для парсинга, понимания и извлечения ключевых понятий, методов, результатов и выводов из научных статей;
- создание и обучение моделей для классификации документов, распознавания сущностей, извлечения связей и суммирования, специфичных для материаловедения;
- интеграция семантического поискового агента в архитектуру мультиагентной системы для совместного сбора информации и рассуждений;
- тесное взаимодействие с экспертами в области материаловедения для обеспечения релевантности и точности извлекаемой информации;
- оптимизация релевантности поиска, точности, полноты и масштабируемости системы для обработки больших объёмов научных документов;
- отслеживание современных методов в области семантического поиска, NLP и AI для научного анализа текстов.
Требования:
- степень магистра или кандидата наук в области компьютерных наук, искусственного интеллекта, Data Science или смежных дисциплин;
- подтверждённый опыт работы с семантическим поиском, информационным поиском и NLP, предпочтительно применительно к научным или техническим документам;
- уверенные навыки программирования на Python и опыт работы с NLP-библиотеками/фреймворками (spaCy, Hugging Face Transformers, AllenNLP или аналогичные);
- опыт работы с крупными научными наборами данных и API (например, ArXiv API);
- знание методов машинного обучения для классификации текстов, распознавания сущностей, суммирования и построения графов знаний;
- понимание терминологии и концепций материаловедения будет большим плюсом.
Желательные навыки:
- опыт разработки мультиагентных систем или AI-агентов;
- знания в области векторных поисковых движков (FAISS, Pinecone) и техник встраивания для семантического поиска;
- наличие публикаций или вкладов в open-source проекты по семантическому поиску или анализу научных текстов.
Мы предлагаем:
- уникальную возможность работать над передовым AI-проектом, влияющим на развитие материаловедения во всём мире;
- конкурентоспособную заработную плату и социальный пакет;
- гибкий график работы и возможность удалённой работы;
- коллаборативную и интеллектуально стимулирующую среду с экспертами в AI и материаловедении;
- возможности профессионального развития: конференции, семинары и обучение.