Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей
Построение решений на базе LLM моделей \ разработка промптов.
Суммаризация информации для генерации кода и тестов
Генерация кода и тестов с помощью LLM
Определение роли пользователя \ выделение навыков с помощью LLM
Генерация рекомендаций по улучшению кода пользователя с помощью LLM
Построение RAG сервиса базы знаний по коду и тестам
Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов
Требования:
Высшее образование (IT, техническое, математическое)
Уверенное владение Python, SQL
Хорошие знания в области теории вероятностей, математической статистики, алгоритмов машинного обучения ML \ DL (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.)
Знания в области NLP алгоритмов
Понимание деталей работы LLM и того, как происходит их дообучение и инференс
Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch