Сейчас мы ищем Middle Data Scientist LLM в направление клиентской поддержки.
Чем предстоит заниматься:
Автоматизацией клиентской поддержки: LLM-агенты для клиентов, LLM-копилоты для операторов, классические NLU системы, анализ фото от клиентов (связка текстовых и картиночных моделей);
Автоматизацией аналитики обратной связи (классификация, NER, кластеризация по данным отзывов от клиентов);
Выбор, дообучение, анализ, оптимизация NLP моделей (LLM, transformers-based архитектуры) для повышения эффективности бизнеса;
Сбор, постановка задачи разметки, предобработка, EDA данных, выбор offline/online метрик;
Составление дизайна ML решения, сбор требований от продуктовой команды;
Разработка RAG и агентских систем;
Автоматизация ML процессов (дообучение, разметка, обновление сервисов), встраиванием моделей в FastAPI сервисы.
От успешного соискателя мы ожидаем:
Знание NLP стека от tf-idf до LLM;
Понимание отличий современных LLM, практический опыт работы с LLM (дообучение, оценка метрик, оптимизация инференса);
Опыт работы в задачах классификации текста (BERT-like модели);
Уверенное владение Python (ООП, PyTorch, Pandas, NumPy, Optuna, SciPy, scikit-learn);
Хорошие знания классических ML моделей, метрик, лоссов;
Опыт выкатки в продакшен классических/NLP моделей.
Будет плюсом:
Опыт оптимизации Transformer/LLM-based сервисов под высокие продакшен нагрузки (ONNX, Triton, и прочее);
Опыт моделирования и проведения A/B-тестов;
Опыт реализации демо с помощью Gradio/Streamlit;
Опыт работы с ASR/TTS моделями обработки аудиоданных.