FP TRADE ищет Junior ML Engineer. Мы занимаемся разработкой проектов на аутсорсе.
Мы представляем собой опытных единомышленников, увлеченных созданием продуктов для разных сфер жизни.
Наш стек: React, Nginx, Java 8-21, Spring, PostgreSQL, MySQL, Redis, Kafka, Elasticsearch, ClickHouse, Activity, Docker, Kubernetes, GlusterFS, Gitlab.
Рассматриваем также обучающихся на 3-4 курсах.
Задачи, которые предстоит решать:
- Прогнозирование читательского спроса на основе пользовательской активности;
- Разработка LLM-агентов для взаимодействия с пользователями и обработки естественного языка;
- Реализация векторного поиска и Retrieval-Augmented Generation (RAG) для интеллектуального поиска по базе знаний;
- Дообучение и внедрение моделей Text-to-Speech для генерации озвучки текстового контента;
- Построение рекомендательной системы с использованием гибридных подходов (контентные, коллаборативные методы).
Требования:
- Уверенное владение Python и опыт использования основных библиотек анализа данных и машинного обучения: numpy, pandas, scikit-learn, matplotlib, seaborn;
- Опыт разработки нейросетей на PyTorch и/или TensorFlow.
- Понимание и опыт очистки, нормализации и подготовки данных, генерации и отбора признаков
- Знание классических алгоритмов и опыт обучения моделей машинного обучения: логистическая регрессия, деревья решений / бустинги, кластеризация.
- Знание метрик и подходов для оценки качества моделей (недостатки, ограничения, применимость для различных задач).
- Понимание методов обработки текстовых данных: токенизация, TF-IDF, word embeddings, нормализация текста
- Опыт работы с open-source LLM: LLaMA, Mistral, DeepSeek и другие, как через API, так и в виде локально развёрнутых моделей
- Понимание и навыки prompt engineering, chain-of-thought prompting, построения цепочек reasoning-агентов
- Понимание методов дообучения и оптимизации инференса LLM: fine-tuning, LoRA, квантование, дистилляция
- Понимание принципов векторного поиска, реализация RAG-подходов
- Опыт построения пайплайнов обучения и инференса, разработки микросервисов на FastAPI
- Навыки и опыт работы с Docker, Git.
Будет плюсом:
- Опыт или эксперименты с моделями синтеза речи (Text-to-Speech) и голосовыми фреймворками;
- Понимание принципов построения рекомендательных систем: content-based, collaborative filtering, гибридные методы;
- Опыт создания и внедрения LLM-ассистентов;
- Навыки и опыт работы с базами данных: SQL, NoSQL (Redis), Elasticsearch, векторные БД (Milvus, FAISS);
- Опыт использования библиотек и инструментов: LlamaIndex, LangChain, vLLM;
- Знание теоретических основ статистики и теории вероятностей;
- Владение Java.
Мы предлагаем:
- Гибридный график работы (г. Минск).
- 4 sick days в год без справок.
- Отпуск 25 календарных дней.
- Гибкое начало рабочего для.
Ждем ваших откликов :)