Data Scientist / NLP Engineer

Data Scientist / NLP Engineer

Москва

Показать контакты

Описание вакансии

О проекте

Разработка алгоритма классификации текстовых сообщений с использованием современных методов векторного представления текста. Решение должно быть масштабируемым, эффективным и готовым к интеграции в production-среду.

Ключевые задачи:

Предобработка текста (очистка, нормализация, токенизация, лемматизация).
Создание продуктивных решений с эмбеддинговыми моделями разных типов:

-Контекстно-независимые: Word2Vec, FastText, GloVe.

-Контекстно-зависимые: BERT, RoBERTa, DeBERTa.

-Современные SOTA-модели:

▪ BGE-M3 (BAAI General Embedding, мультиязычные эмбеддинги).

▪ E5 (Microsoft, текстовые эмбеддинги для поиска и классификации).

▪ Sentence-BERT (SBERT) для эффективного сравнения текстов.

Оптимизация скорости инференса (квантование, дистилляция, ONNX-экспорт).
Оценка качества (F1, Precision/Recall, ROC-AUC) и A/B-тестирование.

Требования к кандидату

Обязательные:

Опыт работы с NLP (3+ лет).
Глубокое понимание эмбеддинговых моделей
(разница между static и contextual embeddings).

Практические навыки:

Python (PyTorch/TensorFlow, Hugging Face Transformers, scikit-learn).
Библиотеки для NLP: spaCy, NLTK, gensim.
o Работа с векторными БД (FAISS, Annoy, Qdrant — будет плюсом).
Умение доносить идеи: визуализация результатов, отчёты.
Желательные:
Опыт деплоя ML-моделей (Docker, FastAPI, Triton Inference Server, Streamlit).
Знание SQL и основ MLOps (DVC, MLflow).

Условия:

Полное соблюдение ТК РФ;
Возможность удаленной работы;
После проекта возможно принятие в штат;
Гибкий график;
Возможность профессионального и карьерного роста;
Молодой дружный коллектив;
Развитая корпоративная культура.
Работа в аккредитованной ИТ-компании.

Навыки

Python
Sentence-BERT
BGE-M3
TensorFlow
NLP
E5
A/B-тестирование
static и contextual embeddings
FAISS
Hugging Face

Посмотреть контакты работодателя

Адрес

Зарплата
Не указана
Занятость
Проектная работа, Удаленная работа
Опыт работы
От 3 до 6 лет
Дата размещения:
20.05.2025 11:14:44

Похожие вакансии

Python-разработчик (AI / NLP)

WealthCoders

Удаленная работа

Москва
до 165000 RUR

Рекомендуем

Data Scientist

ПерилаГлавСнаб

Удаленная работа

Москва
до 120000 RUR

Рекомендуем

Инженер по оптимизации ИИ-моделей и разработке промптов (ML системный аналитик)

АКСИС ПРО

Удаленная работа

Москва
до 500000 RUR

Рекомендуем

Data Analyst/Data engineer

Самозанятые

Удаленная работа

Москва
до 500000 RUR

Инженер-сметчик

Бенитех

Удаленная работа

Москва
от 80000 RUR

Инженер-проектировщик систем промышленного водоохлаждения

БИМ ИНЖИНИРИНГ

Удаленная работа

Москва
до 500000 RUR

Инженер-проектировщик

КБ ТЕХНАБ

Удаленная работа

Москва
до 180000 RUR

Инженер-конструктор ПГС

ЛЕ Проект

Удаленная работа

Москва
от 200000 RUR

Инженер-конструктор ПГС

РУСПРОЕКТ

Удаленная работа

Москва
от 200000 RUR

Ведущий инженер ОВиК и ВК

РУСПРОЕКТ

Удаленная работа

Москва
от 200000 RUR

Ведущий инженер ЭОМ и СС

РУСПРОЕКТ

Удаленная работа

Москва
от 200000 RUR

Инженер-программист АСУ ТП (Робототехника)

ПРОФ-ИТ ГРУПП

Удаленная работа

Москва
от 200000 RUR

Инженер-программист

Технекон, компания

Удаленная работа

Москва
от 200000 RUR

Инженер-проектировщик

Ride Action

Удаленная работа

Москва
от 60000 RUR

Инженер-проектировщик механики сцены

ЭлементМедиа

Удаленная работа

Москва
от 200000 RUR

Инженер-конструктор

ФОРСТЕК МЕНЕДЖМЕНТ

Удаленная работа

Москва
от 200000 RUR

Инженер по пожарной безопасности

Солар-ПРО

Удаленная работа

Москва
до 100000 RUR

Инженер-программист Sinumerik 840

Эско Восток КРК

Удаленная работа

Москва
до 100000 RUR

Инженер-проектировщик солнечных систем

A1 SolarStore

Удаленная работа

Москва
до 100000 RUR

Инженер-конструктор

IT Группа Открытие

Удаленная работа

Москва
от 130000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.

Оставить вакансию