Data Scientist / NLP Engineer

Data Scientist / NLP Engineer

Москва

Описание вакансии

О проекте

Разработка алгоритма классификации текстовых сообщений с использованием современных методов векторного представления текста. Решение должно быть масштабируемым, эффективным и готовым к интеграции в production-среду.

Ключевые задачи:

  • Предобработка текста (очистка, нормализация, токенизация, лемматизация).
  • Создание продуктивных решений с эмбеддинговыми моделями разных типов:

-Контекстно-независимые: Word2Vec, FastText, GloVe.

-Контекстно-зависимые: BERT, RoBERTa, DeBERTa.

-Современные SOTA-модели:

▪ BGE-M3 (BAAI General Embedding, мультиязычные эмбеддинги).

▪ E5 (Microsoft, текстовые эмбеддинги для поиска и классификации).

▪ Sentence-BERT (SBERT) для эффективного сравнения текстов.

  • Оптимизация скорости инференса (квантование, дистилляция, ONNX-экспорт).
  • Оценка качества (F1, Precision/Recall, ROC-AUC) и A/B-тестирование.

Требования к кандидату

Обязательные:

  • Опыт работы с NLP (3+ лет).
  • Глубокое понимание эмбеддинговых моделей
  • (разница между static и contextual embeddings).

Практические навыки:

  • Python (PyTorch/TensorFlow, Hugging Face Transformers, scikit-learn).
  • Библиотеки для NLP: spaCy, NLTK, gensim.
  • o Работа с векторными БД (FAISS, Annoy, Qdrant — будет плюсом).
  • Умение доносить идеи: визуализация результатов, отчёты.
  • Желательные:
  • Опыт деплоя ML-моделей (Docker, FastAPI, Triton Inference Server, Streamlit).
  • Знание SQL и основ MLOps (DVC, MLflow).

Условия:

  • Полное соблюдение ТК РФ;
  • Возможность удаленной работы;
  • После проекта возможно принятие в штат;
  • Гибкий график;
  • Возможность профессионального и карьерного роста;
  • Молодой дружный коллектив;
  • Развитая корпоративная культура.
  • Работа в аккредитованной ИТ-компании.
Навыки
  • Python
  • Sentence-BERT
  • BGE-M3
  • TensorFlow
  • NLP
  • E5
  • A/B-тестирование
  • static и contextual embeddings
  • FAISS
  • Hugging Face
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Удаленная работа
  • Москва

  • до 165000 RUR

Рекомендуем
ПерилаГлавСнаб

Data Scientist

ПерилаГлавСнаб

Удаленная работа
  • Москва

  • до 120000 RUR

Рекомендуем
АКСИС ПРО
Удаленная работа
  • Москва

  • до 500000 RUR

Рекомендуем
Самозанятые

Data Analyst/Data engineer

Самозанятые

Удаленная работа
  • Москва

  • до 500000 RUR

Удаленная работа
  • Москва

  • от 80000 RUR

БИМ ИНЖИНИРИНГ
Удаленная работа
  • Москва

  • до 500000 RUR

КБ ТЕХНАБ
Удаленная работа
  • Москва

  • до 180000 RUR

ЛЕ Проект
Удаленная работа
  • Москва

  • от 200000 RUR

Удаленная работа
  • Москва

  • от 200000 RUR

Удаленная работа
  • Москва

  • от 200000 RUR

Удаленная работа
  • Москва

  • от 200000 RUR

ПРОФ-ИТ ГРУПП
Удаленная работа
  • Москва

  • от 200000 RUR

Инженер-программист

Технекон, компания

Удаленная работа
  • Москва

  • от 200000 RUR

Ride Action
Удаленная работа
  • Москва

  • от 60000 RUR

ЭлементМедиа
Удаленная работа
  • Москва

  • от 200000 RUR

ФОРСТЕК МЕНЕДЖМЕНТ

Инженер-конструктор

ФОРСТЕК МЕНЕДЖМЕНТ

Удаленная работа
  • Москва

  • от 200000 RUR

Удаленная работа
  • Москва

  • до 100000 RUR

Удаленная работа
  • Москва

  • до 100000 RUR

A1 SolarStore
Удаленная работа
  • Москва

  • до 100000 RUR

IT Группа Открытие

Инженер-конструктор

IT Группа Открытие

Удаленная работа
  • Москва

  • от 130000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию