Senior ML-разработчик (NLP / Обработка документов)

Иттех

Senior ML-разработчик (NLP / Обработка документов)

Описание вакансии

Мы ищем Senior ML-разработчика с опытом в NLP и обработке текстовых данных для работы над системой электронного документооборота (СЭД). Вам предстоит разрабатывать и внедрять ML-модели для анализа документов, автоматизации извлечения информации и улучшения поиска в больших массивах текстов.

Основные задачи:
Разработка и оптимизация NLP-моделей для обработки документов (классификация, извлечение сущностей, NER, summarization, question answering).

Работа с полуструктурированными данными (PDF, сканы, таблицы) — распознавание текстов, разметка, нормализация.

Построение ML-пайплайнов для обработки и анализа больших объёмов текстовых данных.

Интеграция моделей в продакшен (Docker, FastAPI, Kubernetes).

Разработка метрик качества и A/B-тестирование решений.

Оптимизация работы с векторными базами данных для семантического поиска.

Требования:
Опыт от 3+ лет в ML с фокусом на NLP.

Глубокое знание:

Python, PyTorch/TensorFlow (включая трансформеры: BERT, GPT, T5, и т. д.).

Библиотеки для NLP (SpaCy, NLTK, Hugging Face, LangChain).

Работа с текстами (токенизация, лемматизация, TF-IDF, word2vec, BERT-эмбеддинги).

Обработка PDF/сканов (OCR: Tesseract, EasyOCR, или аналоги).

Основы SQL/NoSQL (PostgreSQL, Elasticsearch).

Опыт деплоя ML-моделей (Docker, REST API, Airflow).

Понимание современных подходов в NLP (LLM, RAG, fine-tuning, prompt engineering).

Будет плюсом:
Базовые навыки в Computer Vision (например, для обработки сканов документов или таблиц) — но это не обязательное требование.

Опыт работы с графами знаний или онтологиями.

Знание Rust или C++ для оптимизации высоконагруженных NLP-моделей.

Публикации на ACL, EMNLP, NeurIPS или аналогичных конференциях.

Опыт в госсекторе (ФЗ-44, ФЗ-223) или финтехе (где важна обработка документов).

Условия:

Мы предлагаем:
Оклад от 250 000 ₽ (обсуждается индивидуально).

Гибкий график (сдвиг +-2 часа).

Удалённую работу с редкими офисными встречами.

Проект с реальным impact на процессы документооборота.

Команду экспертов в ML и data engineering.


Навыки
  • NLP
  • MLflow
  • NER
  • summarization
  • Docker
  • FastAPI
  • Kubernetes
  • Python
  • TensorFlow
  • BERT
  • GPT
  • T5
  • Rust
  • C++
  • ACL
  • EMNLP
  • NeurlPS
Посмотреть контакты работодателя

Похожие вакансии

Pre-Interviews

Senior Data Scientist

Pre-Interviews

Удаленная работа
  • Москва

  • от 4000 USD

Рекомендуем
FunCorp
Удаленная работа
  • Москва

  • до 6500 EUR

Рекомендуем
СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 6500 EUR

Рекомендуем
Ozon
Удаленная работа
  • Москва

  • до 6500 EUR

HR Prime

ML Lead (NLP)

HR Prime

Удаленная работа
  • Москва

  • до 10000 EUR

Арго студио

Senior Python Developer

Арго студио

Удаленная работа
  • Москва

  • до 10000 EUR

билайн
Удаленная работа
  • Москва

  • до 10000 EUR

Sapiens solutions
Удаленная работа
  • Москва

  • до 10000 EUR

Автомакон

ML Lead

Автомакон

Удаленная работа
  • Москва

  • до 500000 RUR

AMarkets
Удаленная работа
  • Москва

  • до 500000 RUR

МФК Фордевинд

Middle/Senior Python Developer

МФК Фордевинд

Удаленная работа
  • Москва

  • до 300000 RUR

Diamond Personnel R&C

Senior Data Scientist (LLM)

Diamond Personnel R&C

Удаленная работа
  • Москва

  • до 450000 RUR

Progressive Mind
Удаленная работа
  • Москва

  • до 7000 USD

Диджитал Лайн

Data engineer (Middle+/Senior)

Диджитал Лайн

Удаленная работа
  • Москва

  • от 250000 RUR

Ростелеком Информационные Технологии

Lead Data Engineer / Инженер по данным

Ростелеком Информационные Технологии

Удаленная работа
  • Москва

  • от 250000 RUR

Novakid Inc
Удаленная работа
  • Москва

  • от 4500 USD

Lamoda Tech
Удаленная работа
  • Москва

  • от 4500 USD

МТС
Удаленная работа
  • Москва

  • от 4500 USD

Maslov.ai
Удаленная работа
  • Москва

  • от 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию