Вакансия открыта в компании Газпромнефть-Хантос, оформление по договору ГПХ.
Обязанности:
- Разработка дата-сетов для обучения моделей на низкоресурсном языке.
- Оптимизация времени обучения LLM (Large Language Model) с использованием распределенных вычислений.
- Адаптация готовых моделей под нишевые задачи (ассистент для промышленной безопасности, инструмент анализа данных, GPT поиск по базе данных документов и т.д.).
Требования: Опыт работы с данными:
- Создание и подготовка дата-сетов: сбор, очистка, предобработка, аугментация данных (показать примеры решений).
- Умение работать с разнородными источниками (API, веб-скрейпинг, SQL/NoSQL-базы, открытые репозитории).
- Понимание специфики NLP: токенизация, лемматизация, обработка контекста, работа с шумом в данных.
Запуск и обучение моделей:
- Опыт обучения и тонкой настройки языковых моделей (BERT, GPT, T5, RoBERTa, Qwen и т.д.).
- Знание фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
- Умение оптимизировать процесс обучения: распределенные вычисления, использование GPU/TPU, ускорение инференса.
- Навыки оценки моделей: применение метрик (BLEU, ROUGE, perplexity, accuracy), анализ ошибок.
Языки программирования: Python (обязательно), опыт с библиотеками (pandas, NumPy, scikit-learn, NLTK/spaCy).
Работа с NLP:
- Знание архитектур трансформеров, механизма внимания.
- Опыт с задачами: классификация текста, генерация, summarization, NER, машинный перевод.
Инструменты:
- Git, MLflow, DVC, Airflow.
- Docker, Kubernetes (для деплоя моделей).
- Базы данных: SQL (PostgreSQL, MySQL), NoSQL (MongoDB, Elasticsearch).
Мы предлагаем:
- Оформление по договору ГПХ
- Достойную твоего профессионального уровня заработную плату (уровень вознаграждения обсуждается индивидуально по результатам интервью)
- Удаленный формат работы
- Неограниченный доступ к образовательному контенту на портале знаний от корпоративного университета
- Подписка на лучшие электронные библиотеки с подборками IT-литературы (и не только)
- Собственный центр профессионального развития, в котором проводятся комплексные программы обучения hard skills
- Внутренние демодни, коуч-дни, питчи – то, что поможет продвигать и совершенствовать проекты и собственные идеи
- Корпоративные скидки для изучения английского языка в малых группах онлайн и офлайн
- Регулярные карьерные марафоны, индивидуальные карьерные консультации и планы развития