Сахалинский центр искусственного интеллекта ищет талантливого и амбициозного исследователя данных (DevOps-инженер) для работы над проектами в области искусственного интеллекта.
Переезд в г. Южно-Сахалинск, Сахалинская область!!!
Индивидуальное сопровождение при переезде кандидата и членов его семьи:
- Возмещение перелета;
- Предоставление арендного жилья;
- Помощь в трудоустройстве супруги/ супруга;
- Устройство детей в детские сады и школы;
Условия:
- Трудоустройство по ТК РФ, полный соц. пакет;
- Трудовой договор на 1 год с возможностью продления;
-
График работы: Пн-пт;
-
Испытательный срок 3 месяца;
-
Ежегодный оплачиваемый отпуск 44 дня;
-
Оплата проезда в отпуск раз в два года.;
Требования:
- Высшее образование в области: математики/ информатики/ физики или смежных дисциплин;
- Облачные платформы: AWS (SageMaker, EKS)/Azure (ML Studio)/GCP или российские аналоги;
- Инструменты оркестрации: Docker Swarm/Kubernetes/Nomad;
- Инструменты управления конфигурацией: Ansible, Terraform (желательно);
- Опыт работы с инструментами CI/CD: GitLab CI/CD/Jenkins/GitHub Actions;
- Мониторинг: Prometheus+Alertmanager+Grafana/Zabbix;
- Системы сбора логов: ELK Stack/Loki;
- Опыт с базами данных: PostgreSQL, MongoDB, Redis;
- Знание сетевых протоколов и безопасности (TLS, VPN, Firewall);
- Языки: Python/Bash для автоматизации, понимание работы ML-библиотек (желательно);
- Английский язык: на уровне чтения технической документации;
Обязанности:
Развертывание и управление инфраструктурой:
- Настройка и поддержка облачных платформ.
- Автоматизация развертывания моделей ML/DL (PyTorch, TensorFlow) с использованием MLOps-практик.
CI/CD и автоматизация: - Создание и поддержка пайплайнов сборки, тестирования и развертывания приложений;
- Контейнеризация приложений и настройка развертывания в кластере.
Безопасность и мониторинг: - Настройка мониторинга и алертинга;
- Обеспечение безопасности инфраструктуры (IAM, аудит).
Сопровождение проектов: - Оптимизация производительности и стоимости облачных решений;
- Работа с базами данных (SQL/NoSQL) и распределенными системами.
Поддержка команд: - Помощь Data Science-командам в эксплуатации моделей (Serving, A/B-тестирование);
- Документирование процессов и обучение сотрудников.