В настоящее время ФГАУ «НИИ «ЦЭПП» расширяет команду профессионалов и приглашает на работу Аналитика данных для разработки и внедрения математических моделей для систем автоматического контроля и управления для различных отраслей промышленности
Обязанности:
- поиск необходимых данных и анализ качества данных;
- подготовка данных для эксперимента;
- постановка и проведение экспериментов с моделями (начиная с линейной регрессии МНК до многослойных нейронных сетей), выбор наилучшего подхода/метода;
- проведение имитационного моделирования;
- выбор и обоснование метрики оценки качества;
- написание чистого кода и выведение модели в работу;
- презентация и защита результатов исследования;
- интеграция моделей в информационную систему. Ввод модели в промышленную эксплуатацию;
- разработка отчетов, инструкций, технической и сопроводительной документации.
Требования: - Высшее техническое/математическое образование по отраслям промышленности (знание производственных процессов химической или металлургической промышленности, или энергетики - будет являться преимуществом);
- Знание языков программирования Python, R;
- Знание сред имитационного моделирования SimInTech, Ansys и др.;
- знание методов математического и численного моделирования, машинного обучения, статистического анализа, оптимизации;
- понимание задач регрессии, классификации, кластеризации, прогнозирования временных рядов.
Условия:
- Место работы: г. Москва, м. Серпуховская
- График работы:5/2, 9.00-18.00
- Испытательный срок - 3 месяца
- Оформление согласно ТК РФ с первого дня
- Своевременная выплата заработной платы 2 раза в месяц
- ДМС
Чем придется заниматься Инженеру по анализу данных:
- Формирование запросов к разным базам данных и выгрузка данных в датасет;
- Статистический анализ данных (работа с пропусками, выбросами, аномалиями, задвоением значений, переквантование и достоверизация значений и т.д.) на языке Python или R;
- Преобразование, обогащение и трансформация данных (уменьшение размерности, выравнивание классов, кластеризация, генерация признаков, оценка важности признаков и т.д.) на языке Python или R;
- Обучение моделей регрессии, классификации разными алгоритмами и рекуррентных нейросетей. Настройка гиперпараметров на языке Python или R;
- Проверка моделей. Оценка по выбранной метрике, расчет погрешности;
- Моделирование поведения модели при разных входных значениях. Выбор наилучшей реализации. Сериализация модели;
- Встраивание модели в сервер приложения к внешним устройствам (ПЛК, сервера) в программе AggreGate SCADA/HMI;
- Развертывание проекта, ПНР, ввод автоматизированной системы в промышленную эксплуатацию;
- Разработка отчетов, инструкций, технической и сопроводительной документации;
- Оформление аналитических и исследовательских описаний, руководств по анализу и моделированию данных.