Разработка RL-агентов (DQN, PPO, SAC).
Симуляции, robotics, game AI.
Оптимизация reward functions, multi-agent RL.
Интеграция с Unity/Gym.
3+ года RL, Stable Baselines, Ray RLlib.
Python, опыт robotics.
Английский B2.
ЗП 1 600 000 – 2 800 000 ₸/мес на руки.
Удалёнка, NeurIPS.
Tianmeisheng Human Resources Service Co., Ltd.
Алматы
Не указана
Метод Бизнес Хардкор
Алматы
до 1000 USD
Частная компания “Automated Communication Solutions Ltd.”
Алматы
от 500000 KZT
Турчинович Александр Сергеевич
Алматы
до 300 USD
Legacy Online School
Алматы
до 3000 USD
Омни Юнит Казахстан
Алматы
до 600000 KZT
Almaty Business Services and Solutions
Алматы
до 50000 KZT