华为OA卢助力:强化学习预置算法
华为云计算技术有限公司 IT和互联网 150-500人
应用案例 2022-04-15 08:15:51
该强化学习预置算法中,为用户提供了常用的强化学习算法,目前包括五个常用算法(DQN、PPO、A2C、IMPALA以及APEX)。用户订阅之后,选择算法只需设置对应参数,即可很方便地创建训练作业,开始训练相应的强化学习环境(内置环境或自定义环境)。训练后生成的模型可直接在ModelArts平台部署为在线服务,支持推理。