华为OA卢助力:强化学习预置算法

华为云计算技术有限公司 IT和互联网 150-500人
应用案例 2022-04-15 08:15:51
该强化学习预置算法中,为用户提供了常用的强化学习算法,目前包括五个常用算法(DQN、PPO、A2C、IMPALA以及APEX)。用户订阅之后,选择算法只需设置对应参数,即可很方便地创建训练作业,开始训练相应的强化学习环境(内置环境或自定义环境)。训练后生成的模型可直接在ModelArts平台部署为在线服务,支持推理。
华为OA卢助力:强化学习预置算法

算法基本信息

  • 任务类型:强化学习

  • 支持的框架引擎:Tensorflow-1.13.0-python3.6(ray-0.7.4)

  • 支持的环境:classic_control, atari, toy_text

  • 算法输入:

    • 若使用内置环境,无需输入数据,可以选择一个空文件夹或位置即可。

    • 若使用自定义的环境时,输入为用户实现自定义环境的代码所在的文件夹路径信息, 目录结构示例如下。更详细设置参考“自定义环境训练示例”文档。

    训练输入目录
      |- __init__.py
      |- custom_env_name
        |- custom_env_name.py
        |- custom_model.py
    
    __init__.py控制从custom_env和custom_model中导入模块,示例如下所示:
    from .custom_env import create_custom_env
    from .custom_model import CustomNetwork
    all__=["create_custom_env","CustomNetwork"]
    
    custom_env.py中为gym.Env类型的环境和create_custom_env函数,示例如下所示:
    class CusEnv(gym.Env):
        ...
    def create_custom_env(env_config):
        custom_env=CusEnv()
        return custom_env
    
    custom_model.py用来自定义模型,示例如下所示:
    class CustomNetwork(Model):
        ...
    
  • 算法输出:

    • 训练保存的模型、参数文件、checkponit等文件。

免费与10000名中国最顶尖CIO、CTO交流

华为产品免费试用
立即试用
华为售前咨询/预约演示
立即咨询

华为公司概况 查看详细信息

公司基本信息

公司全称:
华为技术有限公司
成立时间:
1987年
注册资本:
4034113.182万元
总部所在国家:
中国
中国总部所在地址:
深圳市
官方网站:
https://www.huawei.com

公司财务实力

营收状况:
2020年,营收8914亿元,利润646亿元
2019年,营收8588亿元,利润627亿元
2018年,营收7212亿元,利润593亿元

公司人员规模

员工总规模:
约20万人
研发人员规模:
约10万人

公司研发能力

CMMI认证:
5级
ISO9001认证:
通过

公司服务能力 查看更多

经销商:
7家
华为产品免费试用
立即试用
华为售前咨询/预约演示
立即咨询