2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

强化学习研究综述

高阳 陈世福 陆鑫

高阳, 陈世福, 陆鑫. 强化学习研究综述. 自动化学报, 2004, 30(1): 86-100.
引用本文: 高阳, 陈世福, 陆鑫. 强化学习研究综述. 自动化学报, 2004, 30(1): 86-100.
GAO Yang, CHEN Shi-Fu, LU Xin. Research on Reinforcement Learning Technology:A Review. ACTA AUTOMATICA SINICA, 2004, 30(1): 86-100.
Citation: GAO Yang, CHEN Shi-Fu, LU Xin. Research on Reinforcement Learning Technology:A Review. ACTA AUTOMATICA SINICA, 2004, 30(1): 86-100.

强化学习研究综述

详细信息
    通讯作者:

    高阳,陈世福,陆鑫

    高阳,陈世福,陆鑫

    高阳,陈世福,陆鑫

  • 中图分类号: TP181

Research on Reinforcement Learning Technology:A Review

More Information
    Corresponding author: GAO Yang,CHEN Shi-Fu,LU Xin; GAO Yang,CHEN Shi-Fu,LU Xin; GAO Yang,CHEN Shi-Fu,LU Xin
  • 摘要: 摘要强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为 机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类 图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结 合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学 习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向.
  • 加载中
计量
  • 文章访问数:  7107
  • HTML全文浏览量:  698
  • PDF下载量:  6464
  • 被引次数: 0
出版历程
  • 收稿日期:  2002-11-04
  • 刊出日期:  2004-01-20

目录

    /

    返回文章
    返回