多智能体机器学习:强化学习方法[Multi-AgentMachineLearning]
编辑推荐
适读人群 :事机器学习、多智能体协同控制等领域的工程技术人员,高等院校相关专业本科生、研究生以及教师 “多智能体”:一般专指多智能体系统( Multi Agent System,MAS)或多智能体技术( Multi Agent Technology,MAT)。多智能体系统是分布式人工智能的一个重要分支,是20世纪末~ 21世纪初国际上人工智能的前沿学科。多智能体学习相关的研究领域已成为人工智能发展的热点。 《多智能体机器学习:强化学习方法》提供了一种多智能体不同学习方法的框架。同时还提供了多智能体微分博弈中的新进展以及在博弈理论和移动机器人中应用的全面概述。本书向读者介绍了多智能体机器学习的不同方法。主要包括单智能体强化学习、随机博弈和马尔科夫博弈、自适应模糊控制和推理、时间差分学习和Q学习。 《多智能体机器学习:强化学习方法》具有如下特点: 强化学习是近年来在机器学习领域非常热门的研究方向,尤其在多智能体机器学习中,若智能体的某个行为策略获得强化信号,则智能体以后产生这个行为策略的趋势便会加强,这对于群体智能具有十分重要的意义,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有广泛应用。
全面涵盖了多人博弈、微分博弈和博弈理论;
基于梯度算法的简单策略学习方法;
多人矩阵博弈和随机博弈的详细算法和示例;
群机器人和性格特征进化中的学习示例。
《多智能体机器学习:强化学习方法》对于研究人员、研究生和从事多智能体学习的相关人员以及在电子和计算机工程、计算机科学以及机械和航空工程领域的相关人员非常有用。
在现有的机器学习书籍中,较少有以强化学习的方法对多智能体机器学习进行描述的,而有关强化学习的内容,也往往只是在某些专业的机器学习书籍中在个别章节进行阐述。本书以强化学习与协作策略在相关研究领域的应用为主,侧重协作策略的应用,列举了车辆路径规划、多播路由、供应链管理等问题中的解决方案,多智能体及群体智能微分博弈中的新进展以及在博弈理论和移动机器人中的先进应用,而较少涉及强化学习理论的演化。
内容简介
《多智能体机器学习:强化学习方法》主要介绍了多智能体机器人强化学习的相关内容。全书共6章,首先介绍了几种常用的监督式学习方法,在此基础上,介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后,介绍了双人矩阵博弈问题、多人随机博弈学习问题,并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容,并提出LRI滞后锚算法和指数移动平均Q学习算法等,并进行了分析比较。接下来,介绍了模糊系统和模糊学习,并通过仿真示例详细分析算法。后,介绍了群智能学习进化以及性格特征概念和应用。全书内容丰富,重点突出。
作者简介
Howard M.Schwartz 博士,在加拿大魁北克蒙特利尔的麦吉尔大学获得工学学士学位,在美国马萨诸塞州剑桥麻省理工学院获得硕士和博士学位,现为加拿大渥太华卡尔顿大学系统与计算机工程系的教授,研究领域包括自适应和智能控制系统、机器人、机器学习、多智能体学习、系统辨识和状态估计。 连晓峰,现为中国电子学会高级会员,系统仿真学会会员,北京高新技术企业认定委员会专家库专家,《机器人技术与应用》杂志社理事,国家工信部工业和信息化科技人才专家库专家。