政策信息
Policy Information
推动成都智能决策人才发展合作
提升人才竞争力
学赛研产联动
腾讯开悟人工智能全球公开赛颁奖仪式举行
什么是多智能体?
它能在哪些领域应用?
为什么这场大会选择在成都举办?
记者专访了腾讯公司副总裁蔡光忠
↓↓
蔡光忠
记者:能不能先介绍一下多智能体到底是什么?
蔡光忠:字面意思其实已经给出了一个解释,多个智能体的协作。
多智能体是由多个相互作用、相互协作的智能体所组成的系统。智能体可以简单理解为一个能够感知环境、进行推理决策并采取相应行动以实现自身目标的实体,这些智能体在多智能体系统中共同存在、协同运作。
比如人就是一个智能体,我们做的许多事情,事实上就是多智能体协作。
当下人工智能技术发展很快,怎么让多个采用AI技术的智能体一起做好一件事情,这就是当下多智能体应用的研究和发展方向。
记者:当下看有没有具体应用的诞生?
蔡光忠:有的。回答这个问题前,我先聊聊多智能体是怎么来的。
初衷其实很简单。《王者荣耀》这个游戏上线之初有个问题,经常有玩家掉线,游戏角色站在那儿不动了,影响游戏进程。
其实竞技游戏就是最直接的多智能体博弈,红蓝两组,每组5个玩家进行5v5对抗,每个玩家就是一个智能体。
有玩家掉线不动了怎么办,我们用AI智能体替代这个掉线的玩家来控制游戏角色,与自己的4个队友继续配合进行比赛。
这就是我们多智能体技术诞生的最初目的。
但没想到的是,用来发展这项技术的“开悟”平台,受到了国内几乎所有知名院校的关注,大家就一起加入了进来,在各个可以用到多智能体技术的领域进行开发。
现在这项技术的应用领域就很广了。理论上看,只要是需要多智能体配合协同的场景,都可以用它来完成。目前已经在交通、电力,甚至是卫星群控制的领域,都有应用。
记者:能不能举一些具体的案例?
蔡光忠:在成都天府三街,我们就和西南交大的团队合作,通过多智能体技术,提升交通通行效率。
这么看这个问题——每一辆车、每一个行人都是一个智能体。一套强大的交通管理系统,应该根据这些智能体的实时状态、动作、预期目的来进行实时调整。每一侧路口,有多少人和车,他们想干什么?交通系统根据这些状态实时作出反应。是不是很像在玩游戏?
交通管理系统“玩”得好了,就不会出现你在等一个红灯,但横向车道上根本没车也没人通行,完全是在“干等”的情况。
现在许多交通路口仍会出现这样的状况,就是当下的“经验模型”还不够优化的结果。开发这项多智能体应用,就是为了解决这个问题。
再比如,我们正在做的一套群体卫星控制系统。以前我们需要人为地控制每一颗卫星,去完成从规定的各个角度拍摄某一对象的工作。现在每个卫星都成了智能体,它们之间知道应该如何相互配合完成拍摄,人都不用管了,效率和质量都更高。
记者:发展多智能技术当下有什么困难或者瓶颈?
蔡光忠:最大的瓶颈还是在算力上。多智能体的训练主要依靠强化训练来完成。
这里解释一下强化训练的概念:它不像传统的学习训练方式——有一套系统的教学模式,告诉训练对象具体每个场景下,每一步应该怎么做。而是通过神经网络技术,让智能体直接去做。做出来的成果好就告诉它做对了,成果不好就告诉它做错了。
其实,它具体是怎么学会做的,是一个“黑匣子”,我们研发人员也不知道。但事实看,这种方式训练出来结果是最好的,所以多智能体当下都依靠强化学习来完成训练。
但强化学习的核心,就是得让它做的次数达到海量。这需要很大的算力资源进行支持。我们现在也正通过各种途径解决这个问题。
记者:为什么选择在成都召开这次会议?
蔡光忠:其实多智能体技术发展的瓶颈除开算力之外,另一个就是人才。这也是我们选择在成都落地这场会议的原因。这里有优质的高校资源。此前我们举行的一场面向全球的多智能体博弈比赛中,电子科大团队的最终评分就遥遥领先获得第一。另外成都的软件产业发展在全国独树一帜,上下游配套更顺畅。
把目光放到全省看,四川产业门类非常齐全,且企业对数字化升级的需求也较高,我们研发的各类应用场景更容易落地,这对研发侧来说十分重要。
成都商报-成都发布记者丨郭晶晶
综合 四川日报 川观新闻
成都发布编辑丨王映丹
点点在看,点点赞