人工智能会谈判
2022年12月09日 18:07
化工热点
英国伦敦深度思维公司的一项研究表示,人工智能(AI)代理可谈判和形成协议,使其在桌面游戏《外交》中胜过其他无此能力的代理。这些发现展示了一种深度强化学习方法,用其建模的代理可以与其他人工代理沟通和合作,在玩游戏时共同制定计划。相关结果近日发表于《自然—通讯》。
开发能展现出代理间合作和沟通的人工智能十分重要。《外交》是一个流行桌面游戏,为此类行为提供了有用的测试平台,它包含玩家之间复杂的沟通、谈判和形成同盟,而AI一直很难达成这些。要赢得游戏,《外交》需要推断在场玩家的未来计划、玩家间的承诺,和他们的诚实合作。过去的AI代理在单个玩家或两个竞争性玩家的游戏中取得过成功,其中玩家之间没有交流。
深度思维公司的Janos Kramar、Yoram Bachrach和同事设计了一个深度强化学习方法,让代理可以协商同盟、共同制定计划。作者创造出了模拟玩家的代理,形成团队,尝试胜过其他队伍的策略。通过预测可能的未来游戏状态,这一学习算法允许代理对未来行动达成一致,识别有益交易。为接近人类水平的表现,作者还通过检验一些代理间承诺破裂的场景(代理背离了过去的协议),调查了诚实合作的条件。
这些发现有助于AI代理形成灵活沟通机制的基础,使其能根据环境调整策略。此外这些发现还表明,对违反协议的同伴的制裁倾向如何大为降低了这类违反者的优势,有助于形成大多可信的交流,尽管情况最初更有利于违反协议者。(来源:中国科学报 冯维维)
相关论文信息:https://doi.org/10.1038/s41467-022-34473-5
来源:Kramar
声明:本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
最新资讯
- 【创赛中国】102-87-4|三(十二烷基)胺|Trilaurylamine
- 【创赛中国】329-98-6|苯甲基磺酰氟|Phenylmethylsulfonyl Fluoride
- 【创赛中国】聚甲基丙烯酸 2-羟乙酯|Poly(2-hydroxyethyl methacrylate)
- [Perfemiker]四氢吡啶并[2,3,b]吡嗪,97%
- Advanced BioMatrix 胶原酶,冻干粉使用指南&应用领域
- Advanced BioMatrix PEPTITE-2000,RGD肽操作与注意事项说明
- [Perfemiker]Tianeptine,≥98%
- Advanced BioMatrix人源Ⅲ型胶原蛋白的纯度与稳定性分析
- [Perfemiker]三乙二醇二甲醚,99%,含0.01 % BHT 稳定剂
- IQ Products新品Pregnostic®–PE IIp ELISA(内皮细胞特异性分子-1检测试剂盒)限时促销!
- [Medlife优选]2,5-二羟基苯甲酸