10:1!DeepMind人工智能在《星际争霸2》人机对战中

  【TechWeb】1月25日消息,据国外媒体报道,在人机围棋大战中打败柯洁、李世石等一众围棋高手之后,谷歌旗下人工智能公司DeepMind又将人机大战转向了电脑游戏,而在《星际争霸2》的人机大战中,谷歌DeepMind的人工智能程序以10:1的成绩完胜人类职业选手。

  谷歌DeepMind研发的用于人机对战的人工智能程序名为AlphaStar,其挑战的是两位《星际争霸2》的职业玩家“TLO”和“MaNa”,比赛在去年的12月进行,《星际争霸2》的开发商暴雪和谷歌DeepMind已公布了当时比赛的视频。

  在AlphaStar 与“TLO”和“MaNa”去年的对战中,使用的是略微过时的《星际争霸2》版本,这一版本在设计上便于人工智能程序进行相关的研究。

  “TLO”和“MaNa”与AlphaStar各进行了五局比赛,但“TLO”和“MaNa”在比赛中并未占据优势,最后的结果都是AlphaStar全胜,对决结果定格在了尴尬的10:0。

  在所公布的比赛视频中,谷歌DeepMind推出了一个新版本的AlphaStar,与“MaNa”进行比赛,新推出的AlphaStar对视野进行了限制,“MaNa”也得以发现的AlphaStar的部分不足并最终也战胜了它,用一局胜利为人类职业玩家挽回了一丝颜面,AlphaStar也在与职业玩家的对战中首尝败绩。

  在与AlphaStar进行对战的视频中,“TLO”曾表示他有信心战胜AlphaStar,但不曾想后者在五局中全部获胜,而且每次都采用了完全不同的策略。

  “TLO”之后的“MaNa”,在比赛中也拼尽全力,但并未摆脱与“TLO”相同的命运,他在与AlphaStar的五局比赛中也均已失败告终。

  外媒在报道中表示,人工智能程序在电脑游戏方面存在较多的优势,包括“TLO”和“MaNa”在内的职业玩家,玩电脑游戏时每分钟的鼠标点击量方面存在理论上的限制,而人工智能程序则没有这方面的限制。

  其次,外媒在报道中表示,人工智能程序的反应时间约为350毫秒,AlphaStar在反应速度方面比大多数的职业玩家要慢一些,但在通过大量的训练之后,人工智能程序变得更聪明,更有效率的决定弥补了反应时间方面的不足,这也是人工智能程序在游戏中的一大优势。

  其三,虽然古语有“眼观六路耳听八方”,历史上也不乏视野开阔的高手的传说,但在游戏中,这一点对职业玩家并不太适用,反而更适用于人工智能程序,相关的技术使其对游戏全部区域有更好的掌控,人类玩家则需要花费时间关注不同的区域。

  AlphaStar对游戏全部区域有更好的掌控能力这一点,在其与“MaNa”的最后一局中也得到了印证,在那一局中,谷歌DeepMind对新推出的AlphaStar进行了视角方面的限制,在对所进行游戏的全部区域的注意力方面就不再有明显的优势,“MaNa”也就有时间发现AlphaStar的缺点并最终战胜它。

  AlphaStar在《星际争霸2》方面的技能,来自于开发商DeepMind对其进行的深度训练,DeepMind回放了大量人类玩家游戏时的视频,也是基于相关的数据训练神经网络,在持续一周的时间里,AlphaStar玩了相当于200年的《星际争霸2》。

  AlphaStar目前在游戏方面的水平及超快的学习能力,对《星际争霸》方面的职业玩家来说并不是个好消息,但也不全是坏消息,职业玩家也能从中学到部分有用的策略,毕竟AlphaStar通过训练所积累的游戏经验远高于职业玩家。

  每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

  华为畅享20 Pro星河银开箱图赏:双玻璃机身+6.5英寸珍珠屏 深得年轻人喜爱

  超感知徕卡五摄再攀影像巅峰 2020最强高端旗舰华为P40 Pro+图赏