注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

环球科学

《科学美国人》中文版官方博客

 
 
 

日志

 
 
关于我

1845年创刊,151位诺贝尔奖得主撰稿,从爱迪生到比尔·盖茨都喜欢阅读的科普杂志。 购买《环球科学》可前往淘宝店,链接是:http://huanqiukexue.taobao.com/

网易考拉推荐

计算机电竞高手  

2015-03-11 18:14:36|  分类: 每日科学新闻 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
DeepMind计算机可以自己学会玩不同的游戏,这也为研究大脑运作提供了新的方式

  


能够自学“太空侵略者”游戏的软件能帮助科学家研究意识

 
Google下属的人工智能公司DeepMind透露了他们怎样开发出一项单一的“玩家算法”的过程,这个算法能学会49种不同电子游戏,其中包括19世纪70年代经典的“乒乓”(Pong)和“太空侵略者”(Space Invaders)游戏。这台电脑对半数以上的这些游戏已经相当熟练,足以击败专业的人类玩家。
 
这项算法的初版在2013年发布之际就已经成了个话题(V.Mnih et al. Preprint at http://arxiv.org/abs/1312.5602; 2013),它是首个能基于极少量起始信息从头开始学习各种任务的人工智能系统。“这个系统能学会好几种游戏的玩法,无需调整就能学习不同的游戏,这一点相当令人震惊和印象深刻,”来自弗吉尼亚州哈里森堡詹姆士麦迪逊大学(James Madison University)的机器学习科学家Nathan Sprague说。
 
总部设立于伦敦的DeepMind公司表示,脑启发系统(brain-inspired)同样也有助于洞察人类智能。“神经科学家们正在研究智力与决策,显然这里就有个实验平台能验证那些想法,”DeepMind的联合创始人Demis Hassabis说,他与他的同事在本周(2015年2月25日)的一篇论文中介绍了这项“玩家算法”(V.Mnih et al. Nature 518, 529–533; 2015. See also News & Views on page 486)。
 
来自加拿大埃德蒙顿市阿尔伯塔大学(University of Alberta)研究强化学习的计算机科学家Richard Sutton表示,游戏对于人工智能研究者而言就好比生物学中的果蝇——也就是用来测试理论的简化系统。“理解思维是个超乎想象的难题,然而通过游戏你能把问题化整为零,分解成各个部分供你研究,”他说。然而迄今为止,大部分击败人类的电脑都只擅长一种比赛——譬如1997年击败国际象棋冠军Garry Kasparov 的IBM公司的“深蓝”(Deep Blue), 以及最近才问世的完美破解德州扑克的算法(Nature http://doi.org/2dw; 2015)。
 
DeepMind的多才多艺是通过结合两种机器学习方式实现的——这是被Sutton称为“相当重要”的成就。其一称为“深度学习”(deep learning),采用了一种脑启发结构,这种结构能根据经验强化虚拟神经元层次间的连接,随后,深度学习系统就能从大量无序的数据中提炼出复杂的信息(Nature 505, 146–148; 2014)。加利福尼亚州山景城的Google公司采用这一算法实现了照片的自动分类,并计划将其用于机器翻译。
 
第二种机器学习方式称为“强化学习”(reinforcement learning),这是一种从动物脑内的多巴胺神经奖赏系统中受到启发而建立的决策系统。这一系统仅以屏幕像素与游戏得分作为输入,通过试错来学习在任意给定时间内应该采取何种行动(诸如往左、往右或开火)才能获得最高奖励。电脑花上几小时学习每个游戏,然后就会精通一系列经典电子游戏,包括“赛车”、“拳击”和“太空侵略者”。
 
Sutton表示,Google之类的公司在开发人工智能方面有着直接的商业利益。其应用可能包括设计在线广告的最佳布置方式,以及优先选择新闻汇集网站的故事。Sprague同时提出,这项技术可以让机器人通过与环境相互作用来解决问题。
 
然而Hassabis表示,主要的驱动力仍来自科学本身,因为建立更加智能的系统意味着更深入地了解智力。很多计算神经科学家赞同这一点。Sprague自行设计了一个DeepMind式的算法,他解释说,尽管从解剖学的神经连接来看,人工智能与神经科学风马牛不相及,它却能提供对计算原理的更高层面的洞察力。
 
来自爱沙尼亚塔尔图大学(University of Tartu)的计算科学家Ilya Kuzovkin属于一支自从2013年起就运用逆向工程编码DeepMind的团队成员,他说:“我们并没有使用生物学技巧来训练一个系统,但对比这两者可能会引出关于大脑的新的认识。” Kuzovkin表示,DeepMind团队发表编码和研究成果这一选择可能会产生特别的推动作用,因为他和其他一些实验室现在能够基于这些成果继续工作。“这同时也证明了,工业资助研究是条正确的路线,让研究者共享学术资源。”他补充道。
 
据报道,DeepMind在2014年被Google以4亿英镑收购,研究人员目前已由80人扩展到140人,并持续吸引着学术界的顶尖计算科学家与神经科学家。
 
DeepMind的下一步计划似乎仍受到神经科学的影响。计划之一可能是为算法建立记忆,允许系统将已学知识运用到新任务中。不同与人类,精通一个游戏并不能使目前的系统更擅长下一个游戏。
 
另一个挑战是模拟人脑将问题分解为几个小任务的方式。目前DeepMind系统正在致力于将行为与深远的后果联系起来——这个缺陷使它还无法精通“吃豆人”之类的迷宫游戏。(翻译:陈晓青 校对:董子晨曦 弥生)
 
撰文:伊丽莎白?吉布尼(Elizabeth Gibney)
  评论这张
 
阅读(163)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017