您在使用过程,发现BUG通过在线问题提交由开发人员确定后,本站将会给予一个月广告展示机会!
 位置:首页 -> 行业新闻 -> 国际市场  
  • 超级电脑沃森背后的秘密
  • 发表日期:[2013-08-04]

  • dbzz.net

      2011年在智力问答节目《危险边缘》中一战成名后,IBM的超级电脑沃森一直未脱离人们关注的视野。目前,IBM已经将这台超级电脑应用于医疗和金融等领域,而根据最新消息,IBM还将利用沃森设计移动版客户服务应用。通过这一应用,消费者无须再与客户服务中心联系以获得建议,而是直接向沃森提问即可。

      基于大数据技术的沃森,为我们提供了人工智能的新思路,同时,在大数据的价值和应用方面也给我们以启示。7月25日,参与沃森研发的IBM中国研究院信息管理与医疗健康首席科学家潘越做客IC咖啡北京站,向大家讲述了超级电脑沃森背后的秘密。

      瞄准自然语言处理

      如果你去看一下2011年沃森和两名人类选手的比赛视频,一定会对沃森的“机智”钦佩不已。比赛中,沃森与两名人类选手短兵相接,你来我往,战得不亦乐乎。现场的观众也对他们的精彩表现报以热烈的掌声。

      而在回答问题时,除了那种机器合成的略显刻板的声音,你几乎看不出沃森与其他选手有什么不同。事实上,沃森比其他选手更聪明,最终以明显优势赢得了比赛。

      那么,沃森究竟是怎么做到这一切的?

      如果了解了其背后的技术原理,你不禁会对科学家的智慧感到惊叹。

      潘越表示,《危险边缘》中的问题,不仅是开放式的,而且还是嵌套式的复杂结构。比如:一个美国的城市,这个城市最大的机场是以二战一位英雄命名的,第二大机场是以二战一场战役命名的。每个问题都涉及到多方面的知识。

      潘越介绍说,一开始,科学家们的想法是建立一个包含所有答案的数据库,但由于问题的开放性,建立这样一个数据库显然是不可能完成的任务。

      由于《危险边缘》的题目分不同的类型,因此,科学家又考虑能否建立某个类型的数据库。但他们通过统计发现,《危险边缘》在过去的历史中,一共积累了20多万个问题,包含2500多个类型,出现频率最高的类型,占比不超过3%,而出现频率排名前十的类型之和,占比也不超过20%。所以,建立某一个类型数据库的想法也很难行得通。

      最终研究人员决定,不建立数据库,而是让电脑直接处理自然语言,然后去寻找答案。

      胜利的秘密

      接下来,科学家开始对人类的思维逻辑进行分析。潘越介绍说,当人碰到一个复杂的问题时,首先要做的是去理解这个问题,然后会针对这个问题寻找答案,寻找到备选答案之后,还要为每个备选的答案寻找证据,然后对证据进行分析,最后才会确定正确答案。

      遵循这一思路,科学家在沃森研制中也采取了这种分步的策略。

      潘越表示,沃森在回答一个问题时,会分为几个步骤。第一步是对问题进行分析,包括问题中的人物、时间、地点等命名实体,期待得到的答案的类型是什么以及命名实体和答案之间的关系是什么,等等。

      完成第一步之后,沃森会把分析得出的关键词和命名实体做备选答案的生成,通过搜索,将段落里面的句法树和命名实体抽出来,作为备选答案。

      第三步,沃森要为备选答案寻找证据。这也是一个搜索的过程。沃森会把备选答案作为关键词进行搜索,得到很多文章的段落,然后再进行分析,从多个维度对备选答案进行打分。

      “验证一个备选答案,会有100多个不同的维度,沃森对这100多个维度进行评分,再折算成一个分数,然后对备选答案进行排序。”潘越说。

      因此,在沃森“机智”的背后,是海量的、严谨的计算。演讲中潘越举了这样一个例子:在细胞分裂中,有丝分裂分开了细胞核,而细胞分裂分开了包围在细胞核周围的这种液体。

      在理解了这个问题之后,沃森通过不同的搜获及抽取策略,会生成很多备选答案,如细胞器、细胞质、液泡、等离子体、线粒体。对每一个备选答案,都要从不同维度去评价其是否正确。通过上述方法,综合各种类型判断的技术,沃森得到了这样一个答案:细胞质是一种包围在细胞核周围的流体。

      接下来,沃森还要通过文本挖掘的方式,比较流体和液体这两个词汇。最终对细胞质是不是液体有一个判断,然后提供一个概率值,用于表示这一判断的置信度。

      潘越介绍说,置信度对于沃森的意义是,在恰当的时机作出恰当的选择。比如,当沃森遥遥领先对手时,即使对问题的答案有较高置信度,也未必会回答,因为这时候沃森采取的策略比较保守,保证不失分就可以了。而当沃森的领先优势不明显时,虽然答案的置信度低一些,但沃森也会采取比较激进的策略。“我们通过置信度管理风险和制定游戏策略。”潘越说。

      IBM花费如此大精力研发沃森,显然不仅仅是在智力问答节目中出风头,更为看重的是沃森的商业应用。潘越表示,医疗卫生是沃森重要的应用领域。“医学知识十分庞杂,就连专业人士也很难全部掌握。如果能够让机器去掌握这些医学知识,就可以帮助医生去作诊断。”

      沃森的另一个重要应用领域是金融。潘越表示,沃森可以对相关的信息,特别是文本信息进行处理,然后作出投资决策。

      不过潘越也指出,沃森所代表的“深度问答”,只是人工智能的方向之一,此外,人工智能需要突破的领域还有图像的识别,运动的协调,以及如何理解人类语言中的概念。这些都需要科学家们进一步的努力。

    (来源:中国科学报)
  • 免责声明:本文仅代表作者个人观点,与东北制造网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证、承诺,并不负任何及连带责任,请读者仅作参考,并请自行核实相关内容。联系时请说明在东北制造网上看到的
网站首页 - 关于我们 - 使用协议 - 免责条款 - 版权隐私 - 网站地图 - 友情链接 - 广告服务 - 会员服务 - 免费注册 - 联系方式
问题请通过在线提问反馈 | 在线客户QQ:105452034 | 收费会员及广告咨询电话13332201705 技术支持:辽宁衡骏节能科技有限公司
Copyright 2007- dbzz.net All Rights Reserved 东北制造网(东北地区唯一制造业网上平台) 版权所有 辽ICP备2021008091号 辽公网安备21021702000105
为获得最佳浏览效果,建议使用IE7以上,或Firefox7以上浏览器
经营性网站
备案信息
百强网站
诚信联盟
网络110
报警服务
不良信息
举报中心