中国企业在全球机器阅读理解水平测试折桂

据微软官方公布消息,最新的全球机器阅读理解标准水平测试(MSMARCO)中,中国企业“猿辅导”名列第一,其数据模型在阅读理解能力上超过了人类的平均水平。

 

图片默认标题_fororder_猿辅导

 

“猿辅导”标志

 

MSMARCO是全球人工智能领域行业中,公认的机器阅读理解标准水平测试,也是该领域的顶级赛事。赛事举办目标是创造出能够像人类一样思考的机器,吸引世界顶尖科技公司的人工智能研究团队参与。微软公司从搜索引擎中抽取10万个问题,然后由人类和参赛团队数据模型进行答题。

 

参赛的“猿辅导”是国内一家在线教育创业公司。此次该企业研究团队的MARS数据模型,答题在两项官方评测指标上分别得分49.72、48.02,位列参赛团队榜首,且超越人类47、46的基准水平。百度NLP团队、微软AI研究团队分列二、三名。

 

“猿辅导”研究团队武汉分部负责人柳景明表示,猿辅导此次提交的MARS模型,采用层叠式的注意力机制在多候选文档,采样出多个候选答案区域,并在此基础上使用交叉投票模型,优化最终的答案,实现机器找出的答案比普通人找的更准确。

 

微软全球机器阅读理解标准水平测试项目负责人表示,人工智能得分超过人类,将意味着人工智能在探索和学习人类知识时,将能够更快、更有效地获取信息,“如果能让机器像人类一样阅读和理解文档,将为所有可能的情形开启大门。”