本报讯(融媒体中心记者 方针)4月2日,京东AI研究院自然语言处理组在WikiHop机器阅读数据集中,以74.3%的盲测试集精准度成为WikiHop数据集排行榜第一名,并超越该数据集官方给出的人类表现水平74.1%的精准度。据了解,京东AI已计划将自主研发的这些优秀机器阅读能力应用于人工智能导购、虚拟个人助理和城市助手等多个领域,旨在降低成本、提高效率、提升用户体验。
WikiHop数据集是伦敦大学学院机器学习组提出的一个需要跨多文档、多跳推理的机器阅读理解数据库。每一个WikiHop的样本有一个问题,多个支持文档,和一个备选答案集,模型需要根据问题从多个文档中搜集证据,最后从备选答案集中挑选出正确的答案。由于其更具挑战性的设置,WikiHop阅读理解数据集一经发布即吸引了全球众多高校和科研机构的参与。
WikiHop数据集存在多种挑战。首先,相比于SQuAD这类只需要从单个文档中寻找答案的阅读理解数据集,WikiHop每一个样本都是多个文档,以此来考察模型从多个信息来源提取证据的能力。其次,多数的WikiHop样本必须根据多个文档才能给出答案,仅仅依靠单个文档不足以回答相应的问题,这就要求模型必须具有多跳推理的能力。
人类的知识大多是通过阅读获得,所以机器阅读技术在智能对话与服务中有极高的应用价值,是对话引擎知识的重要来源之一。京东在机器阅读技术上的突破性研究,也将对许多相关的应用带来创新,据了解,京东已将一系列的AI能力沉淀到京东人工智能开放平台NeuHub之上。