AI开始在阅读理解领域“跑分”,它还能如何帮助人类?
2018-01-23 11:10:01     [查看原文]

原标题:AI开始在阅读理解领域“跑分”,它还能如何帮助人类?

“三长一短选最短, 三短一长选最长,参差不齐C无敌。”

还记得上学期间流传在“学渣们”之间的所谓阅读理解的“做题法宝”吗?

当然,这只是学渣们给自己的心理安慰。阅读理解作为一道考察学生理解能力、思辨能力的题型,绝不仅仅是一道口诀就能解决的,它需要大量的练习与不断地揣摩。

不管如何,相信大家都有一个共识:阅读理解这件事当然是人类的专项。

然而事实上,近日,在美国斯坦福大学发起机器阅读理解领域顶级赛事SQuAD中,阿里巴巴开发的人工智能模型获得了82.44的高分,超过了人类平均值82.304的分数。这是机器首次在此类测试中获得超过人类的分数,而微软的AI模型获得了82.650的分数,排名首位。

智能体在阅读理解领域开始“跑分”,AI能够进行全文理解,已然成为了AI界的大事件。此时,我们首先要面对的问题就是,当AI已经能够比人类更快速、更精准地对文本中的信息进行回答时,AI究竟是人类的替代者还是帮助者呢?AI阅读理解在未来又会如何落地呢?这些问题看似简单,却有很多值得讨论的地方。

AI阅读理解技术之思

整体来说,智能相对论认为至少可以从这两点思考。

1、AI阅读理解只是自然语言处理(NLP)的进化

虽说AI阅读理解近期才进入人们的视线,但AI阅读理解技术究其根本还是继语义分析、语音识别后的又一在自然语言处理技术中取得的突破。

(图来自亿欧网)

自然语言处理发展得很早,计算机刚刚发明之后,人们就开始了自然语言处理的研究。机器翻译是其中最早进行的NLP研究。那时的NLP研究都是基于规则的,或者基于专家知识的。而阅读理解技术是怎么发展而来的呢?在图像识别和语音识别领域的成果激励下,人们逐渐开始引入深度学习来做NLP研究,于是阅读理解技术应运而生。

这类技术也面临很多挑战。具体来讲,包括:

如何跟知识学习——有效地把知识包括语言学知识、领域知识用起来;

如何跟环境学习——通过强化学习的方式提升系统的性能;

如何跟上下文学习——利用上下文进一步增强对当前句子的处理能力;

如何利用用户画像体现个性化。

每个环节若出现偏差都有可能导致结果的不准确。

2、AI阅读理解缺乏真正的思考

让我们先来看一道语文考试中常见的阅读理解题目——

老师提出问题:为什么作者描写的“窗帘”是蓝色的?

学生答:“因为窗帘是蓝色的。”

老师说:“错!蓝色的‘窗帘’具有愁绪的意味,表达作者当时困郁的心境……

这种类型的阅读理解,大家都很熟悉吧。目前,AI在中文阅读理解的简答题型方面表现如何还没有具体的数据可以说明(值得一提的是,百度即将筹办中文阅读理解比赛,竞赛将于2018年3月1日正式开启报名通道)。但是针对这类题型,人类早已总结出了一套答题技巧,更何况是收集了大量数据文本的机器呢?在为AI建立模型时,完全可以达到以某个词汇来刺激AI作出相应答案的程度。比如上文中的“蓝色”对应“惆怅,困郁”,再如“书信”对应“思念”等等。但是,这种操作下,AI阅读理解在做题时用的不是“理解”,而是“套路”;因为机器没有“思考”,只有“运算”。

为什么这么说呢?我们大概能在AI阅读理解的做题流程中找到答案:

Embedding Layer(相当于是人的词汇级的阅读知识):一般采用的都是在外部大规模数据上预训练的词向量(例如Glove等),以及基于循环神经网络或者卷积神经网络的从字符到单词的词向量(表示),这样就可以得到问题和文章段落里面每个单词的上下文无关的表示。

Encoding Layer(相当于人通览全文):一般采用多层的循环神经网络得到问题和文章段落的每个词的上下文相关的表示。

Matching Layer(相当于带着问题读段落):得到问题里面的词和文章段落词之间的对应(或者叫匹配)关系。基本是采用注意力(attention)的机制实现,常见的有基于Match-LSTM和Co-attention两种,这样就得到文章里面每个词的和问题相关的表示。

本栏目中的所有页面均系自动生成,自动分类排列,采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道,包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读