什么时候迁移学习会被普遍的适用?
【问】:为什么你认为人工智能非常困难?因为人类获得智能似乎很简单,对吧?你把小孩子放在幼儿园,你给他们展示一些红色的东西,然后你给他们展示数字“3”,然后他们就会一下子明白三个红色的东西是什么意思。我的意思是,我们会自然地变得聪明起来,然而我经常打电话给我的常客计划系统,当我告诉它我的电话号码时,它很多时候就无法明白。你为什么觉得这么难?
【彼得】:你说的是真的,尽管你花了很多年才想到这一点。即使是一个能做到你刚才所说事情的孩子也需要有多年的生活才能想到这一点。至少在今天,我们有所期待之时,尤其是在智能机器的商业领域,有时会有一点耐心。但话虽如此,我认为你说的是对的。
我之前提到过维恩图,所以,有一个大的圆圈,那就是智能,我们假设其中有很大一部分是人工智能。然后你把它放大,就这样,人工智能泡泡里面的一个小气泡就是机器学习,这只是机器利用经验变得更好。然后,这个小气泡里的一个小气泡是机器学习数据,这些数据中可提取出模型,将已经学过的东西整理出来,这些模型都是分析大量数据后提取出来的。这就是我们今天所处的位置,在这个大泡泡中的小泡泡里面的小泡泡里,我们称之为人工智能。
值得注意的是,不论我们的理解有多么狭隘,大多数令人兴奋的进步都源于这个小小的、狭隘的用数据进行机器学习的概念中,而且在这个小泡泡里还有一个更小的泡泡,我们称之为一种监督的方式。即便这么小,我们也从中看到了巨大的力量,一种巨大的能创造出新的计算系统的能力,而这些系统能做出一些令人印象深刻且具有价值的事情。对于微软这样的公司来说,这样的价值无法估量。与此同时,我们对智能的了解又是如此之少。
举个简单的例子,比如你提到的一次性学习,你可以向一个小孩展示一辆消防车的卡通图片,如果那个孩子此前在她的生活中没见过消防车,你可以带她到大街上,而一旦在她面前行驶而过第一辆真正的消防车,孩子马上就会认出。你是说得对,我们现有的系统并不擅长这种一次性学习。
虽然我们对利用数据进行机器学习取得的进步感到非常兴奋,但有关智能的一些东西对我们来说仍然很神秘,而且我们对此所了解的相当有限。有时候,当这一点很重要的时候,我们的限制就会阻碍我们的发展,这就产生了一个想法,那就是人工智能的发展仍然非常困难。
【问】:你说的是学习迁移。你会说那个小女孩可以完成一次性学习原因是,她下一次看到了一幅画着香蕉的画,然后马上就看到了一根香蕉?然后下一次,她看到了一幅画着猫的画和一只猫。所以,这并不是一次性学习。
你认为学习迁移对人类有什么作用?因为这似乎是我们非常擅长的事情。我们可以把我们在一个地方学到的东西转移到另一个地方。你知道,如果有人跟我说,“找到自由女神像被涂上了花生酱的那幅画”,我可以把这幅画我挑出来,因为从来没见过涂上了像花生酱或者其他东西的自由女神像。
你认为这是一个我们还不知道怎么完成的简单诀窍吗?这就是你设想的人工智能的未来发展目标?就像是突然灵机一动,你发现了基本思想。或者你认为这是一百个小窍门,并且在我们脑海里的学习迁移只是一些喝醉了的程序员在截止日期之前写的意大利面条毫无头绪的代码对吧?你觉得那是什么?这是一件简单的事情,还是一及其复杂的事情?
事实证明,对于微软来说,迁移学习是一件非常有趣的事情,既有研发价值也具有商业价值,也是发展公司业务的支柱。有趣的是,什么时候迁移学习会更普遍适用,而不是不切实际?
【彼得】:例如,在我们的语音处理系统中,也就是微软提供的实际的商业语音处理系统,我们经常使用迁移学习。当我们训练我们的语音系统来理解英语,然后我们训练这些相同的系统来理解葡萄牙语,或者汉语,或者意大利语,在此过程中。我们得到了学习迁移的效果,对语音系统理解第二种,第三种,第四种语言的训练需要更少的数据和更少的计算能力。与此同时,我们添加的每一个后续语言都提高了系统理解早期添加语言的能力。因此,训练基于英语语言的系统去理解葡萄牙语实际上提高了我们的英语语音系统的性能,所以这里有学习迁移的效果。
在我们的图像识别任务中,有一个叫做“ImageNet”的计算机视觉识别挑战赛,我们参加了很多年,我们上一次参加比赛是在两年前,也就是2015年。有五个方面图像处理分类的竞赛。我们训练我们的系统在第一类中做得很好,尤其是在基本的图像分类方面。然后我们使用学习迁移的方式不仅赢得了第一类别的胜利,还有所有其他四类的竞赛。因此,没有任何进一步的专业培训,就会产生一种学习迁移效应。
实际上,学习迁移似乎确实发生了。在我们的深层神经网络中,存在着深度学习研究活动,学习迁移效果。当我们看到这些时,真的令人陶醉。它会让你思考我们作为人类所做的事情。
与此同时,这似乎是一件不现实的事情。我们并不一定了解这种学习迁移效果何时有效、如何有效。对该方面研究所得出的早期证据是,有不同形式的学习,而且,即使是很小的孩子也擅长一次性学习,这似乎已经超出了我们目前正在研究的深层神经网络系统的范围。即使是你已经表达了学习迁移的直观想法,我们看到,在某些情况下,它也能很好地发挥作用,对我们来说甚至能产生商业价值,但我们也看到了简单的学习迁移任务,这些任务中的系统似乎都失败了。所以,即使是这些事情现在对我们来说也很神秘。
【问】:我没有任何证据来支持这一点,但似乎就我的直觉看来,你所描述的并不是纯粹的学习迁移,而是你所说的“我们建立了一个非常擅长翻译语言的系统,它可以在很多不同的语言中使用。”
在我看来,学习迁移的精髓便在于你把它带到不同的学科之时,例如,“因为我学会了第二语言,所以我现在是一个更优秀的艺术家。因为我学会了第二语言,我现在是一个更厉害的厨师了。”我们借用某一门学科当中的知识,增加了我们知识的丰富性和深度,而这样的一种方式对我们的人际关系产生了深远的影响。
有一天我在和一个人聊天,他说学习第二语言是他做过的最有价值的事,他使用第二语言的个性和他使用英语时是不一样的。我知道你在说什么,我认为这些都促使我们朝正确方向发展。但我想知道,它的核心是否是多维度的,是否类似于人类的行为,这就是为什么我们可以进行一次性学习,因为我们所做的事情与现实生活中的东西所画成的卡通画毫无关系。你对此有什么回应吗?
【彼得】:至少在我们目前对研究领域的理解中,有一件事是,学习和推理是有区别的。我喜欢的举的一个例子是,我们在语言理解方面做了很多工作,特别是在机器阅读方面,你想要能够阅读文本,然后回答关于文本的问题。你测试机器阅读能力的一个典型场合是SAT考试口试环节当中的部分。SAT考试的好处是你可以试着回答问题,你可以通过考试获得的分数来衡量进步。这种情况正在稳步改善,不仅是在微软的研究领域,而且还在相当多的大学研究领域和中心。
现在,把同样的系统用在三年级的加州成绩测验上,智能系统就不起作用了。如果你看一看三年级学生的学习能力,有一种常识性的推理能力似乎超出了我们在机器学习系统中的努力范围。所以,举个例子,你会在三年级的成绩测试中得到一个问题,也许是四幅卡通画:草地上有一个球,一些雨滴,一把伞,还有一只小狗,你必须知道如何给这四幅画配对。三年级学应该能够从正确的生活经历中找到正确的逻辑推理,正确的常识推理,将两两组合在一起,但我们实际上并没有可靠的人工智能系统能够做到这一点。这种常识性的推理似乎是,至少在今天,就现在的科学和技术知识的现状,超出了机器学习的领域。这不是我们认为机器学习最终会学会的东西。
这种区别对我们很重要,甚至在商业上也是如此。今天我在看一封电子邮件,微软的某个人让我准备今天和你谈谈。电子邮件上说,就在我正前方,“这是明天早上播客的简报。如果你今晚想复习的话,我明天就给你打印出来。”目前,该系统已经强调了“今晚想要回顾”的内容,以及它强调的原因是,它在某种程度上做出了合乎逻辑的常识性推论,那就是我可能想要在日程表上设置,提醒自己查看简报文件。但值得注意的是,它成功做到了这一点,因为它还提到了明天早上和今晚。所以,做这些常识性的推断,做那种推理,仍然是非常困难的,而且还需要很多聪明的研究人员做出大量的努力来实现。
【问】:这很有趣,因为你说,你只有一行代码,解答三年级的测试问题不是机器学习的任务,那我们怎么解决这个问题呢?或者换句话说,我经常问这些图灵测试系统,“哪个更大,一个五分镍币还是太阳?”没有一个人能回答这个问题。因为“太阳”和“五分镍币”的这两个词也许都有意义不明确。
不论如何,如果我们不使用机器学习技术,我们如何达到三年级的水平呢?或者我们甚至不用担心三年级的难度,因为我们在生活中遇到的大多数问题都不是三年级的难度,而是我们真正想让机器解答的是12年级难度的问题。我们希望他们能够翻译出不匹配小狗图片的文件。
微软小冰可以做什么?它现在到底有多智能?
【彼得】:当然,如果你看看像微软这样的公司以及整个科技行业正在做什么,我认为,至少在10年的时间里,我们都能看到机器学习给全世界人们带来的巨大价值。机器学习有着巨大的可能性,所以我认为我们将会非常专注于机器学习,这至关重要。它将让人们的生活变得更好,它将为微软等公司提供大量的商业机会。但这并不意味着利用常识进行推理不再重要。几乎所有你想要帮助进行的任务,即便是一些简单的事情,比如规划旅旅程,购物,或者更大的事情,比如得到医疗建议,关于你自己教育方面的建议,这些任务几乎永远涉及到一些你所谓的常识推理的元素,会得出一些不太常见的推论,这些推论对你来说非常特殊和具体,也许是以前从未见过的推论。
现在,话虽如此,在科学界中,在我们的研究中,在我们的研究人员中,存在着很多争论,有关于可以通过机器学习来获取何种程度上的推理能力,还有关于机器通过观察人类行为足够长时间所能从中学习并获取的能力大小。但是,至少对我来说,我看到的是,有一种不同的科学,如果我们想要获得那种常识性的推理,我们确实需要进一步开发。
为了让你们了解这场辩论,我们一直在做的一件事,也是中国正在进行的一项实验,那就是,我们在中国有了一种新型的聊天机器人技术,它有一个人名,叫微软小冰。微软小冰是活跃在中国社交媒体上的一个人物角色,拥有数千万的粉丝。
通常,当我们思考美国市场上的聊天机器人和智能代理时,比如微软小娜、Siri、谷歌助理或Alexa,我们尤为强调语义理解;我们真的想让聊天机器人在语义层面上理解你所说的话。对于微软小冰,我们进行了一项不同的实验,我们并没有试图植入高程度的语义理解能力,而是研究了人们在社交媒体上的言论,我们使用自然语言处理来挑选出语句响应对,并将它们放入一个大数据库当中。所以现在,如果你在中国对微软小冰说些什么,小冰就像其他人回应这样的话语那样回应你。也许它会根据其他人的行为给出一百种可能的回答,然后我们用机器学习来对可能的反应进行排序,试图优化谈话的乐趣和参与度,从而优化对话参与者继续对话的可能性。随着时间的推移,小冰在这方面变得非常有效。事实上,对于那些每天与小冰进行互动的20万人来说,每个人与小冰的对话已经超过了二十三次。
值得注意的是,有关人工智能中什么是重要的,以及什么是智能的重要方面,引起这些争论的原因在于,小冰的核心部分根本不了解你在说什么。在某种程度上,它非常聪明地模仿别人在成功的对话中的言谈。这就提出了一个问题,当我们谈论机器和仿佛拥有智能的机器时,什么才是真正重要的呢?这真的纯粹是一个机械的、句法的系统,就像我们在做小冰的实验一样,或者是我们想要使用诸如微软小娜这样的工具将我们对世界的语义理解、以及这种语义理解的运行方式和我们所采用的方式进行编码。
这些都是人工智能领域的一些根本争论。至少我在微软的日常工作中,有一点很酷,那就是我们不仅能够,并且也允许,在这些事情上做基础研究,还可以建立和部署非常大型的实验,看看会发生什么,并从中学习。这很酷。与此同时,我不能说这已经告诉了我答案是什么。还没有。这只是让我有了很棒的体验,我们分享了我们在世界上所学到的东西,但要确切地说这些东西意味着什么,要难得多。
【问】:1950年,阿兰图灵曾说过:“机器能思考吗?”那仍然是许多人无法达成一致意见的问题,因为他们不一定就条文达成一致。但你说的没错,聊天机器人在理论上可以通过图灵测试。在第二十三次谈话时,如果你不告诉别人这是一个聊天机器人,它有可能通过图灵测试。
但你是对的,虽然让人或多或少不满意,但微软小冰也还算是一个巨大的里程碑。因为如果你把它看成是一位慢吞吞的用户,你问了一个问题,然后它先进行查询,接着抽出上百个答案,再对这些答案进行等级排序,然后看看有多少能成功地继续对话或者是得到竖大拇指或者笑脸表情作为回复,最后给你一个答案……这就是微软小冰的运作方式,一旦你对此了解,它就不那么有趣了。
【彼得】:这是真的。至于要在使用小冰聊天机器人的帮助下实现目标,或者完成任务,在某些情况下,微软小冰确实能给予极大帮助。如果有人说,“我在市场上买了一款新的智能手机,我想要的是更大的平板手机,但我还是希望它能装进我的钱包里。”小冰能出奇有效地告诉你这个问题的答案,因为这个问题是很多人在购买新手机时都在谈论的。
但与此同时,小冰可能不太擅长帮助你决定住在哪家酒店,或者帮助你安排下一个假期计划。它或许能提供一些指导,但也许并不完全是深思熟虑后的正确指导。还有一件事要说的是,今天,至少在我们谈论的规模和实用性上来说,在很大程度上,我们是在从数据中学习,而这些数据本质上是来源于人类思想和活动的数字产出。还有另一种观点,小冰虽然通过了图灵测试,但它在某种程度上还是受到了人类智能的限制,因为它所能做的几乎每件事都是通过别人的行为来观察和学习。我们不能低估未来系统的可能性,届时,这些系统对数据依赖程度较低,能够理解世界的结构还有一些问题,并从中学习。
我注意到,我从来没有回答过这个问题。我从来没有给出答案,所以它还是无法回答。