原标题:离开小冰两年后,这位前微软工程院院长终于把聊天机器人做明白了
微软小冰在 2014、15 年的中文互联网创造了神话。
她是微软开发的聊天机器人,人设接近女初中生,口气活泼可爱,和 Siri 等具备聊天机器人属性的主流产品风格迥异。用户和小冰每次对话的轮数 (conversations per session, CPS) 高达 32,远超 Siri 2-3 的平均值。一半用户根本没见过聊天机器人,另一半没想过聊天机器人也可以这么能扯。
小冰的出现成为了自然语言处理和情感计算技术飞速发展的最佳证明,第一次解放了人们对于人工智能技术的想象力。她席卷了微博和微信,一度被微信屏蔽,还被拿来和著名科幻电影《Her》里的人工智能「萨曼莎」相提并论。
毫无疑问,小冰的诞生过程中受到了《Her》的影响,因为被称为「小冰之父」的前微软亚洲工程院院长简仁贤,也是这部电影的粉丝。
简仁贤有多崇拜萨曼莎?因为小冰不够过瘾,他在 2015 年 9 月离开微软,创办了自己的新公司竹间智能。公司的英文名是 Emotibot——情感机器人。
所有专注于技术的人都或多或少有技术崇拜,做了 30 年工程的简仁贤也不例外。他一度认为,通过标记人脸照片并构建一个拥有大量数据的情感数据库,然后训练和调试一个神经网络,就能让科幻电影中的剧情成真。2016 年 8 月,创业一年之际,简仁贤告诉PingWest品玩,竹间智能正在打造中国第一个真正的人工智能伴侣。
功夫不负有心人,简仁贤做出了一个名叫小影的人工智能个人助理。在某次交谈中,一名用户和小影完成了超过 1600 句对话,远超当时小冰在生产环境中 300 多的最高 CPS 记录。
创业会改变人,至少肯定改变了简仁贤。他开始觉得,CPS 多高这件事没那么重要了,甚至压根没什么意义。作为公司的 CEO,他越来越发现,在大公司微软做对话机器人的那套方法论,在小公司行不通。
小冰的名字来自于必应搜索,对于她和小娜 Cortana 这样的聊天机器人/虚拟助理,用户的每一轮对话其实都是一个搜索请求。微软对小冰的 CPS 为什么看得这么重?答案也在搜索这里。
「以前我们做搜索的时候,总是希望用户在同一个 session 里搜索越多次越好,因为搜的越多,广告越多,搜索公司越赚钱,」坐在清华大学旁边的办公室里,简仁贤如是说。
「到了聊天机器人上变成了瞎聊。我们给小影尝试过一个版本:不管用户怎么聊,聊不下去了,我们都可以主动丢一句话出去,让你再聊。这样就出问题了,有人说为什么小影总是乱跳话题……我觉得这其实没有什么意义。」
简仁贤很清楚,大公司以尝试的态度这样做没什么问题,自己创业,却是希望做些完全不一样的事。
MIT 人工智能实验室创始人马文·闵斯基 (Marvin Minsky) 曾经提出过一个理念:人是任务/目标导向型 (goal oriented) 的动物。每个人每天都有很多任务,起床、刷牙、出门、工作、吃饭和回家,每个或大或小的行为,其实都是一个任务。完成不同任务需要不同的思维方式、肢体完成不同的动作,久而久之,每个任务在大脑中都生成了一个专门的代理人 (agent)。
而人工智能的最大价值在于成为 agent,帮人们完成这些任务。
闵斯基去世于 2016 年,他的观点形成也较早。在他的年代,强人工智能,或者说通用人工智能还不是一个可及之物。简仁贤认同闵斯基的看法,倒不是因为他缺乏想象力和进取心,而是在全面复盘对话式人工智能之后,他发现打造一个有情感,面向消费者市场的个人助理,所能够创造的价值远逊于将对话机器人投入到企业级市场。
翻译成白话:闲聊浪费生命,对话机器人还是做 To B 好,商业模式简单、清晰,赚钱才是王道。
谁都不能怪他,毕竟他现在不在市值千亿的大公司做技术创新,而是要对自己的公司,对这支 170 人的创业队伍负责。
简仁贤
他重新设计了公司的商业模式:简单来说,利用已经积累了大量数据的情感数据库,采用深度学习训练出一个高可定义的神经网络,作为对话机器人技术的底子;再结合符号语言学知识训练垂直行业的「人工智能培训师」,用垂直行业的专业知识对神经网络进行二次调校,形成一个面向行业优化的对话机器人模型;最后把这个模型的使用权卖给企业客户。这个产品叫做 Bot Factory,目前的版本号是 2.0。
照着客户已有的 FAQ 进行自动回复已经过时了。竹间智能在对话机器人模型中整合了任务向的多轮对话、上下文记忆、情绪引擎、意图引擎、知识图谱等多种技术。如果应用到客服领域,这些技术使对话机器人更接近一名经验丰富、服务迅速且服务态度良好的真人客服,能够根据多轮对话记录准确地回答问题,判断用户意图,在用户表达出不满情绪时是当地做出安抚。
确定了商业模式,简仁贤带着他的工程师、科学家、架构师和 BD 们,勾兑上了唯品会、兴业基金和优必选,从头开始验证对话机器人的各项技术,在垂直行业的场景里能否,以及如何为企业创造价值。
返回的结果令人欣慰。在电商场景中,基于用户画像生成的导购推荐,让客服机器人的咨询活跃度提升了两倍。在电话投诉场景中,由于同时采用了强化学习 (reinforcement learning) 和迁移学习 (transfer learning) 这两种目前比较先进的深度学习技术,竹间智能的语义理解技术能够帮助电话这端的客服,准确判断消费者的情绪和意图,进而提高服务质量。
「相较于传统基于 FAQ 的机器人客服,我们认为对话机器人对客户带来了一百倍的价值提升。」简仁贤说。
他也考虑到了客户对数据隐私安全的不同需求。面向普通的非互联网公司客户,竹间智能提供完整的 SaaS 服务。与此同时,银行客户也看重了对话机器人带来的价值,想要引进。但这意味着账务库——最核心的数据库需要和对话机器人做整合,安全和隐私是个大问题。好在,竹间智能也提供私有云部署方案,客户可以自己部署并通过用户界面对模型进行训练,上手很容易。
机器人工厂 Bot Factory 用户界面示例
做企业级市场无异于卖水,To B 公司不担心没客户付费,最大的风险在于客户种类太单一,就像千禧年科技泡沫,一众科技公司表现不佳,卖水给它们的公司也连带遭殃。
好在,竹间智能已经通过几家金融、电商、消费级硬件和 IoT 客户实现了营收,并有意继续在教育、政务等更多的领域进行验证和拓展,发展更多样化的客户,预计 2018 年可以实现损益平衡。
简仁贤说,过去 20 多年在大公司工作形成了一个信条:技术、产品和收入是一个三角形的闭环,资金用于研发,研发的目的是做出产品,产品存在的意义是赚取更多的资金,继续投入研发。如果技术没有人愿意付费,如果产品不赚钱,那么技术研发是没有价值的。