健康有益:AI技术破解健康管理难题
2018-01-18 18:45:58     [查看原文]

近日,健康有益发布了与京东、科大讯飞等多家企业的合作信息,将整合在健康管理、智能电商平台、人工智能等方面的资源和技术优势,合力打造多场景下的健康生活,推动精准健康产业的发展。

健康有益成立于2014年9月。创立三年来,利用人工智能与生命科学等技术,专注于探索和创新健康领域的研究实践、应用落地与解决方案,打造AI精准健康管理开放平台。希望人们科学管理生命,重健康而轻医疗,通过饮食、运动、生活方式及心理调节即能实现健康生活,降低疾病发生的可能性。

在探索过程中发现,健康管理领域面临很多难题,如健康信息的收集难度较大、个性化健康管理难实现等。针对这些行业难题,健康有益团队通过建立自然语言处理组、机器视觉组、强化深度学习组来综合解决,目前已经取得了一些成果。

自然语言处理:

自然语言处理领域主要包含开放域聊天对话技术、基于任务的单轮多轮对话技术、机器翻译技术和舆情监控技术等。健康有益研发人员在健康管理领域主要是利用基于任务的单轮、多轮对话技术,基于该技术实现用户的健康语音记录和健康咨询服务。

基于该技术,团队构建了基于健康管理任务驱动的对话框架,具体如下:

第一步语音识别,主要通过深度学习LSTM将声音转化成文字。

第二步自然语言理解,这个部分简单来讲就是将一段文字进行结构化表示,所谓结构化表示就是建立slot-value pair的过程。例如“我将在11点30分吃午饭”。这个句子中就包含了两个slot, 分别是时间和动作。时间对应的value是11点30分,动作对应的value是吃午饭。

第三步对话管理,这个部分主要实现的是意图识别,以及某个意图所对应的对话行为。状态跟踪就是意图的识别,slot里面的value有可能对应的是一个意图。比如“我想吃饭”,吃饭作为value,对应的意图有可能是希望查询周边的用餐信息,也有可能是希望直接推荐餐单进行订餐,对应value就会有多个意图。而每个意图又对应了产生的动作。查询周边的意图对应的动作就是推荐周边的餐馆信息,订餐意图对应的动作就是提供订餐功能。那么什么时候用户会选择查询,什么时候用户会选择订餐,如何确定,这就是对话策略。

第四步,确定好应对策略后,结合数据库中的知识,自动生成相应的对话,与用户进行交互,这就是自然语言生成。

第五步,语音合成,就是将生成的自然语言文字,转化成语音播放出来。

以上就是健康管理任务驱动的完整框架。

机器视觉:

机器视觉主要包含了图像、视频识别、三维重建、运动检测等相关技术。健康有益团队目前主要采用了图像识别技术和三维重建技术,图像识别技术主要用于食物识别。

食物识别主要采用CNN中的ResNet(残差网络),主要分为卷积层,池化层,全连接层,分类层。卷积层主要实现的是特征提取,通过不同的卷积核来提取图片的不同纬度的特征。池化层主要解决的是特征向量过多导致过拟合的问题,所以要进行降维,降维的原则是将高频分量保留,低频分量删除。经过池化后的特征向量,再进行第二次,第三次,第N次的卷积和池化,最后得到的特征向量,经过全连接层和分类层,进行特征的识别。分类层主要是对图片进行分类的方法,目前主要包含softmax和SVM两种,用的最多的是softmax。

知识图谱:

知识图谱主要分为四步,分别是信息抽取,知识融合,知识加工,知识更新。

信息抽取:主要是根据健康领域专家提供的专业信息进行分析,抽取其中的实体信息、关系信息、属性信息。实体抽取,即从专业信息中集中自动识别出命名健康领域的专业实体;关系抽取,即为了得到语义信息,还需要从相关语料中提取出实体之间的关联关系,将实体通过关系联系起来;属性抽取,即属性抽取的目标是从不同信息源中采集特定实体的属性信息。

知识融合:数据层的融合包括实体的指称、属性关系以及所属类别等。主要的问题是如何避免实例以及关系的冲突问题造成不必要的冗余。

知识加工:首先对信息进行本体构建,也就是模型建立。利用这些本体,结合实体关系进行相关知识推理,以此发现新的信息关系,以扩展和修正知识图谱的结构和内容。

知识更新:人类所拥有的信息和知识量都是时间的单调递增函数,因此知识图谱的内容也需要与时俱进。其构建过程是一个不断迭代更新的过程。

当前人工智能在健康领域已经全线爆发,但医疗占据仍较大比例。健康有益作为首批将人工智能与健康管理进行结合的科技公司,探索创新人类个性化健康管理的新方式。未来健康有益还会与更多的行业巨头企业进行合作,通过技术与健康管理的深度融合,帮助人类更好地量化生命。

本栏目中的所有页面均系自动生成,自动分类排列,采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道,包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读