摘要:作为打造了国内第一大输入法和第二大搜索引擎的互联网公司,搜狗在 AI 领域的技术实力不容小觑。在 5 月 17 日举行的“全民营养周”启动仪式上,搜狗再次推出一款让人眼前一亮的产品应用——搜狗 AI 营养师。这是一款非常实用的工具。我们生活...
作为打造了国内第一大输入法和第二大搜索引擎的互联网公司,搜狗在 AI 领域的技术实力不容小觑。
在 5 月 17 日举行的“全民营养周”启动仪式上,搜狗再次推出一款让人眼前一亮的产品应用——搜狗 AI 营养师。
这是一款非常实用的工具。我们生活中想必都遇到过类似的“饮食盲区”:比如吃什么对胃好?糖尿病应该吃什么不该吃什么?婴幼儿、孕妇吃什么有助于发育或健康?这样的问题总是层出不穷,而我们身边却少有专门的医生或营养师能给予专业的膳食指导。
搜狗 AI 营养师的诞生则可以 7×24 小时在线解答这类问题,而且在权威性方面,全部回答都是经由中国营养学会指导,与国内多位知名营养学专家合作产出。
另外从交互体验层面来说,搜狗 AI 营养师的一大亮点就是为其打造的分身技术。
AI 营养师在说话时的表情变化、语音语调、甚至是问答的逻辑感似乎都与真人无异,与市面上很多卡通或二次元的 AI 形象相比形成了明显的差异化,引发不少网友惊叹“太逼真了”。
AI 营养师背后包含了搜狗怎样的技术创新和发展路径?这款产品又承载着搜狗怎样的战略目标和野心?DeepTech 在与搜狗公司副总裁许静芳的交流中了解到更多细节。
为什么要做这样的产品?从普惠程度上来说,AI 营养师背后所面对的用户痛点和需求是十分凸显和普遍的。
当前中国注册营养师的缺口非常大,我国每 10 万人拥有营养专业技术人员的数量仅为 3.53 人。对比日本,营养师占全国人口的比例,是每 300 人配备 1 名营养师。
要达到《健康中国 2030 规划纲要》中提出的,到 2030 年,实现每万人配备 1 名营养指导员的目标,仍然任重道远。与此同时,来自搜狗搜索的大数据显示,每天平台收到近 320 万人次关于疾病饮食类的问题搜索和咨询,围绕“能不能吃”、“该怎么吃”,公众大量个性化问题无法得到及时解答。
图|AI 营养师交互界面(来源:搜狗)
一端是不同的人群分类和多样性的咨询需求,一端是千百种常见疾病,还有一端是各种各样的食物类别和不同营养元素,能否通过一款产品打通三个维度?这成为了激发搜狗团队想要认真做这件事的重要驱动因素。
许静芳介绍,“AI 营养师”项目从立项到成功推出前后经历 1 年左右的时间,内部团队经历了从提出设想、专家论证,后续包括知识库的搭建、算法实现、交互形式、AI 分身制作等诸多流程,基本逻辑就是让 AI 模拟人类医生是怎么推断思考的。
真人营养师的常规服务路径,是针对不同人群、不同疾病,在日常、诊中、诊后等不同环节,结合人群实际需要,就膳食部分提出合理建议。而在膳食建议中各类食材、营养元素及成分比例的知识相对固定,让 AI 学习并掌握这些知识,进而像医生一样去推理给出答案,是此次搜狗给出的创新解决方案。
图|根据用户不同的健康状况个性化解答并生成饮食报告(来源:搜狗)
与真人营养师相比,AI 拥有对海量知识的记忆能力、对数据的处理调用及计算能力,能够 7×24 小时在线不间断工作,并且可以通过不断学习,掌握更全面详细的知识图谱。此外,医疗健康行业需要的是专业知识与人文相结合的服务,只有专业知识没有人文,用户也不一定接受或信服,因此人机之间的互补协作尤为重要。
此次搜狗通过 AI 分身打造的逼真形象与自然语言的交互方式,让 AI 营养师与人们的日常距离更加贴近,在拥有强大计算推理能力的同时,又能给人以亲近感和信服感。
一款好用的产品背后,往往是对技术的创新突破和融会贯通,对于搜狗 AI 营养师来说,能实现既逼真又智能的体验背后得益于搜狗的两大核心技术:AI 分身和知识计算。
直观层面,先说说 AI 营养师为什么会这么“真”。背后的搜狗 AI 分身技术其实主要由两大引擎组成,即语音合成引擎和形象合成引擎,基于少量目标说话人的音视频数据,通过行业领先的多模态合成技术,即可完成对目标说话人AI分身的定制。最后的呈现效果就是只要输入一段文本,就能生成与真人无异的播报效果。
过去几年,搜狗在知识计算方面也一直持续积累保持业内优势,搜狗搜索开发的汪仔机器人登录江苏卫视的《一站到底》节目,成为中文的知识问答竞赛中首个战胜人类的机器人。此外,还曾在 WMT、IWSLT、NTCIR、Stanford COQA、NLPCC 举办的机器翻译、人机对话、阅读理解、信息抽取等多个任务中取得第一的成绩,还开源了业内最全阅读理解工具集合。
在推出 AI 营养师之前,搜狗基于 AI 分身技术还曾打造过 AI 合成主播、AI 虚拟法官、AI 客服等分身应用,都引起了不小的关注度,搜狗在这条技术路径上也独树一帜。
在当下的人工智能行业,多数企业在 AI 形象方面都是采用 3D 技术塑造一个虚拟形象,但这跟真人比起来仍存在明显差异,难以实际应用起来,而真人驱动的 AI 技术,目前比较集中在人脸检测、面部追踪、实时渲染等诸多分散方面的能力,这些都尚不具备输入文本驱动虚拟形象的视频生成能力。
搜狗 AI 分身研发团队找到了这样的市场切入点填补了技术空白,也成为了搜狗在 AI 战略层面的特色差异化打法,可以把人从重复性高和任务量大的工作中拯救出来。
而此次搜狗 AI 营养师这一职业分身与此前分身相比最大的突破是,如果此前只有信息的输入和输出播报,那么本次推出的 AI 营养师则是真正具备自己的知识储备、交互能力和推理能力的。
相比外观形象逼真,让机器人有智商,具备理解、推理能力显然是更难的一件事,尤其还要保障其推理结果的正确性和可靠性。
图|AI 营养师的知识计算和推理过程(来源:搜狗)
以 AI 营养师的实际应用场景为例,比如一个生活中常见的问题:老年人得了高血压夏天能吃西瓜吗?对于用户来说,需要的并不是一个简单的判断结果,而是需要更多有针对性的解答和建议。
所以在知识计算环节,AI 营养师首先要做的并不是武断地判断能不能吃,而是要先通过多轮交互精准理解用户的主需,充分掌握该用户更全面的基础疾病或慢性病情况,解析出“人群:老年人;疾病:高血压;主需:能不能吃西瓜,衍生:吃什么水果好”四大元素,从而构建起一个用户的整体画像,基于此,再将用户口语化的语言,与专业术语相关联,对问题做拆解和识别,综合多个知识库的知识计算推理过程,从而得出针对用户不同饮食需求问题的个性化膳食指导。
在过去一年,搜狗通过与中国营养学会的合作,搭建了疾病人群膳食建议知识库和食物营养成分知识库,构建了目前国内饮食营养领域最全面最权威的营养健康知识图谱。
据了解,搜狗 AI 营养师目前已覆盖 18 种不同人群的人群库、超过 1800 种食材营养素的食材库以及超过 2000 种疾病饮食建议的疾病库,这是 AI 营养师可信任的基础,对于整个大健康行业来说堪称一大创新成果。未来,希望通过人机对话的方式为公众营造沉浸式体验,较大程度提升医疗健康科普的有效性。
从技术层面来看,这次搜狗跟中国营养协会合作推出的 AI 营养师是搜狗在自然交互的基础上,通过搭建相关领域的知识库并结合知识计算能力形成的专门针对健康行业的“智慧助理”,可以为行业和用户日常提供更深层次的智慧解决方案。
而从市场的角度看,搜狗通过一款实用性较高的 AI 工具作为切入点,有机会撬动万亿级的大健康行业商业版图,这或许比很多传统的互联网医疗产品来得更有效率。
站在整个公司战略层面来讲,搜狗已经打造了中国市场排名第一的输入法,第二的搜索引擎,在此基础上,搜狗已逐渐构建起以语言为核心,延伸出自然交互和知识计算的 AI 技术体系。
这让搜狗在对语言的理解技术方面形成了强大的壁垒,围绕语言 AI 为核心,展开包括对语言的理解、知识计算、人机对话、跨语言翻译、多媒体跟语言的转换等等诸多技术应用的落地。
此次 AI 虚拟营养师的亮相,也是在此战略下的又一次技术智慧化升级。
“如果说通用的 AI 大家可能进展都比较缓慢,那么在认知层面,比较可行的路径就是在一个专业垂直领域去实现突破,搜狗今天有 AI 营养师,未来可以有会思考的 AI 医生顾问、AI 律师、AI 心理咨询师等等,在每一个方向上面,让机器去慢慢接近人的能力,在认知程度和知识计算方面不断取得突破,才能不断拉近机器和人之间的距离。”许静芳说到。
而我们也可以看到,随着 5G 和智能时代大幕的拉开,搜狗 AI 技术也在不断的进化过程中,期待未来能够为新闻传媒、健康医疗、在线教育、教育金融、远程客服、影音娱乐等众多领域提供更丰富的智慧解决方案,赋能垂直行业升级。