2024年5月26日
北京朝阳区中电发展大厦
元宇宙科技 虚拟现实

田有为:突破数字人与人之间的交互壁垒

元宇宙概念问世至今,虚拟世界正在缓慢拓展至现实世界。交通、医药、建筑等与我们生活息息相关的领域都在发生缓慢变化。服务作为各行各业的目标之一,连同服务业本身也都在向虚拟方向发力。
服务的本质是给客户提供一个满意的有价值的感受,它可能是一个有效的信息,也可能提供了一份愉悦的体验。若具体到客服行业,云问科技的虚拟人产品线顾问田有为表示:“客服的本职工作是给客户提供相对准确的信息,即把相关的学习类型,数据类型,以一个比较合理的搭配方式,更高效易懂地传给客户。”
从0到1学习交流
田有为表示:“从无法交流到能够随地而谈,AI也需要经历人类的学习、理解、思考和补充四大过程,对应到AI层面就是知识搭建、语义理解、语义处理和自主学习。”
知识搭建即学习,但它不是图囵吞枣,直接灌输给计算机的方式,而是一个缓慢有序的过程。一般情况下,在数字人客户服务层面,知识搭建可以分为三个维度。
首先是界面式地简单寒暄,比如我们与智慧大屏中的虚拟人进行简单的交流,问题通常为“你好吗,今天天气怎样等。”其次在特定的业务场景下,如银行咨询或酒店预定,能够进行一问一答的交互。最后在更具象的层面,如处理复杂的多人交互时,就对AI系统的处理能力,包括语义理解和语言处理的要求就会很高。
语义理解则注重如何让AI读懂客户在说什么,在做什么。无论是文本客服,还是语音客服,都需要让AI知道客户的话中含义。田有为表示:“若学习是基础,那么理解就是关键。”云问科技就利用了中文分词算法、词泛化、句向量、拼音标注等技术,将客户反馈的话术拆分为机器或软件能转化的结构化数据、可操作的对象,实现抽象概念的理解。
语言处理即知识匹配,AI要在理解客户的需求意图之后,结合现有知识库的信息材料,得出最优解,并从客户话术、情绪、喜好等方面综合出发,给出现阶段最合理的应答或推荐。
自主学习可以理解为是一个反馈的过程,田有为表示:“对于客服行业,或数字人客服来说,可以将反馈问题整理为三点,分别是回答错误的问题、无法应答的问题、更好的应答话术。”
AI数字人对话的四大模型
知识搭建、语义理解、语言处理和自主学习四个功能即为云问科技搭建的语义中台。但在实际对话中,对当前环境、现有信息的感知和扩展能力,以及对同类信息的收集整理举一反三能力等也尤为重要。
对于AI端或虚拟数字人,它们就需要深度学习,理解环境等内容,进行组合、训练,创建各种模型,包括意图模型、推荐模型、抽取模型和情绪模型。
意图模型必须在特定的机构或者业务场景下,根据客户反馈的信息判断客户的需求,如饭店点单场景,用户说“我要吃饭了,菜单给一下”,这些信息对于机器人而言是可以被“理解”的。然而,一旦存在部分客户以不同的说法进行反馈时,此时的AI系统或数字人是无法处理的。因此意图模型应用场景较广,但应用面不高。
推荐模型可以借助用户画像层面来理解,比如在访客的认证系统之上,我们根据面部识别,确认客户当前身份后,获取他们的历史交互数据,并在用户画像的标签或属性的加持下,向其推荐感兴趣的话题,或展示他们最喜欢的状态。
抽取模型则一般应用在多轮交互等比较复杂的业务过程,除去简单的一问一答对话,多轮交互需要与多方系统对接,获取对方系统数据基础,在此基础上,与访客进行交涉沟通。
情绪模型也很重要,田有为认为:“对于虚拟人或数字人来讲,它的重要程度非常高。因为你必须能够读懂客户的情绪,才能给出相应的反馈。”这些反馈可以是面部上的一个反馈,也可以是动作上的反馈,毕竟人与人之间的交互,光凭口说是无法进行一个完全的感知。
突破数字人与人之间的壁垒
即使虚拟数字人能够从0到1学习交流,也在不断地训练相应的模型,但数字人与人之间仍然存在壁垒和差异。
首先是感应差异,目标受限。对于人来说,我们在视觉、听觉和味觉等方面的感知是非常明显且直接的,我们也可以很好地感知到沟通双方情绪、状态、心情等。这些对于AI的物理检测来说,很难做到。
并且,AI系统是由人类设计的,它的所有智慧来源于它的设计团队,且囿于设计团队的目标,无法扩张。一旦突破现有环境,目标适应性就大大降低。比如将商场入口处的虚拟人转移到其他场景下,虚拟人的原有目标或者服务机制将被破坏,它需要被重设一套机制才能“正常”运行,非常被动。
其次,机器和人还有一个最大的鸿沟就在于逻辑易懂情绪难分。人和动物都存在感觉感受感知,他们的行为中充斥着大量的情绪因素,即便在本能和行为层面,也都容易受到情绪影响。但是AI数字人不行,尽管它有强大的计算与存储能力,使得结构化的事物和信息是能够在极短的时间做到非常好的处理,但它的情绪区分别表达还很简单。
那么,如何突破这些壁垒,田有为认为:“比较好的方法是能够将AI系统与人的共同领域达到一致,保证我们的规则我们的文化,我们的背景,我们的因素等各方面都能够协调的非常好。
以电影《头号玩家》为例,我们能够在虚拟世界里共用一套规则、一套领域,以共同的语言进行交互,在这个时候,我们或许就可以做到与虚拟人,或者虚拟世界进行真正的沟通。

专家观点分享
(点击文字即可跳转阅读)
西门子-石银明博士 | 51WORLD-张焜棋 
易知微科技-阚海明 | 悉见科技-刘怀洋  

智汇云舟科技-陈虹旭 | UINO优锘科技-纪德勇

天行智能-安武 |商汤科技-杨燕


发表评论

您的电子邮箱地址不会被公开。