当前位置:首页 > 产品运营 > 正文

1. 什么是问答系统?

图2:阿里巴巴小米客服机器人2.问答系统框架

问答系统通常包括三个环节,NLU(自然语言理解)、DM(中央控制平台)、NLG(自然语言生成)。 DM主要包括两部分:对话状态跟踪和策略学习。

如下图所示,NLU主要分析用户问题,可以理解为将用户问题转换成机器可以理解的语言。 对话状态跟踪主要是获取当前状态,可以理解为机器人理解的用户问题的状态。 策略学习主要是根据当前系统状态采取的策略(比如用户可能想在这里查询一个地址,那么返回策略就和查询地址相关)。 NLG是对用户问题的回复,可以理解为用户最终会看到的机器人返回的结果。

图3:问答系统框架

3.问答系统的类型

按任务类型

1.任务导向型机器人

用于完成用户特定的任务,机器人利用语义来执行后台已经连接的能力,帮助用户完成特定的任务。 例如,预订酒店、销售产品等。

特点:智能决策、状态转移、槽位填充、多轮问答。

2.抢答机器人

用于回答用户的问题。 机器人的回复来自特定的知识库,并以特定的回复回答用户。 比如百科问答相关的机器人或者产品客服机器人。

特点:问答模型、信息检索、单轮聚焦。

3.聊天机器人

与用户无目的聊天时,机器人的回复没有任何限制,而且回复大多有趣、个性化。

特点:开放域名、个性化、内容丰富。

根据解决方案

基于搜索词的问答系统

根据问题在数据库中搜索最接近的问题,并返回对应的答案。

特点:稳定可控,缺乏灵活性。

基于生成的问答系统

直接从实际问题生成答案。

特点:答案比较丰富,相对灵活,生成的答案不受控制。 (主要用于聊天机器人)

4.问答系统流程

图4:问答系统流程

预处理模块的目的是让用户的问题尽可能标准化,并尽可能与预定义的问题模式一致。 比如文本场景,后续的解决方案都是针对标准用户问题,但是用户输入错误(同义词、同音词)的问题却不可避免。 如果不考虑这个问题,线上效果和线下效果会不一样。 差别很大。

召回模块旨在获得候选答案。 通过知识库检索可以获得候选答案。 检索方式分为文本检索(tfidf、bm25等)和向量检索(faiss等),也可以通过seq2seq(循环神经网络、gpt等)直接生成答案。 用户问题可能有多种可能的答案。 这里我们要尽力找出所有可能的答案,因此召回模块更注重召回率(想象一下,如果召回模块没有召回正确答案,那么后续的精细排名模块无论效果如何,它不可能向用户返回正确答案)。 同时,召回模块不能返回过多的候选答案,因为后续的精细排序模型一般都是结构比较复杂、耗时比较长的模块。 如果召回模块返回太多候选者,精细排名模型将无法处理。 时间也会相对延长,导致整个过程耗时更长。 因此,召回多少名候选人是一个需要权衡的问题。 常见的召回数量从数十到数百不等。

精细排名模块的目的是对召回模块返回的候选答案进行评分和排序。 可分为双塔式或交叉式。 划分的依据是用户问题和候选答案之间是否存在特征交互。 双塔模型需要分别对用户问题和候选答案进行编码,然后计算两者之间的相似度(如Sentence Bert所做的)。 交叉模型会在用户问题和候选答案之间进行特征交互(例如通过[sep]将用户问题和候选答案放在一起输入到bert中,然后计算两者相似度的方法)。 由于cross模型做的是特征交互,所以cross模型的效果普遍优于双塔模型(最近流行的对比学习有效提升了双塔模型的效果,包括simcse、consert、pairupcon等) .)。

决策模块的目的是决定返回给用户的答案。 细化排名模型将为每个候选答案分配一个分数,默认情况下将返回得分最高的候选答案。 然而,有可能所有考生的分数都很低。 此时认为所有候选答案都不符合要求,需要采取对冲策略。

5.问答系统的一些趋势

多模态,能够以多种模态解决问题,以多种模态回答问题

多任务、成熟的问答系统具备任务型机器人和聊天型机器人等相结合的能力,不仅可以满足用户对某些特定任务的需求,还可以进行普通的聊天。 (包括微软小冰、阿里巴巴小米在内的很多机器人都包含多种机器人能力)

挖掘在线语料,预训练模型的兴起极大地提高了自然语言处理的能力,因此能够通过无监督学习挖掘互联网上的有用信息也是一项非常重要的能力。

用户建模,真实模拟用户行为,迭代相应的对话系统。

建立具有长期目标的系统。 伟大的计划很难一蹴而就,所以在设计计划的时候也有一个长期的迭代优化计划。

--

对NLP感兴趣的朋友可以关注我的公众号NLP日志。 也欢迎您加入NLP学习交流群。 NLP登录学习交流群,一起学习,一起进步。 您可以通过发送群组到公众号的方式加入群组。 。 我们的目标不是内卷,也不是害怕内卷。

--

参考链接

(微软小冰)同理心社交聊天机器人小冰的设计与实现

arxiv.org/pdf/1812.08989v2.pdf

(阿里巴巴小米,ACM2017)AliMe Assist:打造创新电商体验的智能助手

arxiv.org/pdf/1801.05032.pdf

(sentence-bert,EMNLP2019)Sentence-BERT:使用 Siamese BERT 网络进行句子嵌入

arxiv.org/pdf/1908.10084.pdf

(simcse,emnlp2021)句子嵌入的简单对比学习

arxiv.org/pdf/2104.08821.pdf

(美团consert,ACL2021)ConSERT:自监督句子表示迁移的对比框架

arxiv.org/abs/2105.11741

(pairsupcon,EMNLP2021)句子表示的成对监督对比学习

arxiv.org/abs/2109.00542

0
收藏0

最新文章

随机文章

取消
扫码支持支付码