摘要: 了解如何注册CHAT GPT账号,获取CHAT GPT官方网站账号申请教程,购买CHAT GPT账号,及账号购买平台。
大语言模型“忽如一夜春风来”,作为最佳应用实践战场之一的智能客服领域,各厂商经过短暂的观望之后纷纷出手。落地应用最先开展的场景之一便是知识库自动扩写,这也是AIGC能力在智能客服中最简单直观的展现。
一、AI训练师的“神器”?
智能客服领域的一个难点在于知识领域限制较多,AI机器人必须被限定于企业账户级的知识库中。智能客服中的知识库即为一个限定领域的企业私有知识库,在没有配置外接知识库的情况下,AI文本和语音机器人都会在此知识库范围内进行问答。因此智能客服机器人的智能化程度,受限于知识库的完善程度。运营得当的企业会进行大量的知识库维护工作,帮助机器人校准回答水平。对于重度使用智能客服AI机器人的用户,这是一项高度依赖人力的工作,必须配备专职的AI训练师进行话术流程搭建和知识库维护工作。AI训练师的工作流程包括:分析客户话术流程需求、设计话术流程模板、搭建话术知识库、测试话术流程、配合上线、收集运营数据反馈调优等。这既包括大量的产品操作性工作,也包括大量的客户沟通。其中对知识库的编写工作是最耗时费力的工作之一。有经验的AI训练师会借助积累的通用知识库、领域知识库和常用模板来实现快速冷启动,同时还需要对对话术中的详细知识点进行针对性扩写,这是绕不开的一个工作。借助大模型能力协助AI训练师进行知识库扩写,就是为了解决她们的效率问题。
二、AI扩写实现方案
要实现智能客服知识库的自动扩写,可以借助大语言模型。具体实现方案需要考虑以下几个方面:
-
选定知识库和知识点:从现有知识库中选定需要扩充的知识点,如概念、实体等。这决定了扩充内容的范围和方向。
-
收集相关语料:通过各种方式收集与选定知识点相关的语料,如网页数据、文献数据、问答数据等。语料的规模和质量直接影响生成文本的效果。
-
选择语言模型:选择一个合适的预训练语言模型,如BERT、GPT-3、Transformer等。不同模型适用不同类型和规模的数据,模型性能也不同。
-
设计定制模板:根据扩充目标设计定制模板,如概念解释模板、问答模板、例句模板等。模板的设计指导和规范了语言模型的生成过程。
-
构建生成框架:构建一个生成框架,将语言模型、语料和定制模板有机结合,使其协同工作完成文本生成任务。框架的关键在于输入与输出的有效衔接。
-
生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。
-
评估和筛选:采用自动评估与人工评估相结合的方式对生成文本进行评估和筛选,选择内容丰富、准确度高和最符合要求的文本。
-
添加到知识库:将选择出的扩充文本添加到对应的知识点下,以实现知识点的详细描述和内容扩充。
-
持续监测与优化:持续监测已添加扩充文本的有效性,并收集用户反馈意见。根据反馈进行生成框架的优化,不断提高扩充质量。
-
重复迭代:对更多知识点重复上述步骤,逐渐实现知识库的广度和深度扩充。
在实际实现中,需要注意语料和模板的选用、框架的设计、生成文本的筛选,以及优化机制的构建等方面。良好的设计可以大大提高自动扩充的效率与效果。同时,人工参与也是关键,特别是在评估选文本和优化框架的过程中。
三、对正则表达式的扩写
针对机器人知识库中常用的正则表达式,也可以借助大语言模型进行自动扩写。具体实现需要考虑以下几个步骤:
-
深入解析问句正则表达式:利用正则表达式解析技术深入理解其表达的语义和信息,提取关键词、概念、变化范围等,准确把握其表达意图。
-
构建正则模板:根据解析结果设计多个正则表达式模板,代表不同的问句表达形式和角度。模板中包含可替换的词汇或符号作为槽位。
-
填充词汇/变换:根据实际语境,为正则模板的槽位填入相关词汇或变换模板中的符号,形成新的正则表达式。词汇/符号的替换将产生语义相似但结构略有变化的新的正则表达式。
-
组合生成:将不同的正则模板按照一定策略组合,并为不同模板的槽位填入词汇/变换模板,形成更复杂的正则表达式,代表更广泛的问句形式。
-
评分与选择:对所有生成的正则表达式问句,根据语义相关度、复杂度等标准进行评分,选择最优的若干个表达式。然后人工选取其中最佳的几个表达式。
-
优化与提高:分析选取的结果和人工反馈,优化正则模板、词汇列表和变换策略,产生更高质量的候选正则表达式,不断提高生成效果。
因此,要实现正则表达式问句的自动生成,关键是要深入理解正则表达式的语义,设计正则模板并通过填充词汇和变换模板生成候选表达式。然后通过评分选择、优化提高,最终生成高质量的相似正则表达式,满足问句的扩充要求。
四、实例:知识库扩写生成测试
我从实际的AI机器人知识库中随机抽取了几个场景的问题,拿来让AI测试自动扩写生成。以下是AI生成的备选扩写句子:
- 黑金卡免费停车卡为什么不能马上使用?
- 为什么开通了黑金卡免费停车服务后不能直接使用?
- 申请黑金卡免费停车卡后为何要过一段时间才能正常使用?
- 开通黑金卡专属免费停车服务为何需要等待一定时间才能使用?
- 享有黑金卡免费停车权益为什么首次使用要待一段时间?
-
黑金卡停车卡申请下来为什么不能立即启用使用?
-
高端领军人才怎么申请人才公寓?
- 高端领军人才如何申请人才公寓的资格?
- 高端领军人才申请入住人才公寓需要满足什么条件?
- 高端领军人才想申请人才公寓,需要准备什么申请材料?
- 高端领军人才申请人才公寓的流程和步骤是什么?
-
高端领军人才要申请人才公寓,需要符合什么要求和标准?
-
你是真人吗?你是不是机器人?
- 你是人工智能聊天机器人吗?
- 你是真实的人类用户还是AI系统产生的效果?
- 我们现在的交谈对话是和真人进行的还是和机器人系统?
- 我现在与之交流的对象是人类用户还是人工智能聊天机器人?
-
我们此刻的对话是在跟真人对话还是在跟聊天机器人对话?
-
别打电话了,不要再联系我。
- 别电话,别再电话,别给我电话。
- 莫打电话,莫再打电话,联络过。
- 别联络,别再联络,天天打电话。
- 老电话,老是打电话。
通过AI扩写生成的文本,可以看出大语言模型在知识库扩写和正则表达式扩写方面的应用潜力。AI在这些方面的自动生成能力将极大地提高内容的多样性和效率,为智能客服等领域的应用带来更大的便利和效果提升。
三、对正则表达式的扩写
针对机器人知识库常用的正则表达式的自动扩写,也可以通过大语言模型进行自动扩写。需要考虑的内容包括:深入解析问句正则表达式,构建正则模板,填充词汇/变换,组合生成,评分与选择,优化与提高。
带有组合关系的正则表达式(且&):
Q:(再联系|没)&(时间|有空)
A:
-
(再联络|空余)&(时间|有闲)
-
(再联系|没)&(时间余裕|有空闲)
-
(再联系|能抽出)&(时间|空出来)
-
(再联系|有)&(时间可以|空可以)
-
(联系|如果)&(有时间的话|时间方便)
这些方法可以实现正则表达式问句的扩写,使得生成的问句更加丰富多样,满足不同用户的需求。
四、实例:知识库扩写生成测试
相似问的AI自动生成:
我从实际的AI机器人知识库中,随机抽取了几个场景的问题,拿来让AI测试下自动扩写生成(Q为原句,A为AI扩写的内容,每次生成5句备选)。
Q:黑金卡免费停车卡为什么不能马上使用
A:
1. 为什么开通了黑金卡免费停车服务后不能直接使用?
2. 申请黑金卡免费停车卡后为何要过一段时间才能正常使用?
3. 开通黑金卡专属免费停车服务为何需要等待一定时间才能使用?
4. 享有黑金卡免费停车权益为什么首次使用要待一段时间?
5. 黑金卡停车卡申请下来为什么不能立即启用使用?
Q:高端领军人才怎么申请人才公寓?
A:
1. 高端领军人才如何申请人才公寓的资格?
2. 高端领军人才申请入住人才公寓需要满足什么条件?
3. 高端领军人才想申请人才公寓,需要准备什么申请材料?
4. 高端领军人才申请人才公寓的流程和步骤是什么?
5. 高端领军人才要申请人才公寓,需要符合什么要求和标准?
Q:你是真人嘛?你是不是机器人?
A:
1. 你是人工智能聊天机器人吗?
2. 你是真实的人类用户还是AI系统产生的效果?
3. 我们现在的交谈对话是和真人进行的还是和机器人系统?
4. 我现在与之交流的对象是人类用户还是人工智能聊天机器人?
5. 我们此刻的对话是在跟真人对话还是在跟聊天机器人对话?
Q:别打,别再,别给我打,不要打,不要再打,联系过,不要联系,不要再联系,天天打,一直打,老是打
A:
1. 别电话,别再电话,别给我电话,莫打电话,莫再打电话,联络过,别联络,别再联络,天天电话,老电话,老打电话
2. 不要打钟,不要再打钟,不要给我打钟,不要打钟,不要再打钟,联系过,不要联系,不要再联系,天天打钟,老打钟,老是打钟
3. 不要响铃,别再响铃,别给我响铃,不要响铃,不要再响铃,联络过,别联络,别再联络,天天响铃,常响铃,老响铃
4. 别打扰,别再打扰,别给我打扰,不要打扰,不要再打扰, 联系过,别联系,别再联系,天天打扰,老打扰,经常打扰
5. 别骚扰,别再骚扰,别给我骚扰,不要骚扰,不要再骚扰,联络过,别联络,别再联络,天天骚扰,老骚扰,常骚扰
带有组合关系的正则表达式(且&):
Q:(再联系|没)&(时间|有空)
A:
1. (再联络|空余)&(时间|有闲)
2. (再联系|没)&(时间余裕|有空闲)
3. (再联系|能抽出)&(时间|空出来)
4. (再联系|有)&(时间可以|空可以)
5. (联系|如果)&(有时间的话|时间方便)
以上是AI根据给出的问题进行的扩写,可以看出大语言模型在知识库扩写和正则表达式扩写方面的应用潜力。通过AI的生成能力,可以大大提高内容的多样性和效率,为智能客服等领域的应用带来更大的便利和效果提升。