专利 基于通用知识图谱的个性化智能助手构建方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210018928.7 (22)申请日 2022.01.07 (71)申请人福州大学地址 350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学 (72)发明人陈星　陈佳雯　林章颖　张铭豪　陈礼贤　 (74)专利代理机构福州元创专利商标代理有限公司 35100 代理人陈明鑫　蔡学俊 (51)Int.Cl. G06F 9/448(2018.01) G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称基于通用知识图谱的个性化智能助手构建方法 (57)摘要本发明涉及一种基于通用知识图谱的个性化智能助手构建方法。该方法将通用知识图谱引入到场景建模与开发过程中，通过基于相似度计算的API匹配与推荐以及基于特征匹配的API参数抽取方法，实现用户自然语言指令到API的自动化匹配和执行。权利要求书5页说明书13页附图3页 CN 114398109 A 2022.04.26 CN 114398109 A 1.一种基于通用知识图谱的个性化智能助手构建方法，其特征在于，包括：基于通用知识图谱的特征模型构建：根据指令的结构特征以及语义特征，借助通用知识图谱的结构化数据构建自然语言指令特征，进而构建API特征以表示场景特征；在此基础上，提出基于通用知识图谱的特征提取方法；基于相似度计算的API匹配与推荐：针对已构建好的特征模型，对用户指令计算三元组关系相似度及标签相似度，根据两者结果加权得到对于用户指令最匹配的API；基于特征匹配的API参数抽取方法：针对已构建好的特征模型，将用户指令面向匹配到的API进行标签向量化，基于标签和前置词进行指令槽值提取，得到执行API所需要的参数，完成API执行。 2.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法，其特征在于，所述基于通用知识图谱的特征模型构建的具体实现过程如下： (1)自然语言指令特征自然语言指令特征包含以下四个特征：自然语言指令三元组集合TripleSet、指令关键词集合KeySet，指令前置词集合PrepSet及自然语言指令标签集合LabelSet；定义一句自然语言指令为comd；其中， (1.1)自然语言指令三元组集合TripleSet 对于每一个自然语言指令，抽取指令三元组ti后，构成三元组集合comd.TripleSet＝ {t1,t2,...,tn}； (1.2)指令关键词K eySet 定义指令的关键词KeySet由指令中的名词和命名实体识别结果构成： comd.KeySet＝ (N,Spe)＝{k1,k2,...,kn}，其中， N为范例指令in stance中的名词集合， Spe为命名实体识别标注不为空的词语， ki为关键词； (1.3)指令前置词集合PrepSet 若关键词ki前面的词语识别为介词，记该介词为关键词的前置词ki.prep，因此指令前置词集合com d.PrepSet＝{＜k1.prep,k1＞,＜k2.prep,k2＞...,＜kn.prep,kn＞}，为每个关键词以及它的前置词的二元关系组集合； (1.4)自然语言指令标签集合LabelSet 一个词语w的标签集合可以表示为w.LabelS et＝{l1,l2,...,ln}，则自然语言指令标签集合可以表示为每个关键词标签集合的并集， comd .LabelSet＝{k1.LabelSet, k2.LabelSet， . ..,kn.LabelSet}＝{l1,l2,...,lm}； (2)API特征定义一个API为API＝{APIName,Inst ance,ParaName}，其中， APIName为应用程序接口名， Instance＝{instance1,instance2,...,instancen}为调用该API的n个自然语言范例指令， ParaName＝{slot1,slot2,...,slotm}为执行API所需填入的m个参数，这种参数限定条件也被称为词槽；执行API所需要的参数值即为槽值slotn.value；与自然语言指令特征类似，定义API特征为调用该API的范例指令的结构的特征以及语义特征；因此， API特征包含三个要素： API 三元组集合TripleSet、 API标签集合KeySet，及API词槽标签集合LabelSet； (2.1)API配置用户可以随需添加x个API配置文件，以满足自己所需要的服务场景；；对于每个应用程权　利　要　求　书 1/5 页 2 CN 114398109 A 2序接口apii，用户可以个性化为其配置n个服务自然语言范例Instance，配置该API的m个词槽ParaName；对于每个范例instancej，配置其自然语言指令中API参数对应的槽值 slotn.value； (2.2)API 三元组集合 API三元组集合apii.TripleSet包含API中每个范例的指令三元组集合 instancej.TripleSet； (2.3)API标签集合计算所有instancej.LabelSet里出现的每个标签的频数li.f，若li.f＞F，则记li为该 API的核心标签集合， F计算公式下所示： F＝w％×n API标签集合apii.LabelSet包含服务的n个范例i nstancej.KeySet的所有核心标签； (2.4)API词槽标签集合使用通用知识图谱为API的每个设定词槽进行释义，得到API词槽标签集合； API有m个需要填入的词槽，对于一个API的多个范例，获取他们同一个词槽slotj下的不同槽值 slotj.value的标签集合，对同个词槽的不同槽值标签集合进行高频处理后，得到该词槽的标签集合apii.ParaName .LabelSet；由此获得API中不同词槽分别的标签集合 apii.slotj.LabelSet。 3.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法，其特征在于，所述基于相似度计算的API匹配与推荐的实现方式为：在获得用户指令与多个场景下API的特征模型后，采用三元组关系相似度 tri_sim与标签相似度lab_ sim进行相似度计算来匹配 API；三元组关系相似度tri_sim表示两个事件的动作意图，通过匹配关系相似度可以判别两个事件的动作意图是否相似；标签相似度lab_sim通过计算标签相似度可以判别两个事件的语义是否相近；因此，使用三元组关系相似度tr i_sim与标签相似度lab_ sim，通过加权计算得到用户指令与每一个场景下API的相似度API_Sim，取相似度结果Top1作为匹配到的 API，返回为用户指令的场景匹配结果。 4.根据权利要求3所述的基于通用知识图谱的个性化智能助手构建方法，其特征在于，所述基于相似度计算的API匹配与推荐的具体实现过程如下： (1)基于三元组的API相似度计算利用通过大规模训练语料训练好的Glove模型对自然语言文本中的词汇进行分布式表示，句子的向量可以用句子中所有谓语词向量和的平均值来表示，将句子转化为具有相同长度的句谓语向量进行表示，每个词语w的Glove向量可以表示为一个m维向量vec(w)＝ (xi1,xi2,...,xim)；定义句谓语向量V为所有关系的词向量相同维度和的平均值，那么句子也可以由一个m 维向量V表示， V＝(V1,V2,...,Vm)， Vj的计算公式如下所示：若用户输入的自然语言指令为ucmd，则基于词嵌入技术，对用户指令三元组集合 ucmd.TripleSet完成向量化表示；首先遍历每句指令的所有三元组instancej.TripleSet，权　利　要　求　书 2/5 页 3 CN 114398109 A 3

专利 基于通用知识图谱的个性化智能助手构建方法

专利基于通用知识图谱的个性化智能助手构建方法