说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210018928.7 (22)申请日 2022.01.07 (71)申请人 福州大学 地址 350108 福建省福州市闽侯县福州大 学城乌龙江北 大道2号福州大 学 (72)发明人 陈星 陈佳雯 林章颖 张铭豪  陈礼贤  (74)专利代理 机构 福州元创专利商标代理有限 公司 35100 代理人 陈明鑫 蔡学俊 (51)Int.Cl. G06F 9/448(2018.01) G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称 基于通用知识图谱的个性化智能助手构建 方法 (57)摘要 本发明涉及一种基于通用知识图谱的个性 化智能助手构建方法。 该方法将通用知识图谱引 入到场景建模与开发过程中, 通过基于相似度计 算的API匹配与推荐以及基于特征匹配的API参 数抽取方法, 实现用户自然语言指令到API的自 动化匹配和执 行。 权利要求书5页 说明书13页 附图3页 CN 114398109 A 2022.04.26 CN 114398109 A 1.一种基于通用知识图谱的个性 化智能助手构建方法, 其特 征在于, 包括: 基于通用 知识图谱的特征模型构建: 根据指令的结构特征以及语义特征, 借助通用 知 识图谱的结构化数据构建自然语 言指令特征, 进而构建API特征以表示场景特征; 在此基础 上, 提出基于通用知识图谱的特 征提取方法; 基于相似度计算的API匹配与推荐: 针对已构建好的特征模型, 对用户指令计算三元组 关系相似度及标签相似度, 根据两者结果加权得到对于用户指令最匹配的API; 基于特征匹配的API参数抽取方法: 针对已构建好的特征模型, 将用户指令面向匹配到 的API进行标签向量化, 基于标签和前置词进 行指令槽值提取, 得到执行API所需要的参数, 完成API执 行。 2.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于, 所述基于通用知识图谱的特 征模型构建的具体实现过程如下: (1)自然语言指令特 征 自然语言指令特征包含以下 四个特征: 自然语言指令三元组集合TripleSet、 指令关键 词集合KeySet, 指令前置词集合PrepSet及自然语言指令标签集合LabelSet; 定义一句自然 语言指令为comd; 其中, (1.1)自然语言指令三元组集 合TripleSet 对于每一个自然语言指令, 抽取指令三元组ti后, 构成三元组集合comd.TripleSet= {t1,t2,...,tn}; (1.2)指令关键词K eySet 定义指令的关键词KeySet由指令中的名词和命名实体识别结果构成: comd.KeySet= (N,Spe)={k1,k2,...,kn}, 其中, N为范例指令in stance中的名词集合, Spe为命名实体识别 标注不为空的词语, ki为关键词; (1.3)指令前置词集 合PrepSet 若关键词ki前面的词语识别为介词, 记该介词为关键词的前置词ki.prep, 因此指令前 置词集合com d.PrepSet={<k1.prep,k1>,<k2.prep,k2>...,<kn.prep,kn>}, 为每个 关键词以及它的前置词的二元关系组集 合; (1.4)自然语言指令标签集 合LabelSet 一个词语w的标签集合可以表示为w.LabelS et={l1,l2,...,ln}, 则自然语言指令标签 集合可以表示为每个关键词标签集合的并集, comd .LabelSet={k1.LabelSet, k2.LabelSet, . ..,kn.LabelSet}={l1,l2,...,lm}; (2)API特 征 定义一个API为API={APIName,Inst ance,ParaName}, 其中, APIName为应用程序接口 名, Instance={instance1,instance2,...,instancen}为调用该API的n个自然语言范例指 令, ParaName={slot1,slot2,...,slotm}为执行API所需填入的m个参数, 这种参数限定条 件也被称为词槽; 执行API所需要的参数值即为槽值slotn.value; 与自然语言指令特征类 似, 定义API特征为调用该API的范例指令的结构的特征以及语义特征; 因此, API特征包含 三个要素: API 三元组集 合TripleSet、 API标签集 合KeySet, 及API词槽标签集 合LabelSet; (2.1)API配置 用户可以随需添加x个API配置文件, 以满足 自己所需要的服务场景; ; 对于每个应用程权 利 要 求 书 1/5 页 2 CN 114398109 A 2序接口apii, 用户可以个性化为其配置n个服务自然语言范例Instance, 配置该API的m个词 槽ParaName; 对于每个范例instancej, 配置其自然语言指令中API参数对应的槽值 slotn.value; (2.2)API 三元组集 合 API三元组集合apii.TripleSet包含API中每个范例的指令三元组集合 instancej.TripleSet; (2.3)API标签集 合 计算所有instancej.LabelSet里出现的每个标签 的频数li.f, 若li.f>F, 则记li为该 API的核心标签集 合, F计算公式下 所示: F=w%×n API标签集 合apii.LabelSet包 含服务的n个范例i nstancej.KeySet的所有 核心标签; (2.4)API词槽标签集 合 使用通用知识图谱为API的每个设定词槽进行释义, 得到API词槽标签集合; API有m个 需要填入的词槽, 对于一个API的多个范例, 获取他们同一个词槽slotj下的不同槽值 slotj.value的标签集合, 对同个词槽的不同槽值标签集合进行高频处理后, 得到该词槽的 标签集合apii.ParaName .LabelSet; 由此获得API中不同词槽分别的标签集合 apii.slotj.LabelSet。 3.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于, 所述基于相似度计算的API匹配与推荐的实现方式为: 在获得用户指 令与多个场景下API的 特征模型后, 采用三元组关系相似度 tri_sim与标签相似度lab_ sim进行相似度计算来匹配 API; 三元组关系相似度tri_sim表示两个事件的动作意图, 通过匹配关系相似度可以判别 两个事件的动作意图是否相 似; 标签相 似度lab_sim通过计算标签相 似度可以判别两个事 件的语义是否相近; 因此, 使用三元组关系相似度tr i_sim与标签相似度lab_ sim, 通过加权 计算得到用户指 令与每一个场景下API的相似度API_Sim, 取相似度结果Top1作为匹配到的 API, 返回为用户指令的场景匹配结果。 4.根据权利要求3所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于, 所述基于相似度计算的API匹配与推荐的具体实现过程如下: (1)基于三元组的API相似度计算 利用通过大规模训练语料训练好的Glove模型对自然语言文本中的词 汇进行分布式表 示, 句子的向量可以用句 子中所有谓语词向量和的平均值来表示, 将句 子转化为具有相同 长度的句谓语向量进行表示, 每个词语w的Glove向量可以表示为一个m维向量vec(w)= (xi1,xi2,...,xim); 定义句谓语向量V为所有关系的词向量相同维度和的平均值, 那么句子也可以由一个m 维向量V表示, V=(V1,V2,...,Vm), Vj的计算公式如下 所示: 若用户输入的自然语言指令为ucmd, 则基于词嵌入技术, 对用户指令三元组集合 ucmd.TripleSet完 成向量化表示; 首先遍历每句指令的所有三元组instancej.TripleSet,权 利 要 求 书 2/5 页 3 CN 114398109 A 3

.PDF文档 专利 基于通用知识图谱的个性化智能助手构建方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于通用知识图谱的个性化智能助手构建方法 第 1 页 专利 基于通用知识图谱的个性化智能助手构建方法 第 2 页 专利 基于通用知识图谱的个性化智能助手构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。