(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210018928.7
(22)申请日 2022.01.07
(71)申请人 福州大学
地址 350108 福建省福州市闽侯县福州大
学城乌龙江北 大道2号福州大 学
(72)发明人 陈星 陈佳雯 林章颖 张铭豪
陈礼贤
(74)专利代理 机构 福州元创专利商标代理有限
公司 35100
代理人 陈明鑫 蔡学俊
(51)Int.Cl.
G06F 9/448(2018.01)
G06F 16/36(2019.01)
G06K 9/62(2022.01)
(54)发明名称
基于通用知识图谱的个性化智能助手构建
方法
(57)摘要
本发明涉及一种基于通用知识图谱的个性
化智能助手构建方法。 该方法将通用知识图谱引
入到场景建模与开发过程中, 通过基于相似度计
算的API匹配与推荐以及基于特征匹配的API参
数抽取方法, 实现用户自然语言指令到API的自
动化匹配和执 行。
权利要求书5页 说明书13页 附图3页
CN 114398109 A
2022.04.26
CN 114398109 A
1.一种基于通用知识图谱的个性 化智能助手构建方法, 其特 征在于, 包括:
基于通用 知识图谱的特征模型构建: 根据指令的结构特征以及语义特征, 借助通用 知
识图谱的结构化数据构建自然语 言指令特征, 进而构建API特征以表示场景特征; 在此基础
上, 提出基于通用知识图谱的特 征提取方法;
基于相似度计算的API匹配与推荐: 针对已构建好的特征模型, 对用户指令计算三元组
关系相似度及标签相似度, 根据两者结果加权得到对于用户指令最匹配的API;
基于特征匹配的API参数抽取方法: 针对已构建好的特征模型, 将用户指令面向匹配到
的API进行标签向量化, 基于标签和前置词进 行指令槽值提取, 得到执行API所需要的参数,
完成API执 行。
2.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于,
所述基于通用知识图谱的特 征模型构建的具体实现过程如下:
(1)自然语言指令特 征
自然语言指令特征包含以下 四个特征: 自然语言指令三元组集合TripleSet、 指令关键
词集合KeySet, 指令前置词集合PrepSet及自然语言指令标签集合LabelSet; 定义一句自然
语言指令为comd; 其中,
(1.1)自然语言指令三元组集 合TripleSet
对于每一个自然语言指令, 抽取指令三元组ti后, 构成三元组集合comd.TripleSet=
{t1,t2,...,tn};
(1.2)指令关键词K eySet
定义指令的关键词KeySet由指令中的名词和命名实体识别结果构成: comd.KeySet=
(N,Spe)={k1,k2,...,kn}, 其中, N为范例指令in stance中的名词集合, Spe为命名实体识别
标注不为空的词语, ki为关键词;
(1.3)指令前置词集 合PrepSet
若关键词ki前面的词语识别为介词, 记该介词为关键词的前置词ki.prep, 因此指令前
置词集合com d.PrepSet={<k1.prep,k1>,<k2.prep,k2>...,<kn.prep,kn>}, 为每个
关键词以及它的前置词的二元关系组集 合;
(1.4)自然语言指令标签集 合LabelSet
一个词语w的标签集合可以表示为w.LabelS et={l1,l2,...,ln}, 则自然语言指令标签
集合可以表示为每个关键词标签集合的并集, comd .LabelSet={k1.LabelSet,
k2.LabelSet, . ..,kn.LabelSet}={l1,l2,...,lm};
(2)API特 征
定义一个API为API={APIName,Inst ance,ParaName}, 其中, APIName为应用程序接口
名, Instance={instance1,instance2,...,instancen}为调用该API的n个自然语言范例指
令, ParaName={slot1,slot2,...,slotm}为执行API所需填入的m个参数, 这种参数限定条
件也被称为词槽; 执行API所需要的参数值即为槽值slotn.value; 与自然语言指令特征类
似, 定义API特征为调用该API的范例指令的结构的特征以及语义特征; 因此, API特征包含
三个要素: API 三元组集 合TripleSet、 API标签集 合KeySet, 及API词槽标签集 合LabelSet;
(2.1)API配置
用户可以随需添加x个API配置文件, 以满足 自己所需要的服务场景; ; 对于每个应用程权 利 要 求 书 1/5 页
2
CN 114398109 A
2序接口apii, 用户可以个性化为其配置n个服务自然语言范例Instance, 配置该API的m个词
槽ParaName; 对于每个范例instancej, 配置其自然语言指令中API参数对应的槽值
slotn.value;
(2.2)API 三元组集 合
API三元组集合apii.TripleSet包含API中每个范例的指令三元组集合
instancej.TripleSet;
(2.3)API标签集 合
计算所有instancej.LabelSet里出现的每个标签 的频数li.f, 若li.f>F, 则记li为该
API的核心标签集 合, F计算公式下 所示:
F=w%×n
API标签集 合apii.LabelSet包 含服务的n个范例i nstancej.KeySet的所有 核心标签;
(2.4)API词槽标签集 合
使用通用知识图谱为API的每个设定词槽进行释义, 得到API词槽标签集合; API有m个
需要填入的词槽, 对于一个API的多个范例, 获取他们同一个词槽slotj下的不同槽值
slotj.value的标签集合, 对同个词槽的不同槽值标签集合进行高频处理后, 得到该词槽的
标签集合apii.ParaName .LabelSet; 由此获得API中不同词槽分别的标签集合
apii.slotj.LabelSet。
3.根据权利要求1所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于,
所述基于相似度计算的API匹配与推荐的实现方式为: 在获得用户指 令与多个场景下API的
特征模型后, 采用三元组关系相似度 tri_sim与标签相似度lab_ sim进行相似度计算来匹配
API; 三元组关系相似度tri_sim表示两个事件的动作意图, 通过匹配关系相似度可以判别
两个事件的动作意图是否相 似; 标签相 似度lab_sim通过计算标签相 似度可以判别两个事
件的语义是否相近; 因此, 使用三元组关系相似度tr i_sim与标签相似度lab_ sim, 通过加权
计算得到用户指 令与每一个场景下API的相似度API_Sim, 取相似度结果Top1作为匹配到的
API, 返回为用户指令的场景匹配结果。
4.根据权利要求3所述的基于通用知识图谱的个性化智能助手构建方法, 其特征在于,
所述基于相似度计算的API匹配与推荐的具体实现过程如下:
(1)基于三元组的API相似度计算
利用通过大规模训练语料训练好的Glove模型对自然语言文本中的词 汇进行分布式表
示, 句子的向量可以用句 子中所有谓语词向量和的平均值来表示, 将句 子转化为具有相同
长度的句谓语向量进行表示, 每个词语w的Glove向量可以表示为一个m维向量vec(w)=
(xi1,xi2,...,xim);
定义句谓语向量V为所有关系的词向量相同维度和的平均值, 那么句子也可以由一个m
维向量V表示, V=(V1,V2,...,Vm), Vj的计算公式如下 所示:
若用户输入的自然语言指令为ucmd, 则基于词嵌入技术, 对用户指令三元组集合
ucmd.TripleSet完 成向量化表示; 首先遍历每句指令的所有三元组instancej.TripleSet,权 利 要 求 书 2/5 页
3
CN 114398109 A
3
专利 基于通用知识图谱的个性化智能助手构建方法
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:58:05上传分享