说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210042199.9 (22)申请日 2022.01.14 (71)申请人 平安健康保险股份有限公司 地址 200000 上海市徐汇区凯滨路16 6号B 座16楼 (72)发明人 段丹丹  (74)专利代理 机构 深圳众鼎专利商标代理事务 所(普通合伙) 44325 代理人 谭果林 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/35(2020.01) G06Q 40/08(2012.01) G06F 16/332(2019.01) (54)发明名称 基于知识图谱的保险语义理解方法、 装置、 设备及介质 (57)摘要 本发明涉及数据分析的技术领域, 公开了一 种基于知识图谱的保险语义理解方法、 装置、 设 备及介质。 所述方法包括: 获取用户输入的关于 保险领域的用户问题; 根据预设的实体和意图联 合抽取模型, 识别出所述用户问题中的实体内容 和用户意图; 确认知识图谱中与所述实体内容链 接的目标 实体内容; 根据 识别到的实体内容和用 户意图, 将所述用户问题转换成结构化查询语 句, 并根据所述结构化查询语句从所述知识图谱 中查询到与所述目标实体内容对应的用户答案; 将与所述用户问题对应的用户答案反馈至所述 用户。 本发 明能够能够提升用户问题中的实体内 容和用户意图的识别效率和准确率。 权利要求书3页 说明书13页 附图6页 CN 114372157 A 2022.04.19 CN 114372157 A 1.一种基于知识图谱的保险语义理解方法, 其特 征在于, 包括: 获取用户输入的关于保险领域的用户问题; 根据预设的实体和意图联合抽取模型, 识别出所述用户问题中的实体内容和用户意 图; 确认知识图谱中与所述实体内容链接的目标实体内容; 根据识别到的实体内容和用户意图, 将所述用户问题转换成结构化查询语句, 并根据 所述结构化 查询语句从所述知识图谱中查询到与所述目标实体内容对应的用户答案; 将与所述用户问题对应的用户答案反馈 至所述用户。 2.根据权利要求1所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述根据 预 设的实体和意图联合抽取模型, 识别出所述用户问题中的实体内容和用户意图之前, 还包 括: 获取多个与用户关联的保险领域问题; 通过共享编码层对所述保险领域问题进行向量特 征提取, 得到句子向量矩阵; 通过序列识别层将所述句子向量矩阵输入至预设的双向长短时记忆模型中进行编码, 得到已编 码成功的第一编 码向量, 并通过预设的条件随机场模型对所述第一编 码向量进 行 解码, 得到实体预测后的以序列表示的实体内容; 通过意图识别层将通过所述共享编码层得到的句子向量矩阵和通过所述序列识别层 得到的所述第一编码向量进行拼接, 得到第二编码向量, 并通过预设的一维卷积函数和分 类函数对所述第二编码向量进行解码, 得到意图预测后的用户意图; 对预测的实体 内容使用条件随机场模型计算第 一损失值, 对用户意图采用多分类交叉 熵损失计算第二损失值, 根据所述第一损失值和第二损失值联合计算总损失值; 在所述总损 失值达到预设目标阈值时, 确认所述实体和意图联合抽取模型搭建完成; 所述实体和意图联合抽取模型包括所述共享编码层、 序列识别层和意图识别层。 3.根据权利要求2所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述获取多 个与用户关联的保险领域问题之后, 还 包括: 根据保险领域的实 际业务场景, 定义出第一预设数量实体类型的实体内容; 一个所述 保险领域问题关联零个实体内容或者至少一个实体内容; 根据保险领域的问题范围, 将所述保险领域问题划分出第 二预设数量意图类型的用户 意图; 一个所述保险领域问题关联至少一个用户意图。 4.根据权利要求2所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述通过共 享编码层对所述保险领域问题进行向量特 征提取, 得到句子向量矩阵, 包括: 通过所述共享编码层对所述保险领域问题进行分字处理后, 将分字处理后的字转换为 字ID序列, 并对 所述字ID序列进 行截取预设长度和初始 化后, 得到一个M*N 维度的字向量矩 阵; 所述字向量矩阵中包 含多个与字对应的字向量; 通过所述共享编码层对所述保险领域问题进行分词处理后, 将分词处理后的分词表示 成词向量, 并在确定每个字对应的字向量为字所在的分词的词向量后, 得到一个M*N 维度的 词向量矩阵; 对M*N维度的字向量矩阵和M*N维度的词向量矩阵进行相加后, 得到一个M*N维度的字 词向量矩阵;权 利 要 求 书 1/3 页 2 CN 114372157 A 2根据预设的领域关键词词 表, 对所述保险领域问题进行关键词匹配后, 得到一个M*Y维 的关键词向量矩阵; 将M*Y维的关键词向量矩阵横向拼接在M*N维度的字词向量矩阵后, 得到一个M*(N+Y) 维的字词关键词向量矩阵; 通过所述共享编码层对所述保险领域问题中的每一个位置的字随机初始化一个与所 述字词关键词向量矩阵相同维度的位置向量矩阵; 将M*(N+Y)维的位置向量矩阵与所述M*(N+Y)维的字词关键词向量矩阵进行相加后, 得 到一个M*(N+Y)维的句子向量矩阵。 5.根据权利要求1所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述确 认知 识图谱中与所述实体内容链接的目标实体内容之前, 还 包括: 获取待标准 化的实体内容和知识图谱中的实体词典; 判断所述实体内容与所述实体词典中的词是否 完全匹配; 若所述实体内容与 所述实体词典中的词为完全匹配, 则将所述实体词典中的词加入至 预设候选实体列表中: 若所述实体内容与 所述实体词典中的词为未完全匹配, 则判断所述实体 内容是否为包 含在所述实体词典中的词; 若确定所述实体 内容包含在所述实体词典中的词, 则将所述实体词典中的词加入至预 设候选实体列表中: 若确定所述实体 内容并不是包含在所述实体词典中的词, 则 计算所述实体内容与 所述 实体词典中的每个词的编辑距离, 并在对所述编辑距离与预设距离阈值进行对比后, 将筛 选出的所述编辑距离大于所述预设距离阈值的词, 按照所述编辑距离与所述预设距离阈值 的差别高低依次加入至所述预设候选实体列表中; 判断所述预设候选实体列表中的内容是否为空; 若所述预设候选实体列表中的内容不为空, 则根据 预设优先级规则对所述设实体列表 中的词进行排序和去重, 并输出所述知识图谱中的最终候选实体列表; 所述最终候选实体 列表中的词为与所述实体内容对应的目标实体内容。 6.根据权利要求5所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述判断所 述预设候选实体列表中的内容是否为空之后, 还 包括: 若所述预设候选实体列表中的内容为空, 则将所述预设候选实体列表作为最终候选实 体列表。 7.根据权利要求5所述的基于知识图谱的保险语义理解方法, 其特征在于, 所述若所述 实体内容与所述 实体词典中的词为完全匹配, 则将所述 实体词典中的词加入至预设候选实 体列表之后, 还 包括: 将所述预设候选实体列表作为 最终候选实体列表。 8.一种基于知识图谱的保险语义理解装置, 其特 征在于, 包括: 第一获取模块, 用于获取用户输入的关于保险领域的用户问题; 识别模块, 用于根据预设的实体和意图联合抽取模型, 识别出所述用户问题中的实体 内容和用户意图; 第一确认模块, 用于确认知识图谱中与所述实体内容链接的目标实体内容;权 利 要 求 书 2/3 页 3 CN 114372157 A 3

.PDF文档 专利 基于知识图谱的保险语义理解方法、装置、设备及介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识图谱的保险语义理解方法、装置、设备及介质 第 1 页 专利 基于知识图谱的保险语义理解方法、装置、设备及介质 第 2 页 专利 基于知识图谱的保险语义理解方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:57:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。