说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210223234.7 (22)申请日 2022.03.09 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 申请人 中国科学院计算 技术研究所 (72)发明人 杨洋 梁华盛 范意兴 王苑铮 颜强 郭嘉丰 (74)专利代理 机构 北京三高永信知识产权代理 有限责任公司 1 1138 专利代理师 李文静 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 16/338(2019.01) (54)发明名称 基于知识图谱的搜索方法、 装置、 计算机设 备及存储介质 (57)摘要 本申请公开了一种基于知识图谱的搜索方 法、 装置、 计算机设备及存储介质, 涉及信息检索 技术领域。 所述方法包括: 在知识图谱中确定与 查询文本对应的候选实体列表, 候选实体列表包 括至少一个候选实体; 对查询文本进行编码得到 第一查询向量, 以及对候选实体的知识图谱信息 进行编码得到第一候选向量; 将第一查询向量和 第一候选向量输入自注意力层, 得到第二查询向 量和第二候选向量; 根据第二查询向量和第二候 选向量的向量相似度, 确定查询文本与候选实体 的相关度打分; 根据相关度打分对候选实体进行 排序, 以及基于排序结果输出搜索结果。 本申请 通过自注意力层实现查询文本和候选实体列表 中的各个候选实体的交互, 提升了搜索的精确 度。 权利要求书3页 说明书14页 附图6页 CN 114637855 A 2022.06.17 CN 114637855 A 1.一种基于知识图谱的搜索方法, 其特 征在于, 所述方法包括: 在知识图谱中确定与查询文本对应的候选实体列表, 所述候选实体列表包括至少一个 候选实体; 对所述查询文本进行编码得到第 一查询向量, 以及对所述候选实体的知识图谱信 息进 行编码得到第一 候选向量; 将所述第一查询向量和所述第 一候选向量输入自注意力层, 得到第 二查询向量和第 二 候选向量; 根据所述第 二查询向量和所述第 二候选向量的向量相似度, 确定所述查询文本与 所述 候选实体的相关度打 分; 根据所述相关度打 分对所述 候选实体进行排序, 以及基于排序结果输出搜索结果。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一查询向量和所述第 一候选 向量输入自注意力层, 得到第二 查询向量和第二 候选向量, 包括: 获取所述候选实体的参考相关度打分和参考排名, 所述参考相关度打分用于指示所述 候选实体和所述查询文本的相关度, 所述参考排名用于指示所述候选实体列 表中的候选实 体与所述 查询文本的相关度排名; 将所述查询文本对应的第一信息组合和所述候选实体对应的第二信息组合输入自注 意力层, 得到所述第二 查询向量和所述第二 候选向量; 其中, 所述第一信息组合包括所述第一查询向量和第一标识信息, 所述第二信息组合 包括所述第一候选向量、 第二标识信息、 所述参考相关度打分和所述参考排名, 所述第一标 识信息用于指示所述第一查询向量为与所述查询文本对应的向量, 所述第二标识信息用于 指示所述第一 候选向量 为与所述 候选实体对应的向量。 3.根据权利要求2所述的方法, 其特征在于, 所述获取所述候选实体的参考相关度打分 和参考排名, 包括: 将所述第一查询向量和所述第 一候选向量的向量相似度, 确定为所述候选实体的所述 参考相关度打 分; 根据所述 参考相关度打 分确定所述 候选实体列表中的候选实体的所述 参考排名。 4.根据权利要求1至3任一所述的方法, 其特征在于, 所述候选实体为知识图谱中的实 体; 所述对所述 候选实体的知识图谱信息进行编码得到第一 候选向量, 包括: 获取所述候选实体对应的知识图谱文本, 所述知识图谱文本是基于所述候选实体在所 述知识图谱中的图谱信息转换 得到的自然语言文本; 对所述候选实体对应的知识图谱文本进行编码得到所述第一 候选向量。 5.根据权利要求4所述的方法, 其特征在于, 所述获取所述候选实体对应的知识图谱文 本, 包括: 在所述知识图谱 对应的语料库中查询与所述 候选实体对应的知识图谱文本; 其中, 所述语料库包括所述知识图谱中各个实体对应的知识图谱文本, 每个所述实体 对应的知识图谱文本是预先基于所述实体在所述知识图谱中的图谱信息进行转换得到的 自然语言文本 。 6.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括:权 利 要 求 书 1/3 页 2 CN 114637855 A 2将所述实体在所述知识图谱中的图谱信息表示 为三元组信息; 将所述实体对应的三元组信息, 转换为所述实体对应的知识图谱文本 。 7.根据权利要求6所述的方法, 其特征在于, 所述知识图谱为以账号为中心的机构图 谱, 所述机构图谱 包括所述账号的属性和所述属性的属性 值; 所述将所述实体在所述知识图谱中的图谱信 息表示为三元组信 息, 将所述实体对应的 三元组信息, 转换为所述实体对应的知识图谱文本, 包括: 将所述账号在所述机构图谱中的图谱信 息表示为属性三元组, 所述属性三元组包括所 述账号、 所述账号的属性和所述属性的属性 值; 将所述账号对应的属性 三元组拼接为知识图谱文本 。 8.根据权利要求6所述的方法, 其特 征在于, 所述实体对应的三元组信息为至少两个; 所述将所述实体对应的三元组信息, 转换为所述实体对应的知识图谱文本, 包括: 在所述实体对应的每个所述三元组信 息的末尾添加第 一语义符, 并将所述至少两个处 理后的三元组信息首尾拼接, 得到第一知识图谱文本, 所述第一语义符用于指示所述三元 组信息之间的分隔; 在所述第一知识图谱文本的开头添加第二语义符, 得到所述实体对应的知识图谱文 本, 所述第二语义符用于指示所述实体对应的知识图谱文本的开端。 9.根据权利要求1至8任一所述的方法, 其特征在于, 所述根据所述第二查询向量和所 述第二候选向量的向量相似度, 确定所述 查询文本与所述 候选实体的相关度打 分, 包括: 通过计算向量点乘得到所述第 二查询向量和所述第 二候选向量的向量相似度, 确定所 述查询文本与所述 候选实体的相关度打 分; 或, 通过计算欧氏距离得到所述第 二查询向量和所述第 二候选向量的向量相似度, 确定所 述查询文本与所述 候选实体的相关度打 分; 或, 通过计算向量余弦得到所述第 二查询向量和所述第 二候选向量的向量相似度, 确定所 述查询文本与所述 候选实体的相关度打 分。 10.根据权利要求1至8任一所述的方法, 其特征在于, 所述对所述查询文本进行编码得 到第一查询向量, 以及对所述 候选实体进行编码得到第一 候选向量, 包括: 将所述查询文本输入预训练的基于变换器的双向编码器表示技术BERT层进行编码, 得 到所述第一查询向量; 以及, 将所述候选实体输入 所述BERT层进 行编码, 得到所述第一候选 向量。 11.一种基于知识图谱的搜索装置, 其特 征在于, 所述装置包括: 确定模块, 用于在知识图谱中确定与查询文本对应的候选实体列表, 所述候选实体列 表包括至少一个候选实体; 编码模块, 用于对所述查询文本进行编码得到第一查询向量, 以及对所述候选实体的 知识图谱信息进行编码得到第一 候选向量; 交互模块, 用于将所述第一查询向量和所述第一候选向量输入自注意力层, 得到第二 查询向量和第二 候选向量; 所述确定模块, 还用于根据所述第二查询向量和所述第二候选向量的向量相似度, 确权 利 要 求 书 2/3 页 3 CN 114637855 A 3
专利 基于知识图谱的搜索方法、装置、计算机设备及存储介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:57:39
上传分享
举报
下载
原文档
(960.1 KB)
分享
友情链接
SY-T 7640-2021 非常规气田采出水回注环境保护规范.pdf
T-CSAE 269—2022 智能网联汽车 自动驾驶地图动态信息数据交换格式.pdf
GB-T 254-2022 半精炼石蜡.pdf
SN-T 1306-2017 出入境人员预防接种或预防措施国际证书签发规程.pdf
GB-T 33656-2017 企业能源计量网络图绘制方法.pdf
GB-T 3714-2017 碳酸锰矿.pdf
信息安全组织管理制度.pdf
WDTA AI-STR-02-LLM security Large Language Model Security.pdf
GB/T 19237-2021 汽车用压缩天然气加气机.pdf
GB-T 41630-2022 智能泊车辅助系统性能要求及试验方法.pdf
GB 1589-2016 汽车、挂车及汽车列车外廓尺寸、 轴荷及质量限值.pdf
GB-T 18135-2008 电气工程CAD制图规则.pdf
T-CTSS 1—2018 白茶仓储规范.pdf
GB-T 31072-2014 科技平台 统一身份认证.pdf
LD-T 09-2022 人力资源社会保障信息系统运行维护平台建设规范.pdf
DB3201-T 1113-2022 法人主数据规范 南京市.pdf
T-GCHA 1.3—2018 定制家居产品 人造板定制衣柜 第3部分:有害物质限量及气味等级.pdf
GB-T 41260-2022 数字化车间信息安全要求.pdf
GB-T 15731-2015 内河旅游船星级的划分与评定.pdf
GB-T 19604-2017 毒死蜱原药.pdf
交流群
-->
1
/
3
24
评价文档
赞助2元 点击下载(960.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。