(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210355086.4
(22)申请日 2022.03.31
(71)申请人 阿里巴巴达摩院 (杭州) 科技有限公
司
地址 311100 浙江省杭州市余杭区五常街
道文一西路969号3幢5层516室
(72)发明人 龚镖 吕逸良 唐铭谦
(74)专利代理 机构 北京清源汇知识产权代理事
务所(特殊普通 合伙) 11644
专利代理师 冯德魁 张艳梅
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/338(2019.01)
G06F 16/36(2019.01)
(54)发明名称
基于知识图谱的搜索方法、 装置及电子设备
(57)摘要
本申请公开了一种基于知识图谱的搜索方
法、 装置、 电子设备及计算机 可读存储介质, 方法
包括: 获取第一查询文本; 确定与第一查询文本
相关联的至少一个第一信息实体, 从预先构建的
知识图谱中筛选出与第一信息实体相关联的第
二信息实体, 从知识图谱中确定出各信息实体对
应的各信息、 各信息实体之间的关联关系, 以预
定的规则, 确定各信息实体、 各信息实体对应的
信息、 各信息实体之间的关联关系的展示方式,
提供给需要展示的显示界面。 本申请提供的方案
能够使策划人员无需再反复进行多次搜索, 也无
需再将搜索出的内容进行过多的梳理, 简化了策
划人员进行信息编辑之前的信息搜索的过程, 从
而提高了策划人员进行信息编辑的效率。
权利要求书3页 说明书23页 附图4页
CN 114911898 A
2022.08.16
CN 114911898 A
1.一种基于知识图谱的搜索方法, 其特 征在于, 应用于服 务端, 所述方法包括:
获取第一 查询文本;
确定与所述第一查询文本相关联的至少一个第 一信息实体, 所述第 一信息实体用于表
示所述第一 查询文本对应的信息所 涉及的信息实体;
从预先构建的知识图谱中筛选出与所述第一信息实体相关联的至少一个第二信息实
体;
从所述知识图谱中确定出各信息实体对应的各信息、 各信息实体之间的关联关系, 所
述各信息实体包括各 所述第一信息实体和各 所述第二信息实体;
以预定的规则, 确定所述各信息实体、 所述各信息实体对应的信 息、 所述各信 息实体之
间的关联关系的展示方式, 提供 给需要展示的显示界面。
2.根据权利要求1所述的搜索方法, 其特征在于, 所述确定与 所述第一查询文本相关联
的第一信息实体, 包括:
对所述查询文本第一 查询文本进行实体识别, 得到 至少一个第三信息实体;
根据各所述第三信息实体确定与所述第一 查询文本相关联的第一信息实体。
3.根据权利要求2所述的搜索方法, 其特征在于, 所述根据 各所述第 三信息实体确定与
所述第一 查询文本相关联的第一信息实体, 包括:
基于预先构建的知识图谱对所述第 三信息实体进行实体扩展, 得到至少一个与所述第
三信息实体相关联的扩展实体;
根据所述第三信息实体以及所述扩展实体确定与所述第一查询文本相关联的第一信
息实体。
4.根据权利要求3所述的搜索方法, 其特征在于, 在所述获取第一查询文本之前, 所述
方法还包括:
获取第二 查询文本;
从预先构建的知识图谱所存储的各信息中搜索出与所述第二查询文本相匹配的目标
信息;
从所述知识图谱中确定与所述目标信息相关联的各信息实体;
所述基于预 先构建的知识图谱 对所述第三信息实体进行实体扩展, 包括:
基于与所述目标信息相关联的各信息实体对所述第三信息实体进行实体扩展;
其中, 所述第一 查询文本是在所述第二 查询文本的基础上进行扩展得到的文本 。
5.根据权利要求4所述的搜索方法, 其特征在于, 所述知识图谱中存储有已存储信 息以
及与该已存 储信息相对应的事 件、 发生地点以及人物;
所述从所述知识图谱中确定与所述目标信息相关联的各信息实体, 包括:
确定所述目标信息所 涉及的各目标事 件;
从所述知识图谱中查找与所述目标事 件相关联的各目标发生 地点以及各目标 人物;
将所述目标事件、 所述目标发生地点以及所述目标人物确定为所述目标信 息相关联的
信息实体。
6.根据权利要求3所述的搜索方法, 其特 征在于, 所述方法还 包括:
将各所述第三信息实体以及各所述扩展实体进行分组, 得到多组实体组合, 所述实体
组合中包 含多个信息实体, 每两组所述实体组合包 含的信息实体存在差异;权 利 要 求 书 1/3 页
2
CN 114911898 A
2将所述多组所述实体组合输入事件推理模型中, 得到与 所述多组实体组合相关联的事
件;
确定所述多组实体组合相关联的事件的展示方式, 提供给所述显示界面, 所述事件推
理模型是基于样本实体组合以及与所述样本实体组合相关联的样本事 件训练得到的。
7.根据权利要求1所述的搜索方法, 其特征在于, 所述以预定的规则, 确定所述各信息
实体、 所述各信息实体对应的信息、 所述各信息实体之间的关联关系的展示方式, 包括:
按照所述知识图谱的结构确定所述各信息实体、 所述各信息实体对应的信息、 所述各
信息实体之间的关联关系的展示方式。
8.根据权利要求1所述的搜索方法, 其特 征在于, 所述方法还 包括:
从预先构建的第 一参考信 息库中确定与 所述第一查询文本相对应的参考信 息, 并将与
所述查询文本相关联的参考信息提供给所述显示界面, 所述参考信息用于为用户编辑稿件
提供知识参 考。
9.根据权利要求1所述的搜索方法, 其特 征在于, 所述方法还 包括:
获取更新信息, 并基于所述更新信息更新所述知识图谱。
10.根据权利要求1所述的搜索方法, 其特征在于, 所述知识图谱中包含多个信息节点
和多个实体节点, 所述信息节点上存储有已存储信息, 所述实体节点上存储有所述已存储
信息对应的信息实体;
所述已存 储信息对应的信息实体包括所述已存 储信息对应的事 件;
所述知识图谱中的每两个对应有相同事件的信 息节点之间存在第 一连接边, 所述第 一
连接边上存 储有与该 连接边连接的信息节点对应的事 件。
11.根据权利要求10所述的搜索方法, 其特征在于, 所述多个实体节点中包含多个事件
节点, 所述事件节点上存储有所述已存储信息对应的事件, 每两个具有关联关系的事件节
点之间存在第二连接边, 所述第二连接边上存储有所连接的两个事件节点分别对应的两个
事件之间的关联关系。
12.根据权利要求1所述的搜索方法, 其特 征在于, 所述知识图谱的构建过程包括:
获取待创建的知识图谱中的各待存 储信息;
将所述各待存储信 息进行聚合, 得到多组信 息组, 其中, 每组信 息组中的各个信 息为相
似信息;
根据所述信息组中各信息的内容确定所述信息组对应的各信息实体;
基于各所述信息组分别对应的各信息实体、 各 所述待存 储信息创建所述知识图谱。
13.根据权利要求12所述的搜索方法, 其特征在于, 所述将所述各待存储信息进行聚
合, 得到多组信息组, 包括:
基于聚合规则对各所述待存储信息进行聚合, 得到多组信息组, 其中, 所述聚合规则
为: 每组所述信息组中各个信息之间的内容相似度大于第一预设阈值、 发生时间间隔小于
预设时间 间隔。
14.一种基于知识图谱的搜索方法, 其特 征在于, 应用于客户端, 所述方法包括:
获取用户输入的第一 查询文本, 所述第一 查询文本用于进行信息 搜索;
获取各信息实体、 所述各信息实体对应的信息、 所述各信息实体之间的关联关系的展
示方式, 并在显示界面进行显示;权 利 要 求 书 2/3 页
3
CN 114911898 A
3
专利 基于知识图谱的搜索方法、装置及电子设备
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:57:40上传分享