说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210290077.1 (22)申请日 2022.03.23 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 桂正科  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 周良玉 (51)Int.Cl. G06F 16/36(2019.01) G06F 8/658(2018.01) (54)发明名称 更新知识图谱的方法及装置 (57)摘要 本说明书实施例提供一种更新知识图谱的 方法及装置, 在为当前业务提供基于知识图谱的 数据支持过程中, 采用在线、 离线相结合的方式 更新知识图谱。 首先, 利用全量业务数据离线构 建知识图谱, 并进行全量的实体链指、 实体归一, 以初始化知识图谱。 之后, 设置增量更新条件进 行多轮增量更新。 在一轮增量更新期间, 一方面, 基于实时产生的业务数据进行实时链指提供在 线的知识图谱更新, 另一方面, 在预设的增量更 新条件满足时, 按照当前增量更新周期内新增的 业务数据进行增量链指, 从而提供离线的知 识图 谱更新, 并作为下一轮次增量更新的初始知 识图 谱。 如此, 可 以使得相关业务处理结果更准确有 效。 权利要求书2页 说明书14页 附图3页 CN 114385833 A 2022.04.22 CN 114385833 A 1.一种更新知识图谱的方法, 所述方法包括对知识图谱进行多轮增量更新, 其中, 一轮 增量更新包括: 获取该轮增量更新的初始知识图谱; 进行更新步骤, 包括重复执行的实时更新操作和满足预设的增量更新条件的情况下的 增量更新操作, 其中, 该实时更新操作包括: 响应于接 收到新的业务数据, 利用接收的业务 数据对前一实时更新操作中更新后的知识图谱进行更新, 该增量更新操作包括: 利用该轮 增量更新期间产生的业务数据对所述初始知识图谱进 行更新, 以作为下一轮增量更新的初 始知识图谱。 2.如权利要求1所述的方法, 其中, 所述实时更新操作、 所述增量更新操作均包含以下 实体链指过程: 确定是否存在至少2个节点对应的业 务主体具有相同特性; 在存在的情况下, 针对实体链指结果还执行以下实体归一过程: 将具有相同特性的节 点合并为一个节点, 并且具有相同特性的各个节 点相应的实体描述信息叠加后作为合并后 的节点的实体描述信息 。 3.如权利要求1所述的方法, 其中: 在该轮增量更新是首轮增量更新的情况下, 该轮增量更新的初始知识图谱基于对利用 全量业务数据构建的知识图谱的实体链指结果进行实体归一得到; 在该轮增量更新不是首轮增量更新的情况下, 该轮增量更新的初始知识图谱基于对前 一轮增量更新中的初始知识图谱的增量的实体链指结果进行实体归一得到 。 4.如权利要求3所述的方法, 其中, 所述对利用全量业务数据构建的知识图谱全量的实 体链指结果 通过以下 方式获取: 针对利用全量业务数据构建的知识图谱中的各个节点分别获取其对应的实体描述信 息; 根据各个节点各自对应的实体描述信息提取 各个节点分别对应的各个特 征向量; 基于两两特征向量检测两 两节点之间的相似性; 根据两两特征向量的相似性是否满足预定同质条件, 识别相应的两两节点是否具有相 同特性。 5.如权利要求2所述的方法, 其中, 所述初始知识图谱包括第一节点, 针对所述第一节 点的第一业务数据为当前接收的新的业务数据, 所述响应于当前业务中产生新的业务数 据, 利用接收的业 务数据对前一实时更新操作中更新后的知识图谱进行 更新包括: 利用所述第一 业务信息更新所述第一节点的第一实体描述信息; 从更新后的第一实体描述信息中提取第一特 征向量; 比较所述第一特 征向量与其 他各个节点的各个其 他特征向量一一对应的各个相似性; 基于各个相似性是否满足预定同质条件, 得到是否存在与所述第 一节点具有相同特性 的其他节点实时的实体链指结果; 基于该实时的实体链指结果对前一实时更新操作中更新后的知识图谱进行 更新。 6.如权利要求2所述的方法, 其中, 所述方法还 包括: 将当前接收的新的业 务数据作为增量数据添加至当前增量数据集; 所述利用该轮增量更新期间产生的业 务数据对所述初始知识图谱进行 更新包括: 利用当前增量数据集中的各条增量数据进行针对该轮增量更新的初始知识图谱增量权 利 要 求 书 1/2 页 2 CN 114385833 A 2的实体链指; 利用增量的实体链指结果更新所述初始知识图谱。 7.如权利要求1所述的方法, 其中, 所述增量更新条件包括: 预定周期到达, 或者该轮增 量更新期间产生的业 务数据条 数达到预定条 数。 8.如权利要求1所述的方法, 其中, 在该轮增量更新不是首轮增量更新的情况下, 所述 更新步骤还包括: 获取基于前一轮增量更新中满足预设的增量更新条件之后的实时更新操作中得到的 各个实时的更新结果; 根据各个实时的更新结果更新该轮增量更新的初始知识图谱。 9.如权利要求2 ‑5任一所述的方法, 其中, 所述实体描述信息包括属性信息、 连接信息 中的至少一项。 10.如权利要求2 ‑5任一所述的方法, 其中, 所述特征向量包括以下中的一项, 或以下中 的多项经嵌入得到的向量: 文本语义向量、 轨 迹向量、 图结构向量、 图表征向量。 11.如权利要求6所述的方法, 其中, 实时的实体链指过程通过在线检索引擎完成, 基于 实时的实体链指更新当前知识图谱通过在线图存储引擎完成; 所述利用增量的实体链指结 果更新所述初始知识图谱 包括: 通过数据转存机制, 将所述增量的实体链指结果同步至在线检索引擎及在线图存储引 擎, 从而完成所述增量的实体链指结果对该轮增量更新期间内产生的各个实时的实体链指 结果的替换, 从而利用增量的实体链指结果更新所述初始知识图谱。 12.如权利要求2所述的方法, 其中, 在增量数据中涉及的第二业务主体在该轮增量更 新的初始知识图谱中不存在相对应的节点的情况 下, 所述增量更新操作还 包括: 在该轮增量更新的初始知识图谱中增 加与所述第二 业务主体相对应的第二节点; 基于增加所述第二节点后的知识图谱进行增量的实体链指。 13.如权利要求1所述的方法, 其中, 在该轮增量更新为首轮增量更新的情况下, 该轮增 量更新的首次实时更新操作为: 利用接收的业 务数据对该轮增量更新的初始知识图谱进行 更新。 14.一种更新知识图谱的装置, 所述装置包括: 获取单元, 配置为在各轮增量更新中获取初始知识图谱; 更新单元, 配置为在各轮增量更新中进行包括重复执行的实时更新操作和满足预设的 增量更新条件的情况下的增量更新操作的更新步骤, 其中, 该实时更新操作包括: 响应于接 收到新的业务数据, 利用接收的业务数据对前一 实时更新操作中更新后的知识图谱进 行更 新, 该增量更新操作包括: 利用该轮增 量更新期间产生的业务数据对所述初始知识图谱进 行更新, 以作为下一轮增量更新的初始知识图谱。 15.一种计算机可读存储介质, 其上存储有计算机程序, 当所述计算机程序在计算机中 执行时, 令计算机执 行权利要求1 ‑13中任一项的所述的方法。 16.一种计算设备, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有可执行代 码, 所述处 理器执行所述可执行代码时, 实现权利要求1 ‑13中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114385833 A 3

.PDF文档 专利 更新知识图谱的方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 更新知识图谱的方法及装置 第 1 页 专利 更新知识图谱的方法及装置 第 2 页 专利 更新知识图谱的方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。