说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210290077.1 (22)申请日 2022.03.23 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 桂正科 (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 代理人 陈霁 周良玉 (51)Int.Cl. G06F 16/36(2019.01) G06F 8/658(2018.01) (54)发明名称 更新知识图谱的方法及装置 (57)摘要 本说明书实施例提供一种更新知识图谱的 方法及装置, 在为当前业务提供基于知识图谱的 数据支持过程中, 采用在线、 离线相结合的方式 更新知识图谱。 首先, 利用全量业务数据离线构 建知识图谱, 并进行全量的实体链指、 实体归一, 以初始化知识图谱。 之后, 设置增量更新条件进 行多轮增量更新。 在一轮增量更新期间, 一方面, 基于实时产生的业务数据进行实时链指提供在 线的知识图谱更新, 另一方面, 在预设的增量更 新条件满足时, 按照当前增量更新周期内新增的 业务数据进行增量链指, 从而提供离线的知 识图 谱更新, 并作为下一轮次增量更新的初始知 识图 谱。 如此, 可 以使得相关业务处理结果更准确有 效。 权利要求书2页 说明书14页 附图3页 CN 114385833 A 2022.04.22 CN 114385833 A 1.一种更新知识图谱的方法, 所述方法包括对知识图谱进行多轮增量更新, 其中, 一轮 增量更新包括: 获取该轮增量更新的初始知识图谱; 进行更新步骤, 包括重复执行的实时更新操作和满足预设的增量更新条件的情况下的 增量更新操作, 其中, 该实时更新操作包括: 响应于接 收到新的业务数据, 利用接收的业务 数据对前一实时更新操作中更新后的知识图谱进行更新, 该增量更新操作包括: 利用该轮 增量更新期间产生的业务数据对所述初始知识图谱进 行更新, 以作为下一轮增量更新的初 始知识图谱。 2.如权利要求1所述的方法, 其中, 所述实时更新操作、 所述增量更新操作均包含以下 实体链指过程: 确定是否存在至少2个节点对应的业 务主体具有相同特性; 在存在的情况下, 针对实体链指结果还执行以下实体归一过程: 将具有相同特性的节 点合并为一个节点, 并且具有相同特性的各个节 点相应的实体描述信息叠加后作为合并后 的节点的实体描述信息 。 3.如权利要求1所述的方法, 其中: 在该轮增量更新是首轮增量更新的情况下, 该轮增量更新的初始知识图谱基于对利用 全量业务数据构建的知识图谱的实体链指结果进行实体归一得到; 在该轮增量更新不是首轮增量更新的情况下, 该轮增量更新的初始知识图谱基于对前 一轮增量更新中的初始知识图谱的增量的实体链指结果进行实体归一得到 。 4.如权利要求3所述的方法, 其中, 所述对利用全量业务数据构建的知识图谱全量的实 体链指结果 通过以下 方式获取: 针对利用全量业务数据构建的知识图谱中的各个节点分别获取其对应的实体描述信 息; 根据各个节点各自对应的实体描述信息提取 各个节点分别对应的各个特 征向量; 基于两两特征向量检测两 两节点之间的相似性; 根据两两特征向量的相似性是否满足预定同质条件, 识别相应的两两节点是否具有相 同特性。 5.如权利要求2所述的方法, 其中, 所述初始知识图谱包括第一节点, 针对所述第一节 点的第一业务数据为当前接收的新的业务数据, 所述响应于当前业务中产生新的业务数 据, 利用接收的业 务数据对前一实时更新操作中更新后的知识图谱进行 更新包括: 利用所述第一 业务信息更新所述第一节点的第一实体描述信息; 从更新后的第一实体描述信息中提取第一特 征向量; 比较所述第一特 征向量与其 他各个节点的各个其 他特征向量一一对应的各个相似性; 基于各个相似性是否满足预定同质条件, 得到是否存在与所述第 一节点具有相同特性 的其他节点实时的实体链指结果; 基于该实时的实体链指结果对前一实时更新操作中更新后的知识图谱进行 更新。 6.如权利要求2所述的方法, 其中, 所述方法还 包括: 将当前接收的新的业 务数据作为增量数据添加至当前增量数据集; 所述利用该轮增量更新期间产生的业 务数据对所述初始知识图谱进行 更新包括: 利用当前增量数据集中的各条增量数据进行针对该轮增量更新的初始知识图谱增量权 利 要 求 书 1/2 页 2 CN 114385833 A 2的实体链指; 利用增量的实体链指结果更新所述初始知识图谱。 7.如权利要求1所述的方法, 其中, 所述增量更新条件包括: 预定周期到达, 或者该轮增 量更新期间产生的业 务数据条 数达到预定条 数。 8.如权利要求1所述的方法, 其中, 在该轮增量更新不是首轮增量更新的情况下, 所述 更新步骤还包括: 获取基于前一轮增量更新中满足预设的增量更新条件之后的实时更新操作中得到的 各个实时的更新结果; 根据各个实时的更新结果更新该轮增量更新的初始知识图谱。 9.如权利要求2 ‑5任一所述的方法, 其中, 所述实体描述信息包括属性信息、 连接信息 中的至少一项。 10.如权利要求2 ‑5任一所述的方法, 其中, 所述特征向量包括以下中的一项, 或以下中 的多项经嵌入得到的向量: 文本语义向量、 轨 迹向量、 图结构向量、 图表征向量。 11.如权利要求6所述的方法, 其中, 实时的实体链指过程通过在线检索引擎完成, 基于 实时的实体链指更新当前知识图谱通过在线图存储引擎完成; 所述利用增量的实体链指结 果更新所述初始知识图谱 包括: 通过数据转存机制, 将所述增量的实体链指结果同步至在线检索引擎及在线图存储引 擎, 从而完成所述增量的实体链指结果对该轮增量更新期间内产生的各个实时的实体链指 结果的替换, 从而利用增量的实体链指结果更新所述初始知识图谱。 12.如权利要求2所述的方法, 其中, 在增量数据中涉及的第二业务主体在该轮增量更 新的初始知识图谱中不存在相对应的节点的情况 下, 所述增量更新操作还 包括: 在该轮增量更新的初始知识图谱中增 加与所述第二 业务主体相对应的第二节点; 基于增加所述第二节点后的知识图谱进行增量的实体链指。 13.如权利要求1所述的方法, 其中, 在该轮增量更新为首轮增量更新的情况下, 该轮增 量更新的首次实时更新操作为: 利用接收的业 务数据对该轮增量更新的初始知识图谱进行 更新。 14.一种更新知识图谱的装置, 所述装置包括: 获取单元, 配置为在各轮增量更新中获取初始知识图谱; 更新单元, 配置为在各轮增量更新中进行包括重复执行的实时更新操作和满足预设的 增量更新条件的情况下的增量更新操作的更新步骤, 其中, 该实时更新操作包括: 响应于接 收到新的业务数据, 利用接收的业务数据对前一 实时更新操作中更新后的知识图谱进 行更 新, 该增量更新操作包括: 利用该轮增 量更新期间产生的业务数据对所述初始知识图谱进 行更新, 以作为下一轮增量更新的初始知识图谱。 15.一种计算机可读存储介质, 其上存储有计算机程序, 当所述计算机程序在计算机中 执行时, 令计算机执 行权利要求1 ‑13中任一项的所述的方法。 16.一种计算设备, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有可执行代 码, 所述处 理器执行所述可执行代码时, 实现权利要求1 ‑13中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114385833 A 3
专利 更新知识图谱的方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:58:58
上传分享
举报
下载
原文档
(778.9 KB)
分享
友情链接
NY-T 1215-2006 水稻光、温敏雄性核不育系育性鉴定规程.pdf
GB-T 24533-2019 锂离子电池石墨类负极材料.pdf
DL-T 884-2019 火电厂金相检验与评定技术导则.pdf
IATF安全框架 中文版 .pdf
GB-T 42260-2022 磷酸铁锂电化学性能测试 循环寿命测试方法.pdf
DB51-T 2989-2023 四川省健康医疗大数据应用指南 四川省.pdf
ISO IEC 27000-2018.pdf
GB-T 35281-2017 信息安全技术 移动互联网应用服务器安全技术要求.pdf
GB-T 29156-2012 金属复合装饰板材生产生命周期评价技术规范 产品种类规则.pdf
IDC 2022中国大模型发展白皮书 中国人工智能系列白皮书.pdf
招投标采购视角下网络安全市场2023年度报告最终版.pdf
T-CSAE 131—2020 乘用车白车身防腐排水及密封设计指南.pdf
WS-T 640-2018 临床微生物学检验样本的采集和转运.pdf
T-ZBLM 0001—2018 数据备份与恢复服务能力成熟度测评规范.pdf
GB-T 26758-2011 铅、锌冶炼企业节能规范.pdf
T-SMSWYY 001—2021 多花黄精工厂化育苗技术规程.pdf
GB-T 32841-2016 金矿石取样制样方法.pdf
亿格云 陈吴栋 零信任SASE 助力数字化企业建立多云安全访问体系.pdf
GB-T 37046-2018 信息安全技术 灾难恢复服务能力评估准则.pdf
GB 4824-2019 工业、科学和医疗设备 射频骚扰特性 限值和测量方法.pdf
交流群
-->
1
/
3
20
评价文档
赞助2元 点击下载(778.9 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。