说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210272608.4 (22)申请日 2022.03.18 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 金建杰  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 何倚雯 (51)Int.Cl. G06F 40/279(2020.01) G06F 16/35(2019.01) G06F 16/36(2019.01) (54)发明名称 数据分析方法、 电子设备和计算机可读存储 介质 (57)摘要 本申请公开了一种数据分析方法、 电子设备 和计算机可读存储介质, 该方法包括: 获得待处 理的原始数据, 基于知 识图谱映射规则为原始数 据设置标签; 基于标签将原始数据归类至对应的 实体表中, 得到原始数据对应的实体, 并在实体 表中确定实体的标识和信息字段; 其中, 实体对 应有实体类型, 每个实体表对应一种实体类型; 基于实体表中每两个实体的标识和 信息字段, 确 定两个实体在知识图谱中的关联关系。 上述方 案, 能够提高数据分析的效率降低数据维护的难 度。 权利要求书2页 说明书7页 附图2页 CN 114881013 A 2022.08.09 CN 114881013 A 1.一种数据分析 方法, 其特 征在于, 所述方法包括: 获得待处 理的原始数据, 基于知识图谱映射 规则为所述原 始数据设置标签; 基于所述标签将所述原始数据归类至对应的实体表中, 得到所述原始数据对应的实 体, 并在所述实体表中确定所述实体的标识和信息字段; 其中, 所述实体对应有实体类型, 每个所述实体表对应一种所述实体 类型; 基于所述实体表中每两个所述实体的所述标识和所述信 息字段, 确定两个所述实体在 知识图谱中的关联关系。 2.根据权利要求1所述的数据分析方法, 其特征在于, 所述获得待处理的原始数据, 基 于知识图谱映射 规则为所述原 始数据设置标签的步骤, 包括: 从数据源获取待处理 的所述原始数据, 将所述原始数据与所述数据源中的其他数据进 行融合处理, 基于融合处理结果为所述原始数据设置知识图谱 可采用的标签; 其中, 所述标 签与所述实体 类型相对应, 每种所述实体 类型对应有至少一个所述标签。 3.根据权利要求2所述的数据分析方法, 其特征在于, 所述基于所述标签将所述原始数 据归类至对应的实体表中, 得到所述原始数据对应的实体, 并在所述实体表中确定所述实 体的标识和信息 字段的步骤, 包括: 基于所述标签确定所述原始数据的实体类型, 将所述原始数据归类至与所述实体类型 对应的实体表中, 得到所述原 始数据对应的实体; 在所述实体表中为所述实体设置标识, 基于所述原始数据生成所述实体对应的属性字 段和冗余字段; 其中, 所述信息 字段包括所述属性字段和所述冗余字段。 4.根据权利要求3所述的数据分析方法, 其特征在于, 所述在所述实体表中为所述实体 设置标识的步骤, 包括: 基于信息摘要算法和所述实体对应的实体 类型, 生成所述实体对应的标识。 5.根据权利要求3所述的数据分析方法, 其特征在于, 所述基于所述标签将所述原始数 据归类至对应的实体表中, 得到所述原始数据对应的实体, 并在所述实体表中确定所述实 体的标识和信息 字段的步骤之后, 还 包括: 响应于获得多个实体表, 基于所述实体表对应的所述实体类型将所述实体表归类至对 应的实体主题中; 其中, 每种所述实体主题对应有至少一个所述实体 类型。 6.根据权利要求1所述的数据分析方法, 其特征在于, 所述关联关系包括多种预定义的 关系类型, 所述基于所述实体表中每两个所述实体的所述标识和所述信息字段, 确定两个 所述实体在 知识图谱中的关联关系的步骤, 包括: 在所述实体表中基于所述标识选择任意两个所述实体, 基于所述实体的所述信息字 段, 生成两个所述实体之 间的关联信息并确定两个所述 实体在知识图谱中的关联关系对应 的关系类型。 7.根据权利要求6所述的数据分析方法, 其特征在于, 所述基于所述实体的所述信 息字 段, 生成两个所述实体之 间的关联信息并确定两个所述 实体在知识图谱中的关联关系对应 的关系类型的步骤, 包括: 基于两个所述实体各自对应的所述信息字段, 遍历预定义的所述关系类型, 确定两个 所述实体在 知识图谱中的关联关系对应的至少一个关系类型; 确定每个所述关系类型分别对应的关联信 息; 其中, 所述关联信 息包括关联时间、 关联权 利 要 求 书 1/2 页 2 CN 114881013 A 2地址和关联 频次中的至少一种; 汇总两个所述实体对应的关系类型和所述关系类型对应的关联信 息, 得到所述两个实 体在所述知识图谱中的关系结果表。 8.根据权利要求7所述的数据分析方法, 其特征在于, 所述基于所述实体表中每两个所 述实体的所述标识和所述信息字段, 确定两个所述实体在知识图谱中的关联关系的步骤之 后, 还包括: 基于当前节点和上一节点分别对应的所述实体表和所述关系结果表, 生成每经过预设 周期所述当前节点对应的实体增量表和关系增量表。 9.一种电子设备, 其特征在于, 包括: 相互耦接的存储器和处理器, 其中, 所述存储器存 储有程序数据, 所述处 理器调用所述 程序数据以执 行如权利要求1 ‑8中任一项所述的方法。 10.一种计算机可读存储介质, 其上存储有程序数据, 其特征在于, 所述程序数据被处 理器执行时实现如权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114881013 A 3

.PDF文档 专利 数据分析方法、电子设备和计算机可读存储介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据分析方法、电子设备和计算机可读存储介质 第 1 页 专利 数据分析方法、电子设备和计算机可读存储介质 第 2 页 专利 数据分析方法、电子设备和计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。