说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210356681.X (22)申请日 2022.03.31 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 孟轩  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 武晨燕 徐升升 (51)Int.Cl. G06F 16/36(2019.01) (54)发明名称 数据识别方法、 装置、 设备以及存 储介质 (57)摘要 本公开提供了一种数据识别方法、 装置、 设 备以及存储介质。 涉及数据处理技术领域, 尤其 涉及数据挖掘、 数据分析等领域。 具体实现方案 为: 获取第一实体的第一数据以及第二实体的第 二数据, 第一数据包括第一实体的目标对象 的特 征, 第二数据包括第二实体的目标对象的特征; 获取第一实体与第二实体的关系数据; 在第一实 体与第二实体的关系数据满足预设条件的情况 下, 将第一实体和第二实体包括的特征相同的目 标对象识别为同一目标对象。 根据本公开的技术 方案, 能提高数据识别的准确度。 权利要求书2页 说明书11页 附图8页 CN 114896410 A 2022.08.12 CN 114896410 A 1.一种数据识别方法, 包括: 获取第一实体的第 一数据以及第 二实体的第 二数据, 所述第 一数据包括所述第 一实体 的目标对象的特 征, 所述第二数据包括所述第二实体的目标对象的特 征; 获取所述第一实体与所述第二实体的关系数据; 在所述第一实体与 所述第二实体的所述关系数据满足预设条件的情况下, 将所述第 一 实体和所述第二实体包括的特 征相同的目标对象识别为同一目标对象。 2.根据权利要求1所述的方法, 其中, 所述在所述第 一实体与 所述第二实体的所述关系 数据满足预设条件的情况下, 将所述第一实体和所述第二实体包括的特征相同的目标对象 识别为同一目标对象, 包括: 在所述第一实体与所述第二实体包括的特征相同的目标对象的数量大于预设值的情 况下, 将所述第一实体和所述第二实体包括的特 征相同的目标对象识别为同一目标对象。 3.根据权利要求1所述的方法, 其中, 所述在所述第 一实体与 所述第二实体的所述关系 数据满足预设条件的情况下, 将所述第一实体和所述第二实体包括的特征相同的目标对象 识别为同一目标对象, 包括: 在所述第一实体与 所述第二实体存在预设直接关系的情况下, 将所述第 一实体和所述 第二实体包括的特 征相同的目标对象识别为同一目标对象。 4.根据权利要求1所述的方法, 其中, 所述在所述第 一实体与 所述第二实体的所述关系 数据满足预设条件的情况下, 将所述第一实体和所述第二实体包括的特征相同的目标对象 识别为同一目标对象, 包括: 在所述第一实体与所述第二实体存在N度以内间接关系的情况下, 将所述第一实体和 所述第二实体包括的特 征相同的目标对象识别为同一目标对象, 所述 N为大于1的整数。 5.根据权利要求1所述的方法, 还 包括: 将所述第一实体包括的特 征相同的多个目标对象识别为同一目标对象; 将所述第二实体包括的特 征相同的多个目标对象识别为同一目标对象。 6.根据权利要求1至 5任一项所述的方法, 还 包括: 在将所述第一实体和所述第二实体包括的特征相同的目标对象识别为同一目标对象 之后, 基于识别的结果 生成所述第一实体和所述第二实体的关系图谱。 7.一种数据识别装置, 包括: 第一获取模块, 用于获取第一实体的第一数据以及第二实体的第二数据, 所述第一数 据包括所述第一 实体的目标对象的特征, 所述第二数据包括所述第二实体的目标对象的特 征; 第二获取模块, 用于获取 所述第一实体与所述第二实体的关系数据; 识别模块, 用于在所述第 一实体与 所述第二实体的所述关系数据满足预设条件的情况 下, 将所述第一实体和所述第二实体包括的特 征相同的目标对象识别为同一目标对象。 8.根据权利要求7所述的装置, 其中, 所述识别模块包括第一识别子模块, 所述第一识 别子模块用于: 在所述第一实体与所述第二实体包括的特征相同的目标对象的数量大于预设值的情 况下, 将所述第一实体和所述第二实体包括的特 征相同的目标对象识别为同一目标对象。 9.根据权利要求7所述的装置, 其中, 所述识别模块包括第二识别子模块, 所述第二识权 利 要 求 书 1/2 页 2 CN 114896410 A 2别子模块用于: 在所述第一实体与 所述第二实体存在预设直接关系的情况下, 将所述第 一实体和所述 第二实体包括的特 征相同的目标对象识别为同一目标对象。 10.根据权利要求7所述的装置, 其中, 所述识别模块包括第 三识别子模块, 所述第 三识 别子模块用于: 在所述第一实体与所述第二实体存在N度以内间接关系的情况下, 将所述第一实体和 所述第二实体包括的特 征相同的目标对象识别为同一目标对象, 所述 N为大于1的整数。 11.根据权利要求7所述的装置, 所述识别模块包括第四识别子模块, 所述第四识别子 模块用于: 将所述第一实体包括的特 征相同的多个目标对象识别为同一目标对象; 将所述第二实体包括的特 征相同的多个目标对象识别为同一目标对象。 12.根据权利要求7至1 1任一项所述的装置, 还 包括: 生成模块, 用于在将所述第 一实体和所述第 二实体包括的特征相同的目标对象识别为 同一目标对象之后, 基于识别的结果 生成所述第一实体和所述第二实体的关系图谱。 13.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1至 6中任一项所述的方法。 14.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1至 6中任一项所述的方法。 15.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1至 6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114896410 A 3

.PDF文档 专利 数据识别方法、装置、设备以及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据识别方法、装置、设备以及存储介质 第 1 页 专利 数据识别方法、装置、设备以及存储介质 第 2 页 专利 数据识别方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。