说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211205488.2 (22)申请日 2022.09.29 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 何军响 杨明川 胡婕 闫蕊  高芷乔  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 孙宝海 (51)Int.Cl. G06F 16/2453(2019.01) G06F 16/2455(2019.01) (54)发明名称 数据查询方法、 装置、 电子设备以及存储介 质 (57)摘要 本申请的实施例揭示了数据查询方法、 装 置、 电子设备及计算机可读存储介质。 本方法包 括中央节 点获取待查询信息对应的业务类型, 从 多个边缘节点中确定与业务类型对应的多个目 标边缘节点, 其中, 各个目标边缘节点的注册信 息包括业务类型; 中央节点将待查询信息发送至 各个目标边缘节点, 其中, 各个目标边缘节点位 于不同的区域; 各个目标边缘节 点在本地存储的 数据集合中查询与待查询信息相关的候选数据, 各个目标边缘节点分别将得到的包括候选数据 的查询结果发送至中央节点; 中央节 点将各个目 标边缘节 点对应的查询结果进行汇总, 得到最终 的查询结果。 本申请能够提高数据查询效率。 权利要求书2页 说明书13页 附图6页 CN 115495478 A 2022.12.20 CN 115495478 A 1.一种数据查询方法, 其特征在于, 应用于数据查询系统, 所述数据查询系统包括中央 节点和与所述中央节点连接的多个边 缘节点, 包括: 中央节点获取待查询信 息对应的业务类型, 从所述多个边缘节点中确定与 所述业务类 型对应的多个目标边 缘节点, 其中, 各个目标边 缘节点的注 册信息包括所述 业务类型; 所述中央节点将所述待查询信息发送至各个目标边缘节点, 其中, 各个目标边缘节点 位于不同的区域; 各个目标边缘节点在本地存储的数据集合中查询与所述待查询信 息相关的候选数据, 各个目标边 缘节点分别将得到的包括 候选数据的查询结果发送至所述中央节点; 所述中央节点将各个目标边 缘节点对应的查询结果进行汇总, 得到最终的查询结果。 2.根据权利要求1所述的方法, 其特征在于, 所述各个目标边缘节点在本地存储的数据 集合中查询与所述待查询信息相关的候选数据包括: 各个目标边缘节点在向量索引中获取每个数据, 并计算对应数据与 所述待查询信 息的 相似度, 将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据, 基于对应 目标边缘节点的候选数据确定对应目标边 缘节点的第一 查询结果; 各个目标边缘节点在倒 排索引中获取每个数据, 并计算对应数据与 所述待查询信 息的 相似度, 将相似度大于第二预设阈值的数据作为对应目标边缘节点的候选数据, 基于对应 目标边缘节点的候选数据确定对应目标边 缘节点的第二 查询结果; 各个目标边缘节点基于对应的第一查询结果和第二查询结果确定对应目标边缘节点 的查询结果; 其中, 各个目标边缘节点的向量索引和倒排索引是对应目标边缘节点预先为本地存储 的数据集 合构建的。 3.根据权利要求2所述的方法, 其特征在于, 所述各个目标边缘节点在倒 排索引中获取 每个数据, 并计算对应数据与所述待查询信息的相似度, 将相似度大于第二预设阈值的数 据作为对应目标边缘节点的候选数据, 基于对应目标边缘节点的候选数据确定对应目标边 缘节点的第二 查询结果包括: 各个目标边 缘节点对所述待查询信息进行分词, 得到多个实词; 基于各个实词在所述待查询信息的IF- IDF值, 得到所述待查询信息的第一词频向量; 在对应目标边缘节点的倒 排索引中获取与 各个实词对应的数据, 基于各个实词在对应 数据中的IF- IDF值, 得到对应数据的第二词频向量; 对应目标边缘节点计算所述第 一词频向量和各个数据对应的第 二词频向量的相似度, 基于相似度大于所述第二预设阈值的候选数据确定对应目标边缘节点的所述第二查询结 果。 4.根据权利要求2所述的方法, 其特征在于, 各个目标边缘节点的第 一查询结果包括所 述待查询 信息与各个候选数据之间的第一相似度, 各个目标边缘节点的第二查询结果包括 所述待查询信息与各个候选数据之 间的第二相似度; 所述各个目标边缘节点基于对应的第 一查询结果和第二 查询结果确定对应目标边 缘节点的查询结果包括: 若存在目标边缘节点的所述第 一查询结果和第 二查询结果均包括目标候选数据, 所述 中央节点将对应目标边缘节点的目标候选数据的第一相似度和第二相似度的加权和作为 对应目标边 缘节点的目标候选数据的相似度;权 利 要 求 书 1/2 页 2 CN 115495478 A 2若对应目标边缘节点的目标候选数据的相似度大于第 三预设阈值, 所述中央节点将对 应目标边 缘节点的目标候选数据作为对应目标边 缘节点的查询结果中一个候选数据。 5.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类 型对应的子数据集 合; 各个目标业务节点分别为各个业务类型对应的子数据集合构建对应的子向量索引和 子倒排索引。 6.根据权利要求5所述的方法, 其特征在于, 所述各个目标边缘节点在本地存储的数据 集合中查询与所述待查询信息相关的候选数据包括: 各个目标边缘节点基于所述待查询信息在所述待查询信息对应的业务类型的子向量 索引和子倒排索引进行查询, 获取与所述待查询信息相关的候选数据。 7.根据权利要求2所述的方法, 其特征在于, 所述各个目标边缘节点在向量索引中获取 每个数据, 并计算对应数据与所述待查询信息的相似度, 将相似度大于第一预设阈值的数 据作为对应目标边缘节点的候选数据, 基于对应目标边缘节点的候选数据确定对应目标边 缘节点的第一 查询结果包括: 各个目标边 缘节点将所述待查询信息划分为多个子待查询信息; 对所述多个子待查询信息的语义向量进行池化处理, 得到所述待查询信息的语义向 量; 计算对应数据的语义向量与 所述待查询信 息的语义向量的相似度, 将相似度 大于所述 第一预设阈值的数据作为对应目标边缘节点的候选数据, 基于对应目标边缘节点的候选数 据确定对应目标边 缘节点的 的第一查询结果。 8.一种数据查询控制装置, 用于控制数据查询系统, 所述数据查询系统包括中央节点 和与所述中央节点连接的多个边 缘节点, 其特 征在于, 包括: 确定模块, 用于控制中央节点获取待查询信息对应的业务类型, 从所述多个边缘节点 中确定与所述业务类型对应的多个目标边缘节点, 其中, 各个目标边缘节点的注册信息包 括所述业务类型; 发送模块, 用于控制所述中央节点将所述待查询信息发送至各个目标边缘节点, 其中, 各个目标边 缘节点位于不同的区域; 查询模块, 用于控制各个目标边缘节点基于所述待查询信 息在本地存储的数据集合中 进行查询, 各个目标边 缘节点分别将得到的查询结果发送至所述中央节点; 汇总模块, 用于控制所述中央节点将各个目标边缘节点对应的查询结果进行汇总, 得 到最终的查询结果。 9.一种电子设备, 其特 征在于, 包括: 存储器, 存储有计算机可读指令; 处理器, 读取存储器存储的计算机可读指令, 以执行权利要求1-7中的任一项所述的 方法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机可读指令, 当所述计算 机可读指令被计算机的处理器执行时, 使计算机执行权利要求1-7中的任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 115495478 A 3

.PDF文档 专利 数据查询方法、装置、电子设备以及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据查询方法、装置、电子设备以及存储介质 第 1 页 专利 数据查询方法、装置、电子设备以及存储介质 第 2 页 专利 数据查询方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:17:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。