(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210856875.6
(22)申请日 2022.07.21
(65)同一申请的已公布的文献号
申请公布号 CN 114969110 A
(43)申请公布日 2022.08.30
(73)专利权人 阿里巴巴 (中国) 有限公司
地址 310012 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 孙建华 冯遵宝 张广舟 李飞飞
(74)专利代理 机构 北京润泽恒知识产权代理有
限公司 1 1319
专利代理师 刘祥景
(51)Int.Cl.
G06F 16/2453(2019.01)
G06F 16/2455(2019.01)G06F 16/27(2019.01)
(56)对比文件
CN 105975617 A,2016.09.28
US 9652496 B1,2017.0 5.16
CN 105247513 A,2016.01.13
CN 111352950 A,2020.0 6.30
CN 114254005 A,2022.03.29
CN 112364021 A,2021.02.12
US 2012254245 A1,2012.10.04
CN 102201010 A,201 1.09.28
王志海.无线网络优化平台数据库性能优化
设计思路. 《移动通信》 .2015,(第02期),
审查员 张改红
(54)发明名称
查询方法和装置
(57)摘要
本申请公开了查询方法和装置。 其中所述方
法通过将共享存储架构的分区表转换为无共享
架构的分布表,利用分布表的群集感知 (cluster
aware) 特点, 使得在横向上多个并行查询进 程共
同扫描一张分区父表, 在纵向上多个并行查询进
程扫描各自负责的分区子表, 实现对分区表混合
扫描 (Hybrid Scan) 的方式, 基于此使得并行执
行引擎从底层同时支持分区表的各项优化。 这
样, 既可以消除分区表的多个并行查询进程的数
据重分布开销, 因此可以有效提升查询性能; 又
支持不同分区数的分区表连接加速, 因此可以有
效提升分区表加速查询的鲁棒性; 再者, 由于从
底层同时支持分区表的各项优化, 因此还可以有
效提升查询加速方式的可扩 展性。
权利要求书2页 说明书12页 附图5页
CN 114969110 B
2022.10.21
CN 114969110 B
1.一种查询方法, 包括:
针对目标查询语句相关的共享存储的目标分区表, 构建分区子表与计算节点之间的第
一对应关系, 使得将共享存储的目标分区表数据映射为分布表数据, 以及, 构建分区子表与
并行查询进程之间的第二对应关系;
根据所述第一对应关系, 通过计算节点上的并行查询进程扫描目标分区表;
根据所述第二对应关系, 通过不同的查询进程扫描不同的分区子表;
根据各进程的扫描结果, 获取与目标查询语句对应的查询结果。
2.根据权利要求1所述的方法,
所述目标查询语句包括针对第 一分区表和第 二分区表进行连接查询的语句, 所述目标
分区表包括第一分区表和第二分区表, 第一分区表与第二分区表的分区数不同。
3.根据权利要求1所述的方法, 还 包括:
获取目标分区表的分区方式信息;
根据所述分区方式信息, 判断是否执 行所述方法。
4.根据权利要求3所述的方法,
所述目标分区表包括哈希分区表;
所述方法还 包括:
获取计算节点的第一进程数阈值;
所述获取目标分区表的分区方式信息, 包括:
获取各分区表的哈希定义取模值;
所述根据所述分区方式信息, 判断是否执 行所述方法, 包括:
根据各分区表的哈希定义取模值, 确定所有分区表的哈希定义取模值的公约数;
根据所述公约数和所述第一进程数阈值, 确定第二进程数阈值;
若计算节点的进程数 大于第二进程数阈值, 则判定执 行所述方法。
5.根据权利要求1所述的方法,
所述目标分区表包括哈希分区表;
所述第二对应关系采用如下 方式构建:
根据分区子表 的哈希值、 分区数和并行查询进程数, 确定分区子表与并行查询进程之
间的对应关系。
6.根据权利要求1所述的方法, 所述第一对应关系采用如下 方式构建:
获取计算节点数和分区子表标识;
根据分区子表标识与计算节点数相除的余数, 确定分区子表和计算节点之间的对应关
系。
7.根据权利要求1所述的方法, 所述第二对应关系采用如下 方式构建:
根据计算节点数、 并行查询进程数、 进程标识和分区子表标识, 确定分区子表与并行查
询进程之间的对应关系。
8.根据权利要求1所述的方法, 还 包括:
构建并行查询进程与计算节点之间的对应关系。
9.一种查询装置, 包括:
映射单元, 用于针对目标查询语句相关的共享存储的目标分区表, 构建分区子表与计权 利 要 求 书 1/2 页
2
CN 114969110 B
2算节点之 间的第一对应 关系, 使得将共享存储的目标分区表数据映射为分布表数据, 以及,
构建分区子表与并行查询进程之间的第二对应关系;
横向扫描单元, 用于根据所述第一对应关系, 通过计算节点上的并行查询进程扫描目
标分区表;
纵向扫描单元, 用于根据所述第二对应关系, 通过不同的查询进程扫描不同的分区子
表;
查询结果获取单元, 用于根据各进程的扫描结果, 获取与目标查询语句对应的查询结
果。
10.一种电子设备, 包括:
处理器和存 储器;
存储器, 用于存储实现根据权利要求1 ‑8任一项所述的查询方法的程序, 该设备通电并
通过所述处理器运行 该方法的程序。
11.一种计算机可读存储介质, 所述计算机可读存储介质中存储有指令, 当其在计算机
上运行时, 使得计算机执 行根据权利要求1 ‑8任一项所述的方法。
12.一种数据库系统, 包括:
存储节点, 计算节点;
所述计算节点执 行如下处 理:
针对目标查询语句相关的共享存储的目标分区表, 构建分区子表与计算节点之间的第
一对应关系, 使得将共享存储的目标分区表数据映射为分布表数据, 以及, 构建分区子表与
并行查询进程之间的第二对应关系;
根据所述第一对应关系, 通过计算节点上的并行查询进程扫描目标分区表;
根据所述第二对应关系, 通过不同的查询进程扫描不同的分区子表;
根据各进程的扫描结果, 获取与目标查询语句对应的查询结果。权 利 要 求 书 2/2 页
3
CN 114969110 B
3
专利 查询方法和装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:18:09上传分享