说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211060154.0 (22)申请日 2022.08.30 (71)申请人 上海掌数 科技有限公司 地址 200093 上海市杨 浦区周家嘴路3 388 号13号楼C 01-C04 (72)发明人 邹昌根 高星 龚丽丽 刘建  (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 隋晓勇 (51)Int.Cl. G06F 9/38(2006.01) G06F 9/54(2006.01) G06F 8/41(2018.01) G06F 16/21(2019.01) G06F 16/22(2019.01)G06F 16/242(2019.01) G06F 16/2455(2019.01) (54)发明名称 一种openGauss内核数据库并行执行优化的 方法 (57)摘要 本发明提供一种open Gauss内核数据库并行 执行优化的方法, 包括以下步骤: 修改open Gauss 内核数据库的引擎内容, 在SMP并行程序中增加 与数据业务无关的流水号对主表数据重分布, 对 流水号按并行度进行Hash计算, 对主表数据执行 重分布; 对各小表全广播; 编译 openGauss内核 二 进制文件; 将 存储过程业务逻辑修改为动态开通 或者关闭SMP并行特性; 在操作系统安装部署 openGauss内核二进制软件; 对数据库软件设置 启用SMP特性; 导入数据模型; 导入业务数据, 根 据业务调度需求开启SMP并行执行SQL语句 或存 储过程。 本发 明实现了与数据分布无关的执行计 划, 提高了openGaus s内核并行 特性适用范围。 权利要求书2页 说明书6页 附图3页 CN 115421792 A 2022.12.02 CN 115421792 A 1.一种openGaus s内核数据库并行 执行优化的方法, 其特 征在于, 包括以下步骤: S1、 修改openGauss内核数据库的引擎内容, 在SMP并行程序 中增加与数据业务无关的 流水号, 对数据库表的主表数据进行重分布, 对所述流水号按并行度m进行Hash计算得到 Hash值, 使用所述Hash值对所述主表数据执 行重分布; S2、 对数据库表的与主表关联的各小表进行全广播复制m份, 使得各小表数据在各分布 数据节点都包 含有一份副本; S3、 编译出支持SMP特性的openGaus s内核二进制文件; S4、 将openGauss内核数据库存储过程的业务逻辑修改为在会话过程中动态开通或者 关闭SMP并行 特性; S5、 选择支持SMP多核并行处理能力的计算机以及操作系统, 在操作系统上安装部署S3 步骤编译的所述openGauss内核二进制软件; 对openGauss内核数据库软件设置启用SMP特 性; S6、 导入数据模型; 导入业务数据, 根据业务调度需求, 开启SMP并行执行SQL语句或存 储过程。 2.根据权利要求1所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述S6步骤的开启SMP并行 执行SQL语句或存 储过程的方法包括以下步骤: S61、 通过JDBC调用存储过程或对应的SQL代码段; 进入所述SQL代码段; 开启SMP并行特 性, 设置并发路数; S62、 进入openGaus s内核执行需要并行的SQ L计算; S63、 将并行的SQL计算结果实时返回进行合并、 聚合、 统计, 直到所有Worker线程都返 回结果; S64、 按设定条件 对SQL计算结果进行排序、 筛 选, 生成结果 集合并返回。 3.根据权利要求2所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述S62步骤的进入openGaus s内核执行需要并行的SQ L计算的方法包括: 通过查询优化器对传入openGauss内核的SQL计算字段进行解析, 通过SQL获取主表数 据的部分逻辑, 按照流水号对主表数据进行Hash计算执行重分布形成数据分片Data  Node, 将所述数据分片进行拆分, 下发到不同的支持多线程并行的执行Worker; 各执行Worker接 收到执行指令后, 对数据分片 DataNode进行数据计算。 4.根据权利要求3所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述数据分片下发到不同的执 行Worker的方法包括: 通过查询优化器对与主表关联的各小表进行全广播BROADCAST操作, 将各小表数据的 副本下发到不同的执 行Worker。 5.根据权利要求3所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述对数据分片 Data Node进行数据计算的方法包括: 在所述数据分片内执 行join操作, 做到非共享Share  Nothing。 6.根据权利要求2所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述S64步骤之后还 包括: 恢复并发路数为默认的1路; 进入下一段SQL代码段, 按需决定是否开启SMP并行特性; 直到会话过程执 行完毕。权 利 要 求 书 1/2 页 2 CN 115421792 A 27.根据权利要求1所述的openGauss内核数据库并行执行优化的方法, 其特征在于, 所 述S6步骤的所述数据模型包括: 业务表、 存储过程、 视图、 函数。 8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器 执行时实现权利要求1 ‑7任一项所述的openGaus s内核数据库并行 执行优化的方法的步骤。 9.一种计算机设备, 所述计算机设备包括存储器、 处理器及存储在存储器上并可在处 理器上运行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7任 一项所述的openGaus s内核数据库并行 执行优化的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115421792 A 3

.PDF文档 专利 一种openGauss内核数据库并行执行优化的方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种openGauss内核数据库并行执行优化的方法 第 1 页 专利 一种openGauss内核数据库并行执行优化的方法 第 2 页 专利 一种openGauss内核数据库并行执行优化的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:14:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。