说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211145425.2 (22)申请日 2022.09.20 (71)申请人 北京火山引擎科技有限公司 地址 100190 北京市海淀区紫金 数码园4号 楼13层13 09 (72)发明人 黄昭伟 户蕾蕾 杜军令 罗旋  (74)专利代理 机构 北京信远 达知识产权代理有 限公司 1 1304 专利代理师 储倩 (51)Int.Cl. G06F 16/242(2019.01) G06F 16/2455(2019.01) G06F 16/248(2019.01) (54)发明名称 一种Doris的数据查询方法、 装置、 存储介质 及设备 (57)摘要 本申请公开了一种Doris的数据查询方法、 装置、 存储介质及设备, 该方法包括: 首先获取 Doris的底层算子中的历史数据, 并将其进行聚 合计算, 得到聚合结果, 然后通过预设缓存系统, 将其进行缓存; 接着响应于对Doris的数据查询 请求, 对Doris中新插入的底层算子中的实时数 据进行聚合计算, 得到聚合结果; 进而从预设缓 存系统中获取历史数据的聚合结果, 并将其与实 时数据的聚合结果进行合并处理, 得到合并后的 数据, 再将其通过Doris的数据发送算子向执行 引擎的上层进行反馈, 输出最终的数据查询结 果。 由于先将底层算子中历史数据的聚合结果缓 存, 在数据查询时, 只需要对实时数据进行聚合 计算,历史数据的聚合结果可从缓存中获取, 减 少了计算资源, 提高了查询并发效果。 权利要求书2页 说明书10页 附图6页 CN 115455031 A 2022.12.09 CN 115455031 A 1.一种Doris的数据查询方法, 其特 征在于, 所述方法包括: 获取Doris的存储引擎架构中底层算子中的历史数据, 并将所述历史数据进行聚合计 算, 得到聚合后的底层算子中历史数据的聚合结果; 通过预设缓存系统, 将所述历史数据的聚合结果进行缓存; 响应于对所述Doris的数据 查询请求, 对所述Doris中新插入的底层算子中的实时数据 进行聚合计算, 得到实时数据的聚合结果; 从所述预设缓存系统中获取历史数据的聚合结果, 并将所述历史数据的聚合结果与 所 述实时数据的聚合结果进行合并处 理, 得到合并后的数据; 将所述合并后的数据通过Doris的数据发送算子向执行引擎的上层进行反馈, 以便输 出最终的数据查询结果。 2.根据权利要求1所述的方法, 其特征在于, 所述通过预设缓存系统, 将所述历史数据 的聚合结果进行缓存, 包括: 通过预设缓存系统, 按照键值对的方式, 将所述历史数据的聚合结果进行缓存。 3.根据权利要求2所述的方法, 其特征在于, 所述历史数据的聚合结果的键包含底层算 子读取器, 以及过 滤器、 列、 本地聚合 算子、 排序算子中的至少一项。 4.根据权利要求2所述的方法, 其特征在于, 所述历史数据的聚合结果的值的存储结构 为结果块列表。 5.根据权利要求3所述的方法, 其特征在于, 所述将所述历史数据的聚合结果与所述实 时数据的聚合结果进行合并处 理, 得到合并后的数据, 包括: 当所述历史数据的聚合结果的键的最上层为底层算子读取器、 过滤器或列时, 将所述 历史数据的聚合结果与所述实时数据的聚合结果组织为列表方式,进行联合处理, 得到处 理后的数据; 或者, 当所述历史数据的聚合结果的键的最上层为本地聚合算子时, 将所述历史数据 的聚合结果与所述实时数据的聚合结果组织为哈希方式,并在 对所述实时数据的聚合结果 进行哈希处 理后, 将得到的处 理结果插 入到所述历史数据的聚合结果对应的哈希结果中; 或者, 当所述历史数据的聚合结果的键的最上层为排序算子时, 将所述历史数据的聚 合结果与所述实时数据的聚合结果组织为有序列 表或者有序哈希表方式,并将所述 实时数 据的聚合结果, 通过插 入排序的方式, 插 入到有序结果 集中。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 利用最近最少使用算法,当达到所述预设缓存系统中预置的过期时间和/或缓存容量 时, 删除所述预设缓存系统中最 不频繁使用的历史数据的聚合结果。 7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述预设缓存系统为内存。 8.一种Doris的数据查询装置, 其特 征在于, 所述装置包括: 第一计算单元, 用于获取Doris的存储引擎架构中底层算子中的历史数据, 并将所述历 史数据进行聚合计算, 得到聚合后的底层算子中历史数据的聚合结果; 缓存单元, 用于通过 预设缓存系统, 将所述历史数据的聚合结果进行缓存; 第二计算单元, 用于响应于对所述Doris的数据查询请求, 对所述Doris中新插入的底 层算子中的实时数据进行聚合计算, 得到实时数据的聚合结果; 合并单元, 用于从所述预设缓存系统中获取历史数据的聚合结果, 并将所述历史数据权 利 要 求 书 1/2 页 2 CN 115455031 A 2的聚合结果与所述实时数据的聚合结果进行合并处 理, 得到合并后的数据; 反馈单元, 用于将所述合并后的数据通过Doris的数据发送算子向执行引擎的上层进 行反馈, 以便 输出最终的数据查询结果。 9.一种Doris的数据查询设备, 其特 征在于, 包括: 处 理器、 存储器、 系统总线; 所述处理器以及所述存 储器通过 所述系统总线相连; 所述存储器用于存储一个或多个程序, 所述一个或多个程序包括指令, 所述指令当被 所述处理器执行时使所述处 理器执行权利要求1 ‑7任一项所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有指令, 当所述指令在终端设备 上运行时, 使得 所述终端设备 执行权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115455031 A 3

.PDF文档 专利 一种Doris的数据查询方法、装置、存储介质及设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种Doris的数据查询方法、装置、存储介质及设备 第 1 页 专利 一种Doris的数据查询方法、装置、存储介质及设备 第 2 页 专利 一种Doris的数据查询方法、装置、存储介质及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:14:07上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。