说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210763773.X (22)申请日 2022.06.30 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中经济开发 区郭巷街道官浦路1号9幢 (72)发明人 王超  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 耿苑 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/455(2006.01) (54)发明名称 一种资源配置方法、 装置、 设备及可读存储 介质 (57)摘要 本申请公开了一种资源配置方法、 装置、 设 备及可读存储介质, 该方法包括: Kubernetes获 取目标服务的资源状态参数; 利用bandit算法, 对资源状态参数进行计算, 得到资源分配信息; 利用资源分配信息, 对目标服务进行资源分配。 在本申请中, 获取目标访问的资源状态参数, 然 后直接利用bandit算法, 计算出目标服务对应的 资源分配信息, 然后利用该资源分配信息对目标 服务进行资源分配即可。 由于bandit算法可以实 现在线优化, 也可以快速响应, 因而基于bandit 算法计算出的资源分配信息进行资源配置, 可以 积极应当在线推理服务的冷启动的情况, 在线业 务特征维度升高、 降低导致的计算复杂 度变化的 情况。 权利要求书1页 说明书8页 附图3页 CN 115114026 A 2022.09.27 CN 115114026 A 1.一种资源配置方法, 其特 征在于, 包括: Kubernetes获取目标服 务的资源状态参数; 利用bandit算法, 对所述资源状态参数进行计算, 得到资源分配信息; 利用所述资源分配信息, 对所述目标服 务进行资源分配。 2.根据权利要求1所述的资源配置方法, 其特征在于, 所述得到资源分配信息之后, 还 包括: 利用所述资源分配信息, 对与所述目标服 务的相似服 务进行初始化资源配置 。 3.根据权利要求1所述的资源配置方法, 其特征在于, 所述获取目标服务的资源状态参 数, 包括: 获取所述目标服务的实时流量、 处理器使用率、 存储设备占用率、 计算设备温度、 加速 卡计算能力值。 4.根据权利要求1所述的资源配置方法, 其特征在于, 利用所述资源分配信息, 对所述 目标服务进行资源分配, 包括: 参照所述资源分配信息, 对所述目标服务的CPU核心数量、 加速卡数量、 QPS、 资源阈值 进行设置或调整。 5.根据权利 要求1至4任一项所述的资源配置方法, 其特征在于, 利用bandit算法, 对所 述资源状态参数进行计算, 得到资源分配信息, 包括: 利用LinUCB算法, 对所述资源状态参数进行计算, 得到所述资源分配信息 。 6.根据权利要求5所述的资源配置方法, 其特征在于, 在对所述目标服务进行资源分配 之后, 还包括: 重新获取 所述目标服 务的资源状态参数; 利用新获取的所述资源状态参数, 对所述 LinUCB算法的进行训练。 7.根据权利要求6所述的资源配置方法, 其特征在于, 利用新获取的所述资源状态参 数, 对所述 LinUCB算法的进行训练, 包括: 将新获取的所述资源状态参数输入所述 LinUCB算法; 利用FTRL 算法替换逆运 算过程后, 计算并更新所述 LinUCB算法每 个臂的参数。 8.一种资源配置装置, 其特 征在于, 应用于Kubernetes, 包括: 参数获取模块, 用于获取目标服 务的资源状态参数; 资源分配信息获取模块, 用于利用bandit算法, 对所述资源状态参数进行计算, 得到资 源分配信息; 资源分配模块, 用于利用所述资源分配信息, 对所述目标服 务进行资源分配。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储计算机程序; 处理器, 用于执行所述计算机程序时实现如权利要求1至7任一项所述资源配置方法的 步骤。 10.一种可读存储介质, 其特征在于, 所述可读存储介质上存储有计算机程序, 所述计 算机程序被处 理器执行时实现如权利要求1至7任一项所述资源配置方法的步骤。权 利 要 求 书 1/1 页 2 CN 115114026 A 2一种资源配置方 法、 装置、 设备及可读存储介质 技术领域 [0001]本申请涉及计算机应用技术领域, 特别是涉及一种资源配置方法、 装置、 设备及可 读存储介质。 背景技术 [0002]Kubernetes简称 “k8s”或者“kube”, 是一个可移植的、 可扩展的开源平 台, 用于管 理容器化的工作负载和服务, 可促进声明式配置和自动化, 可以在物理或虚拟机的 Kubernetes集群上运行容器化应用, Kubernetes能提供一个以容器为中心的基础架构, 满 足在生产环境中运行应用的一些常见需求。 [0003]Kubernetes对容器/服务提供了弹性扩容能力, 能根据一定的弹性策略动态增加 和减少服务的容器节点数, 从而动态地调整服务处理能力。 在一定程度上解决了突发流量 和计算资源分配的问题。 [0004]但是, 对于在线推理服务的冷启动的情况, 或者在线业务特征维度升高、 降低导致 的计算复杂度变化, 现有Kub ernetes弹性扩容能力 无法快速、 准确地为新上线业务提供最 佳的计算资源初始 化配置, 并且对于需要GPU的计算加速场景, Kuber netes也很难有效地根 据线上个服 务、 资源指标进行服 务副本的弹性扩 缩容。 [0005]综上所述, 如何有效地解决服务资源配置等问题, 是目前本领域技术人员急需解 决的技术问题。 发明内容 [0006]本申请的目的是提供一种资源配置方法、 装置、 设备及可读存储介质, 以面对资源 需求变化的情况 下, 快速完成与资源需求对应的资源配置 。 [0007]为解决上述 技术问题, 本申请提供如下技 术方案: [0008]一种服务资源配置方法, 包括: [0009]Kubernetes获取目标服 务的资源状态参数; [0010]利用bandit算法, 对所述资源状态参数进行计算, 得到资源分配信息; [0011]利用所述资源分配信息, 对所述目标服 务进行资源分配。 [0012]优选地, 所述得到资源分配信息之后, 还 包括: [0013]利用所述资源分配信息, 对与所述目标服 务的相似服 务进行初始化资源配置 。 [0014]优选地, 所述获取目标服 务的资源状态参数, 包括: [0015]获取所述目标服务的实时流量、 处理器使用率、 存储设备占用率、 计算设备温度、 加速卡计算能力值。 [0016]优选地, 利用所述资源分配信息, 对所述目标服 务进行资源分配, 包括: [0017]参照所述资源分配信息, 对所述目标服务 的CPU核心数量、 加速卡数量、 QPS、 资源 阈值进行设置或调整。 [0018]优选地, 利用bandit算法, 对所述资源状态参数进行计算, 得到资源分配信息, 包说 明 书 1/8 页 3 CN 115114026 A 3

.PDF文档 专利 一种资源配置方法、装置、设备及可读存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种资源配置方法、装置、设备及可读存储介质 第 1 页 专利 一种资源配置方法、装置、设备及可读存储介质 第 2 页 专利 一种资源配置方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:29:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。