说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210907493.1 (22)申请日 2022.07.29 (71)申请人 北京市商汤科技 开发有限公司 地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人 宋言 刘英卓 陈磊 卢乐炜  (74)专利代理 机构 北京林达刘知识产权代理事 务所(普通 合伙) 11277 专利代理师 刘新宇 (51)Int.Cl. G06F 16/2455(2019.01) G06N 5/04(2006.01) A63F 3/00(2006.01) A63F 13/67(2014.01) (54)发明名称 棋谱生成方法、 装置、 电子设备、 存储介质和 程序产品 (57)摘要 本公开涉及一种棋谱生成方法、 装置、 电子 设备、 存储介质和程序产品。 所述方法包括: 获得 棋局的初始局面信息; 通过具有至少两种搜索深 度的推理引擎, 基于所述初始局面信息进行自对 弈, 得到候选局面信息, 其中, 所述搜索深度表示 棋步决策时的预测步数; 基于所述候选局面信 息, 生成棋谱数据。 权利要求书3页 说明书20页 附图7页 CN 115292368 A 2022.11.04 CN 115292368 A 1.一种棋谱生成方法, 其特 征在于, 包括: 获得棋局的初始局面信息; 通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信息进行自对弈, 得到候 选局面信息, 其中, 所述搜索深度表示棋步决策时的预测步数; 基于所述 候选局面信息, 生成 棋谱数据。 2.根据权利要求1所述的方法, 其特征在于, 所述通过具有至少两种搜索深度的推理引 擎, 基于所述初始局面信息进行自对弈, 得到候选局面信息, 包括: 通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信息重复进行自对弈, 得 到至少两项候选局面信息 。 3.根据权利要求2所述的方法, 其特征在于, 所述通过具有至少两种搜索深度的推理引 擎, 基于所述初始局面信息 重复进行自对弈, 得到 至少两项候选局面信息, 包括: 采用至少两个处理器, 通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信 息进行自对弈, 得到 至少两项候选局面信息 。 4.根据权利要求1至 3中任意一项所述的方法, 其特 征在于, 任意一局自对弈中的任意 一棋步对应的搜索深度, 基于预设概 率分布随机确定; 或者, 任意一局自对弈中的任意一棋手对应的推理引擎的搜索深度, 基于所述预设概率分布 随机确定; 或者, 任意一局自对弈对应的搜索深度, 基于所述预设概 率分布随机确定 。 5.根据权利要求1至4中任意一项所述的方法, 其特征在于, 在任意一局自对弈中的任 意一棋步的决策中, 从所述棋步对应的至少 两个最优走子策略中, 随机确定所述棋步对应 的走子策略。 6.根据权利要求1至5中任意一项所述的方法, 其特征在于, 所述初始局面信息对应的 局面为未下过任何棋子的局面; 所述通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信息进行自对弈, 得 到候选局面信息, 包括: 通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信 息进行宽度优先的自对 弈, 得到候选局 面信息, 其中, 在任意一局自对弈中的任意一棋步的决策中, 生成预设数量 的棋步, 其中, 所述预设数量大于或等于2。 7.根据权利要求1至5中任意一项所述的方法, 其特征在于, 所述初始局面信息对应的 局面为残局局面; 所述通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信息进行自对弈, 得 到候选局面信息, 包括: 通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信 息进行宽度优先的自对 弈, 得到候选局 面信息, 其中, 在任意一局自对弈中的任意一棋步的决策中, 生成预设数量 的棋步, 其中, 所述预设数量大于或等于2。 8.根据权利要求1至4、 6、 7中任意 一项所述的方法, 其特 征在于, 所述方法还 包括: 确定所述棋局的棋手的评估值;权 利 要 求 书 1/3 页 2 CN 115292368 A 2响应于所述棋局的不同棋手的评估值之间的差异信 息满足预设的非均衡局面条件, 调 整所述棋局的棋手的棋力水平。 9.根据权利要求8所述的方法, 其特征在于, 所述调整所述棋局的棋手的棋力水平, 包 括: 调整所述棋局的棋手对应的推理引擎的搜索深度, 以使调整后的搜索深度与 所述评估 值负相关。 10.根据权利要求8或9所述的方法, 其特征在于, 所述调整所述棋局的棋手的棋力水 平, 包括: 调整所述棋局的棋手对应的推理引擎的棋步选择策略, 其中, 评估值较高的棋手对应 的推理引擎从可选棋步中选择的棋步的优先级, 低于评估值较低的棋手对应的推理引擎从 可选棋步中选择的棋步的优先级。 11.根据权利要求8至10中任意一项所述的方法, 其特征在于, 所述确定所述棋局的棋 手的评估值, 包括: 根据以下至少之一, 确定所述棋局的任一棋手的评估值: 所述棋手的棋子的价值信 息、 所述棋手的棋子的位置信息、 所述棋手的棋子的机动性信息、 所述棋手的不同棋子之间的 关系信息、 所述棋手的棋子与其 他棋手的棋子之间的关系信息 。 12.根据权利要求1至11中任意一项所述的方法, 其特征在于, 所述基于所述候选局面 信息, 生成 棋谱数据, 包括: 对所述候选局面信息进行重复性检测和/或合理性检测, 得到所述候选局面信息对应 的检测结果; 根据所述检测结果, 对所述 候选局面信息进行筛 选, 得到目标局面信息; 基于所述目标局面信息, 生成 棋谱数据。 13.根据权利要求12所述的方法, 其特征在于, 所述棋谱数据包括以下至少之一: 所述 目标局面信息对应的预设棋手的局面信息, 从所述初始局面信息至所述目标局面信息的走 子策略, 所述目标局面信息对应的局面中、 棋手的评估值。 14.一种棋谱生成装置, 其特 征在于, 包括: 获得模块, 用于获得棋局的初始局面信息; 自对弈模块, 用于通过具有至少两种搜索深度的推理引擎, 基于所述初始局面信息进 行自对弈, 得到候选局面信息, 其中, 所述搜索深度表示棋步决策时的预测步数; 生成模块, 用于基于所述 候选局面信息, 生成 棋谱数据。 15.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 用于存储可执行指令的存 储器; 其中, 所述一个或多个处理器被配置为调用所述存储器存储的可执行指令, 以执行权 利要求1至13中任意 一项所述的方法。 16.一种计算机可读存储介质, 其上存储有计算机程序指令, 其特征在于, 所述计算机 程序指令被处 理器执行时实现权利要求1至13中任意 一项所述的方法。 17.一种计算机程序产品, 其特征在于, 包括计算机可读代码, 或者承载有计算机可读 代码的非易失性计算机可读存储介质, 当所述计算机可读代码在电子设备中运行时, 所述权 利 要 求 书 2/3 页 3 CN 115292368 A 3

.PDF文档 专利 棋谱生成方法、装置、电子设备、存储介质和程序产品

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 棋谱生成方法、装置、电子设备、存储介质和程序产品 第 1 页 专利 棋谱生成方法、装置、电子设备、存储介质和程序产品 第 2 页 专利 棋谱生成方法、装置、电子设备、存储介质和程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:18:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。