专利 棋谱生成方法、装置、电子设备、存储介质和程序产品

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210907493.1 (22)申请日 2022.07.29 (71)申请人北京市商汤科技开发有限公司地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人宋言　刘英卓　陈磊　卢乐炜　 (74)专利代理机构北京林达刘知识产权代理事务所(普通合伙) 11277 专利代理师刘新宇 (51)Int.Cl. G06F 16/2455(2019.01) G06N 5/04(2006.01) A63F 3/00(2006.01) A63F 13/67(2014.01) (54)发明名称棋谱生成方法、装置、电子设备、存储介质和程序产品 (57)摘要本公开涉及一种棋谱生成方法、装置、电子设备、存储介质和程序产品。所述方法包括：获得棋局的初始局面信息；通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，其中，所述搜索深度表示棋步决策时的预测步数；基于所述候选局面信息，生成棋谱数据。权利要求书3页说明书20页附图7页 CN 115292368 A 2022.11.04 CN 115292368 A 1.一种棋谱生成方法，其特征在于，包括：获得棋局的初始局面信息；通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，其中，所述搜索深度表示棋步决策时的预测步数；基于所述候选局面信息，生成棋谱数据。 2.根据权利要求1所述的方法，其特征在于，所述通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，包括：通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息重复进行自对弈，得到至少两项候选局面信息。 3.根据权利要求2所述的方法，其特征在于，所述通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息重复进行自对弈，得到至少两项候选局面信息，包括：采用至少两个处理器，通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到至少两项候选局面信息。 4.根据权利要求1至 3中任意一项所述的方法，其特征在于，任意一局自对弈中的任意一棋步对应的搜索深度，基于预设概率分布随机确定；或者，任意一局自对弈中的任意一棋手对应的推理引擎的搜索深度，基于所述预设概率分布随机确定；或者，任意一局自对弈对应的搜索深度，基于所述预设概率分布随机确定。 5.根据权利要求1至4中任意一项所述的方法，其特征在于，在任意一局自对弈中的任意一棋步的决策中，从所述棋步对应的至少两个最优走子策略中，随机确定所述棋步对应的走子策略。 6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述初始局面信息对应的局面为未下过任何棋子的局面；所述通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，包括：通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行宽度优先的自对弈，得到候选局面信息，其中，在任意一局自对弈中的任意一棋步的决策中，生成预设数量的棋步，其中，所述预设数量大于或等于2。 7.根据权利要求1至5中任意一项所述的方法，其特征在于，所述初始局面信息对应的局面为残局局面；所述通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，包括：通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行宽度优先的自对弈，得到候选局面信息，其中，在任意一局自对弈中的任意一棋步的决策中，生成预设数量的棋步，其中，所述预设数量大于或等于2。 8.根据权利要求1至4、 6、 7中任意一项所述的方法，其特征在于，所述方法还包括：确定所述棋局的棋手的评估值；权　利　要　求　书 1/3 页 2 CN 115292368 A 2响应于所述棋局的不同棋手的评估值之间的差异信息满足预设的非均衡局面条件，调整所述棋局的棋手的棋力水平。 9.根据权利要求8所述的方法，其特征在于，所述调整所述棋局的棋手的棋力水平，包括：调整所述棋局的棋手对应的推理引擎的搜索深度，以使调整后的搜索深度与所述评估值负相关。 10.根据权利要求8或9所述的方法，其特征在于，所述调整所述棋局的棋手的棋力水平，包括：调整所述棋局的棋手对应的推理引擎的棋步选择策略，其中，评估值较高的棋手对应的推理引擎从可选棋步中选择的棋步的优先级，低于评估值较低的棋手对应的推理引擎从可选棋步中选择的棋步的优先级。 11.根据权利要求8至10中任意一项所述的方法，其特征在于，所述确定所述棋局的棋手的评估值，包括：根据以下至少之一，确定所述棋局的任一棋手的评估值：所述棋手的棋子的价值信息、所述棋手的棋子的位置信息、所述棋手的棋子的机动性信息、所述棋手的不同棋子之间的关系信息、所述棋手的棋子与其他棋手的棋子之间的关系信息。 12.根据权利要求1至11中任意一项所述的方法，其特征在于，所述基于所述候选局面信息，生成棋谱数据，包括：对所述候选局面信息进行重复性检测和/或合理性检测，得到所述候选局面信息对应的检测结果；根据所述检测结果，对所述候选局面信息进行筛选，得到目标局面信息；基于所述目标局面信息，生成棋谱数据。 13.根据权利要求12所述的方法，其特征在于，所述棋谱数据包括以下至少之一：所述目标局面信息对应的预设棋手的局面信息，从所述初始局面信息至所述目标局面信息的走子策略，所述目标局面信息对应的局面中、棋手的评估值。 14.一种棋谱生成装置，其特征在于，包括：获得模块，用于获得棋局的初始局面信息；自对弈模块，用于通过具有至少两种搜索深度的推理引擎，基于所述初始局面信息进行自对弈，得到候选局面信息，其中，所述搜索深度表示棋步决策时的预测步数；生成模块，用于基于所述候选局面信息，生成棋谱数据。 15.一种电子设备，其特征在于，包括：一个或多个处理器；用于存储可执行指令的存储器；其中，所述一个或多个处理器被配置为调用所述存储器存储的可执行指令，以执行权利要求1至13中任意一项所述的方法。 16.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至13中任意一项所述的方法。 17.一种计算机程序产品，其特征在于，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备中运行时，所述权　利　要　求　书 2/3 页 3 CN 115292368 A 3

专利 棋谱生成方法、装置、电子设备、存储介质和程序产品

专利棋谱生成方法、装置、电子设备、存储介质和程序产品