说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210995711.1 (22)申请日 2022.08.18 (71)申请人 深圳前海微众 银行股份有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (入驻深圳市 前海商务秘书 有限公司) (72)发明人 谭蕴琨 陈婷 吴三平 庄伟亮  张鹏 壮青 吴轶凡 陈庆麟  徐朔 黄勇卫  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 李俊杰 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01)G06K 9/62(2022.01) (54)发明名称 信用风险预测模 型训练方法、 电子设备及可 读存储介质 (57)摘要 本申请公开了一种信用风险预测模型训练 方法、 电子设备及可读存储介质, 应用于金融科 技技术领域, 所述信用风险预测模 型训练方法包 括: 获取训练样本集以及训练样 本集中各训练样 本的样本权重; 根据训练样本集和各样本权重, 得到信用风险预测总模型, 信用风险预测总模型 由多个风险预测子模型组成; 依据风险预测子模 型的子模型预测结果, 对风险预测子模型进行聚 类, 得到子模型群; 依据子模型预测结果和子模 型群, 扩增训练样本集; 返回执行步骤: 根据训练 样本集和各样本权重, 迭代训练得到信用风险预 测总模型, 直至信用风险预测总模 型满足预设迭 代更新结束条件, 得到目标信用风险预测总模 型。 本申请解决了用户信用风险的预测准确度低 的技术问题。 权利要求书3页 说明书14页 附图3页 CN 115293889 A 2022.11.04 CN 115293889 A 1.一种信用风险预测模型训练方法, 其特征在于, 所述信用风险预测模型训练方法包 括: 获取用户的历史行为数据作为训练样本集以及所述训练样本集中各训练样本的样本 权重; 根据所述训练样本集和各所述样本权重, 迭代训练得到信用风险预测总模型, 其中, 所 述信用风险预测总模型由多个风险预测子模型组成; 获取各所述风险预测子模型对于所述训练样本集的子模型预测结果, 依据各所述子模 型预测结果, 对所述 风险预测子模型进行聚类, 得到 至少一个子模型群; 依据各所述子模型预测结果和各所述子模型群, 优化各所述样本权重, 以扩增所述训 练样本集; 返回执行步骤: 根据所述训练样本集和各所述样本权重, 迭代训练得到信用风险预测 总模型, 直至所述信用风险预测总模型满足预设迭代更新结束条件, 得到目标信用风险预 测总模型。 2.如权利要求1所述信用风险预测模型训练方法, 其特征在于, 所述根据 所述训练样本 集和各所述样本权重, 迭代训练得到信用风险预测总模型, 其中, 所述信用风险预测总模型 由多个风险预测子模型组成的步骤 包括: 从所述训练样本集中选取训练样本, 并根据 所述训练样本和所述训练样本对应的样本 权重确定待预测样本; 将所述待预测样本分别输入各 所述风险预测子模型, 得到各子模型输出 预测结果; 根据各所述风险预测子模型对应的模型加权权重, 对各所述子模型输出预测结果进行 加权聚合, 得到总模型输出 预测结果; 根据所述总模型输出预测结果, 优化各所述模型加权权重以及各所述风险预测子模 型; 返回执行步骤: 从所述训练样本集中选取训练样本, 并根据所述训练样本和所述训练 样本对应的样本权重确定待预测样本, 直至各所述模型加权权重满足预设权重条件以及各 所述子模型参数满足预设模型参数 条件, 得到所述信用风险预测总模型。 3.如权利要求1所述信用风险预测模型训练方法, 其特征在于, 所述依据 各所述子模型 预测结果, 对所述 风险预测子模型进行聚类, 得到 至少一个子模型群的步骤 包括: 获取各所述子模型预测结果之间的子模型预测结果相似度, 将所述子模型预测结果相 似度作为各 所述风险预测子模型之间的子模型相似度; 依据所述子模型相似度, 对各 所述风险预测子模型进行聚类, 得到 至少一个子模型群。 4.如权利要求1所述信用风险预测模型训练方法, 其特征在于, 所述依据 各所述子模型 预测结果和各 所述子模型群, 优化各 所述样本 权重, 以扩增所述训练样本集的步骤 包括: 在各所述子模型群中选取满足预设条件的目标子模型群, 其中, 所述预设条件包括相 关性条件和重要度条件中的至少一种; 依据所述目标子模型群和各所述子模型预测结果, 调整各所述样本权重, 以扩增所述 训练样本集。 5.如权利要求4所述信用风险预测模型训练方法, 其特征在于, 所述在各所述子模型群 中选取满足预设条件的目标子模型群, 其中, 所述预设条件包括相关性条件和重要度条件权 利 要 求 书 1/3 页 2 CN 115293889 A 2中的至少一种的步骤 包括: 获取所述信用风险预测总模型对于所述训练样本集的总模型 预测结果; 依据各所述子模型预测结果和所述总 模型预测结果, 生成各所述子模型群与 所述信用 风险预测总模型之间的子模型群相关性; 在各所述子模型群中选取 所述子模型群相关性小于预设相关性阈值的目标子模型群。 6.如权利要求4所述信用风险预测模型训练方法, 其特征在于, 所述在各所述子模型群 中选取满足预设条件的目标子模型群, 其中, 所述预设条件包括相关性条件和重要度条件 中的至少一种的步骤, 还 包括: 获取各所述风险预测子模型的模型加权 权重; 依据所述模型加权权重, 确定各所述子模型群对于所述信用风险预测总 模型的子模型 群重要度; 在各所述子模型群中选取 所述子模型群重要度小于预设重要度阈值的目标子模型群。 7.如权利要求4至6中任一项所述信用风险预测模型训练方法, 其特征在于, 所述在各 所述子模型群中选取满足预设条件的目标子模型群, 其中, 所述预设条件包括相关性条件 和重要度条件中的至少一种的步骤, 还 包括: 在各所述子模型群中选取所述子模型群相关性小于预设相关性阈值且所述子模型群 重要度小于预设重要度阈值的目标子模型群。 8.如权利要求4所述信用风险预测模型训练方法, 其特征在于, 所述依据 所述目标子模 型群和各 所述子模型 预测结果, 调整各 所述样本 权重的步骤 包括: 依据所述目标子模型群和各所述子模型预测结果, 确定所述目标子模型群的预测结果 分布信息; 依据所述预测结果分布信息, 调整各 所述样本 权重。 9.如权利要求8所述信用风险预测模型训练方法, 其特征在于, 所述依据 所述预测结果 分布信息, 调整各 所述样本 权重的步骤 包括: 获取所述预测结果分布信息中各所述训练样本被各所述风险预测子模型正确预测的 正确预测占比, 其中, 所述预测结果分布信息包括各风险预测子模型针对于训练样本的子 模型预测结果; 判断所述 正确预测占比是否大于预设占比阈值; 若是, 则调低各 所述训练样本对应的样本 权重; 若否, 则调高各 所述训练样本对应的样本 权重。 10.如权利要求1所述信用风险预测模型训练方法, 其特征在于, 在所述获取用户的历 史行为数据作为训练样本集以及所述训练样本集中各训练样本的样本权重的步骤之前, 还 包括: 获取各所述训练样本对应的真实标签; 依据各所述训练样本和各所述风险预测子模型, 生成各所述风险预测子模型对于所述 训练样本集的子模型 预测结果; 依据所述真实标签和子模型预测结果, 确定各所述训练样本被各所述风险预测子模型 预测正确的子模型 数量; 依据所述子模型 数量、 预设参数和权 重平滑系数, 生成各 所述训练样本的样本 权重。权 利 要 求 书 2/3 页 3 CN 115293889 A 3

PDF文档 专利 信用风险预测模型训练方法、电子设备及可读存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信用风险预测模型训练方法、电子设备及可读存储介质 第 1 页 专利 信用风险预测模型训练方法、电子设备及可读存储介质 第 2 页 专利 信用风险预测模型训练方法、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。