说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210942645.1 (22)申请日 2022.08.08 (71)申请人 太平金融科技 服务 (上海) 有限公司 深圳分公司 地址 518048 广东省深圳市福田区新洲路 立交桥西北侧新洲广场华丰大厦第3 层B1-A 申请人 太平财产保险有限公司 (72)发明人 马丹雄 付沙 黄锐 陈中乾  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 邓丹 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/06(2012.01)G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 业务数据分类预测方法、 装置、 计算机设备 和存储介质 (57)摘要 本申请涉及一种业务数据分类预测方法、 装 置、 计算机设备和存储介质, 包括: 计算机设备获 取待处理业务数据, 根据待处理业务数据的数据 类型, 确定与数据类型对应的目标分类预测模 型, 将待处理业务数据输入至目标分类预测模型 中, 得到待处理业务数据的风险预测结果。 其中, 目标分类预测模型为基于样本业务数据进行聚 类训练得到的; 样本业务数据中的阴性样本数据 的数据量在样本业务数据中的占比大于预设阈 值; 风险预测结果用于表示待处理业务数据在业 务办理中的风险量化值。 在本方案中涉及到的目 标分类预测模型为适用于样本数据中不均衡的 场景下的预测模 型, 提高了在样 本数据不均衡的 应用场景 下的模型的预测准确率。 权利要求书2页 说明书15页 附图6页 CN 115018210 A 2022.09.06 CN 115018210 A 1.一种业 务数据分类预测方法, 其特 征在于, 所述方法还 包括: 获取待处 理业务数据; 根据所述待处理业务数据的数据类型, 确定与所述数据类型对应的目标分类预测模 型; 所述目标分类预测模型为对样本业务数据进行聚类处理, 根据所述聚类处理之后的样 本数据训练得到的; 所述样本业务数据中的阴性样本数据的数据量在所述样本业务数据中 的占比大于预设阈值; 将所述待处理业务数据输入至所述目标分类预测模型中, 得到所述待处理业务数据的 风险预测结果; 所述风险预测结果用于表示所述待处理业务数据在业务办理中的风险量化 值。 2.根据权利要求1所述的方法, 其特 征在于, 所述目标分类预测模型的训练方法包括: 获取样本业务数据; 所述样本业务数据包括阴性样本业务数据和阳性样本业务数据, 所述阴性样本数据的数据量在所述样本业 务数据中的占比大于预设阈值; 根据预设的聚类算法对所述阴性样本业务数据进行分类处理, 得到多个数据类型对应 的分类阴性样本数据集 合; 将各所述分类阴性样本数据集合分别与 所述阳性样本业务数据合并, 得到多个训练数 据子集; 将各所述训练数据子集输入至对应的初始分类预测模型中进行训练, 得到各所述数据 类型对应的目标分类预测模型。 3.根据权利要求2所述的方法, 其特征在于, 所述将各所述训练数据子集输入至对应的 初始分类预测模型中进行训练, 得到各 所述数据类型对应的目标分类预测模型, 包括: 将各所述训练数据子集分别输入至对应的所述初始分类预测模型中, 得到风险预测 值; 计算风险预测值和所述样本业务数据中对应的标准风险值之间的损失值, 并根据损失 值调整所述初始分类预测模型 的参数, 直到满足迭代条件, 得到各所述数据类型对应的目 标分类预测模型。 4.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 若所述训练数据子集中的阴性样本业务数据与阳性样本业务数据的比值处于预设比 值范围之外, 则调整所述训练数据子集中的阴性样本业务数据和阳性样本业务数据, 以使 所述训练数据子集中的阴性样本业务数据与阳性样本业务数据的比值处于所述预设比值 范围内。 5.根据权利要求2所述的方法, 其特征在于, 所述根据预设的聚类算法对所述阴性样本 业务数据进行分类处 理, 得到多个数据类型对应的分类阴性样本数据集 合, 包括: 采用K‑qeans聚类算法对所述阴性样本业务数据进行分类, 并通过肘部法确定多个分 类节点; 确定各所述分类节点的数据类型, 得到所述多个数据类型对应的分类阴性样本数据集 合。 6.根据权利要求2 ‑5中任一项所述的方法, 其特 征在于, 所述方法还 包括: 根据预设维度从原 始样本业 务数据中提取初始样本业 务数据; 对所述初始样本业务数据进行数据预处理, 得到候选样本业务数据; 所述数据预处理权 利 要 求 书 1/2 页 2 CN 115018210 A 2包括异常值处 理、 缺失值 填充、 变量筛 选中至少一种; 根据预设的数据扩充规则, 对所述候选样本业务数据进行扩充处理, 得到所述样本业 务数据。 7.根据权利要求6所述的方法, 其特征在于, 所述根据预设的数据扩充规则, 对所述候 选样本业 务数据进行扩充处 理, 得到所述样本业 务数据, 包括: 针对第i个所述候选样本业务数据, 根据业务提交节点确定第i个所述候选样本业务数 据的q业务字段; 按照各所述业务字段的时间顺序对所述业务字段进行组合, 得到第i个所述候选样本 业务数据的n个样 本业务数据; 所述n个样本业务数据包括第1个业务字段到第n个业务字段 对应的数据, n小于或等于q。 8.根据权利要求1 ‑5中任一项所述的方法, 其特 征在于, 所述方法还 包括: 根据所述待处理业务数据的风险预测结果和预设的量化规则数据库, 得到所述待处理 业务数据对应的量 化结果; 所述 量化结果中包括 业务数据对应的风险原因。 9.根据权利要求8所述的方法, 其特征在于, 所述根据所述待处理业务数据的风险预测 结果和预设的量 化规则数据库, 得到所述待处 理业务数据对应的量 化结果, 包括: 若所述待处理业务数据的风险量化值大于预设阈值, 则将所述待处理业务数据与 所述 量化规则数据库进行匹配, 确定与所述待处 理业务数据对应的量 化结果。 10.根据权利要求1 ‑5中任一项所述的方法, 其特 征在于, 所述方法还 包括: 若所述待处理业务数据中不包括预设维度的字段, 则将所述待处理业务数据的预设维 度设置为目标值, 得到 字段处理后的待处 理业务数据; 所述将所述待处理业务数据输入至所述目标分类预测模型中, 得到所述待处理业务数 据的风险预测结果, 包括: 将所述字段处理后的待处理业务数据输入至所述目标分类预测模型中, 得到所述待处 理业务数据的风险预测结果。 11.一种业 务数据分类预测装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待处 理业务数据; 确定模块, 用于根据所述待处理业务数据的数据类型, 确定与所述数据类型对应的目 标分类预测模型; 所述 目标分类预测模型为对样本业务数据进行聚类处理, 根据所述聚类 处理之后的样本数据训练得到的; 所述样本业务数据中的阴性样本数据的数据量在所述样 本业务数据中的占比大于预设阈值; 预测模块, 用于将所述待处理业务数据输入至所述目标分类预测模型中, 得到所述待 处理业务数据的风险预测结果; 所述风险预测结果用于表示所述待处理业务数据在业务办 理中的风险量 化值。 12.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。 13.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。 14.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1至10中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115018210 A 3

PDF文档 专利 业务数据分类预测方法、装置、计算机设备和存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 业务数据分类预测方法、装置、计算机设备和存储介质 第 1 页 专利 业务数据分类预测方法、装置、计算机设备和存储介质 第 2 页 专利 业务数据分类预测方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。