说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210980620.0 (22)申请日 2022.08.16 (71)申请人 苏州大学 地址 215000 江苏省苏州市吴中区石湖西 路188号 (72)发明人 张莉 陈心怡 赵雷 王邦军  李映  (74)专利代理 机构 苏州市中南伟业知识产权代 理事务所(普通 合伙) 32257 专利代理师 朱振德 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 基于前向迭代约束评分特征选择的信用评 估方法及系统 (57)摘要 本发明公开了基于前向迭代约束评分特征 选择的信用评估方法, 包括以下步骤: S1、 对用户 信用数据集中的数据进行预处理, 得到原始样本 数据集; S2、 建立目标特征子集和候选特征集, 设 置需要选 择的特征数量, 通过前向迭代的约束评 分算法从候选特征集中选择特征添加到目标特 征子集, 得到更新后的目标特征子集; S3、 根据更 新后的目标特征子集对原始样本数据集进行特 征选择, 生成训练样本数据, 利用训练样本数据 训练的分类器对用户进行信用评估。 本发明通过 基于前向迭代约束评分特征选择方法, 有效考虑 特征之间的耦合, 生成最优特征子集, 从而提高 最终信用评估效果。 权利要求书2页 说明书7页 附图2页 CN 115239485 A 2022.10.25 CN 115239485 A 1.一种基于前向迭代约束评分特 征选择的信用评估方法, 其特 征在于: 包括以下步骤: S1、 对用户信用数据集中的数据进行 预处理, 得到原 始样本数据集; S2、 建立目标特征子集和候选特征集, 设置需要选择的特征数量, 通过前向迭代的约束 评分算法从候选特 征集中选择 特征添加到目标 特征子集, 得到更新后的目标 特征子集; S3、 根据更新后的目标特征子集对原始样本数据集进行特征选择, 生成训练样本数据, 利用训练样本数据训练的分类 器对用户进行信用评估。 2.如权利要求1所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 所述前向迭代的约束评分算法包括以下步骤: 初始化目标特征子集, 对候选特征集中的每一个特征计算其评分, 选取得分最小的特 征添加到目标 特征子集, 并从候选特 征集中删除对应得分最小的特 征。 3.如权利要求1所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 所述步骤S1具体包括以下步骤: S11、 收集用户信用的基本信息 并数值化形成数据集, 其中, 基本信息包括账户余额、 信 用额度、 还款记录和交易记录; S12、 将数据集中的数据进行样本特 征表示, 并进行归一 化处理, 得到原 始样本数据集。 4.如权利要求3所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 原始样本数据集X={x1, x2, ...xi, ...xn}, 其中, 表示第i个样 本, 其特征为d个, n 为总的数据个数; 样本数据矩阵表示: 其中, 是第j 个特征向量, 且被归一到[0, 1]区间。 5.如权利要求4所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 对数据进行预处理还包括: 根据已有用户的信用, 对数据集中的p个数据加标签, 令加了标 签的数据为 X1和X2, 分别表示信用好和信用差的用户集合; 利用带标签的数据集生成相关对 集合M和不相关对集 合C, 即: M={(xi, xj)|xi∈Xland xj∈Xl, L=1, 2} C={(xi, xj)|xi∈Xland xj∈Xl′, l, l′=1, 2, l≠l ′}。 6.如权利要求5所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 所述步骤S2具体包括以下步骤: S21、 初始化目标特征子集 候选特征子集B={f1, f2, ..., fd}, 并设置需要选择的 特征数量m; S22、 当目标特征子集 时, 进行步骤S221 ‑S225; 当目标特征子集A不为空时, 进行 步骤S226‑S228; S221、 由相关对集合M和不相关对集合C分别生成两个矩阵WM和Wc, 矩阵中的具体元素构 造如下: 权 利 要 求 书 1/2 页 2 CN 115239485 A 2S222、 计算对角矩阵DM, 其对角线元素的值为 并构造拉普拉斯矩阵LM= DM‑WM, 同理构造拉普拉斯矩阵Lc: S223、 计算集合B中每个特征的得分: S224、 选择特征得分最小的特 征索引, 并将其添加到目标 特征子集A中; S225、 更新待选特 征子集B: 从B中去掉目标函数最小值对应的特 征索引; S226、 对候选特 征子集B中的每一个特 征fk, 计算特征子集A∪{fk}的得分: 其中, trace( ·)是求矩阵对角线元素之和的函数, 代表在特征子 集A∪{fk}上的数据矩阵, | ·|是取集合元素个数的函数; S227、 选择使得特征子集得分J(A∪{fk})最小的特征索引, 将此特征索引添加到目标特 征子集A中; S228、 更新候选特征子集B: 从B中去掉对应的特 征索引; S23、 重复上述 步骤S22, 直到目标 特征子集|A|=m时, 停止 选择; S24、 对原始数据集X进行特征选择形成训练样本数据集, 记为X ′={x′1, x′2, ..., x′n}, 其中 7.如权利要求1所述的基于前向迭代约束评分特征选择的信用评估方法, 其特征在于: 所述步骤S3具体包括以下步骤: S31、 根据更新后的目标特征子集对原始样本数据集 进行特征选择, 得到训练样 本数据集 S32、 采用最近邻分类器, 以训练样本数据集中的样本X ′为训练数据来评估新用户的信 用是否存在风险, 分类结果 为1表示用户信用好, 分类结果 为2表示用户信用差 。 8.一种基于前向迭代约束评分特 征选择的信用评估系统, 其特 征在于: 包括: 数据处理模块, 用于对用户信用数据集中的数据进行 预处理, 得到原 始样本数据集; 特征选择模块, 用于建立目标特征子集和候选特征集, 设置 需要选择的特征数量, 通过 前向迭代的约束评 分算法从候选特征集中选择特征添加到目标特征子集, 得到更新后的目 标特征子集; 信用风险评估模块, 用于根据更新后的目标特征子集对原始样本数据集进行特征选 择, 生成训练样本数据, 利用训练样本数据训练的分类 器对用户进行信用评估。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7 任一项所述的基于前向迭代约束评分特 征选择的信用评估方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现权利要求1到7任一项所述的基于前向迭代约束评分特征选择 的信用评估方法 的步骤。权 利 要 求 书 2/2 页 3 CN 115239485 A 3

PDF文档 专利 基于前向迭代约束评分特征选择的信用评估方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于前向迭代约束评分特征选择的信用评估方法及系统 第 1 页 专利 基于前向迭代约束评分特征选择的信用评估方法及系统 第 2 页 专利 基于前向迭代约束评分特征选择的信用评估方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。