(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210877114.9
(22)申请日 2022.07.25
(71)申请人 冯长青
地址 710000 陕西省西安市雁塔区科技 二
路77号国家光电子 基地A幢10 3
(72)发明人 冯长青 白程 肖勇 刘佳钰
胡建梅
(74)专利代理 机构 北京睿博行远知识产权代理
有限公司 1 1297
专利代理师 林再颐
(51)Int.Cl.
G06Q 40/08(2012.01)
G06F 16/2455(2019.01)
(54)发明名称
一种风险规则提取方法及风险规则提取系
统
(57)摘要
本发明提供的一种风险规则提取方法及风
险规则提取系统, 涉及风险识别技术领域。 在本
发明中, 获取多条风险样本数据; 基于风险样本
数据表征的风险系数和初始变量之间的变量关
联度, 对多条风险样本数据进行解析处理, 以在
多条风险样本数据包括的第一数量个初始变量
中确定出对应的第二数量个目标变量, 其中, 目
标变量对应的风险样本数据表征的风险系数大
于或等于 预先配置的第一风险系数阈值, 且目标
变量之间的变量关联度大于或等于预先配置的
第一关联度阈值; 基于第二数量个目标变量, 确
定出多条风险样本数据对应的目标风险规则。 基
于上述方法, 可以改善 现有技术中提取到的风险
规则的可靠度不佳的问题。
权利要求书4页 说明书11页 附图2页
CN 115439261 A
2022.12.06
CN 115439261 A
1.一种风险规则提取方法, 其特征在于, 应用于风险管控服务器, 所述风险规则提取方
法包括:
从通信连接的至少一个目标数据库中的每一个目标数据库, 获取多条风险样本数据,
其中, 所述多条风险样本数据中的每一条风险样本数据包括第一数量个初始变量, 每一个
所述初始变量具有对应的变量具体值;
基于所述风险样本数据表征的风险系数和所述初始变量之间的变量关联度, 对所述多
条风险样本数据进行解析 处理, 以在所述多 条风险样本数据包括的所述第一数量个初始变
量中确定出对应的第二数量个目标变量, 其中, 所述第二数量个目标变量对应的风险样本
数据表征的风险系数大于或等于预先配置的第一风险系数阈值, 且所述第二数量个目标变
量之间的变量关联度大于或等于预 先配置的第一关联度阈值;
基于所述第二数量个目标变量, 确定出所述多条风险样本数据对应的目标风险规则,
其中, 所述目标风险规则用于对目标风险数据进 行识别以确定该目标风险数据是否属于所
述第二数量个目标变量对应的风险事 件。
2.如权利要求1所述的风险规则提取方法, 其特征在于, 所述从通信连接的至少一个目
标数据库中 中的每一个目标 数据库, 获取多条风险样本数据的步骤, 包括:
从通信连接的至少一个目标数据库中的每一个目标数据库, 获取多条原始风险样本数
据, 其中, 所述多条原始风险样本数据中的每一条原始风险样本数据包括至少一个初始变
量;
基于所述多条原始风险样本数据中的每一条原始风险样本数据包括的初始变量, 对所
述多条原 始风险样本数据进行筛 选, 得到包括第一数量个初始变量的多条风险样本数据。
3.如权利要求1所述的风险规则提取方法, 其特征在于, 所述基于所述风险样本数据表
征的风险系数和所述初始变量之间的变量关联度, 对所述多条风险样本数据进行解析处
理, 以在所述多 条风险样本数据包括的所述第一数量个初始变量中确定出对应的第二数量
个目标变量的步骤, 包括:
针对所述第 一数量个初始变量中的每一个初始变量, 确定该初始变量的变量重要性表
征值, 并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小
关系, 以及, 在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时, 将该初始
变量确定为 候选变量;
在所述多条风险样本数据中, 基于预先配置的自动编码算法确定出风险系数大于或等
于所述第一风险系 数阈值的每一条目标风险样本数据, 其中, 每一条目标风险样本数据包
括所述候选变量对应的变量具体值;
基于预先配置的关联规则算法对每一条所述目标风险样本数据进行解析处理, 以确定
出对应的变量关联度大于或等于所述第一关联度阈值的每一个候选变量, 得到第二数量个
目标变量。
4.如权利要求3所述的风险规则提取方法, 其特征在于, 所述针对所述第 一数量个初始
变量中的每一个初始变量, 确定该初始变量的变量重要性表征值, 并确定该变量重要性表
征值与预先配置的第一变量重要性表征阈值之间的相对大小关系, 以及, 在该变量重要性
表征值大于或等于所述第一变量重要性表征阈值时, 将该初始变量确定为候选变量的步
骤, 包括:权 利 要 求 书 1/4 页
2
CN 115439261 A
2针对所述第 一数量个初始变量中的每一个初始变量, 基于该初始变量在所述多条风险
样本数据包括的每一条风险样本数据中对应的变量具体值, 构建得到该初始变量对应的变
量具体值集合, 其中, 每一个所述变量具体值集合包括的变量具体值的数量与所述多条风
险样本数据的数量;
针对所述第 一数量个初始变量中的每一个初始变量, 对该初始变量对应的所述变量具
体值集合包括的变量具体值进行均值计算, 得到该初始变量对应的变量值均值, 并基于该
变量值均值对该变量具体值集合包括的变量具体值进 行离散度计算, 得到该初始变量对应
的变量值分布离 散度;
针对所述第 一数量个初始变量中的每一个初始变量, 基于该初始变量对应的变量值分
布离散度, 确定出该初始变量的变量重要性表征值, 其中, 所述变量重要性表征值与所述变
量值分布离 散度之间具有负相关 关系;
针对所述第 一数量个初始变量中的每一个初始变量, 确定该初始变量对应的变量重要
性表征值与预先配置的第一变量重要性表征阈值之 间的相对大小关系, 并在该变量重要性
表征值大于或等于所述第一变量重要性表征阈值时, 将该初始变量确定为候选变量, 或者,
在该变量重要性表征值小于所述第一变量重要性表征阈值时, 将该初始变量确定为 非候选
变量。
5.如权利要求3所述的风险规则提取方法, 其特征在于, 所述针对所述第 一数量个初始
变量中的每一个初始变量, 确定该初始变量的变量重要性表征值, 并确定该变量重要性表
征值与预先配置的第一变量重要性表征阈值之间的相对大小关系, 以及, 在该变量重要性
表征值大于或等于所述第一变量重要性表征阈值时, 将该初始变量确定为候选变量的步
骤, 包括:
针对所述第 一数量个初始变量中的每一个初始变量, 基于该初始变量在所述多条风险
样本数据包括的每一条风险样本数据中的对应的变量具体值, 构建得到该初始变量对应的
变量具体值集合, 其中, 每一个所述变量具体值集合包括的变量具体值的数量与所述多条
风险样本数据的数量;
针对所述第 一数量个初始变量中的每一个初始变量, 对该初始变量对应的所述变量具
体值集合包括的变量具体值进行均值计算, 得到该初始变量对应的变量值均值, 并基于该
变量值均值对该变量具体值集合包括的变量具体值进 行离散度计算, 得到该初始变量对应
的变量值分布离 散度;
针对所述第 一数量个初始变量中的每一个初始变量, 对该初始变量对应的所述变量具
体值集合包括的变量具体值进行聚类处理, 得到该初始变量对应的至少一个聚类集合, 并
统计所述至少一个聚类集合的数量, 得到对应的集合统计数量, 以及, 计算所述至少一个聚
类集合中每一个聚类集合包括的集合元素 的数量的数量离散度, 其中, 所述至少一个聚类
集合中的每一个聚类集 合包括至少一个 变量具体值;
针对所述第 一数量个初始变量中的每一个初始变量, 基于该初始变量对应的变量值分
布离散度、 集合统计数量和数量离散度, 确定出该初始变量的变量重要性表征值, 其中, 所
述变量重要性表征值与所述变量值分布离散度之间具有负相关关系, 所述变量重要性表征
值与所述集合统计数量之 间具有负相关关系, 所述变量重要性表征值与所述数量离散度之
间具有负相关 关系;权 利 要 求 书 2/4 页
3
CN 115439261 A
3
专利 一种风险规则提取方法及风险规则提取系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:16:22上传分享