(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210996357.4
(22)申请日 2022.08.19
(71)申请人 浙大城市学院
地址 310015 浙江省杭州市拱 墅区湖州街
51号
(72)发明人 李缃珍
(74)专利代理 机构 杭州九洲专利事务所有限公
司 33101
专利代理师 张羽振
(51)Int.Cl.
G06Q 40/02(2012.01)
G06Q 40/04(2012.01)
G06F 17/16(2006.01)
(54)发明名称
一种用于金融机构拆分洗钱的无监督识别
方法
(57)摘要
本发明涉及一种用于金融机构拆分洗钱的
无监督识别方法, 包括: 从金融交易数据集中筛
选出潜在拆分洗钱的账户信息集合, 并对每个集
合元素构建交易矩阵; 基于拆分洗钱的三种行为
特征, 对交易矩阵进行重新排序; 对重新排序矩
阵进行划分, 计算矩阵编码成本和纯度, 识别出
拆分洗钱涉及的汇出账户、 汇入账户和中转账
户。 本发明的有益效果是: 本发明将蕴含业务规
律的、 跨系统跨主体的数据信息以图的形式进行
关联与分析, 挖掘出隐含的洗钱风险, 实现对金
融机构洗钱风险案件的动态精 准识别与监测, 具
有重要的现实意 义和应用价 值。
权利要求书3页 说明书6页 附图3页
CN 115330525 A
2022.11.11
CN 115330525 A
1.一种用于金融机构拆分洗钱的无监 督识别方法, 其特 征在于, 包括:
S1、 从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合, 所述账户信息集合中
的每个集合元素为三元组, 所述三元组包括: 汇出账户、 汇入账户和中转账户; 并对每个集
合元素构建交易矩阵V;
S2、 基于拆分洗钱的三种行为特征, 对S1构建的交易矩阵V进行重新排序; 所述三种行
为特征包括: 中转账户越多, 嫌疑越大; 内部纯度: 中转账户之间的交易越少, 越是可疑; 外
部纯度: 与正常账户交易的中转账户越少, 越是 可疑;
S3、 对S2的重新排序矩阵进行划分, 计算矩阵编码 成本和纯度, 识别出拆分洗钱涉及的
汇出账户、 汇入账户和中转账户。
2.根据权利要求1所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S1
中, 所述金融交易数据集为历史交易行为数据集, 所述账户信息集合为历史交易记录集合,
所述集合元素为历史交易记录; 所述交易矩阵V的行表示交易发起方的编号, 交易矩阵V的
列表示交易接收方的编号, Vi.j=1表示账户i和j之间存在交易行为, Vi.j=0表示账户i和j
之间没有交易行为。
3.根据权利要求2所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S1
中, 筛选标准为汇出账户到汇入账户的中转账户多于2个。
4.根据权利要求3的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S2中, 若
交易矩阵V为包 含“拆分洗钱 ”模式的矩阵, 则定义 为:
其中, n是涉及的交易账户的数量, k是中间账户的数量; 对于给定的交易矩阵V, 在第j
次矩阵重排的迭代时, 首先将交易汇出账户、 中间账户和汇入账户的索引分别添加到排序
列表Ο中, 然后再将V中的行和列按Ο重新 排序, 其中, j=1, …,J, J表示 最大迭代次数。
5.根据权利要求1所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S3包
括:
S301、 将S2的重新排序矩阵划分为4个子矩阵, 采用最小描述长度原则计算每个子矩阵
的编码成本和压缩率;
S302、 计算重新排序矩阵的纯度, 利用压缩率与纯度计算得到交易矩阵V的异常分数,
若该异常分数大于风控专家预设的阈值, 则基于交易矩阵V获得涉及拆分洗钱的交易账户
信息。
6.根据权利要求5所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S301
中, 具体给定第J次迭代时矩阵V的重新排序矩阵VJ和索引信息I, I包括交易汇出账户、 中间
账户与汇入账户的索引集合, 通过迭代j次将矩阵VJ划分为四个子矩阵, 其中j=1, …, J, 将
VJ涉及的中间账户数量表示为
即第j次迭代时交易中间账户的索引数量, 起始索
引表示为
其中|Ij′|表示第j ′次迭代时的交易汇出账户、 中间账户与汇入账
户的索引数量之和, 并将重新 排序的矩阵VJ分成如下四个子矩阵:
Aj(VJ, Ij)=VJ[rj: rj+kj][rj: rj+kj]权 利 要 求 书 1/3 页
2
CN 115330525 A
2Bj(VJ, Ij)=VJ[rj: rj+kj][rj+kj+1: n]
Cj(VJ, Ij)=VJ[rj+kj+1: n][rj: rj+kj]
D(VJ, IJ)=VJ[rJ+kJ+1: n][rJ+kJ+1: n]
其中, j=1, …, J, Ij∈I, 子矩阵Aj表示通过重新排序分离出来包括潜在的 “拆分洗钱 ”
模式子矩阵, 子矩阵Bj表示中间账户向其他 账户汇款信息, 子矩阵Cj表示中间账户收到 其他
账户的汇入信息, 子矩阵D用来表示没有发现 “拆分洗钱 ”模式的压缩错 误。
7.根据权利要求6所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S301
中, 根据内纯度和外纯度的特性, 子矩阵A、 B、 C和D的编码成本计算如下:
其中,
是一个全为1的矩阵; 为编码实数, 使用通用代码长度lg*(x)≈2lg(x)+1, “拆分
洗钱”模式的数量由lg*(J)编码, 每个 交易汇出账户、 中间账户和汇入账户的索引都需要lg
(n)来编码, 总体编码成本可计算如下:
CostT(VJ, IJ)=CostA(VJ, IJ)+CostB(VJ, IJ)+CostC(VJ, IJ)+CostD(VJ, IJ)+lg*(J)+|IJ|*
lg n
将原始重新排序矩阵VJ和压缩重新排序矩阵的编码成本之差归一化, 可得交易矩阵V的
压缩率, 表示 为(c‑c′)/c, 其中c表示 最后一次迭代的编码成本, c ′表示当前编码成本 。
8.根据权利要求7所述的用于金融机构拆分洗钱的无监督识别方法, 其特征在于, S302
中, 纯度分数ρ 可以按以下 方式计算:
将压缩率乘以纯度, 得到一个给定V交易矩阵的最终异常 分数, 记为s=ρ *(c ‑c′)/c。
9.一种用于金融机构拆分洗钱的无监督识别装置, 其特征在于, 用于执行权利要求1至
8任一所述的用于金融机构拆分洗钱的无监 督识别方法, 包括:
筛选模块, 用于从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合, 所述账户
信息集合中的每个集合元素为三元组, 所述三元组包括: 汇出账户、 汇入账户和中转账户;
并对每个集合元素构建交易矩阵V;
排序模块, 用于基于拆分洗钱的三种行为特征, 对筛选模块构建的交易矩阵V进行重新
排序; 所述三种行为特征包括: 中转账户越多, 嫌疑越大; 内部纯度: 中转账户之 间的交易越权 利 要 求 书 2/3 页
3
CN 115330525 A
3
专利 一种用于金融机构拆分洗钱的无监督识别方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:15:50上传分享