(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210993058.5
(22)申请日 2022.08.18
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 李甜甜
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 张欣然
(51)Int.Cl.
G06F 16/9035(2019.01)
G06F 16/901(2019.01)
G06N 3/08(2006.01)
G06Q 40/02(2012.01)
(54)发明名称
基于图对比学习的用户筛选方法、 装置、 设
备和存储介质
(57)摘要
本申请提供一种基于图对比学习的用户筛
选方法、 装置、 设备和存储介质, 可应用于 人工智
能领域或金融领域, 方法包括: 根据用户行为记
录生成多个包括用户, 金融产品和用户产品的权
重二元组; 利用多个二元组构建二部图网络; 以
二部图网络作为输入, 基于有监督学习方法和无
监督对比学习方法训练图网络模 型, 获得训练好
的图网络模 型; 利用训练好的图网络模型处理二
部图网络, 获得每一个第一节点的筛选指标; 筛
选指标作为筛选每一个第一节点表征的用户的
依据。 本方案通过构建二部图网络并利用图网络
模型进行分析, 自动确定每一用户的筛选指标,
从而能够根据筛 选指标自动筛 选高价值用户。
权利要求书3页 说明书11页 附图2页
CN 115329159 A
2022.11.11
CN 115329159 A
1.一种基于图对比学习的用户筛 选方法, 其特 征在于, 包括:
根据用户行为记录生成多个二元组; 其中, 所述二元组包括用户, 金融产品和用户产品
权重; 所述用户产品权 重根据所述用户对所述金融产品的行为确定;
利用所述多个二元组构建二部图网络; 其中所述二部图网络包括表征用户的第一节
点, 表征金融产品的第二节点和连接所述第一节点与所述第二节点的边; 所述边具有连接
的第一节点和第二节点对应的所述用户产品权 重;
以所述二部图网络作为输入, 基于有监督学习方法和无监督对比学习方法训练图网络
模型, 获得训练好的图网络模型;
利用所述训练好的图网络模型处理所述二部图网络, 获得每一个所述第 一节点的筛选
指标; 所述筛 选指标作为筛 选每一个所述第一节点表征的用户的依据。
2.根据权利要求1所述的方法, 其特征在于, 所述根据用户行为记录生成多个二元组,
包括:
针对每一个用户 ‑产品组合, 确定所述用户 ‑产品组合对应的用户产品权重, 将所述用
户‑产品组合中的用户和金融产品, 以及所述用户 ‑产品组合对应的用户产品权重组成所述
用户‑产品组合对应的二元组;
其中, 确定所述用户 ‑产品组合对应的用户产品权 重的过程包括:
确定所述用户 ‑产品组合中用户对金融产品的历史行为的行为类型和行为强度;
若行为类型为点击, 所述行为强度小于第一停留阈值时, 确定所述用户产品权重为第
一权重; 点击对应的行为强度为停留时长;
若行为类型为点击, 所述行为强度 大于或等于所述第 一停留阈值且小于第 二停留阈值
时, 确定所述用户产品权 重为第二权 重; 所述第二权 重大于所述第一权 重;
若行为类型为点击, 所述行为强度大于或等于所述第二停留阈值时, 确定所述用户产
品权重为第三权 重; 所述第三权 重大于所述第二权 重;
若行为类型为购买, 根据对应的行为强度确定所述用户产品权重为大于所述第 三权重
的第四权 重; 所述第四权 重和购买对应的行为强度正相关。
3.根据权利要求1所述的方法, 其特征在于, 所述以所述二部 图网络作为输入, 基于有
监督学习方法和无监 督对比学习方法训练图网络模型, 获得训练好的图网络模型, 包括:
分别对所述二部图网络进行两次启发式数据增强, 获得所述二部图网络对应的第 一视
图和第二视图;
利用所述图网络模型编码所述第 一视图和所述第 二视图, 获得所述第 一视图中各节点
的第一表示向量, 以及所述第二视图中各节点的第二表示向量;
利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模
型的对比损失值; 其中, 每一个样 本包括一个所述第一表示向量和所述第二表 示向量, 包含
的第一表示向量和 第二表示向量对应于相同节点的样本为正向样本, 包含的第一表示向量
和第二表示向量对应于不同节点的样本为负向样本;
利用图网络模型编码所述二部图网络 中的第一节点, 获得所述第 一节点的第 三表示向
量;
根据所述第三表示向量和预先标注的所述第一节点表征的用户的真实标签确定所述
图网络模型的交叉熵损失值;权 利 要 求 书 1/3 页
2
CN 115329159 A
2根据所述对比损失值和所述交叉熵损失值确定所述图网络模型的综合损失值;
根据所述图网络模型的综合损失值更新所述图网络模型的参数, 直至所述综合损失值
符合预设的综合收敛 条件为止, 获得训练好的图网络模型。
4.根据权利要求3所述的方法, 其特征在于, 所述利用所述第 一表示向量和所述第 二表
示向量组成的多个样本计算得到所述图网络模型的对比损失值, 包括:
针对每一个样本, 若所述样本为正向样本, 将所述样本包含的所述第一表示向量和所
述第二表示向量的相似度的相反数确定为所述样本的样本损失, 若所述样本为负向样本,
将所述样本包含的所述第一表示向量和所述第二表示向量的相似度确定为所述样本的样
本损失;
将每一个所述样本的样本损失相加, 获得 所述图网络模型的对比损失。
5.一种基于图对比学习的用户筛 选装置, 其特 征在于, 包括:
生成单元, 用于根据用户行为记录生成多个二元组; 其中, 所述二元组包括用户, 金融
产品和用户产品权 重; 所述用户产品权 重根据所述用户对所述金融产品的行为确定;
构建单元, 用于利用所述多个二元组构建二部 图网络; 其中所述二部 图网络包括表征
用户的第一节点, 表征金融产品的第二节点和连接所述第一节点与所述第二节点的边; 所
述边具有连接的第一节点和第二节点对应的所述用户产品权 重;
训练单元, 用于以所述二部 图网络作为输入, 基于有监督学习方法和无监督对比学习
方法训练图网络模型, 获得训练好的图网络模型;
处理单元, 用于利用所述训练好的图网络模型处理所述二部 图网络, 获得每一个所述
第一节点的筛 选指标; 所述筛 选指标作为筛 选每一个所述第一节点表征的用户的依据。
6.根据权利要求5所述的装置, 其特征在于, 所述生成单元根据用户行为记录生成多个
二元组时, 具体用于:
针对每一个用户 ‑产品组合, 确定所述用户 ‑产品组合对应的用户产品权重, 将所述用
户‑产品组合中的用户和金融产品, 以及所述用户 ‑产品组合对应的用户产品权重组成所述
用户‑产品组合对应的二元组;
其中, 确定所述用户 ‑产品组合对应的用户产品权 重的过程包括:
确定所述用户 ‑产品组合中用户对金融产品的历史行为的行为类型和行为强度;
若行为类型为点击, 所述行为强度小于第一停留阈值时, 确定所述用户产品权重为第
一权重; 点击对应的行为强度为停留时长;
若行为类型为点击, 所述行为强度 大于或等于所述第 一停留阈值且小于第 二停留阈值
时, 确定所述用户产品权 重为第二权 重; 所述第二权 重大于所述第一权 重;
若行为类型为点击, 所述行为强度大于或等于所述第二停留阈值时, 确定所述用户产
品权重为第三权 重; 所述第三权 重大于所述第二权 重;
若行为类型为购买, 根据对应的行为强度确定所述用户产品权重为大于所述第 三权重
的第四权 重; 所述第四权 重和购买对应的行为强度正相关。
7.根据权利要求5所述的装置, 其特征在于, 所述训练单元以所述二部图网络作为输
入, 基于有监督学习方法和无监督对比学习方法训练图网络模型, 获得训练好的图网络模
型时, 具体用于:
分别对所述二部图网络进行两次启发式数据增强, 获得所述二部图网络对应的第 一视权 利 要 求 书 2/3 页
3
CN 115329159 A
3
专利 基于图对比学习的用户筛选方法、装置、设备和存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:15:50上传分享