专利 基于图对比学习的用户筛选方法、装置、设备和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210993058.5 (22)申请日 2022.08.18 (71)申请人中国银行股份有限公司地址 100818 北京市西城区复兴门内大街1 号 (72)发明人李甜甜　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师张欣然 (51)Int.Cl. G06F 16/9035(2019.01) G06F 16/901(2019.01) G06N 3/08(2006.01) G06Q 40/02(2012.01) (54)发明名称基于图对比学习的用户筛选方法、装置、设备和存储介质 (57)摘要本申请提供一种基于图对比学习的用户筛选方法、装置、设备和存储介质，可应用于人工智能领域或金融领域，方法包括：根据用户行为记录生成多个包括用户，金融产品和用户产品的权重二元组；利用多个二元组构建二部图网络；以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标；筛选指标作为筛选每一个第一节点表征的用户的依据。本方案通过构建二部图网络并利用图网络模型进行分析，自动确定每一用户的筛选指标，从而能够根据筛选指标自动筛选高价值用户。权利要求书3页说明书11页附图2页 CN 115329159 A 2022.11.11 CN 115329159 A 1.一种基于图对比学习的用户筛选方法，其特征在于，包括：根据用户行为记录生成多个二元组；其中，所述二元组包括用户，金融产品和用户产品权重；所述用户产品权重根据所述用户对所述金融产品的行为确定；利用所述多个二元组构建二部图网络；其中所述二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接所述第一节点与所述第二节点的边；所述边具有连接的第一节点和第二节点对应的所述用户产品权重；以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；利用所述训练好的图网络模型处理所述二部图网络，获得每一个所述第一节点的筛选指标；所述筛选指标作为筛选每一个所述第一节点表征的用户的依据。 2.根据权利要求1所述的方法，其特征在于，所述根据用户行为记录生成多个二元组，包括：针对每一个用户 ‑产品组合，确定所述用户 ‑产品组合对应的用户产品权重，将所述用户‑产品组合中的用户和金融产品，以及所述用户 ‑产品组合对应的用户产品权重组成所述用户‑产品组合对应的二元组；其中，确定所述用户 ‑产品组合对应的用户产品权重的过程包括：确定所述用户 ‑产品组合中用户对金融产品的历史行为的行为类型和行为强度；若行为类型为点击，所述行为强度小于第一停留阈值时，确定所述用户产品权重为第一权重；点击对应的行为强度为停留时长；若行为类型为点击，所述行为强度大于或等于所述第一停留阈值且小于第二停留阈值时，确定所述用户产品权重为第二权重；所述第二权重大于所述第一权重；若行为类型为点击，所述行为强度大于或等于所述第二停留阈值时，确定所述用户产品权重为第三权重；所述第三权重大于所述第二权重；若行为类型为购买，根据对应的行为强度确定所述用户产品权重为大于所述第三权重的第四权重；所述第四权重和购买对应的行为强度正相关。 3.根据权利要求1所述的方法，其特征在于，所述以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型，包括：分别对所述二部图网络进行两次启发式数据增强，获得所述二部图网络对应的第一视图和第二视图；利用所述图网络模型编码所述第一视图和所述第二视图，获得所述第一视图中各节点的第一表示向量，以及所述第二视图中各节点的第二表示向量；利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值；其中，每一个样本包括一个所述第一表示向量和所述第二表示向量，包含的第一表示向量和第二表示向量对应于相同节点的样本为正向样本，包含的第一表示向量和第二表示向量对应于不同节点的样本为负向样本；利用图网络模型编码所述二部图网络中的第一节点，获得所述第一节点的第三表示向量；根据所述第三表示向量和预先标注的所述第一节点表征的用户的真实标签确定所述图网络模型的交叉熵损失值；权　利　要　求　书 1/3 页 2 CN 115329159 A 2根据所述对比损失值和所述交叉熵损失值确定所述图网络模型的综合损失值；根据所述图网络模型的综合损失值更新所述图网络模型的参数，直至所述综合损失值符合预设的综合收敛条件为止，获得训练好的图网络模型。 4.根据权利要求3所述的方法，其特征在于，所述利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值，包括：针对每一个样本，若所述样本为正向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度的相反数确定为所述样本的样本损失，若所述样本为负向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度确定为所述样本的样本损失；将每一个所述样本的样本损失相加，获得所述图网络模型的对比损失。 5.一种基于图对比学习的用户筛选装置，其特征在于，包括：生成单元，用于根据用户行为记录生成多个二元组；其中，所述二元组包括用户，金融产品和用户产品权重；所述用户产品权重根据所述用户对所述金融产品的行为确定；构建单元，用于利用所述多个二元组构建二部图网络；其中所述二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接所述第一节点与所述第二节点的边；所述边具有连接的第一节点和第二节点对应的所述用户产品权重；训练单元，用于以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；处理单元，用于利用所述训练好的图网络模型处理所述二部图网络，获得每一个所述第一节点的筛选指标；所述筛选指标作为筛选每一个所述第一节点表征的用户的依据。 6.根据权利要求5所述的装置，其特征在于，所述生成单元根据用户行为记录生成多个二元组时，具体用于：针对每一个用户 ‑产品组合，确定所述用户 ‑产品组合对应的用户产品权重，将所述用户‑产品组合中的用户和金融产品，以及所述用户 ‑产品组合对应的用户产品权重组成所述用户‑产品组合对应的二元组；其中，确定所述用户 ‑产品组合对应的用户产品权重的过程包括：确定所述用户 ‑产品组合中用户对金融产品的历史行为的行为类型和行为强度；若行为类型为点击，所述行为强度小于第一停留阈值时，确定所述用户产品权重为第一权重；点击对应的行为强度为停留时长；若行为类型为点击，所述行为强度大于或等于所述第一停留阈值且小于第二停留阈值时，确定所述用户产品权重为第二权重；所述第二权重大于所述第一权重；若行为类型为点击，所述行为强度大于或等于所述第二停留阈值时，确定所述用户产品权重为第三权重；所述第三权重大于所述第二权重；若行为类型为购买，根据对应的行为强度确定所述用户产品权重为大于所述第三权重的第四权重；所述第四权重和购买对应的行为强度正相关。 7.根据权利要求5所述的装置，其特征在于，所述训练单元以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型时，具体用于：分别对所述二部图网络进行两次启发式数据增强，获得所述二部图网络对应的第一视权　利　要　求　书 2/3 页 3 CN 115329159 A 3

专利 基于图对比学习的用户筛选方法、装置、设备和存储介质

专利基于图对比学习的用户筛选方法、装置、设备和存储介质