说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210975893.6 (22)申请日 2022.08.15 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 李钰 梁颖 刘腾 焦勇博  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 唐彩琴 (51)Int.Cl. G06Q 30/00(2012.01) G06Q 40/02(2012.01) (54)发明名称 客户分类方法、 装置、 计算机设备和存储介 质 (57)摘要 本申请涉及一种客户分类方法、 装置、 计算 机设备和存储介质。 所述方法包括: 根据不同客 户的第一多模态数据样本, 确定目标分类模型, 其中, 第一多模态数据样本包括基础属性数据样 本、 行为埋点数据样本和交互数据样本中的至少 一种数据 样本类型, 进而获取待分类客户的多模 态数据, 从而根据待分类客户的多模态数据和目 标分类模型, 确定待分类客户的类型。 采用本方 法能够提高客户分类的准确性。 权利要求书2页 说明书17页 附图8页 CN 115239355 A 2022.10.25 CN 115239355 A 1.一种客户分类方法, 其特 征在于, 所述方法包括: 根据不同客户的第一多模态数据样本, 确定目标分类模型, 其中, 所述第 一多模态数据 样本包括基础属性数据样本、 行为埋点数据样本和交互数据样本中的至少一种数据样本类 型; 获取待分类客户的多模态数据; 根据所述待分类客户的多模态数据和所述目标分类模型, 确定所述待分类客户的类 型。 2.根据权利要求1所述的方法, 其特征在于, 所述根据不同客户的第一多模态数据样 本, 确定目标分类模型, 包括: 对所述不同客户的第 一多模态数据样本进行预处理, 得到预处理后的第 二多模态数据 样本; 根据所述第二多模态数据样本和预设的客户分类 类型, 确定训练数据集; 根据所述训练数据集中各数据样本类型以及各所述数据样本类型对应的初始模型, 确 定各所述数据样本类型对应的中间模型; 根据各所述数据样本类型对应的中间模型以及所述训练数据集, 确定所述目标分类模 型。 3.根据权利要求2所述的方法, 其特征在于, 所述根据各所述数据样本类型对应的中间 模型以及所述训练数据集, 确定所述目标分类模型, 包括: 在对各所述数据样本类型对应的中间模型进行各次测试时, 对所述训练数据集进行N 次随机抽样, 得到各 所述随机抽样下的N个随机数据集, 其中, N 为大于1的整数; 根据各所述中间模型以及各次测试对应的N个随机数据集, 确定各次测试下各所述中 间模型的权 重系数; 根据各所述中间模型以及各次测试下各所述中间模型的权重系数, 确定所述目标分类 模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据各所述中间模型以及各次测试对 应的N个随机数据集, 确定各次测试 下各所述中间模型的权 重系数, 包括: 根据各次测试对应的N个随机数据集和各所述中间模型, 得到各次测试下各所述中间 模型对应的N个性能参数, 其中, 所述N个性能参数包括利用各所述随机数据集测试时, 各所 述中间模型对应的各性能参数; 根据各次测试下各所述中间模型对应的N个性能参数, 确定各次测试下各所述中间模 型的权重系数。 5.根据权利要求4所述的方法, 其特征在于, 所述根据各次测试下各所述中间模型对应 的N个性能参数, 确定各次测试 下各所述中间模型的权 重系数, 包括: 将各次测试下各所述中间模型对应的第一数量除以N得到的商值, 作为各次测试下各 所述中间模型 的权重系 数, 其中, 各次测试下各所述中间模型对应的第一数量等于利用各 所述随机数据集测试时, 各所述中间模型对应的各性能参数是所有中间模 型对应的各性能 参数中最大值的次数总和。 6.根据权利要求3 ‑5任意一项所述的方法, 其特征在于, 所述根据 各所述中间模型以及 各次测试 下各所述中间模型的权 重系数, 确定所述目标分类模型, 包括:权 利 要 求 书 1/2 页 2 CN 115239355 A 2将各次测试下各所述中间模型的权重系数的平均值作为各所述中间模型的目标权重 系数; 根据各所述中间模型和各 所述中间模型的目标权 重系数, 得到所述目标分类模型。 7.根据权利要求2所述的方法, 其特征在于, 所述根据所述第 二多模态数据样本和预设 的客户分类 类型, 确定训练数据集, 包括: 根据所述第二多模态数据样本和预设的客户分类 类型, 确定初始数据集; 确定所述初始数据集中各 所述第二多模态数据样本所对应的特 征值; 根据各所述第二多模态数据样本所对应的特 征值, 确定所述训练数据集。 8.根据权利要求7所述的方法, 其特征在于, 所述确定所述初始数据集中各所述第 二多 模态数据样本所对应的特 征值, 包括: 利用所述初始数据集中各类型的数据样本所对应的预设算法, 确定所述初始数据集中 各类型的数据样本的特 征值。 9.根据权利要求8所述的方法, 其特征在于, 所述根据各所述第 二多模态数据样本所对 应的特征值, 确定所述训练数据集, 包括: 根据所述初始数据集中各类型的数据样本的特征值, 对所述初始数据集中各类型的数 据样本进行筛 选, 得到所述初始数据集中各类型的数据样本对应的数据集; 根据所述初始数据集中各类型的数据样本对应的数据集, 确定所述训练数据集。 10.根据权利要求2所述的方法, 其特征在于, 所述对所述不同客户的第一多模态数据 样本进行 预处理, 得到预处 理后的第二多模态数据样本, 包括: 对所述第一多模态数据样本中的基础属性数据样本进行归一化处理, 得到归一化处理 后的基础属性数据样本; 对所述多模态数据样本 中的行为埋点数据样本进行清洗处理, 得到所述第 一行为埋点 数据样本; 对所述多模态数据样本 中的交互数据样本进行分词处理, 得到所述第 一行交互数据样 本。 11.一种客户分类装置, 其特 征在于, 所述装置包括: 第一确定模块, 用于根据不同客户的第一多模态数据样本, 确定目标分类模型, 其中, 所述第一多模态数据样本包括基础属性数据样本、 行为埋点数据样本和交互数据样本中的 至少一种数据样本类型; 获取模块, 用于获取待分类客户的多模态数据; 第二确定模块, 用于根据所述待分类客户的多模态数据和所述目标分类模型, 确定所 述待分类客户的类型。 12.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。 13.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。 14.一种计算机程序产品, 包括计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1至10中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115239355 A 3

PDF文档 专利 客户分类方法、装置、计算机设备和存储介质

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 客户分类方法、装置、计算机设备和存储介质 第 1 页 专利 客户分类方法、装置、计算机设备和存储介质 第 2 页 专利 客户分类方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。