说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211086182.X (22)申请日 2022.09.06 (71)申请人 中国平安财产保险股份有限公司 地址 518000 广东省深圳市福田区益田路 5033号平安金融中心12、 13、 38、 39、 40 层 (72)发明人 陈婷婷  (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 郝少剑 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 50/18(2012.01) (54)发明名称 目标企业用户筛选方法、 装置、 计算机设备 及存储介质 (57)摘要 本申请实施例属于人工智能领域, 应用于用 户筛选领域中, 涉及一种目标企业用户筛选方 法、 装置、 计算机设备及存储介质, 包括对若干个 企业用户进行正负样本划分; 获取同一正样本中 各企业用户对应的特征集; 获得符合初选条件的 特征元素; 获得符合终选条件的特征元素, 构建 当前样本对应的综合特征; 依次将每个正样本对 应的综合特征分别作为输入参数, 输入基于 LightGBM算法的预测评分模型, 获取每个正样本 对应的预测分值; 获取负样本的综合特征, 将综 合特征输入预测评分模型, 获取预测分值; 进行 对比, 确定负样本中各企业用户分别对应的正样 本, 完成目标企业用户筛选。 便于帮助协议设立 方精准快速的查找到意定的协议签订方。 权利要求书3页 说明书11页 附图4页 CN 115409559 A 2022.11.29 CN 115409559 A 1.一种目标企业用户筛 选方法, 其特 征在于, 包括下述 步骤: 步骤201, 获取若干个企业用户的基本信息, 根据所述基本信息, 对所述若干个企业用 户进行正负样本划分, 其中, 所述基本信息包括企业名称和所述企业用户签订的团体类协 议名称; 步骤202, 基于预设表单, 获取同一正样本中各企业用户分别对应的第 一特征集和第二 特征集; 步骤203, 对所述第一特征集和第二特征集中特征元素分别进行筛选处理, 获得符合预 设筛选条件的特 征元素, 构建当前样本对应的综合特 征; 步骤204, 依次将每个正样本对应的综合特征分别作为输入参数, 输入基于LightGBM算 法的预测评分模型, 获取每 个正样本对应的预测分值; 步骤205, 获取负样本 中各企业用户分别对应的第一特征集和第二特征集, 并执行步骤 203, 获取负样 本中各企业用户分别对应的综合特征, 将所述 综合特征输入所述预测评 分模 型, 获取预测分值; 步骤206, 基于所述预测分值和所述每个正样本对应的预测分值, 确定所述负样本中各 企业用户分别对应的正样本, 完成目标企业用户筛 选。 2.根据权利要求1所述的目标企业用户筛选方法, 其特征在于, 预设正样本筛选条件, 所述根据所述基本信息, 对所述若干个企业用户进行正负 样本划分的步骤, 具体包括: 基于所述正样本筛选条件和所述企业名称, 筛选出所述若干个企业用户中符合所述正 样本筛选条件的企业用户, 其中, 所述正样本筛选条件包括所述若干个企业用户签订的团 体类协议名称; 将筛选出的企业用户作为 正样本; 将未被筛 选出的企业用户作为负 样本。 3.根据权利要求2所述的目标企业用户筛选方法, 其特征在于, 所述基于所述正样本筛 选条件和所述企业名称, 筛选出所述若干个企业用户中符合所述正样本筛选条件的企业用 户的步骤, 具体包括: 基于所述团体类协议名称和所述企业名称, 分别识别出所述若干个企业用户中签订了 相同团体 类协议的企业用户; 将签订了所述相同团体类协议的企业用户划分为一个正样本, 生成N个正样本, 其中, N 为正整数, N表示所述若干个企业用户签订的团体 类协议的种类; 将所述若干个企业用户中未签订任何团体 类协议的企业用户作为负 样本。 4.根据权利要求1所述的目标企业用户筛选方法, 其特征在于, 所述基于预设表单, 获 取同一正样本中各企业用户分别对应的第一特 征集和第二特 征集的步骤, 具体包括: 基于所述表单, 获取所述企业用户的画像属性, 构建第一标签集, 其中, 所述企业用户 的画像属性包括企业经营信息、 规模信息、 产品信息、 团体类协议信息和非团体类协议信 息; 基于所述表单, 获取所述企业用户的决策人的画像属性, 构建第二标签集, 其中, 所述 企业用户的决策 人的画像属性包括所述决策 人的基本信息、 财富信息、 个人类协议信息 。 5.根据权利要求1所述的目标企业用户筛选方法, 其特征在于, 所述对所述第 一特征集 和第二特征集中特征元素分别进行筛选处理, 获得符合预设筛选条件的特征元素, 构建当权 利 要 求 书 1/3 页 2 CN 115409559 A 2前样本对应的综合特 征的步骤, 具体包括: 对所述第一特征集和第 二特征集中特征元素分别进行特征分箱 处理, 获取各特征元素 对应的特 征因子IV值; 基于预设特征因子IV值阈值和所述各特征元素对应的特征因子IV值, 对所述第一特征 集和第二特 征集中特 征元素进行数据清洗, 获得符合初选条件的特 征元素; 使用相关性分析法和主成分分析法, 对所述符合初选条件的特征元素进行特征分析, 获得符合终选条件的特 征元素, 构建当前样本对应的综合特 征。 6.根据权利要求5所述的目标企业用户筛选方法, 其特征在于, 在所述对所述第 一特征 集和第二特征集中特征元素分别进行特征分箱处理, 获取各特征元素对应的特征 因子IV值 的步骤之前, 所述方法还 包括: 根据预设赋值规则, 对所述第一特征集和第二特征集中特征元素进行数值化赋值处 理; 对数值化赋值处理结果中的极值, 按照预设替换规则进行平滑替换, 其中, 所述极值包 括极大值和极小值。 7.根据权利要求5所述的目标企业用户筛选方法, 其特征在于, 所述基于预设特征因子 IV值阈值和所述各特征元素对应的特征 因子IV值, 对所述第一特征集和第二特征集中特征 元素进行数据清洗, 获得符合初选条件的特 征元素的步骤, 具体包括: 判断所述第一特征集和第二特征集中特征元素对应的特征因子IV值是否满足对应的 特征因子IV值阈值; 若满足, 则所述特 征元素符合初选条件, 进行保留; 若不满足, 则所述特 征元素不符合初选条件, 进行剔除。 8.根据权利要求5所述的目标企业用户筛选方法, 其特征在于, 所述使用相关性分析法 和主成分分析法, 对所述符合初选条件的特征元素进行特征分析, 获得符合终选条件的特 征元素, 构建当前正样本对应的综合特 征的步骤, 具体包括: 使用所述相关性分析法, 对所述符合初选条件的特征元素进行相关性分析, 获取每个 所述特征元素的相关性表征值; 基于所述相关性表征值和预设相关性阈值, 筛选并剔除大于所述相关性阈值的特征元 素, 获得二次筛 选后的特 征元素; 使用主成分分析法, 对所述二次筛选后的特征元素进行主成分分析, 获取所述特征元 素对应的权 重系数; 基于所述特征元素对应的权重系数和预设权重系数阈值, 筛选出大于所述权重系数阈 值的特征元素, 按照预设组合 规则, 对所述特 征元素进行组合, 构建综合特 征。 9.根据权利要求1至3任一所述的目标企业用户筛选方法, 其特征在于, 所述基于所述 预测分值和所述每个正样本对应的预测分值, 确定所述负样本中各企业用户分别对应的正 样本, 完成目标企业用户筛 选的步骤, 具体包括: 将所述负样本中各企业用户分别对应的预测分值依次与所述每个正样本对应的预测 分值进行对比; 根据对比结果, 筛 选出所述负样本中各企业用户分别对应的目标正样本; 将所述目标正样本对应的团体类协议名称, 推荐给所述目标正样本对应的企业用户,权 利 要 求 书 2/3 页 3 CN 115409559 A 3

.PDF文档 专利 目标企业用户筛选方法、装置、计算机设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标企业用户筛选方法、装置、计算机设备及存储介质 第 1 页 专利 目标企业用户筛选方法、装置、计算机设备及存储介质 第 2 页 专利 目标企业用户筛选方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 15:41:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。