说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211366750.1 (22)申请日 2022.11.03 (71)申请人 深圳市云积分科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道南海大道海典居3 E-1 (72)发明人 许先才 肖荣昌 汪芳芳 熊磊  (74)专利代理 机构 深圳智汇远见知识产权代理 有限公司 4 4481 专利代理师 赵烁 (51)Int.Cl. G06F 7/10(2006.01) G06F 7/08(2006.01) G06Q 30/02(2012.01) G06F 17/18(2006.01) (54)发明名称 人群标签的选择方法及装置、 存储介质、 电 子设备 (57)摘要 本发明公开了一种人群标签的选择方法及 装置、 存储介质、 电子设备, 其中, 该方法包括: 确 定参考人群, 并圈选标签集合, 其中, 所述标签集 合包括多个属性的标签, 每个标签对应一个包括 同一用户属性的样本人群; 计算所述参考人群分 别与多个样本人群的交集, 得到多个交集人群; 根据所述交集人群与每个所述样本人群计算所 述标签集合中标签的转化率, 所述转化率用于表 征标签对应样本人群转化为所述参考人群的概 率; 根据所述转化率在所述标签集合中选择所述 参考人群的人群标签。 通过本发明, 解决了相关 技术中人工为参考人群筛选优质标签的效率低 和准确率低的技术问题, 提高了人群标签的优选 效率和准确率。 权利要求书2页 说明书11页 附图4页 CN 115495042 A 2022.12.20 CN 115495042 A 1.一种人群标签的选择 方法, 其特 征在于, 包括: 确定参考人群, 并圈选标签集合, 其中, 所述标签集合包括多个属性的标签, 每个标签 对应一个包括同一用户属性的样本人群; 计算所述 参考人群分别与多个样本人群的交集, 得到多个交集人群; 根据所述交集人群与每个所述样本人群计算所述标签集合中标签的转化率, 所述转化 率用于表征 标签对应样本人群转 化为所述参考人群的概 率; 根据所述 转化率在所述标签集 合中选择 所述参考人群的人群标签。 2.根据权利要求1所述的方法, 其特征在于, 计算所述参考人群分别与多个样本人群的 交集, 得到多个交集人群包括: 针对每个标签集 合中的每 个单标签, 确定命中所述标签的第一样本人群; 针对所述第一样本人群中的每个第一样本对象, 执行以下操作: 判断所述第一样本对 象是否属于所述参考人群; 若所述第一样本对象属于所述参考人群, 将所述第一样本对 象 添加至所述 参考人群与所述第一样本人群的第一交集人群。 3.根据权利要求1所述的方法, 其特征在于, 计算所述参考人群分别与多个样本人群的 交集, 得到多个交集人群包括: 针对每个标签集合中的每个标签组合, 确定同时命中所述标签组合的第二样本人群, 其中, 所述标签组合包括多个标签; 针对所述第二样本人群中的每个第二样本对象, 执行以下操作: 判断所述第二样本对 象是否属于所述参考人群; 若所述第二样本对象属于所述参考人群, 将所述第二样本对 象 添加至所述 参考人群与所述第二样本人群的第二交集人群。 4.根据权利要求1所述的方法, 其特征在于, 根据 所述交集人群与每个所述样本人群计 算所述标签集 合中每个标签的转 化率包括: 统计所述标签集合中每个标签的样本人群的第 一规模数量, 以及统计所述交集人群的 第二规模数量; 针对所述标签集合中的每个标签, 计算所述第 二规模数量与 所述第一规模数量之间的 人数比; 将所述人 数比确定为所述标签的转 化率。 5.根据权利要求4所述的方法, 其特征在于, 在将所述人数比确定为所述标签的转化率 之后, 所述方法还 包括: 从所述标签集 合的全量人群中随机抽取k个样本对象; 计算所述 k个样本对象与所述 参考人群的交集, 得到随机交集人 数; 计算所述随机交集人 数与所述 参考人群人 数的比值, 得到随机转 化率; 将所述随机转化率与 所有标签的转化率进行比较, 在所述标签集合中选择转化率大于 所述随机转 化率的待选标签, 得到p个待选标签; 对所述p个待选标签进行多阶的自由组合, 生成所述标签集合的多个标签组合, 其中, k, p均为正整数。 6.根据权利要求1所述的方法, 其特征在于, 根据 所述转化率在所述标签集合中选择所 述参考人群的人群标签包括: 基于所述 转化率对所述标签集 合中的标签进行降序排序, 得到标签序列;权 利 要 求 书 1/2 页 2 CN 115495042 A 2从所述标签序列的起始标签开始, 依次选择前m个标签, 直到m个标签的样本人群总规 模数量达 到第一目标 人数, 其中, m为 正整数; 将所述前m个标签输出为所述 参考人群的第一人群标签。 7.根据权利要求1所述的方法, 其特征在于, 根据 所述转化率在所述标签集合中选择所 述参考人群的人群标签包括: 基于所述转化率对所述标签集合中的多个标签组合进行降序排序, 得到标签组合序 列; 从所述标签组合序列的起始标签组合开始, 依次选择前n个标签组合, 直到n个标签组 合的样本人群总规模数量达 到第二目标 人数, 其中, n 为正整数; 将所述前n个标签输出为所述 参考人群的第二人群标签。 8.一种人群标签的选择装置, 其特 征在于, 包括: 确定模块, 用于确定参考人群, 并圈选标签集合, 其中, 所述标签集合包括多个属性的 标签, 每个标签对应一个包括同一用户属性的样本人群; 第一计算模块, 用于计算所述参考人群分别与多个样本人群的交集, 得到多个交集人 群; 第二计算模块, 用于根据所述交集人群与每个所述样本人群计算所述标签集合中标签 的转化率, 所述转化率用于表征 标签对应样本人群转 化为所述参考人群的概 率; 选择模块, 用于根据所述 转化率在所述标签集 合中选择 所述参考人群的人群标签。 9.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 所述程序运行时 执行上述权利要求1至7中任一项所述的方法的步骤。 10.一种电子设备, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理器, 通信接 口, 存储器通过通信总线完成相互间的通信; 其中: 存储器, 用于存放计算机程序; 处理器, 用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方 法的步骤。权 利 要 求 书 2/2 页 3 CN 115495042 A 3

.PDF文档 专利 人群标签的选择方法及装置、存储介质、电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 人群标签的选择方法及装置、存储介质、电子设备 第 1 页 专利 人群标签的选择方法及装置、存储介质、电子设备 第 2 页 专利 人群标签的选择方法及装置、存储介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 15:40:09上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。