说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211080506.9 (22)申请日 2022.09.05 (71)申请人 上海秒针网络科技有限公司 地址 200232 上海市徐汇区云锦路701号西 岸国际人工智能中心 29层 (72)发明人 吴立成 韩坤 李沫 梁志婷  赵奇  (74)专利代理 机构 北京华夏泰和知识产权代理 有限公司 1 1662 专利代理师 曾军 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9537(2019.01) G06Q 30/02(2012.01) (54)发明名称 流动人口数量的确定方法、 装置、 电子设备 及存储介质 (57)摘要 本发明提供了一种流动人口数量的确定方 法、 装置、 电子设备及存储介质, 该方法包括: 获 取第一样本数据集, 其中, 第一样本数据集包括 多条浏览日志样本, 每条浏览日志样本中含有 IP 属地信息和用户标识, 且每条浏览日志样本中的 IP属地均为目标区域; 根据每个用户标识对应的 常住区域以及目标区域, 确定第一样本数据集中 的流动样 本数量和常住样本数量; 根据流动样本 数量和常住样本数量, 确定样本流动人口比例; 根据目标区域的常住人口数量和样本流动人口 比例, 确定目标区域的流动人口数量。 解决了现 有的流动人口估算时效低的技术问题, 进而实现 了快速、 便捷的估算出具有时效性的地区流动人 口数量。 权利要求书3页 说明书13页 附图3页 CN 115455288 A 2022.12.09 CN 115455288 A 1.一种流动人口数量的确定方法, 其特 征在于, 所述方法包括: 获取第一样本数据集, 其中, 所述第 一样本数据集包括多条浏览日志样本, 每条浏览日 志样本中含有IP属地信息和用户标识, 且每条浏览日志样本中的IP属地均为目标区域; 根据每个用户标识对应的常住区域以及所述目标区域, 确定所述第 一样本数据集中的 流动样本数量和常住样本数量; 根据所述 流动样本数量和所述常住样本数量, 确定样本流动人口比例; 根据所述目标区域的常住人口数量和所述样本流动人口比例, 确定所述目标区域的流 动人口数量。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取第一样本数据集包括: 获取第一预设时间段的第二样本数据集, 其中, 所述第二样本数据集中的浏览日志样 本中包括多种不同的IP属地信息, 不同的IP属地信息对应不同的IP属地; 从所述第二样本数据集中, 筛选出IP属地均为所述目标区域的浏览日志样本, 得到所 述第一样本数据集。 3.根据权利要求1所述的方法, 其特征在于, 所述根据每个用户标识对应的常住区域以 及所述目标区域确定所述第一样本数据集中的流动样本数量和常住样本数量包括: 确定所述第一样本数据集中任一第一用户标识对应的常住区域; 判定所述第一用户标识对应的常住区域与所述第一用户标识对应的IP属地信息是否 匹配; 若所述第 一用户标识对应的常住区域与所述第 一用户标识对应的IP属地信息匹配, 则 确定所述第一用户标识为常住样本; 否则, 所述第一用户标识为 流动样本; 统计所述第一样本数据集中的常住样本数量以及流动样本数量。 4.根据权利要求3所述的方法, 其特征在于, 所述确定所述第 一样本数据集中任一第 一 用户标识对应的常住区域包括: 获取第二预设时间段的第三样本数据集, 其中, 在所述第三样本数据集中任一第一用 户标识对应至少一 IP属地信息; 统计所述第一用户标识在每一 IP属地的活跃天数; 将活跃天数最高时对应的IP属地, 作为所述第一用户标识对应的常住区域。 5.根据权利要求4所述的方法, 其特征在于, 所述获取第 二预设时间段的第 三样本数据 集包括: 采集所述第二预设时间段的浏览日志样本; 针对所述第 二预设时间段的浏 览日志样本中任一第 二用户标识, 统计所述第 二用户标 识对应的浏览日志样本数量, 其中, 每 个第二用户标识对应至少一浏览日志样本; 将所述浏览日志样本数量与预设值进行比较; 从所述第二预设时间段的浏 览日志样本 中, 筛选出浏览日志样本数量大于或等于所述 预设值时对应的目标第二用户标识; 将多个目标第二用户标识对应的多个浏览日志样本作为所述第三样本数据集。 6.根据权利要求3或4所述的方法, 其特征在于, 在确定所述第一样本数据集中任一第 一用户标识对应的常住区域之后, 所述方法还 包括: 采用与所述第一用户标识的常住区域对应的常住区域标签, 标记所述第一用户标识。权 利 要 求 书 1/3 页 2 CN 115455288 A 27.根据权利要求6所述的方法, 其特征在于, 所述判定所述第 一用户标识对应的常住区 域与所述第一用户标识对应的IP属地信息是否匹配包括: 查询所述第一用户标识对应的常住区域标签; 比较所述第一用户标识对应的常住区域标签与所述第一用户标识对应的IP属地信息 是否相同; 若所述第一用户标识对应的常住区域标签与所述第一用户标识对应的IP属地信息相 同, 则所述第一用户标识对应的常住区域与所述第一用户标识对应的IP属 地信息匹配; 否 则, 所述第一用户标识对应的常住区域与所述第一用户标识对应的IP属地信息不匹配。 8.根据权利要求4所述的方法, 其特征在于, 在将活跃天数最高时对应的IP属地, 作为 所述第一用户标识对应的常住区域之后, 所述方法还 包括: 确定所述第一用户标识在对应的常住区域的目标活跃天数, 以及, 针对所述第三样本 数据集, 统计所述第一用户标识在所有IP属地的总活跃天数; 计算所述目标活跃天数与 所述总活跃天数之间的比值, 得到所述第 一用户标识对应的 目标置信度; 从所述第三样本数据集中, 筛选出目标置信度大于或等于预设置信度的子集, 以对所 述第一样本数据集进行 过滤。 9.根据权利要求1所述的方法, 其特征在于, 所述根据所述流动样本数量和所述常住样 本数量确定样本流动人口比例包括: 计算所述 流动样本数量与所述常住样本数量之间的比值; 将所述比值作为所述样本流动人口比例。 10.根据权利要求1所述的方法, 其特征在于, 所述根据所述目标区域的常住人口数量 和所述样本流动人口比例确定所述目标区域的流动人口数量包括: 获取所述目标区域的常住人口数量; 通过对所述常住 人口数量与 所述样本流动人口比例进行乘法运算, 得到所述目标区域 的流动人口数量。 11.一种流动人口数量的确定装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取第一样本数据集, 其中, 所述第 一样本数据集包括多条浏览日志样 本, 每条浏览日志样本中含有IP属地信息和用户标识, 且每条浏览日志样本中的IP属地均 为目标区域; 第一确定模块, 用于根据每个用户标识对应的常住区域以及所述目标区域, 确定所述 第一样本数据集中的流动样本数量和常住样本数量; 第二确定模块, 用于根据所述流动样本数量和所述常住样本数量, 确定样本流动人口 比例; 第三确定模块, 用于根据所述目标区域的常住人口数量和所述样本流动人口比例, 确 定所述目标区域的流动人口数量。 12.一种电子设备, 其特征在于, 包括: 处理器、 通信接口、 存储器和通信总线, 其中, 处 理器, 通信接口, 存 储器通过通信总线完成相互间的通信; 所述存储器, 用于存放计算机程序; 所述处理器, 用于执 行计算机程序时, 实现权利要求1 ‑10任一所述的方法步骤。权 利 要 求 书 2/3 页 3 CN 115455288 A 3

.PDF文档 专利 流动人口数量的确定方法、装置、电子设备及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 流动人口数量的确定方法、装置、电子设备及存储介质 第 1 页 专利 流动人口数量的确定方法、装置、电子设备及存储介质 第 2 页 专利 流动人口数量的确定方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 15:41:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。