(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211196002.3
(22)申请日 2022.09.27
(71)申请人 浪潮卓数 大数据产业发展 有限公司
地址 214125 江苏省无锡市无锡经济开发
区金融一街15号1101、 1102、 1103、
1104、 1105、 1106、 1107、 1108
(72)发明人 阮潘 单震 国靖 邱元磊
(74)专利代理 机构 济南信达专利事务所有限公
司 37100
专利代理师 冯春连
(51)Int.Cl.
G06Q 30/02(2012.01)
(54)发明名称
一种网络零售活跃店铺主题库的构建方法
及工具
(57)摘要
本发明公开一种网络零售活跃店铺主题库
的构建方法及工具, 涉及网络零售技术领域, 其
实现过程为: 利用爬虫技术, 获取不同网络交易
平台的网络零售店铺公开数据; 定义活跃店铺,
基于获取的公开数据, 确定店铺所属地, 选取店
铺主营类型, 设定店铺评分标准; 按照相应的数
据标准对已获取的网络零售店铺公开数据进行
清洗处理和标准化处理, 随后基于活跃店铺的定
义内容和网络零售店铺的某项公开数据, 将网络
零售店铺标记 为活跃店铺; 构建网络零售活跃店
铺主题库, 将活跃店铺的标准化公开数据保存到
主题库中。 本发 明可以得到网络零售店铺的活跃
情况及发展趋势, 提高地方对店铺有效管理。
权利要求书2页 说明书5页 附图1页
CN 115423530 A
2022.12.02
CN 115423530 A
1.一种网络零售活跃店铺主题库的构建方法, 其特 征在于,包括以下步骤:
S1、 利用爬虫技 术, 获取不同网络交易平台的网络零售 店铺公开数据;
S2、 定义活跃店铺, 基于获取的公开数据, 确定店铺所属地, 选取店铺主营类型, 设定店
铺评分标准;
S3、 按照相应的数据 标准对已获取的网络零售店铺公开数据进行清洗处理和标准化处
理, 随后基于活跃店铺的定义内容和网络零售店铺的某项公开数据, 将网络零售店铺标记
为活跃店铺;
S4、 构建网络零售活跃店铺主题库, 将活跃店铺的标准 化公开数据保存到主题库中。
2.根据权利要求1所述的一种网络零售活跃店铺主题库的构建方法, 其特征在于, 网络
零售店铺是指: 截至统计期末, 各公共网络交易平台分配给成功入驻商家的独立网络化虚
拟商铺, 其公开数据包括店铺名称、 店铺类型、 店铺发货地、 店铺所在地、 店铺所属企业、 店
铺评分、 店铺商品价格、 店铺商品数、 商品销量、 商品类目;
基于网络零售店铺, 定义活跃店铺: 在统计期内, 在监测网络交易平台中商品销量大于
零的网络零售 店铺。
3.根据权利要求2所述的一种网络零售活跃店铺主题库的构建方法, 其特征在于, 执行
步骤S2, 确定店铺所属地, 选取店铺主营类型, 设定店铺评分标准, 进行的具体操作为:
S2.1、 直接使用公开数据中店铺所在地作为店铺所属地, 未采集到店铺所在地的, 使用
店铺发货地作为店铺所属 地, 也未采集到店铺发货地的, 使用网络交易平台公布的店铺地
址作为店铺所属地,
S2.2、 将网络零售 店铺中销售额 最大的商品类目作为店铺主营类型,
S2.3、 将所有网络交易平台的评分标准统一设定为五分制, 根据设定的评分标准对网
络零售店铺的评分进行调整。
4.根据权利要求2所述的一种网络零售活跃店铺主题库的构建方法, 其特征在于, 执行
步骤S3,
对已获取公开数据进行异常数据、 重复数据的清洗, 确保网络零售 店铺的唯一;
对已获取公开数据中店铺发货地和店铺所在地的行政区划代码、 店铺所属企业的组织
机构代码、 商品类目的划分结果进行 标准化;
将已获取公开数据中商品销量大于零的网络零售 店铺标记为活跃店铺。
5.根据权利要求4所述的一种网络零售活跃店铺主题库的构建方法, 其特征在于, 活跃
店铺的标准化公开数据包括店铺名称、 所属网络交易平台、 店铺所属地、 店铺主营类型、 商
品销量、 商品类目;
基于活跃店铺所属的店铺主营类型, 按照商品销量降低的方式对活跃店铺进行排序。
6.一种网络零售活跃店铺主题库的构建工具, 其特 征在于, 其结构包括:
数据获取模块, 用于利用爬虫技 术, 获取不同网络交易平台的网络零售 店铺公开数据;
定义模块, 用于根据网络零售 店铺的某项公开数据定义活跃店铺;
选取设定模块, 用于基于获取的公开数据, 确定店铺所属地, 选取店铺主营类型, 设定
店铺评分标准;
数据处理模块, 用于按照相应的数据标准对已获取的网络零售店铺公开数据进行清洗
处理和标准 化处理;权 利 要 求 书 1/2 页
2
CN 115423530 A
2店铺标记模块, 用于根据活跃店铺的定义内容和网络零售店铺的某项公开数据, 将网
络零售店铺标记为活跃店铺;
构建存储模块, 用于构建网络零售活跃店铺主题库, 并将标记为活跃店铺的标准化公
开数据保存到主题库中。
7.根据权利要求6所述的一种网络零售活跃店铺主题库的构建工具, 其特征在于, 网络
零售店铺是指: 截至统计期末, 各公共网络交易平台分配给成功入驻商家的独立网络化虚
拟商铺;
所述数据获取模块获取的公开数据包括店铺名称、 店铺类型、 店铺发货地、 店铺所在
地、 店铺所属企业、 店铺评分、 店铺商品价格、 店铺商品数、 商品销量、 商品类目;
所述定义模块将在统计期内, 监测网络交易平台中商 品销量大于零的网络零售店铺定
义为活跃店铺。
8.根据权利要求7所述的一种网络零售活跃店铺主题库的构建工具, 其特征在于, 所述
选取设定模块基于获取的公开数据, 确定店铺所属地, 选取店铺主 营类型, 设定店铺评 分标
准, 执行的具体操作为:
(1)直接使用公开数据中店铺所在地作为店铺所属地, 未采集到店铺所在地的, 使用店
铺发货地作为店铺所属 地, 也未采集到店铺发货地的, 使用网络交易平台公布的店铺地址
作为店铺所属地,
(2)将网络零售 店铺中销售额 最大的商品类目作为店铺主营类型,
(3)将所有网络交易平台的评分标准统一设定为五分制, 根据设定的评分标准对网络
零售店铺的评分进行调整。
9.根据权利要求8所述的一种网络零售活跃店铺主题库的构建工具, 其特征在于, 所述
数据处理模块按照相应的数据标准对已获取公开数据进行异常数据、 重复数据的清洗, 确
保网络零售 店铺的唯一;
所述数据处理模块按照相应的数据标准对已获取公开数据中店铺发货地和店铺所在
地的行政区划代码、 店铺所属企业的组织机构代码、 商品类目的划分结果进行 标准化。
10.根据权利要求7所述的一种网络零售活跃店铺主题库的构建工具, 其特征在于, 活
跃店铺的标准化公开数据包括店铺名称、 所属网络交易平台、 店铺所属地、 店铺主营类型、
商品销量、 商品类目。
所述构建存储模块基于活跃店铺所属的店铺主营类型, 按照商品销量降低的方式对活
跃店铺进行排序, 并保存到主题库中。权 利 要 求 书 2/2 页
3
CN 115423530 A
3
专利 一种网络零售活跃店铺主题库的构建方法及工具
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 15:39:13上传分享