说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210880512.6 (22)申请日 2022.07.25 (71)申请人 每日互动股份有限公司 地址 310012 浙江省杭州市西湖区西溪路 525号A楼西区418室 (72)发明人 陈津来 陈志勇 尹雅露 董霖  (74)专利代理 机构 北京锺维联合知识产权代理 有限公司 1 1579 专利代理师 原春香 (51)Int.Cl. G06F 16/2455(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于pkg获取设备的数据处 理系统 (57)摘要 本发明提供了一种基于pkg获取设备的数据 处理系统, 数据处理系统包括原始设备列表, 原 始设备列表中每一原始设备对应的原始向量, 处 理器和存储有计算机程序的存储器, 当所述计算 机程序被处理器执行时, 实现以下步骤: 获取初 始设备列表; 获取原始向量列表; 获取初始向量 列表; 对所有初始向量进行均值处理, 获得中心 向量; 根据原始向量和中心向量计算相似度, 获 取相似度正向排序的前z项作为目标设备, 从而 从而形成基于pkg获取设备的系统, 更加准确地 获取指定pkg的相似pkg上安装的设备。 权利要求书2页 说明书5页 附图1页 CN 115145963 A 2022.10.04 CN 115145963 A 1.一种基于pkg获取设备的数据处理系统, 其特征在于, 数据处理系统包括原始设备ID 列表, 原始设备ID列表中每一原始设备对应的原始向量, 处理器和存储有计算机程序的存 储器, 所述原始设备ID列表S={S1,…, Sk,…, Sp}, Sk={Sk1,…, Sky,…, Skt}, Sk是指第k个设 备ID, Sky是指第k个设备ID对应的第y个pkg, k的取值范围是1到p, p是原始设备的总数量, y 的取值范围时1到t, t是指第k个原始设备ID在预设时间段内安装的pkg的总数量; 当所述计 算机程序被处 理器执行时, 实现以下步骤: S100, 获取初始设备ID列表B={B1,…, Bi,…, Bm}, Bi={Bi1,…, Bij,…, Bin}, Bi是指第i 个初始设备ID, i的取值范围是1到m, m是指初始设备的总数量, Bij是指第i个初始设备ID对 应的第j个pkg, j的取值范围是1到n, n是指Bi在预设时间段内安装的pkg的总数量, 其中, m< p; S200, 对每一Sky进行处理, 获取到S对应的原始向量列表 H={H1,…, Hk,…, Hp}, Hk是指Sk 对应的原 始向量; S300, 对每一Bij进行处理, 获取到B对应的初始向量列表 C={C1,…, Ci,…, Cm}, Ci是指Bi 对应的初始向量; S400, 对C中所有Ci进行均值处 理, 获得中心向量D; S500, 根据 Hk和D, 获取相似度列表E={ E1,…, Ek,…, Ep}, Ek是指Hk和D的相似度, Ek符合 如下条件: Hγ k是指原始向量Hk中第γ个bit值, Dγ是指中心向量D中第 γ个bit值, γ的取值范围是1到φ, φ是指原 始向量Hk和中心向量D的总bit数; S600, 将相似度列表进行正向排序, 获取 前z项初始向量对应的设备作为目标设备。 2.根据权利要求1所述的基于pkg获取设备的数据处理系 统, 其特征在于, S200包括如 下步骤获取原 始向量列表H: S201, 获取Sky对应的向量H ′ky=(H′1 ky,…, H′L ky,…, H′Φ ky), 从而获得第k个原始设备ID 对应的的原始向量列表H ′k={H′k1,…, H′ky,…, H′kt}; HL ky是指向量H ′ky中第L个bit位, L的 取值范围是1到Φ, φ是指原 始向量H′ky总bit数; S202, 对H ′k进行均值处 理, 获得Hk, 其中, Hky符合如下 条件: Hky=∑t y=1H′ky; S203, 基于Hk, 获取S对应的原 始向量列表H={H1,…, Hk,…, Hp}。 3.根据权利要求1所述的基于pkg获取设备的数据处理系 统, 其特征在于, S300包括如 下步骤获取初始向量列表C: S301, 获取Bij对应的向量C ′ij={C′1 ij,…, C′V ij,…, C′Φ ij}, C′V ij是指第V个bit位, V的 取值范围是1到Φ, 从而获得第i个初始设备ID对应的的初始向量列表C ′i={C′i1,…, C ′iy,…, C′it}; S302, 对C ′i进行均值处理, 获得Ci=(C1 i,…, CJ i,…, CΦ i), CJ i是指向量Ci中第J个bit位, J的取值范围时1到Φ, 其中, CJ i符合如下 条件:权 利 要 求 书 1/2 页 2 CN 115145963 A 2CJ i=∑n j=1C′ij; S303, 基于Ci, 获取C对应的初始向量列表C={C1,…, Ci,…, Cm}。 4.根据权利要求1和2和3所述的基于pkg获取设备的数据处理系统, 其特征在于, S400 中, 中心向量D=(D1,…, DJ,…, DΦ), DJ是指中心向量D的第J个bit位, DJ符合如下 条件: DJ=∑m i=1CJ i。 5.根据权利要求1所述的基于pkg获取设备的数据处理系统, 其特征在于, 所述预设时 间段为一周。 6.根据权利要求2和3所述的基于pkg获取设备的数据处理系 统, 其特征在于, 将pkg转 化为向量时, 使用同一平台。 7.根据权利要求1所述的基于pkg获取设备的数据处理系统, 其特征在于, 使用词向量 对应表获取Aij对应的向量Cij, 具体通过如下步骤获取词向量对应表: 将Q个原始pk g输入Word2Vec模型进行训练, 获取每个原始pk g出现的次数; 当任一原始 pkg出现的次数<共同次数阈值时, 将原始pkg进行删除, 不进行后续操作; 将原始pkg转化为 Φ位的原始向量, 进行输出; 从而获取pkg和向量对应的词向量对应表; 其中, 原始pkg是原 始设备ID上安装的pkg。 8.根据权利要求1所述的基于pk g获取设备的数据处理系统, 其特征在于, 使用K ‑means 聚类算法将初始向量列表C={C1,…, Ci,…, Cm}进行聚合成中心向量D。 9.根据权利要求7 所述的基于pkg获取设备的数据处 理系统, 其特 征在于, z /p=0.6。 10.根据权利要求1所述的基于pkg获取设备的数据处 理系统, 其特 征在于, m/p< 0.001。权 利 要 求 书 2/2 页 3 CN 115145963 A 3

.PDF文档 专利 一种基于pkg获取设备的数据处理系统

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于pkg获取设备的数据处理系统 第 1 页 专利 一种基于pkg获取设备的数据处理系统 第 2 页 专利 一种基于pkg获取设备的数据处理系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:14:36上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。