说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210086272.2 (22)申请日 2022.01.25 (71)申请人 平安国际智慧城市科技股份有限公 司 地址 518000 广东省深圳市前海深港合作 区妈湾兴海 大道3048号前海自贸大厦 1-34层 (72)发明人 马旋 (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 刘畅 (51)Int.Cl. G06Q 30/02(2012.01) G06N 3/04(2006.01) G06F 40/295(2020.01)G06F 16/36(2019.01) (54)发明名称 数据分析方法、 装置、 计算机设备及存储介 质 (57)摘要 本申请实施例属于大数据领域, 涉及一种数 据分析方法, 包括根据贸易数据和产品品类信息 构建第一知识图谱, 从第一知识图谱中确定目标 城市的往来城市信息, 基于贸易数据和往来城市 信息构建第二知识图谱; 根据历史贸易往来数据 和第一知识图谱确定重点产品, 通过第二知 识图 谱查找重点产品的依赖城市; 从依赖城市的所属 国家的公开策略中, 爬取贸易影响数据; 通过历 史贸易往来数据和历史影响数据训练线性回归 模型得到目标预测模型, 基于目标预测模型对贸 易影响数据和相关产能利用率进行计算, 得到地 方产能利用率。 本申请还提供一种数据分析装 置、 计算机设备及存储介质。 地方产能利用率可 存储于区块链中。 本申请实现了对贸易数据的精 确分析。 权利要求书2页 说明书14页 附图4页 CN 114549053 A 2022.05.27 CN 114549053 A 1.一种数据分析 方法, 其特 征在于, 包括下述 步骤: 从目标贸易网站获取目标城市的贸易数据、 产品品类信息以及历史贸易往来数据, 根 据所述贸易数据和所述产品品类信息构建第一知识图谱, 从所述第一知识图谱中确定所述 目标城市的往来城市信息, 基于所述贸易数据和所述往来城市信息构建第二知识图谱; 根据所述历史贸易往来数据和所述第 一知识图谱确定所述目标城市的重点产品, 通过 所述第二知识图谱查找所述重点产品的依赖城市; 从所述依赖城市的所属国家的公开策略中, 爬取 所述依赖城市的贸易影响数据; 获取所述目标城市的历史影响数据和所述重点产品的相关产能利用率, 通过所述历史 贸易往来数据和所述历史影响数据训练线性回归模型得到目标预测模型, 基于所述目标预 测模型对所述贸易影响数据和所述相关产能利用率进 行计算, 得到所述目标城市的地方产 能利用率。 2.根据权利要求1所述的数据分析方法, 其特征在于, 所述从 目标贸易网站获取目标城 市的贸易数据、 产品 品类信息的步骤 包括: 获取预设的数据爬取时段, 根据所述数据爬取时段从所述目标贸易网站定时爬取所述 目标城市的贸易源数据和产品源数据; 对所述贸易源数据和产品源数据进行分词处 理, 得到第一分词组和第二分词组; 获取预设的命名实体识别模型, 根据 所述命名实体识别模型对所述第 一分词组和所述 第二分词组进行实体识别, 得到所述贸易数据和所述产品 品类信息 。 3.根据权利要求2所述的数据分析方法, 其特征在于, 所述根据 所述命名实体识别模型 对所述第一分词组和所述第二分词组进行实体识别, 得到所述贸易数据和所述产品品类信 息的步骤 包括: 采集多组参考贸易数据和参考产品数据, 对所述参考贸易数据和所述参考产品数据进 行标签标注, 得到第一 参考标签和第二 参考标签; 根据所述参考贸易数据、 所述参考产品数据、 所述第 一参考标签和所述第 二参考标签, 对基础实体识别模型进行训练, 得到所述命名实体识别模型; 分别输入所述第 一分词词组和所述第 二分词词组至所述命名实体识别模型, 得到所述 第一分词词组对应的第一标签和所述第二分词词组对应的第二标签, 将所述第一标签对应 的实体作为识别得到的所述贸易数据, 将所述第二标签对应的实体作为识别得到的所述产 品品类信息 。 4.根据权利要求1所述的数据分析方法, 其特征在于, 所述基于所述贸易数据和所述往 来城市信息构建第二知识图谱的步骤 包括: 获取所述往来城市信 息中的往来城市, 根据 所述贸易数据确定所述目标城市和所述往 来城市的贸易关系; 基于所述贸易关系 、 所述往来城市和所述贸易数据, 构建第一子知识图谱; 获取所述往来城市对应的往来国家, 基于所述往来国家、 所述贸易关系和所述贸易数 据, 构建第二子知识图谱; 关联所述第一子知识图谱和所述第二子知识图谱, 得到所述第二知识图谱。 5.根据权利要求4所述的数据分析方法, 其特征在于, 所述基于所述贸易关系、 所述往 来城市和所述贸易数据, 构建第一子知识图谱的步骤 包括:权 利 要 求 书 1/2 页 2 CN 114549053 A 2基于所述贸易关系 、 所述往来城市和所述贸易数据构建三元组; 获取训练好的三元组评估模型, 根据 所述三元组评估模型对所述三元组进行置信度评 估, 得到所述 三元组的评估值; 确定所述评估值是否大于等于预设阈值, 在所述评估值大于等于所述预设阈值时, 确 定所述三元组验证通过, 基于验证通过的三元组构建得到所述第一知识图谱。 6.根据权利要求1所述的数据分析方法, 其特征在于, 在所述从所述依赖城市的所属国 家的公开策略中, 爬取 所述依赖城市的贸易影响数据的步骤之后还 包括: 获取所述贸易影响数据的爬取时刻和爬取来源; 将所述贸易影响数据、 所述爬取时刻和所述爬取来源关联存 储在预设的数据库表中。 7.根据权利要求1所述的数据分析方法, 其特征在于, 所述通过所述历史贸易往来数据 和所述历史影响数据训练线性回归 模型得到目标 预测模型的步骤 包括: 获取所述历史贸易往来数据中的不同产品类别的进口产品量和出口产品量, 将所述进 口产品量、 所述出口产品量和所述历史影响数据作为训练样本; 基于所述训练样本对线性回归 模型进行训练, 得到目标 预测模型。 8.一种数据分析装置, 其特 征在于, 包括: 构建模块, 用于从目标贸易网站获取目标城市的贸易数据、 产品品类信息以及历史贸 易往来数据, 根据所述贸易数据和所述产品品类信息构建第一知识图谱, 从所述第一知识 图谱中确定所述目标城市的往来城市信息, 基于所述贸易数据和所述往来城市信息构建第 二知识图谱; 确认模块, 用于根据 所述历史贸易往来数据和所述第 一知识图谱确定所述目标城市的 重点产品, 通过 所述第二知识图谱查找所述重点产品的依赖城市; 爬取模块, 用于从所述依赖城市的所属国家 的公开策略中, 爬取所述依赖城市的贸易 影响数据; 预测模块, 用于获取所述目标城市的历史影响数据和所述重点产品的相关产能利用 率, 通过所述历史贸易往来数据和所述历史影响数据训练线性回归模型得到目标预测模 型, 基于所述 目标预测模型对所述贸易影响数据和所述相关产能利用率进行计算, 得到所 述目标城市的地方产能利用率。 9.一种计算机设备, 包括存储器和处理器, 所述存储器中存储有计算机可读指令, 所述 处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的数据分析方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 可读指令, 所述计算机可读指 令被处理器执行时实现如权利要求 1至7中任一项 所述的数据 分析方法的步骤。权 利 要 求 书 2/2 页 3 CN 114549053 A 3
专利 数据分析方法、装置、计算机设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:58:40
上传分享
举报
下载
原文档
(692.7 KB)
分享
友情链接
GB-T 18916.55-2021 取水定额 第55部分:皮革.pdf
GB-T 26429-2022 设备工程监理规范.pdf
T-HSCA 001—2018 体育场馆钢结构检测与鉴定规程.pdf
20230129-中信建投-人工智能行业从CHAT_GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力.pdf
软件开发管理制度.pdf
DB52-T 1597-2021 计量检测元数据及交互规范 贵州省.pdf
GB-T 32608-2016 羽毛球拍及部件的物理参数和试验方法.pdf
GB-T 35278-2017 信息安全技术 移动终端安全保护技术要求.pdf
中国人工智能系列白皮书 大模型技术白皮书2023版.pdf
GB-T 42588-2023 系统与软件工程 功能规模测量 NESMA方法.pdf
GB-T 41570-2022 流程生产能效计量技术规范.pdf
GB-T 2812-2006 安全帽测试方法.pdf
T-ZMDS 10011—2021 近红外脑组织血氧监测仪参数测试方法.pdf
GB-T 20486-2017 江河流域面雨量等级.pdf
GB/T 1.2-2020 标准化工作导则 第2部分 以ISO IEC标准化文件为基础的标准化文件起草规则.pdf
GB-T 37451-2019 海洋平台起重机试验规程.pdf
GB-T 2007.4-2008 散装矿产品取样、制样通则 偏差、精密度校核试验方法.pdf
DB51-T 2868-2022 机关事务应急保障规范 四川省.pdf
德勤中国 数字化时代下的网络安全战略框架系列之三.pdf
工业控制系统信息安全防护指南.pdf
交流群
-->
1
/
3
21
评价文档
赞助2元 点击下载(692.7 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。