说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210821734.0 (22)申请日 2022.07.12 (71)申请人 广州市优 普计算机有限公司 地址 510000 广东省广州市天河区天河北 路233号3203室 (72)发明人 袁进波 (74)专利代理 机构 广州凯东知识产权代理有限 公司 44259 专利代理师 李俊康 (51)Int.Cl. G06F 16/2455(2019.01) (54)发明名称 一种实时富 集流式数据处 理技术 (57)摘要 本发明公开了一种实时富集流式数据处理 技术, 包括整体架构, 整体架构 包括反查流程, 反 查流程包括以下步骤: 用户访 问数据通过kafka 进入到EventTopic中, 通过Yan ‑资源管理和 Spark/storm对采集的信息进行预处理, 并对各 类型数据进行标识, 判断是否为网络安全数据, 如果是登录事件, 将事件进入到IP反查逻辑配置 判断是否打开; 如果IP反查逻辑配置判断打开, 将进入到根据ip和站点id, 到redis去查看是否 存在富集信息判断; 如果IP反查逻辑配置判断没 有打开, 直接进入到ES内, 然后结束; 如果存在富 集信息, 信息将通过IP反查富集处理, 并延长key 的过期时间, 之后进入到ES内, 然后结束。 本发明 Kafka数据积压问题不再发生, 流处理程序处理 延时从小时级下降到秒级, 降低页面响应时间。 权利要求书2页 说明书4页 附图2页 CN 115185994 A 2022.10.14 CN 115185994 A 1.一种实时富集流式数据处理技术, 包括整体架构, 其特征在于: 所述整体架构包括反 查流程, 所述反查 流程包括以下步骤: 数据流向: 用户访问数据通过kafka进入到 Event Topic中; 信息处理: 通过Yan ‑资源管理和Spark/storm对采集的信息进行预处理, 并对各类型数 据进行标识, 通过系统判断是否为网络安全数据: 1.1)、 如果是网络安全数据, 将事 件进入到IP反查逻辑配置判断是否打开; 1.1.1)、 如果IP反查逻辑配置判断打开, 将进入到根据ip和站点id, 到redis去查看是 否存在富 集信息判断; 1.1.2)、 如果 IP反查逻辑配置判断没有打开, 直接进入到 ES内, 然后结束; 1.1.1.1)、 如果存在富集信息, 信息将通过IP反查富集处理, 并延长key的过期时间, 之 后进入到 ES内, 然后结束; 1.1.1.2)、 如果不存在富集信息, 信息将通过PI查询富集信息, 进行富集处理, 并将富 集信息写入redis缓存, 同时富集处理的登录事件数据入RS, 之后进入到ES内, 同时数据进 入到Redis内; 1.2)、 如果不是网络安全数据, 通过其他事件富集、 鲁棒性处理, 之后进入到ES内, 然后 结束。 2.根据权利要求1所述的一种实时富集流式数据处理技术, 其特征在于: 所述反查流程 内根据ip和站点id, 到redis去查看是否存在富集信息判断系统与Redis相互连通, MongoDB 通过缓冲热点 ip信息进入到redis内。 3.根据权利要求1所述的一种实时富集流式数据处理技术, 其特征在于: 所述整体框架 包括API、 DM、 MongoDB、 Yam ‑逻辑处理、 Redi s、 ES、 Spsark集群、 Alarms、 Yarn ‑逻辑处理、 数据 复制、 Hive、 Spark/storm、 Spsark/storm集群、 Event、 Lo gstash和Kafk a等, 所述Kafk a包括 内循环事 件、 通信对、 可疑文件、 Event、 人工智能/其 他和日志。 4.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述网络安全 数据包括但不限于内循环事 件、 通信对数据等。 5.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述Yarn ‑逻 辑处理之后进入到Alarms后通过Spsar k集群进入到Yam ‑逻辑处理, 然后处理后警告数据进 入到ES内, 如果存在资产发现等信息将进入到DM内, 之后进入到API内。 6.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述MongoDB 数据进入到API内, 同时通过警告规则和首页指标进入到Redis内。 7.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述DM内的数 据通过配置信息、 资产属性进入到Redis内, 进入到Redis内的数据进入到Yam ‑逻辑处理, 同 时通过富 集、 鲁棒性进入到 Yarn‑逻辑处理, 所述Redis内的数据进入到API内。 8.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述ES内的数 据进入到API内, 所述ES内的数据通过 数据复制进入到 Hive内处 理。 9.根据权利要求3所述的一种实时富集流式数据处理技术, 其特征在于: 所述ES内的数 据通过文件、 报文、 通信对送检进入到Spark/storm内, 所述Spark/storm内的数据通过送检 状态、 报告结果更新进入到 ES内。 10.根据权利要求1所述的一种实时富集流式数据处理技术, 其特征在于: 所述资产库权 利 要 求 书 1/2 页 2 CN 115185994 A 2信息包括公司、 单位、 站点、 安全分区、 设备名称, 所述内网ip库信息包括ip类型、 公司、 单 位、 站点、 安全分区、 设备名称、 经度和维度。权 利 要 求 书 2/2 页 3 CN 115185994 A 3
专利 一种实时富集流式数据处理技术
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 17:15:04
上传分享
举报
下载
原文档
(456.3 KB)
分享
友情链接
南京市民用建筑节能条例.pdf
GB-T 42581-2023 信息技术服务 数据中心业务连续性等级评价准则.pdf
GB-T 31288-2014 铁尾矿砂.pdf
华商国际 数字化建筑设计研究中心-冷链物流园区规划、建设及运营的数字化发展趋势.pdf
TIA-942 数据中心电信基础设施标准 中文版.pdf
T-CI 017—2023 离子型稀土矿区土壤生态功能恢复技术指南.pdf
GB-T 36681-2018 展览场馆服务管理规范.pdf
T-GDCKCJH 058—2022 汽车域控制器(DCU)自动化测试线通用要求.pdf
GB/T 39468-2020 陆地定量遥感产品真实性检验通用方法.pdf
GB-T 14846-2014 铝及铝合金挤压型材尺寸偏差.pdf
GB-T 971-2008 滚丝轮.pdf
T-SCIIA 1—2020 数字化转型 新型基础设施建设产品与服务认定规范.pdf
OWASP 软件保障成熟度模型 SAMM 2.0中文版.pdf
GA-T 1390.5-2017 信息安全技术 网络安全等级保护基本要求 第5部门 工业控制系统安全扩展要求.pdf
深圳经济特区科技创新条例.pdf
DB13-T 5022-2019 冶金企业气体防护站安全管理规范 河北省.pdf
GB-T 24421.3-2023 服务业组织标准化工作指南 第3部分:标准编制.pdf
DB15-T 2675—2022 盐碱地改良水盐动态监测与评价导则 内蒙古自治区.pdf
GB-T 43572-2023 区块链和分布式记账技术 术语.pdf
YD-T 2400-2022 宽带速率测试方法 固定宽带接入.pdf
交流群
-->
1
/
3
9
评价文档
赞助2元 点击下载(456.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。