说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210873137.2 (22)申请日 2022.07.22 (71)申请人 国网安徽省电力有限公司铜陵供电 公司 地址 244000 安徽省铜陵市长江中路91号 申请人 上海京德电气有限公司 (72)发明人 黄道友 康健 方登洲 王坤 刘锋 罗沙 吕孝平 刘芹 朱宁 吴小林 韩少卫 彭涛 任寅平 夏宗杰 苏建民 肖向虎 刘兴 倪超 吴征 赵尚娜 (74)专利代理 机构 上海政济知识产权代理事务 所(普通合伙) 31479 专利代理师 罗子芳(51)Int.Cl. G06F 16/9532(2019.01) G06F 40/289(2020.01) G06F 16/2455(2019.01) G06F 16/215(2019.01) G06F 16/27(2019.01) G06F 16/22(2019.01) G06F 16/28(2019.01) G06F 16/9538(2019.01) (54)发明名称 数字档案分词检索系统 (57)摘要 本发明提供一种数字档案分词检索系统, 其 特征在于, 包括: 数据导入单元: 利用Logstash工 具将MySQL数据库中的标准化数据导入 ElasticSearch ; 数据索 引单元 : 通过 ElasticSearch对标准化数据建立索引, 并将索 引信息存放到索引库; 数据检索单元: 获取用户 发送的检索请求, SpringBoot服务器通过 JavaAPI接口调用ElasticSear ch实现检索, 结果 通过VUE框架在用户端进行展示。 本发明检索系 统的实现了分词查询、 档案数据毫秒级查询, 能 较好地满足不断增长的数字档案分词检索 的需 求, 提高检索效率和检索质量。 权利要求书2页 说明书4页 附图3页 CN 115146144 A 2022.10.04 CN 115146144 A 1.一种数字档案分词检索系统, 其特 征在于, 包括: 数据导入单元, 利用Logstash工具将MySQL数据库中的标准化数据导入 ElasticSearc h; 数据索引单元, 通过El asticSearch对标准化数据建立索引, 并将索引信息存放到索引 库; 数据检索单元, 获取用户发送的检索请求, SpringBoot服务器通过JavaAPI接口调用 ElasticSearc h实现检索, 结果 通过VUE框架在用户端 进行展示。 2.如权利要求1所述的数字档案分词检索系统, 其特 征在于, 还 包括: 数据缓存单 元, 用于将用户信息、 用户热搜资源、 平台热搜资源 存放至缓存数据库。 3.如权利要求2所述的数字档案分词检索系统, 其特 征在于: 其中, 所述缓存数据库为Redis数据库。 4.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述MySQL数据库中的标准化数据是数字档案数据依次经过汇聚、 清洗、 筛选、 标 准化之后得到的数据。 5.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述数据索引单 元按照如下流 程运行: 步骤A1, 从所述MySQ L数据库获取 所述标准 化数据; 步骤A2, 通过分词器将步骤A1 获取的数据解析生成若干field对象; 步骤A3, 将field对象构建为Document对象; 步骤A4, 利用I ndexWrite工具建立索引并将得到索引数据放入索引库。 6.如权利要求5所述的数字档案分词检索系统, 其特 征在于: 其中, 所述分词器包括IK ‑Analyzer中文分词器, 该IK ‑Analyzer中文分词器通过如下 步骤配置 到ElasticSearc h中: 步骤B1, 下 载IK‑Analyzer源码, 接着执 行命令mvncleanpacka ge, 打包得到jar包文件; 步骤B2, 将IK ‑Analyzer 依赖包复制到elasticsear ‑ch/plugin/analysis ‑ik目录下; 步骤B3, 在ElasticSearc h的config目录下对IK ‑Analyzer进行配置 。 7.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述数据检索单 元运行查询关键词流 程以及搜索联想流 程, 所述查询关键词流 程具体如下: 步骤C1, 获取用户通过用户端发送的查询关键词请求, 通过分词器对关键字进行分词, 生成若干个field对象; 步骤C2, 通过MultiFiledQueryParse工具生成Query对象, 然后在索引库的不同索引列 上进行多个关键词的搜索; 步骤C3, 创建IndexS earcher对象实例, 对ElasticS earch的集群各节点进行索引检索, 将符合条件的查询结果合并, 然后经过相关性排序之后得到结果集, 即将结果集返回给用 户端; 所述搜索联想流 程具体如下: 步骤D1, 实时获取用户通过用户端在检索框中输入 的内容, 利用Ajax请求数据接口异 步地向Spri ngBoot服务器发送搜索联想的请求;权 利 要 求 书 1/2 页 2 CN 115146144 A 2步骤D2, SpringBoot服务器将请求到的数据在ElasticSearch中进行前缀匹配, 利用 ElasticSearch搜索对应前缀的索引, 然后通过ElasticSearch的bool quer工具将多个前 缀查询结果组合 起来, 最终所有前缀 查询结果返回到用户端; 步骤D3, 用户端利用Ajax组件库中的jQuery完成提 示词展示。权 利 要 求 书 2/2 页 3 CN 115146144 A 3
专利 数字档案分词检索系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 17:17:34
上传分享
举报
下载
原文档
(475.8 KB)
分享
友情链接
GB 12676-2014 商用车辆和挂车制动系统技术要求及试验方法.pdf
GB-T 41885-2022 浮空器分类和分级.pdf
GB-T 38558-2020 信息安全技术 办公设备安全测试方法.pdf
GB-T 21053-2023 信息安全技术 公钥基础设施 PKI系统安全技术要求.pdf
T-GHDQ 88.2—2022 车辆无线通信信息安全测试规范 第2部分:车载WLAN安全测试规范.pdf
DB31-T 1311-2021 上海市 数据去标识化共享指南 .pdf
GB-T 36412-2018 力标准机的检验与校准.pdf
GM-T 0031-2014 安全电子签章密码技术规范.pdf
DB42-T 1951-2023 桥梁结构健康信息化监测技术规范 湖北省.pdf
GB 30510-2018 重型商用车辆燃料消耗量限值.pdf
GM-T 0014-2023 数字证书认证系统密码协议规范.pdf
GB-T 18442.7-2017 固定式真空绝热深冷压力容器 第7部分:内容器应变强化技术规定.pdf
DB63-T 2226-2023 绿色算力基础设施智能运维规范 青海省.pdf
GB-T 22081-2016 信息技术 安全技术 信息安全控制实践指南.pdf
GB-T 34690.6-2017 印刷技术 胶印数字化过程控制 第6部分:数字硬打样.pdf
DB34-T 4686-2024 挥发性有机物走航监测技术规范 安徽省.pdf
T-CAB 0228—2022 组织节能降碳绩效评价通则.pdf
GB/T 40581-2021 电力系统安全稳定计算规范.pdf
GB-T 50087-2013 工业企业噪声控制设计规范.pdf
SF-T 0008-2017 全国司法行政信息化总体技术规范.pdf
交流群
-->
1
/
3
10
评价文档
赞助2元 点击下载(475.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。