说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210873137.2 (22)申请日 2022.07.22 (71)申请人 国网安徽省电力有限公司铜陵供电 公司 地址 244000 安徽省铜陵市长江中路91号 申请人 上海京德电气有限公司 (72)发明人 黄道友 康健 方登洲 王坤  刘锋 罗沙 吕孝平 刘芹 朱宁  吴小林 韩少卫 彭涛 任寅平  夏宗杰 苏建民 肖向虎 刘兴  倪超 吴征 赵尚娜  (74)专利代理 机构 上海政济知识产权代理事务 所(普通合伙) 31479 专利代理师 罗子芳(51)Int.Cl. G06F 16/9532(2019.01) G06F 40/289(2020.01) G06F 16/2455(2019.01) G06F 16/215(2019.01) G06F 16/27(2019.01) G06F 16/22(2019.01) G06F 16/28(2019.01) G06F 16/9538(2019.01) (54)发明名称 数字档案分词检索系统 (57)摘要 本发明提供一种数字档案分词检索系统, 其 特征在于, 包括: 数据导入单元: 利用Logstash工 具将MySQL数据库中的标准化数据导入 ElasticSearch ; 数据索 引单元 : 通过 ElasticSearch对标准化数据建立索引, 并将索 引信息存放到索引库; 数据检索单元: 获取用户 发送的检索请求, SpringBoot服务器通过 JavaAPI接口调用ElasticSear ch实现检索, 结果 通过VUE框架在用户端进行展示。 本发明检索系 统的实现了分词查询、 档案数据毫秒级查询, 能 较好地满足不断增长的数字档案分词检索 的需 求, 提高检索效率和检索质量。 权利要求书2页 说明书4页 附图3页 CN 115146144 A 2022.10.04 CN 115146144 A 1.一种数字档案分词检索系统, 其特 征在于, 包括: 数据导入单元, 利用Logstash工具将MySQL数据库中的标准化数据导入 ElasticSearc h; 数据索引单元, 通过El asticSearch对标准化数据建立索引, 并将索引信息存放到索引 库; 数据检索单元, 获取用户发送的检索请求, SpringBoot服务器通过JavaAPI接口调用 ElasticSearc h实现检索, 结果 通过VUE框架在用户端 进行展示。 2.如权利要求1所述的数字档案分词检索系统, 其特 征在于, 还 包括: 数据缓存单 元, 用于将用户信息、 用户热搜资源、 平台热搜资源 存放至缓存数据库。 3.如权利要求2所述的数字档案分词检索系统, 其特 征在于: 其中, 所述缓存数据库为Redis数据库。 4.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述MySQL数据库中的标准化数据是数字档案数据依次经过汇聚、 清洗、 筛选、 标 准化之后得到的数据。 5.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述数据索引单 元按照如下流 程运行: 步骤A1, 从所述MySQ L数据库获取 所述标准 化数据; 步骤A2, 通过分词器将步骤A1 获取的数据解析生成若干field对象; 步骤A3, 将field对象构建为Document对象; 步骤A4, 利用I ndexWrite工具建立索引并将得到索引数据放入索引库。 6.如权利要求5所述的数字档案分词检索系统, 其特 征在于: 其中, 所述分词器包括IK ‑Analyzer中文分词器, 该IK ‑Analyzer中文分词器通过如下 步骤配置 到ElasticSearc h中: 步骤B1, 下 载IK‑Analyzer源码, 接着执 行命令mvncleanpacka ge, 打包得到jar包文件; 步骤B2, 将IK ‑Analyzer 依赖包复制到elasticsear ‑ch/plugin/analysis ‑ik目录下; 步骤B3, 在ElasticSearc h的config目录下对IK ‑Analyzer进行配置 。 7.如权利要求1所述的数字档案分词检索系统, 其特 征在于: 其中, 所述数据检索单 元运行查询关键词流 程以及搜索联想流 程, 所述查询关键词流 程具体如下: 步骤C1, 获取用户通过用户端发送的查询关键词请求, 通过分词器对关键字进行分词, 生成若干个field对象; 步骤C2, 通过MultiFiledQueryParse工具生成Query对象, 然后在索引库的不同索引列 上进行多个关键词的搜索; 步骤C3, 创建IndexS earcher对象实例, 对ElasticS earch的集群各节点进行索引检索, 将符合条件的查询结果合并, 然后经过相关性排序之后得到结果集, 即将结果集返回给用 户端; 所述搜索联想流 程具体如下: 步骤D1, 实时获取用户通过用户端在检索框中输入 的内容, 利用Ajax请求数据接口异 步地向Spri ngBoot服务器发送搜索联想的请求;权 利 要 求 书 1/2 页 2 CN 115146144 A 2步骤D2, SpringBoot服务器将请求到的数据在ElasticSearch中进行前缀匹配, 利用 ElasticSearch搜索对应前缀的索引, 然后通过ElasticSearch的bool  quer工具将多个前 缀查询结果组合 起来, 最终所有前缀 查询结果返回到用户端; 步骤D3, 用户端利用Ajax组件库中的jQuery完成提 示词展示。权 利 要 求 书 2/2 页 3 CN 115146144 A 3

.PDF文档 专利 数字档案分词检索系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数字档案分词检索系统 第 1 页 专利 数字档案分词检索系统 第 2 页 专利 数字档案分词检索系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:17:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。