说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210963873.7 (22)申请日 2022.08.11 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 甘露 张建兵 张新运 徐增辉  陈亮辉 孙珂  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 孟洋 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/22(2019.01) G06F 16/28(2019.01) (54)发明名称 基于人工智能的数据查询方法、 装置和存储 介质 (57)摘要 本公开提供了一种基于人工智能的数据查 询方法、 装置和存储介质, 涉及人工智 能技术领 域, 具体涉及自然语言处理、 大数据、 知识图谱、 智能搜索技术, 可应用在智慧城市、 城市治理等 场景下。 具体实现方案为: 在获取到查询文本后, 对查询文本进行查询理解, 以得到查询文本的查 询理解结果和查询文本中未被理解的文本片段, 并从基于关系数据库中文本内容的语义特征向 量所预先建立的语义特征向量库中, 对 未被理解 的文本片段进行语义索引, 以得到该文本片段的 语义理解结果, 并根据查询理解结果和语义理解 结果, 在关系数据数据库中进行数据查询, 以得 到查询文本的查询结果。 由此, 提高了查询准确 率。 权利要求书4页 说明书14页 附图8页 CN 115328956 A 2022.11.11 CN 115328956 A 1.一种基于人工智能的数据查询方法, 包括: 获取查询文本; 对所述查询文本进行查询理解, 以得到所述查询文本的查询理解结果和所述查询文本 中未被理解的文本片段; 基于预先建立的语义特征向量库, 确定出与所述文本片段相匹配的目标语义特征向 量, 其中, 所述语义特征向量库是基于关系 数据库中文本内容的语义特征向量而预先建立 的; 从所述语义特征向量库中获取与 所述目标语义特征向量对应的目标文本内容, 并基于 所述目标文本内容确定所述文本片段的语义理解结果; 根据所述查询理解结果和所述语义理解结果, 在所述关系数据数据库中进行数据查 询, 以得到所述 查询文本的查询结果。 2.根据权利要求1所述的方法, 其中, 所述基于预先建立的语义特征向量库, 确定出与 所述文本片段相匹配的目标语义特 征向量, 包括: 采用滑动窗口对所述文本片段进行划分, 以得到多个文本块; 针对每个文本块, 在所述语义特征向量库中存在与所述文本块相匹配的语义特征向量 的情况下, 将所述文本块作为目标文本块; 根据所述目标文本块各自匹配到的语义特征向量, 确定出与 所述文本片段相匹配的目 标语义特 征向量。 3.根据权利要求2所述的方法, 其中, 所述针对每个文本块, 在所述语义特征向量库中 存在与所述文本块相匹配的语义特 征向量的情况 下, 将所述文本块作为目标文本块, 包括: 针对每个文本块, 确定所述文本块的语义特 征向量; 将所述文本块的语义特征向量与所述语义特征向量库中的多个语义特征向量进行匹 配; 根据匹配结果, 确定所述语义特征向量库中存在与所述文本块相匹配的语义特征向 量; 将所述文本块作为目标文本块。 4.根据权利要求3所述的方法, 其中, 所述确定所述文本块的语义特 征向量, 包括: 将所述文本块输入到预先训练好的语义模型, 以通过所述语义模型得到所述文本块的 语义特征向量。 5.根据权利要求3所述的方法, 其中, 所述匹配结果包括: 所述文本块的语义特征向量 和所述语义特征向量库中各个语义特征向量之间的匹配度, 所述根据匹配结果, 确定所述 语义特征向量库中存在与所述文本块相匹配的语义特 征向量, 包括: 针对各个匹配度, 将所述匹配度与预设匹配度阈值进行 大小比较, 以得到比较结果; 在所述比较结果为所述匹配度 大于预设匹配度阈值的情况下, 确定所述语义特征向量 库中存在与所述文本块相匹配的语义特 征向量。 6.根据权利要求1所述的方法, 其中, 在所述根据 所述查询理解结果和所述语义理解结 果, 在所述关系数据数据库中进 行数据查询, 以得到所述查询文本的查询结果之前, 所述方 法还包括: 确定所述语义理解结果与所述 查询理解结果 不存在冲突。权 利 要 求 书 1/4 页 2 CN 115328956 A 27.根据权利要求6所述的方法, 所述确定所述语义理解结果与所述查询理解结果不存 在冲突, 包括: 确定所述语义理解结果和所述 查询理解结果中的共有属性 值; 获取所述语义理解结果中与所述共有属性 值所对应的第一属性名; 获取所述查询理解结果中所述共有属性 值所对应的第二属性名; 在所述第一属性名和所述第 二属性名相同的情况下, 确定所述语义理解结果与所述查 询理解结果 不存在冲突。 8.根据权利要求6所述的方法, 所述确定所述语义理解结果与所述查询理解结果不存 在冲突, 包括: 确定所述语义理解结果和所述 查询理解结果中的共有属性 值; 在所述语义理解结果中不存在与 所述共有属性值对应的属性名, 并且所述查询理解结 果中不存在与所述共有属性值所对应的属性名的情况下, 确定所述语义理解结果与所述查 询理解结果 不存在冲突。 9.根据权利要求1所述的方法, 在所述根据 所述查询理解结果和所述语义理解结果, 在 所述关系 数据数据库中进行数据查询, 以得到所述查询文本的查询结果之前, 所述方法还 包括: 在所述文本片段为多个的情况下, 从多个所述文本片段所对应的语义理解结果中, 确 定出与所述 查询理解结果 不存在冲突的目标语义理解结果; 所述根据 所述查询理解结果和所述语义理解结果, 在所述关系数据数据库中进行数据 查询, 以得到所述 查询文本的查询结果, 包括: 根据所述查询理解结果和所述目标语义理解结果, 在所述关系数据数据库中进行数据 查询, 以得到所述 查询文本的查询结果。 10.根据权利要求1 ‑8任一项所述的方法, 所述根据 所述查询理解结果和所述语义理解 结果, 在所述关系数据数据库中进行 数据查询, 以得到所述 查询文本的查询结果, 包括: 对所述查询理解结果和所述语义理解结果进行 数据合并, 以得到数据合并结果; 获取所述数据合并结果中不存在属性名的目标属性 值; 根据所述目标属性值生成第 一查询条件, 并基于所述数据合并结果中除了所述目标属 性之外的其 他内容生成第二 查询条件; 根据所述第 一查询条件在所述关系数据库中的所有属性字段中进行数据查询, 并根据 所述第二查询条件在所述关系数据库中的指定属性字段中进 行数据查询, 以得到与所述第 一查询条件和所述第二查询条件均匹配的查询结果, 其中, 所述指定属 性字段是基于所述 第二查询条件确定出的; 将所得到的查询结果作为所述 查询文本的查询结果。 11.一种基于人工智能的数据查询装置, 包括: 第一获取模块, 用于获取查询文本; 查询理解模块, 用于对所述查询文本进行查询理解, 以得到所述查询文本的查询理解 结果和所述 查询文本中未被理解的文本片段; 第一确定模块, 用于基于预先建立的语义特征向量库, 确定出与所述文本片段相匹配 的目标语义特征向量, 其中, 所述语义特征向量库是基于关系 数据库中文本内容的语义特权 利 要 求 书 2/4 页 3 CN 115328956 A 3

.PDF文档 专利 基于人工智能的数据查询方法、装置和存储介质

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于人工智能的数据查询方法、装置和存储介质 第 1 页 专利 基于人工智能的数据查询方法、装置和存储介质 第 2 页 专利 基于人工智能的数据查询方法、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:16:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。