(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210113219.7
(22)申请日 2022.01.29
(65)同一申请的已公布的文献号
申请公布号 CN 114168756 A
(43)申请公布日 2022.03.11
(73)专利权人 浙江口碑网络技 术有限公司
地址 310012 浙江省杭州市西湖区西斗门
路3号天堂软件园A幢1 1楼G座
(72)发明人 许林隆
(74)专利代理 机构 北京清源汇知识产权代理事
务所(特殊普通 合伙) 11644
专利代理师 汪洋 冯德魁
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/953(2019.01)(56)对比文件
CN 110390054 A,2019.10.2 9
CN 111061859 A,2020.04.24
CN 113742446 A,2021.12.0 3
审查员 郭明亮
(54)发明名称
搜索意图的查询理解方法和装置, 存储介质
和电子设备
(57)摘要
本申请公开一种搜索意图的查询理解方法
和装置, 存储介质和电子设备, 所述方法包括: 对
待搜索信息进行实体识别, 确定所述待搜索信息
中的实体类型信息; 根据所述实体类型信息中核
心实体和属性实体, 与构建的知识图谱建立的关
联关系, 获取所述核心实体的核心信息和所述属
性实体的属性信息; 根据所述实体类型信息, 确
定所述待搜索信息的召回域; 根据所述核心信息
和所述属性信息, 确定所述待搜索信息的召回内
容; 根据所述召回域和所述召回内容生成所述待
搜索信息的召回条件, 从而能够提高召回效率以
及召回的准确度。
权利要求书3页 说明书12页 附图2页
CN 114168756 B
2022.05.13
CN 114168756 B
1.一种搜索意图的查询理解方法, 其特 征在于, 包括:
对待搜索信息进行实体识别, 确定所述待搜索信息中的实体 类型信息;
根据所述实体类型信息中核心实体和属性实体, 与构建的知识图谱建立的关联关系,
获取所述核心实体的核心信息和所述属性实体的属性信息;
根据所述实体类型信息, 确定所述待搜索信息的召回域; 根据所述核心信息和所述属
性信息, 确定所述待搜索信息的召回内容;
所述根据所述核心信息和 属性信息, 确定所述待搜索信息的召回内容, 包括:
根据所述知识图谱, 将所述核心信息和所述属性信息作为整体进行字段粒度解析, 获
取用于描述所述核心信息和所述属性信息的单 元字段;
根据所述单 元字段, 确定所述待搜索信息中的关键 字段召回内容;
根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件;
所述根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件, 包括:
根据所述召回域和所述关键字段召回内容, 生成所述待搜索信 息的关键字段类型召回
条件。
2.根据权利要求1所述的搜索意图的查询理解方法, 其特征在于, 所述对待搜索信 息进
行实体识别, 确定所述待搜索信息中的实体 类型信息, 包括:
确定所述对待搜索信息进行实体识别的实体 类型之间是否存在嵌套关系;
若是, 则将存在所述嵌套关系的实体类型作为同一类型实体, 确定为所述实体类型信
息。
3.根据权利要求1所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述实体类
型信息中核心实体和/或属性 实体, 与构建的知识图谱建立的关联关系, 获取所述核心实体
的核心信息和/或所述属性实体的属性信息, 包括:
建立所述核心实体和 属性实体, 与所述知识图谱 对应的实体 类型之间的关联关系;
根据所述关联关系, 获取 所述核心实体的核心信息和所述属性实体的属性信息 。
4.根据权利要求3所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述召回域
和所述召回内容 生成所述待搜索信息的召回条件, 包括:
将所述召回域和所述召回内容 生成所述待搜索信息的知识类型召回条件。
5.根据权利要求1所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述单元字
段, 确定所述待搜索信息中的关键 字段召回内容, 包括:
根据所述知识图谱, 获取 所述单元字段的改写字段;
将所述改写字段确定为所述待搜索信息中关键 字段召回内容。
6.根据权利要求1所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述单元字
段, 确定所述待搜索信息中的关键 字段召回内容, 包括:
根据所述单 元字段, 确定所述单 元字段的权 重和/或紧密度;
根据所述权 重和/或紧密度, 确定所述待搜索信息的关键 字段召回内容。
7.根据权利要求6所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述权重
和/或紧密度, 确定所述待搜索信息的关键 字段召回内容, 包括:
根据所述单元字段的权重和/或紧密度, 对所述单元字段进行丢字段和/或改写, 获取
目标单元字段;权 利 要 求 书 1/3 页
2
CN 114168756 B
2将所述目标 单元字段确定为所述关键 字段召回内容;
所述根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件, 包括:
根据所述召回域和所述目标单元字段, 生成所述待搜索信息的关键字段类型召回条
件。
8.根据权利要求1所述搜索意图的查询理解方法, 其特 征在于, 还 包括:
当所述实体类型信 息包括主题实体、 场景实体和类目实体中的至少一种实体类型信 息
时, 对所述实体 类型信息进行 标签化处 理;
根据所述标签化处 理, 预测与所述至少一种实体对应的标签信息 。
9.根据权利要求8所述的搜索意图的查询理解方法, 其特征在于, 所述根据所述实体类
型信息, 确定所述待搜索信息的召回域; 根据所述属性信息, 确定所述待搜索信息的召回内
容, 包括:
将所述实体类型信 息中的所述主题实体确定为主题召回域; 将所述主题实体的主题标
签确定为主题标签召回内容;
所述根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件, 包括:
根据所述主题召回域和所述主题标签召回内容生成所述待搜索信息的主题标签类型
召回条件。
10.根据权利要求8 或9所述的搜索意图的查询理解方法, 其特征在于, 所述根据 所述实
体类型信息, 确定所述待搜索信息的召回域; 根据所述属性信息, 确定所述待搜索信息的召
回内容, 包括:
将所述实体类型信 息中的所述场景实体确定为场景召回域; 将所述场景实体的场景标
签确定为场景 标签召回内容;
所述根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件, 包括:
根据所述场景召回域和所述场景标签召回内容生成所述待搜索信息的场景标签类型
召回条件。
11.根据权利要求10所述的搜索意图的查询理解方法, 其特征在于, 所述根据 所述实体
类型信息, 确定所述待搜索信息的召回域; 根据所述核心信息和所述属性信息, 确定所述待
搜索信息的召回内容, 包括:
将所述实体类型信 息中的所述类目实体确定为类目召回域; 将所述类目实体的类目标
签确定为类目标签召回内容;
所述根据所述召回域和所述召回内容 生成所述待搜索信息的召回条件, 包括:
根据所述类目召回域和所述类目标签召回内容生成所述待搜索信息的类目标签类型
召回条件。
12.根据权利要求1所述搜索意图的查询理解方法, 其特 征在于, 还 包括:
确定所述待搜索信息的行业类型;
所述对待搜索信息进行实体识别, 确定所述待搜索信息中的实体 类型信息, 包括:
在所述行业类型的范围内对所述待搜索信 息进行实体识别, 确定所述待搜索信 息中的
所述实体 类型信息 。
13.根据权利要求1所述搜索意图的查询理解方法, 其特 征在于, 还 包括:
当所述实体类型信 息为地址类实体信 息时, 将所述地址类实体信 息中地址字段确定为权 利 要 求 书 2/3 页
3
CN 114168756 B
3
专利 搜索意图的查询理解方法和装置,存储介质和电子设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:58:35上传分享