说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210327382.3 (22)申请日 2022.03.30 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 李泽诚 马镇新  (74)专利代理 机构 北京展翼知识产权代理事务 所(特殊普通 合伙) 11452 专利代理师 张阳 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/335(2019.01) G06F 16/36(2019.01) (54)发明名称 搜索方法和搜索系统 (57)摘要 公开了一种搜索方法和搜索系统。 所述方法 包括: 获取用户输入的搜索词和筛选项; 基于每 个筛选项与所述搜索词的相关性, 求取各个筛选 项的权重分; 对 经权重分过滤的筛选项和所述搜 索词进行重述, 以生成优化的搜索词。 本发明公 开了一种初始搜索词与补充的筛选项融合产生 优化搜索词的流程化方案。 该方案通过基于QPP 的词权重计算和搜索词重述, 生成优化的搜索 词, 由此提升针对用户输入内容的召回率和召回 准确性, 尤其适用于专业性较强的医疗垂直搜索 领域。 本方案不仅可 以应用于交互式搜索场景, 还可适用于类似需要对用户输入的初始搜索词 进行补充的搜索场景。 权利要求书2页 说明书12页 附图5页 CN 114756645 A 2022.07.15 CN 114756645 A 1.一种搜索方法, 包括: 获取用户输入的搜索词和筛 选项; 基于每个筛选项与所述搜索词的相关性, 求取 各个筛选项的权 重分; 对经权重分过滤的筛选项和所述搜索词进行重述, 以生成优化的搜索词。 2.如权利要求1所述的搜索方法, 其中, 获取用户输入信息包括: 获取所述用户输入的所述搜索词; 基于所述搜索词, 显示针对所述搜索词的补充 描述选项; 以及 获取所述用户从所述补充 描述选项中确定的筛 选项。 3.如权利要求1所述的搜索方法, 还 包括: 对所述筛 选项进行同义词处 理, 其中, 基于每个筛选项与所述搜索词的相关性, 求取 各个筛选项的权 重分包括: 基于每个经同义词处 理的筛选项与所述搜索词的相关性, 求取 各个筛选项的权 重分。 4.如权利要求1所述的搜索方法, 其中, 对所述筛 选项进行同义词处 理包括: 给出所述筛选项的筛 选项同义词, 并且其中: 同时使用所述筛选项和筛选项 同义词两者来求取所述筛选项的权重分, 和/或同时使 用所述筛选项和筛选项同义词两者来进行重述, 并且从两者中选取被判定为更优的词来生 成所述优化的搜索词。 5.如权利要求1所述的搜索方法, 其中, 对所述筛 选项进行同义词处 理包括: 从筛选项同义词库中找出命中的筛选项同义词对, 并给出所述筛选项的筛选项同义 词, 其中, 基于在前用户查询和点击历史构建所述筛 选项同义词库。 6.如权利要求1所述的搜索方法, 其中, 基于每个筛选项与所述搜索词的相关性, 求取 各个筛选项的权 重分包括: 深度学习 模型预先从搜索词与筛选项的搜索结果中学习筛选项与搜索词的相关性, 并 用于求取当前搜索词中各个筛 选项的权 重分。 7.如权利要求6所述的搜索方法, 其中, 所述深度 学习模型是上下文感知动态词权重模 型, 并且基于每 个筛选项与所述搜索词的相关性, 求取 各个筛选项的权 重分包括: 将所述搜索词和各个筛 选项送入所述上 下文感知动态词权 重模型; 以及 基于所述上 下文感知动态词权 重模型的预测结果 求取每个筛选项的权 重分, 其中, 基于搜索词和筛选项在所述搜索结果中的相关性构造用于训练所述上下文感知 动态词权 重模型的词权 重标签。 8.如权利要求7所述的搜索方法, 其中, 基于搜索词和筛选项在所述搜索结果中的相关 性构造训练所述上 下文感知动态词权 重模型的词权 重标签包括: 使用搜索词和单个筛 选项发起搜索并获取 前N个返回结果, 其中N是 大于1的整数; 求取所述搜索词在所述前N个返回结果中的搜索词命中分; 求取所述单个筛 选项在所述前N个返回结果中的筛 选项命中分; 求取所述搜索词和所述前N个返回结果的相关 分; 以及 根据所述搜索词命中分、 筛 选项命中分和所述相关 分构造所述词权 重标签。 9.如权利要求6所述的搜索方法, 还 包括: 将生成的所述优化的搜索词送入搜索引擎以向用户提供优化的搜索结果,权 利 要 求 书 1/2 页 2 CN 114756645 A 2其中, 所述搜索引擎用于提供所述深度学习 模型训练所需的搜索词和筛选项的搜索结 果。 10.如权利要求1所述的搜索方法, 其中, 对经权重分过滤的筛选项和所述搜索词进行 重述, 以生成优化的搜索词包括: 对经权重分过滤的筛选项和所述搜索词进行组合 排序; 筛选掉不符合预定规则的排序; 将经筛选的组合 排序送入排序语言模型; 以及 选择排序语言模型分最高的排序作为所述优化的搜索词。 11.如权利要求1所述的搜索方法, 其中, 所述搜索方法用于 医疗垂直搜索, 所述用户输 入的搜索词包括症状和/或病名内容, 所述筛 选项包括对症状的补充 描述。 12.一种搜索系统, 包括: 医疗垂搜判定单元, 用于获取并识别用户输入的搜索词中的症状和/或病名内容作为 关键短语; 筛选项获取单元, 用于基于所述关键短语提供对症状的多个补充描述并获取用户选择 的补充描述作为筛 选项; 优化搜索词生成单元, 用于执行如权利要求1 ‑11任一项所述的方法, 以生成所述优化 的搜索词, 以及 搜索引擎, 用于根据所述优化的搜索词返回搜索结果。 13.一种计算设备, 包括: 处理器; 以及 存储器, 其上存储有可执行代码, 当所述可执行代码被所述处理器执行时, 使所述处理 器执行如权利要求1 ‑11任一项所述的方法。 14.一种非暂时性机器可读存储介质, 其上存储有可执行代码, 当所述可执行代码被电 子设备的处 理器执行时, 使所述处 理器执行如权利要求1 ‑11任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114756645 A 3

.PDF文档 专利 搜索方法和搜索系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 搜索方法和搜索系统 第 1 页 专利 搜索方法和搜索系统 第 2 页 专利 搜索方法和搜索系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。