说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210329150.1 (22)申请日 2022.03.31 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 李泽诚 马镇新 (74)专利代理 机构 北京展翼知识产权代理事务 所(特殊普通 合伙) 11452 专利代理师 张阳 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) (54)发明名称 搜索处理方法、 搜索方法和搜索系统 (57)摘要 公开了一种搜索处理方法、 搜索方法和搜 索。 所述搜索处理方法包括: 获取当前搜索词和 当前筛选项; 将获取的所述当前搜索词和所述当 前筛选项送入深度学习模型; 以及基于所述深度 学习模型输出的结果, 求取用于表征所述当前筛 选项与所述当前搜索词相关性的词权重分, 其 中, 所述深度学习模型使用表征搜索词与筛选项 的搜索结果相关性的词权重标签进行训练。 本发 明采用了一种上下文动态词权重计算方法, 创新 地融合了QPP指标, 从搜索结果本身设计词权重, 使得权重目标与搜索效果一致, 由此大幅提升基 于词权重的筛选项筛选的效率, 尤其适用于医疗 搜索场景下关键词匹配能力的提升, 并由此改善 医疗搜索的召回质量。 权利要求书2页 说明书13页 附图6页 CN 114936262 A 2022.08.23 CN 114936262 A 1.一种搜索处 理方法, 包括: 获取当前搜索词和当前筛 选项; 将获取的所述当前搜索词和所述当前筛 选项送入深度学习模型; 以及 基于所述深度 学习模型输出的结果, 求取用于表征所述当前筛选项与 所述当前搜索词 相关性的词权 重分, 其中, 所述深度 学习模型使用表征搜索词与筛选项的搜索结果相关性的词权重标签进 行训练。 2.如权利要求1所述的方法, 其中, 在训练之前, 基于第一搜索词和第一筛选项的搜索 结果表现离线构造训练针对所述第一搜索词和所述第一筛 选项的第一词权 重标签。 3.如权利要求2所述的方法, 其中, 单次预测中, 所述深度学习模型使用一个当前搜索 词和多个当前筛选项作为输入样本, 以输入的所述多个当前筛选项各自的权重分作为输 出, 并且 在训练阶段, 在所述深度学习模型的输入样本包括所述第一搜索词、 所述第一筛选项 以及第二筛选项时, 使用所述第一词权重标签以及针对所述第一搜索词和 第二筛选项的第 二词权重标签来 求取损失值。 4.如权利要求2所述的方法, 其中, 在训练之前, 基于第一搜索词和第一筛选项的搜索 结果表现离线构造训练针对所述第一搜索词和所述第一筛 选项的第一词权 重标签包括: 使用所述第 一搜索词和所述第 一筛选项发起搜索并获取第 一前N个返回结果, N是大于 1的整数; 求取所述第一搜索词在所述第一前N个返回结果中的搜索词命中分; 求取所述第一筛 选项在所述第一前N个返回结果中的筛 选项命中分; 求取所述第一搜索词和所述第一前N个返回结果的相关 分; 以及 根据所述第 一搜索词命中分、 第 一筛选项命中分和所述第 一相关分构造所述第 一词权 重标签。 5.如权利要求1所述的方法, 其中, 训练所述深度学习模型包括: 将筛选项被掩码的包括搜索词和多个筛 选项的训练样本送入所述深度学习模型; 对输入的所述训练样本进行 特征提取, 并获取被掩码筛 选项的筛 选项嵌入向量; 经由转换层将所述被掩码筛 选项的筛 选项嵌入向量 转化为预测的词权 重值; 以及 基于与所述训练样本中包括的搜索词和被掩码筛选项相对应的词权重标签, 求取损失 函数。 6.如权利要求1所述的方法, 其中, 所述深度学习模型是上下文感知的动态词权重模 型, 并且包括用于对输入进行 特征提取的多个Transformer模型层。 7.如权利要求1所述的方法, 还 包括: 对经权重过滤的筛选项和所述当前搜索词进行重述, 以生成优化的搜索词; 以及 将所述优化的搜索词送入搜索引擎以向用户提供针对所述当前搜索词的搜索结果, 其中, 所述搜索引擎用于为所述词权 重标签的求取提供 所需的搜索结果。 8.如权利要求1所述的方法, 其中, 所述搜索处理方法用于医疗垂直搜索, 所述用户输 入的当前搜索词包括症状和/或病名内容, 所述当前筛 选项包括对症状的补充 描述。 9.一种搜索方法, 包括:权 利 要 求 书 1/2 页 2 CN 114936262 A 2获取用户输入的搜索词和筛 选项; 对所述筛 选项进行同义词处 理; 将所述搜索词和经同义词处理的筛选项送入深度学习模型, 求取各个筛选项的权重 分; 以及 对经权重分过滤的筛选项和所述搜索词进行重述, 以生成优化的搜索词, 其中, 所述深度 学习模型使用表征搜索词与筛选项的搜索结果相关性的词权重标签进 行训练。 10.一种搜索系统, 包括: 医疗垂搜判定单元, 用于获取并识别用户当前输入的搜索词中包括的症状和/或病名 内容作为关键短语; 筛选项获取单元, 用于基于所述关键短语提供对症状的多个补充描述并获取用户选择 的补充描述作为筛 选项; 优化搜索词生成单元, 用于执行如权利要求1 ‑8中任一项所述的方法, 以基于词权重分 生成优化的搜索词, 以及 搜索引擎, 用于根据所述优化的搜索词返回搜索结果。 11.一种计算设备, 包括: 处理器; 以及 存储器, 其上存储有可执行代码, 当所述可执行代码被所述处理器执行时, 使所述处理 器执行如权利要求1 ‑9中任一项所述的方法。 12.一种非暂时性机器可读存储介质, 其上存储有可执行代码, 当所述可执行代码被电 子设备的处 理器执行时, 使所述处 理器执行如权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114936262 A 3
专利 搜索处理方法、搜索方法和搜索系统
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:58:34
上传分享
举报
下载
原文档
(945.1 KB)
分享
友情链接
T-CES 184—2022 中低压配电网快速插拔电缆连接器配置技术导则.pdf
DB31-T 1356.1-2022 公共数据资源目录 第1部分:编制指南 上海市.pdf
GB-T 40665.4-2021 中医四诊操作规范 第4部分:切诊.pdf
GB-T 10801.2-2018 绝热用挤塑聚苯乙烯泡沫塑料(XPS).pdf
禁止进口限制进口技术管理办法.pdf
DB15-T 2776—2022 地理信息大数据平台运行维护规范 内蒙古自治区.pdf
GB-T 42582-2023 信息安全技术 移动互联网应用程序(App)个人信息安全测评规范.pdf
GB-T 3190-2020 变形铝及铝合金化学成分.pdf
T-CIECCPA 010—2020 节能诊断数据结构化处理规范.pdf
GB-T 5599-2019 机车车辆动力学性能评定及试验鉴定规范.pdf
DB22-T 370-2014 建筑逃生缓降器设置技术规范 吉林省.pdf
DB4403-T 422.1—2024 诚信计量管理规范 第1部分:通则 深圳市.pdf
GB-T 27926.8-2021 金融服务 金融业通用报文方案 第8部分:ASN.1生成.pdf
GB-T 32918.2-2016 信息安全技术 SM2椭圆曲线公钥密码算法 第2部分:数字签名算法.pdf
GB-T 42293-2022 商品交易市场知识产权保护规范.pdf
GB-T 24353-2022 风险管理指南 .pdf
GB-T 19315-2003 小艇 最大装载量.pdf
华为 工业互联网白皮书 工业知识与ICT技术深入融合 2020.pdf
DB42-T 1674-2021 电加热模锻生产过程节能管理规范 湖北省.pdf
GB-T 36322-2018 信息安全技术 密码设备应用接口规范.pdf
交流群
-->
1
/
3
22
评价文档
赞助2元 点击下载(945.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。