说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210162095.1 (22)申请日 2022.02.22 (71)申请人 武汉纺织大 学 地址 430073 湖北省武汉市洪山区纺织路1 号 (72)发明人 刘军平 梅世杰 胡新荣 姚迅 杨捷 (74)专利代理 机构 上海硕力知识产权代理事务 所(普通合伙) 31251 专利代理师 刘桂芝 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称 智能问答模型的生成方法、 装置、 计算设备 和存储介质 (57)摘要 本发明提供了一种智能问答模型的生成方 法, 包括: 扩充原始样本数据集以使存在与所述 原始样本数据集中问题对应的正样 本, 生成新样 本数据集; 将生成的新样本数据集输入到现有问 答模型中, 所述现有问答模型从新样本数据集中 的知识库和文档中获取与问题相关的特征编码, 并计算现有问答模型的损失Lqa; 将获得的特征 编码加入到改进的对比学习模型中, 分别计算出 真样本与新样本数据集中的困难正、 负样本之间 的相似度, 得出对比损失Lcl; 将现有问答模型 的 损失Lqa和对比损失Lcl进行结合, 得到最终问答 模型的损失L, 并训练最终问答模型。 本发明在现 有问答模型加入对比学习模型, 模 型泛化能力更 强, 同时在知识库问答取得的效果相比于传统的 方法更好。 权利要求书3页 说明书13页 附图4页 CN 114547267 A 2022.05.27 CN 114547267 A 1.一种智能问答模型的生成方法, 其特 征在于, 所述方法包括: 扩充原始样本数据集以使存在与 所述原始样本数据集中问题对应的正样本, 生成新样 本数据集, 其中, 所述正样 本定义为与 原始样本数据集答案相同的问题, 与 原始样本数据集 答案不相同的问题定义 为负样本; 将生成的新样本数据集输入到现有问答模型中, 所述现有问答模型从新样本数据集中 的知识库和文档中获取与问题相关的特 征编码, 并计算现有问答模型的损失Lqa; 将获得的特征编码加入到改进的对比学习 模型中, 分别计算出真样本与新样本数据集 中的困难正、 负 样本之间的相似度, 得 出对比损失Lcl; 采用线性融合将现有问答模型的损失Lqa和对比损失Lcl进行结合, 得到最终问答模型的 损失L, 并训练得到所述 最终问答模型。 2.根据权利要求1所述的智能问答模型的生成方法, 其特征在于, 所述扩充原始样本数 据集以使存在与所述原 始样本数据集中问题对应的正样本, 生成新样本数据集具体包括: 根据原始样本数据集中的问题和知识库三元组信 息, 生成与原始样本数据集中的问题 对应的正样本, 其中将与原始样本数据集中答案相同的问题定义为正样本, 答案不同的定 义为负样本; 针对每一条数据样本生成三条正样本, 得到新样本数据集, 其中, 原始样本数据集为公 共的问答数据集 WebQuesti onSP。 3.根据权利要求2所述的智能问答模型的生成方法, 其特征在于, 所述现有问答模型从 新样本数据集中的知识库和文档中获取与问题相关的特 征编码具体包括: 现有问答模型对问题、 知识库三元组信息和文档信息分别进行编码, 分别得到它们的 语义表达 q, KBi和docj, 其中, KBi表示知识库中第i个子图的语义表达, i=1, 2, .., lkb, 这里 lkb表示知识库中子图的总数; docj表示文档中第j个子图的语义表达, j=1, 2, .., ldoc, ldoc 表示文档的总数; 利用LSTM注意力编码器对问题进行编码, 获得问题特 征向量 获得知识库的实体特 征向量和文档的实体特 征向量; 根据知识库的实体特征向量和文档的实体特征向量获得与问题相关的实体特征向量 ent; 将所述问题特 征向量 实体特征向量ent作为特 征编码。 4.根据权利要求3所述的智能问答模型的生成方法, 其特 征在于, 所述方法还 包括: 将原始样本数据集标记为真样本xquery, 计算所述真样本xquery的特征向量query, 其中 将扩充的三条正样本数据标记为 计算正样本的特征向量(k1, k2, k3), 其中, 权 利 要 求 书 1/3 页 2 CN 114547267 A 2θk←mθk+(1‑m)θq, m∈[0, 1) 其中fq=encoder, fk=moment encoder均为现有问答模型和动量更新编码器。 5.根据权利要求4所述的智能问答模型的生成方法, 其特征在于, 所述将 获得的特征编 码加入到改进的对比学习模型中, 分别计算出真样本与新样本数据集中的困难正样本、 负 样本之间的相似度, 得出对比损失Lcl, 采用线性融合将现有问答模型的损失Lqa和对比损失 Lcl进行结合, 得到最终问答模型的损失L具体包括: 定义一个负样本队列Zneg={z1, z2, ..., zK}, 其中zi表示样本数据集中的第l个负样本, K 表示负样本队列的个数; 计算真样本与正样本之间的余弦相似度, 并最终提取相似度最小的正样本作为困难正 样本向量 khard: 将正样本和真样本进行线性融合后形成新的困难负样本向量 然后更新进负样本 队列Zneg, 具体公式如下: 其中, λ表示分配权 重; 对Zneg按照负样本和真样本的相似度进行从大到小的排序, 得到|| query||||zi||>|| query||||zj||, (i<j), 抽取Top ‑K个相似度最大的负 样本来组成 满足: 其中λneg为预先设定的超参; 根据得到的困难负样本队列向量 和困难正样本向量 khard, 得到改进后的对比损失函数Lcl, 其中, τ 为 一个常数; 从而得到最终的模型损失函数L, L= λqaLqa+λclLcl λqa和 λcl分别表示现有问答模型和对比模型的损失权 重。 6.一种智能问答模型的生成装置, 其特 征在于, 所述装置包括: 样本集生成模块, 用于扩充原始样本数据集以使存在与 所述原始样本数据集中问题对 应的正样本, 生 成新样本数据集, 其中所述正样本定义为原始样本数据集答案相同的问题, 原始样本数据集 答案不相同的问题定义 为负样本; 编码模块, 用于将生成的新样本数据集输入到现有问答模型中, 所述现有问答模型从 新样本数据集中的知识库和文档中获取与问题相关的特征编码, 并计算现有问答模型的损权 利 要 求 书 2/3 页 3 CN 114547267 A 3
专利 智能问答模型的生成方法、装置、计算设备和存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 08:58:57
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 43079.2-2023 钢制管法兰、垫片及紧固件选用规定 第2部分:Class系列.pdf
GB-T 41997.3-2022 机械电气安全 基于视觉的电敏保护设备 第3部分:采用立体视觉保护器件特殊要求.pdf
DB34-T 3906-2021 基层防汛监测预警系统集成规范 安徽省.pdf
GB-T 36441-2018 硬件产品与操作系统兼容性规范.pdf
DB37-T 5237-2022 《超低能耗公共建筑技术标准》 山东省.pdf
T-CSRME 005—2020 露天矿山边坡岩体结构面抗剪强度获取技术规程.pdf
4.信息系统运行和业务恢复能力水印版.pdf
T-SAMA 001—2021 数据安全的增材制造服务系统总体要求.pdf
GB-T 22900-2022 科学技术研究项目评价通则.pdf
T-CESA 1121—2020 人工智能芯片 面向端侧的深度学习芯片测试指标与测试方法.pdf
GB 35373-2017 氢氟烃类灭火剂.pdf
GB-T 33585-2017 复合磺酸钙基润滑脂.pdf
GB-T 6900-2016 铝硅系耐火材料化学分析方法.pdf
DB62-T 4290-2021 法定计量检定机构监督检查规范 甘肃省.pdf
GB 9706.226-2021 医用电气设备 第2-26部分:脑电图机的基本安全和基本性能专用要求.pdf
NY-T 3990-2021 数字果园建设规范 苹果.pdf
T-CEC 672—2022 变压器油中溶解气体在线监测装置现场校验器技术条件.pdf
GB-T 32950-2016 鲜活农产品标签标识.pdf
专利 隐私计算、隐私数据和联邦学习的互联互通方法及装置.PDF
GB-T 42809-2023 自动化集装箱码头操作系统技术要求.pdf
交流群
-->
1
/
3
21
评价文档
赞助2元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。