说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210399141.X (22)申请日 2022.04.11 (71)申请人 深圳科卫机 器人科技有限公司 地址 518000 广东省深圳市南 山区沙河街 道侨香路40 68号智慧广场C 栋2楼201 (72)发明人 赵康 王一冰 王一科 贾林  涂静一  (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 李燕娥 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01)G06Q 50/12(2012.01) (54)发明名称 实体库扩充方法、 装置、 计算机设备及存储 介质 (57)摘要 本发明实施例公开了实体库扩充方法、 装 置、 计算机设备及存储介质。 方法包括: 获取语音 对话内容; 将语音对话内容进行ASR转换, 以得到 语义文本; 采用NER技术提取语义文本内的菜品 名, 以得到提取结果; 判断提取结果是否存在菜 品名; 若是, 则将提取结果扩充至预设的菜品实 体库内, 并对 预设的菜品实体库内的菜品名进行 去重处理。 若否, 则采用人工提取语义文本内的 菜品名, 以得到提取结果, 并将提取结果扩充至 预设的菜品实体库内, 并对预设的菜品实体库内 的菜品名进行去重处理。 通过 实施本发明实施例 的方法可实现能识别在自定义的菜品实体库不 存在的菜名, 且 可将识别出的菜名加入菜品实体 库, 扩充菜品实体库, 以提高后续菜品识别的效 率和准确率。 权利要求书2页 说明书12页 附图7页 CN 114691851 A 2022.07.01 CN 114691851 A 1.实体库扩充方法, 其特 征在于, 包括: 获取语音对话内容; 将所述语音对话内容进行ASR转换, 以得到语义文本; 采用NER技 术提取所述语义文本内的菜品名, 以得到提取 结果; 判断所述 提取结果是否存在菜品名; 若所述提取结果存在菜品名, 则将所述提取结果扩充至预设的菜品实体库内, 并对预 设的菜品实体库内的菜品名进行去重处 理; 若所述提取结果不存在菜品名, 则采用人工提取所述语义文本内的菜品名, 以得到提 取结果, 并执行所述将所述提取结果扩充至预设的菜品实体库内, 并对预设的菜品实体库 内的菜品名进行去重处 理。 2.根据权利要求1所述的实体库扩充方法, 其特征在于, 所述采用NER技术提取所述语 义文本内的菜品名, 以得到提取 结果, 包括: 对预设的菜品实体库内的实体进行处 理, 以得到菜品切词库; 对所述语义文本进行 预处理, 以得到预处 理结果; 根据所述菜品切词集召回所述预处 理结果命中的词语, 以得到召回结果; 判断所述召回结果是否有命中的词语; 若所述召回结果有命中的词语, 则根据所述召回结果确定所述语义文本内的菜品名, 以得到提取 结果; 若所述召回结果没有命中的词语, 则确定所述 提取结果不存在菜品名。 3.根据权利要求2所述的实体库扩充方法, 其特征在于, 所述对预设的菜 品实体库内的 实体进行处 理, 以得到菜品切词库, 包括: 对预设的菜品实体库内的实体进行切词, 以得到初始词库; 对所述初始词库内的词语进行同义词和近似词的扩充, 以得到菜品切词库。 4.根据权利要求2所述的实体库扩充方法, 其特征在于, 所述对所述语义文本进行预处 理, 以得到预处 理结果, 包括: 对所述语义文本进行切词, 并标注词性, 以得到预处 理结果。 5.根据权利要求2所述的实体库扩充方法, 其特征在于, 所述根据 所述召回结果确定所 述语义文本内的菜品名, 以得到提取 结果, 包括: 判断所述 提取结果是否是有连续命中词语; 若所述提取结果有连续命中词语, 则判断所述预处理结果内的动词与命中的词语之间 是否存在其 他词语; 若所述预处理结果内的动词与命中的词语之间存在其他词语, 则判断所述动词与命中 的词语之间是否存在 “的”字; 若所述动词与命中的词语之间存在 “的”字, 则将所述预处理结果中的最后一个 “的”字 之后的词语与命中的词语联合形成菜品名, 以得到提取 结果; 若所述动词与命中的词语之间不存在 “的”字, 则将所述动词与命中的词语之间的词语 与命中的词语联合形成菜品名, 以得到提取 结果; 若所述预处理结果内的动词与命中的词语之间不存在其他词语, 则将命中的词语联合 形成菜品名, 以得到提取 结果。权 利 要 求 书 1/2 页 2 CN 114691851 A 26.根据权利要求5所述的实体库扩充方法, 其特征在于, 所述判断所述提取结果是否是 有连续命中词语之后, 还 包括: 若所述提取结果没有连续命中词语, 则判断所述命中的词语之间是否存在 “的”字; 若所述命中的词语之间存在 “的”字, 则确定最后一个 “的”字后面命中的词语作为菜品 名, 以得到提取 结果; 若所述命中的词语之间不存在 “的”字, 则将第 一个命中的词语到最后一个命中的词语 之间的所有词语联合形成菜品名, 以得到提取 结果。 7.实体库扩充装置, 其特 征在于, 包括: 内容获取 单元, 用于获取语音对话内容; 转换单元, 用于将所述语音对话内容进行ASR转换, 以得到语义文本; 提取单元, 用于采用NER技 术提取所述语义文本内的菜品名, 以得到提取 结果; 判断单元, 用于判断所述 提取结果是否存在菜品名; 扩充单元, 用于若所述提取结果存在菜品名, 则将所述提取结果扩充至预设的菜品实 体库内, 并对预设的菜品实体库内的菜品名进行去重处 理; 人工处理单元, 用于若所述提取结果不存在菜品名, 则采用人工提取所述语义文本内 的菜品名, 以得到提取结果, 并执行所述将所述提取结果扩充至预设的菜品实体库内, 并对 预设的菜品实体库内的菜品名进行去重处 理。 8.根据权利要求7 所述的实体库扩充装置, 其特 征在于, 所述 提取单元包括: 实体处理子单元, 用于对预设的菜品实体库内的实体进行处 理, 以得到菜品切词库; 预处理子单元, 用于对所述语义文本进行 预处理, 以得到预处 理结果; 召回子单元, 用于根据所述菜品切词集召回所述预处理结果命中的词语, 以得到召回 结果; 召回结果判断子单 元, 用于判断所述召回结果是否有命中的词语; 第一确定子单元, 用于若所述召回结果有命中的词语, 则根据所述召回结果确定所述 语义文本内的菜品名, 以得到提取 结果; 第二确定子单元, 用于若所述召回结果没有命中的词语, 则确定所述提取结果不存在 菜品名。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器及处理器, 所述存储器上 存储有计算机程序, 所述处理器执行所述计算机程序时实现如权利要求 1至6中任一项所述 的方法。 10.一种存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求1至 6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114691851 A 3

.PDF文档 专利 实体库扩充方法、装置、计算机设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 实体库扩充方法、装置、计算机设备及存储介质 第 1 页 专利 实体库扩充方法、装置、计算机设备及存储介质 第 2 页 专利 实体库扩充方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:11上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。