说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210102819.3 (22)申请日 2022.01.27 (71)申请人 网易(杭州)网络有限公司 地址 310052 浙江省杭州市滨江区网商路 599号网易大厦 (72)发明人 张林箭 王佳安 邹北琪 张聪  汪硕芃 宋有伟 范长杰 胡志鹏  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 高燕 (51)Int.Cl. G06F 40/35(2020.01) G06F 16/36(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06V 10/25(2022.01) G06V 10/82(2022.01) (54)发明名称 意图识别的方法、 装置及电子设备 (57)摘要 本发明提供了一种意图识别的方法、 装置及 电子设备, 涉及信息处理技术领域。 该方法包括: 响应接收到虚拟角色对应玩家输入的对话文本, 获取虚拟场景当前对应的场景图像, 并基于预设 的知识图谱获取对话文本和场景图像分别对应 的知识子图, 最终基于知识子图和意图识别模 型, 获得对话文本对应的预测意图。 本申请的技 术在对玩家属于的对话文本进行意图识别时, 不 仅考虑对话文本本身的信息, 还考虑了玩家发出 对话文本时所处的虚拟场景, 将对话文本和场景 图像共同作为意图识别模型的输入, 通过意图识 别模型确定出的意图能够更加准确的体现玩家 针对虚拟场景的真实意图, 有效避免了对玩家意 图的错误识别, 提高了针对对话进行意图识别的 准确性。 权利要求书2页 说明书13页 附图7页 CN 114429142 A 2022.05.03 CN 114429142 A 1.一种意图识别的方法, 其特征在于, 通过电子设备提供一图形用户界面, 所述图形用 户界面显示的内容至少包括 一虚拟场景以及一虚拟角色; 所述方法包括: 响应接收到所述虚拟角色对应玩家输入的对话文本, 获取所述虚拟场景当前对应的场 景图像; 基于预设的知识图谱获取 所述对话文本和所述场景图像分别对应的知识子图; 基于所述知识子图和意图识别模型, 获得 所述对话文本对应的预测意图。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 从所述场景图像中提取包 含目标对象的多个子图像; 所述基于预设的知识图谱获取 所述场景图像对应的知识子图, 包括: 基于预设的知识图谱获取 所述多个子图像分别对应的知识子图。 3.根据权利要求2所述的方法, 其特征在于, 所述基于预设的知识图谱获取所述多个子 图像分别对应的知识子图, 包括: 通过图像描述 算法获取 所述多个子图像中的每 个子图像分别对应的描述文本; 基于预设的知识图谱和每个所述子图像对应的描述文本, 分别获得每个所述子图像对 应的知识子图。 4.根据权利要求1所述的方法, 其特征在于, 所述基于预设的知识图谱获取所述对话文 本和所述场景图像分别对应的知识子图, 包括: 基于预设的知识图谱获取 所述对话文本和所述场景图像分别对应的初始知识子图; 基于预设的图卷积神经网络分别对所述初始知识子图中的节点进行更新, 获得所述对 话文本和所述场景图像分别对应的知识子图。 5.根据权利要求4所述的方法, 其特征在于, 基于预设的知识图谱获取所述对话文本和 所述场景图像分别对应的初始知识子图的步骤, 包括: 将所述对话文本对应的描述文本分割成多个第 一文本单元, 将所述场景图像对应的描 述文本分割成多个第二文本单 元; 从预设的知识图谱中确定每个所述第 一文本单元对应的第 一知识节点, 和每个所述第 二文本单 元对应的第二知识 节点; 从所述预设的知识图谱中确定出与所述第一知识节点的距离小于预设距离阈值的第 一子知识节点, 以及与所述第二知识节点的距离小于所述预设距离阈值的第二子知识节 点; 将由所述第一知识节点和所述第一子知识节点构成的子图确定为所述对话文本对应 的初始知识子图, 将由所述第二知识节点和所述第二子知识节点构成的子图确定为所述场 景图像对应的初始知识子图。 6.根据权利要求2所述的方法, 其特征在于, 基于所述知识子 图和意图识别模型, 获得 所述对话文本对应的预测意图, 包括: 根据所述对话文本和所述多个子图像生成第一序列; 根据所述对话文本的第一类型信息和所述多个子图像的第二类型生成第二序列; 对所述第一序列中的每个对象所在的位置进行编码, 得到所述第 一序列中的每个对象 的编码表示, 根据所述编码表示得到第三序列; 根据所述知识子图确定第四序列;权 利 要 求 书 1/2 页 2 CN 114429142 A 2将所述第一序列、 所述第二序列、 所述第三序列以及所述第 四序列输入所述意图识别 模型, 通过 所述意图识别模型进行处 理, 获得所述对话文本对应的预测意图。 7.根据权利要求6所述的方法, 其特征在于, 根据所述知识子 图确定第 四序列的步骤, 包括: 确定所述第一序列中同时出现在所述对话文本对应的知识子图和任一所述子图像对 应的知识子图中的目标对象; 将所述目标对象对应的编码标识作为所述目标对象的知识 表示; 将所述多个子图像分别对应的知识子图作为对应的子图像的知识 表示; 根据所述知识 表示获得第四序列。 8.根据权利要求1所述的方法, 其特 征在于, 所述电子设备中还预存有语义库; 基于所述知识子图和意图识别模型, 获得 所述对话文本对应的预测意图的步骤, 包括: 根据所述知识子图和意图识别模型, 确定所述语义库中的每个语义的置信度; 其中, 所 述置信度用于表征 该语义能够反应所述对话文本的真实意图的概 率; 根据所述语义的置信度确定与所述对话文本匹配的预测意图。 9.根据权利要求1 ‑8任一项所述的方法, 其特征在于, 所述意图识别模型包括语义表示 子模型和分类 器, 所述意图识别模型通过以下 方法训练得到: 获取样本数据; 其中, 所述样本数据包括训练文本以及训练文本对应的真实语义; 通过初始意图识别模型对所述训练文本进行语义预测, 得到训练预测语义; 计算所述真实语义及所述训练预测语义的交叉熵损失函数值; 根据计算结果更新所述语义表示子模型的参数, 和/或, 根据 所述计算结果更新所述分 类器的参数。 10.一种意图识别装置, 其特征在于, 所述装置提供一图形用户界面, 所述图形用户界 面显示的内容至少包括 一虚拟场景以及一虚拟角色, 所述装置包括: 场景图像获取模块, 用于响应接收到所述虚拟角色对应玩家输入的对话文本, 获取所 述虚拟场景当前对应的场景图像; 知识子图确定模块, 用于基于预设的知识图谱获取所述对话文本和所述场景图像分别 对应的知识子图; 意图预测模块, 用于基于所述知识子 图和意图识别模型, 获得所述对话文本对应的预 测意图。 11.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有能够被所述 处理器执行的计算机可执行指 令, 所述处理器执行所述计算机可执行指令以实现权利要求 1‑9中任一项所述的方法。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机可 执行指令, 所述计算机可执行指令在被处理器调用和执行时, 计算机可执行指令促使处理 器实现权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114429142 A 3

.PDF文档 专利 意图识别的方法、装置及电子设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 意图识别的方法、装置及电子设备 第 1 页 专利 意图识别的方法、装置及电子设备 第 2 页 专利 意图识别的方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。