专利 意图识别的方法、装置及电子设备

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210102819.3 (22)申请日 2022.01.27 (71)申请人网易(杭州)网络有限公司地址 310052 浙江省杭州市滨江区网商路 599号网易大厦 (72)发明人张林箭　王佳安　邹北琪　张聪　汪硕芃　宋有伟　范长杰　胡志鹏　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人高燕 (51)Int.Cl. G06F 40/35(2020.01) G06F 16/36(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06V 10/25(2022.01) G06V 10/82(2022.01) (54)发明名称意图识别的方法、装置及电子设备 (57)摘要本发明提供了一种意图识别的方法、装置及电子设备，涉及信息处理技术领域。该方法包括：响应接收到虚拟角色对应玩家输入的对话文本，获取虚拟场景当前对应的场景图像，并基于预设的知识图谱获取对话文本和场景图像分别对应的知识子图，最终基于知识子图和意图识别模型，获得对话文本对应的预测意图。本申请的技术在对玩家属于的对话文本进行意图识别时，不仅考虑对话文本本身的信息，还考虑了玩家发出对话文本时所处的虚拟场景，将对话文本和场景图像共同作为意图识别模型的输入，通过意图识别模型确定出的意图能够更加准确的体现玩家针对虚拟场景的真实意图，有效避免了对玩家意图的错误识别，提高了针对对话进行意图识别的准确性。权利要求书2页说明书13页附图7页 CN 114429142 A 2022.05.03 CN 114429142 A 1.一种意图识别的方法，其特征在于，通过电子设备提供一图形用户界面，所述图形用户界面显示的内容至少包括一虚拟场景以及一虚拟角色；所述方法包括：响应接收到所述虚拟角色对应玩家输入的对话文本，获取所述虚拟场景当前对应的场景图像；基于预设的知识图谱获取所述对话文本和所述场景图像分别对应的知识子图；基于所述知识子图和意图识别模型，获得所述对话文本对应的预测意图。 2.根据权利要求1所述的方法，其特征在于，所述方法还包括：从所述场景图像中提取包含目标对象的多个子图像；所述基于预设的知识图谱获取所述场景图像对应的知识子图，包括：基于预设的知识图谱获取所述多个子图像分别对应的知识子图。 3.根据权利要求2所述的方法，其特征在于，所述基于预设的知识图谱获取所述多个子图像分别对应的知识子图，包括：通过图像描述算法获取所述多个子图像中的每个子图像分别对应的描述文本；基于预设的知识图谱和每个所述子图像对应的描述文本，分别获得每个所述子图像对应的知识子图。 4.根据权利要求1所述的方法，其特征在于，所述基于预设的知识图谱获取所述对话文本和所述场景图像分别对应的知识子图，包括：基于预设的知识图谱获取所述对话文本和所述场景图像分别对应的初始知识子图；基于预设的图卷积神经网络分别对所述初始知识子图中的节点进行更新，获得所述对话文本和所述场景图像分别对应的知识子图。 5.根据权利要求4所述的方法，其特征在于，基于预设的知识图谱获取所述对话文本和所述场景图像分别对应的初始知识子图的步骤，包括：将所述对话文本对应的描述文本分割成多个第一文本单元，将所述场景图像对应的描述文本分割成多个第二文本单元；从预设的知识图谱中确定每个所述第一文本单元对应的第一知识节点，和每个所述第二文本单元对应的第二知识节点；从所述预设的知识图谱中确定出与所述第一知识节点的距离小于预设距离阈值的第一子知识节点，以及与所述第二知识节点的距离小于所述预设距离阈值的第二子知识节点；将由所述第一知识节点和所述第一子知识节点构成的子图确定为所述对话文本对应的初始知识子图，将由所述第二知识节点和所述第二子知识节点构成的子图确定为所述场景图像对应的初始知识子图。 6.根据权利要求2所述的方法，其特征在于，基于所述知识子图和意图识别模型，获得所述对话文本对应的预测意图，包括：根据所述对话文本和所述多个子图像生成第一序列；根据所述对话文本的第一类型信息和所述多个子图像的第二类型生成第二序列；对所述第一序列中的每个对象所在的位置进行编码，得到所述第一序列中的每个对象的编码表示，根据所述编码表示得到第三序列；根据所述知识子图确定第四序列；权　利　要　求　书 1/2 页 2 CN 114429142 A 2将所述第一序列、所述第二序列、所述第三序列以及所述第四序列输入所述意图识别模型，通过所述意图识别模型进行处理，获得所述对话文本对应的预测意图。 7.根据权利要求6所述的方法，其特征在于，根据所述知识子图确定第四序列的步骤，包括：确定所述第一序列中同时出现在所述对话文本对应的知识子图和任一所述子图像对应的知识子图中的目标对象；将所述目标对象对应的编码标识作为所述目标对象的知识表示；将所述多个子图像分别对应的知识子图作为对应的子图像的知识表示；根据所述知识表示获得第四序列。 8.根据权利要求1所述的方法，其特征在于，所述电子设备中还预存有语义库；基于所述知识子图和意图识别模型，获得所述对话文本对应的预测意图的步骤，包括：根据所述知识子图和意图识别模型，确定所述语义库中的每个语义的置信度；其中，所述置信度用于表征该语义能够反应所述对话文本的真实意图的概率；根据所述语义的置信度确定与所述对话文本匹配的预测意图。 9.根据权利要求1 ‑8任一项所述的方法，其特征在于，所述意图识别模型包括语义表示子模型和分类器，所述意图识别模型通过以下方法训练得到：获取样本数据；其中，所述样本数据包括训练文本以及训练文本对应的真实语义；通过初始意图识别模型对所述训练文本进行语义预测，得到训练预测语义；计算所述真实语义及所述训练预测语义的交叉熵损失函数值；根据计算结果更新所述语义表示子模型的参数，和/或，根据所述计算结果更新所述分类器的参数。 10.一种意图识别装置，其特征在于，所述装置提供一图形用户界面，所述图形用户界面显示的内容至少包括一虚拟场景以及一虚拟角色，所述装置包括：场景图像获取模块，用于响应接收到所述虚拟角色对应玩家输入的对话文本，获取所述虚拟场景当前对应的场景图像；知识子图确定模块，用于基于预设的知识图谱获取所述对话文本和所述场景图像分别对应的知识子图；意图预测模块，用于基于所述知识子图和意图识别模型，获得所述对话文本对应的预测意图。 11.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求 1‑9中任一项所述的方法。 12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现权利要求1 ‑9中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114429142 A 3

专利 意图识别的方法、装置及电子设备

专利意图识别的方法、装置及电子设备