专利 模型训练方法和装置、文本分类方法、电子设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210135357.5 (22)申请日 2022.02.14 (71)申请人阿里巴巴（中国）有限公司地址 310056 浙江省杭州市滨江区长河街道网商路69 9号4号楼5楼5 08室 (72)发明人李旭瑞　康杨杨　孙常龙　 (74)专利代理机构北京市惠诚律师事务所 11353 专利代理师刘子敬 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) (54)发明名称模型训练方法和装置、文本分类方法、电子设备及存储介质 (57)摘要本申请公开了一种模型训练方法和装置、文本分类方法、电子设备及存储介质。该方法包括：根据具有标签的已标注文本，获取以所述已标注文本为中心节点的关系图谱，其中，所述关系图谱包括与所述中心节点直接关联或间接关联的邻居节点，所述邻居节点包括文本节点和实体节点；将所述关系图谱中的文本节点输入文本分类模型，以得到针对每个所述文本节点的预测伪标签和预测特征向量；根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量；采用所述汇聚特征向量作为训练数据，训练图分类模型。本申请实施例实现了对于已标注文本的有效扩展，因此通过增加了大量与已标注文本相关的训练数据而提升了训练后模型的识别准确率。权利要求书2页说明书14页附图4页 CN 114840663 A 2022.08.02 CN 114840663 A 1.一种模型训练方法，包括：根据具有标签的已标注文本，获取以所述已标注文本为中心节点的关系图谱，其中，所述关系图谱包括与所述中心节点直接关联或间接关联的邻居节点，所述邻居节点包括文本节点和实体节点；将所述关系图谱中的文本节点输入文本分类模型，以得到针对每个所述文本节点的预测伪标签和预测特征向量；根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量；采用所述汇聚特征向量作为训练数据，训练图分类模型。 2.根据权利要求1所述的模型训练方法，其中，所述根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量，包括：获取预测伪标签与所述中心节点的标签相同的所述文本节点，作为第一文本节点；计算所述第一文本节点的预测特征向量的平均值，作为第一平均向量；将所述第一平均向量与所述中心节点的特征向量进行拼接或平均处理，以得到所述汇聚特征向量。 3.根据权利要求1所述的模型训练方法，其中，所述根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量，包括：计算各所述文本节点的预测伪标签与所述中心节点的标签的相似度，作为权重值；根据所述权重值，计算所述文本节点的预测特征向量的加权平均值，作为第二平均向量；将所述第二平均向量与所述中心节点的特征向量进行拼接或平均处理，以得到所述汇聚特征向量。 4.根据权利要求1所述的模型训练方法，其中，所述方法还包括：采用所述已标注文本作为训练数据，训练所述文本分类模型。 5.根据权利要求1所述的模型训练方法，其中，所述方法还包括：将所述关系图谱中的文本节点输入所述图分类模型，以得到针对每个所述文本节点的预测伪标签和预测特征向量。 6.根据权利要求5所述的模型训练方法，其中，在采用所述图分类模型进行预测时，所述方法还包括：将所述图分类模型的中间特征层的输出作为所述文本节点的预测特征向量；计算各所述文本节点的预测特征向量与所述中心节点的特征向量的相似度，作为权重值；根据所述权重值，计算所述文本节点的预测特征向量的加权平均值，作为第三平均向量；将所述第三平均向量与所述中心节点的特征向量进行拼接或平均处理，以得到所述汇聚特征向量。 7.一种文本分类方法，包括：对目标文本进行文本特征提取，以获得所述目标文本的文本特征向量；将所述目标文本的文本特征向量输入预定的图分类模型中，以计算所述目标文本与预权　利　要　求　书 1/2 页 2 CN 114840663 A 2定的各分类标签的相关性；根据所述相关性确定所述目标文本的分类标签，其中所述预定的图分类模型是使用下述方式训练的：根据具有分类标签的已标注文本，获取以所述已标注文本为中心节点的关系图谱，其中，所述关系图谱包括与所述中心节点直接关联或间接关联的邻居节点，所述邻居节点包括文本节点和实体节点；将所述关系图谱中的文本节点输入文本分类模型，以得到针对每个所述文本节点的预测伪标签和预测特征向量；根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量；采用所述汇聚特征向量作为训练数据，对所述图分类模型进行训练。 8.一种模型训练装置，包括：获取模块，用于根据具有标签的已标注文本，获取以所述已标注文本为中心节点的关系图谱，其中，所述关系图谱包括与所述中心节点直接关联或间接关联的邻居节点，所述邻居节点包括文本节点和实体节点；文本分类模块，用于将所述关系图谱中的文本节点输入文本分类模型，以得到针对每个所述文本节点的预测伪标签和预测特征向量；汇聚模块，用于根据所述预测伪标签，将各文本节点与所述中心节点进行汇聚处理，以得到汇聚特征向量；训练模块，用于采用所述汇聚特征向量作为训练数据，训练图分类模型。 9.一种电子设备，包括：存储器，用于存储程序；处理器，用于运行所述存储器中存储的所述程序，以执行如权利要求1至6中任一所述的模型训练方法。 10.一种计算机可读存储介质，其上存储有可被处理器执行的计算机程序，其中，所述程序被处理器执行时实现如权利要求1至 6中任一所述的模型训练方法。权　利　要　求　书 2/2 页 3 CN 114840663 A 3

专利 模型训练方法和装置、文本分类方法、电子设备及存储介质

专利模型训练方法和装置、文本分类方法、电子设备及存储介质