专利 实体关系抽取方法、装置、终端及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210203644.5 (22)申请日 2022.03.03 (71)申请人北京小米移动软件有限公司地址 100085 北京市海淀区西二旗中路33 号院6号楼8层018号申请人北京小米松果电子有限公司 (72)发明人张芮　彭力　 (74)专利代理机构北京善任知识产权代理有限公司 11650 专利代理师张振伟　孟桂超 (51)Int.Cl. G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称实体关系抽取方法、装置、终端及存储介质 (57)摘要本公开实施例公开了一种实体关系抽取方法、装置、终端及存储介质；所述方法包括：获取至少一个训练样本的第一关系数据；将所述第一关系数据所在的所述训练样本输入到所述第一关系抽取模型进行识别，以获得所述训练样本的第二关系数据；将所述第一关系数据及所述第二关系数据输入到所述第一关系抽取模型进行迭代，以更新所述第一关系抽取模型得到第二关系抽取模型；将目标文本输入到所述第二关系抽取模型进行训练，以获得所述目标文本的目标关系数据。权利要求书4页说明书22页附图5页 CN 115017324 A 2022.09.06 CN 115017324 A 1.一种实体关系抽取方法，其特征在于，所述方法包括：获取至少一个训练样本的第一关系数据；将所述第一关系数据所在的所述训练样本输入到所述第一关系抽取模型进行识别，以获得所述训练样本的第二关系数据；将所述第一关系数据及所述第二关系数据输入到所述第一关系抽取模型进行迭代，以更新所述第一关系抽取模型得到第二关系抽取模型；将目标文本输入到所述第二关系抽取模型进行训练，以获得所述目标文本的目标关系数据。 2.根据权利要求1所述的方法，其特征在于，所述方法包括：获取至少一个所述训练样本的样本信息；其中，所述样本信息包括：至少一个样本关系的主语信息及宾语信息；所述主语信息包括主语头指针信息与主语尾指针信息；所述宾语信息包括宾语头指针信息及宾语尾指针信息；将所述样本信息输入到所述第二关系抽取模型进行迭代训练，直至所述第二关系抽取模型的损失函数满足收敛条件，得到训练后的所述第二关系抽取模型；所述将目标文本输入到所述第二关系抽取模型进行训练，以获得所述目标文本的目标关系数据，包括：将所述目标文本输入到训练后的所述第二关系抽取模型，以获得所述目标文本的所述目标关系数据。 3.根据权利要求2所述的方法，其特征在于，将所述样本信息输入到所述第二关系抽取模型中进行的一次迭代训练，包括：将至少一个所述样本关系的主语信息及宾语信息输入到所述第二关系抽取模型，构建当前次迭代训练的损失值；基于所述损失值更新所述第二关系抽取模型，得到当前次迭代训练后的所述第二关系抽取模型。 4.根据权利要求3所述的方法，其特征在于，所述将至少一个所述样本关系的主语信息及宾语信息输入到所述第二关系抽取模型，构建当前次迭代训练的损失值，包括：基于各所述训练样本，获取各所述训练样本的编码信息；基于所述编码信息及主语分类器，获取所述训练样本的预测主语信息，其中，所述预测主语信息包括：预测主语头指针信息及预测主语尾指针信息；基于所述编码信息及宾语分类器，获取所述训练样本的预测宾语信息，其中，所述预测宾语信息，包括：预测宾语头指针信息及预测宾语尾指针信息；基于所述训练样本的至少一个所述样本关系的主语信息及对应的预测主语信息、宾语信息及对应的预测宾语信息，获取当前次迭代训练的损失值。 5.根据权利要求 4所述的方法，其特征在于，所述方法包括：对所述训练样本的编码信息及主语向量表征进行融合处理，得到融合后的融合向量表征；其中，所述主语向量表征基于所述预测主语头指针信息及预测尾指针信息确定；所述基于所述编码信息及宾语分类器，获取所述训练样本的预测宾语信息，包括：基于所述融合向量表征及所述宾语分类器，获取所述训练样本的所述预测宾语信息。 6.根据权利要求 4所述的方法，其特征在于，所述方法包括：权　利　要　求　书 1/4 页 2 CN 115017324 A 2若一个所述训练样本包括至少两个主语，在一个所述主语的所述预测主语头指针信息所指示的位置的预定范围内，确定与所述主语的所述预测主语头指针信息对应的所述预测主语尾指针信息。 7.根据权利要求4所述的方法，其特征在于，所述基于所述训练样本的至少一个所述样本关系的主语信息及对应的预测主语信息、宾语信息及对应的预测宾语信息，获取当前次迭代训练的损失值，包括：基于至少一个所述训练样本的至少一个所述样本关系的所述主语信息及预测主语信息，获得主语损失值；基于至少一个所述训练样本的至少一个所述样本关系的所述宾语信息及预测宾语信息，获得宾语损失值；其中，所述宾语损失值包括：表征主语存在宾语关系的第一宾语损失值、及表征主语不存在宾语关系的第二宾语损失值；基于至少一个所述训练样本的所述主语损失值及所述宾语损失值的和，获取当前次迭代训练的损失值。 8.根据权利要求7所述的方法，其特征在于，所述基于至少一个所述训练样本的所述主语损失值及所述宾语损失值的和，获取当前次迭代训练的损失值，包括：基于所述训练样本的宾语损失值及权重系数，获得所述训练样本加权后的宾语损失值；基于至少一个所述训练样本的所述主语损失值及加权后的宾语损失值的和，获取当前次迭代训练的损失值。 9.根据权利要求4所述的方法，其特征在于，所述基于各所述训练样本，获取各所述训练样本的编码信息，包括：将各所述训练样本输入到预训练模型，获得各所述训练样本的所述编码信息；其中，所述预训练模型中包括各备选字与编码信息的对应关系。 10.一种实体关系抽取方法，其特征在于，所述方法包括：获取至少一个所述训练样本的样本信息；其中，所述样本信息包括：至少一个样本关系的主语信息及宾语信息；所述主语信息包括主语头指针信息与主语尾指针信息；所述宾语信息包括宾语头指针信息及宾语尾指针信息；将所述样本信息输入到所述第二关系抽取模型进行迭代训练，直至所述第二关系抽取模型的损失函数满足收敛条件，得到训练后的所述第二关系抽取模型；将目标文本输入到训练后的所述第二关系抽取模型，以获得所述目标文本的所述目标关系数据。 11.一种实体关系抽取装置，其特征在于，所述装置包括：第一获取模块，用于获取至少一个训练样本的第一关系数据；第一识别模块，用于将所述第一关系数据所在的所述训练样本输入到所述第一关系抽取模型进行识别，以获得所述训练样本的第二关系数据；第一处理模块，用于将所述第一关系数据及所述第二关系数据输入到所述第一关系抽取模型进行迭代，以更新所述第一关系抽取模型得到第二关系抽取模型；第二处理模块，用于将目标文本输入到所述第二关系抽取模型进行训练，以获得所述目标文本的目标关系数据。权　利　要　求　书 2/4 页 3 CN 115017324 A 3

专利 实体关系抽取方法、装置、终端及存储介质

专利实体关系抽取方法、装置、终端及存储介质