专利 基于智能体图谱的图像识别方法、系统和可读存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210024129.0 (22)申请日 2022.01.11 (65)同一申请的已公布的文献号申请公布号 CN 114049493 A (43)申请公布日 2022.02.15 (73)专利权人北京融信数联科技有限公司地址 100000 北京市海淀区上地信息路26 号10层10 04室 (72)发明人张广志　成立立　于笑博　杨占军　刘畔青　 (74)专利代理机构北京沃杰永益知识产权代理事务所(普通合伙) 11905 代理人杨杰 (51)Int.Cl. G06V 10/26(2022.01)G06V 10/74(2022.01) G06K 9/62(2022.01) G06F 16/36(2019.01) 审查员韦佳黎 (54)发明名称基于智能体图谱的图像识别方法、系统和可读存储介质 (57)摘要本发明公开的一种基于智能体图谱的图像识别方法、系统和可读存储介质，其中方法包括：调用多模态机制对预设数据进行处理以构建所述智能体图谱；对目标图片进行图像分割，将分割结果与所述智能体图谱内的图谱进行比对匹配，以检测并识别出目标数据；基于所述目标数据获取各目标块的相对位置以及相对大小，并结合所述智能体图谱获取各所述目标块的相互关系。本发明通过提取多模态数据语义信息，进而通过融合关联，将多模态数据用于智能体图谱构建中，使得智能体图谱内容更加丰富，为认知智能提供多模态本体实体及事理逻辑知识库支撑，依托智能体图谱中的已有认知，进行图像识别，更好地理解图片中的信息。权利要求书3页说明书9页附图1页 CN 114049493 B 2022.04.01 CN 114049493 B 1.一种基于智能体图谱的图像识别方法，其特征在于，包括以下步骤：调用多模态机制对预设数据进行处理以构建所述智能体图谱；对目标图片进行图像分割，将分割结果与所述智能体图谱内的图谱进行比对匹配，以检测并识别出目标数据；基于所述目标数据获取各目标块的相对位置以及相对大小，并结合所述智能体图谱获取各所述目标块的相互关系；所述将分割结果与所述智能体图谱内的图谱进行比对匹配，以检测并识别出目标数据，具体包括：提取所述分割结果识别每一个所述目标块；基于每个所述目标块依次与所述智能体图谱内的图片进行比对，并计算相似概率值，其中，若所述相似概率值超过预设第一相似阈值，则判定所述目标块与所述智能体图谱中对应的所述图片为同一物体，否则，判定为不同物体；将判定为同一物体的所述目标块组合成所述目标数据；所述基于所述目标数据获取各目标块的相对位置以及相对大小，并结合所述智能体图谱获取各所述目标块的相互关系，具体包括：利用区域的矩识别所述目标块于所述目标图片中的方位数据；计算每个所述目标块的面积并进行大小降序排列，结合所述智能体图谱确定各所述目标块间的所述相互关系，以生成对应的文本化描述；所述检测并识别出目标数据，还包括：基于分类模型和图像搜索融合技术的检测图像。 2.根据权利要求1所述的一种基于智能体图谱的图像识别方法，其特征在于，所述调用多模态机制对预设数据进行处理以构建所述智能体图谱，具体包括：通过多模态知识抽取、多模态知识表示、多模态知识融合以及多模态知识加工来构建所述智能体图谱，其中，基于预设特征提取模型对所述预设数据进行单模态语义特征提取，而后提取多模态数据的对应关系以完成所述多模态知识抽取；基于预设嵌入方式将不同类型的所述预设数据投射到同一向量空间中表示，以完成所述多模态知识表示；基于概念层以及数据层两个层面对所述多模态知识抽取的结果进行链接，以完成所述多模态知识融合；对所述多模态知识融合后的链接结果调用预设加工方式以完成所述多模态知识加工。 3.根据权利要求2所述的一种基于智能体图谱的图像识别方法，其特征在于，所述预设嵌入方法包括词嵌入、无监督图嵌入、属性图嵌入以及异构图嵌入；所述加工方式包括本体构建、事件本体构建、知识推理和质量评估。 4.根据权利要求2所述的一种基于智能体图谱的图像识别方法，其特征在于，所述对目标图片进行图像分割，具体包括：利用预设算法对所述目标图片进行图像分割得到所述分割结果，其中，所述预设算法为Swin‑Transformer算法和/或Self ‑attention算法；调用预设参数对所述目标图片进行图像分割得到所述分割结果，其中，所述预设参数包括形状、颜色、亮度以及对比度。权　利　要　求　书 1/3 页 2 CN 114049493 B 25.一种基于智能体图谱的图像识别系统，其特征在于，包括存储器和处理器，所述存储器中包括基于智能体图谱的图像识别方法程序，所述基于智能体图谱的图像识别方法程序被所述处理器执行时实现如下步骤：调用多模态机制对预设数据进行处理以构建所述智能体图谱；对目标图片进行图像分割，将分割结果与所述智能体图谱内的图谱进行比对匹配，以检测并识别出目标数据；基于所述目标数据获取各目标块的相对位置以及相对大小，并结合所述智能体图谱获取各所述目标块的相互关系；所述将分割结果与所述智能体图谱内的图谱进行比对匹配，以检测并识别出目标数据，具体包括：提取所述分割结果识别每一个所述目标块；基于每个所述目标块依次与所述智能体图谱内的图片进行比对，并计算相似概率值，其中，若所述相似概率值超过预设第一相似阈值，则判定所述目标块与所述智能体图谱中对应的所述图片为同一物体，否则，判定为不同物体；将判定为同一物体的所述目标块组合成所述目标数据；所述基于所述目标数据获取各目标块的相对位置以及相对大小，并结合所述智能体图谱获取各所述目标块的相互关系，具体包括：利用区域的矩识别所述目标块于所述目标图片中的方位数据；计算每个所述目标块的面积并进行大小降序排列，结合所述智能体图谱确定各所述目标块间的所述相互关系，以生成对应的文本化描述；所述检测并识别出目标数据，还包括：基于分类模型和图像搜索融合技术的检测图像。 6.根据权利要求5所述的一种基于智能体图谱的图像识别系统，其特征在于，所述调用多模态机制对预设数据进行处理以构建所述智能体图谱，具体包括：通过多模态知识抽取、多模态知识表示、多模态知识融合以及多模态知识加工来构建所述智能体图谱，其中，基于预设特征提取模型对所述预设数据进行单模态语义特征提取，而后提取多模态数据的对应关系以完成所述多模态知识抽取；基于预设嵌入方式将不同类型的所述预设数据投射到同一向量空间中表示，以完成所述多模态知识表示；基于概念层以及数据层两个层面对所述多模态知识抽取的结果进行链接，以完成所述多模态知识融合；对所述多模态知识融合后的链接结果调用预设加工方式以完成所述多模态知识加工。 7.根据权利要求6所述的一种基于智能体图谱的图像识别系统，其特征在于，所述对目标图片进行图像分割，具体包括：利用预设算法对所述目标图片进行图像分割得到所述分割结果，其中，所述预设算法为Swin‑Transformer算法和/或Self ‑attention算法；调用预设参数对所述目标图片进行图像分割得到所述分割结果，其中，所述预设参数包括形状、颜色、亮度以及对比度。 8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括一种基于权　利　要　求　书 2/3 页 3 CN 114049493 B 3

专利 基于智能体图谱的图像识别方法、系统和可读存储介质

专利基于智能体图谱的图像识别方法、系统和可读存储介质