说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210300784.4 (22)申请日 2022.03.24 (71)申请人 华中科技大 学 地址 430000 湖北省武汉市洪山区珞喻路 1037号 (72)发明人 赵兴炜 刘沛丰 钱璐  (74)专利代理 机构 北京轻创知识产权代理有限 公司 11212 专利代理师 王澎 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06F 16/36(2019.01) (54)发明名称 构建航空知识图谱的方法及装置、 计算机可 读介质 (57)摘要 本发明提供了构建航空知识图谱的方法及 装置, 该方法包括: 预先设置航空实体样本集; 预 先训练实体识别模型和实体关系抽取模型; 将多 个航空文本输入到训练好的实体识别模型中; 利 用训练好的实体识别模型对每个所述航空文本 执行以下处理: 对航空文本的每个字符进行标 注, 生成标注后的航空文本; 根据标注后的航空 文本, 确定航空文本中的航空实体; 根据航空文 本中的航空实体和航空实体样 本集, 确定每个航 空实体的实体类别; 利用训练好的实体 关系抽取 模型, 根据各个航空实体的实体类别, 从各个航 空文本中抽取各个航空实体 之间的实体 关系; 根 据各个航空实体和各个航空实体之间的实体关 系, 构建航空知识图谱。 本发明能够构建出航空 领域的知识图谱。 权利要求书4页 说明书10页 附图1页 CN 114722823 A 2022.07.08 CN 114722823 A 1.构建航空知识图谱的方法, 其特征在于, 包括: 预先设置航空实体样本集、 实体识别 模型和实体关系抽取模型; 预先对所述实体识别模型进行训练, 生成训练好的实体识别模型; 预先对所述实体关系抽取模型进行训练, 生成训练好的实体关系抽取模型; 该方法还包括: 将多个航空文本 输入到训练好的所述实体识别模型中; 利用训练好的所述实体识别模型对每 个所述航空文本执 行以下处 理: 对所述航空文本的每 个字符进行 标注, 生成标注后的所述 航空文本; 根据标注后的所述 航空文本, 确定所述 航空文本中的航空实体; 根据所述航空文本 中的航空实体和所述航空实体样本集, 确定每个所述航空实体的实 体类别; 利用训练好的所述实体关系抽取模型, 根据各个所述航空实体的实体类别, 从各个所 述航空文本中抽取 各个所述 航空实体之间的实体关系; 根据各个所述 航空实体和各个所述 航空实体之间的实体关系, 构建航空知识图谱。 2.根据权利要求1所述的方法, 其特 征在于, 所述对所述 航空文本的每 个字符进行 标注, 生成标注后的所述 航空文本, 包括: 获取所述航空文本中每 个字符的上文信息和下文信息; 根据每个字符的所述上文信息, 生成每个字符的第 一输出向量, 其中, 所述第 一输出向 量中包括: 基于所述上文信息的情况 下, 该字符的标签分别为每 个预设标签的概 率; 根据每个字符的所述下文信息, 生成每个字符的第 二输出向量, 其中, 所述第 二输出向 量中包括: 基于所述下文信息的情况 下, 该字符的标签分别为每 个预设标签的概 率; 将每个字符的所述第 一输出向量和所述第 二输出向量进行组合, 生成每个字符第 三输 出向量; 将每个字符的所述上文信息和所述下文信息输入条件随机场, 确定第 四输出向量, 其 中, 所述第四输出向量中包括在条件随机场的处理方式下, 该字符的标签分别为每个预设 标签的概 率; 将每个字符的所述第 三输出向量与 所述第四输出向量之和, 作为每个字符的第五输出 向量; 根据每个字符的所述第五输出向量, 确定每个字符的标签, 获得标注后的所述航空文 本。 3.根据权利要求1所述的方法, 其特 征在于, 所述航空实体样本集中包括预先定义的航空实体样本, 以及每个所述航空实体样本的 实体类别; 所述根据 所述航空文本 中的航空实体和所述航空实体样本集, 确定每个所述航空实体 的实体类别, 包括: 针对每个所述航空实体均执 行: 确定所述 航空实体样本集中的每 个所述航空实体样本的词向量; 确定当前的航空实体的词向量; 根据公式一、 当前的航空实体的词向量和每个所述航空实体样本的词向量, 确定当前权 利 要 求 书 1/4 页 2 CN 114722823 A 2的航空实体与每 个所述航空实体样本的相似度, 其中, 所述公式一 为: 其中, A为当前的航空实体的词向量, B为航空实体样本的词向量, Ai为当前的航空实体 的词向量的第i维, Bi为航空实体样本的词向量的第i维, n为词向量的维度, S为当前的航空 实体与每个所述航空实体样本的相似参数, S越小, 当前的航空实体与每个所述航空实体样 本的相似度越高; 将与当前的航空实体相似度最高的航空实体样本的实体类别作为当前的航空实体的 实体类别。 4.根据权利要求1所述的方法, 其特 征在于, 所述利用训练好的所述实体关系抽取模型, 根据各个所述航空实体的实体类别, 从各 个所述航空文本中抽取 各个所述 航空实体之间的实体关系, 包括: 针对任一所述 航空文本, 均执 行: 将当前的航空文本 输入到训练好的所述实体关系抽取模型中; 利用训练好的所述实体关系抽取模型识别当前的航空文本中的各个所述航空实体之 间的语义内容; 根据所述语义内容和当前的航空文本 中的各个所述航空实体的实体类别, 确定当前的 航空文本中的各个所述 航空实体之间的实体关系。 5.构建航空知识图谱的装置, 其特 征在于, 包括: 保存模块, 用于保存预 先设置的航空实体样本集; 第一训练模块, 用于对所述实体识别模型进行训练, 生成训练好的实体识别模型; 第二训练模块, 用于对所述实体关系抽取模型进行训练, 生成训练好的实体关系抽取 模型; 输入模块, 用于将多个航空文本 输入到训练好的所述实体识别模型中; 处理模块, 用于利用训练好的所述实体识别模型对每 个所述航空文本执 行以下处 理: 对所述航空文本的每 个字符进行 标注, 生成标注后的所述 航空文本; 根据标注后的所述 航空文本, 确定所述 航空文本中的航空实体; 根据所述航空文本 中的航空实体和所述航空实体样本集, 确定每个所述航空实体的实 体类别; 关系抽取模块, 用于利用训练好的所述实体关系抽取模型, 根据各个所述航空实体的 实体类别, 从各个所述 航空文本中抽取 各个所述 航空实体之间的实体关系; 构建模块, 用于根据各个所述航空实体和各个所述航空实体之间的实体关系, 构建航 空知识图谱。 6.根据权利要求5所述的装置, 其特 征在于, 所述处理模块, 在执行所述对所述航空文本的每个字符进行标注, 生成标注后的所述 航空文本时, 具体用于: 获取所述航空文本中每 个字符的上文信息和下文信息; 根据每个字符的所述上文信息, 生成每个字符的第 一输出向量, 其中, 所述第 一输出向权 利 要 求 书 2/4 页 3 CN 114722823 A 3

.PDF文档 专利 构建航空知识图谱的方法及装置、计算机可读介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 构建航空知识图谱的方法及装置、计算机可读介质 第 1 页 专利 构建航空知识图谱的方法及装置、计算机可读介质 第 2 页 专利 构建航空知识图谱的方法及装置、计算机可读介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。