说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210415291.5 (22)申请日 2022.04.20 (71)申请人 北京明略昭辉科技有限公司 地址 100000 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 于皓 张杰  (74)专利代理 机构 北京康盛知识产权代理有限 公司 11331 专利代理师 陶俊洁 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/45(2019.01) G06K 9/62(2022.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 用于构建知识体系的方法及装置、 电子设 备、 存储介质 (57)摘要 本申请涉及知识体系构建领域, 公开一种用 于构建知识 体系的方法, 包括: 获取语料; 确定语 料中的多个实体和各实体对应的实体向量; 对各 实体向量进行聚类获得若干实体簇; 确定各实体 簇对应的实体簇语义向量; 确定各 实体簇语义向 量之间的上下位关系; 按照上下位关系连接各实 体簇语义向量, 获得知识 体系。 这样, 对 各实体向 量进行聚类, 再获取实体簇语义向量, 能够自动 确定各实体存在的概念。 确定各实体簇语义向量 之间的上下位关系, 能够自动抽取出概念与概念 之间的关系。 根据概念之间的关系对概念进行连 接就能够自动构建知识体系, 从而提高知识体系 的构建效率。 本申请还公开一种用于构建知 识体 系的装置、 电子设备、 存 储介质。 权利要求书2页 说明书9页 附图5页 CN 114780745 A 2022.07.22 CN 114780745 A 1.一种用于构建知识体系的方法, 其特 征在于, 包括: 获取语料; 确定所述语料中的多个实体和各 所述实体对应的实体向量; 对各所述实体向量进行聚类获得若干实体簇; 确定各所述实体簇对应的实体簇语义向量; 确定各所述实体簇语义向量之间的上 下位关系; 按照上下位关系连接各 所述实体簇语义向量, 获得知识体系。 2.根据权利要求1所述的方法, 其特征在于, 确定所述语料中的多个实体和各所述实体 对应的实体向量, 包括: 利用预设的第 一知识抽取模型对所述语料进行实体抽取, 获得语料中的多个实体和各 实体对应的实体向量。 3.根据权利要求2所述的方法, 其特 征在于, 第一知识抽取模型通过以下 方式获取: 获取样本语料; 确定所述样本语料的多个关键词、 各所述关键词对应的词向量和各所述词向量对应的 权重; 对各所述词向量进行聚类, 获得若干词向量类簇; 根据各所述词向量类簇和各 所述词向量对应的权 重标注所述样本语料中的实体; 将标注过实体的样本语料输入预设的领域预训练模型进行训练, 获得第 二知识抽取模 型; 利用所述词向量类簇对所述第二知识抽取模型进行对比学习, 获得第一知识抽取模 型。 4.根据权利要求3所述的方法, 其特征在于, 根据 各所述词向量类簇和各所述词向量对 应的权重标注所述样本语料中的实体, 包括: 对各词向量类簇中的词向量分别按照词向量对应的权重进行排序, 获得各词向量序 列; 将处于词向量序列预设位数后的各词向量确定为备选词向量; 响应于专家的删除指令删除若干个备选词向量; 并响应于专家的命名指令对词向量类 簇命名, 获得类簇名称; 根据各类簇命名标注所述样本语料中的实体。 5.根据权利要求1所述的方法, 其特征在于, 实体簇包括若干子类簇; 确定实体簇对应 的实体簇语义向量, 包括: 分别获取实体簇的各子类簇与实体簇的类簇中心的距离; 根据各子类簇与类簇中心的距离确定各子类簇的权 重; 根据各子类簇的权 重确定实体簇对应的实体簇语义向量。 6.根据权利要求1所述的方法, 其特征在于, 按照上下位关系连接各所述实体簇语义向 量, 包括: 将处于上位关系的实体簇语义向量确定为备选语义向量; 确定备选语义向量对应的实体簇中的备选实体的数量; 在所述备选实体的数量小于或等于预设阈值的情况下, 按照上下位关系连接各实体簇权 利 要 求 书 1/2 页 2 CN 114780745 A 2语义向量。 7.根据权利要求1所述的方法, 其特征在于, 按照上下位关系连接各实体簇语义向量, 获得知识体系后, 还 包括: 将所述知识体系展示给用户。 8.一种用于构建知识体系的装置, 其特 征在于, 包括: 获取模块, 被 配置为获取语料; 第一确定模块, 被 配置为确定所述语料中的多个实体和各 所述实体对应的实体向量; 聚类模块, 被 配置为对各 所述实体向量进行聚类获得若干实体簇; 第二确定模块, 被 配置为确定各 所述实体簇对应的实体簇语义向量; 第三确定模块, 被 配置为确定各 所述实体簇语义向量之间的上 下位关系; 构建模块, 被 配置为按照上 下位关系连接各 所述实体簇语义向量, 获得知识体系。 9.一种电子设备, 包括处理器和存储有程序指令的存储器, 其特征在于, 所述处理器被 配置为在运行所述程序指 令时, 执行如权利要求 1至7任一项 所述的用于构建知识体系的方 法。 10.一种存储介质, 存储有程序指令, 其特征在于, 所述程序指令在运行时, 执行如权利 要求1至7任一项所述的用于构建知识体系的方法。权 利 要 求 书 2/2 页 3 CN 114780745 A 3

.PDF文档 专利 用于构建知识体系的方法及装置、电子设备、存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于构建知识体系的方法及装置、电子设备、存储介质 第 1 页 专利 用于构建知识体系的方法及装置、电子设备、存储介质 第 2 页 专利 用于构建知识体系的方法及装置、电子设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:19上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。