说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210405768.1 (22)申请日 2022.04.18 (71)申请人 北京明略昭辉科技有限公司 地址 100000 北京市海淀区北三环西路25 号27号楼二层2020室 (72)发明人 于皓 张杰  (74)专利代理 机构 北京康盛知识产权代理有限 公司 11331 专利代理师 陶俊洁 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/279(2020.01) G06F 16/35(2019.01) G06F 16/36(2019.01) (54)发明名称 用于检测实体类型多义性的方法及装置、 电 子设备、 存 储介质 (57)摘要 本申请涉及实体类型多义性检测领域, 公开 一种用于检测实体类型多义性的方法, 包括: 获 取语料; 确定语料中的若干实体、 各实体对应的 实体类型和各 实体对应的实体向量; 按照实体类 型将实体对应的实体向量分成若干向量分组; 分 别对各向量 分组中的实体向量进行语义聚类, 获 得各向量分组分别对应的类簇; 根据各向量分组 分别对应的类簇确定各向量分组对应的实体类 型是否存在多义性。 这样, 由于在实体类型存在 多义的情况下, 实体类型对应的向量分组中会存 在若干个分离的类簇。 因此, 根据实体类型对应 的向量分组中的类簇能够确定实体类型是否存 在多义性。 本申请还公开一种用于检测实体类型 多义性的装置、 电子设备、 存 储介质。 权利要求书2页 说明书8页 附图5页 CN 114757202 A 2022.07.15 CN 114757202 A 1.一种用于检测实体 类型多义 性的方法, 其特 征在于, 包括: 获取语料; 确定所述语料中的若干实体、 各所述实体对应的实体类型和各所述实体对应的实体向 量; 按照实体 类型将实体对应的实体向量分成若干向量分组; 分别对各向量分组中的实体向量进行语义聚类, 获得 各向量分组分别对应的类簇; 根据各向量分组分别对应的类簇确定各向量分组对应的实体 类型是否存在多义 性。 2.根据权利要求1所述的方法, 其特征在于, 确定所述语料中的若干实体、 各所述实体 对应的实体 类型和各 所述实体对应的实体向量, 包括: 利用预设的知识抽取模型对所述语料进行实体抽取, 获得若干实体、 各所述实体对应 的实体类型、 各所述实体对应的to ken向量和各 所述实体对应的to ken向量的权 重; 分别将实体对应的token向量按照实体对应的token向量的权重进行加权获得各实体 对应的实体向量。 3.根据权利要求2所述的方法, 其特 征在于, 知识抽取模型通过以下 方式获得: 获取样本语料; 对样本语料 标注实体 类型; 将标注有实体类型的样本语料输入预设的备选训练模型进行训练, 获得知识抽取模 型。 4.根据权利要求3所述的方法, 其特 征在于, 备选训练模型通过以下 方式获得: 将样本语料输入预设的待训练模型进行训练, 获得备选训练模型; 所述待训练模型为 自然语言的预训练模型。 5.根据权利要求1所述的方法, 其特征在于, 根据向量分组对应的类簇确定向量分组对 应的实体 类型是否存在多义 性, 包括: 获取向量分组对应的各类簇的类内距离和各类簇之间的类间距离; 根据类间距离和类内距离, 获取类簇对应的向量分组的总语义距离; 根据所述总语义距离确定向量分组对应的实体 类型是否存在多义 性。 6.根据权利要求5所述的方法, 其特征在于, 根据总语义距离确定向量分组对应的实体 类型是否存在多义 性, 包括: 在所述总语义距离大于预设阈值的情况下, 确定所述总语义距离对应的向量分组对应 的实体类型存在多义 性; 和/或, 在所述总语义距离小于或等于预设阈值的情况下, 确定所述总语义距离对应的向量分 组对应的实体 类型不存在多义 性。 7.根据权利要求1所述的方法, 其特征在于, 根据向量分组对应的类簇确定向量分组对 应的实体 类型是否存在多义 性后, 还包括: 在向量分组对应的实体类型存在多义性的情况下, 将向量分组对应的类簇展示给用 户。 8.一种用于检测实体 类型多义 性的装置, 其特 征在于, 包括: 获取模块, 被 配置为获取语料; 确定模块, 被配置为确定所述语料中的若干实体、 各所述实体对应的实体类型和各所权 利 要 求 书 1/2 页 2 CN 114757202 A 2述实体对应的实体向量; 分类模块, 被 配置为按照实体 类型将实体对应的实体向量分成若干向量分组; 聚类模块, 被配置为分别对各向量分组中的实体向量进行语义聚类, 获得各向量分组 分别对应的类簇; 多义性确定模块, 被配置为根据各向量分组分别对应的类簇确定各向量分组对应的实 体类型是否存在多义 性。 9.一种电子设备, 包括处理器和存储有程序指令的存储器, 其特征在于, 所述处理器被 配置为在运行所述程序指 令时, 执行如权利要求 1至7任一项 所述的用于检测实体类型多义 性的方法。 10.一种存储介质, 存储有程序指令, 其特征在于, 所述程序指令在运行时, 执行如权利 要求1至7任一项所述的用于检测实体 类型多义 性的方法。权 利 要 求 书 2/2 页 3 CN 114757202 A 3

.PDF文档 专利 用于检测实体类型多义性的方法及装置、电子设备、存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于检测实体类型多义性的方法及装置、电子设备、存储介质 第 1 页 专利 用于检测实体类型多义性的方法及装置、电子设备、存储介质 第 2 页 专利 用于检测实体类型多义性的方法及装置、电子设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:59:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。