说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221042684 4.7 (22)申请日 2022.04.21 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 马婷 黄龙涛 薛晖  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 柴艳波 刘戈 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 16/958(2019.01) G06N 5/02(2006.01) (54)发明名称 数据处理、 模型训练、 风险识别方法、 设备及 存储介质 (57)摘要 本申请实施例提供一种数据处理、 模型训 练、 风险识别方法、 设备及存储介质。 其中, 方法 包括如下的步骤: 从超关系知识图谱中确定出五 元组事实; 以第一节点代替所述五元组事实中的 主三元组的方式, 将所述五元 组事实修改为第一 目标三元组事实; 根据所述第一目标三元组事 实, 构建第一知识图谱; 根据所述主三元组的嵌 入表示, 确定所述第一节点的初始嵌入表示; 根 据所述第一节 点的初始嵌入表示, 对 所述第一知 识图谱进行图嵌入处理, 得到所述第一目标三元 组事实的嵌入表示; 根据所述第一目标三元组事 实的嵌入表示, 确定所述五元组事实的嵌入表 示。 本申请实施例提供的方案能够提高超关系知 识图谱中超关系事实的嵌入合理性。 权利要求书3页 说明书15页 附图7页 CN 114942997 A 2022.08.26 CN 114942997 A 1.一种数据处 理方法, 其中, 包括: 从超关系知识图谱中确定出五元组事实; 以第一节点代替所述五元组事实中的主三元组的方式, 将所述五元组事实修改为第 一 目标三元组事实; 根据所述第一目标三元组事实, 构建第一知识图谱; 根据所述主三元组的嵌入表示, 确定所述第一节点的初始嵌入表示; 根据所述第一节点的初始嵌入表示, 对所述第一知识图谱进行图嵌入处理, 得到所述 第一目标三元组事实的嵌入表示; 根据所述第一目标三元组事实的嵌入表示, 确定所述五元组事实的嵌入表示。 2.根据权利要求1所述的方法, 其中, 还 包括: 以删除所述五元组事实中的限定词的方式, 将所述五元组事实修改为第 二目标三元组 事实; 根据所述第二目标三元组事实, 构建第二知识图谱; 对所述第二知识图谱进行图嵌入处 理, 得到所述第二目标三元组事实的嵌入表示; 根据所述第二目标三元组事实的嵌入表示, 确定所述主三元组的嵌入表示。 3.根据权利要求1所述的方法, 其中, 还 包括: 从所述超关系知识图谱中确定出三元组事实; 将所述三元组事实中的目标节点替换为用于表示所述三元组事实的第 二节点, 得到第 三目标三元组事实; 根据所述第一目标三元组事实, 构建第一知识图谱, 包括: 根据所述第一目标三元组事实以及所述第三目标三元组事实, 构建第一知识图谱。 4.根据权利要求3所述的方法, 其中, 还 包括: 根据所述 三元组事实的嵌入表示, 确定所述第二节点的初始嵌入表示; 根据所述第一节点的初始嵌入表示, 对所述第一知识图谱进行图嵌入处理, 得到所述 第一目标三元组事实的嵌入表示, 包括: 根据所述第 一节点的初始嵌入表示以及所述第 二节点的初始嵌入表示, 对所述第 一知 识图谱进 行图嵌入处理, 得到所述第一目标三元组事实的嵌入表示以及所述第三目标三元 组事实的嵌入表示。 5.根据权利要求1至4中任一项所述的方法, 其中, 根据所述第一节点的初始嵌入表示, 对所述第一知识图谱进行图嵌入处 理, 得到所述第一目标三元组事实的嵌入表示, 包括: 根据所述第 一节点的初始嵌入表示, 利用基于图神经网络的计算模型对所述第 一知识 图谱进行图嵌入处 理, 得到所述第一目标三元组事实的嵌入表示; 所述计算模型 是基于样本超关系知识图谱及其训练标签训练的。 6.根据权利要求5所述的方法, 其中, 所述第一知识图谱中包括第三节点; 所述计算模型用于: 在所述第一知识图谱中确定出所述第 三节点的多个邻域元素; 所述第 三节点的多个邻 域元素包括所述第三节点的邻居节点及其与所述第三节点之间的边; 根据所述第三节点的多个邻域元 素的嵌入表示, 更新所述第三节点的嵌入表示。 7.根据权利要求6所述的方法, 其中, 所述第三节点的邻居节点为多个; 所述第三节点权 利 要 求 书 1/3 页 2 CN 114942997 A 2的多个邻居节点中包括第一邻居节点; 根据所述第三节点的多个邻域元 素的嵌入表示, 更新所述第三节点的嵌入表示, 包括: 对所述第一邻居节点的嵌入表示以及所述第一邻居节点与所述第三节点之间的边的 嵌入表示进行合并, 得到所述第一邻居节点对应的合并嵌入表示; 对所述第三节点的多个邻居节点各自对应的合并嵌入表示进行融合, 得到 融合后嵌入 表示, 以作为更新后的所述第三节点的嵌入表示。 8.根据权利要求1至4中任一项所述的方法, 其中, 还 包括: 根据所述超关系知识图谱以及所述超关系知识图谱中五元组事实的嵌入表示, 对待 匹 配信息进行知识匹配。 9.一种模型训练方法, 其中, 包括: 从样本超关系知识图谱中确定出五元组事实; 以第一节点代替所述五元组事实中的主三元组的方式, 将所述五元组事实修改为第 一 目标三元组事实; 根据所述第一目标三元组事实, 构建第一知识图谱; 根据所述主三元组的嵌入表示, 确定所述第一节点的初始嵌入表示; 根据所述目标节点的初始嵌入表示, 利用基于图神经网络的计算模型对所述第 一目标 知识图谱进行图嵌入处 理, 得到所述第一目标三元组事实的嵌入表示; 根据所述第一目标三元组事实的嵌入表示, 确定所述五元组事实成立的第一可能性; 根据所述第一可能性以及所述五元组事实的训练标签, 对所述计算模型进行优化。 10.根据权利要求9所述的方法, 其中, 还 包括: 以删除所述五元组事实中的限定词的方式, 将所述五元组事实修改为第 二目标三元组 事实; 根据所述第二目标三元组事实, 构建第二知识图谱; 利用所述计算模型对所述第 二知识图谱进行图嵌入处理, 得到所述第 二目标三元组事 实的嵌入表示; 根据所述第二目标三元组事实的嵌入表示, 确定所述五元组事实成立的第二可能性; 根据所述第一可能性以及所述五元组事实的训练标签, 对所述计算模型进行优化, 包 括: 根据所述第一可能性和所述第二可能性, 确定目标 可能性; 根据所述目标 可能性以及所述五元组事实的训练标签, 对所述计算模型进行优化。 11.根据权利要求9所述的方法, 其中, 还 包括: 获取样本信息; 利用所述计算模型对所述样本信息进行 特征提取, 得到所述样本信息的样本特 征; 确定所述样本特 征与所述样本超关系知识图谱中五元组事实的嵌入表示的匹配度; 根据所述匹配度以及所述样本信息的训练标签, 确定匹配损失值; 根据所述第一可能性以及所述五元组事实的训练标签, 对所述计算模型进行优化, 包 括: 根据所述第一可能性以及所述五元组事实的训练标签, 确定表示损失值; 根据所述表示损失值和所述匹配损失值, 对所述计算模型进行优化。权 利 要 求 书 2/3 页 3 CN 114942997 A 3

.PDF文档 专利 数据处理、模型训练、风险识别方法、设备及存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理、模型训练、风险识别方法、设备及存储介质 第 1 页 专利 数据处理、模型训练、风险识别方法、设备及存储介质 第 2 页 专利 数据处理、模型训练、风险识别方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:41上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。