(19)中华 人民共和国 国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210118731.0
(22)申请日 2022.02.08
(65)同一申请的已公布的文献号
申请公布号 CN 114138985 A
(43)申请公布日 2022.03.04
(73)专利权人 深圳希施玛数据科技有限公司
地址 518000 广东省深圳市南 山区学苑大
道1001号南山智园A4栋1201
(72)发明人 穆旖旎 张中岩
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
代理人 赖妙旋
(51)Int.Cl.
G06F 16/36(2019.01)
G06N 5/02(2006.01)(56)对比文件
CN 113094587 A,2021.07.09
WO 2022022045 A1,202 2.02.03
US 20180 52885 A1,2018.02.2 2
闫斌.基于知识图谱的新闻推荐系统的研究
与实现. 《计算机技 术》 .2021,I138-2547.
审查员 王爽
(54)发明名称
文本数据处理的方法、 装置、 计算机设备以
及存储介质
(57)摘要
本申请涉及互联网产业的适用 于经济金融
目的的数据处理技术领域, 具体涉及一种文本数
据处理的方法、 装置、 计算机设备以及存储介质。
其中方法包括: 构建显性知识图谱, 所述显性知
识图谱的边权重相等; 获取用户的行为数据; 基
于所述用户的行为数据和所述显性知识图谱, 构
建隐性知识图谱; 基于所述显性知识图谱和所述
隐性知识图谱, 生成目标知识图谱。 实施本申请
实施例, 可以提高变量 生成的准确率和效率。
权利要求书2页 说明书18页 附图3页
CN 114138985 B
2022.04.26
CN 114138985 B
1.一种文本数据处 理的方法, 其特 征在于, 包括:
构建显性知识图谱, 所述显性知识图谱的边权 重相等;
获取用户的行为数据;
提取所述用户的行为数据的数据字段名, 将所述数据字段名输入至所述显性知识图
谱, 得到第二目标三元组;
基于用户的操作顺序, 生成数据时间戳, 将所述数据字段名和所述第二目标三元组输
入至所述显性知识图谱, 得到 子图谱;
对所述子 图谱的邻居节点信息进行聚合, 得到数据节点特征, 将所述数据节点特征和
所述数据时间戳输入至第一神经网络模型, 对用户操作 记录的空间关系信息和时间关系信
息进行聚合;
基于聚合后的所述用户操作记录的空间关系信 息和时间关系信 息, 更新所述子图谱的
边权重, 基于更新的所述 边权重, 更新所述子图谱, 得到隐性知识图谱;
基于所述显性知识图谱和所述隐性知识图谱, 生成目标知识图谱。
2.根据权利要求1所述的方法, 其特征在于, 所述构建显性知识图谱, 所述显性知识图
谱的边权 重相等, 包括:
从预设知识库中构建第一目标三元组;
将所述第一目标三元组输入至语言表示模型中进行编码, 得到三元组编码;
对所述三元组编码进行实体消歧, 得到目标三元组编码;
将所述目标三元组编码输入至注意力神经网络模型中, 得到 显性知识图谱。
3.根据权利要求1所述的方法, 其特征在于, 所述基于所述显性知识图谱和所述隐性知
识图谱, 生成目标知识图谱, 包括:
构建第二神经网络模型;
将所述显性知识图谱和所述隐性知识图谱输入至所述第 二神经网络模型, 得到目标知
识图谱。
4.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 在所述基于所述显性知识图谱和
所述隐性知识图谱, 生成目标知识图谱之后, 还 包括:
接收用户输入的查询信息;
基于所述目标知识图谱, 以所述查询信 息作为查询节点, 获取所述查询节点的K阶邻居
节点, 得到候选内容;
基于所述查询节点的边权重确定所述候选内容的推荐值, 其中, 所述推荐值与所述边
权重呈正相关;
将推荐值最高的前N个候选内容作为推荐内容进行推荐, 其中, 所述K和所述N为大于或
等于1的正整数。
5.根据权利要求4所述的方法, 其特征在于, 在所述基于所述显性知识图谱和所述隐性
知识图谱, 生成目标知识图谱之后, 还 包括:
设定图谱更新时间窗;
获取所述图谱更新时间窗内生成的用户的行为数据;
基于所述图谱更新时间窗内生成的用户的行为数据, 更新所述目标知识图谱。
6.一种文本数据处 理的装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页
2
CN 114138985 B
2第一构建模块, 用于构建显性知识图谱, 所述显性知识图谱边权 重相等;
第一获取模块, 用于获取用户的行为数据;
第二构建模块, 用于提取所述用户的行为数据的数据字段名, 将所述数据字段名输入
至所述显性知识图谱, 得到第二目标三元组; 还用于基于用户的操作顺序, 生成数据时间
戳, 将所述数据字段名和所述第二目标三元组输入至所述显性知识图谱, 得到子图谱; 还用
于对所述子图谱的邻居节点信息进行聚合, 得到数据节点特征, 将所述数据节点特征和所
述数据时间戳输入至第一神经网络模型, 对用户操作 记录的空间关系信息和时间关系信息
进行聚合; 还用于基于聚合后的所述用户操作记录的空间关系信息和时间关系信息, 更新
所述子图谱的边权 重, 基于更新的所述 边权重, 更新所述子图谱, 得到隐性知识图谱;
生成模块, 用于基于所述显性知识图谱和所述隐性知识图谱, 生成目标知识图谱。
7.一种计算机设备, 其特征在于, 包括处理器、 存储器和通信 接口, 其中, 所述存储器存
储有计算机程序, 所述计算机程序被配置由所述处理器执行, 所述计算机程序包括用于执
行权利要求1 ‑5中任一项所述的方法中的步骤的指令 。
8.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储计算机程序,
所述计算机程序使得计算机执 行以实现权利要求1 ‑5中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 114138985 B
3
专利 文本数据处理的方法、装置、计算机设备以及存储介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:58:51上传分享