说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210139349.8 (22)申请日 2022.02.15 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 孙梓淇 张智  (74)专利代理 机构 深圳市隆天联鼎知识产权代 理有限公司 4 4232 专利代理师 孙强 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/38(2019.01) G06F 40/284(2020.01)G06K 9/62(2022.01) (54)发明名称 文本生成方法、 装置、 设备及 介质 (57)摘要 本申请涉及人工智能技术领域, 具体公开了 一种文本生成方法、 装置、 设备及介质, 所述文本 生成方法通过 获取主题词汇, 并获取预先构建的 知识图谱; 计算主题词汇以及图谱节 点之间的匹 配度, 以根据匹配度大于匹配度阈值的图谱节点 得到至少一个知识子图; 根据知识子图, 得到关 键词集合 以及关键词集合中每个关键词针对知 识子图的路径特征; 将关键词集合以及关键词集 合中每个关键词针对知识子图的路径特征输入 预先训练的文本生成模型中, 得到目标文本。 以 通过知识图谱以及主题词汇进行词汇扩充, 以得 到足够数量的关键词, 进而将关键词输入文本生 成模型, 以得到内容更加丰富的目标文本, 实现 了根据极少的词汇信息即可自动生成内容丰富 的文本信息 。 权利要求书2页 说明书12页 附图3页 CN 114491077 A 2022.05.13 CN 114491077 A 1.一种文本生成方法, 其特 征在于, 所述方法包括: 获取主题词汇, 并获取 预先构建的知识图谱; 其中, 所述知识图谱 包括多个图谱节点; 计算所述主题词汇以及所述图谱节点之间的匹配度, 以根据所述匹配度 大于匹配度阈 值的图谱节点得到 至少一个知识子图; 根据所述知识子图, 得到关键词集合以及所述关键词集合中每个关键词针对所述知识 子图的路径特 征; 将所述关键词集合以及所述关键词集合中每个关键词针对知识子图的路径特征输入 预先训练的文本生成模型中, 得到目标文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述根据匹配度大于匹配度阈值的图谱节 点得到至少一个知识子图, 包括: 将所述匹配度大于匹配度阈值的图谱节点作为目标节点, 得到目标节点 集合; 根据所述知识图谱获取与 所述目标节点相邻的图谱节点, 将所述相邻的图谱节点添加 至所述目标节点 集合, 直至所述目标节点 集合中目标节点的数量达 到预设节点数量; 根据所述目标节点集合中的目标节点以及所述目标节点之间的关系, 得到所述知识子 图。 3.根据权利要求1所述的方法, 其特征在于, 所述根据匹配度大于匹配度阈值的图谱节 点得到至少一个知识子图, 包括: 将所述匹配度 大于匹配度阈值的图谱节点作为起始节点, 根据 所述起始节点向所述知 识图谱中的其它图谱节点进行随机游走; 将所述随机游走中遍历的图谱节点作为目标节点, 直至所述目标节点的数量达到预设 节点数量, 得到目标节点 集合; 根据所述目标节点集合中的目标节点以及所述目标节点之间的关系, 得到所述知识子 图。 4.根据权利要求1所述的方法, 其特征在于, 所述文本生成模型是基于自注意力 机制的 编码解码模型训练得到的, 所述将所述关键词集合以及所述关键词集合中每个关键词针对 知识子图的路径特 征输入预 先训练的文本生成模型中, 得到目标文本, 包括: 对所述关键词集 合中的关键词进行编码处 理, 得到所述关键词对应的词向量; 对所述关键词对应的词向量以及所述关键词针对知识子图的路径特征进行融合, 得到 每个关键词对应的特 征向量; 通过自注意力机制对所述特 征向量进行处 理, 得到目标文本 。 5.根据权利要求4所述的方法, 其特征在于, 所述通过自注意力 机制对所述特征向量进 行处理, 得到目标文本, 包括: 根据所述每个关键词对应的特征向量和当前时间步的输出隐向量, 确定所述每个关键 词在所述当前时间步对应的注意力权值; 根据所述每个关键词在所述当前时间步对应的注意力 权值、 所述当前时间步的输出隐 向量和当前时间步的输入向量, 确定所述当前时间步对应的文本词汇; 遍历所有时间步, 根据每 个时间步输出的文本词汇得到目标文本 。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述获取预先构建的知识图谱, 包括:权 利 要 求 书 1/2 页 2 CN 114491077 A 2对所述主题词汇进行分类, 得到所述主题词汇对应的分类结果; 获取与所述分类结果匹配的知识图谱。 7.根据权利要求1至 5任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取所述目标文本中每个字符的字向量以及文本向量; 其中, 所述字向量用于表示字 符的标识信息, 所述文本向量用于表示字符在所述目标文本中的语义信息; 对所述每个字符的字向量以及文本向量进行融合, 得到所述每个字符对应的融合向 量; 将所述每个字符对应的融合向量输入预先训练的文本评价网络, 通过所述文本评价网 络对所述每个字符对应的融合向量进行处理, 得到所述目标文本对应的文本质量评价信 息。 8.一种文本生成装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取主题词汇, 并获取预先构建的知识图谱; 其中, 所述知识图谱包括 多个图谱节点; 知识子图计算模块, 用于计算所述主题词汇以及所述图谱节点之间的匹配度, 以根据 所述匹配度大于匹配度阈值的图谱节点得到 至少一个知识子图; 关键词及特征获取模块, 用于根据所述知识子 图, 得到关键词集合以及所述关键词集 合中每个关键词针对所述知识子图的路径特 征; 文本生成模块, 用于将所述关键词集合以及所述关键词集合中每个关键词针对知识子 图的路径特 征输入预 先训练的文本生成模型中, 得到目标文本 。 9.一种计算机设备, 其特 征在于, 所述计算机设备包括存 储器和处 理器; 所述存储器, 用于存 储计算机程序; 所述处理器, 用于执行所述的计算机程序并在执行所述的计算机程序时实现如权利要 求1至7中任一项所述的文本生成方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序被处理器执行时使 所述处理器实现如权利要求 1至7中任一项 所述的文 本生成方法。权 利 要 求 书 2/2 页 3 CN 114491077 A 3

.PDF文档 专利 文本生成方法、装置、设备及介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本生成方法、装置、设备及介质 第 1 页 专利 文本生成方法、装置、设备及介质 第 2 页 专利 文本生成方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。