说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210184161.5 (22)申请日 2022.02.25 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 吴雨薇 卞东海 蔡远俊 郑烨翰  徐伟建  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 代理人 杨静 (51)Int.Cl. G06F 40/186(2020.01) G06F 16/34(2019.01) G06F 16/36(2019.01) G06F 16/35(2019.01)G06F 40/258(2020.01) G06F 40/216(2020.01) (54)发明名称 文章生成方法、 装置、 电子设备以及存储介 质 (57)摘要 本公开提供了一种文章生成方法、 装置、 电 子设备以及存储介质, 涉及人工智能技术领域, 尤其涉及自然语 言处理和知识图谱技术领域。 具 体实现方案为: 根据目标事件, 得到目标关联事 件集, 其中, 目标关联事件集包括至少一个目标 关联事件, 目标关联事件的发生时刻与目标事件 的发生时刻处于同一预定时段内; 确定候选素材 集, 其中, 候选素材集包括与目标事件对应的至 少一个候选素材和与 目标关联事件对应的至少 一个候选素材; 对候选素材集进行处理, 得到与 至少一个候选素材对应的主体信息和概要信息; 根据预定文章模板以及与至少一个候选素材对 应的主体信息和概要信息, 生成目标文章。 权利要求书5页 说明书15页 附图4页 CN 114417808 A 2022.04.29 CN 114417808 A 1.一种文章 生成方法, 包括: 根据目标事件, 得到目标关联事件集, 其中, 所述目标关联事件集包括至少一个目标关 联事件, 所述目标关联事 件的发生时刻与所述目标事 件的发生时刻处于同一预定时段内; 确定候选素材集, 其中, 所述候选素材集包括与所述目标事件对应的至少一个候选素 材和与所述目标关联事 件对应的至少一个候选素 材; 对所述候选素材集进行处理, 得到与所述至少一个候选素材对应的主体信 息和概要信 息; 以及 根据预定文章模板以及与 所述至少一个候选素材对应的主体信 息和概要信 息, 生成目 标文章。 2.根据权利要求1所述的方法, 其中, 所述 根据目标事 件, 得到目标关联事 件集, 包括: 确定所述目标事 件的至少一个目标对象; 以及 基于事件知识图谱, 根据所述至少一个目标对象, 得到所述目标关联事 件集。 3.根据权利要求2所述的方法, 其中, 所述确定所述目标事件的至少一个目标对象, 包 括: 对所述目标事 件进行处 理, 得到至少一个候选对象; 以及 基于第一预定 选择策略, 从所述至少一个候选对象中确定所述至少一个目标对象。 4.根据权利要求3所述的方法, 其中, 所述对所述目标事件进行处理, 得到至少一个候 选对象, 包括: 对所述目标事 件进行对象提取, 得到 至少一个核心对象; 以及 基于对象知识图谱, 根据所述至少一个核心对象, 得到所述至少一个候选对象。 5.根据权利要求2~4中任一项所述的方法, 其中, 所述基于事件知识图谱, 根据 所述至 少一个目标对象, 得到所述目标关联事 件集, 包括: 基于所述事件知识图谱, 根据所述至少一个目标对象, 得到候选关联事件集, 其中, 所 述候选关联事 件集包括至少一个候选关联事 件; 以及 基于第二预定 选择策略, 从所述 候选关联事 件集中确定所述目标关联事 件集。 6.根据权利要求5所述的方法, 其中, 所述基于第二预定选择策略, 从所述候选关联事 件集中确定所述目标关联事 件集, 包括: 确定所述候选关联事件集中每个候选关联事件与 所述目标事件之间的关联度, 得到至 少一个第一关联度; 以及 根据所述至少一个第一关联度, 从所述 候选关联事 件集中确定所述目标关联事 件集。 7.根据权利要求6所述的方法, 其中, 所述根据所述至少一个第一关联度, 从所述候选 关联事件集中确定所述目标关联事 件集, 包括: 根据所述至少一个第一关联度, 从所述候选关联事件集中确定第一候选关联事件子 集; 以及 根据所述第 一候选关联事件子集中候选关联事件的发生 时刻, 从所述第 一候选关联事 件子集中确定所述目标关联事 件集。 8.根据权利要求5所述的方法, 其中, 所述基于第二预定选择策略, 从所述候选关联事 件集中确定所述目标关联事 件集, 包括: 根据所述候选关联事件集中候选关联事件的发生 时刻, 从所述候选关联事件集中确定权 利 要 求 书 1/5 页 2 CN 114417808 A 2所述目标关联事 件。 9.根据权利要求8所述的方法, 其中, 所述根据所述候选关联事件集中候选关联事件的 发生时刻, 从所述 候选关联事 件集中确定所述目标关联事 件, 包括: 根据所述候选关联事件集中候选关联事件的发生 时刻, 从所述候选关联事件集中确定 第二候选关联事 件子集; 确定所述第 二候选关联事件子集中候选关联事件与所述目标事件之间的第 二关联度, 得到至少一个第二关联度; 以及 根据所述至少一个第 二关联度, 从所述第 二候选关联事件子集中确定所述目标关联事 件集。 10.根据权利要求1~9中任一项所述的方法, 其中, 所述概要信息包括标题信息、 摘要 信息和线索信息; 其中, 所述对所述候选素材集进行处理, 得到与所述至少一个候选素材对应的主体信 息和线索信息, 包括: 针对所述 候选素材集中的每 个候选素 材, 根据所述 候选素材, 得到所述 候选素材的标题信息、 主体信息和摘要信息; 在确定所述摘要信息满足预定条件的情况 下, 将所述 候选素材确定为目标 素材; 以及 对所述目标 素材进行线索提取, 得到所述目标 素材的线索信息 。 11.根据权利要求10所述的方法, 其中, 所述根据所述候选素材, 得到所述候选素材的 标题信息、 主体信息和摘要信息, 包括: 根据所述 候选素材, 得到所述 候选素材的标题信息和主体信息; 以及 利用摘要算法处 理所述主体信息, 得到所述 候选素材的摘要信息 。 12.根据权利要求10或11所述的方法, 其中, 所述对所述目标素材进行线索提取, 得到 所述目标 素材的线索信息, 包括: 利用事件抽取算法处理所述目标素材, 得到所述目标素材的线索信 息, 其中, 所述线索 信息包括以下至少一项: 事 件、 所述事 件的发生时刻和与所述事 件的参与者。 13.根据权利要求1~12中任一项所述的方法, 其中, 所述根据预定文章模板以及与所 述至少一个候选素 材对应的主体信息和概要信息, 生成目标文章, 包括: 基于预定结构化处理策略, 对所述至少一个候选素材进行处理, 得到结构化处理结果; 以及 根据所述预定文章模板、 所述结构化处理结果以及与 所述至少一个候选素材对应的主 体信息和概要信息, 生成所述目标文章。 14.根据权利要求13所述的方法, 其中, 所述基于预定结构化处理策略, 对所述至少一 个候选素 材进行处 理, 得到结构化处 理结果, 包括: 对所述至少一个候选素材进行分组, 得到至少一个候选素材组, 其中, 不同所述候选素 材组关联的对象彼此不同; 针对所述每个候选素材组, 基于预定排序策略, 对所述候选素材组中的至少一个所述 候选素材进行排序, 得到排序结果; 以及 根据所述至少一个候选素 材组各自的排序结果, 得到所述结构化处 理结果。 15.根据权利要求1~14中任一项所述的方法, 还 包括:权 利 要 求 书 2/5 页 3 CN 114417808 A 3

.PDF文档 专利 文章生成方法、装置、电子设备以及存储介质

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文章生成方法、装置、电子设备以及存储介质 第 1 页 专利 文章生成方法、装置、电子设备以及存储介质 第 2 页 专利 文章生成方法、装置、电子设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:58:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。