(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210374719.6
(22)申请日 2022.04.11
(71)申请人 哈尔滨工业大 学 (深圳)
地址 518055 广东省深圳市南 山区桃源街
道深圳大 学城哈尔滨工业大 学校区
(72)发明人 李旭涛 梁俊平 陈武桥 龙永深
(74)专利代理 机构 北京隆源天恒知识产权代理
有限公司 1 1473
专利代理师 林安堂
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 50/10(2012.01)
G06F 16/36(2019.01)
G06F 40/284(2020.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
服务流程模型训练方法及服务流程生成方
法
(57)摘要
本发明提供了一种服务流程模型训练方法
及服务流程生成方法, 训练方法包括: 获取文本
数据集, 所述文本数据集包括多个不同服务流程
的描述文本; 对 各个所述描述文本中的实际事件
词进行标注, 获得第一训练集; 采用所述第一训
练集对预先建立的第一深度学习模 型进行训练,
获得所述事件抽取模型; 对各个所述描述文本中
每两个所述实际事件词之间的实际事件关系词
进行标注, 获得第二训练集; 采用所述第二训练
集对预先建立的第二深度学习模 型进行训练, 获
得所述事件关系抽取模型。 本发 明的技术方案能
够提高服务流程的制定效率和生成的服务流程
的可靠性。
权利要求书4页 说明书16页 附图4页
CN 114943410 A
2022.08.26
CN 114943410 A
1.一种服务流程模型训练方法, 其特征在于, 服务流程模型包括事件抽取模型和事件
关系抽取模型, 方法包括:
获取文本数据集, 所述文本数据集包括多个不同服 务流程的描述文本;
对各个所述描述文本中的实 际事件词进行标注, 获得第一训练集; 采用所述第一训练
集对预先建立的第一深度学习模型进行训练, 获得 所述事件抽取模型;
对各个所述描述文本中每两个所述实际事件词之间的实际事件关系词进行标注, 获得
第二训练集; 采用所述第二训练集对预先建立的第二深度学习模型进行训练, 获得所述事
件关系抽取模型。
2.根据权利要求1所述的服务流程模型训练方法, 其特征在于, 所述第 一深度学习模型
包括触发词提取模型和论元提取模型, 所述事件抽取模型包括训练好的触发词提取模型和
训练好的论元提取模型, 所述第一训练集包括多个对应的所述描述文本和所述实际事件词
组成的第一数据对, 其中, 所述 实际事件词包括所述服务流程中的实际触发词和实际论元,
所述实际论元表示与所述 服务流程中事件相关联的元 素;
所述采用所述第一训练集对预 先建立的第一深度学习模型进行训练包括:
对所述描述文本进行基于 字的分词处 理, 获得字序列;
将所述字序列输入所述触发词提取模型, 输出 预测触发词;
基于预设的第 一损失函数, 根据所述预测触发词和对应的所述实际触发词校正所述触
发词提取模型 的参数, 直至所述触发词提取模型 的精度达到第一预设范围, 获得所述训练
好的触发词提取模型;
将所述字序列和所述实际触发词在所述字序列中的位置输入所述论元提取模型, 输出
预测论元;
基于预设的第 二损失函数, 根据所述预测论元和对应的所述实际论元校正所述论元提
取模型的参数, 直至所述论元提取模型 的精度达到第二预设范围, 获得所述训练好的论元
提取模型。
3.根据权利要求2所述的服务流程模型训练方法, 其特征在于, 所述触发词提取模型包
括第一Bert模型、 第一Mid ‑Linear层和第一指针标注网络, 所述将所述字序列输入所述触
发词提取模型, 输出 预测触发词包括:
将所述字序列输入所述第一B ert模型, 通过所述第一B ert模型对所述字序列中的各个
字符进行编码, 输出第一编码序列;
将所述第一编码序列输入所述第一Mid ‑Linear层, 执行位置序列生成步骤, 输出触发
词开始位置序列和触发词结束位置序列;
将所述触发词开始位置序列和所述触发词结束位置序列输入所述第 一指针标注网络,
执行位置确定步骤, 确定触发词开始位置和触发词结束位置;
执行特定词提取步骤, 根据 所述触发词开始位置和所述触发词结束位置从所述字序列
中提取所述预测触发词。
4.根据权利要求2所述的服务流程模型训练方法, 其特征在于, 所述论元提取模型包括
第二Bert模型、 Conditinal ‑Layer Norm层、 第 二Mid‑Linear层和第 二指针标注网络, 所述
将所述字序列和所述 实际触发词在所述字序列中的位置输入所述论元提取模型, 输出预测
论元包括:权 利 要 求 书 1/4 页
2
CN 114943410 A
2将所述字序列输入所述第二B ert模型, 通过所述第二B ert模型对所述字序列中的各个
字符进行编码, 输出第二编码序列;
将所述第二编码序列和所述实际触发词在 所述字序列中的位置输入所述Conditinal ‑
Layer Norm层, 输出处 理序列;
将所述处理序列输入所述第二Mid ‑Linear层, 执行位置序列生成步骤, 输出论元开始
位置序列和论元 结束位置序列;
将所述论元开始位置序列和所述论元结束位置序列输入所述第 二指针标注网络, 执行
位置确定步骤, 确定论元开始位置和论元 结束位置;
执行特定词提取步骤, 根据 所述论元开始位置和所述论元结束位置从所述字序列中提
取所述预测论元。
5.根据权利要求1所述的服务流程模型训练方法, 其特征在于, 所述第 二深度学习模型
包括第三Bert模型、 编码Concatenate层、 第三Mid ‑Linear层和第三指针标注网络, 所述第
二训练集包括多个对应的所述描述文本和特征词组成的第二数据对, 所述特征词包括任意
两个所述实际事 件词和对应的实际事 件关系词;
所述采用所述第二训练集对预 先建立的第二深度学习模型进行训练包括:
对所述描述文本进行基于 字的分词处 理, 获得字序列;
将所述字序列输入所述第三B ert模型, 通过所述第三B ert模型对所述字序列中的各个
字符进行编码, 获得第三编码序列;
将所述第三编码序列和任意两个所述实际事件词在所述第三编码序列中的位置输入
所述编码Co ncatenate层, 输出 特征序列;
将所述特征序列输入所述第三Mid ‑Linear层, 执行位置序列生成步骤, 输出事件关系
词开始位置序列和事 件关系词结束位置序列;
将所述事件关系词开始位置序列和所述事件关系词结束位置序列输入所述第三指针
标注网络, 执 行位置确定步骤, 确定事 件关系词开始位置和事 件关系词结束位置;
执行特定词提取步骤, 根据 所述事件关系词开始位置和所述事件关系词结束位置从所
述字序列中提取 预测事件关系词;
基于预设的第 三损失函数, 根据所述预测事件关系词和对应的所述实际事件关系词校
正所述第二深度学习模型 的参数, 直至所述第二深度学习模型的精度达到第三预设范围,
获得所述事件关系抽取模型。
6.根据权利要求5所述的服务流程模型训练方法, 其特征在于, 对各个所述描述文本中
每两个所述实际事 件词之间的实际事 件关系词进行 标注之后, 还 包括:
确定标注的各个所述实际事件关系词的关系类型, 根据 所述实际事件关系词和对应的
所述关系类型构建事件关系词库, 其中, 所述关系类型包括顺序关系、 并发关系和选择关
系;
和/或,
所述根据所述事件关系词开始位置和所述事件关系词结束位置从所述字序列中提取
所述预测事 件关系词之后, 还 包括:
在预设的事 件关系词库中确定所述预测事 件关系词对应的关系类型。
7.根据权利要求3至6任一项所述的服务流程模型训练方法, 其特征在于, 所述执行位权 利 要 求 书 2/4 页
3
CN 114943410 A
3
专利 服务流程模型训练方法及服务流程生成方法
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:58:59上传分享