(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210509636.3
(22)申请日 2022.05.11
(71)申请人 城云科技 (中国) 有限公司
地址 310052 浙江省杭州市滨江区长河街
道江南大道588号恒 鑫大厦主楼17层、
18层
(72)发明人 毛云青 陈思瑶 王国梁 葛俊
李洁
(74)专利代理 机构 杭州汇和信专利代理有限公
司 33475
专利代理师 董超
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06Q 50/18(2012.01)G06Q 50/26(2012.01)
(54)发明名称
联合实体关系抽取的纠纷事件分类方法及
其应用
(57)摘要
本申请提出了联合实体关系抽取的纠纷事
件分类方法及其应用, 包括以下步骤: S00、 根据
纠纷事件字段从纠纷事件库中获取纠纷事件内
容; S10、 根据纠纷事件内容分别获取纠纷事件内
容涉及的人名、 第一纠纷事件特征以及第一实体
关系特征; S20、 根据第一纠纷事件特征和第一实
体关系特征获取纠纷事件和实体关系的关联性;
S30、 根据纠纷事件和实体关系的关联性获取包
含纠纷事件类别和实体关系关联性的纠纷事件
特征; S40、 将 包含纠纷事件类别和实体关系关联
性的纠纷事件特征后接纠纷事件分类层以获取
纠纷事件的类别。 本申请能够显著提升纠纷事件
分类的精确率和召回率。
权利要求书3页 说明书10页 附图6页
CN 114925201 A
2022.08.19
CN 114925201 A
1.联合实体关系抽取的纠纷事 件分类方法, 其特 征在于, 包括以下步骤:
S00、 根据纠纷事 件字段从纠纷事 件库中获取纠纷事 件内容;
S10、 根据 所述纠纷事件内容分别获取纠纷事件内容涉及的人名、 第一纠纷事件特征以
及第一实体关系特 征;
S20、 根据所述第一纠纷事件特征和所述第一实体关系特征获取纠纷事件和实体关系
的关联性;
S30、 根据所述纠纷事件和 实体关系的关联性获取包含纠纷事件类别和实体关系关联
性的纠纷事 件特征;
S40、 将所述包含纠纷事件类别和实体关系关联性的纠纷事件特征后接纠纷事件分类
层以获取纠纷事 件的类别。
2.如权利要求1所述的联合实体关系抽取的纠纷事件分类方法, 其特征在于, 步骤S10
中, 将所述纠纷事件内容输入到纠纷事件分类模型获取所述第一纠纷事件特征, 该纠纷事
件分类模型的训练步骤如下:
S11、 采集第 一纠纷事件数据, 标注所述第一纠纷事件数据的纠纷事件的类别构成纠纷
事件分类数据集, 按照设定比例将所述纠纷事件分类数据集划分为纠纷事件分类训练数据
集和纠纷事 件分类验证数据集;
S12、 将所述纠纷事件分类训练数据集输入至第一预训练模型迭代训练多次形成所述
纠纷事件分类模型的初始版本;
S13、 将所述纠纷事件分类验证数据集输入至所述纠纷事件分类模型的初始版本进行
预测纠正, 直至准确率 不再上升得到已训练的所述纠纷事 件分类模型。
3.如权利要求2所述的联合实体关系抽取的纠纷事件分类方法, 其特征在于, 步骤S10
中, 所述纠纷事件内容和所述纠纷事件内容涉及的人名通过输入至实体关系抽取模型获取
所述第一实体关系特 征, 该实体关系抽取模型的训练步骤如下:
S14、 将所述第一纠纷事件数据输入至开源命名实体识别模型提取人名, 对所述人名标
注实体间的关系, 构成纠纷事件实体关系抽取数据集, 按照设定比例将所述纠纷事件实体
关系抽取数据集划分为纠纷事件实体关系抽取训练数据集和纠纷事件实体关系抽取验证
数据集;
S15、 将所述纠纷事件实体关系抽取训练数据集输入至第二预训练模型迭代训练多次
形成所述实体关系抽取模型的初始版本;
S16、 将所述纠纷事件实体关系抽取验证数据集输入至所述实体关系抽取模型的初始
版本进行 预测纠正, 直至准确率 不再上升得到已训练的所述实体关系抽取模型。
4.如权利要求1所述的联合实体关系抽取的纠纷事件分类方法, 其特征在于, 步骤S20
中, 将所述第一纠纷事件特征和所述第一实体关系特征通过输入到纠纷事件文本特征和实
体关系特征注意力模块获取所述纠纷事件和实体关系的关联性, 该纠纷事件文本特征和实
体关系特 征注意力模块使用步骤 包括:
S21、 将所述第一纠纷事件特征和所述第一实体关系特征输入至第一多层感知机映射
至相同的语义空间, 得到相同语义空间的第二纠纷事 件文本特 征和第二实体关系特 征;
S22、 将所述第二纠纷事件文本特征和所述第二实体关系特征拼接并输入至第二多层
感知机获取 所述纠纷事 件和实体关系的关联性。权 利 要 求 书 1/3 页
2
CN 114925201 A
25.如权利要求1所述的联合实体关系抽取的纠纷事件分类方法, 其特征在于, 步骤S30
中, 所述纠纷事件和实体关系的关联性通过输入至纠纷事件特征和实体关系特征混合模块
获取所述包含纠纷事件类别和实体关系关联性的纠纷事件特征, 该纠纷事件特征和实体关
系特征混合模块使用步骤 包括:
S31、 将所述纠纷事件和实体关系的关联性乘以所述第一纠纷事件特征, 得到包含纠纷
事件类别和实体关系关联性的纠纷事 件特征。
6.如权利要求3所述的联合实体关系抽取的纠纷事件分类方法, 其特征在于, 纠纷事件
分类训练数据集数据量大于纠纷事件分类验证数据集数据量; 纠纷事件实体关系抽取训练
数据集数据量大于纠纷事 件实体关系抽取验证数据集数据量。
7.联合实体关系抽取的纠纷事 件分类模型训练方法, 其特 征在于, 包括以下步骤:
采集第二纠纷事 件数据, 标注该第二纠纷事 件数据的类别;
将该第二纠纷事件数据输入到已训练的命名实体识别模型提取人名并构成联合实体
关系抽取的纠纷事 件数据集;
将该联合实体关系抽取的纠纷事件数据集按照设定比例划分为联合实体关系抽取的
纠纷事件训练数据集和联合 实体关系抽取的纠纷事件验证数据集, 其中联合 实体关系抽取
的纠纷事 件训练数据集数据量大于联合实体关系抽取的纠纷事 件验证数据集数据量;
将所述联合实体关系抽取的纠纷事件训练数据集分别输入到已训练的纠纷事件分类
模型和已训练的实体关系抽取模型, 提取第一纠纷事 件特征和第一实体关系特 征;
将所述第一纠纷事件特征和所述第一实体关系特征输入到纠纷事件文本特征和实体
关系特征注意力模块获取纠纷事 件的类别和实体关系的关联性;
将所述纠纷事件的类别和实体关系的关联性输入到纠纷事件特征和实体关系特征混
合模块得到包 含纠纷事 件类别和实体关系关联性的纠纷事 件特征;
将所述包含纠纷事件类别和实体关系关联性的纠纷事件特征与纠纷事件分类层进行
连接;
将所述已训练的纠纷事件分类模型和所述已训练的实体关系抽取模型的参数进行固
定并迭代训练多次得到所述联合实体关系抽取的纠纷事 件分类模型的初始版本;
将所述联合实体关系抽取的纠纷事件验证数据集输入至所述联合实体关系抽取的纠
纷事件分类模型的初始版本进 行预测纠正, 直至准确率不再上升得到已训练的所述联合 实
体关系抽取的纠纷事 件分类模型。
8.一种联合实体关系抽取的纠纷事 件分类装置, 其特 征在于, 包括:
采集模块, 用于根据纠纷事 件字段从纠纷事 件库中获取纠纷事 件内容;
命名实体识别模块, 用于根据所述纠纷事 件内容获取纠纷事 件内容涉及的人名;
纠纷事件分类模型, 用于根据所述纠纷事 件内容获取第一纠纷事 件特征;
实体关系抽取模型, 用于根据 所述纠纷事件内容和所述纠纷事件内容涉及的人名获取
第一实体关系特 征;
纠纷事件文本特征和实体关系特征注意力模块, 用于根据 所述第一纠纷事件特征和所
述第一实体关系特 征获取纠纷事 件和实体关系的关联性;
纠纷事件特征和实体关系特征混合模块, 用于根据 所述纠纷事件和实体关系的关联性
获取包含纠纷事 件类别和实体关系关联性的纠纷事 件特征;权 利 要 求 书 2/3 页
3
CN 114925201 A
3
专利 联合实体关系抽取的纠纷事件分类方法及其应用
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:01:04上传分享