说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210646948.9 (22)申请日 2022.06.08 (71)申请人 深圳市赛 为智能股份有限公司 地址 518000 广东省深圳市龙岗区南湾街 道下李朗社区联李东路8号赛为大楼 A101至15楼 (72)发明人 郑博超 王秋阳 胡懋成 凤阳 (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 周永敬 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/335(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01)G06N 3/08(2006.01) G06Q 50/18(2012.01) (54)发明名称 法条推荐方法、 装置、 计算机设备及存储介 质 (57)摘要 本发明实施例公开了一种法条推荐 方法、 装 置、 计算机设备及存储介质, 训练方法包括: 使用 SentencePiece模型构建法律专门词典。 采用法 律专门词典中的符号对预训练样本与正式训练 样本中的文本进行标识化处理, 生成对应的符号 序列。 在预训练阶段, 将预训练样本的符号序列 输入至MacBERT模型进行训练, 得到MacBERT预训 练权重。 在正式训练阶段, 使用预训练权重作为 MacBERT模型的初 始权重, 在MacBERT模型基础上 增加元数据特征提取网络结构和分类网络结构, 以推荐法条标签作为监督信息, 以正式训练样本 的符号序列化文本和元数据作为输入。 经过迭代 训练后得到该法条推荐模型。 本发 明提升了对文 本的分词效果, 对特征提取能力和文本内容的理 解能力。 权利要求书2页 说明书12页 附图3页 CN 114880438 A 2022.08.09 CN 114880438 A 1.法条推荐方法, 其特 征在于, 包括: 选取待查询文本; 将待查询文本输入到法条推荐模型中进行处理, 以得到与待查询文本 内容相关的法条 推荐结果。 2.根据权利要求1所述的法条推荐方法, 其特征在于, 所述法条推荐模型的训练方法包 括: 使用SentencePiece模型构建法律专门词典; 选取预训练样本, 所述预训练样本包括事实文本和与案件 事实对应的法条文本; 采用法律专门词典的符号对预训练样本 中的事实文本进行标识化处理, 以生成对应事 实文本的符号序列预训练样本; 将符号序列预训练样本 输入至MacBERT模型进行 预训练, 以得到 MacBERT模型权 重; 构建正式训练样本, 所述正式训练样本包括文本数据、 元数据和与案件事实对应的法 条文本; 采用法律专门词典的符号对正式训练样本的文本数据进行标识化处理, 以生成对应文 本数据的符号序列正式训练样本; 将正式训练样本中的元数据进行编码, 以得到元数据的特征向量, 并将符号序列正式 训练样本通过MacBERT模型权 重处理, 以得到符号序列正式训练样本的语义特 征向量; 将元数据的特征向量和符号序列 正式训练样本的语义特征向量进行concat融合, 以得 到融合特 征向量; 对融合特征向量通过Dropout、 LinearTanh和Softmax层叠加处理, 以得到每一条法条 被引用的预测概 率; 通过损失函数计算的损失值衡量模型 预测概率的向量和样本的标签向量之间的差异; 当迭代训练后, 推荐结果的top20召回率和损失值充分收敛且稳定时, 此时的模型参数 权重在法条类推荐任务上达到局部最优, 并确定此时的模型结构为训练完成的法条推荐模 型。 3.根据权利要求2所述的法条推荐方法, 其特征在于, 所述使用SentencePiece模型构 建法律专门词典, 所述SentencePiece模型包括 Normalizer、 Trai ner、 Encoder和Decoder。 4.根据权利要求3所述的法条推荐方法, 其特征在于, 所述使用SentencePiece模型构 建法律专门词典, 包括: 通过Encoder执 行范式化输入文本; 通过Trai ner对范式化输入文本进行训练, 以得到亚词分割模型; 亚词分割模型将范式化输入文本转换为 亚词对应的符号; Decoder将亚词序列转变为范式化文本 。 5.根据权利要求2所述的法条推荐方法, 其特征在于, 所述构建正式训练样本, 所述正 式训练样本包括文本数据、 元 数据和与案件 事实对应的法条文本, 包括: 获取法院裁决的生态 环境案件的文本; 对文本的信息进行提取, 以得到正式训练样本 。 6.根据权利要求2所述的法条推荐方法, 其特征在于, 所述将符号序列 预训练样本输入 至MacBERT模型进行预训练, 以得到MacBERT模型权重, 在训练时使用entity ‑level mask替权 利 要 求 书 1/2 页 2 CN 114880438 A 2换MacBERT模型的to ken‑level mask。 7.根据权利要求2所述的法条推荐方法, 其特征在于, 所述通过损失函数计算的损失值 衡量模型预测概率的向量和样本的标签向量之间的差异, 所采用的损失函数为cross ‑ entropy损失函数。 8.法条推荐装置, 其特 征在于, 包括选取 单元和处理单元; 所述选取 单元, 用于选取待查询文本; 所述处理单元, 用于将待查询文本输入到法条推荐模型中进行处理, 以得到与待查询 文本内容相关的法条推荐结果。 9.一种计算机设备, 其特征在于, 包括存储器、 处理器以及存储在所述存储器上并可在 所述处理器上运行的计算机程序, 所述处理器执行所述计算机程序时实现如权利要求 1~7 中任意一项所述的法条推荐方法步骤。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计 算机程序包括程序指 令, 所述程序指 令被处理器执行时, 使得所述处理器执行如权利要求 1 ~7任意一项所述的法条推荐方法步骤。权 利 要 求 书 2/2 页 3 CN 114880438 A 3
专利 法条推荐方法、装置、计算机设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:00:19
上传分享
举报
下载
原文档
(570.8 KB)
分享
友情链接
GB-T 42293-2022 商品交易市场知识产权保护规范.pdf
GB 24284-2009 大型焰火燃放安全技术规程.pdf
GB-T 35281-2017 信息安全技术 移动互联网应用服务器安全技术要求.pdf
ISOIEC 29100-2024.pdf
GB-T 35274-2017 信息安全技术 大数据服务安全能力要求 .pdf
GM-T 0107-2021 智能IC卡密钥管理系统基本技术要求.pdf
GB-T 38635.2-2020 信息安全技术 SM9标识密码算法 第2部分:算法.pdf
GB-T 7931-2008 1500 11 000 12 000 地形图航空摄影测量外业规范.pdf
GB-T 43803-2024 科研机构评估指南.pdf
T-CRHA 017—2023 人肝祖细胞类器官构建、质量控制与保藏操作指南.pdf
T-CEC 676—2022 电化学储能电站检修规程.pdf
DB23-T 3275—2022 养老机构分级照护服务规范 黑龙江省.pdf
GB-T 3273-2015 汽车大梁用热轧钢板和钢带.pdf
T-CSTM 00577—2021 油气田设备和材料绿色制造通用要求.pdf
工业数据分类分级指南(试行).pdf
GB-T 36474-2018 半导体集成电路 第三代双倍数据速率同步动态随机存储器 (DDR3 SDRAM)测试方法.pdf
T-NIFA 26—2023 移动金融客户端应用软件上架资质指引.pdf
GB-T 38645-2020 信息安全技术 网络安全事件应急演练指南.pdf
DB22-T 370-2014 建筑逃生缓降器设置技术规范 吉林省.pdf
T-CISA 046—2020 铬—锰—镍—氮系奥氏体不锈钢冷轧钢板和钢带.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(570.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。