说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210524897.2 (22)申请日 2022.05.13 (71)申请人 医渡云 (北京) 技 术有限公司 地址 100191 北京市海淀区花园北路3 5号9 号楼8层801 (72)发明人 滕召荣 康波 (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 王辉 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/242(2020.01) G06F 16/383(2019.01) G06F 16/36(2019.01) (54)发明名称 时间实体识别方法和装置、 计算机存储介 质、 电子设备 (57)摘要 本公开是关于一种时间实体识别方法和装 置、 计算机存储介质以及电子设备, 涉及文本识 别技术领域, 该方法包括: 获取时间规则库, 根据 所述时间规则库中包括的时间, 生成时间字典 树; 获取待识别文本, 根据预设替换规则对所述 待识别文本中包括的单词进行替换, 得到替换数 组; 对所述替换数组与所述时间字典树进行匹 配, 得到所述待识别文本中包括的时间实体; 对 所述待识别文本中包括的时间实体进行时间标 准化, 得到目标时间实体。 本公开提高了医疗文 本识别的效率以及准确率。 权利要求书2页 说明书14页 附图5页 CN 114943222 A 2022.08.26 CN 114943222 A 1.一种时间实体识别方法, 其特 征在于, 包括: 获取时间规则库, 根据所述时间规则库中包括的时间, 生成时间字典树; 获取待识别文本, 根据预设替换规则对所述待识别文本中包括的单词进行替换, 得到 替换数组; 对所述替换数组与所述时间字典树进行匹配, 得到所述待识别文本中包括的时间实 体; 对所述待识别文本中包括的时间实体进行时间标准 化, 得到目标时间实体。 2.根据权利要求1所述的时间实体识别方法, 其特征在于, 根据 所述时间规则库中包括 的时间, 生成时间字典树, 包括: 获取所述时间规则库中包括的相对时间规则库以及绝对时间规则库; 对所述相对时间规则库以及所述绝对时间规则库中包括的时间以及与所述时间关联 的词进行替换, 得到替换相对时间规则以及替换绝对时间规则; 利用所述替换相对时间规则生成相对时间字典树, 以及所述替换绝对时间规则生成绝 对时间字典树; 其中, 所述时间字典树中包括所述相对时间字典树以及所述绝对时间字典 树。 3.根据权利要求2所述的时间实体识别方法, 其特征在于, 获取待识别文本, 根据预设 替换规则对所述待识别文本中包括的单词进行替换, 得到替换 数组, 包括: 获取所述待识别文本, 对所述待识别文本中包括的单词进行预处理, 得到处理识别文 本; 根据所述预设替换规则对所述处理识别文本 中包括的待替换单词进行替换, 得到替换 符号; 通过所述待替换 单词以及所述 替换符号 生成所述 替换数组。 4.根据权利要求3所述的时间实体识别方法, 其特征在于, 对所述替换数组与 所述时间 字典树进行匹配, 得到所述待识别文本中包括的时间实体, 包括: 依次获取 所述替换数组, 并在所述时间字典树中进行遍历; 在确定所述 时间字典树中包括与 所述替换数组中的替换符号对应的节点 时, 通过所述 节点, 得到所述待识别文本中包括的时间实体。 5.根据权利要求4所述的时间实体识别方法, 其特征在于, 在所述 时间字典树中进行遍 历, 包括: 在确定所述 时间字典树中不包括与任一所述替换数组中的替换符号对应的节点时, 获 取任一所述 替换数组的下一 替换数组; 根据所述下一 替换数组, 在所述时间字典树中进行遍历。 6.根据权利要求2所述的时间实体识别方法, 其特征在于, 对所述待识别文本中包括的 时间实体进行时间标准 化, 得到目标时间实体, 包括: 确定所述待识别文本中包括的时间实体的类型; 根据所述时间实体的类型, 对所述时间实体进行时间标准 化, 得到所述目标时间实体。 7.根据权利要求6所述的时间实体识别方法, 其特征在于, 所述 时间实体的类型为相对 时间实体或绝对时间实体中的一种; 当所述时间实体的类型为绝对时间实体时, 对所述时间实体进行时间标准化, 得到所权 利 要 求 书 1/2 页 2 CN 114943222 A 2述目标时间实体, 包括: 获取所述绝对时间实体, 对所述绝对时间实体的格式进行处理, 得到所述目标时间实 体。 8.根据权利要求7所述的时间实体识别方法, 其特征在于, 当所述 时间实体的类型为相 对时间实体时, 对所述时间实体进行时间标准 化, 得到所述目标时间实体, 包括: 获取所述相对时间实体, 获取所述处理识别文本中与 所述相对时间实体关联的绝对时 间实体; 根据与所述相对时间实体关联的绝对时间实体以及所述相对时间实体的上下文特征, 得到目标绝对时间实体; 对所述目标绝对时间实体的格式进行处 理, 得到所述目标时间实体。 9.根据权利要求1所述的时间实体识别方法, 其特征在于, 所述 时间实体识别方法还包 括: 获取预设的时间识别模型, 通过所述时间识别模型对所述待识别文本进行识别, 得到 第一时间实体列表; 获取利用所述时间字典树对所述待识别文本进行识别得到的第二时间实体列表; 计算所述第一时间实体列表与所述第二时间实体列表的差集, 得到时间实体差集; 在确定所述 时间实体差集不为空时, 将所述 时间实体差集中包括的时间实体转换成第 一时间字典树; 将所述第一时间字典树添加至所述时间字典树中, 得到目标字典树。 10.一种时间实体识别装置, 其特 征在于, 包括: 字典树生成模块, 用于获取时间规则库中, 根据 所述时间规则库中包括的时间, 生成时 间字典树; 待识别文本替换模块, 用于获取待识别文本, 根据预设替换规则对所述待识别文本中 包括的单词进行替换, 得到替换 数组; 待识别文本匹配模块, 用于对所述替换数组与所述时间字典树进行匹配, 得到所述待 识别文本中包括的时间实体; 目标时间获取模块, 用于对所述待识别文本中包括的时间实体进行时间标准化, 得到 目标时间实体。 11.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现权利要求1 ‑9任一项所述的时间实体识别方法。 12.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1 ‑9任一项所述的 时间实体识别方法。权 利 要 求 书 2/2 页 3 CN 114943222 A 3
专利 时间实体识别方法和装置、计算机存储介质、电子设备
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:00:09
上传分享
举报
下载
原文档
(917.8 KB)
分享
友情链接
QX-T 210-2013 城市景观照明设施防雷技术规范.pdf
GB 42296-2022 电动自行车用充电器安全技术要求.pdf
腾讯研究院:2024工业大模型应用报告-2024-04-宏观大势.pdf
GB-T 4741-1999 陶瓷材料抗弯曲强度试验方法.pdf
RB-T 065-2021 认证认可行业标准体系构建指南.pdf
DB37-T 3483-2019 人民防空可视化互联平台功能要求 山东省.pdf
TB-T 2604-2016 机车车辆车钩缓冲装置计量器具 货车钩尾框量具.pdf
GB-T 36361-2018 LED加速寿命试验方法.pdf
DB13-T 5945—2024 地面沉降监测分层标施工技术规程 河北省.pdf
NB-T 10682-2021 数字化继电保护现场系统级检测规范.pdf
GB-T 9711-2017 石油天然气工业 管线输送系统用钢管.pdf
SN-T 5410.1-2022 铅矿及主要含铅的矿渣鉴别方法 第1部分:通则.pdf
T-CSAE 269—2022 智能网联汽车 自动驾驶地图动态信息数据交换格式.pdf
A_White_Paper_of_AIGC_GPT-4_Empowering_Telecom_Sector.pdf
SN-T 2770-2011 国境口岸军团菌荧光PCR检测方法.pdf
GB/T 40127-2021 全断面隧道掘进机 顶管机安全要求.pdf
GB-T 35589-2017信息技术大数据技术参考模型.pdf
GB-T 26067-2010 硅片切口尺寸测试方法.pdf
GB-T 35101-2017 信息安全技术 智能卡读写机具安全技术要求(EAL4增强).pdf
DB5111-T 25-2022 嘉州菜 乐山甜皮鸭制作工艺规范 乐山市.pdf
1
/
3
22
评价文档
赞助2.5元 点击下载(917.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。