说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210524897.2 (22)申请日 2022.05.13 (71)申请人 医渡云 (北京) 技 术有限公司 地址 100191 北京市海淀区花园北路3 5号9 号楼8层801 (72)发明人 滕召荣 康波  (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 王辉 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/242(2020.01) G06F 16/383(2019.01) G06F 16/36(2019.01) (54)发明名称 时间实体识别方法和装置、 计算机存储介 质、 电子设备 (57)摘要 本公开是关于一种时间实体识别方法和装 置、 计算机存储介质以及电子设备, 涉及文本识 别技术领域, 该方法包括: 获取时间规则库, 根据 所述时间规则库中包括的时间, 生成时间字典 树; 获取待识别文本, 根据预设替换规则对所述 待识别文本中包括的单词进行替换, 得到替换数 组; 对所述替换数组与所述时间字典树进行匹 配, 得到所述待识别文本中包括的时间实体; 对 所述待识别文本中包括的时间实体进行时间标 准化, 得到目标时间实体。 本公开提高了医疗文 本识别的效率以及准确率。 权利要求书2页 说明书14页 附图5页 CN 114943222 A 2022.08.26 CN 114943222 A 1.一种时间实体识别方法, 其特 征在于, 包括: 获取时间规则库, 根据所述时间规则库中包括的时间, 生成时间字典树; 获取待识别文本, 根据预设替换规则对所述待识别文本中包括的单词进行替换, 得到 替换数组; 对所述替换数组与所述时间字典树进行匹配, 得到所述待识别文本中包括的时间实 体; 对所述待识别文本中包括的时间实体进行时间标准 化, 得到目标时间实体。 2.根据权利要求1所述的时间实体识别方法, 其特征在于, 根据 所述时间规则库中包括 的时间, 生成时间字典树, 包括: 获取所述时间规则库中包括的相对时间规则库以及绝对时间规则库; 对所述相对时间规则库以及所述绝对时间规则库中包括的时间以及与所述时间关联 的词进行替换, 得到替换相对时间规则以及替换绝对时间规则; 利用所述替换相对时间规则生成相对时间字典树, 以及所述替换绝对时间规则生成绝 对时间字典树; 其中, 所述时间字典树中包括所述相对时间字典树以及所述绝对时间字典 树。 3.根据权利要求2所述的时间实体识别方法, 其特征在于, 获取待识别文本, 根据预设 替换规则对所述待识别文本中包括的单词进行替换, 得到替换 数组, 包括: 获取所述待识别文本, 对所述待识别文本中包括的单词进行预处理, 得到处理识别文 本; 根据所述预设替换规则对所述处理识别文本 中包括的待替换单词进行替换, 得到替换 符号; 通过所述待替换 单词以及所述 替换符号 生成所述 替换数组。 4.根据权利要求3所述的时间实体识别方法, 其特征在于, 对所述替换数组与 所述时间 字典树进行匹配, 得到所述待识别文本中包括的时间实体, 包括: 依次获取 所述替换数组, 并在所述时间字典树中进行遍历; 在确定所述 时间字典树中包括与 所述替换数组中的替换符号对应的节点 时, 通过所述 节点, 得到所述待识别文本中包括的时间实体。 5.根据权利要求4所述的时间实体识别方法, 其特征在于, 在所述 时间字典树中进行遍 历, 包括: 在确定所述 时间字典树中不包括与任一所述替换数组中的替换符号对应的节点时, 获 取任一所述 替换数组的下一 替换数组; 根据所述下一 替换数组, 在所述时间字典树中进行遍历。 6.根据权利要求2所述的时间实体识别方法, 其特征在于, 对所述待识别文本中包括的 时间实体进行时间标准 化, 得到目标时间实体, 包括: 确定所述待识别文本中包括的时间实体的类型; 根据所述时间实体的类型, 对所述时间实体进行时间标准 化, 得到所述目标时间实体。 7.根据权利要求6所述的时间实体识别方法, 其特征在于, 所述 时间实体的类型为相对 时间实体或绝对时间实体中的一种; 当所述时间实体的类型为绝对时间实体时, 对所述时间实体进行时间标准化, 得到所权 利 要 求 书 1/2 页 2 CN 114943222 A 2述目标时间实体, 包括: 获取所述绝对时间实体, 对所述绝对时间实体的格式进行处理, 得到所述目标时间实 体。 8.根据权利要求7所述的时间实体识别方法, 其特征在于, 当所述 时间实体的类型为相 对时间实体时, 对所述时间实体进行时间标准 化, 得到所述目标时间实体, 包括: 获取所述相对时间实体, 获取所述处理识别文本中与 所述相对时间实体关联的绝对时 间实体; 根据与所述相对时间实体关联的绝对时间实体以及所述相对时间实体的上下文特征, 得到目标绝对时间实体; 对所述目标绝对时间实体的格式进行处 理, 得到所述目标时间实体。 9.根据权利要求1所述的时间实体识别方法, 其特征在于, 所述 时间实体识别方法还包 括: 获取预设的时间识别模型, 通过所述时间识别模型对所述待识别文本进行识别, 得到 第一时间实体列表; 获取利用所述时间字典树对所述待识别文本进行识别得到的第二时间实体列表; 计算所述第一时间实体列表与所述第二时间实体列表的差集, 得到时间实体差集; 在确定所述 时间实体差集不为空时, 将所述 时间实体差集中包括的时间实体转换成第 一时间字典树; 将所述第一时间字典树添加至所述时间字典树中, 得到目标字典树。 10.一种时间实体识别装置, 其特 征在于, 包括: 字典树生成模块, 用于获取时间规则库中, 根据 所述时间规则库中包括的时间, 生成时 间字典树; 待识别文本替换模块, 用于获取待识别文本, 根据预设替换规则对所述待识别文本中 包括的单词进行替换, 得到替换 数组; 待识别文本匹配模块, 用于对所述替换数组与所述时间字典树进行匹配, 得到所述待 识别文本中包括的时间实体; 目标时间获取模块, 用于对所述待识别文本中包括的时间实体进行时间标准化, 得到 目标时间实体。 11.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现权利要求1 ‑9任一项所述的时间实体识别方法。 12.一种电子设备, 其特 征在于, 包括: 处理器; 以及 存储器, 用于存 储所述处 理器的可 执行指令; 其中, 所述处理器配置为经由执行所述可执行指令来执行权利要求1 ‑9任一项所述的 时间实体识别方法。权 利 要 求 书 2/2 页 3 CN 114943222 A 3

.PDF文档 专利 时间实体识别方法和装置、计算机存储介质、电子设备

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 时间实体识别方法和装置、计算机存储介质、电子设备 第 1 页 专利 时间实体识别方法和装置、计算机存储介质、电子设备 第 2 页 专利 时间实体识别方法和装置、计算机存储介质、电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。