(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210852471.X
(22)申请日 2022.07.20
(71)申请人 三峡大学
地址 443002 湖北省宜昌市大 学路8号
(72)发明人 李小龙 吴义熔 孙水发 唐庭龙
刘世焯
(74)专利代理 机构 北京睿智保诚专利代理事务
所(普通合伙) 11732
专利代理师 杜娟
(51)Int.Cl.
G16H 15/00(2018.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
G06F 40/295(2020.01)
G06F 16/36(2019.01)
(54)发明名称
基于超声检查报告的乳腺癌诊断知识图谱
构建方法及系统
(57)摘要
本发明公开了一种基于超声检查报告的乳
腺癌诊断知识图谱构建方法及系统, 涉及医学知
识图谱领域。 包括以下步骤: 构建知识图谱本体
及概念层; 基于乳腺超声检查报告数据, 提取乳
腺癌超声BI ‑RADS变量特征, 获取乳腺癌诊断知
识图谱数据层; 对提取的BI ‑RADS变量特征进行
知识融合、 知 识加工, 得到处理后 BI‑RADS变量特
征; 将处理后BI ‑RADS变量特征导入乳腺癌超声
知识图谱概念层框架, 实现乳 腺癌超声知识图谱
“实体‑属性‑关系”三元组的对应, 完成知 识图谱
图数据库构建。 本发明可减 轻临床医生从非结构
化数据中找出关键特征并进行分析诊断的工作
强度和时间成本, 有助于临床医生对病人病因或
结果进行成因分析、 风险预测等应用。
权利要求书1页 说明书7页 附图3页
CN 115101158 A
2022.09.23
CN 115101158 A
1.一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 其特征在于, 包括以下步
骤:
构建知识图谱本体及概念层;
基于乳腺超声检查报告数据, 提取乳腺癌超声BI ‑RADS变量特征, 获取乳腺癌诊断知识
图谱数据层;
对提取的BI ‑RADS变量特征进行知识融合、 知识加工, 得到处 理后BI‑RADS变量特征;
将处理后BI ‑RADS变量特征导入乳腺癌超声知识图谱概念层框架, 实现乳腺癌超声知
识图谱“实体‑属性‑关系”三元组的对应, 完成知识图谱图数据库构建。
2.根据权利要求1所述的一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 其
特征在于, 还 包括对乳腺超声检查报告数据进行 预处理, 具体步骤如下:
去除内容重复的报告和含有记录不完整或错 误数据的报告;
BI‑RADS变量特征标注, 并将标注的文本转换成BIO格式;
构建基于深度学习的命名实体识别模型。
3.根据权利要求2所述的一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 其
特征在于, 构建基于深度学习的命名实体识别模型, 包括: 在BiLSTM ‑CRF模型基础上, 通过
增加注意力机制对编码器所有时间步的 隐藏状态做加权平均来得到下一层的输入变量, 增
加注意力机制用来建立网络层之间的关联, 搭建Bi LSTM‑Attention‑CRF模型。
4.根据权利要求3所述的一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 其
特征在于, 所述命名实体识别模型包括: 嵌入层、 双向 ‑长短时记忆网络层、 注意力机制层、
条件随机场层。
5.根据权利要求1所述的一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 其
特征在于, 还包括知识图谱图数据库的可视化分析, 具体为: 将提取的BI ‑RADS特征数据导
入Neo4j图数据库, 实现知识图谱可视化展示。
6.一种基于超声检查报告的乳腺癌诊断知识图谱构建系统, 其特 征在于, 包括:
知识图谱概念层构建模块: 用于构建知识图谱本体及概念层;
知识图谱数据层构 建模块: 用于基于乳腺超声检查报告数据, 提取乳腺癌超声BI ‑RADS
变量特征, 获取乳腺癌诊断知识图谱数据层;
变量特征处理模块: 用于对提取的BI ‑RADS变量特征进行知识融合、 知识加工, 得到处
理后的BI ‑RADS变量特征;
知识图谱图数据库构建模块: 用于将BI ‑RADS变量特征导入乳腺癌超声知识图谱概念
层框架, 实现乳腺癌超声知识图谱 “实体‑属性‑关系”三元组的对应, 完成知识图谱图数据
库构建。
7.根据权利要求6所述的一种基于超声检查报告的乳腺癌诊断知识图谱构建系统, 其
特征在于, 还包括知识图谱图数据库的可视化分析模块: 用于将提取的BI ‑RADS特征数据导
入Neo4j图数据库, 实现知识图谱可视化展示。权 利 要 求 书 1/1 页
2
CN 115101158 A
2基于超声检查报 告的乳腺癌诊断知识图谱构建 方法及系统
技术领域
[0001]本发明涉及医学知识图谱领域, 更具体的说是涉及一种基于超声检查报告的乳腺
癌诊断知识图谱构建方法及系统。
背景技术
[0002]知识图谱以图数据库作为存储引擎, 通过对提取的关键信息进行智能化处理, 并
采用可视化技术来描述知识资源及其载体。 针对乳腺癌EMR知识图谱研究, 龚乐君等人在 文
献“龚乐君,张立鹏,李 宇茜.等.基于决策树的乳 腺癌病历文本的挖掘与决策[J].南京师大
学报:自然科学版,2019,42(3):10. ”中从自然语言角度出发, 使用挖掘算法从临床病历文
本挖掘病人乳腺癌这一疾病的相关信息, 构建了乳腺癌TNM(Tumor,Node,Metastasis)分期
知识图谱。 崔洁等人在文献 “崔洁,陈德华,乐嘉锦.基于EMR的乳腺肿 瘤知识图谱构建研究
[J].计算机应用与 软件,2017(12):128 ‑132.”中提出了从EMR中提取乳腺癌肿瘤医疗事实
知识, 在此基础上构建乳腺癌诊断知识图谱。 Hasan等人在文献 “Hasan S,Rivera D,Wu X
C,et al.Knowledge graph‑enabled cancer data analytics[J].IEEE Journal of
Biomedical and Health Informatics,2020,24(7):1952 ‑1967.”中提出了一套从癌症注
册登记数据构建知识图谱的方法, 并发展了针对乳腺癌病 人管理的知识图谱雏形。 习 佳宁
等人在专利 “发明专利申请说明书CN202010665947.X ”中提出了一套乳腺癌超声影像高置
实体关系的知识图谱构建方法。 Zhou等人在文献 “Zhou M T,Tang T L,Lu J,et
al.Extract bi‑rads features from mammography reports in chinese based on
machine learning[J].Journal of Flow Visualization and Image Processing,2021,
28(2):55‑68.”中以BiLSTM为深度学习模型, 开展了针对钼靶变量的提取。
[0003]现有的医学知识图谱, 大都是基于互联网上公开的医学文献、 网络社区或各种开
放数据库, 这类数据虽然获取比较方便, 但是涉及到电子病历(Electronic Medical
Record, EMR)的医疗事实知识较少。 以乳 腺癌超声检查报告为研究样 本, 系统完整的相关研
究还非常有限。 有必要发展一整套从中文电子病历(EMR)知识抽取到知识图谱构建乃至辅
助诊断的工作流程, 将实体变量、 变量间关系通过可视化的形式进 行展示, 进而依 托构建的
知识图谱开展可视化分析、 数据查询、 辅助诊断等应用。
发明内容
[0004]有鉴于此, 本发明提供了一种基于超声检查报告的乳腺癌诊断知识图谱构建方法
及系统, 采用自然语言处理技术进行知识获取, 利用所构建的乳腺癌诊断知识图谱系统开
展数据查询、 辅助诊断等应用研究。
[0005]为了实现上述目的, 本发明采用如下技 术方案:
[0006]公开了一种基于超声检查报告的乳腺癌诊断知识图谱构建方法, 包括以下步骤:
[0007]构建知识图谱本体及概念层;
[0008]基于乳腺超声检查报告数据, 提取乳腺癌超声BI ‑RADS变量特征, 获取乳腺癌诊断说 明 书 1/7 页
3
CN 115101158 A
3
专利 基于超声检查报告的乳腺癌诊断知识图谱构建方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:59:13上传分享