(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210570384.5
(22)申请日 2022.05.24
(71)申请人 山东海量信息技 术研究院
地址 250098 山东省济南市高新 技术开发
区国家信息通信国际创新园
申请人 济南大学
(72)发明人 杨晓晖 臧振宇 曲守宁 冯志全
田京兰
(74)专利代理 机构 济南圣达知识产权代理有限
公司 372 21
专利代理师 黄海丽
(51)Int.Cl.
G16H 50/30(2018.01)
G16H 10/60(2018.01)
G16H 50/70(2018.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06F 16/36(2019.01)
G06F 16/35(2019.01)
(54)发明名称
基于异质信息网络的疾病预测系统
(57)摘要
本发明公开了基于异质信息网络的疾病预
测系统, 包括: 获取模块, 其被配置为: 获取待预
测患者的当前电子病历; 疾病预测模块, 其被配
置为: 将待预测患者的当前电子病历, 输入到训
练后的疾病预测模型中, 输出疾病预测结果; 其
中, 疾病预测模型的工作原理为: 对待预测患者
的当前电子病历进行数据扩充, 基于扩充后的数
据构建电子病历异质图; 在电子病历异质图上,
基于元路径的学习表示进行电子病历的嵌入表
示, 通过注意力机制进行元路径邻居节点的聚
合; 最终实现对待预测患者的疾病预测。 以便准
确预测患者是否存在潜在疾病, 对患者做出准确
地预测。
权利要求书3页 说明书5页 附图3页
CN 114883001 A
2022.08.09
CN 114883001 A
1.基于异质信息网络的疾病预测系统, 其特 征是, 包括:
获取模块, 其被 配置为: 获取待预测患者的当前电子病历;
疾病预测模块, 其被配置为: 将待预测患者的当前电子病历, 输入到训练后的疾病预测
模型中, 输出疾病预测结果;
其中, 疾病预测模型的工作原 理为: 对待预测患 者的当前电子病历进行数据扩充, 基于
扩充后的数据构建电子病历异质图; 在电子病历异质图上, 基于元路径的学习表示进行电
子病历的嵌入表示, 通过注意力机制进行元路径邻居节点的聚合; 最终实现对待预测患者
的疾病预测。
2.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述对待预测患
者的当前电子病历进行 数据扩充, 基于扩充后的数据构建电子病历异质图; 具体包括:
构建基于医学知识库的医学概念图; 其中, 医学概念图中包含症状和疾病名称两种节
点, 每种疾病节点与其对应的症状节点 通过边进行 连接;
构建全员电子病历图; 其中, 电子病历图中包含患 者、 症状、 疾病三种节点, 患者与其对
应的症状之间通过边连接, 症状与其对应的疾病之间通过边连接;
基于医学概念图和全员电子病历图对待预测患 者的电子病历进行数据扩充, 得到电子
病历异质图。
3.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述对待预测患
者的当前电子病历进行数据扩充, 基于扩充后的数据构建电子病历异质图之后; 在电子病
历异质图上, 基于元路径的学习表示进行电子病历的嵌入表示之前; 还 包括:
对电子病历异质图进行分解, 得到若干个二部 图; 对二部 图中每个节点的邻居节点进
行随机采样; 对邻居节点的采样信息进行聚合操作, 完成数据更新。
4.如权利要求3所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述对邻居节点
的采样信息进行聚合操作, 具体包括:
根据每个节点一阶邻居特征
计算权重信息, 对每个节点的一阶邻居特征进行信息聚
合操作, 并对图中的所有节点执 行相同的操作:
其中, sigmod为激活函数, αi,j为节点, W 为权重系数;
通过每一节点的一阶邻居信息聚合后, 接下来将每一阶信息进行串联, 达到信息在多
阶节点的传递目的, 传递公式如下:
其中,
表示更新后节点第l层的信息, W表示权重系数,
表示节点第l ‑1层的信
息,
表示未更新时第l层的节点信息, | |表示信息的传递。
5.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述在电子病历
异质图上, 基于元路径的学习表示进行电子病历的嵌入表示; 具体包括:
将每个二部 图进行非线性激活操作; 然后, 使用每个节点的上下文节点实体嵌入到非
线性激活操作的结果中, 得到最终的嵌入表示。权 利 要 求 书 1/3 页
2
CN 114883001 A
26.如权利要求5所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述使用每个节
点的上下文节点实体嵌入到非线性激活操作的结果中, 其中, 嵌入表达公式如下:
其中, W表示投影权重矩阵, 所述投影权重矩阵通过随机初始化, 然后不断迭代进行矩
阵更新调整, Zv为节点v的最终嵌入表示, hv表示节点信 息, σ 表示激活函数, G表示所有节点
集合。
7.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述通过注意力
机制进行 元路径邻居节点的聚合; 具体包括:
通过注意力机制, 学习不同节点间基于不同元路径的权重, 基于权重将不同类型节点
特征投影到统一特 征空间。
8.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述通过注意力
机制进行 元路径邻居节点的聚合; 具体包括:
将不同类型节点的特征投影到同一特征空间, 使用注意机制来学习不同节点间基于不
同元路径下的权 重;
给定一个节点对, 计算不同元路径下该节点对连接的概率, 求出不同元路径对首节点
的权重概率信息;
其中, Ci,j为获得的概 率计算, Zi与Zj表示患者节点与目标节点。
9.如权利要求1所述的基于异质信 息网络的疾病预测系统, 其特征是, 所述最终实现对
待预测患者的疾病预测; 具体包括:
在每条元路径下 学习节点的邻居信息, 获得基于元路径下节点的信息表示;
所述在每条元路径下学习节点的邻居信息, 获得基于元路径下节点的信息表示; 具体
为:
αT=σ(∑j∈Nαj·Zv) (5)
其中, σ 代表非线性激活函数, αT则为学习到的不同元路径信息表示; Zv为节点v的最终
嵌入表示, αj表示在不同元路径下的权 重;
对学习到的信息表示αT进行归一化操作, 获得标准的信息表示α, 并将其作为公式(6)的
输入值, 进行最终的结果预测:
将包含在症状、 疾病和患者节点中的信息进行表达, 输出 预测疾病。
10.如权利要求1所述的基于异质信息网络的疾病预测系统, 其特征是, 所述训练后的
疾病预测模型; 训练过程包括:
构建训练集; 其中, 训练集 为已知疾病类型 标签的电子病历;
将训练集, 输入到疾病预测模型中, 对模型进行训练, 当模型的损失函数值不再降低,
或者迭代 次数达到最小值时, 停止训练, 得到训练后的疾病预测模型; 所述损失函数, 采用
负对数似然损失函数;
其中, 负对数似然损失函数, 公式表达如下:权 利 要 求 书 2/3 页
3
CN 114883001 A
3
专利 基于异质信息网络的疾病预测系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:58:20上传分享