(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210750831.5
(22)申请日 2022.06.28
(71)申请人 神州医疗科技股份有限公司
地址 100080 北京市海淀区北四环西路6 6
号16层1901
(72)发明人 王乐 许峥 张林 许娟 史文钊
(74)专利代理 机构 北京超凡宏宇专利代理事务
所(特殊普通 合伙) 11463
专利代理师 张萌
(51)Int.Cl.
G16H 50/30(2018.01)
G16H 50/70(2018.01)
G06K 9/62(2022.01)
G06F 16/36(2019.01)
A61B 5/00(2006.01)
(54)发明名称
基于知识图谱的糖尿病风险预测方法、 装
置、 设备及 介质
(57)摘要
本申请提供了一种基于知识图谱的糖尿病
风险预测方法、 装置、 设备及介质, 其中, 该方法
包括: 使用待预测对象 的第一病历数据对糖尿病
知识图谱进行更新得到目标知识图谱; 根据目标
知识图谱中待预测年份节点的周围节点的第一
节点向量, 确定待预测年份节点的第二节点向
量; 根据第二节点向量和目标节 点与待预测年份
节点之间的第一关联关系向量得到第一拼接向
量; 目标节点为患病节点和/或未患病节点; 第一
关联关系向量是根据待预测年份节点与周围节
点之间的第二关联关系向量确定的; 将第一拼接
向量和目标节点向量输入到糖尿病风险预测模
型中输出第一余弦相似度; 根据第一余弦相似度
确定糖尿病的患病概率。 通过该方法提高了糖尿
病风险预测的准确性。
权利要求书3页 说明书15页 附图6页
CN 114999654 A
2022.09.02
CN 114999654 A
1.一种基于知识图谱的糖尿病风险预测方法, 其特 征在于, 包括:
使用待预测对象的第 一病历数据对预先建立的糖尿病知识图谱进行更新, 得到更新后
的目标知识图谱; 所述第一病历数据包括所述待 预测对象在待预测年份且与糖尿病相关的
各项医学指标 数据;
根据所述目标知识图谱中与待预测年份节点相关联的周围节点的第 一节点向量, 确定
出所述待预测年份节点的第二节点向量;
将所述第二节点向量和所述目标知识图谱中的目标节点与所述待预测年份节点之间
的第一关联关系向量进行拼接, 得到第一拼接 向量; 所述 目标节点包括用于表示患有糖尿
病的患病节点, 和/或, 用于表示未患有糖尿病的未患病节点; 所述第一关联关系向量是根
据所述目标知识图谱中所述待预测 年份节点与所述周围节点之间的第二关联关系向量确
定出来的;
将所述第一拼接向量和所述目标节点的目标节点向量输入到训练好的糖尿病风险预
测模型中, 输出 所述第一 拼接向量与所述目标节点向量之间的第一 余弦相似度;
根据所述第 一余弦相似度, 确定所述待预测对象在所述待预测年份患有糖尿病的概率
大小。
2.根据权利要求1所述方法, 其特征在于, 当所述目标节点为所述患病节点时, 将所述
第一余弦相似度作为所述待预测对象在所述待预测年份患有糖尿病的概 率大小;
当所述目标节点为所述未患病节点 时, 将所述第 一余弦相似度作为所述待预测对象在
所述待预测年份未患有糖尿病的概率大小, 以根据所述未患有糖尿病的概率大小计算患有
糖尿病的概 率大小;
当所述目标节点包括所述患病节点和所述未患病节点 时, 判断第 二余弦相似度和第 三
余弦相似度之 间的大小关系; 所述第二余弦相似度为所述第一拼接向量与所述患病节点的
患病节点向量之间的第一余弦相似度; 所述第三余弦相似度为所述第一拼接向量与所述未
患病节点的未患病节点向量之间的第一 余弦相似度;
根据所述第 二余弦相似度和所述第 三余弦相似度之间的大小关系, 确定所述待预测对
象在所述待预测年份患有糖尿病的概 率大小。
3.根据权利要求1所述方法, 其特征在于, 所述糖尿病知识图谱是通过以下方式建立
的:
获取与糖尿病相关的医学特征数据, 每个所述医学特征数据的层级和所述医学特征数
据之间的关联关系; 以及获取样本患者的第二病历数据; 所述第二病历数据包括所述样本
患者在各个历史年份的与糖尿病相关的各项医学指标数据以及各个所述历史年份对应的
糖尿病患病情况;
根据所述医学特征数据、 每个所述医学特征数据的层级和所述医学特征数据之间的关
联关系, 构建所述糖尿病知识图谱的概念层; 以及根据所述第二病历数据构建所述糖尿病
知识图谱的实例层; 所述 实例层中包含有 所述样本患者的各个历史年份节点与各个医学指
标节点和所述目标节点之间的关联关系;
根据所述 概念层和所述实例层, 构建所述糖尿病知识图谱。
4.根据权利要求1所述方法, 其特征在于, 所述糖尿病风险预测模型是通过以下方式训
练的:权 利 要 求 书 1/3 页
2
CN 114999654 A
2针对所述糖尿病知识图谱中的每个目标三元组, 将该目标三元组中的第 一头节点转换
为头节点向量、 将第一尾节点转换为尾节点向量以及将所述第一头节点和所述第一尾节点
之间的第一关联关系转换为第三关联关系向量;
针对每个所述目标三元组, 将该目标三元组对应的所述头节点向量和所述第 三关联关
系向量拼接为第二 拼接向量;
将所述糖尿病知识图谱中的所有所述目标三元组划分为多个三元组集 合;
将同一所述三元组集合中所有所述目标三元组对应的所述第二拼接向量和所述尾节
点向量输入到待训练糖尿病风险预测模型中, 输出任意两个所述第二拼接向量和所述尾节
点向量之间的第四余弦相似度;
针对每组所述尾节点向量和所述第 二拼接向量, 使用该组对应的所述第四余弦相似度
和用于表示该尾节点向量与该第二拼接 向量是否为同一所述目标三元组的标签计算损失
函数, 得到损失数值;
使用所述损失数值更新所述待训练糖尿病风险预测模型中的可学习参数, 直至达到预
设训练轮次后停止训练, 并将当前的待训练糖尿病风险预测模型作为训练完成后的所述糖
尿病风险预测模型。
5.根据权利要求4所述方法, 其特征在于, 所述将同一所述三元组集合中所有所述目标
三元组对应的所述第二拼接向量和所述尾节点向量输入到待训练糖尿病风险预测模型中,
输出任意两个所述第二 拼接向量和所述尾节点向量之间的第四余弦相似度, 包括:
将同一所述三元组集合中所有所述目标三元组对应的所述第二拼接向量输入到待训
练糖尿病风险预测模 型中的卷积层中, 在所述卷积层中, 针对每个所述第二拼接向量, 使用
预设数量的卷积核对该第二拼接向量进行所述预设数量的卷积处理, 得到所述预设数量的
第一特征矩阵;
针对每个所述第 二拼接向量, 对该第 二拼接向量对应的所述预设数量的所述第 一特征
矩阵进行全连接处 理, 得到第三 拼接向量;
将所述第三拼接向量输入到所述待训练糖尿病风险预测模型中的投影层中, 输出用于
表示所述目标三元组中的所述头节点和所述关联关系的第四拼接向量;
将同一所述三元组集合中所有所述目标三元组对应的所述第四拼接向量和所述尾节
点向量输入到所述待训练糖尿病风险预测模型中的内积层中, 输出任意两个所述第四拼接
向量与所述尾节点向量之 间的第五余弦相似度, 以将所述第四拼接向量与所述尾节点向量
之间的所述第五余弦相似度作为所述第二拼接 向量和所述尾节点向量之间的第四余弦相
似度。
6.根据权利要求3所述方法, 其特征在于, 所述使用待预测对象的第 一病历数据对预先
建立的糖尿病知识图谱进行 更新, 包括:
根据所述第一病历数据, 构建多个第一 三元组;
针对每一个所述第 一三元组中的节点, 从所述糖尿病知识图谱中找到与该第 一三元组
的节点相同的医学指标节点;
根据相同的所述医学指标节点, 将所述第一三元组嵌入到所述糖尿病知识图谱中, 以
对所述糖尿病知识图谱进行 更新。
7.根据权利要求1所述方法, 其特征在于, 所述根据 所述目标知识图谱中与待预测年份权 利 要 求 书 2/3 页
3
CN 114999654 A
3
专利 基于知识图谱的糖尿病风险预测方法、装置、设备及介质
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:58:59上传分享