说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210713228.X (22)申请日 2022.06.22 (71)申请人 开封市中心医院 地址 475003 河南省开封市顺河区河道街 85号 (72)发明人 刘洎 段宝民 束新辉 董文星 孙鑫 赵普威 张会霞 (74)专利代理 机构 西安通大专利代理有限责任 公司 6120 0 专利代理师 张宇鸽 (51)Int.Cl. G16H 70/40(2018.01) G16H 50/00(2018.01) G06F 16/36(2019.01) G06F 16/35(2019.01)G06F 40/216(2020.01) (54)发明名称 基于标签传播的药品不良反应挖掘方法、 系 统、 终端及 介质 (57)摘要 本发明公开了一种基于标签传播的药品不 良反应挖掘方法、 系统、 终端及介质, 包括: 获取 药品集M={m1, ..., mi, ..., mn}, 基于正则表达 式, 从药品mi对应的属 性列表中获取药品mi所属 类别的集合Ci; 基于药品集合Ci, 构建药品加权 形式的药品关系图; 对药品mi所对应的网络页 面, 基于正则表达式提取页面中的锚文本作为术 语集Ti; 基于术语集Ti中的术语ti, 建立包含隐 含主题特征、 频次特征、 距离 特征的特征向量; 基 于标签传播的 “不良反应 ”挖掘算法, 从术语集Ti 得到药品mi的“不良反应 ”候选集cADRi; 基于药 品关系图和标签传播从药品mi的“不良反应 ”候 选集cADRi挖掘得到“不良反应 ”集ADRi。 本发明 能在不需要人工标注数据的情况下, 挖掘出药品 的不良反应 。 权利要求书3页 说明书8页 附图1页 CN 115083623 A 2022.09.20 CN 115083623 A 1.基于标签传播的药品不良反应挖掘方法, 其特 征在于, 包括: 获取药品集M={m1, ..., mi, ..., mn}, 基于正则表 达式, 从药品mi对应的属性列表中获取 药品mi所属类别的集 合Ci; 基于药品集 合Ci, 构建药品加权形式的药品关系图; 对药品mi所对应的网络页面, 基于正则表达式提取页面中的锚文本作为 术语集Ti; 基于术语集Ti中的术语ti, 建立包 含隐含主题特 征、 频次特 征、 距离特 征的特征向量; 基于隐含主题特征、 频次特征和距离特征的特征向量, 构建基于支持向量机的 “不良反 应”识别算法, 从术语集Ti得到药品mi的“不良反应 ”候选集cADRi; 基于药品关系图和标签传播的 “不良反应 ”挖掘算法从药品mi的“不良反应 ”候选集 cADRi挖掘得到“不良反应 ”集ADRi。 2.根据权利要求1所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述基 于正则表达式, 从药品mi对应的属性列表中获取 药品mi所属类别的集 合Ci, 具体为: 基于正则表达式REI、 RE2从mi对应的Wikipedia页面底部的Categories列表中提取mi所 属类别的集 合Ci; 所述正则表达式RE1和RE2如下: RE1: normal‑catlinks″>(.+)hid den‑catlinks RE2: <a href=″([^″]+)″\s+title= ″[^″]+″>([^<]+)</a> 其中, RE1用于匹配出页面中文本段形式的Category列表, RE2用于从Category列表匹 配出药品所属的一组类别。 3.根据权利要求2所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述基 于药品集合Ci, 构建药品加权形式的药品关系图, 具体 为: 基于药品集合{Ci|i∈[1..n]}, 构 建加权图形式的药品关系图G=(M, E, ψ ), 其中, 表示药品mi与mj属于至少一 个相同的类别, 是一个为E中每条边赋予权 重的函数。 4.根据权利要求3所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述基 于{Ci|mi∈M}构建药品关系图G=(M, E, ψ )的步骤如下: 设 ψ(mi, mj)=|Ci∩Cj|, 其中, mi, mj∈M且i≠j; 设E初始为 对于 且i≠j, 若 ψ(mi, mj)≠0, 则E ←E∪{eij}, 并将边eij的权重 设为 ψ(mi, mj)。 5.根据权利要求4所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述对 药品mi所对应的网络页面, 基于正则表达式提取页面中的锚文本作为 术语集Ti; 具体为: 对于药品mi, 从mi对应的Wikipedia页面, 利用正则表达式RE3提取页面中的锚文本作为 术语集Ti; RE3: <a href=″([^″]+)″\s+title= ″([^″]+)″ 其中, RE3用于匹配出页面中的锚文本作为 术语。 6.根据权利要求5所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述基 于隐含主题特征、 频次特征和距离特征 的特征向量, 构建基于支持向量机的 “不良反应 ”识 别算法, 从术语集Ti得到药品mi的“不良反应 ”候选集cADRi; 具体为: 利用Wikip edia医学离线版的页 面集, 对无监督的隐含狄利克雷分布模型参数推断; 三权 利 要 求 书 1/3 页 2 CN 115083623 A 2个超参为: 隐含主题数k; “文档‑主题”分布参数α =(0.1, ..., 0.1, ..., 0.1), 维度为10; “主 题‑词”分布参数β =(1/m, ..., 1/m, ..., 1/m), 维度为 表示页面集PM中所有术 语的数量; 对于 利用LDA模型得到术语til的隐含主题特征LD Ail; 统计PM中包含术语til的页 面数nil, 术语til的频次特征 对于 统计术语til与Ti中其它术语的 平均距离作为距离特 征, 定义为: 其中, LP表示页面p的字节大小, dis(til, t, p)表示术语til与t在页面p中最近的字符间 隔, 若两者在页面中p没有同时出现, 则规定dis(til, t, p)=LP; 拼接上述特征, 得到术语til的特征向量 为 拼接操作; 人工标注包含上述特征向量的若干个训练样本, 训练基于支持向量机的布尔型分类 器, 判别类别分别是 “不良反应 ”与“非不良反应 ”; 利用布尔型分类器, 对每个Ti生成对应的 “不良反应 ”候选集cADRi。 7.根据权利要求6所述的基于标签传播的药品不良反应挖掘方法, 其特征在于, 所述基 于药品关系图和标签传播的 “不良反应 ”挖掘算法从药品mi的“不良反应 ”候选集cADRi挖掘 得到“不良反应 ”集ADRi, 具体为: (1)根据药品关系图G=(M, E, ψ )生成对应的邻接矩阵AG=(aij)n×n, 其中, 其中, aij表示药品mi, mj∈M之间相似度; (2)根据Ti(i∈[1..n])对应的 “不良反应 ”候选集cADRi, 生成描述 “药品‑不良反应 ”双 模态数据的矩阵: R0=(rih)n×q (3) 其中, q=|cADR| (4) (3)设t=0, 迭代执行以下过程, 直到||Rt+1‑Rt||F<0.01, 输出R=Rt+1, ||·||F为F‑范 数: 3.1, Rt+1=AGRt; 通过邻接矩阵与双模矩阵相乘, 实现一次传播, 得到新的双模矩阵; 3.2, 将矩阵Rt+1的每一行 所有元素除以该 行的最大值, 实现Rt+1的归一化; 3.3, t←t+1; (4)对每个药品mi∈M, 根据R=(rih)n×q生成的“不良反应 ”集ADRi, 执行如下过程:权 利 要 求 书 2/3 页 3 CN 115083623 A 3
专利 基于标签传播的药品不良反应挖掘方法、系统、终端及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:58:31
上传分享
举报
下载
原文档
(626.8 KB)
分享
友情链接
DB45-T 2211-2020 航空集装箱用铝合金板材技术规范 广西壮族自治区.pdf
GB-T 36001-2015 社会责任报告编写指南.pdf
GB-T 14379-1993 罗兰C系统通用技术条件.pdf
GB-T 12054-1989 数据处理 转义序列的登记规程.pdf
DB23-T 1574—2020 森林火灾林木损失调查评估技术规程 黑龙江省.pdf
T-GHDQ 100—2022 智能网联汽车控制器硬件信息安全测试规范.pdf
GB-T 31773-2015 中药方剂编码规则及编码.pdf
T-CSTM 01094—2023 材料基因工程 合金扩散偶制备元数据.pdf
GB-T 10722-2014 炭黑 总表面积和外表面积的测定 氮吸附法.pdf
GM-T 0125.4-2022 JSON Web 密码应用语法规范 第4部分:密钥.pdf
T-CHTS 10034—2021 沥青路面施工质量信息动态管理技术指南.pdf
DB31-T 1339-2021 医院多学科诊疗管理规范 上海市.pdf
DB3701-T 0005.8—2019 济南市公共服务领域名称英文译写规范 第8部分:体育 济南市.pdf
T-ZZB 0602—2018 环保节能舒适型冷风扇.pdf
TB-T 1669-2018 机车车辆车钩及缓冲装置计量器具 13型车钩量具.pdf
GB-T 31974-2015 钝化颗粒镁.pdf
DB15-T 839—2022 高速公路养护工程预算编制办法及定额 内蒙古自治区.pdf
DB31-T 220-2020 工业炉窑经济运行与节能监测 上海市.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
DL-T 1066-2023 水电站设备检修管理导则.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(626.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。