说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210964247.X (22)申请日 2022.08.11 (71)申请人 天津泰凡科技有限公司 地址 300300 天津市滨 海新区经济技 术开 发区第二大街泰达MSD-G1座11层 1102-108 (72)发明人 贾勇哲 马国宁 王林 徐大为  (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 金含 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 5/02(2006.01) G16H 50/20(2018.01) (54)发明名称 基于知识图谱的医疗问答方法及相关 设备 (57)摘要 本申请提供的基于知识图谱的医疗问答方 法及相关设备, 将经过预处理的医疗问题的描述 通过编码器进行编码后与知识图谱表 示相融合, 得到的融合特征通过解码器解码后进行逐个元 素输出, 将每次的输出元素对应的解码器的隐藏 状态作为查询向量作用于知识图谱表 示中, 以便 解码器对下一个元素进行输出。 通过本申请提供 的医疗问答方法能够将医疗问题与知识图谱进 行有效结合, 深度理解所述医疗问题, 生成蕴含 实体与图谱推理的针对医疗问题的回复, 有利于 提高医疗诊断结果的准确率。 权利要求书3页 说明书11页 附图3页 CN 115470327 A 2022.12.13 CN 115470327 A 1.一种基于知识图谱的医疗问答方法, 其特 征在于, 包括: 响应于接收到用户输入的医疗问题的描述, 对所述描述进行 预处理; 将经过预处理的所述描述输入至编码器中, 得到所述描述的文本表示; 基于所述文本表示和医疗知识图谱三元组, 通过解码器逐个输出所述医疗问题的答复 序列中的每 个元素, 对于每个元素的输出, 基于所述文本表示、 所述医疗知识图谱三元组以及与 该元素对应的所述解码器的隐藏 状态, 通过第一多层感知机网络得到与所述文本表示关联的第一知识图谱表示; 将所述文本表示和所述第一知识图谱表示输入至第二多层感知机网络得到融合特征 表示; 将所述融合特征表示以及基于所述第一知识图谱表示计算得到的第二知识图谱表示 输入至所述 解码器中, 输出 该元素, 其中, 所述编码器、 所述第一多层感知机网络、 所述第二多层感知机网络和所述解码器均是 经过预训练的。 2.根据权利要求1所述的方法, 其特 征在于, 所述预处 理, 包括: 通过分词算法对所述描述进行分词, 得到所述描述中每句对应的词序列; 按照预定规则对 全部所述词序列进行排序。 3.根据权利要求1所述的方法, 其特征在于, 基于所述文本表示、 医疗知识图谱三元组 以及与该元素对应的所述解码器的 隐藏状态, 通过第一多层感知机网络得到与所述文本表 示关联的第一知识图谱表示, 包括: 获取医疗知识图谱三元组; 将所述三元组输入所述第一多层感知机网络, 得到三元组向量表示; 基于所述 三元组向量表示构建医疗知识图谱; 基于所述医疗知识图谱、 所述文本表示以及该元素对应的所述解码器的隐藏状态, 通 过计算得到所述第一知识图谱表示。 4.根据权利要求3所述的方法, 其特征在于, 将所述融合特征表示以及基于所述第 一知 识图谱表示计算得到的第二知识图谱表示输入至所述 解码器中, 输出 该元素, 包括: 基于所述融合特征表示、 所述解码器的隐藏状态和所述第 二知识图谱表示计算得到选 择概率; 基于所述选择概率确定所述元素对应的候选集合, 所述候选集合包括预先构建的词汇 表和所述医疗知识图谱; 根据所述 候选集合及其对应的选择概 率分布, 通过计算确定实体概 率分布; 选择所述实体概 率分布中最大概 率对应的实体作为所述元 素进行输出。 5.根据权利要求1所述的方法, 其特 征在于, 所述预训练, 包括: 获取医疗 对话历史文本; 将所述医疗 对话历史文本划分为训练样本集和 测试样本集; 基于所述训练样本集和损 失函数对所述编码器、 所述第一多层感知机网络、 所述第二 多层感知机网络和所述 解码器进行迭代训练; 通过所述测试样本集对经过迭代训练的所述编码器、 所述第一多层感知机网络、 所述权 利 要 求 书 1/3 页 2 CN 115470327 A 2第二多层感知机网络和所述 解码器进行评估计算; 响应于所述评估计算的评估分数达到预设条件或迭代训练次数达到预设数值, 停止所 述预训练。 6.根据权利要求5所述的方法, 其特征在于, 所述迭代训练包括多轮训练, 所述基于所 述训练样本集和损失函数对所述编码器、 所述第一多层感知机网络、 所述第二多层感知机 网络和所述 解码器进行迭代训练, 包括: 针对迭代训练中的每 轮训练, 对所述训练样本集进行 所述预处 理; 将经过预处理的所述训练样本集输入至所述编码器中, 得到所述训练样本集中每个训 练样本的样本表示; 基于所述训练样本的样本表示和所述医疗知识图谱三元组, 通过所述解码器逐个输出 所述训练样本的预测答复序列中的每 个预测元 素, 对于每个预测元 素的输出, 基于所述训练样本的样本表示、 所述医疗知识图谱三元组以及与该预测元素对应的所 述解码器的 隐藏状态, 通过所述第一多层感知机网络得到与所述训练样本的样本表示关联 的第一预测知识图谱表示; 将所述训练样本的样本表示和所述第一预测知识图谱表示输入至所述第二多层感知 机网络得到预测融合特 征表示; 将所述预测融合特征表示以及基于所述第一预测知识图谱表示计算得到的第二预测 知识图谱表示输入至所述 解码器中, 输出 该预测元素; 通过损失函数计算所述预测元 素和其对应的真实元 素之间的损失值; 最小化所述损 失值以得到所述编码器、 所述第一多层感知机网络、 所述第二多层感知 机网络和所述 解码器。 7.根据权利要求1所述的方法, 其特征在于, 所述编码器包括嵌入 网络和多层多头注意 力网络; 所述第一多层感知机和所述第二多层感知机均包括输入层、 隐藏层和输出层; 所述 解码器为长短期记 忆网络LSTM 。 8.一种基于知识图谱的医疗问答装置, 其特 征在于, 包括: 预处理模块, 别配置为响应于接收到用户输入的医疗问题的描述, 对所述描述进行预 处理; 第一编码模块, 被配置为将经过预处理的所述描述输入至编码器中, 得到所述描述的 文本表示; 输出模块, 被配置为基于所述文本表示和医疗知识图谱三元组, 通过解码器逐个输出 所述医疗问题的答复序列中的每 个元素, 对于每个元素的输出, 知识图谱表示单元, 被配置为基于所述文本表示、 所述医疗知识图谱三元组以及与该 元素对应的所述解码 器的隐藏状态, 通过第一多层感知机网络得到与所述文本表示关联的 第一知识图谱表示; 融合单元, 被配置为将所述文本表示和所述第 一知识图谱表示输入至第 二多层感知机 网络得到融合特 征表示;权 利 要 求 书 2/3 页 3 CN 115470327 A 3

.PDF文档 专利 基于知识图谱的医疗问答方法及相关设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识图谱的医疗问答方法及相关设备 第 1 页 专利 基于知识图谱的医疗问答方法及相关设备 第 2 页 专利 基于知识图谱的医疗问答方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:42:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。