说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210555742.5 (22)申请日 2022.05.19 (71)申请人 华中师范大学 地址 430079 湖北省武汉市洪山区珞 瑜路 152号 (72)发明人 张思 惠柠 翟佩云 徐佳丽  刘清堂  (74)专利代理 机构 武汉科皓知识产权代理事务 所(特殊普通 合伙) 42222 专利代理师 肖明洲 (51)Int.Cl. G06F 16/9536(2019.01) G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01)G06F 40/30(2020.01) G06Q 50/20(2012.01) (54)发明名称 基于知识图谱的在线社区学习路径推荐方 法、 系统及设备 (57)摘要 本发明公开了一种基于知识图谱的在线社 区学习路径推荐方法、 系统及设备, 首先, 构建 “课程——主题——知识点 ”三层实体建模的知 识图谱模型, 结合在线社区中用户帖子构造基于 语料库和核心短语多层次文本相似度函数; 其 次, 横向借助相似性函数度量帖子语义之间的相 似性, 以用户知识背景确定用户群体中相近知识 水平的唯一用户, 获取其学习路径; 若路径缺失 则需要纵向借助知识 图谱推荐处于当前主题知 识点更高层级的用户, 通过用户知识背景确定唯 一用户, 获取该用户的帖子; 最后, 结合知识图谱 为在线社区中用户推荐细粒度和多情境感知 的 学习路径。 本发明可以从横向、 纵向两个角度, 并 结合用户知识背景, 为其推荐细粒度和多情境感 知的学习路径。 权利要求书6页 说明书10页 附图3页 CN 115238199 A 2022.10.25 CN 115238199 A 1.一种基于知识图谱的在线社区学习路径推荐方法, 其特 征在于, 包括以下步骤: 步骤1: 构建 “课程——主题— —知识点 ”三层实体的知识图谱 模型; 根据课程内容数据的教学单元及其教学顺序, 将课程内容数据划分成不同的主题, 确 定每个主题包 含的知识点及其层级; 构建知识本体, 本体=类+关系+函数+公理+实例; 其中, 类是描述领域内的实际概念, 既可以是实际存在的事物, 也可以是抽象 的概念; 关系用于描述类之 间的关系, 包括局部与 整体的关系P、 父类与子类之间的关系K、 类的实例与类之间的关系I、 某个类是另一个类的 属性A; 函数是一类特殊的关系, 在这种关系中前n ‑1个元素能唯一决定第n个元素; 公理代 表本体内存在的事实, 用于对本体内类或者关系进行约束; 实例表示具体某个类的实际存 在; 知识抽取, 包括实体抽取、 关系抽取以及属性抽取; 从自然文本 中抽取所需要的命名实 体, 挖掘出实体与实体之 间的语义信息, 根据知识特性抽取出具有针对性的属性描述; 对于 每一个课程实体C、 主题实体T均能表示为: C/T={T*,D,N,Date*}; 其中, *表示属性值不能 为空, T*为标题, 实体的名称; D为描述, 对定义的实体所讲解知识内容的解释与说明; N为序 号, 实体讲授进 行的顺序编号; Date*为时间, 实体的添加时间; 课程、 主题、 知识 点内部和外 部的关系采取三元组的形式表 示G={(h,r,t)|h,t∈ ε,r∈R}, 其中h代表头实体,  t代表尾 实体, r代表头尾实体之间的关系, ε表示实体集 合, R表示关系集 合; 知识表示, 根据课程内容和主题的需求, 每个知识点实体K均表示为K={T*, C*, O, D, P ={P1,P2 …Pn}}; 其中, C*为类别, 实体的类别, 其中值为1表 示基础知识, 值为2表 示中级知 识, 值为3表 示高级知识; O代表知识 点的别名; P表 示隶属于类别K的知识 点具有的特有的特 征属性, Pi代表某 一特征属性, 对于不同的知识点, 其Pi的个数和种类也是随之变化的, 1≤ i≤n; 知识融合, 实体或者属性的融合采取相关性聚类的方法, 如下 所示: min∑rxy(1‑simxy)+(1‑rxy)simxy; 其中, x,y表示实体或属性, rxy表示x, y被分配在同一类, si mxy表示x,y是同一类的概率, 目标是使用最小的代价找到一个聚类方案; 步骤2: 获取在线社区中用户当前帖子和历史帖子记录, 进行 数据预处 理; 步骤3: 构造基于语料库和核心短语多层次文本相似度函数, 定义阈值, 横向度量在线 社区中用户帖子语义之间的相似性, 寻找与当前用户相近知识水平的用户群 体; 步骤4: 通过用户知识背景确定与当前用户相近知识水平的唯一用户, 获取其学习路径 进行推荐; 步骤5: 若学习路径缺失则纵向借助知识图谱推荐处于当前主题知识点更高层级的用 户; 步骤6: 通过用户知识背景确定知识点更高层级的唯一用户, 为当前用户推荐该用户的 帖子; 步骤7: 在线社区用户知识水平处于最高层级, 则无需推荐, 学习者继续学习。 2.根据权利要要求1所述的基于知识图谱的在线社区学习路径推荐方法, 其特征在于: 步骤2中, 获取的评论数据包括用户名、 用户ID、 评论内容、 评论时间、 浏览次数、 回复次数, 并对获取的评论数据按照统一格式进行整理归纳。权 利 要 求 书 1/6 页 2 CN 115238199 A 23.根据权利要要求1所述的基于知识图谱的在线社区学习路径推荐方法, 其特征在于, 步骤3的具体实现包括以下子步骤: 步骤3.1: 基于中文语料库计算用户帖子之间在段落和句子层面文本的相似度, 用TF ‑ IDF提取帖子的关键字, 用训练好的word2vec模型和关键字分别计算某个帖子文本向量Vi 和其他n‑1个帖子文本向量V={V1,V2,V3,...,Vi‑1,Vi+1,...,Vn}的相似度 步骤3.2: 从用户帖子中筛选核心短语, 随机从帖子中取一个片段, 如果这个片段左右 的搭配丰富, 并且片段内部成分搭配固定, 则认 为这是一个核心短语; 片段外部左右搭配的 丰富程度, 用信息熵来衡量, 而片段内部搭配的固定程度用子序列的互信息来衡量; 其中, p(x,y)是X和Y的联合概率分布函数, 而p(x)和p(y)分别是X和Y的边缘概率分布 函数; 给定字 符串S作为核心短语备选, X定义为该字符串左边可能出现的字 符, 则称H(X)为 S的左信息熵, 类似定义右信息熵H(Y), 左右信息熵越 大, 说明字符串可能的搭配就越丰富, 该字符串是一个核心短语的可能性就越大; 互信息I(X; Y)指的是两个离散型随机变量X与Y 相关程度的度量, 片段有多种组合方式时, 计算上选取所有组合方式中互信息最小的那一 种为代表; 有了左右信息熵和互信息 之后, 将两个指标低于一定阈值的片段过滤掉, 剩下的 片段按频次降序排序, 截取最高频次的N个片段即完成了核心短语提取流 程; 步骤3.3: 基于余弦相似度计算某个帖子核心短语向量Vp={Vp1,Vp2,Vp3,...,Vpn}和其 他帖子Vc={Vc1,Vc2,Vc3,...,Vcn}核心短语向量之间的相似度; 步骤3.4: 构造相似度函数 其中, 为权重系数; 若需要计算用户某个帖子核心短语向量Vp和知识图谱中的实体及其属性中提取的核心 短语向量VK={VK1,VK2,VK3,...,VKn}的相似度时, 此时 VC替换为VK, 即 步骤3.5: 设定阈值, 利用步骤3.4中求得帖子间相似度, 相似度值大于所设阈值, 则此 用户定义为与当前用户处于相近知识水平, 进而获得与当前用户Ui相近知识水平的用户群 体集合U, 用户帖子集 合V, 以及相似度集 合S, 其中m为用户群 体个数;权 利 要 求 书 2/6 页 3 CN 115238199 A 3

.PDF文档 专利 基于知识图谱的在线社区学习路径推荐方法、系统及设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识图谱的在线社区学习路径推荐方法、系统及设备 第 1 页 专利 基于知识图谱的在线社区学习路径推荐方法、系统及设备 第 2 页 专利 基于知识图谱的在线社区学习路径推荐方法、系统及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:58:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。