说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210450655.3 (22)申请日 2022.04.27 (71)申请人 电子科技大 学 地址 611731 四川省成 都市高新区 (西区) 西源大道 2006号 (72)发明人 翟学萌 刘蓉 胡翔宇 胡光岷  (74)专利代理 机构 成都虹盛汇泉专利代理有限 公司 51268 专利代理师 王伟 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/9536(2019.01) G06F 16/2458(2019.01) G06F 16/33(2019.01) G06K 9/62(2022.01)G06F 16/35(2019.01) (54)发明名称 基于最大团发现的特定Twitter用户群体的 挖掘方法 (57)摘要 本发明公开了一种基于最大团发现的特定 Twitter用户群体的挖掘方法, 包括以下步骤: S1、 基于最大团的推文 集合筛选, 并获取用户群, 进行用户群体挖掘; S2、 获取用户群体后的相关 分析。 本发 明提出一种根据用户所传播信息的关 系进行用户群体挖掘方法, 对一系列信息传播过 程进行相关网络构建, 并提取其中相关性最高的 信息传播集合, 再选择其中参与信息传播的用户 群体, 使用该方法能够较为快速地获取发送相同 信息的用户群体。 本发明还可以很大程度地降低 特定Twitter用户群体挖掘的算法复杂度, 缩小 用户群体挖掘需要遍历的用户数目, 提高求解问 题的速度。 权利要求书1页 说明书4页 附图1页 CN 114817563 A 2022.07.29 CN 114817563 A 1.基于最大团发现的特定Tw itter用户群 体的挖掘方法, 其特 征在于, 包括以下步骤: S1、 基于最大团的推文集 合筛选, 并获取用户群, 进行用户群 体挖掘; S2、 获取用户群 体后的相关 分析。 2.根据权利 要求1所述的基于最大团发现的特定Twitter用户群体的挖掘方法, 其特征 在于, 所述 步骤S1具体实现方法为: S11、 参数定义: 将推文关系图定义为G=(V, E)的形式, 其 中V是图中节点的集合, V中的 每个节点v表 示一条推文; E是边的集合, E中的每条边e=(v, u, w)表示推文节 点v与u之间存 在相同的参与转发的用户, w 为边的权重, 表示推文节点v与u 有w个相同的转发用户; 推文关系图是一个有权无向图, 通过TwitterAPI根据关键字采集到的多条原始推文作 为节点的集合V, 同时采集所有原始推文的转发用户并计算各条原始推文相同的转发用户 得到边的集 合E; 设图中连边权值的最小值 为x, 则称推文关系图为x阶推文关系图; S12、 构建推文关系图: 推文筛选: 将转发量小于1000的原始推文过滤掉, 仅对转发量大于等于1000的原始推 文进行推文关系图的构建; 连边及边权值筛选: 以原始推文作为节点, 对所有的原始推文节点根据有相同转发用 户的规则进 行连边的建立, 构建出一个推文关系图; 对推文关系图连边进 行筛选, 保留权值 大于x的连边, 得到一个x阶的推文关系图; S13、 用户群体挖掘: 在推文关系图中联系紧密的部分中寻找推文集合以及对应的转发 用户群体, 使用连通片 中的最大团结构来寻找连接最紧密、 由最多相同用户转发的推文集 合; 在从推文关系图所提取 的最大团结构 中, 任意的两条推文都均有大于等于推文关系图 阶数x的相同转 发用户; 在给定推文 条数n的前提下, 提取所有n个节点的完全子图结构中边 权值和最大的完全子图结构, 这 n个节点对应的原 始推文集 合就是所求的推文集 合; 得到推文集合之后, 仅对各条原始推文对应的转发推文的用户集合求交集, 得到目标 用户群体, 这个用户群 体内的用户共同转发了相同的多条推文。 3.根据权利 要求1所述的基于最大团发现的特定Twitter用户群体的挖掘方法, 其特征 在于, 所述步骤S2具体实现方法为: 构建用户群体对不同推文的转 发网络、 构建用户群体的 关注网络 。权 利 要 求 书 1/1 页 2 CN 114817563 A 2基于最大团发现的特定Twit ter用户群体的挖掘方 法 技术领域 [0001]本发明涉及一种基于最大团发现的特定Tw itter用户群 体的挖掘方法。 背景技术 [0002]社交网络21世纪以来取得了迅速发展和广泛应用, Twitter、 FaceBook、 QQ、 微信、 微 博等社交网络平台已经成为了研究信息传播的有效工具。 研究在这些社交网络平台上 信息 的传播特征与模式以构建信息传播网络模型, 对抑制敏感信息扩散、 预测信息传播、 最大 化信息传播影响力、 舆情分析与检测等实际问题的分析与解决具有重要作用。 [0003]Twitter自2006年创建以来, 至今已拥有1.87亿日活跃用户, 其具有实时、 快速、 多 语 言等特性, 这些特性使 得Twitter平台中传播的信息会与同一时间现实社会中发生的时 间密 切相关并会 对其产生相当大的影响。 [0004]Twitter在政治、 经济等方面具有相当大的影响力, 因此对其进行信息传播的研究 是由 重要意义的。 以用户之间的关注关系为基础, 通过分析关注关系的结构和用户之 间的 互动 行为, 研究用户群体中的影响力用户, 从而通过控制这些用户来达到促进信息传播或 者抑 制信息传播的目的。 [0005]在Twitter分析研究中, 通常将Twitter关系网络抽象为社交网络模型进行研究, 将Twitter  中的用户或其他研究对象抽象为节点, 用户或对象之间的关系抽象为边, 构成 社交网络图  模型。 例如以Twitter平台中的用户作为节点, 关注关系作为连边, 构建起 Twitter用户关系  网络; 以推文转发关系作为连边可以构建起推文信息传播网络。 对 Twitter社交网络模型的  结构和布局进行分析, 可以进一步得出研究对象之间的相关性 质, 例如用户之 间的关注关  系连边稠密性反映出用户之 间对应关系的紧密性。 在社 交网络 分析研究中, 如果网络中一  部分节点之间具有紧密的联系, 则认为这些节点属于一个社团 结构。 如果网络图结构中的  任意节点两两相连, 构成的图结构称为完全图。 在网络中寻找 完全图的问题称为最大团问  题, 最大团即一个网络中的最大完全子图。 在社交网络中, 最 大团反映了社交网络用户节  点之间存在着某种紧密的关系, 根据这种紧密关系能够进行 更加深入的分析研究, 解决实  际社交网络中特定用户识别的实际问题。 [0006]目前对于用户群体挖掘的主要研究大多基于社交网络的网络结构和属性两大要 素来进行, 同时现有的研究认为用户群体的网络结构特征与社区类似, 因此也有很多研究 采用社区发现  技术来对关联紧密的用户群 体进行挖掘。 [0007]基于社交网络的网络结构的用户群体挖掘技术是从不同的角度来对网络进行划 分, 而基 于属性的用户群体挖掘算法是利用用户属 性信息来对用户节点进行聚类或者分 类, 再将聚类  或分类的结果放到不同的群体集合中。 这两种用户群体挖掘的技术 都有各自 的优点, 但前者  必须获取所有相关用户进 行社交网络构建, 才能根据结构来对用户群体进 行划分; 而后者忽  略了用户之间的连接关系, 会使得用户群 体获取不全面。说 明 书 1/4 页 3 CN 114817563 A 3

.PDF文档 专利 基于最大团发现的特定Twitter用户群体的挖掘方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于最大团发现的特定Twitter用户群体的挖掘方法 第 1 页 专利 基于最大团发现的特定Twitter用户群体的挖掘方法 第 2 页 专利 基于最大团发现的特定Twitter用户群体的挖掘方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:58:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。