ICS 35.240.01 M 11 备案号: 广 DB 4 4 0 1 州 市 地 方 标 准 DB4401/T 12—2018 网络舆情分级与判定 Classification and judgment for network public opinion 2018 -12 - 01 实施 2018 - 10 - 10 发布 广州市质量技术监督局 发 布 DB4401/T 12—2018 目 次 前言 ................................................................................ Ⅲ 1 范围 .............................................................................. 1 2 术语和定义、缩略语 ................................................................ 1 2.1 术语和定义 .................................................................... 1 2.2 缩略语 ........................................................................ 1 3 网络舆情评价一般流程 .............................................................. 2 4 指标体系 .......................................................................... 2 5 指标量化 .......................................................................... 3 5.1 5.2 5.3 5.4 5.5 量化要求 ...................................................................... 事件指标 ...................................................................... 网民指标 ...................................................................... 媒体指标 ...................................................................... 舆情态势指标 .................................................................. 3 3 4 5 6 6 综合评价 .......................................................................... 7 7 等级划分与风险程度评价 ............................................................ 7 7.1 等级划分 ...................................................................... 7 7.2 结果评价 ...................................................................... 8 附录 A(资料性附录) 文档主题生成模型 ................................................ 9 附录 B(资料性附录) 基于层次分析法(AHP)的权重计算方法 ............................ 12 I II DB4401/T 12—2018 前 言 本标准按照GB/T 1.1—2009给出的规则起草。 本标准由中国共产党广州市委员会宣传部提出并归口。 本标准起草单位:广州市网络舆情信息中心、广州市标准化研究院、广州市云润大数据服务有限公 司。 本标准主要起草人:李伟滨、陈韶航、徐湛、萧玉珊、王贺珍、郑裕钊、曾庆贤、林毅、李永康、 陈敏华、陈振兴、裴炜。 本标准是首次发布。 III DB4401/T 12—2018 网络舆情分级与判定 1 范围 本标准规定了网络舆情研判评价的一般流程、指标体系、指标量化、综合评价、等级划分与风险程 度评价等内容。 本标准适用于广州市网络舆情的监测、评估、预警及相关软件开发等。 2 术语和定义、缩略语 2.1 术语和定义 下列术语和定义适用于本文件。 2.1.1 网民倾向性 Netizens' tendency 网民对舆情的评价和态度取向。 2.1.2 焦度 Focal power 舆情在传播过程中最受关注点所处的状态。 2.1.3 拐度 Flexion 舆情生命周期中拐点所处状态。 2.1.4 网站的PR值 PageRank 全称为PageRank,是google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值 越高说明该网页在搜索排名中的地位越重要。 2.1.5 传播扩散度 Propagation diffusivity 影响网络舆情信息安全的重要指标之一,它用来刻画某一具体的舆情事件或细化主题的相关信息在 一定的统计时期内通过互联网呈现的传播扩散状况。 2.2 缩略语 下列缩略语适用于本文件。 AHP:层次分析法(The Analytic Hierarchy Process) LDA:文档主题生成模型(Latent Dirichlet Allocation) 1 DB4401/T 12—2018 3 网络舆情评价一般流程 网络舆情评价工作应遵循一定的流程,主要包括以下三个环节,如图1所示: a) 舆情获取与分析:全面收集数据并获取网络舆情源头,对涉穗数据进行分类筛选,对影响因素 进行细致辨识; b) 数据分析:构建层次结构的指标体系,选择科学可行的方法,进行定性和定量的数据处理; c) 评价与措施:对舆情的危险程度进行分析,得出评价结果,给出建议的处理方法。 舆情数据获取 舆情获取与分类 数据信息筛选 舆情分类 网络舆情评价一般流程 建立指标体系 数据分析 选定评价方法 定性、定量分析 等级划分 评价与措施 结果评价 建议处理方法 图1 网络舆情评价一般流程 4 指标体系 网络舆情评价指标体系包括事件指标、网民指标、媒体指标、舆情态势指标等,这些指标又包含各 自的子参数,构成了一个层次的指标体系,如图2所示。针对不同的对象可选择不同的指标,包含但不 限于这些指标。 2 DB4401/T 12—2018 事件性质(P11) 事件指标(P1) 事件波及度(P12) 事件风险度(P13) 网民活跃度(P21) 网络舆情评价指标体系 网民指标(P2) 网民结构(P22) 情感倾向度(P23) 媒体权威度(P31) 媒体指标(P3) 传播扩散度(P32) 传播阶段(P33) 热度(P41) 舆情态势指标(P4) 关注度(P42) 图2 网络舆情评价指标体系 5 指标量化 5.1 量化要求 5.1.1 对网络舆情评价各指标量化可采用定性或定量的方法,标度范围为[0,1]。 5.1.2 对指标定性量化以评价小组成员的平均值作为最终量化值。评价小组成员应受过专业培训。 5.2 事件指标 5.2.1 事件性质 P11 3 DB4401/T 12—2018 按照社会矛盾产生的原因对涉穗舆情信息主题进行分类,通常包括公共安全、群体事件、重大灾害、 官员负面、经济财经、城市治理、意识形态等。事件性质可以通过文档主题生成模型(LDA,参见附录A) 进行聚类分析,其它合适的分析方法亦可使用。 5.2.2 事件波及度 P12 网络舆情波及度是衡量所有网络媒体中涉及到相关信息网站的比例指标。这一指标的意义在于评判 某一话题在网络中传播的广泛程度,或网民在任意登陆一家网站后能够获取到相关信息的概率。波及度 为一个在[0,1]之间的值,可由公式(1)计算。 N1 P12 = ∑ =i 1,=j 1 N wi S j ∑w i =1 ……………………………………(1) i 式中: P12 ——波及度; N1 ——表示涉及到相关信息的网站数量; wi Sj ——表示网站的权重; ——表示网站涉及到与事件相关的信息程度; N ——表示网站总数量。 5.2.3 事件风险度 P13 网络舆情信息内容风险度是指某一特定的网络舆情信息内容可能造成的危害程度,与评估者的着眼 点密切相关,如涉及重大安全事故、重大舆论危机等的负面舆情信息内容,风险度就较高。其评判结果 是通过专家问卷调查确定的,可分为高风险、一般风险、无所谓、不敏感四档。 网络舆情信息内容风险度经过专家问卷调查确定,构建层次分析法(AHP,参见附录B)的判断矩阵 建立。 5.3 网民指标 5.3.1 网民活跃度 P21 网民活跃度通过单位时间内发布信息次数、回复次数来衡量,计算方式见公式(2)。 A(t ) P21 = tend ∑ ( A(t ) + N ) ………………………………………(2) t =tstart 式中: P21 ——网民活跃度; A(t) ——在t时刻相关事件的网民活跃值,见公式(3); tend ——最近更新时间; tstart ——发布时间; N ——平滑参数,表示网民活跃值大于N 时具有参考价值。 A(t ) = Na ∑ w × ( P (t ) − P (t − 1)) i =1 4 i i i ………………………………(3) DB4401/T 12—2018 式中: A(t ) ——在t时刻相关事件的网民活跃值; Na ——网民行为种类数量; wi ——各种行为的权重,权重之和为1; Pi (t ) ——网民在t时刻对事件发布的信息、回复等各种对信息的关注行为次数。 5.3.2 网民结构 P22 网民结构包括年龄结构、教育程度结构等多个三级指标。通过文本挖掘技术的智能分析,得出一个 在[0,1]之间的值,如:判别式方法、矢量距离法、贝叶斯方法、记分器方法等。 经
DB4401-T 12-2018 网络舆情分级与判定 广州市
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2022-10-21 05:50:20上传分享