ICS 35.020 CCS L 70 35 福 建 省 地 方 标 准 DB35/T 1952—2020 公共信息资源开放 数据质量评价规范 Open data—Specification for quality evaluation 2020 - 12 - 30 发布 福建省市场监督管理局 2021 - 03 - 30 实施 发 布 I DB35/T 1952—2020 目 前 次 言 ..............................................................................II 1 2 3 4 5 6 范围 .................................................................................1 规范性引用文件 .......................................................................1 术语和定义 ...........................................................................1 数据集元数据描述 .....................................................................2 数据质量评价原则 .....................................................................3 数据质量评价方法 .....................................................................3 6.1 重复值分析法 .....................................................................3 6.2 缺失值分析法 .....................................................................4 6.3 值域分析法 .......................................................................4 6.4 逻辑关系分析法 ...................................................................4 6.5 词组比对分析法 ...................................................................4 6.6 实验观察法 .......................................................................4 6.7 经验分析法 .......................................................................4 7 数据质量评价指标 .....................................................................4 7.1 完整性 ...........................................................................4 7.2 一致性 ...........................................................................5 7.3 唯一性 ...........................................................................6 7.4 可机读性 .........................................................................7 7.5 规范性 ...........................................................................8 7.6 及时性 ...........................................................................9 7.7 原始性 ...........................................................................9 7.8 非歧视性 .........................................................................9 7.9 安全性 ..........................................................................10 8 数据质量评价步骤 ....................................................................10 8.1 步骤 ............................................................................10 8.2 选择评价指标 ....................................................................11 8.3 初步评价 ........................................................................11 8.4 数据集元数据评价 ................................................................11 8.5 标识数据记录评价 ................................................................11 8.6 内容数据记录评价 ................................................................11 8.7 形成评价结果 ....................................................................12 附 录 A (资料性) 评价结果应用示例 .................................................13 I DB35/T 1952—2020 前 言 本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由福建省经济信息中心提出。 本文件由福建省信息化标准化技术委员会归口。 本文件起草单位:福建省经济信息中心、浪潮软件股份有限公司。 本文件主要起草人:阙天豪、何坤山、郑清溪、吴阳、戴起飞、张兆勇、鲍庆峰、许剑雄。 II DB35/T 1952—2020 公共信息资源开放 数据质量评价规范 1 范围 本文件给出了公共信息资源开放数据集元数据描述,确立了数据质量评价的原则、方法、指标和步 骤。 本文件适用于公共信息资源管理、开放、开发和质量评价等活动中的数据质量评价。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 7408—2005 3 数据元和交换格式 信息交换 GB/T 19710—2005 地理信息 元数据 GB/T 36344—2018 信息技术 数据质量评价指标 日期和时间表示法 术语和定义 GB/T 19710—2005、GB/T 36344—2018界定的以及下列术语和定义适用于本文件。 3.1 政务部门 government department 国家机关、经法律法规授权或者受委托管理公共事务的事业单位和团体组织。 3.2 公共信息资源 public information resources 政务部门、公共服务企业在履行职责或经营过程中制作或获取的,以一定形式记录、保存的,与企 业和公众息息相关的文件、资料、图表和数据等各类信息资源。 3.3 公共信息资源开放 opening of public information resources 经过数据加工处理后,将不涉及国家秘密、商业秘密和个人隐私的公共信息资源,通过公共信息资 源开放平台,提供给社会使用的过程。 3.4 数据质量 data quality 在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。 1 DB35/T 1952—2020 [来源:GB/T 36344—2018,2.3] 3.5 数据质量评价 data quality evaluation 按照数据质量评价指标体系,采用适当的方法对数据质量进行评估,并形成数据质量评价结果的过 程。 3.6 数据集 dataset 具有一定主题,可以标识并可以被计算机化处理的数据集合。 [来源:GB/T 36344—2018,2.6] 3.7 元数据子集 metadata section 元数据的子集合,由相关的元数据实体和元素组成。 [来源:GB/T 19710—2005,4.8] 3.8 数据项 data item 数据的不可分割的最小单位。 4 数据集元数据描述 数据集元数据包括标识子集和内容子集,描述见表1。 表1 数据集元数据 序号 子集 元素 1 名称 2 摘要 3 开放类型 4 5 标识子集 提供单位名称 提供单位统一社会 信用代码 6 提供单位地址 7 提供单位联系方式 填写说明 缩略描述公共信息资源内 由概括公共信息资源内容的标题和“信息”字 容的标题 样组成 对公共信息资源内容进行 概要说明的文字 与公共信息资源名称相对应 公共信息资源面向社会
DB35-T 1952-2020 公共信息资源开放 数据质量评价规范 福建省
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2022-09-30 11:01:31上传分享