ICS 65.020.30 CCS B 40 重 DB50 庆 市 地 方 标 准 DB50/T 1096.2—2021 畜牧兽医大数据应用与管理 第 2 部分:元数据 2021-03-30 发布 2021-07-01 实施 重庆市市场监督管理局 发 布 DB50/T 1096.2—2021 前 言 本文件按照GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规定 起草。 本文件是DB50/T 1096的第 2 部分。DB50/T 1096已发布了以下部分: ----第 1 部分:总则 ----第 2 部分:元数据 ----第 3 部分:信息分类与编码 ----第 4 部分:数据接口 ----第 5 部分:共享交换技术要求 ----第 6 部分:信息资源目录 ----第 7 部分:管理要求 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由重庆市农业农村委员会提出并归口。 本文件起草单位:重庆市畜牧技术推广总站、重庆大学、广州中科易德科技有限公司、西南大学、 广州中国科学院软件应用技术研究所。 本文件主要起草人:李晓波、古平、李引、陈红跃、夏云霓、樊莉、张科、何道领、黄文明、朱燕、 赖鑫、高敏、陈雷。 I DB50/T 1096.2—2021 畜牧兽医大数据应用与管理 第 2 部分:元数据 1 范围 本文件规定了畜牧兽医行业大数据应用与管理的元数据。 本文件适用于畜牧兽医行业有关数据集属性的统一规范化描述。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 7408 数据元和交换格式 信息交换 日期和时间表示方法 GB/T 18391.1—2009 信息技术 元数据注册系统(MDR) 第 1 部分 框架 GB/T 19710—2005 地理信息 元数据 3 术语和定义 下列术语和定义适用于本文件。 3.1 元数据 metadata 定义和描述其他数据的数据。 [来源:GB/T 18391.1—2009,3.2.16] 3.2 数据集 dataset 可以识别的数据集合。 [来源:GB/T 19710—2005,4.2] 4 畜牧兽医数据集的元数据 4.1 元数据组成 畜牧兽医行业数据集的元数据包括核心元数据与参考元数据。参考元数据与核心元数据的包含关系 见图 1,其中数据集按照GB/T 19710的要求进行。 1 DB50/T 1096.2—2021 图 1 参考元数据与核心元数据的包含关系 4.2 元数据框架 畜牧兽医行业数据集的元数据规定了 7 个元数据子集,详见4.5、4.6: a) 元数据标识信息:包含元数据本身的基本信息。 b) 数据集标识信息:包含元数据所描述的数据集的基本信息。 c) 内容信息:包含数据内容特征的描述信息。 d) 分发信息:包含数据分发的信息以及用户获得数据的途径。 e) 数据质量信息:包含数据集数据质量信息的说明。 f) 限制信息:包含对元数据或数据集进行访问和使用的限制信息。 g) 维护信息:包含元数据或数据集的更新频率及更新范围的信息。 畜牧兽医行业数据集参考元数据的聚集关系与依赖关系见图2。 图 2 畜牧兽医行业数据集参考元数据的聚集关系与依赖关系 4.3 元数据的结构层次 按照GB/T 18391.1的要求,元数据的结构包含元数据元素、元数据实体和元数据子集三个层次: a) 元数据元素:最基本的信息单元。例如:数据集名称、数据集标识符、元数据创建日期等。 b) 元数据实体:同类元数据元素的集合。例如“数据集提交和发布方”这一元数据实体需要“单 位名称”、“联系人”、“联系电话”等若干个元数据元素来说明。 c) 元数据子集:元数据的子集合,由元数据元素与元数据实体组成。例如标识信息、内容信息、 分发信息等。 4.4 元数据摘要描述 2 DB50/T 1096.2—2021 元数据摘要描述定义畜牧兽医行业数据集的元数据内容。表1给出了元数据的元素、实体与子集的 定义。表2给出了元数据元素表达式符号的含义。 表1 描述符 约束性 中文名称 必选 元数据摘要描述符 说明 元数据子集、元数据实体或元数据元素的中文名称。 元数据子集、元数据实体或元数据元素的英文名称,一般使用英文全称。英文名称的要求如 英文名称 必选 下:词汇均采用无缝连写,元数据子集与元数据实体英文名称的每个词汇的首字母均为大写, 元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。 定义 必选 描述元数据子集、元数据实体或元数据元素的基本内容,是畜牧兽医大数据信息数据集某个 属性和特征的概念与说明。 表示对元数据的有效值域和允许对该值域内的值进行有效操作的规定。数据类型遵循如下规 定:元数据子集与元数据实体的数据类型为复合型,元数据元素的数据类型包括数值型、布 尔型、字符串、日期型和复合型等;当元数据元素的数据类型为复合型的时候,表明该元数 数据类型 必选 据元素使用了引用信息中的引用数据类型;引用数据类型是由一组元素组成、能被重复引用 的元素集合。例如,“数据集提交和发布方” 和“元数据维护方”两个属性,要共同用到 “单位名称”、“联系人”、“联系电话”、“通讯地址”、“邮政编码”和“电子邮件地 址”这一组子元素来表示,为了表达的方便,畜牧兽医大数据信息元数据定义了一个叫做“负 责方”的数据类型,供“数据集提交和发布方” 和“元数据维护方”进行引用。 元数据子集、元数据实体或元数据元素的英文缩写名称,具体缩写规则如下:短名在本标准 范围内必须唯一;对存在国际或行业惯用英文缩写词汇的元数据元素、实体或子集,采用惯 用英文缩写作短名;对于根据英文名称或自定义的短名,在可以保证其(本标准范围中的所 短名 必选 有短名范围内)唯一性的情况下取每个词汇的前 3 位字母作为其短名,当如此取词时发现 不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加 1 位,如果仍然不能满 足唯一性要求,则照此顺延;元数据元素、实体或子集的短名中,词汇均采用无缝连写。元 数据子集与实体短名中每个词汇的首字母均为大写;元数据元素短名的首词汇全部小写,其 余词汇的首字母采用大写。 注解 必选 取值规则 可选 对元数据子集、元数据实体或元数据元素的含义的进一步解释,包括该元数据的约束/条件 (必选、可选)和最大出现次数。当该元数据为可选时,应注明其约束条件。 元数据元素、元数据实体或元数据子集取值方式的说明。描述元数据元素时必选,描述元数 据实体、子集时不选。 子元素是通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数 子元素 可选 据元素。表示规则为:“标识符=表达式”。描述元数据实体、子集时必选,描述元数据元 素时不选。具体定义方式见表2。 表2 元数据元素表达式符号含义 符号 含义 = “=”左侧由“=”右侧内容替换、生成、组成,补充举例 + 与,“+”左侧与右侧的两项都要选择 | 或(选择),在由“|”分开的两项之中选择其一 a 表示元数据元素a为必选项,且最大出现次数为1 3 DB50/T 1096.2—2021 表 2(续) 符号 含义 0{a}1 表示{}中的元数据元素 a 为可选项,且最大出现次数为1或参见其注解 0{a}n 表示{}中的元数据元素 a 为可选项,且最大出现次数为N或参见其注解 1{a}n 表示{}中的元数据元素 a 为必选项,且最大出现次数为N 4.5 畜牧兽医行业数据集核心元数据 畜牧兽医行业数据集的核心元数据包括 8 个必选元数据元素或实体,10 个可选元数据元素或实 体。畜牧兽医行业数据集的核心元数据内容见表 3。 表3 核心元数据内容 畜牧兽医行业数据集核心元数据内容 元素或实体 约束性 在参考元数据中的位置 数据集名称 元素 必选 数据集标识信息 数据集标识符 元素 必选 数据集标识信息 数据集摘要 元素 必选 内容信息 元素 必选 数据集标识信息 关键词 实体 必选 数据集标识信息 数据集语种 元素 必选 数据集标识信息 元数据创建日期 元素 必选 元数据标识信息 元数据标识符 元素 必选 元数据标识信息 数据集特征数据元 元素 可选 内容信息 数据集发布日期 元素 可选 发布信息 数据集发布格式 实体 可选 发布信息 在线访问地址 元素 可选 发布信息 数据集分类 实体 可选 数据集标识信息 相关环境说明 元素 可选 数据集标识信息 元数据负责方 元素 可选 元数据标识信息 元数据标准名称 元素 可选 元数据标识信息 元数据标准版本 元素 可选 元数据标识信息 元数据更新日期 元素 可选 元数据标识信息 数据集提交或发布方 具体核心元数据内容说明见表 4。 表4 核心元数据内容 定义 简要描述数据集 数据集名称 主题与内容的标 题 畜牧兽医行业数据集核心元数据具体说明 英文名称 datasetTit le 数据类型 字符串 取值规则/子元素 自由文本 短名 dataTi tle 约束性 必选项,最 大出现次数 为1 4 DB50/T 1096.2—2021 表 4(续) 核心元数据内容 定义 英文名称 数据类型 取值规则/子元素 短名 约束性 按照“提交机构-编号版本号”的命名规则进行 数据集标识符 数据集的唯一标 datasetIde 识符 ntifier 字符串 赋值。提交机构使用机构 标准名称,版本号用1位 必选项,最 dataID 大出现次数 为1 整数加2位小数的表示方 式,例如“2.10”(版本) 数据集摘要 数据集内容的简 单说明 abstract 字符串 自由文本 abstra ct 必选项,最 大出现次数 为1 提交或发布数据 数据集提交或发布 方 集,并对数据集的 真实性、正确性、 可靠性负责的单 datasetCon tact 复合型 自由文本 dataCo ntact 必选项,最 大出现次数 为1 位或部门 用于描述数据集 关键词 主题的通用词、形 keywords 字符串 自由文本 式化词或短语 数据集语种 元数据创建日期 元数据标识符 数据集采用的语 datasetLan
DB50-T 1096.2-2021 畜牧兽医大数据应用与管理 第2部分:元数据 重庆市
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2022-10-11 13:39:29上传分享