八文_文档搜索
 
设为首页   |  加入收藏夹
 八文网 - 汇聚八方文档 - 做最优秀的免费文档下载网站
 

科学数据库元数据分析与应用

文档类型: Microsoft PowerPoint PPT 演示文稿 文档大小:319KB
科学数据库元数据分析与应用
中国科学院计算机网络信息中心
黎建辉
2004.6.3
提纲
科学数据库元数据建设的背景与需求
科学数据库元数据框架
科学数据库核
元数据规范
工具与试应用
总结
背景
从学科视角看科学数据库(Domain)
45个主体数据库主要涉及到8个的一级学科
生物学(14)
地球科学(19) >物理学(3)
化学(3)
天文学(1)
材料科学(2)
能源科学技术(2)
化学工程(1)
背景(Cont.)
从资源分布的视角看科学数据库(Distribution)
45个主体数据库主要分布在15个城市,涉及到45个单位
北京(17)
上海(3)
沈阳(1) 长春(4) 大连(1)
兰州(1) 西安(1) 新疆(1)
成都(1) 昆明(2)
武汉(4) 长沙(1)
南京(3) 青岛(1)
广州(4)
背景(Cont.)
从资源类型的视角看科学数据库(Data type)
结构化数据(Structure Data)
关系数据库
半结构化数据(Semi-structure Data)
Html
特定类型的数据文件
非结构化数据(Un-structure Data)
图像,视频,音频等多媒体文件
背景(Cont.)
Distribution(Autonomous)
Domain
Data Type
C(DB)= {Distribution, Domain, Data type}
自治性带来异构性
Design Autonomy
The conceptualization or semantic interpretation of data
The representation and the naming of the data elements
The data being managed
Constraints used to manage the data
The functionality of the system
The association and sharing with other systems
The implementation
Communication Autonomy
Execution Autonomy
Association Autonomy
自治性(Autonomy)
异构性(Heterogeneity)
Information heterogeneity
Semantic Heterogeneity
Structural, Representation/Schematic Heterogeneity
Syntactic, Format Heterogeneity
System Heterogeneity
Digital media repository management system
Database management system
DBMS, data model heterogeneity
Concurrency control, recovery heterogeneity
Operating System
File system, naming, type heterogeneity
Operations, transaction support heterogeneity
Hardware System
Instruction set, data coding heterogeneity
元数据的需求(Cont.)
从数据访问和共享的需求看
Creator&
Provider
Administrator&
Organizer
User
Scientific
Database
Creation&
Collection
Organization
Searching&
Retrieval
Utilization
Value-added
App/Service
Clear out
元数据的需求(Cont.)
从数据库集成与互操作来看
A
B
格式/语法
结构/表示
语义
C
元数据的需求(Cont.)
从数据库集成与互操作来看
A
B
C
CDM
C
Common Data Model
(Metadata format)
科学数据库中二个层面的元数据
The real world
Data/Database World
概念化,模型化和数字化
User/App. World
发现,访问和使用
内容分析
数据库内容的元数据
资源描述
数据库描述的元数据
元数据在科学数据库中的作用
元数据
规范
安全体系
通用数据
管理工具
数据目录
管理工具
访问控制
工具包
信 息 服 务 子 系 统
数据访问子系统
图像数据
处理工具
数据量统计分析工具
系统平台中间件
应用服务
与工具集
其他
通用元数据管理工具
科学数据库元数据框架
References:DC FGDC ISO19115 EML MPEG7 etc
.
Ref.
Ref.
Semantic rule
Structure rule
Syntax rule
Extension Rule
Schema
Namespace
Semantic Statements
Schemes
Crosswalk/mapping
Core
Metadata
Domain-specific metadata
Media-specific metadata
Application Profile
Authoring tools
Metadata
format
规则集
语义规则(Element Semantic)
中文名称(Chinese Name)
英文名称(English Name)
标识(Identifier)
定义(Definition)
类型(Type)
值域(Domain)
选择性(Option)
最大出现频率(Max Occurrence)
注释(Note)
规则集
Root
Module
Module
……
Component
……
Component
……
Component
Component
Element
……
Element
Element
……
Root-Module-Component-Element
结构规则
规则集
语法规则
遵循 XML Schema 语法规则















………….
语法规则















………….
A Schema Example
扩展规则
应用方案制定(Application Profile)
应用方案制订规则
裁减
应该包括原标准中的所有必选模块的必选元素;
一般来说,所创建的元数据应用方案中应包含原标准中的核心元数据元素;
允许根据需要削减掉某些可选元素;
扩展
在确定拟新增模块/元素与原标准中的模块/元素不存在语义重复之后,可以定义新的模块/元素;
新增元素不可用于替换原标准中现有元素的名称,定义或数据类型.
应将扩展元素合理地组织到原标准所确定的"模块-复合元素-数据元素"这一结构中去;
应用方案制订规则
修改
允许对已有模块/元素施以更严格的可选性限制,即可以在应用方案中将核心标准中的某一可选模块/元素设定为必选元素.
允许将已有元素的值域由"自由文本"替换为一个合适的值代码表,以限制该元素的值域;
允许缩小已有元素的值域.例如,在核心标准中某个已有元素的值域为整数,那么应用方案中可以规定该元素的值域为某个范围内的整数;
允许对已有代码表进行扩充;
不允许对核心标准进行上述原则所没有允许的任何扩展.
基于框架的实施现状
科学数据库
核心元数据标准V1.1
科学数据库
生态研究元数据标准V1.1
科学数据库
大气数据元数据标准V1.0
科学数据库
多媒体元数据框架
主体数据库元数据
应用方案
SDB
Core
Metadata
Media-specific
Metadata
discipline
Specific
Metadata
Application Profile
科学数据库核心元数据规范
适用对象
任何一个数据库/数据集,包括逻辑意义上的以及物理意义上的
作用
各专业数据库提供统一,规范的结构化描述
为各专业子库的导航,联合目录服务
为网格平台中信息服务子系统,数据访问子系统服务
设计的原则与优点
简单性与通用性
可扩展性
缺点
各学科领域的专指度不够
核心元数据规范(Cont.)
数据集元数据
数据集描述
数据集结构
数据集质量
数据集分发
数据集服务
服务元数据
服务名称
服务类型
服务描述
服务标识
服务参数
中间件服务
Grid服务
FTP服务
WWW服务
…….
核心规范的学科领域应用范例
SDB-ERM
SDBCM
必选元素
修改
ISO 19115
CSDGM
EML
CERN
FLED
扩展元素和模块
未修改的元素
长期生态观测数据元数据规范
生态数据元数据规范
CnemsDatasetType
0..∞
0..∞
0..∞
0..∞
DatasetDescriptionInfo
DistributionInfo
RsProject
MetadataReferenceInfo
ServiceDescriptionInfo
RsMethod
RsField
StructrureDesciptionInfo
CnemsDataset
CoverageInfo
ContactInfo
CitationInfo
主模块
辅助模块
根元素
两种规范之间的关系
CnemsDatasetType
0..∞
0..∞
0..∞
0..∞
DatasetDescriptionInfo
DistributionInfo
RsProject
MetadataReferenceInfo
ServiceDescriptionInfo
RsMethod
RsField
StructrureDesciptionInfo
CnemsDataset
CoverageInfo
ContactInfo
CitationInfo
MetadataReferenceInfo
DistributionInfo
DatasetDescriptionInfo
Dataset
ServiceDescriptionInfo
StructureDescriptionInfo
SDB Core Metadata
CoverageInfo
ContactInfo
DatasetType
0..∞
生态学元数据标准
核心元数据标准
新增模块
工具支持与试应用
科学数据库通用元数据管理工具
MDIS
(LDAP)
interim XML
MD schema
User
page
Process
(Java bean)
XML engine
install & configure
universal, extensible
customizable
总结
元数据对科学数据库的资源发现,管理,应用和互操作至关重要
科学数据库中元数据包括数据库描述和数据库内容两个层面的元数据,后者在分析和应用过程中难度更大,对数据库的互操作和集成作用也更大
一个定义完整的元数据框架对于一个多种元数据格式并存的系统尤其重要,它是未来系统中不同的元数据互操作的基本保障
谢谢!
标准的主体包括五个主要模块和两个辅助模块.
五个主要模块是数据集描述信息,数据集分发信息,元数据参考信息,服务描述信息以及结构描述信息等模块.
五个主要模块中,数据集描述信息,元数据参考信息模块是必选模块,其余三个模块是可选模块,可根据数据集的具体情况选择著录或不著录.
服务描述信息模块和结构描述信息模块是本标准中的特殊要求.
两个辅助模块是联系信息模块和范围信息模块.它们不可单独使用,供主要模块的特定元素在需要的时候进行引用.

ppt文档的标签: 数据分析 应用 数据库 科学
更多推荐标签: 服务器托管   艺术构思   需求规约实例   印刷类   党政干部题   皇剪电话   初一教材上   工程施工用表   义务支教总结   体育概念分类   山东邹平医院   自学考试教材   会计人家   单凤儒   锅炉热效率   公务文书命令   标准工时   东中西部   河内由加利   初二生物   房产测量设计   仓储现状分析   篮球运   世界能源资源   股指期货会计   竟聘答辩   导购排班表   描写鹅的作文   大一学年论文   电线标准  
相关文档推荐
数据库应用
样本与数据分析初步
数据库或数据文件全名
数据库与数据访问技术
科学数据库标准规范建设
科学数据库建设文档规范
数据库数据仓库数据挖掘
数据库管理及应用
科学数据库
科学数据库建设和中
数据库功能的分析与应用
零售商店数据库应用系统(GrocerMI
网络数据库应用教程
数据库应用系统设计
基于关系数据库的地籍空间数据0储结构
空间数据结构与空间数据库
2002数据库应用
科学数据库项目验收文档编写说明
数据分析代理(DAA)模式研究与实践
中国人民大学教师论文被中国科学引文数据库
推荐文档下载
北京林业大学振兴计划人才培养专项课题
门市位于我国东南沿海
安徽省国土资源科学技术普及计划
教务信息管理系统教师信息变更申请表
股权分置改革背景下基金的作用
国际金融教学大纲
上市公司04年三季报业绩预测
泰安鲁润股份有限公司独立董事工作制度
人事部
文秘类专业
高级时尚管理项目
数码通(澳门)与
继续教育试题
总目26-政府统计处
项目名称:年产1500台中小型液压挖掘机
CRM2800机架式以太网收发器
券商发展的新机遇
EKZ900系列齐纳安全栅样本
社区邻里182006年2月10日星期五
中华人民共和国消费者权益保护法中明确规
 
文档下载提示:
·最新免费文档下载、毕业论文免费下载、Word文档下载、Excel表格下载、PDF电子书下载、PowerPoint提案下载
·所有文档均为网友上传,仅供学习参考,用作其它用途时请征得相关权益人许可.
·八文网只提供文档共享平台,不对文档内容的正确性及相关内容所引发的后果负责.
·如此文档"科学数据库元数据分析与应用"涉及您的权益,请附上网址来信告知web_8wen(#)126.com,本站将认真配合并改正。
Copyright ©2005-2008 八文网-  8Wen.com . All rights reserved.