八文_文档搜索
 
设为首页   |  加入收藏夹
 八文网 - 汇聚八方文档 - 做最优秀的免费文档下载网站
 

地理数据及其

文档类型: Microsoft PowerPoint PPT 演示文稿 文档大小:942.5KB
第二章地理数据及其采集与预处理
本章主要内容:地理数据的类型地理数据的基本特征地理数据的采集与处理地理数据的统计处理地理数据分布的集中化与均衡度指数
第一节地理数据的类型
空间数据:用于描述地理实体,地理要素,地理现象,地理事件及地理过程产生,存在和发展的地理位置,区域范围及空间联系.
属性数据:用于描述地理实体,地理要素,地理现象,地理事件,地理过程的有关属性特征.
两个概念:
一、空间数据的表达点由一个独立的坐标点(x,y)定位、是空间上不可再分的几何实体.
线由若干个(至少两个,理论上是无穷个)坐标点(xi,yi)(i =定义、有一定的长度和走向,表示线状地物或点实体之间的联系.
面表示在空间上连续分布的地理景观或区域.点、线,面之间的拓扑关系.三种基本的地理几何实体及其组合点线面地域类型网络地带区域图2.1.1 三种基本的地理几何实体及其组合
二、属性数据的类型数量标志数据
①间隔尺度数据:以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量.
②比例尺度数据:以无量纲的数据形式表示测度对象的相对量.品质标志数据
①有序数据:当测度标准不是连续的量,只是表示其顺序关系的数据.
②二元数据:用0,1两个数据表示地理事物,地理现象或地理事件的是非判断问题.
③名义尺度数据:用数字表示地理实体,地理要素,地理现象或地理事件的状态类型.
几种属性数据举例:
1754.56 区域3
1365.46
2015.47 区域2区域1国内生产总值(万元)人口(人)土地面积年降水量年平均气温(°C)表2.1.1 间隔尺度数据间隔尺度数据比例尺度数据
129.56
135.69
124.50
115.68 农业发展指数
121.43
132.76
126.54
113.56
120.40 耕地复种指数年份表2.1.2 某地区耕地复种指数和农业发展指数有序尺度数据人口位次规模等级城市F城市E城市D城市C城市B城市A表2.1.3 城市等规模等级与人口数量的排位次序二元数据
1 表2.1.4 二元数据
其中:1表示两城市之间通航0表示两城市之间不通航名义尺度数据土地利用类型地块序列号表2.1.5 土地利用类型
第二节地理数据的基本特征数量化,形式化与逻辑化不确定性多种时空尺度多维性
一、数量化,形式化与逻辑化定量化的地理数据是建立地理数学模型的基础、其作用为:①确定模型的参数,给定模型运行的初值条件; ②检验模型的有效性.
形式化,逻辑化与数量化,是所有地理数据的共同特征.地理计算学,对于地理数据的形式化,逻辑化提出了更高的要求,要求整体和大容量的地理数据具有统一的数据形式和交换标准.
不确定性是地理数据的基本特征之一.地理数据不确定性的来源:地理系统本身的复杂性从本质上决定着地理数据的不确定性.各种原因所导致的数据误差.
二、不确定性
三、地理数据的多时空尺度:
从空间尺度上来看,描述地理区域的各种地理数据,具有多种空间尺度既有全球尺度的,洲际尺度的,国家尺度的,也有流域尺度的,地区尺度的,城市尺度的,社区尺度的.
从时间尺度上来看,描述地理过程的各种地理数据具有多种时间尺度,如历史年代,天,月,季度,年等.
四、多维性对于一个地理对象的具体意义要从空间,属性,时间三个方面综合描述.
空间方面,描述该地理对象所处的地理位置和空间范围,一般需要2~3个变量;
属性方面,描述该地理对象的具体内容、至少需要1个以上,多则需要十几个,甚至几十个变量;
时间方面,描述该地理对象产生,发展和存在的时间范围,需要1个变量;
地理数据的这种多维性,被人们描述为地理数据立方体(The Geographical Data Cube).
地理数据立方体域要素ntk时间图2.2.1 地理数据立方体
第三节地理数据的采集与处理地理数据的采集地理数据处理
一、地理数据的采集
地理数据的渠道来源:
(1)来自于观测,测量部门的有关专业数据.
(2)来自于统计年鉴,统计公报中的有关自然资源及社会经济发展数据.
(3)来自于有关单位或个人的不定期的典型调查数据,抽样调查数据.
(4)来自于政府公报,政府文件中的有关数据.
(5)来自于档案,图书等文献资料中的有关数据.
(6)来自于互联网(Internet)的有关共享数据.
(7)地图图件.主要包括各种比例尺的地形图,影像地图,专题地图等.
(8)遥感数据.主要包括各种航空遥感数据和卫星遥感数据.
(9)其它来源的有关数据.
采集地理数据的过程中需要注意的问题:
(1)数据的完备性和可靠性.
(2)在数据采集过程中、最大限度地减小数据的误差.
(3)在数据采集完毕后,进行检验、进行比较、辨别真伪,通过数据筛选、去粗存精,去伪存真.
二、地理数据处理地理数据处理,是所有地理问题研究的核心环节.从理论上讲,在地理学中、数学方法的运用主要有两个目的:(1)运用数学语言对地理问题的描述,建立地理数学模型,从更高,更深层次上揭示地理问题的机理;(2)运用有关数学方法,通过定量化的计算和分析,对地理数据进行处理,从而揭示有关地理现象的内在规律.因此,从一定意义上来说,地理数据处理也是计量地理学的任务之一.
地理信息系统的核心功能是地理数据处理,它实现了空间数据与属性数据的完美结合.数学方法确是其强有力支撑.
地理计算学的实质是借助于现代化的计算理论、计算方法和计算技术,通过对整体和大容量的地理数据进行处理,揭示复杂地理系统的运行机制,探索和寻求新的地理系统理论.
地理数据的采集,处理及其与数学方法,地理信息系统,地理计算学之间的相互关系图:地理数据的数据源地理数据采集数学方法地理处理数据图2.3.1 地理数据采集与处理
第四节地理数据的统计处理统计整理几种常用的统计指标与参数
变异系数的一个应用实例:中国经济发展水平的省际差异分析
一、统计整理
统计整理的基本步骤:
(1)统计分组所谓统计分组,就是根据研究目的,按照一定的分组标志将地理数据分成若干组.
(2)计算各组数据的频数,频率,编制统计分组表.
(3)作分布图.
例:对于黄土高原西部地区某山区县的人工造林地调查数据,步骤如下:以地块面积作为统计分组标志进行分组;计算各组数据的频数,频率,编制成如下的统计分组表;向下累计频数向上累计频数频率频数组中值(10,11)
(9,10]
(8,9]
(7,8]
(6,7]
(5,6]
(4,5]
(3,4]
(2,3]
(1,2]
(0,1]分组标志分组序号表2.4.1 某县人工造林地面积的统计分组数据
做出频数分布的直方图:图2.4.1 频数分布柱状图将上图各组的频数分布从组中值位置用折线连接起来,得到频数分布的曲线图:图2.4.2 频数分布曲线图
二、几种常用的统计指标与参数描述地理数据一般水平的指标描述地理数据分布的离散程度的指标描述地理数据分布特征的参数(一)描述地理数据一般水平的指标平均值,反映了地理数据一般水平.计算方法:
①未分组的地理数据
②分组的地理数据(2.4.1)
(2.4.2)中位数
①对于未分组的地理数据,样本数n为奇数时,中位数是位置排在第(n1)2位的数据;样本数n为偶数时,中位数是排在中间位置的两个数据的平均值.
②分组的地理数据,中位数的计算方法:
确定中位数所在的组位置,按下述公式计算中位数:或(2.4.3)
(2.4.4)在式(2.4.3)和(2.4.4)中、Me代表中位数;L为中位数所在组的下限值;U为中位数所在组的上限值;fm为中位数所在组的频数;Sm-1为中位数所在组以下的累计频数;Sm1为中位数所在组以上的累计频数;d为中位数所在组的组距.
众数:众数就是出现频数最多的那个数,计算方法分为以下两种情况:
①未分组的地理数据,可以根据每一个数据出现的频数大小直接确定众数.
②对于已经分组的地理数据,中位数的计算步骤如下:a.确定频数最多的组为众数所在组.
b.按以下公式计算众数:
(2.4.5)
(2.4.6)在式(2.4.5)和(2.4.6)中、M0代表众数;L为众数所在组的下限值;U为众数所在组的上限值;1为众数组频数与下一组频数之差;2为众数组频数与上一组频数之差;d为众数所在组的组距.
例1:下表给出了某农场各农田地块的面积,试计算其平均值,中位数和众数.
面积(ha)众数平均值地块编号应按照未分组数据计算其平均值,中位数和众数,计算结果见上表最后三列.
例2:下表给出了中国西部地区某城市2000年家庭月收入的抽样调查结果,试计算其平均值,中位数和众数.
合计8000~90007000~80006000~70005000~60004000~50003000~40002000~3000户数家庭月收入分组(元)
解题步骤:
用公式(2.4.2)计算平均数:计算中位数.先确定中位数所在组的位置,再按照公式(2.4.3)或者(2.4.4)计算中位数.
Me =元)=元)计算众数.先确定众数所在组,再按照公式(2.4.5)或(2.4.6)计算众数.
显然,众数所在组应该在第二组.众数M0 =元).
(二)描述地理数据分布的离散程度的指标
极差,指所有数据中最大值与最小值之差:
离差,指每一个地理数据与平均值的差,计算公式为:
离差平方和.它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为:
方差与标准差,从平均概况衡量一组地理数据与平均值的离散程度.方差计算公式为:
标准差为方差的平方根、计算公式为:
如果以样本方差对标准差进行无偏估计,则计算公式为:
变异系数,表示了地理数据的相对变化(波动)程度,其计算公式:
例如:对于下表中的数据,分别计算极差,离差,离差平方和、方差,标准差,标准差的无偏估计,以及变异系数.
步骤:
按照公式(2.4.7)计算极差:按照公式(2.4.8)计算离差,结果见下表.
-25.25
-1
-19.25
-42.25 离差面积序号表2.4.4 地理数据的离差
按照公式(2.4.9)计算离差平方和:
按照公式计算方差:
按照公式计算标准差:
按照公式计算标准差的无偏估计:
按照公式计算变异系数:
(三)描述地理数据分布特征的参数偏度系数,测度地理数据分布的不对称性情况,刻画以平均值为中心的偏向情况,计算公式为:g10,表示正偏,即均值在峰值的右边;g1=0,表示对称分布(如下图).
图2.4.3 偏度系数的三种情形峰度系数.它测度了地理数据在均值附近的集中程度,其计算公式为标准正态分布的峰度系数g2 =0;g2>0,表示地理数据分布的集中程度高于正态分布;g20
ppt文档的标签: 数据 及其 地理
更多推荐标签: 商品表格   网上付款   生产安全认证   建筑变更报告   就业工作   搜索引擎营销   工作保证书   有关执着论文   密码学引论   市场调研流程   保险术语词典   油漆工总结   大孔树脂   上海印染   淡之美   教育部数据   组织环境   消化科综述   网吧培训教程   分类网站   英文电信   艳遇之旅全文   西安未央   包装专业论文   语言净行为美   饭店意见表格   校庆主题   师资队伍规划   工程管理方   培养秘书素质  
相关文档推荐
数据教程
主要数据
初二地理
地理位置
中学地理的图象及其教学
自然地理
资深人士谈地理高考命题思路及其对策分析
地理位置
地理讲座
模块数据
学好地理
高三地理
地理数据和地理信息的组合
运动地理
初一地理
文综地理
地理学院
地理演义
军事地理
富地理创
推荐文档下载
输欧盟十类纺织品2006年度第一次分配方
未能成行的国庆旅游
英语写作基础自测题(三)
九十四年北区大学院校辅导工作协调谘询中心
名古屋市鸣海工场整备
公共关系学课程教学大纲
自然教学法
中保人寿保险有限公司上海市公司
九年一贯健康与体育学习领域内涵
随机样本
浙江中大集团股份有限公司
第一版
企业人力资源战略规划的制定和推行
行政法与行政诉讼法(开放本补修)模拟试题
春湾站报
D572005422星期五
开题报告
"武汉市国家税务局失踪纳税人公
省直电学毕业论文工作有关要求
发酵动力学
 
文档下载提示:
·最新免费文档下载、毕业论文免费下载、Word文档下载、Excel表格下载、PDF电子书下载、PowerPoint提案下载
·所有文档均为网友上传,仅供学习参考,用作其它用途时请征得相关权益人许可.
·八文网只提供文档共享平台,不对文档内容的正确性及相关内容所引发的后果负责.
·如此文档"地理数据及其"涉及您的权益,请附上网址来信告知web_8wen(#)126.com,本站将认真配合并改正。
Copyright ©2005-2008 八文网-  8Wen.com . All rights reserved.