气象数据预处理二(筛选、去空格、批量公式)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
气象数据预处理二(筛选、去空格、批量套用公式)
西北农林科技大学资环学院小华哥
一、数据筛选
二、去除空格
三、批量套用公式
四、三点注意(去公式,保留负值,扩展排序)
一、数据筛选
1、下载的气象数据有10万条记录左右,包含了全国各个省份不同站点的不同气象数据,而我们在使用的时候可能并不需要这么多,只需要几个省、某些年月分的某些指标,因此我们迫切需要找到一种方便快捷的数据筛选方法。
这就需要用到Excel的数据筛选功能。
2、如我们需要“陕西省+2012年+1月”的气象数据,操作方法如下:
①选择条件行,也可以按住“shift”逐个选择筛选条件。
条件行选择第一列。
②找到头行的“数据-筛选”点击“筛选”,可以看到每个单元格后面显示了一个倒三角,这就是条件选择列表。
③我们在省份后面点击三角形出现以下筛选条件,打对勾的数据就是会显示的数据,我们只保留陕西的对勾,其他省份对勾去掉。
④这时,保留下来的数据都是陕西的了。
同理,保存只显示2012年、1月的数据。
那么保留下来的数据就是陕西省2012年1月份的数据了,可见,筛选条件是可以多次套用的。
此时,我们就可以将筛选后的数据单独保存成工作簿,导入ArcGIS 等软件进行空间插值了。
二、去除空格
1、⑤在第③步中,可以发现陕西省有两个,这是因为省份名称中有空格,这时,我们就需要将空格去掉,以便以后进行查询筛选。
选中第一行筛选条件列,点击“筛选”按钮,将筛选模式关闭,此时会显示所有数据。
选中省份列(只对此列进行数据查询),击替换按钮,查找内容设置为“ ”(不要双引号,在“查找内容处敲一个空格,不能多敲;如果是查找两个空格,就敲两个空格”,如下左图,注意空格的位置);替换内容为空即可(空表示连空格都没有,如下右图,注意输入光标的位置);点击全部替换即可将本列一个空格的去掉。
2、我们再来筛选陕西省的数据,可以发现只有一个陕西了
三、批量套用公式
1、在气象数据预处理一中曾经讲到过一个批量套用公式的方法,即Excel的“复制臂”按钮,那种方法对于千级的数据还比较使用,如果对10万条以上的记录
做复制臂,也很花费时间。
在此传授一个“一键套用公式”的方法。
2、我们以降水为例。
从气象中心获取的气象数据都是乘以过10的,在使用时需
要除以10,变成mm的单位。
3、在降水数据右侧新建一列,并输入公式,点击回车键。
4、(将需要套用公式的范围选中)选中此单元格,并拖动窗口右侧边缘的滑动杆,
到需要复制数据的最后一个单元格,按住Shift的选中最后一个单元格。
5、回到公式输入栏,将光标定位到公式末尾。
按住ctrl,并敲击Enter。
即可批量复制公式,秒杀!
四、三点注意
1、对于有公式计算出的数据,再保存时,需要“再复制-只保留数据”式的保存。
如上5中的温度计算的温度数据,是通过公式计算得来的。
每个数据都包含了公式,如果原始数据发生变化,自身数据也会跟着变化。
如,我们获取了mm单位的降水数据后,想把原始的数据列删除掉。
此时,数据就全部变成了空值。
可见数据都包含公式
处理方法:①复制带公式的数据列;②原地粘贴,粘贴类型选择“123”数字型号。
处理好后,我们再看公式列,就只有数据,而没有公式了。
2、保留负值
气象数据中,有些数据是负数,如气温、气温距平、降水距平等等。
因此在复制、粘贴数据和设置单元格格式(一般在保留负数位数时会用到)时,要注意保留负数。
如在设置保留小数位数时。
负数显示类型只能选择最后两种类型。
不然会将负数变成正值。
2、数据排序时,各列数据之间不要刘空白列,不然无法“扩展排序”。
有时需要将数据按照月份大小排序,这个时候,当然需要每个站点的温度、位置等其他信息根据月份的排序,跟着它一起换位置,不然就会发生数据错位。
如以下数据。
正确的做法就是选中月数据列,选择排序“Z-A”从大到小排列。
在排序方式中选择“扩展选定区域”,表示在月分数据排序后,其他信息也跟着一起变换位置。
第二项目,是只更改月份排序,其他信息位置不变。
1、只能选择“扩展选定区域”,在月份排序的同时,其他信息也跟着一起变了位置。
记住这个循序。
2、常常发生错误的地方不在于没有选择扩展排序,而是,在信息列中间插入了空白数据列。
导致数据错位。
如我在降水数据列后面加入一列空白数据列想加入
降水计算数据,但是又没来得及加入(如下图)
3、对月数据进行从大到小的排序。
左侧是没有空白数据列的正确排序,右边是有空白数据列的扩展排序。
都是扩展排序,但是由于后者中间有空白数据列,导
致扩展范围中断,使得温度数据和其他数据发生错位。
这个作用给我们两点启示:
1、如果需要中断扩展排序范围,只需要在中间加入空白数据列(连标题也是要空白的)
2、如果需要全局扩展排序,那么所有列数据之间不能要留全部是空白的数据列。
如上例中降水和温度列之间,只需要至少一个数据,能将两侧数据联系起来,并
不需要把中间空白处全部填满。
The End。