部门数据整理应用指南.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
部门数据整理应用指南
普查中心宋雪清
2008年9月5日
在获得统计、工商、国税、地税、编办、民政、质监等部门数据
并将其导入单位清查程序之前,由于各部门数据格式、内容不统一,
需要预先通过EXCEL对各部门提供的数据分别进行整理和规范,主要
包括以下几个方面的工作:①将详细地址中的省、市、县名称去掉,
并将所有门牌号统一为半角字符。②尽量获得9位或12位行政区划
代码。③核实与剔除同一部门重名重码的单位。④按统一的顺序排
列指标。
具体操作过程如下:
一、用EXCEL打开部门提供的数据文件,删除其中不需要的列,以
及难以整理成标准代码的中文行业说明,经营范围,单位类型
等等信息,重点保留“部门登记注册号、组织机构代码、单位名
称、法定代表人、详细地址、联系电话”等指标。有的部门数据
数据可能有“注册地址”和“经营地址”等多项地址内容,这时可选择一项作为“详细地址”。
二、通过快速排序键升、降排列来观察详细地址的特点。选
中“详细地址”列,通过EXCEL的替换功能将其中包含的省、地、
县、市等内容都替换为空。注意,在替换时,一定要选中“详细
地址”列,否则可能将单位名称改变。
三、在“详细地址”一列后插入5列空白列,同时插入一个新的Sheet
用来放置本区县的行政区划代码,放置时要将行政区划名称放
在前列,行政区划代码放在后列,将全部代码区域选中,然后
在左上角的名称框处输入“aa”,aa就代表这里选中的行政区划代码区域,在后面的公式中要使用(见图)。本区县的行政区划
代码应以这次普查的标准12位代码为准。
2 四、 打开“部门数据整理及行政区划代码赋码模板.xls”,复制选定区
域的内容,见图。
五、 将上一步复制的内容粘贴到部门文件刚插入的 5 列的第 1、 行
中。其中第 2 行各单元格中对应的其实是公式,其含义见下表,
其公式内容需要根据本地的情况进行简单修改。主要是将 H2
单元格公式中“220104000000”改为本区县的行政区划代码(后
6 位为 0)。
六、选择公式所在的5个单元格,如图,可用三种方式将这些公司
扩展到其他所有单位所在的行。一是当鼠标放在选中区域的右下角且其形状变为黑十字时按下鼠标左键向下拖动,二是当鼠标变为黑十字时双击鼠标自动填充,三是选中这5列中单位对应的所有行,通过编辑菜单中的向下填充命令,自动填充每一个单位的情况。
1、点击“去掉街道乡镇名称后的地址(半角)(此列为最后详细地址的内
容)”这一列,再单击快速降序排序键,会看到最前面有些空行或地
址的首位为数字的情况,这时要将“详细地址”一列中与这些空行或数
字对应的内容复制到此处,代替公式的内容。
2、点击“提取的街道、乡镇名称”列,再单击快速降序排序键,然后
观察该列的内容,看看街道乡镇名称提取得是否正确,同时观察“补充
街道、乡镇级行政区划代码”这一列中的行政区划代码是否达到9位
(7、8、9位不都为0)。如果街道乡镇名称明显错误,就要用详细地址
中的内容代替,或修改详细地址的内容。
3、
4、,及社区村委会名称所在列及赋码效果,有可能有些村、居委会等名称
在标准行政区划代码表中没有赋码,或同一个村有两个名,这时可补充
一下标准代码表的内容,从而在名录中自动得到相应的行政区划代码。
第一个单元格中的公式为:
=IF(ISERROR(FIND("办事处",H2))=TRUE,"",MID(H2,1,FIND("办事处",H2)+2))&
IF(ISERROR(FIND("镇",H2))=TRUE,"",MID(H2,1,FIND("镇",H2)))&
IF(ISERROR(FIND("镇",H2))=TRUE,IF(ISERROR(FIND("乡
",H2))=TRUE,"",MID(H2,1,FIND("乡",H2))),"")
该函数由结构基本相同的三部分构成,中间由“&”连接。该语句的基本思想是在详细地址中分别寻找“办事处”、“镇”、“乡”等关键字,如果找到该关键字,则从详细地址左边开始截取字符到该关键字,如果没有该关键字,则取空字符串。然后把每一个关键字对应的串通过“&”联接起来。正常情况前两个关键字一般不会同时出现在同一详细地址中,如果同时出现,可以通过观察计算结果来发现并个别修正。如果同时出现“镇”、“乡”,则只提取“镇”的情况,没有“镇”,才提取“乡”的情况。
如果详细地址中使用的都是“××街道”而不是“××街道办事处”,则需要将以上公式中的“办事处”改为“街道”,并将“&”前的2改为1。
第二个单元格中的公式为:
=ASC(IF(I2="",H2,IF(ISERROR(FIND("办事处",H2))=TRUE,"",MID(H2,FIND("办事处
",H2)+3,20))&IF(ISERROR(FIND("镇",H2))=TRUE,"",MID(H2,FIND("镇",H2)+1,20))&
IF(ISERROR(FIND("镇",H2))=TRUE,IF(ISERROR(FIND("乡",H2))=TRUE,"",MID(H2,FIND("乡",H2)+1,20)),"")))
该函数也是由三部分通过“&”连接而成,只是在函数外面又加了一个ASC()函数。目的是提取详细地址中去掉街道或乡镇名称后的地址,并将所有门牌号等数字统一变为半角字符。如果将“办事处”改为“街道”,需要将该部分语句后面的+3改为+2。
第三个单元格中的公式为:
=IF(ISERROR(VLOOKUP(I2,aa,2,FALSE))=TRUE,"220104000000",""&VLOOKUP(I2,aa,2,F ALSE))
将标红的内容改为本区县的6位行政区划代码并补6个0。而aa代表的就是前面建立的行政区划代码区域。目的是根据街道乡镇名称自动赋9位行政区划代码,如果没有正规的街道乡镇名称,则赋本区县的6位行政区划代码。
第四个单元格中的公式为:
=IF(ISERROR(FIND("社区",J2))=TRUE,"",MID(J2,1,FIND("社区",J2)+1))&
IF(ISERROR(FIND("村",J2))=TRUE,"",MID(J2,1,FIND("村",J2))&"委会")
也是由两部分构成,中间由“&”连接。如果本地主要用居委会,则可将“社区”改为“居委会”,并将加红后的这部分语句后面的“1”改为“2”。同时要考虑到行政区划代码表中的表述方式。目的是从地址中提取“村委会”、“社区”的名称。
第五个单元格中的公式为:
=IF(L2="",K2,IF(ISERROR(VLOOKUP(L2,aa,2,FALSE))=TRUE,K2,VLOOKUP(L2,aa,2,FAL SE)))&""
本单元格中的内容不用变。目的是根据社区、村委会名称自动赋12位行政区划代码,如果无法提取社区、村委会名称,则使用前面的6位或9位行政区划代码。
5、选中根据本地情况修改完成后的这五个包含公式的单元格,通过向下拖
动或鼠标双击的方式,自动填充每一个单位的情况。