统计学案例集

统计学案例集
统计学案例集

统计学教学案例集

统计学精品课建设小组

2004年11月

一、调查目的、范围和对象

1.1 调查目的

准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。

1.2 调查范围

全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。

1.3 调查对象

全国城乡家庭户中的13岁以上可视居民以及4-12 岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6 个月或预计居住6 个月以

案例一】全国电视观众抽样调查抽样方案

上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。

二、抽样方案设计的原则与特点

2.1 设计原则

抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。

2.2 需要考虑的具体问题、特殊要求及相应的处理方法

2.2.1 城乡区分

城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,

以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。

在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。

2.2.2 抽样方案的类型与抽样单元的确定

全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。

本抽样方案采用分层五阶抽样。各阶抽样单元确定为:第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);第二阶抽样:街道、乡、镇;

第三阶抽样:居委会、村委会;

第四阶抽样:家庭户;

第五阶抽样:个人。

为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。

在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。

2.2.3 自我代表层的设立

根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8 个,包括以下城市与地区:北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。

三、样本区、县的抽选方法

3.1 全国区、县的调查总体

根据2001 年的全国行政区划资料,全国(港澳台除外)共有787 个市辖区,此外有5 个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792 个区;全国共有1674 个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市, 县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。

3.2 区、县分层

为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面已有一些相应的研究结果, 例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。

(1)地域我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3 大层13 个子层,[ 各省括号内的数字为它们的人文发展指数(Human Development Index,简称HDI),在全国的排位,参见附表]。地域分层如表1:

表1

全国区、县的地域分层 所含省、自治区、直辖市

子层31:内蒙古(21)、新疆(15)、宁夏(26) 子层32 :陕西(25)、甘肃(28)、青海(29)

子层33 :重庆(22 )、四川(24) 子层34 :广西(19)、云南(27)、贵州(30)

子层30 :西藏(自我代表层)

需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计

算的人文发展指数仅是考虑因素之一。例如,按人文发展指数,广西(第 19位)实际 上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区, 我们的划分与它一致,这样便于资料的汇总发布。又如海南,根据人文发展指数(第 13 位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为 而言,与广东、福建划在一子层内是合理的。

(2)区、县类别

同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区) 和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程 度有较大差异。我们将各大层中所有的区、县除已划为自我代表层的以外,

(如下称抽

样总体、分成以下5类,每类组成1个小层:

一类区,二类区,县级市,一类县,二类县。

全国抽样总体中所有区县共分成 11 x 5=55个小层。其中区的划分标准为区中非农 业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划 分标准为人均国大层 第一大层

(东部地第二大层

仲部地区) 子层 10: 上海 ⑴、 北京 ⑵、 天津

(3) (每个都作为自我代表层) 子层 11: 辽宁 ⑸、 山东 (9)

子层 12 : 江苏 ⑺、 浙江 ⑹

子层 13 : 福建 (8)、 广东 ⑷、 海南( 13)

子层 21 : 黑龙江(10)、吉林(1

2) 子层 22 : 河北 (11) 、河南

(18) 、山西 (16) 子层 23 : 安徽 (20) 、江西 (23) 子层 24 : 湖北 (14) 、湖南 (17)

第三大层

(西部地

表1 全国区、县的地域分层

内生产总值,高的为一类县,低的为二类县。区县划分类别的标准在三

大层中各不相同,具体标准如下:

表3 抽样总体中各小层的区县数

区类别的划分标准:

东部地区与中部地区:非农人口在总人口中的比例大于或等于80汹一类区,小于80%为二类区;西部地区:非农人口在总人口中的比例大于或等于70%为一类区,小于70%为二类区。

县类别的划分标准:

东部地区:人均GDP在5000元以上为一类县;5000元以下为二类县。中部地区:人均GDF在4000元以上为一类县;4000元以下为二类县。西部地区:人均GDP在3000 元以上为一类县;3000元以下为二类县。

3.3自我代表层的区、县情况

根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。

西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县。

3.4抽样总体区县情况

按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示。

相关主题
相关文档
最新文档