央视索福瑞内部资料-收视率调查的流程与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)确定调查总体
在收视率调查中,调查总体一般被界定为目标区域内4岁及以上 的电视家庭人口。这个界定包括以下三个要素: • 目标区域:可以为全国、省、市、县或某一特定区域; 目标区域:
• 电视家庭人口 电视家庭人口:没有电视机家庭、集体人口及流动人口被排 除在调查总体之外; • 年龄下限(4岁):收视调查要求被访者必须具有一定的行 年龄下限( 岁 为能力。
-收视率越低,抽样误差越小; - 当收视率低于12%时,抽样误差小于2%
(三)样本的抽取
下面以CSM为例,来说明收视调查中样本的抽取方法。 CSM目前拥有的收视调查网有:
• 67个城市收视调查网(日记卡) • 11个城市收视调查网(测量仪) • 15个省级收视调查网(日记卡) • 1个全国收视调查网(测量仪)
取P=0.5,此时p(1-p)达到最大, 在95% 的置信水平(t=1.96)下,样本量n与允 许误差M的关系如下图及表:
允许误差 样本量 1% 9604 2% 2401 3% 1067 4% 600 5% 384 6% 267 7% 196 8% 150 9% 119 10% 96
样本量与允许误差的关系 (95%置信度,收视率P=0.5)
12000 10000 8000 6000 4000 2000 0 0 0.02 0.04 0.06 0.08 允许误差% 0.1 0.12
- 允许误差越小,所需样本量越大; - 当允许误差小于3%时,再提高精度,所需样本量成倍增加; - 权衡精度与成本的关系,样本量为1067人(300户)是合理的样本 规模。
抽样误差=1.96
P (1 − P ) n
P:收视率, n:样本量 上述3%的抽样误差是取P=0.5计算出来的, 而由公式看出:当P =0.5时, P(1-P)达到最大, 由于实际的收视率一般低于50%,所 以实际的抽样误差要小于3%。
抽样误差与收视率的关系 (样本量 样本量1067人(300户),置信度 置信度95%) 样本量 人 户 置信度
样本量
根据上述理论分析,并参考国际经验, CSM所确定的样本量如下: 城市网(测量仪):300户; 城市网(日记卡):300户; 部分小城市(日记卡):100户; 省网:600户; 全国网(测量仪):2000户。
3、抽样误差与收视率的关系
上述当样本量为1067人(300户)、在95%的置信水平下抽样 误差为3%,应当明确,这是此样本规模的最大抽样误差,实际的抽 应当明确, 应当明确 这是此样本规模的最大抽样误差, 样误差要小于3%。 %。因为: 样误差要小于 %。 抽样误差的计算公式为:
收视率% 抽样误差% 收视率% 抽样误差% 收视率% 抽样误差% 1 0.60 18 2.31 35 2.86 2 0.84 19 2.35 36 2.88 3 1.02 20 2.40 37 2.90 4 1.18 21 2.44 38 2.91 5 1.31 22 2.49 39 2.93 6 1.42 23 2.53 40 2.94 7 1.53 24 2.56 41 2.95 8 1.63 25 2.60 42 2.96 9 1.72 26 2.63 43 2.97 10 1.80 27 2.66 44 2.98 11 1.88 28 2.69 45 2.99 12 1.95 29 2.72 46 2.99 13 2.02 30 2.75 47 2.99 14 2.08 31 2.78 48 3.00 15 2.14 32 2.80 49 3.00 16 2.20 33 2.82 50 3.00 17 2.25 34 2.84
2、CSM城市网(测量仪)的抽样方法 CSM城市网(测量仪) 城市网
CSM城市网(测量仪)调查总体的界定、操作流 程与日记卡城市网相同,样本抽取方法稍有不同。
A 基础调查的抽样方法
二阶段、PPS、整群抽样 二阶段、PPS、 第一阶段:由城市抽居( 第一阶段:由城市抽居(家、村)委,用PPS抽样抽取 a=200个居(家、村)委会; 第二阶段:由居( 委抽样本户, 第二阶段:由居(家、村)委抽样本户,在每个抽中居 (家、村)委中,用随机等距抽样方法抽取b=20户家 庭户,对于抽中家庭户中的所有常驻人口都进行调查。 样本量为:a×b=200×20=4000户 样本量为
某市利用PPS抽样抽取居委会示例表
(全市共有3个区、53个居(家、村)委会)
区(县) 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 1区 街道(乡、 镇) 曹山街道 曹山街道 曹山街道 曹山街道 宏业村街道 宏业村街道 宏业村街道 宏业村街道 宏业村街道 宏业村街道 宏业村街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 解放街道 居(家、村) 委会 东站居委 长滩琚委 钢山锥子山 曹山 宏业村三村 宏业村四村 宏业村一村 雪华一村 雪华二村 宏业六村 雪华三村 二钢 解放路 大桥 二钢二居 革新居委 淮河新村 海航 建新 解放三路 建华 曙光九巷 建明 抽样框 户数 624 175 571 458 761 661 789 500 514 522 675 997 865 736 892 749 765 887 699 647 1058 643 379 累计 户数 624 799 1370 1828 2589 3250 4039 4539 5053 5575 6250 7247 8112 8848 9740 10489 11254 12141 12840 13487 14545 15188 15567 r+nk 抽中居 位
A 基础调查的抽样方法
∗ 基础调查的目的 基础调查的目的: - 了解对收视行为有重要影响作用因素的信息, 如频道覆盖率、电视机拥有状况、户规模、人 口年龄性别结构等; - 为固定样组的抽取、轮换及控制提供依据,以 保证固定样组对总体的代表性。 • 基础调查的抽样总体 非农人口比例在45%及以上的市辖区中, 所有家庭户中常住人口(在本地居住半年以上, 且平均每周居住5天以上)。
收视率调查的流程与方法
央视-索福瑞媒介研究(CSM 央视-索福瑞媒介研究( )
主要内容
一、收视率调查的基本流程 二、样本抽取方法 三、数据采集方法 四、数据处理方法
一、收视率调查的基本流程
收视率调查的基本流程包括三大环节,即:
样本抽取
数据采集
数据处理
二、样本抽取方法
在收视率调查中,样本抽取一般包括确定调查总体、确 确定调查总体、 确定调查总体 定样本容量、抽取样本等环节。 定样本容量、抽取样本
各种调查网样本的抽取方法简述如下:
1、CSM城市网的抽样方法 、CSM城市网的抽样方法
调查总体 非农人口比例在45%及以上的市辖区中电视家庭户中4岁及以 上的所有人员。
抽样方法 CSM在收视调查网建立前以及建立后每年都要进行一次大样 本量的基础调查,因而城市网的抽样方法包括基础调查的抽样 基础调查的抽样 方法及固定样组的抽样方法 方法 固定样组的抽样方法
在调查总体及抽样方法一定的条件下, 在调查总体及抽样方法一定的条件下,样本量的大小实际 上是在抽样精度(抽样误差) 上是在抽样精度(抽样误差)与成本之间相平衡的结果
2、样本量的计算
收视率调查是一种成数(比率)调查,样本量的计算公式为: n=t2p(1-p)/M2
其中:n为样本量,p 为收视率, M为允许误差, t为概率度,
19997
6
23354
7
26711
8
33425
10
B 固定样组的抽样方法
固定样组规模: 固定样组规模:大城市300户,中小城市100户 (1)居委会的抽取: 在基础调查的样本居委名 单中随机等距选取固定样组居委 100户站抽取20个居(家、村)委会 300户站抽取60个居(家、村)委会; (2)样本户的抽取:在基础调查样本户中,去掉 非固定样组居(家、村)委所包含的样本户后, 按以下指标排序后形成抽样框;家庭户规模、 是否有线户、电视机台数、家庭户收视时间、 家庭户有无子女(14岁以下)、地区分布、日用 品主要采购者的年龄及家庭户收入。然后随机 等距抽取100户或300户家庭户形成固定样组。
(二)确定样本容量 1、确定样本量时一般应考虑的因素
• 调查总体中各单位的差异程度 差异程度越大,样本容量也应 该越大; • 允许误差 允许误差越小,样本容量就应该越大; • 抽样方法 不同的抽样方法具有不同的效率,如分层抽样、 系统抽样要比简单随机抽样具有更高的效率,因而在其它条件 不变的条件下,分层抽样、系统抽样所需样本量要小于简单随 机抽样的样本量; • 经费、人力和时间等 样本量越大,经费、人力及时间的投入 经费、 也越大。
PPS抽样实例 PPS抽样实例 PPS抽样全称是概率与规模成比例抽样(Sampling with probability proportional to size),它是效率较高的一 种抽样方式。具体抽样过程如下:
第一步:编制抽样框。 第一步 : 编制抽样框 。 从民政局、统计局或其他单位查抄全市 居(家、村)委会名单及户数,所有区、街道及居(家、村)委 会按自然标志排列,形成抽样框。见附表。 第二步:计算抽样间距K 第二步 : 计算抽样间距 K。 抽样间距K=居(家、村)委会总户数/拟 抽选居(家、村)委会数。在本例中,某市居民累计总户数=33570, 拟抽选居(家、村)委会数=10 则:k=33570/10=3357。 第三步: 确定起点。 第三步 : 确定起点 。 在0~3357之间选取一随机数,如随机数为 3212。 第四步:抽取居( 委会。 第四步 : 抽取居 ( 家 、 村 ) 委会 。 在附表‘累计户数’一栏找到 第一个大于等于3212的累计户数,对应的居(家、村)委会即是第 一个被抽中居(家、村)委。 而后抽取其它样本居委,计算3212+K, 3212+2K, 3212+3K, …, 3212+9K, 分别在‘累计户数’一栏找到第一个大于等于上 述数的数字的累计户数,则对应的居(家、村)委会即被抽中。
3212
1
6569
2
9926
3
13283
4
接上表
2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 2区 3区 3区 3区 3区 3区 3区 3区 3区 3区 胜利街道 胜利街道 胜利街道 胜利街道 胜利街道 青年街道 青年街道 青年街道 青年街道 青年街道 青年街道 青年街道 青年街道 青年街道 青年街道 纬二街道 纬二街道 纬二街道 朝阳街道 朝阳街道 朝阳街道 张公山街道 张公山街道 张公山街道 张公山街道 张公山街道 大庆街道 大庆街道 大庆街道 大庆街道 红旗一中 红旗二路三 巷 航运干休所 机场 航英 华丰街 华大街 保安里 青年街 奋勇 同乐园 菜市 中平街 太平街 南山 先进里 蒋岗巷 爱国巷 淮河 新建 新兴 长征路 张公山一村 一居 张公山一村 二居 张公山二村 二居 张公山四村 一居 长影 纺织厂二居 纺织厂三居 长青新村 555 719 482 397 354 668 741 730 738 454 748 549 547 516 702 708 493 528 371 445 397 491 538 970 617 772 826 548 1093 306 16122 16841 17323 17720 18074 18742 19483 20213 20951 21405 22153 22702 23249 23765 24467 25175 25668 26196 26567 27012 27409 27900 28438 29408 30025 30797 31623 32171 33264 33570 30068 9 16640 5
∗ 基础调查的抽样方法 二阶段、PPS、 二阶段、PPS、整群抽样 第一阶段:由城市抽居( 第一阶段:由城市抽居(家、村)委,用PPS抽样 抽取a=72(或36)个居(家、村)委会; 第二阶段:由居( 第二阶段:由居(家、村)委抽样本户,在每个 委抽样本户, 抽中居(家、村)百度文库中,用随机等距抽样方法 抽取b=14户家庭户,对于抽中家庭户中的所有 常驻人口都进行调查。 样本量为:a×b=72×14=1008户(大城市) a×b=36×14=504户(中小城市)