统计学之数据的收集与整理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
•案例: • 调研可以增加商战的胜算,而失败的调研对企业来说是一场噩梦。 上海柴氏宠物食品公司为一次市场调查付出了三十几万元的代价。拿到 错误的数据不如没有数据。 • 2004年底,为了能提高产品在宠物食品市场的竞争力,以前做生意 一贯靠经验的柴远森先生决定为产品设计做消费调查。 • 为了能够了解更多的消费信息,柴先生设计了精细的问卷,在上海 选择了1000个样本,并且保证所有的抽样在超级市场的宠物组购物人群 中产生,内容涉及:价格、包装、食量、周期、口味、配料等6大方面, 覆盖了所能想到的全部因素。 • 2005年初,上海柴氏的新配方、新包装狗粮产品上市了,短暂的旺 销持续了一星期,随后就是全面萧条,后来产品在一些渠道甚至遭到了 抵制。2005年2月初,新产品被迫从终端撤回,产品革新宣布失败。 • • 公司请了十多个新产品的购买者回来座谈,原来,他们拒绝再次购 买的原因是宠物不喜欢吃。产品的最终消费者并不是“人”,人只是一个购 买者,错误的市场调查方向,决定了调查结论的局限,甚至荒谬。
•重点单位:数目不多,但被研究的标志值之和在 总体所有单位标志值总和中占有很大比重的部分 单位。
•优点:调查单位少,人力、物力和财力花费少;
统大选的结果,其声名鹊起,几乎成为民意调
查的代名词。
•
美国历史上的两次选举 (二)
• 谁会在1948选举中获胜 ? • Thomas Dewey(杜威)还是Harry Truman(杜鲁门)? • 盖洛普等民调机构都用了5000份问卷,都预测杜威会赢 。 • 最后的结果是杜鲁门赢了。他获得49.5%的普选票,305 张选举人票(2个选举人改变主意,实际得到303票);杜威 获得45.1%的普选票,187张选举人票(2个选举人改变主意, 实际得到189票);州权党候选人瑟蒙德获得2.4%的普选票和 39张选举人票;进步党候选人、前副总统华莱士获得2.4%的 普选票,没有赢得任何一张选举人票。
• 从结果来看,1936年的选举是美国历史
上最没有悬念的选举。罗斯福以2775万张选票
赢得了46个州,比对手兰登多1107万张选票,
选举人票是523票对8票,罗斯福几乎赢得了所
有25万人口以上的大中城市。
• 盖洛普将其成果归因于他们所采用的与
传统抽样方法不同的配额抽样。应用这种方法
,盖洛普又成功地预测了1940年1944年美国总
• 这个结果与盖洛普民意测验的结果正好相反。盖洛普最 后一次的预测是,杜威将赢得49%的普选票,杜鲁门只能赢得 44%。这也是历次盖洛普民意测验的最大误差——几乎整整5 个百分点。
•
•美 国 历 史 上 最 富 戏 剧 性 的 选 举
•
•重点调查(key-point survey)
•定义:在研究对象的总体中,选取重点单位而进 行的一种非全面调查。
•(每逢末尾数字为“5”的年份进行工业普查; •每逢末尾数字为“3”的年份进行第三产业普查; •每逢末尾数字为“1”或“6”的年份进行基本单位 普查)
•
•抽样调查(sampling survey)
•定义:按照随机(或非随机)的原则,从总体中 抽取一部分单位作为样本进行调查,并根据样本调 查结果来推断总体数量特征的一种非全面调查方式 。 • 特点:
• 经济性,节省人力、物力和财力;
• 时效性强,可迅速、及时地获取信息;
• 适用面广,适用于对各个领域、各种问题的调查;
• 准确性高,产生的误差可以计算和控制。
•
•2000年美国大选
• 在佛州的选票最后决出之前,全美国9000多万张普选选票中 ,民主党候选人阿尔.戈尔获得50,140,140张选票,占49% ,乔治.布什获得49,782,288张,占48%。戈尔领先布什357 ,932张选票;在全美国538张选举人票中,戈尔获得267张; 布什获得246张。
: •优点:数据一般比较准确、规范化程度高;
•
搜集的资料更全面、更系统。wenku.baidu.com
•缺点:工作量大、耗费大;
•
适用的对象比较狭窄。
•基本原则:
•
确定普查的标准时间,避免遗漏或重复;
•
登记工作应在整个普查范围内同时进行;
•
统一规定普查的项目和指标 ;
•
历次普查应尽可能保持连贯性。
•
•我国的普查项目:
•每逢末尾数字为“0”的年份进行人口普查 •;每逢末尾数字为“6”的年份进行农业普查; •每逢末尾数字为“3”或“8”的年份进行经 济普查。
•
美国历史上的两次选举 (一)
• 谁会在1936年的选举中获胜 ?
• Alf London(兰登)还是 F.D.R.(罗斯福)?
• Literary Digest (文学文摘)送出一千万份问卷后,预测兰
登会赢。而Gallop(盖洛普)只问了5000人,说罗斯福会赢。
• 最后罗斯福和盖洛普都赢了,文摘倒闭了。
统计学之数据的收集与 整理
2020年4月29日星期三
§2 数据的收集与整理
•2
•§2·1 数据的收集
•
•一、调查方案的设计
•一、调查目的——“为什么调查” 。 •二、研究对象、调查对象、调查单位——“向谁调查”。
•三、调查项目——“调查什么” 。
•四、调查方式和方法——“怎样调查”。
•五、调查地点和调查时间——“什么时间、什么地点” 。 •六、组织计划(具体工作计划)——“谁做调查”等等。
•
调查的标准时间:资料所属的时间。
•时点资料 •时期资料
调查期限:调查的工作时间。
•
•二、统计调查的方式和方法
• 统计调查的方 式
•普 查•重点调查 •抽样调查 •典型调查
•统计报表
•统计调查的方法
•原始数据搜集方法 •次级数据搜集方法
•
•普查(census) •是专门组织的一次性的全面调查。
• 此后,小布什在佛罗里达州600多万张普选选票中以仅多出戈 尔537张的优势获得该州的25张选举人票,当选美国总统。
• 2000年,乔治·布什成为继1888年本杰明·哈里森之后第一 位以少数选民票当选的总统。戈尔在全国大选中领先布什35万 多票,但最终结果却要由佛罗里达艰苦漫长的人工点票决定。大 选结束四周以后最高法院以5:4决定停止佛州人工点票,将该 州25张总统选举人票判给布什。2000大选作为美国历史上最接 近、最有争议和最奇特的选举而载入史册。
•案例: • 调研可以增加商战的胜算,而失败的调研对企业来说是一场噩梦。 上海柴氏宠物食品公司为一次市场调查付出了三十几万元的代价。拿到 错误的数据不如没有数据。 • 2004年底,为了能提高产品在宠物食品市场的竞争力,以前做生意 一贯靠经验的柴远森先生决定为产品设计做消费调查。 • 为了能够了解更多的消费信息,柴先生设计了精细的问卷,在上海 选择了1000个样本,并且保证所有的抽样在超级市场的宠物组购物人群 中产生,内容涉及:价格、包装、食量、周期、口味、配料等6大方面, 覆盖了所能想到的全部因素。 • 2005年初,上海柴氏的新配方、新包装狗粮产品上市了,短暂的旺 销持续了一星期,随后就是全面萧条,后来产品在一些渠道甚至遭到了 抵制。2005年2月初,新产品被迫从终端撤回,产品革新宣布失败。 • • 公司请了十多个新产品的购买者回来座谈,原来,他们拒绝再次购 买的原因是宠物不喜欢吃。产品的最终消费者并不是“人”,人只是一个购 买者,错误的市场调查方向,决定了调查结论的局限,甚至荒谬。
•重点单位:数目不多,但被研究的标志值之和在 总体所有单位标志值总和中占有很大比重的部分 单位。
•优点:调查单位少,人力、物力和财力花费少;
统大选的结果,其声名鹊起,几乎成为民意调
查的代名词。
•
美国历史上的两次选举 (二)
• 谁会在1948选举中获胜 ? • Thomas Dewey(杜威)还是Harry Truman(杜鲁门)? • 盖洛普等民调机构都用了5000份问卷,都预测杜威会赢 。 • 最后的结果是杜鲁门赢了。他获得49.5%的普选票,305 张选举人票(2个选举人改变主意,实际得到303票);杜威 获得45.1%的普选票,187张选举人票(2个选举人改变主意, 实际得到189票);州权党候选人瑟蒙德获得2.4%的普选票和 39张选举人票;进步党候选人、前副总统华莱士获得2.4%的 普选票,没有赢得任何一张选举人票。
• 从结果来看,1936年的选举是美国历史
上最没有悬念的选举。罗斯福以2775万张选票
赢得了46个州,比对手兰登多1107万张选票,
选举人票是523票对8票,罗斯福几乎赢得了所
有25万人口以上的大中城市。
• 盖洛普将其成果归因于他们所采用的与
传统抽样方法不同的配额抽样。应用这种方法
,盖洛普又成功地预测了1940年1944年美国总
• 这个结果与盖洛普民意测验的结果正好相反。盖洛普最 后一次的预测是,杜威将赢得49%的普选票,杜鲁门只能赢得 44%。这也是历次盖洛普民意测验的最大误差——几乎整整5 个百分点。
•
•美 国 历 史 上 最 富 戏 剧 性 的 选 举
•
•重点调查(key-point survey)
•定义:在研究对象的总体中,选取重点单位而进 行的一种非全面调查。
•(每逢末尾数字为“5”的年份进行工业普查; •每逢末尾数字为“3”的年份进行第三产业普查; •每逢末尾数字为“1”或“6”的年份进行基本单位 普查)
•
•抽样调查(sampling survey)
•定义:按照随机(或非随机)的原则,从总体中 抽取一部分单位作为样本进行调查,并根据样本调 查结果来推断总体数量特征的一种非全面调查方式 。 • 特点:
• 经济性,节省人力、物力和财力;
• 时效性强,可迅速、及时地获取信息;
• 适用面广,适用于对各个领域、各种问题的调查;
• 准确性高,产生的误差可以计算和控制。
•
•2000年美国大选
• 在佛州的选票最后决出之前,全美国9000多万张普选选票中 ,民主党候选人阿尔.戈尔获得50,140,140张选票,占49% ,乔治.布什获得49,782,288张,占48%。戈尔领先布什357 ,932张选票;在全美国538张选举人票中,戈尔获得267张; 布什获得246张。
: •优点:数据一般比较准确、规范化程度高;
•
搜集的资料更全面、更系统。wenku.baidu.com
•缺点:工作量大、耗费大;
•
适用的对象比较狭窄。
•基本原则:
•
确定普查的标准时间,避免遗漏或重复;
•
登记工作应在整个普查范围内同时进行;
•
统一规定普查的项目和指标 ;
•
历次普查应尽可能保持连贯性。
•
•我国的普查项目:
•每逢末尾数字为“0”的年份进行人口普查 •;每逢末尾数字为“6”的年份进行农业普查; •每逢末尾数字为“3”或“8”的年份进行经 济普查。
•
美国历史上的两次选举 (一)
• 谁会在1936年的选举中获胜 ?
• Alf London(兰登)还是 F.D.R.(罗斯福)?
• Literary Digest (文学文摘)送出一千万份问卷后,预测兰
登会赢。而Gallop(盖洛普)只问了5000人,说罗斯福会赢。
• 最后罗斯福和盖洛普都赢了,文摘倒闭了。
统计学之数据的收集与 整理
2020年4月29日星期三
§2 数据的收集与整理
•2
•§2·1 数据的收集
•
•一、调查方案的设计
•一、调查目的——“为什么调查” 。 •二、研究对象、调查对象、调查单位——“向谁调查”。
•三、调查项目——“调查什么” 。
•四、调查方式和方法——“怎样调查”。
•五、调查地点和调查时间——“什么时间、什么地点” 。 •六、组织计划(具体工作计划)——“谁做调查”等等。
•
调查的标准时间:资料所属的时间。
•时点资料 •时期资料
调查期限:调查的工作时间。
•
•二、统计调查的方式和方法
• 统计调查的方 式
•普 查•重点调查 •抽样调查 •典型调查
•统计报表
•统计调查的方法
•原始数据搜集方法 •次级数据搜集方法
•
•普查(census) •是专门组织的一次性的全面调查。
• 此后,小布什在佛罗里达州600多万张普选选票中以仅多出戈 尔537张的优势获得该州的25张选举人票,当选美国总统。
• 2000年,乔治·布什成为继1888年本杰明·哈里森之后第一 位以少数选民票当选的总统。戈尔在全国大选中领先布什35万 多票,但最终结果却要由佛罗里达艰苦漫长的人工点票决定。大 选结束四周以后最高法院以5:4决定停止佛州人工点票,将该 州25张总统选举人票判给布什。2000大选作为美国历史上最接 近、最有争议和最奇特的选举而载入史册。