统计学第六章ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/6/4
统计学院
7
第六章 抽样和抽样分布
STAT
附:1.方便抽样:又称任意抽样、偶遇抽样,是指样本的选定 完全根据调查人员的方便来决定。调查对象的选取常常是因为 他们恰好在恰当的时间、恰当的地点出现。如: (1)没有认定调查对象身份的商场拦截式访问; (2)利用客户的名单(名片、往来信件等方式获得)进行 调查; (3)访问大街上的人们; (4)利用学生、社会组织的成员或工厂机关的职工作为调 查对象; (5)报纸、杂志上填好、寄回的调查。 实施方便抽样时,样本单位一个一个地抽取,直到满足样本 容量要求为止。这种抽样方法的一个基本原则是假定总体的特 性是相同的。方便抽样一般只用于市场预调查和试探性调查。
2018/6/4
3489962435 9866332890 8036522364 7065436387 1327690879 9535443208 2148990085 7065432549 0656433223 2437909854 2376987667 2137860769 8800523267 4379734343 3874856049 . . .
统计学院
7077434431 1422890012 0874321123 0437575967 2132577995 4365789796 4358650841 9343252534 4387670769 4637567488 2365879048 8765980234 1268803235 9323314766 2366897431 . . .
第六章 抽样和抽样分布
本章重点: 1.简单随机抽样; 2. x 的抽样分布; 3. p 的抽样分布; 4.其他组织形式的抽样; 5.正态分布原理。 本章难点: 抽样分布原理。
STAT
2018/6/4
统计学院
1
第六章 抽样和抽样分布
统计实例(Statistics in Practice)
我国某家用电器公司是国内空调最大的生产厂家之一,2004 年时其空调年销售就已达到700万台,销售额为120亿元。这家低 调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作 ,甚至喊出“不想做行业老大”的话,之后3年来却成长势头迅 猛,增长率一直40%以上,赢利率极高。为了避免当今家用电器 行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持 优势,该电器集团决策人又提出了进军汽车行业的战略目标。为 此他要求公司营销部对国际国内各大汽车生产厂家生产能力、销 售额、营利能力、市场占有率等方面作调查分析。 作为公司营销部负责人来说,他必须思考怎样去采集汽车生 产厂家的这些经济机密数据?获得这些数据后,应采用什么方法 作数据分析与推断。这必然会用到统计推断的知识。
2018/6/4
统计学院
6
第六章 抽样和抽样分布
STAT
非概率抽样也叫非随机抽样,是根据经验或判断从总体中选 取若干单位构成样本。如重点调查、典型调查(属于一种判断 抽样)、方便抽样、配额抽样等。非概率抽样难免掺杂调查者 的主观偏见,存在系统性误差、不可以计算和控制抽样误差、 不可以说明估计结果的可靠程度。
2018/6/4
统计学院
10
第六章 抽样和抽样分布
三、抽样推断的作用
STAT
1 .对某些社会现象不可能或不必要进行全面调查,但又必 须了解其全面情况时,可采用抽样推断。(如:破坏性检验、 无限总体、家计调查等等); 2 .与全面调查比较,省时、省力、省费用、时效性高; 3 .可用抽样推断资料对全面调查资料加以补充或修正; 4 .可用于工业生产过程中的质量控制。
2018/6/4 统计学院 5
第六章 抽样和抽样分布
一、统计抽样的概念
STAT
按随机原则,从总体中抽取一部分单位组成样本进行调查, 并根据样本指标,对相应的总体指标作出具有一定可靠程度的 估计和判断。 随机原则:又称同等可能性原则,即机会面前、人人平等。 作用:防止人的主观思想和利益关系的干扰。 从总体中抽取样本的方法有概率抽样与非概率抽样两种: 概率抽样也叫随机抽样,是按随机原则抽取样本。概率抽 样可避免系统性误差、可计算和控制抽样误差、可说明估计结 果的可靠程度。
14
第六章 抽样和抽样分布
3.重置(复)抽样与不重置(复)抽样
(1)重置(复)抽样:也称放回抽样,抽样安排为对每次被抽 到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法 。在每次的抽取中样本单位被抽中的概率都相等。统计中称这样 的抽样为相互独立的试验。
(2)不重置(复)抽样:也称不放回抽样,抽样安排为对被 抽到的单位登记后不再放回总体的抽样方法。
不重置抽样与重置抽样比较,每次抽样的条件是不同的,前一 次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样 为相互不独立的试验。 注意:二种方法都遵循了“等机会原则”
2018/6/4 统计学院 15
第六章 抽样和抽样分布
五、简单随机抽样
简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分 类或排队,直接从总体中按“随机原则”抽取样本单位的调查方 式。 (抽样框:将全及总体中的每个单位进行编号而制定的目录或 表格就是抽样框。)
抽签 编号 摇号 产生样本 随机数字表
2018/6/4
统计学院
16
第六章 抽样和抽样分布
其样本抽取过程按总体为有限和无限的不同加以区别 1.有限总体抽样 从容量为N的有限总体中进行抽样,如果容量为n的每个可能 样本被抽到的可能性相等,则称被抽的样本为简单随机样本。
2018/6/4
2018/6/4
统计学院
18
第六章 抽样和抽样分布
随机数字表
9745238942 1276465909 9874763642 2659305984 1676587006 0377797684 9877808423 2778006869 2133768790 8262130892 3286548900 8084634212 4332657790 7963645324 9087434329 . . .
2018/6/4 统计学院 4
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每 头毛重(设为 ),如果将每头肉猪过秤去秤而获取数据将是不 合算的。我们可以按照“等机会原则” 从中抽出100头称其重量, 计算出这100头猪的平均毛重(假定平均每头95.5kg),以达到我们 期望的目的。 本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是 指在统计抽样中按照“等机会原则” 从全及总体的N(10000)中 抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样 本,又称子样。一般样本总体的单位总数用n(100)表示,称作样 本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样 方法有关。通常n<30称为小样本,n≥30称为大样本,在抽样调 查中取大或小样本会直接影响到抽样分布的特征。
2018/6/4
统计学院
20
第六章 抽样和抽样分布
六、点估计
点估计就是用样本估计量的一个具体观测值直接作为总体的未 知参数的估计值的方法。 如上例中随机抽取的100头肉猪的平均毛重(95.5kg)可作为 10000头肉猪平均毛重 的点估计值
常用的估计量有: (1)样本平均数
(2)样本方差 S 2为总体方差 的估计量; (3)样本成数 p为总体成数 P 估计量。
2018/6/4 统计学院 2
第六章 抽样和抽样分布
从这一章开始便进入推断统计学的学习内容,它会节省人们 的时间和财物来达到认识对象的最佳限度。 现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。 在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
19
第六章 抽样和抽样分布
2.无限总体抽样 在实际应用中,若总体单位数很多,要逐一编号是难以办到 的,特别是有些现象,事前也不可能编号(如一些连续大量正 在生产的产品) 因此我们定义:被研究的总体中所涉及某一正在进行的过程 使得不可能列出总体中的所有元素,则可视为无限总体。 无限总体抽样条件:同一总体 相互独立
统计学院
17
第六章 抽样和抽样分布
为了便于抽取样本单位,一般在明确抽样框的条件下,对总体 的每个单位都要编号,然后用抽签式或利用《随机数字表》进行 抽取。 例如:N=500 n=10 编码从1-500号
在随机数表中随意点二个数字,假设得到4行,34列。则选取 的号码从这个被选中的数开始,由于500是个三位数,则小于或 等于500的连续三位数即为中选号码。见表中所示。
2018/6/4
统计学院
13
第六章 抽样和抽样分布
名称 单位数 平均数 成数 方差 标准差 总体参数 N
X N
STAT
样本统计量 n
x x n
s2
P=N1/N
2 ( X X ) 2 N
p=n1/n ( x x ) 2 n 1 s
2018/6/4
统计学院
2018/6/4 统计学院 8
第六章 抽样和抽样分布
STAT
2.滚雪球抽样:先找少量或个别的调查对象进行访问,然后 通过他(她)们再去寻找新的调查对象,依此类推,就像滚雪 球一样越来越大,直至达到调查目的为止。 滚雪球适用于总体的个体信息不充分或难以获得,不能使用 其他抽样方法抽取样本的调查研究。对于具有特殊癖好、同性 恋者、乞丐、吸毒者、爱滋病患者等特殊群体的调查尤为适用。
1287087765 2136217721 9878764346 4890832769 2164896589 6476793243 4387005345 2164878454 2176590879 2167608965 3254776907 3243700435 2187799990 1358787008 2125749768 . . .
统计学院
12
第六章 抽样和抽样分布
2.总体参数和样本统计量
STATHale Waihona Puke Baidu
根据全及总体各单位变量值计算的反映全及总体某数量特征的 综合指标,由于全及总体唯一确定,故称总体参数。
如上例中的
根据样本总体各单位变量值计算的反映样本总体某数量特征的 综合指标,由于样本总体不具惟一性,故称为样本统计量,它是 一个随机变量。 如上例中的100头肉猪的平均每头毛重(95.5kg)
2018/6/4
统计学院
11
第六章 抽样和抽样分布
四、统计抽样的几个基本概念
1.全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表示。具备 惟一性。
样本总体:按随机原则从总体中抽出的部分单位的全体, 简称样本,被抽出的每个单位称样本单位。容量用n表示。样 本不具惟一性。
2018/6/4
2018/6/4
统计学院
9
第六章 抽样和抽样分布
统计上讲的抽样一般都是指随机抽样(概率抽样)
STAT
二、抽样推断的特点
1 .是非全面调查 与普查的区别; 2 .按随机原则抽取样本 与典型调查和重点调查的区别; 3 .根据样本指标推断总体指标与重点调查的区别; 4 .抽样误差可以事先计算与控制与典型调查的区别。
2018/6/4
统计学院
3
第六章 抽样和抽样分布
STAT
第一节 抽样及抽样组织形式 [例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平 均每头毛重,如果将每头肉猪都过秤去秤而获取数据将是 不合算的。我们可以按照“等机会原则” 从中抽出100头 肉猪称其重量,计算这100头猪的平均每头毛重,以达到我 们期望的目的。 本例中存栏肉猪10000头组成的总体,则称为全及总体, 它是指在统计抽样中所要了解的研究对象整体,又称为母 体,当我确定了研究目标时,它具有惟一性。一般全及总 体的单位总数用N表示,称作总体容量。
9424252386 4879903443 2177609554 2148797544 7537697997 1254876987 6743219845 3248906034 0765433245 8707867698 7694432767 9094232155 0232337932 0362212379 3478794235 . . .