第5章抽样与参数统计。分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章抽样与参数估计
学习内容
一、抽样推断概述
二、抽样分布及其应用
三、常见的抽样分布
四、参数估计
五、区间估计的计算
学习目标
1. 了解抽样和抽样分布的基本概念。
2. 理解抽样分布与总体分布的关系。
3. 了解点估计的概念和估计量的优良标准。
4. 掌握总体均值、总体比例和总体方差的区间估计。
一、抽样推断概述
①推断统计的内容
②抽样推断的过程
统计推断的基本假定
a)总体看作是一个随机变量X,其概率分布为f(x)。
b)样本看作是n个独立的随机变量(X1, X2, …, X n),每个都具有与总体X相同的分布。
c)样本中每个个体必须取自同一总体, X1, X2, …, X n相互独立。
统计推断涉及的概念
参数与统计量
–参数:描述总体分布特征的量,如平均数μ,标准差σ。
–统计量:由样本观察值算出的量,如,S2,S。
–统计量是随机变量。
③抽样分布及其形成过程
抽样分布(概念要点)
所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布。
抽样分布是一种理论概率的分布。
抽样分布的结果来自容量相同的所有可能样本。
单选题
样本平均数和总体平均数()
– A、前者是一个确定值,后者是随机变量
– B、前者是随机变量,后者是一个确定值
– C、两者都是随机变量
– D、两者都是确定值
④抽样推断的理论基础
(1)大数定律
a)大数定律在统计中是指一切关于大量随机现象之平均结果稳定性的定理。
–尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋
于稳定。
b)为整个推断统计提供了最基本的理论依据。
猜硬币赌局
赌局1:–掷10次硬币,赌正面朝上的频率为0.4到0.6次。
赌局2:–掷100次硬币,赌正面朝上的频率0.4到0.6次。
赌局3:–掷1000次硬币,赌正面朝上的频率0.4到0.6次。
贝努利大数定律
设n A是n次独立试验中事件A发生的频数; p表示事件A 在每次试验中发生的概率,则对于任意正数є有:
切比雪夫大数定律
(2)中心极限定理
–设从均值为μ,方差为σ 2的一个任意总体中抽取容量为n的样本,当n充分大时,多次抽样得到的样本均值近似服从均值为μ、方差为σ2/n的正态分布。
(一)大数定律揭示了大量随机变量的平均结果,但并没有涉及到随机变量的分布规律。
(二)中心极限定理是指在一定的条件下,大量相互独立的随机现象的概率分布是以正态分
布为极限的定理。
(三)中心极限定理则说明了许多随机变量的分布是正态或近似正态的。
棣莫弗-拉普拉斯定理
a)随机变量X取A的概率为p、取非A的概率为q=1-p时,抽取n个单位组成样本。
b)A出现的次数k组成的随机变量叫做服从二项分布的随机变量。
二、抽样分布及其应用
1. 样本均值的抽样分布
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表:
所有样本均值的均值和方差:
式中:M为样本数目。
比较及结论:
1. 样本均值的均值(数学期望)等于总体均值。
2. 样本均值的方差等于总体方差的1/n。
样本均值的分布与总体分布的比较
在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布。一种理论概率分布。
推断总体均值μ的理论基础。
样本均值的抽样分布与中心极限定理
当总体服从正态分布N ~ (μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n,即~N(μ,σ2/n)。
核心结论:
样本均值的数学期望;样本均值的方差
样本均值的分布形式。
–与总体分布有关
–总体为正态分布,抽样分布也为正态,与样本容量无关。
b)与样本量有关
–总体不是正态分布,样本量越大(n≥30),抽样分布越接近正态分布。
抽样分布与总体分布的关系
2. 样本比例的抽样分布
比例:总体(或样本)中具有某种属性的单位与全部单位总数之比。
–不同性别的人与全部人数之比。
–合格品(或不合格品) 与全部产品总数之比。
1)容量相同的所有可能样本的样本比例的概率分布。
2)当样本容量很大时,样本比例的抽样分布可用正态分布近似。
3)是一种理论概率分布。
4)推断总体比例π的理论基础。
核心结论
样本比例的数学期望:;样本比例的方差:–重复抽样
3. 样本方差的抽样分布
正态总体样本方差的抽样分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,…, X n为来自该正态总体的样本,则
样本方差 s2的分布为:
将χ2(n – 1)称为自由度为(n-1)的卡方分布。
样本方差抽样分布(χ2分布)的形成过程
4. 抽样分布的应用
[例1]BTL商店的经理想知道供货商给他的电视质量是否低于平均水平。他的研究表明电视机置换时间的均值为8.2年,标准差为1.1年。然后他随机抽取50台过去售出的电视机,发现这些电视机平均置换时间为7.8年。计算这50个随机抽取的电视机的平均置换时间为7.8年或更短的概率。
[例2]《娱乐报道》杂志发起了一项旨在增加订阅的有奖活动。在过去,收到有奖活动参与材料的人中有26%最终参与了竞赛,订阅了杂志。当有奖活动的参与材料发放给500个随机挑选的住户时,估计新增订阅结果的数量在125~150(包括120和150)的概率。