统计量及其抽样分布
概率论与数理统计(06)第6章 统计量及其抽样分布
![概率论与数理统计(06)第6章 统计量及其抽样分布](https://img.taocdn.com/s3/m/03e46414f18583d0496459dd.png)
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第六章统计量,样本及抽样分布
![概率论与数理统计第六章统计量,样本及抽样分布](https://img.taocdn.com/s3/m/cee58ba6f242336c1fb95ea6.png)
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
统计量及其分布
![统计量及其分布](https://img.taocdn.com/s3/m/325b7939b4daa58da0114a8b.png)
样本均值的抽样分布 (例题分析)
【例】设一个总体含有4 个个体,分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下。
总体均值和方差
总体的频数分布
X
i 1
N
i
N
N
2.5
2
2 ( X ) i i 1
0.02 0 2 1 0.1
21 Φ0.2
0.8414
(4) 样本 k 阶(原点)矩
1 n k Ak X i , k 1, 2, ; n i 1
1 n k 其观察值 k x i , k 1, 2, . n i 1
n n 1 2 1 2 2 E( S ) E X i nX (Xi X ) E n 1 i 1 n 1 i 1
2
1 n 2 2 E ( X i ) nE ( X ) n 1 i 1 2 1 n 2 2 2 ( ) n 2 n 1 i 1 n
n
k 1
n
2
2
n
,
定理 设总体X的期望E(X) = ,方差D(X) = 2,X1, X2,…,Xn为总体X的样本, X,S2分别为样本均值 和样本方差,则
E( X ) E( X )
D( X ) 2 D( X ) n n
E( S 2 ) D( X ) 2
思考:在分组样本场合,样本均值如何计算? 二者结果相同吗?
x1 f1 x n f n 其中 x n
第6章-统计量及其抽样分布
![第6章-统计量及其抽样分布](https://img.taocdn.com/s3/m/ef4b9324f342336c1eb91a37f111f18583d00cea.png)
对应于每个数值的相对出现频数排成另一列, 由此,全部可能的样本统计量值形成了一个概 率分布,这个分布就是我们想要得到的抽样分 布。
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和1.0 1.5 4.0 16
2.5 m
n
(xi mx )2
s
2 x
i 1
M
M为样本数目
(1.0 2.5)2
(4.0 2.5)2
s2
0.625
16
n
1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n
从检查一部分得知全体。
复习 抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
6.2.1 抽样分布 (sampling distribution)
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可 能取值形成的相对频数分布
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础,也是抽样推断科学性的重要依据
抽样分布的形成过程 (sampling
distribution)
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
![贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】](https://img.taocdn.com/s3/m/dae6b96dda38376bae1fae2d.png)
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
统计学 第6章 统计量及其抽样分布
![统计学 第6章 统计量及其抽样分布](https://img.taocdn.com/s3/m/c3a0021f6edb6f1aff001f9a.png)
1. 样本统计量的概率分布,是一种理论分布
2. 随机变量是样本统计量
3. 结果来自容量相同的所有可能样本 4. 提供了样本统计量长远而稳定的信息,是进行 推断的理论基础,也是抽样推断科学性的重要 依据
6 - 8 / 55
统计学
STATISTICS (第五版)
重要统计量
1.样本均值:
n 1 若X ~ N(, 2), X X i, n i 1
1 n 1 则E X EX i ,D X 2 n i 1 n 2.样本方差:
n 1 2 S2 ( X X ) i n 1 i 1
1 1 2 2 DX i 2 n n n i 1
X ~ (n)
2
6 - 13 / 55
统计学
STATISTICS (第五版)
2分布
(图示)
n=1 n=4 n=10
n=20
6 - 14 / 55
不同容量样本的抽样分布
2
统计学
STATISTICS (第五版)
2 分布:
定理:如果随机变量 X1, X 2, , X n 相互独立,且都服从 同一正态分布
6.1.1 6.1.2 6.1.3 6.1.4
6 - 4 / 55
统计学
STATISTICS (第五版)
统计量
(statistic)
1. 设 X1,X2,…,Xn 是从总体 X中抽取的容量为 n的一个样本,如果由此样本构造一个函 数 T(X1,X2,…,Xn) ,不依赖于任何未知参 数,则称函数 T(X1,X2,…,Xn) 是一个统计 量
6 - 2 / 55
统计学
STATISTICS (第五版)
第六章 统计量及其抽样分布
![第六章 统计量及其抽样分布](https://img.taocdn.com/s3/m/86674c7e4a7302768f993901.png)
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
抽样分布样本统计量的分布及其应用
![抽样分布样本统计量的分布及其应用](https://img.taocdn.com/s3/m/831b8208777f5acfa1c7aa00b52acfc789eb9f05.png)
抽样分布样本统计量的分布及其应用在统计学中,抽样是一种数据分析的方法,它通过对总体中的一部分个体进行观察和测量来推断总体的特征。
而抽样分布是指抽取相同样本量的多个样本后得到的统计量的分布。
样本统计量是对样本数据进行计算得到的统计指标,它可以用来估计总体参数,并进行假设检验。
1. 抽样分布的基本概念抽样分布具有一些基本性质,首先是无偏性。
当样本容量趋向于总体容量时,样本统计量的期望值会无限接近总体参数的真实值。
其次是有效性,即样本统计量的方差趋近于零,它可以用来估计总体参数的精确度。
最后是一致性,样本统计量在样本容量逐渐增大时趋近于总体参数。
2. 抽样分布的常见形式常见的抽样分布有正态分布、t分布和卡方分布。
其中正态分布应用最为广泛,它在中心极限定理的作用下,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
而t分布则适用于当总体标准差未知、样本容量较小的情况下,它的形状比正态分布要略扁平一些。
卡方分布则主要用于样本方差的估计与检验。
3. 抽样分布的应用抽样分布的应用非常广泛,常用于以下几个方面:3.1 参数估计通过抽样分布,我们可以利用样本统计量对总体参数进行估计。
例如,可以利用样本均值估计总体均值,利用样本标准差估计总体标准差。
通过计算置信区间,我们可以得到对总体参数的范围估计。
3.2 假设检验假设检验是统计学中非常重要的一项工具,用于判断样本数据是否支持某个假设。
基于抽样分布,我们可以计算统计量的P值,进而判断样本数据与假设的一致性。
常用的假设检验有均值检验、方差检验、比例检验等。
3.3 质量控制在生产过程中,质量控制是非常关键的。
通过对样本数据进行分析,可以判断生产过程是否正常。
例如,可以通过控制图分析样本均值的变化情况,以判断过程是否处于控制状态。
3.4 统计决策在实际决策中,我们往往需要依据样本数据来进行判断。
抽样分布提供了一种基于统计的决策依据。
例如,在市场调研中,我们可以通过对样本数据进行分析,对市场潜力进行预测,从而指导营销策略的制定。
《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布
![《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布](https://img.taocdn.com/s3/m/5f3bea21b52acfc788ebc91b.png)
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆短期的机遇变异
重复投掷一枚均匀硬币六次,观察每次出现的面: (1)正反正反反正 (2)反反反正正正 (3)正反反反反反
直觉认为结果(1)是随机的,结果(2)和结果 (3)很不随机。 从概率的观点认为结果(1)、(2)、(3)的发 生有相同的概率,因而没有哪一个结果比其他结果更多 一点或少一点随机性。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
◆变异性(Variablity)
统计数据和统计资料具有变异性, 即个体之间有 差异,而对同一个体的多次观察,其结果也会不一样, 并且几乎每一次观察都随着时间的不同而改变,因而变 异性是一个重要的统计观念。 抽样结果的差异是变异性的主要表现 不能仅仅根据一次抽样的结果就断下结论!
《概率统计简明教程》第二版
第八章 统计量与抽样分布
二、总体和样本
1.总体
我们关心的是总体中的个体的某项指标(如人的身高、 灯泡的寿命, 汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指标 的出现也带有随机性 . 从而可以把这种数量指标看作一 个随机变量X ,因此随机变量X的分布就是该数量指标在 总体中的分布.
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆长期的规律性
在某地的彩票活动中,七年中有人累计中两次大 奖的机会是: 一半对一半
人们的潜意识常常与理性思考的结果有很大差别, 如不善于统计思考,即使面对十分平常的现象,也会闹 出笑话。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
第八章 统计量与抽样分布
二、总体和样本
第6章_统计量及其抽样分布
![第6章_统计量及其抽样分布](https://img.taocdn.com/s3/m/0c1a536b02768e9951e7382a.png)
统计量 抽样分布 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布 两个样本平均值之差和两个样本比例之 差的分布 6.7 样本方差的分布 6.1 6.2 6.3 6.4 6.5 6.6
6.1 统计量
6.1.1 统计量的概念 6.1.2 常用统计量 6.1.3 次序统计量
x
用Excel计算F分布的概率和临界值
1. 利用Excel提供的【FDIST】统计函数,计算F分布右尾 的概率值
语法:FDIST(x,degrees_freedom1,degrees_freedom2)
2. 利用【FINV】函数则可以计算给定右尾概率和自由度 时的相应临界值
语法: FINV(probability,degrees_freedom1,degrees_freedom2)
用Excel计算2分布的概率(续)
计算自由度为8,随机变量2值大于10的概率?
用Excel计算2分布的概率(续)
计算自由度为10,随机变量2分布右尾概率为0.1 的临界值?
t分布 (t distribution)
历史:William Gosset于1908年提出的,由于其经常用 “student”为笔名发表文章,其所提的此分布也称为学生 分布(student’s t)。
样本确定后,统计量的值总是可以计算出来。
常用统计量
设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,
1.样本平均数X 源自Xi 1n
i
n
n
X1 X 2 X n n
2.样本方差 3.样本比例
s2
2 ( X X ) i i 1
n 1
统计量及其分布ppt课件
![统计量及其分布ppt课件](https://img.taocdn.com/s3/m/c37387aca58da0116c1749d7.png)
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
统计量的分布——抽样分布及其性质
![统计量的分布——抽样分布及其性质](https://img.taocdn.com/s3/m/67d66e5e00f69e3143323968011ca300a7c3f650.png)
$
$0
首先根据数学期望和方差的性质有4
(
+
=A
7
AB$
中国人民大学出版社!)%$6!1& '(( 蔡则元&三大抽样分布的理解与具体性质' :( &数
0
(
0
接下来对 学学习与研究 + + + 4
=A 7%E
=A 7E
=A 7()
AB3
AB$
AB3
曲天尧关于对统计推断中抽样分布的总结及判 (
,l%很显然该概率密度服从指数分布 因此) 分布为参 数7$ 的指数分布从而指数分布是作为一种特殊的)
)
根据函数的性质可得 槡 即自由
G/HF
-'
-
' 7
$
>8') )
)
度- 充分大时'-分布近似于正态分布
分布
对于'分布 给定常数 % jj$ 满足条件
科教论坛
!"#!$%&$'(') *+&,-./&$01$21(3$&)%)(%)%$3
科技风 年 月
统计量的分布
抽样分布及其性质
赵红妮
西安思源学院基础部!陕西西安!+#""""
摘4要数理统计是以概率论为基础的一个数学分支它从实际观测的数据出发研究随机现象的规律性 本文基于 正态分布的基础上研究三大抽样分布) 分布'分布和<分布的概念及性质图像结合例题对抽样分布做出更深一层的 理解与应用
关键词随机变量抽样分布正态分布
44概率论中假定随机变量的分布是在已知的基础上研 究随机变量的性质以及数字特征&而在现实生活中要研究
第六章 统计量及其
![第六章 统计量及其](https://img.taocdn.com/s3/m/cb28851b16fc700abb68fc29.png)
D( X (1) X ( 2) ) D( X (1) ) D( X ( 2) ) n1 n2 2 2 X1 X 2 ~ N ( 1 2 , 1 2 ) n1 n2
解:设600份报表中至少有一处错误的报表所 ˆ ,由题意知: p 占的比例为 p ˆ 0.02
p ˆ (1 )
n 0.02 (1 0.02) 0.0057 600
由中心极限定理, 有 (1 ) 2 ˆ N ( , ) p ˆ 即 ~ N (0.02,0.0057 ) p~ n 从而所求概率为:
即该统计人员所填写的报表中至少有一处错误的报 表所占的比例在0.025~0.070之间的概率为 19.02%。
第六节两个样本均值之差的分布
• 两个正态总体 2 (1) (1) (1) N ( ,1 )的一个 设 X 是独立地抽自总体 X ~ ) X ( 2是是独立地 容量为n1 的样本的样本均值, 抽自总体 X ( 2) ~N ( (1) , 2 2 ) 的一个容量为 n2 的样本的样本均值, 则有
(1)
( 2)
D( X
(1)
( 2)
) D( X ) D( X
(1)
( 2)
)
2 1
n1
2 2
n2
例6.8 甲、乙两所高校在某年录取新生时,甲 校的平均分为655分,且服从正态分布,标 准差为20分;乙校的平均分为625分,也服 从正态分布,标准差为25分.现从甲乙两校 各随机抽取8名新生计算其平均分数,出现 甲校比乙校的平均分低的可能性有多大? 解:因为两个总体均为正态分布,所以8名新 生的平均成绩X (1) , X (2) 也分别为正态分布, X (1) X ( 2 ) 也为正态分布,且 2 2 X (1) X ( 2 ) ~ N ( (1) ( 2) , 1 2 )
概率论与数理统计教案统计量和抽样分布
![概率论与数理统计教案统计量和抽样分布](https://img.taocdn.com/s3/m/e8c50f17f6ec4afe04a1b0717fd5360cba1a8d0c.png)
一、统计量和抽样分布的概念介绍1.1 统计量的定义讲解统计量的概念,即根据样本数据所定义的量,用来描述样本的某些特征。
例如,样本均值、样本方差等。
1.2 抽样分布的定义解释抽样分布是指在一定的抽样方法下,统计量的概率分布。
例如,正态分布、t分布等。
二、统计量的估计方法2.1 点估计介绍点估计的概念,即用一个具体的数值来估计总体参数。
例如,用样本均值来估计总体均值。
2.2 区间估计讲解区间估计的方法,即根据样本数据,给出总体参数估计的一个区间,该区间以一定的概率包含总体参数。
例如,置信区间。
三、抽样分布的性质及应用3.1 抽样分布的性质讲解抽样分布的一些基本性质,如独立性、对称性、无偏性等。
3.2 抽样分布的应用介绍抽样分布在实际问题中的应用,如利用抽样分布来判断总体均值的假设检验问题。
四、假设检验的基本概念和方法4.1 假设检验的定义解释假设检验是一种统计推断方法,通过观察样本数据,对总体参数的某个假设进行判断。
4.2 假设检验的方法讲解常见的假设检验方法,如单样本t检验、双样本t检验、卡方检验等。
4.3 假设检验的判断准则介绍假设检验的判断准则,如P值、显著性水平等,并解释其含义和作用。
六、正态分布及其应用6.1 正态分布的定义与性质详细介绍正态分布的概念、概率密度函数、累积分布函数以及其性质,如对称性、钟形曲线等。
6.2 标准正态分布解释标准正态分布的概念,即均值为0,标准差为1的正态分布。
讲解标准正态分布表的使用方法。
6.3 正态分布的应用介绍正态分布在实际问题中的应用,如利用正态分布来分析和估计总体均值、方差等参数。
七、t 分布及其应用7.1 t 分布的定义与性质讲解t 分布的概念、概率密度函数、累积分布函数以及其性质。
解释t 分布与正态分布的关系。
7.2 t 分布的自由度介绍t 分布的自由度概念,即样本量。
讲解自由度对t 分布形状的影响。
7.3 t 分布的应用介绍t 分布在实际问题中的应用,如利用t 分布进行小样本推断、假设检验等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E ( p1 p2 ) 1 2
1 (1 1 ) 2 (1 2 ) D( p1 p2 ) n1 n2
【例】某厂甲、乙两个车间生产同一种 产品,根据经验其产品的不合格率分别 为3.5%和4%。从甲车间随机独立地抽取 200个产品,从乙车间随机独立地抽取 150个产品。问两个样本中产品不合格率 相差不超过1%的概率。
1
2
3
4
现从总体中抽取n=2的简单随机样本,在重 复抽样条件下,共有42=16个样本。所有样本的 结果如下表
所有可能的n = 2 的样本(共16个) 第一个 观察值 第二个观察值 1 2 3 4
1
2 3 4
1, 1
2, 1 3, 1 4, 1
1, 2
2, 2 3, 2 4, 2
1, 3
2, 3 3, 3 4, 3
X p n
(1 ) 当n充分大时,p近似服从均值为 ,方差为 n
的正态分布。
【例】已知对某超市服务水平不满意的人数的 比例为5%,现随机抽取475名顾客组成的简单 随机样本,问这475名顾客中不满意的比例在 0.03~0.075之间的概率有多大? 解:设475名顾客中不满意的比例为p,则 E(p)=0.05, D(p)=0.05×0.95/475=0.0001 p~N(0.05,0.0001)
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0
x
样本均值的抽样分布
所有样本均值的均值和方差
1.0 1.5 4.0 x 2.5 M 16
i 1 i
x
n
2 x
2 ( x ) i x i 1
n
M
(1.0 2.5) 2 (4.0 2.5) 2 2 0.625 16 n
X ~ N (10, 0.432 )
_ _
X
n
49
X 10 9 10 P( X 9) 1 P( X 9) 1 P( ) 0.43 0.43
=1-Φ (-2.33)= Φ (2.33)=0.9901
_
练习题
某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。
1 n X X i s2 n i 1
2 ( X X ) i i 1
2
)
n 1
( X ) T ~ t ( n 1) S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
3 由正态分布导出的几个重 要分布
卡方 (c2) 分布
定义:设随机变量X1,X2,…Xn相互独立,且Xi 服从标准正态分布 N(0,1),则它们的平方和 n X i2 服从自由度为n的c2分布。
i 1
当自由度n足够大时, c2分布的概率密度曲线趋于对称; 当n→+∞时, c2分布的极限分布是正态分布。 c2分布的数学期望为:E( c2)= n c2分布的方差为: D( c2) 2n
i 1
的概率分布即为样本均值的抽样分布。
【例】设一个总体,含有4个元素(个体),即 总体单位数N=4。4个个体分别为X1=1、X2=2、 X3=3 、X4=4 。总体的均值、方差及分布如下
X
i 1
N
总体分布
i
N
2.5
.3 .2 .1 0
2
(X
i 1
N
i
)
2
N
1.25
Y / m nY X Z / n mZ
则称X服从第一自由度为m,第二自由度为n的F分布, 记为X~F(m,n)。
n E( X ) ,n 2 n2 2n 2 (m n 2) D( X ) ,n 4 m(n 2)(n 4)
4
样本比例的抽样分布
如果在样本大小为n的样本中具有某一特征 的个体数为X,则样本比例用p来表示:
例:A班统计学考试平均分为75分,分数 服从正态分布,标准差为5分;B班统计 学考试平均分为72分,也服从正态分布, 标准差为7分。现在从A、B两班分别随 机抽出10名学生的统计学成绩,A班10 名学生的统计学平均成绩高于B班10名 同学的统计学平均成绩的可能性有多大?
两个样本比例之差的分布
设分别从具有参数为π1和π2的两个总体 中抽取包含n1个观测值和n2个观测值的独立 样本,当n1和n2很大时,(p1-p2)的抽样分 布近似服从正态分布:
当样本容量足够大时 (n≥30),样本均值的抽样 分布逐渐趋于正态分布
标准误差
标准误差:样本统计量与总体参数之间的平均差异 1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度 2. 样本均值的标准误差小于总体标准差 3. 计算公式为
x
n
【例】设从一个均值μ =8、标准差σ =0.7的总 体中随机抽取容量为n=49的样本。要求: (1)计算样本均值小于7.9的近似概率 (2)计算样本均值超过7.9的近似概率 (3)计算样本均值在总体均值μ =8附近 0.1范围的近似概率
统计量及其抽样分布
1
1. 抽样
统计量
样本 是样本X1,X2……Xn的一个函数 3. 统计量不依赖任何未知参数 4. 将一组样本的具体观测值代入统计量函 数,可以计算出一个具体的统计量值。
2 样本均值的抽样分布 和中心极限定理
1.从一个总体中随机抽出容量相同的各种样本, 从这些样本计算出的某统计量所有可能值的概 率分布,称为这个统计量的抽样分布。 2. 设X ,X ,…,X 是取自总体X的样本,样本 1 2 n n _ _ 均值 X 1 Xi ,所有可能样本的均值 X 构成 n
D( X1 X 2 ) D( X1 ) D( X 2 ) n1 n2
2 1 2 2
【例】居民区甲有2000个家庭,平均居住时 间为130个月,服从正态分布,标准差为30 个月;居民区乙有3000个家庭,平均居住 时间为120个月,也服从正态分布,标准差 为35个月。从两个居民区中独立地各自抽 取一个简单随机样本,样本容量为70和 100。问居民区甲样本中的平均居住时间 超过居民区乙样本中的居民平均居住时间 的概率是多大。
式中:M为样本均值的个数
样本均值的分布
当总体服从正态分布N ~(μ ,σ 2)时, 来自该总体的所有容量为n的样本的均值X 也服从正态分布,X 的数学期望为μ , 方差为σ 2/n。即X~N(μ ,σ 2/n)
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ 、 方差为σ 2/n的正态分布。
5 两个样本平均值之差的分布
设 X 是独立地抽自总体 X1 ~ N (1,12 ) 的一个容量 为n1的样本的均值。 X 2 是独立地抽自总体 2 X 2 ~ N (2 , 2 ) 的一个容量为n2的样本的均值,则有
1
E ( X1 X 2 ) E ( X1 ) E ( X 2 ) 1 2
【例】某公司有400人,平均工龄为10年,标准 差为3年。随机抽出49名组成一个简单随机样本, 试问样本中工作人员的平均年龄不低于9年的概率 有多大。 解:虽然该总体的分布未知,但样本容量n=49较大 由中心极限定理可知,样本均值的抽样分布近 _ 似服从正态分布。则均值的期望 E ( X ) 10(年) 均值的标准差 3 0.43(年)
t分布和T统计量
1. t分布:设随机变量X~N(0,1),Y~ c2(n), 且X与Y独立,则 X
t Y /n
其分布称为t分布,记为t(n),其中n为自由度。
当n≥2时, t分布的E (t)=0
当n≥3时, t分布的D (t)=n/(n-2)
2. T统计量
设X1,X2,…,Xn是来自正态总体 N ~ (μ ,σ n 的一个样本, 则
1, 4
2, 4 3, 4 4, 4
计算出各样本的均值,如下表。并给出样 本均值的抽样分布
16个样本的均值(x) 第一个 观察值 1 第二个观察值 1 1.0 2 1.5 3 2.0 4 2.5
.3 .2 .1 P(x)
2
3 4
1.5
2.0 2.5
2.0
2.5 3.0
2.5
3.0 3.5
3.0
3.5 4.0
0.03 0.05 p 0.05 0.075 0.05 P(0.03 p 0.075) P 0.01 0.01 0.01
(2.5) (2) (2.5) (2) 1 0.9938 0.9772 1 0.971