第六章统计量及其抽样分布
概率论与数理统计(06)第6章 统计量及其抽样分布
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
统计学第6章统计量及其抽样分布
整理ppt
16
2. T统计量
设X1,X2,…,Xn是来自正态总体N~ (μ,σ2 )
n
的一个样本,
X
1 n
n i 1
Xi
(Xi X )2 s 2 i1
n 1
则 T(X) ~t(n1)
S/ n
称为T统计量,它服从自由度为(n-1)的t分布。
整理ppt
17
F分布
定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:
整理ppt
8
中心极限定理
设从均值为,方差为2的一个任意总 体中抽取容量为n的样本,当n充分大时, 样本均值的抽样分布近似服从均值为μ、 方差为σ2/n的正态分布。
当样本容量足够大时
(n≥30),样本均值的抽样
分布逐渐趋于正态分布
整理ppt
9
标准误差
标准误差:样本统计量与总体参数之间的平均差异
1. 所有可能的样本均值的标准差,测度所有样本 均值的离散程度
因此,估计这100名患者治愈成功的比 例在85%至95%的概率为90.5%
整理ppt
22
6.5 两个样本平均值之差的分布
设
X
1
是独立地抽自总体
X1 ~N(1,12)
的一个容量
为n1的样本的均值。 X 2 是独立地抽自总体
X2 ~N(2,22)的一个容量为n2的样本的均值,则有
E (X 1X 2)E (X 1) E (X 2)12
2. 样本均值的标准误差小于总体标准差
3. 计算公式为
x
n
整理ppt
10
【例】设从一个均值μ=8、标准差σ=0.7的总 体中随机抽取容量为n=49的样本。要求:
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
第六章 统计量及其抽样分布
样本均值的抽样分布
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概率分 布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。 总体的均值、方差及分布如下
第 一
16个样本的均值(x)
个
第二个观察值
观 察值1 2
3
4
11
1.
20.
52. 0.
5
21
2.
25.
03. 5.
0
23
2.
30.
53. 0.
5
24
3.
35.
04. 5.
0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
第六章 统计量及其抽样分布
抽样理论依据: 1、大数定律 (1)独立同分布大数定律:证明当N足够大时,平均数据有稳定性,为用样本平 均数估计总体平均数提供了理论依据。 (2)贝努力大数定律:证明当n足够大时,频率具有稳定性,为用频率代替概率 提供了理论依据 2、中心极限定律 (1)独立同分布中心极限定律:设从均值为u、方差为s2(有限)的任意一个总体 中抽取样本量为n的样本,但n充分大时,样本均值X的抽样分布近似服从均值为u, 方差为s2/n的正态分布。 (2)德莫佛-拉普拉斯中心极限定律:证明属性总体的样本数和样本方差,在n足 够大时,同样趋于正态分布。
(central limit theorem)
概率论 第六章 样本及抽样分布
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?答:(1)设12n X X X ,,…,是从总体X 中抽取的容量为n 的一个样本,如果由此样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。
3.什么是次序统计量?答:设12n X X X ,,…,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序(1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
贾俊平《统计学》第五版第6章_统计量及其抽样分布
6. 3. 3 F分布 定义6.5 设随机变量Y与Z相互独立,且Y与Z分别服从自 由度为m和n的 2 分布
Y ~ 2 (m)
Z ~ 2 (n)
(6. 5)
Y/m nY 则称 X Z/n mZ
X服从第一自由度为m,第二自由度为n的F分布,记为 F(m,n),简记为X~F(m,n) 。
1 ( X i X )2 n 1 i1
2 2 (n 1)S x (m 1)S y
n
Sy
2
1 m (Yi Y )2 m 1 i1
S xy
nm2
6 - 23
( X Y ) ( 1 2 ) mn ~ t (n m 2) (6. 4) S xy mn
6-3
统计学(第三版)
6. 1
统计量
6. 1 统计量
6.1.1 统计量的概念 统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6-5
统计学(第三版)
统计学(第三版)
6.3 由正态分布得到的几个重要分布
证明:
X 1 1 X , Y i Yi n i 1 m i 1
n m
Sx
2
1 n 1 m 2 2 (Xi X ) , Sy (Yi Y ) 2 n 1 i 1 m 1 i 1
2
(n 1) S x
但对于较小的 n, t分布与N(0,1) 分布相差很大.
6 - 20
统计学(第三版)
6.3 由正态分布得到的几个重要分布
2014年自考 概率论与数理统计串讲讲义 第六章 统计量及其抽样分布
n 1 exp − 2 2σ
( xi − µ ) ∑ i
=1
n
常见统计量:设总体为 X, x1 , x2 , " , xn 为其样本, EX = 不含任何未知参数的样本 ( x1 , " , xn ) 的函数称为统计量
µ , DX = σ 2
2 2
1 n 1 m 1 n 1 m 2 2 S1 = ( x − x ) , S = ( y − y ) ,其中 x = x , y = ∑ i ∑ i ∑ i ∑ yi ,则 2 n − 1 i =1 m − 1 i =1 n i =1 m i =1
2
2
U=
( x − y) − ( µ1 − µ 2 )
ES 2 = σ 2 , ESn 2 =
2
n −1 2, σ ) ,则有 x 与 s 相互独立,且
x =
2
(n − 1) s 2
σ
2
=
1
σ
2
( xi − x) ∑ i
=1
n
2
~ x (n − 1)
2
t=
x− µ ~ t (n − 1) * s/ n
(4)若总体 X 与总体 Y 相互独立, x1 , " , xn 与 Y 1 ,", Y m 分别为其样本,X~ N ( µ1 , σ 1 ) ,Y~ N ( µ 2 , σ 2 )
2
∑ ( xi − x) i
=1
2
= (n − 1)σ 2
证明:∵
1
σ
2
( xi − x) ∑ i
=1
n
2
~ x ( n − 1)
统计学课后习题第六章-贾俊平等
第六章统计量及其抽样分布6。
1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====2—1,查标准正态分布表得=0。
8159因此,=0。
63186。
2 =====0。
95查表得:因此n=436。
3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Z n是来自总体N(0,1)的样本,则统计量2分布,记为χ2~ χ2(n)服从自由度为n的χ因此,令,则,那么由概率,可知:b=,查概率表得:b=12.596。
4 在习题6。
1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3。
325,=19。
919,则=0。
369,=1.88。
第6章 抽样分布s1
作者钟卫统计学1Statistics第6 章统计量及其抽样分布6.1 统计量6.2 关于分布的几个概念6.3 由正态分布导出的几个重要分布6.4 样本均值的分布与中心极限定理6.5 样本比例的抽样分布6.6 两个样本平均值之差的分布6.7 关于样本方差的分布第6章抽样分布6.1 抽样误差6.2 样本均值的期望与方差6.3 样本均值的抽样分布6.4 样本比例的抽样分布6.5 两个样本均值之差的抽样分布 6.6 样本方差的抽样分布3•推断统计学的主要任务就是利用样本均值、样本比例、样本方差等统计量来估计和检验总体的相应参数…•由于我们实际上只做了一次抽样,借助这一次抽样的结果,我们能够准确的估计总体相应的参数吗?•抽样分布知识能回答这一问题。
6.1 抽样误差/需要抽样分布的理由5抽样方法概率抽样非概率抽样简单随机抽样系统随机抽样整群抽样分层抽样判断抽样方便抽样总体样本抽样推论(总体参数)(样本统计量)自愿抽样配额抽样•由样本统计量(statistic)去推论总体参数,总会有差距存在,这便是「_______」(sampling error)。
•比如,我们想了解全北京市20岁以上的成年人每年失眠的天数,我们抽取了1000位北京市20岁以上的居民进行调查,并求得其每年失眠天数的样本平均数( ),它不可能刚好等于总体平均数( ),势必有一些抽样误差存在。
•以平均数为例,抽样误差为•差距越大,抽样误差也就______。
•通常,由于总体参数是未知的,而在实际抽样时,我们又只抽一次样,因而无法知道抽样误差的确切值。
x X μ-x X μ抽样误差抽样分布•抽样分布(sampling distribution) :指在既定的样本量下,所有可能的样本组合所分别计算出的样本统计量,及其所发生的概率。
•样本统计量主要包括:样本均值, 样本比例,样本方差等•样本平均数的抽样分布(sampling distribution of the sample mean) :在既定的样本数下(例:北京市抽1000人),所有可能的样本组合(例:)所分别计算出的样本平均数(例:这1000人平均每年失眠天数),及其所发生的概率(例:平均每天失眠2小时的概率有多高),即为抽样分布。
第六章 统计量及其
D( X (1) X ( 2) ) D( X (1) ) D( X ( 2) ) n1 n2 2 2 X1 X 2 ~ N ( 1 2 , 1 2 ) n1 n2
解:设600份报表中至少有一处错误的报表所 ˆ ,由题意知: p 占的比例为 p ˆ 0.02
p ˆ (1 )
n 0.02 (1 0.02) 0.0057 600
由中心极限定理, 有 (1 ) 2 ˆ N ( , ) p ˆ 即 ~ N (0.02,0.0057 ) p~ n 从而所求概率为:
即该统计人员所填写的报表中至少有一处错误的报 表所占的比例在0.025~0.070之间的概率为 19.02%。
第六节两个样本均值之差的分布
• 两个正态总体 2 (1) (1) (1) N ( ,1 )的一个 设 X 是独立地抽自总体 X ~ ) X ( 2是是独立地 容量为n1 的样本的样本均值, 抽自总体 X ( 2) ~N ( (1) , 2 2 ) 的一个容量为 n2 的样本的样本均值, 则有
(1)
( 2)
D( X
(1)
( 2)
) D( X ) D( X
(1)
( 2)
)
2 1
n1
2 2
n2
例6.8 甲、乙两所高校在某年录取新生时,甲 校的平均分为655分,且服从正态分布,标 准差为20分;乙校的平均分为625分,也服 从正态分布,标准差为25分.现从甲乙两校 各随机抽取8名新生计算其平均分数,出现 甲校比乙校的平均分低的可能性有多大? 解:因为两个总体均为正态分布,所以8名新 生的平均成绩X (1) , X (2) 也分别为正态分布, X (1) X ( 2 ) 也为正态分布,且 2 2 X (1) X ( 2 ) ~ N ( (1) ( 2) , 1 2 )
贾俊平第六版统计学课后思考题答案——张云飞
第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X 1 n
i 1
n
X
i
(3.2.1)
为样本均值;称统计量
S
2
1 n 1
(X i
i 1
n
X)
2
(3.2.2)
为样本方差。
称统计量
S S
F ( n , m ) 1 F1 ( m , n )
1 F
~ F (n, m )
t 分布
设
X1
与
X2
独立且
X 1 N (0, 1), X 2 ( n ),
2
则称 t
X1 X2 n
的分布为自由度为n的t分布,
记为 t t ( n ).
t分布在n=1,n=10,n=100时的密度函数图象
其样本均值和样本方差分别为
x 1 n
n
xi , s
2
1 n1
则有
i1
n
( xi x ) ,
2
i1
(1) x 与 s 2 相互独立; (2)
( n 1) s
2
2
( n 1)
2
推论6-1 推论6-2
x s n
t ( n 1)
设 x 1 , x 2 , , x m是来自正态总体 N ( 1 , 12 ) 的样本,
分布, 记为 2 2 ( n ).
2
2
分布具有下面的性质:
2 1 分布的可加性
2 2 2 2 2 2 设 1 ~ ( n 1 ) , 2 ~ ( n 2 ) ,且 1 与 2 独立,则
1 2 ~ ( n1 n 2 )
2 2 2
2 分布的数学期望和方差
t分布性质
(1) T分布的密度函数图形关于y轴对称,在t=0处
密度函数达到极大值;
(2)当n→∞时,T分布的渐近分布为N(0,1) .实际 上当n>30时,就认为近似程度较好;
几个重要结论
定理6-4 设 x 1 , x 2 , , x n 是来自正态总体 N ( , 2 ) 的样本,
i1
假设总体是连续型分布,密度函数为分f (x),则样本
x 1 , x 2 , x n 的联合密度函数为
f ( x1 , x n ) f ( x1 ) f ( x n )
n
f ( xi )
i1
§6.2 统计量及其分布
统计量
不含有任何未知参数的样本的函数, 称为统计量。
几个常用统计量
则当样本容量n较大时,x 的渐近分布为
N ( , ). n
几个常用的抽样分布
统计量的分布称为抽样分布。
来自正态总体的几个常用统计量的分布,已 有一些重要的结果(人们已经获得这些统计量 的具体的分布密度函数)。下面介绍来自正态 总体的几个常用统计量的分布。
分布
2
设 X 1 , X 2 , , X n 独立同分布与标准正态分布 N (0, 1) 则 2 X 12 X 22 X n2 的分布称为自由度为n的
2 2
独立,则称
F
X1 m X2 n
的分布是自由度为m与n的F分布,记为F F ( m , n ), 其中m称为分子自由度,n称为分母自由度.
F分布密度函数图象
称满足
P { F F ( m , n )}
的数 F ( m , n ) 是自由度为m与n的F分布的 分位数
若F-F(m,n),则1/F仍服从F分布,即
设总体X是具有分布函数F(x)的随机变量,若
x1 , x 2 , x n
是一组, x n 是一组取自
总体X的容量为n的简单随机样本(简称样本)
样本联合分布函数
F ( x1 , x 2 , , x n ) F ( x1 ) F ( x 2 ) F ( x n )
(1) p的大小如何?
(2) p的范围? (3) p的大小是否满足设定要求?( p <5%)
§6.2 总体与样本
总体与个体
在一个统计问题中,我们把研究对象的全体称 为总体。构成总体的每个成员称为个体。 一个总体就是一个分布,其数量指标就是服从 这个分布的随机变量。个体的取值是按一定的规律 分布的。
一般来说,总体的分布是未知的,或分布形式 中含有未知参数。 在统计学中,人们总是通过从 总体中抽取一部分个体,根据获得的样本数据对总 体分布进行推断,而被抽出的部分个体叫做总体的 一个样本。
从总体中抽取有限个个体对总体进行观察的过 程叫做抽样。
样本
从总体中随机抽取n个个体,记其指标值为 x 1 , x 2 , , x n , 称为总体的一个样本,n称为样本容量,样本中的个体 称为样品。
第六章 统计量及其抽样分布
§6.1 §6.2 §6.3
引言 总体与样本 统计量及其分布
§6.1 引言
例1 某公司要采购一批产品,每件产品要么是 正品要么是产品。若设这批产品的次品率为p, 则从该批产品中随机抽取一件,用X表示抽到的 次品数,不难看出X服从0-1分布。但分布中的参 数p未知。 p的大小决定了产品的质量,影响采购 行为的经济效益,对p提出一些问题:
2
1 n 1
(X i
i 1
n
X)
2
为样本标准差;
样本均值的抽样分布
定理6-1
设 x 1 , x 2 , x n 是来自某个总体X的样本,
x 为样本均值。
2
(1)若总体 X
N ( , ),
2
则
x N ( ,
),
2
n
(2)若总体分布未知,且
2
E ( X ) , D( X ) ,
假设总体是离散型分布,分布律为:
P { X x i } p i , i 1, 2 ,
样本 ( x 1 , x 2 , x n ) 的联合分布律为
P { x1 , x 2 , , x n } P { X x1 } P { X x n }
n
P{ X xk }
推论6-3
在推论6-2的记号下,设 1
2
2
2 , 并记
2 2
sw
2
( m 1) s x ( n 1) s y m n2
2
则有
( x y ) (1 2 ) sw 1 m 1 n t ( m n 2 ).
y 1 , y 2 , , y n 是来自正态总体N ( 2 , 22 ) 的样本,
且此两样本相互独立,记
sx
2
m 1
2
1
m
( xi x ) , s y
2 2
2 2
i1
n1
1
n
( yi y ) ,
2
i1
则有
F
sx 1
2
sy 2
F ( m 1, n 1).
样本的二重性
(1)样本是随机变量,记作
X 1 , X 2 , , X n
(2)样本抽取后经观测有确定的观测值,样 本是一组数值,记作 x 1 , x 2 , , x n
简单随机样本: 满足以下两个条件的样本
代表性: 即要求样本的抽取是随机的,每个个体 都有机会被抽到; 独立性: 即要求每次观察的结果既不影响其它 观察结果,也不受别的观察结果的影响.
2
E ( ) n
2
, D ( ) 2n
2
2 3 分布的分位点
对于给定的数 ,且 0 1 ,称满足条件
P{
2
( n )}
2
2
(n)
f ( y ) dy
F 分布
设X1
( m ), X 2 ( n ), X 1 与 X 2