概率论第6章样本及抽样分布
概率论与数理统计(06)第6章 统计量及其抽样分布
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 11
µx = µ
xቤተ መጻሕፍቲ ባይዱ
x 的分布趋 于正态分布 的过程
6 - 12
6.4 正态总体 6.3.1 χ2分布 6.3.2 t 分布 6.3.3 F 分布
6 - 13
χ2 分布
第六章 样本与统计量
6.1引言 6.1引言
数理统计学: 运用概率论的基础知识,对要研究的随机现象进行 多次观察或试验,研究如何合理地获得数据资料, 建立有效的数学方法,根据所获得的数据资料,对 所关心的问题作出估计与检验。
6-1
§6.2总体与样本 6.2总体与样本
对某一问题的研究对象全体称为总体。 组成总体的某个基本单元,称为个体。 总体可以是具体事物的集合,如一批产品。 也可以是关于事物的度量数据集合,如长度测量。 总体可以包含有限个个体,也可以包含无限个个体。 有限总体在个体相当多的情况下,可以作为无限 总体进行研究。 总体中的个体,应当有共同的可观察的特征。该 特征与研究目的有关。
6 - 16
χ2分布
(图示) 图示)
n=1 n=4 n=10
n=20
6 - 17 不同容量样本的抽样分布
χ2
t 分布
6 - 18
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 (W. “Student”(学生)为笔名的论文中首次提出 Student”(学生)
X ~ N(µ,σ ) ,则
2
χ2分布
2. 3.
z=
X −µ
Y=z
概率论与数理统计-ch6-样本与抽样分布
概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。
在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。
1、随机样本总体:试验的全部可能的观察值。
=样本空间个体:每⼀个可能观察值。
=样本点容量:总体中所包含的个体的个数。
有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。
所以将不区分总体与相应的随机变量,统称为总体X。
样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。
对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。
则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。
n称为样本的容量。
进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。
2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。
统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。
统计量也是⼀个随机变量。
g(x1,x2,...,xn)是统计量的观测值。
常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。
总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。
第六章样本及样本函数的分布
∼ t(n −1). .
Sn
177
概率论与数理统计全程学习指导
∑ = ∑ 【评注】 10
1 统计量 σ 2
n
(X i
−
μ)2
和
i =1
(n −1)S2 σ2
1 σ2
n
(X i
−
X )2
的分布在自由度上是
i =1
∑ ∑ 1
有差别的,这是因为在 σ2
n
(X i
−
X )2
中有一个约束条件
X
i =1
=1 n
x(1) ≤ x(2) ≤
≤x (k)
,并假设
x( i )
出现的频数为
ni
,那么
x( i )
出现的频率为
i = 1, 2, , k, k ≤ n . 函数
fi
=
ni n
,
⎧ 0,
⎪
∑ Fn (x)
=
⎪ ⎨
i
fj,
⎪ j=1
⎪⎩ 1,
x < x(1),
x(i) ≤ x < x(i+1), i = 1, 2, , k −1, x ≥ x(k).
③ χ2 分布的性质
10 若 χ2 ∼ χ2 (n) ,则 E(χ2 ) = n , D(χ2 ) = 2n ;
20
(可加性)若
χ
2
1
∼
χ2 (n1) ,
χ
2
2
∼
χ2 (n2 )
,且
χ
2
1
和
χ
2
2
相互独立,则
χ
2
1
+
χ
2
概率论 第六章 样本及抽样分布
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.
概率论6-1,2,3
例如,考察某工厂10月份生产的灯泡的寿命所组 例如,考察某工厂 月份生产的灯泡的寿命所组 成的总体。 成的总体。灯泡寿命落在各个时间区间内有一定的 百分比,如灯泡寿命落在1000小时 小时~1300小时的占灯 百分比,如灯泡寿命落在 小时 小时的占灯 泡总数的85%,落在1300小时 %,落在 小时~1800小时的占灯泡总 泡总数的 %,落在 小时 小时的占灯泡总 数的5%, %,…。 即灯泡寿命的取值有一定的分布。 数的 %, 。 即灯泡寿命的取值有一定的分布。
就取位于 [ 是整数, x([ np ]+1) , 不是整数, 当np不是整数, x 综上, 综上, p = 1 [ x( np ) + x( np+1) ], 当np是整数 . 2
0 当 特别, 特别, p = 0.5时,.5分位数 x0 .5也记为Q2或
数据集的箱线图是由箱子和直线组成的图形, 数据集的箱线图是由箱子和直线组成的图形, 它是基于以下五个数的图形概括: 它是基于以下五个数的图形概括: 最小值 Min, 第一四分位数 Q1,中位数M,第三四分位数 Q3和 中位数 最大值 Max. 作法如下: 作法如下: (1) 画一水平数轴, 在轴上标上 Min,Q1, M, 画一水平数轴, Q3,Max. 在数轴上方画一个上、 下侧平行于数 在数轴上方画一个上、 Q 箱子的左右两侧分别位 于 Q1, 3 的上方. 轴的矩形箱子, 轴的矩形箱子, 在 M点的上方画一条垂直线 段 .线段位于箱子内部. ( 2)自箱子左侧引一条水平 线至 Min; 在同一水平 高度自箱子右侧引一条水平线直至最大值. 高度自箱子右侧引一条水平线直至最大值. 如图所示. 如图所示.
1.总体与个体 总体与个体
§1 随机样本
总体 试验的全部可能的观察值称为总体. 试验的全部可能的观察值称为总体. 个体 总体中的每个可能观察值称为个体. 总体中的每个可能观察值称为个体.
正态总体下的四大分布
《概率论与数理统计》第六章样本及抽样分布(2)正态总体下的四大分布:正态分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数).1,0(~/N nx udefσμ-例:设总体ξ~212(1,2),,,n N ξξξ 且是取自ξ的样本,则(D )A)1(0,1)2N ξ-B)1(0,1)4N ξ-C)()1(0,1)2N ξ-D)(0,1)N ξt 分布设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~/--n t ns x tdefμ其中t(n-1)表示自由度为n-1的t 分布。
分布2χ设n x x x ,,,21 为来自正态总体),(2σμN 的一个样本,则样本函数),1(~)1(222--n S n wdefχσ其中)1(2-n χ表示自由度为n-1的2χ分布例:已知F 0.1(7,20)=2.04,则F 0.9(20,7)=_______0.4902_____.例.对于给定的正数α,10<<α,设αu ,)(2n αχ,)(n t α,),(21n n F α分别是)1,0(N ,)(2n χ,)(n t ,),(21n n F 分布的下α分位数,则下面结论中不正确...的是(B )(A)αα--=1u u (B))()(221n n ααχχ-=-(C))()(1n t n t αα--=(D)),(1),(12211n n F αα=-2、设X 、Y 相互独立,且都服从标准正态分布,则Z =2Y X 服从______t(1)_____分布(同时要写出分布的参数).3.设ξ和η相互独立且都服从N(0,4),而41,ξξ 和41,ηη 分别是来自总体ξ和η的样本,则统计量242141......ηηξξ++++=U 服从的分布为)4(t 。
概率论与数理统计-第六章
这200人的年龄数据。
总体:北京市民的年龄 随机变量:年龄X
个体:张三28岁;李四5岁;
样本:{ 28;5;14;56;23;2;39;…;69} 样本容量:200
抽样:随机抽取200人进行调查的过程
6
例2:为了确定工厂生产的电池电量分布情况,在
产品中随机抽取500个,测量其电量。记录了
x
0
F n1 , n2
F分布的分位数
x
F分布的上α分位点
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx 的点F n1 , n2
为F n1 , n2 分布的上 分位数。F n1 , n2 的值可查F 分布表
17
不易计算!
18
抽样分布 —— 任意统计量 Q = g (X1, X2, …, Xn ) 的分布函数 抽样分布的计算: 多维随机变量(独立、同分布)的函数的分布 函数的计算问题。
得到统计量 Q 的抽样分布,就可以用来解决
关于总体 X 的统计推断问题。
19
关于随机变量独立性的两个定理
解:(1)作变换 Yi
显然Y1 , Y2 ,
2 n i 1
Xi
, Yn相互独立,且Yi N 0,1 i 1, 2,
Xi
i 1, 2,
,n
,n
于是 (
) Yi 2 2 n
2 i 1
28
n
(2)
2 ( X X ) X1 X 2 ~ N (0, 2 2 ), 1 2 2 ~ 2 (1) 2
《概率论与数理统计》第六章
既然总体是随机变量X,自然就有其概率分布。
我们把X的分布称为总体分布。
总体的特性是由总体分布来刻画的。因此,常 把总体和总体分布视为同义语。
第六章 样本及抽样分布 ‹#›
例2
在例1中,假定物体真实长度为(未知)。一般 说来,测量值X就是总体,取 附近值的概率要大一 些,而离 越远的值被取到的概率就越小。
k=1,2,…
第六章 样本及抽样分布 ‹#›
它反映了总体k 阶矩的信息
样本k阶中心矩
Bk
1 n
n i 1
(Xi
X )k
它反映了总体k 阶 中心矩的信息
第六章 样本及抽样分布 ‹#›
统计量的观察值
1 n
x n i1 xi;
s2
1 n 1
n i1
(xi
x )2
s
1 n 1
n i1
(xi
x
)2
第六章 样本及抽样分布 ‹#›
实际上,我们真正关心的并不一定是总体或个
体本身,而真正关心的是总体或个体的某项数量指 标。
如:某电子产品的使用寿命,某天的最高气温, 加工出来的某零件的长度等数量指标。因此,有时也
将总体理解为那些研究对象的某项数量指标的全
体。
第六章 样本及抽样分布 ‹#›
为评价某种产品质量的好坏,通常的做法是: 从全部产品中随机(任意)地抽取一些样品进行观测(检
样本X1,X2,…,Xn 既被看成数值,又被看成随机变量, 这就是所谓的样本的二重性。
随机样本
例 4 (例2续) 在前面测量物体长度的例子中,如果我们 在完全相同的条件下,独立地测量了n 次,把这 n 次测 量结果,即样本记为
X1,X2,…,Xn .
概率论与数理统计第6章
以分组区间为底,以
Yj
Wj X j1 X j
Wj 5
为高
作频率直方图
23
从频率直方图可看到:靠近两个极端的数据出现比 较少,而中间附近的数据比较多,即中间大两头小的分 布趋势,——随机变量分布状况的最粗略的信息。
在频率直方图中, 每个矩形面积恰好等于样本值 落在该矩形对应的分组区间内的频率,即
S j
Wj X j1
Xj
X j1 X j
Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的
分布状况。
24
12
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
代表性——即子样( X1, X2 ,
,
X
)的每个分量
n
X
与
i
总体 X 具有相同的概率分布。
独立性——即 X1, X2, , Xn 是相互独立的随机变量。
满足上述两点要求的子样称为简单随机子样.获得简 单随机子样的抽样方法叫简单随机抽样.
从简单随机子样的含义可知,样本 X1, X2 , , Xn 是来自总体 X、与总体 X具有相同分布的随机变量.
2分布 t 分布 数理统计的三大分布(都是连续型). F分布 它们都与正态分布有密切的联系.
在本章中特别要求掌握对正态分布、 2分布、 t分布、F分布的一些结论的熟练运用. 它们
是后面各章的基础.
31
一、 2分布
定义 设总体 X ~ N 0,1 , X1, X2,..., Xn 是 X
概率论第六章样本及抽样分布
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12
2 1
2 (n2 1) S2
2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2
2
~ (n 1)
2
X n1 X n
故 Y
(n 1) S 2
n n 1 ~ t (n 1) /(n 1)
2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1
概率论与数理统计第6章
不含未知参数的样本的函数称为统计量 不含未知参数的样本的函数称为统计量. 统计量 2. 几个常见统计量
1 n 样本均值 X = ∑Xi n i=1
反映总体 均值的信息 反映总 体方差 的信息
1 n 2 2 样本方差 S = ∑( Xi − X) n −1 i=1
样本2阶中心矩 样本 阶中心矩
反映总体2 反映总体 阶 中心矩的信息
(
)
−
n1 +n2 2
x≥0
例1 设X、Y相互独立均服从正态分布 、 相互独立均服从正态分布 N(0,3), X1,X2,…,X9和Y1,Y2,…,Y9分别为来 的样本。 自X、Y的样本。求 、 的样本
U=
X1 + X 2 + L + X 9 Y +Y +L+Y
2 1 2 2
的分布。 的分布。
2 9
小样本问题中使用) 精确抽样分布(小样本问题中使用) 抽样分布 大样本问题中使用) 渐近分布 (大样本问题中使用
{
三. 统计三大分布
1 . χ 分布
2
定义: 相互独立, 定义 设 X1 , X2 ,L, Xn相互独立 都服从正态 分布N(0,1), 则称随机变量: 则称随机变量: 分布 2 2 2 2 χ = X 1 + X 2 + …+X n 所服从的分布为自由度为 n 的 χ 分布. 分布
3. F分布 分布 与 X ~ χ (n1),Y ~ χ (n2 ), X与Y X / n1 相互独立, 相互独立,则称统计量 F = Y / n2 定义: 定义 设
2 2
服从自由度为n 分布, 服从自由度为 1及 n2 的F分布,n1称为第 分布 一自由度, 称为第二自由度, 一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
【样本】概率论与数理统计习题册
【关键字】样本第六章样本及抽样分布一、选择题1. 设是来自总体的简单随机样本,则必然满足( )A.独立但分布不同;B.分布相同但不相互独立; C独立同分布; D.不能确定2.下列关于“统计量”的描述中,不正确的是().A.统计量为随机变量 B. 统计量是样本的函数C. 统计量表达式中不含有参数D. 估计量是统计量3下列关于统计学“四大分布”的判断中,错误的是().A. 若则B.若C.若D.在正态总体下4.设表示来自总体的容量为的样本均值和样本方差,且两总体相互独立,则下列不正确的是().A. B.C. D.5. 设是来自总体的样本,则是( ).A.样本矩B. 二阶原点矩C. 二阶中心矩D.统计量6是来自正态总体的样本,分别为样本均值与样本方差,则( ).A. B. C. D.7. 给定一组样本观测值且得则样本方差的观测值为( ).B. D.8设X服从分布, ,则为( ).A. B. C. D.9设是来自正态总体的简单随机样本,若服从分布,则的值分别为().A. B. C. D.10设随机变量X和Y相互独立,且都服从正态分布,设和分别是来自两总体的简单随机样本,则统计量服从分布是( ).A. B. C. D.2、填空题1.在数理统计中,称为样本. 2.我们通常所说的样本称为简单随机样本,它具有的两个特点是.3.设随机变量相互独立且服从相同的分布,,令,则;4.是来自总体的一个样本,则.5.已知样本取自正态分布总体,为样本均值,已知,则.10.6设总体,是样本均值,是样本方差,为样本容量,则常用的随机变量服从分布.第七章参数估计一、选择题1. 设总体,为抽取样本,则是( ).的无偏估计 的无偏估计 的矩估计 的矩估计 2 设在[0,a]上服从均匀分布,是未知参数,对于容量为的样本,a 的最大似然估计为( ) (A ) (B ) (C ) (D );3 设总体分布为,为未知参数,则的最大似然估计量为( ). (A ) (B ) (C ) (D )4 设总体分布为,已知,则的最大似然估计量为( ). (A ) (B ) (C ) (D )5 设为来自总体的样本,下列关于的无偏估计中,最有效的为( ). (A ) (B ) (C ) (D )6 设)2(,,,21≥n X X X n 是正态分布),(2σμN 的一个样本,若统计量∑-=+-1121)(n i i i X X K 为2σ的无偏估计,则K 的值应该为( )(A )n 21 (B )121-n (C )221-n (D )11-n 7. 设θ为总体X 的未知参数,21,θθ是统计量,()21,θθ为θ的置信度为)10(1<<-a a 的置信区间,则下式中不能恒成的是( ).A. a P -=<<1}{21θθθB. a P P =<+>}{}{12θθθθC. a P -≥<1}{2θθD. 2}{}{12aP P =<+>θθθθ 8 设),(~2σμN X 且2σ未知,若样本容量为n ,且分位数均指定为“上侧分位数”时,则μ的95%的置信区间为( )A. )(025.0u n X σ±B. ))1((05.0-±n t n S XC. ))((025.0n t nS X ±D. ))1((025.0-±n t nS X9 设22,),,(~σμσμN X 均未知,当样本容量为n 时,2σ的95%的置信区间为( )A. ))1()1(,)1()1((2025.022975.02----n x S n n x S nB. ))1()1(,)1()1((2975.022025.02----n x S n n x S nC. ))1()1(,)1()1((2975.022025.02----n t S n n t S n D. ))1((025.0-±n t nS X 二、填空题1. 点估计常用的两种方法是: 和 .2. 若X 是离散型随机变量,分布律是{}(;)P X x P x θ==,(θ是待估计参数),则似然函数是 ,X 是连续型随机变量,概率密度是(;)f x θ,则似然函数是 .3. 设总体X 的概率分布列为:X 0 1 2 3P p 2 2 p (1-p ) p 2 1-2p其中p (2/10<<p ) 是未知参数. 利用总体X 的如下样本值: 1, 3, 0, 2, 3, 3, 1, 3 则p 的矩估计值为__ ___,极大似然估计值为 . 4. 设总体X 的一个样本如下:1.70,1.75,1.70,1.65,1.75 则该样本的数学期望)(X E 和方差)(X D 的矩估计值分别_ ___.5. 设总体X 的密度函数为:⎩⎨⎧+=0)1()(λλx x f 其他10<<x ,设n X X ,,1 是X 的样本,则λ的矩估计量为 ,最大似然估计量为 .6. 假设总体),(~2σμN X ,且∑==ni i X n X 11,n X X X ,,,21 为总体X 的一个样本,则X 是 的无偏估计.7 设总体),(~2σμN X ,n X X X ,,,21 为总体X 的一个样本,则常数k= , 使∑=-ni i X X k 1为σ 的无偏估计量.8 从一大批电子管中随机抽取100只,抽取的电子管的平均寿命为1000小时,样本均方差为40=S .设电子管寿命分布未知,以置信度为95.0,则整批电子管平均寿命μ的置信区间为(给定96.1,645.1025.005.0==Z Z ) . 9设总体),(~2σμN X ,2,σμ为未知参数,则μ的置信度为1α-的置信区间为.10 某车间生产滚珠,从长期实践可以认为滚珠的直径服从正态分布,且直径的方差为04.02=σ,从某天生产的产品中随机抽取9个,测得直径平均值为15毫米,给定05.0=α则滚珠的平均直径的区间估计为 .)96.1,645.1(025.005.0==Z Z 11. 某车间生产滚珠,从某天生产的产品中抽取6个,测得直径为:14.6 15.1 14.9 14.8 15.2 15.1已知原来直径服从)06.0,(N μ,则该天生产的滚珠直径的置信区间为 ,(05.0=α,645.105.0=Z ,96.1025.0=Z ).12. 某矿地矿石含少量元素服从正态分布,现在抽样进行调查,共抽取12个子样算得2.0=S ,则σ的置信区间为 (1.0=α,68.19)11(22=αχ,57.4)11(221=-αχ).第八章 假设检验一、选择题1. 关于检验的拒绝域W,置信水平α,及所谓的“小概率事件”,下列叙述错误的是( ). A. α的值即是对究竟多大概率才算“小”概率的量化描述 B .事件021|),,,{(H W X X X n ∈ 为真}即为一个小概率事件C .设W 是样本空间的某个子集,指的是事件120{(,,,)|}n X X X H 为真D .确定恰当的W 是任何检验的本质问题2. 设总体22),,(~σσμN X 未知,通过样本n X X X ,,,21 检验假设00:μμ=H ,要采用检验估计量( ).A.nX /0σμ- B.nS X /0μ- C.nS X /μ- D.nX /σμ-3. 样本n X X X ,,,21 来自总体)12,(2μN ,检验100:0≤μH ,采用统计量( ). A.nX /12μ- B.nX /12100- C.1/100--n S X D.nS X /μ-4设总体22),,(~σσμN X 未知,通过样本n X X X ,,,21 检验假设00:μμ=H ,此问题 拒绝域形式为 . A.}C > B. }/100{C nS X <- C. }10/100{C S X >- D. }{C X >5.设n X X X ,,,21 为来自总体)3,(2μN 的样本,对于100:0=μH 检验的拒绝域可以形 如( ).A .}{C X >-μ B. {100}X C ->C. }C >D. {100}X C -<6、 样本来自正态总体),(2σμN ,μ未知,要检验100:20=σH ,则采用统计量为( ). A.22)1(σS n - B. 100)1(2S n - C. n X 100μ- D. 1002nS7、设总体分布为),(2σμN ,若μ已知,则要检验100:20≥σH ,应采用统计量( ).A.nS X /μ- B.22)1(σSn - C.100)(21∑=-ni iXμ D.100)(21∑=-ni iX X二、填空题1. 为了校正试用的普通天平, 把在该天平上称量为100克的10个试样在计量标准天平上进行称量,得如下结果:99.3, 98.7, 100.5, 101,2, 98.399.7 99.5 102.1 100.5, 99.2 假设在天平上称量的结果服从正态分布,为检验普通天平与标准天平有无显著差异,0H 为 .2.设样本2521,,,X X X 来自总体μμ),9,(N 未知.对于检验00:μμ=H ,01:μμ=H , 取拒绝域形如k X ≥-0μ,若取05.0=a ,则k 值为 .第六章 样本及抽样分布答案一、选择题1. ( C )2.(C ) 注:统计量是指不含有任何未知参数的样本的函数3.(D )对于答案D,由于~(0,1),1,2,,i X N i n μσ-=,且相互独立,根据2χ分布的定义有4.(C) 注:11~(1)t n -才是正确的.5.(D)6C) 注:1~(0,)X N n~(1)t n -才是正确的7.(A) ()9922221192859257.591918iii i XX XX S ==--⨯-⨯====--∑∑8.(A) 9.(B) 解:由题意可知122~(0,20)X X N +,345~(0,12)X X X N ++,6789~(0,16)X X X X N +++,且相互独立,因此()()()()22212345678922~3201216X X X X X X X X X χ++++++++,即111,,201216a b c === 10(A) 解:()99211~(0,9)9~0,1ii i i XN X N ==⇒∑∑,()92219~9i i Y χ=∑由t()9t 二、填空题1.与总体同分布,且相互独立的一组随机变量2.代表性和独立性3.μ,2nσ4. 0.15.26.2(1)n χ-第七章 参数估计一、选择题1.答案: D.[解] 因为)()(222X E X E -=σ,∑===n i i X n A X E 12221)(ˆ,∑===n i i X n A X E 111)(ˆ, 所以,∑=-=-=n i i X X n X E X E 12222)(1)(ˆ)(ˆˆσ. 2.答案: A.[解]因为似然函数n i in X a a L )max (11)(≤=,当i i X a max =时,)(a L 最大, 所以,a 的最大似然估计为},,,max{21n X X X . 3 答案 A .[解]似然函数⎥⎦⎤⎢⎣⎡--=∏=2212)(21exp 21),(μσσπσμi ni x L , 由0ln ,0ln 2=∂∂=∂∂L L σμ,得22A =∧σ. 4. 答案 C.[解]在上面第5题中用μ取代X 即可. 5答案 B. 6.答案 C. 7答案 D. 8.答案 D. 9.答案 B.二、填空题:1. 矩估计和最大似然估计;2.∏iix p );(θ,∏iix f );(θ;. 341, 0.2828; [解] (1) p 的矩估计值28/1681===∑=i iXX ,令X p X E =-=43)(,得p 的矩估计为 4/14/)3(ˆ=-=X p. (2)似然函数为令 0218126])(ln [=----='pp p p L , 0314122=+-⇒p p 12/)137(±=⇒p . 由 2/10<<p ,故12/)137(+=p 舍去 所以p 的极大似然估计值为 .2828.012/)137(ˆ=-=p4、 1.71,0.00138;[解] 由矩估计有:nX X E X X Eii ∑==22)(ˆ,)(ˆ,又因为22)]([)()(X E X E X D -=,所以71.1575.165.17.175.17.1)(ˆ=++++==X X E且00138.0)(1)(ˆ12=-=∑=n i i X X n X D . 5、XX --=112ˆλ, ∑∑==+-=ni ini iXX n 11ln ln ˆλ;[解] (1)λ的矩估计为:样本的一阶原点矩为:∑==ni i x n X 11所以有:XX X --=⇒=++112ˆ21λλλ (2)λ的最大似然估计为:得:∑∑==+-=ni ini iXX n 11ln ln ˆλ.6、μ;[解]μμ===∑=nn X E n X E n i i 1)(1)(.7、)1(2-n n π;[解]注意到n X X X ,,,21 的相互独立性, 所以,)1,0(~2σnn N X X i --, 因为:⎪⎭⎫⎝⎛-=⎪⎭⎫ ⎝⎛-∑∑==n i i n i i X X E k X X k E 11||||σσπ=-=nn kn122 所以,)1(2-=n n k π.8、. [992.16,1007.84];[解] 这是分布未知,样本容量较大,均值的区间估计,所以有:05.0,40,1000=α==S X ,96.1025.0=Zμ的95%的置信区间是:]84.1007,16.992[],[025.0025.0=+-Z nSX Z n S X . 9、22((1),(1))X n X n αα-+-; [解]这是2σ为未知的情形,所以)1(~/--n t nS X μ.10、 [14.869,15.131];[解] 这是方差已知均值的区间估计,所以区间为:],[22αασ+σ-Z n x Z n x 由题意得:905.004.0152==α=σ=n x ,代入计算可得:]96.192.015,96.192.015[⨯+⨯-, 化间得:]131.15,869.14[. 11、 [14.754,15.146];[解] 这是方差已知,均值的区间估计,所以有:置信区间为:],[22αασ+σ-Z n X Z n X 由题得:95.14)1.152.158.149.141.156.14(61=+++++=X 代入即得:]96.1606.095.14,96.1606.095.14[⨯-⨯- 所以为:]146.15,754.14[ 12、. [0.15,0.31]; [解] 由2222221)1(ααχσχ≤-≤-S n 得: 2222)1(αχσS n -≥,22122)1(αχσ--≤S n所以σ的置信区间为:[)11()1(222αχS n -,)11()1(2212αχ--S n ] , 将12=n ,2.0=S 代入得 [15.0,31.0].第八章 假设检验一、选择题1.C 、2.B 、3.B 、4.C 、5.B 、6.B 、7.C 、8.B 二、填空题 1.100=μ 2. 1.176此文档是由网络收集并进行重新排版整理.word 可编辑版本!。
概率论与数理统计答案第六章
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解: 8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P =2628.0)]25(1[2=Φ-(2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15}=.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10}=.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i i X P 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i i X P解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i ii ii iX P XP χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλnX D ===[六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
概率论第六章
对有限总体,采用放回抽样所得到的样本为简单随 机样本。
当样本容量 n 与总体容量N 相比很小时, 可将无放 回抽样近似地看作放回抽样.(n/N<1/10)
对于无限总体,因抽取一个个体不影响它的分布, 所以总是用不放回抽样。
(X 1,X 2, ,X n)是 来 自 总 体 的 样 本 ,求 样 本 (X 1,X 2, ,X n)的 分 布 律 .
解 总体X的分布律P 为 {X x}px(1p )1 (x x 0, 1)
因 X 1 ,为 X 2 , ,X n 相互 ,且与X独 有相立 同的分 , 布
所 (X 以 1,X 2, ,X n)的分布律为
X 1 k ,X 2 k , ,X n k 独立 X k 同 且 分 与 布
E ( X 1 k ) E ( X 2 k ) E ( X n k ) k
由辛钦定理
A
k
1 n
n i 1
X
k i
P k , k
1, 2,
,
说明2
依概率收敛的序列性质知道 g为连续函数
g( A1, A2 ,, Ak ) P g(1, 2 ,, k )
10 i 1
( xi
x )2
390.0
9 10
s2
21
3. 经验分布函数(与总体分布函数F(x)相对应的统计量)
设 X 1 ,X 2 , ,X n 是 总 体 X 的 一 个 样 本 , 用 s (x ) , x 表 示 X 1 ,X 2 , ,X n 中 不 大 于 x 的 随 机 变 量 的 个 数 ,
基本概念: 个体 总体无有限限总总体体 样本 样本值 总体的分布 样本的分布
第六章 抽样
例:以某高校6000名在校大学生为总体:
抽样1:按一定方式抽取300名大学生作样本;
抽样2:按一定方式抽取10个班作样本;
分析:两种抽样方式下的抽样单位和抽样框
(四)抽样框sample frame
一次直接抽样时总体中所有元素的名单。 抽样框是抽样操作依据的名单,是和调查的总体相 对应的
究总体的操作化界定,规定了调查对象选择的具体指标。
• 目标总体和调查总体吻合度越高,调查的代表性就越好;否则会
产生覆盖误差。
(二)制定抽样框
1.抽样框是对研究总体的进一步操作。
2.抽样框的意义
(1)抽样框与研究/调查总体之间可能不匹配,可能包含研 究总体之外的某些人,或可能遗漏其中的某些人. (2) 根据样本所得到的结果,只能代表组成抽样框的各个 要素的集合 (3) 样本的大小(规模)与其能否正确代表总体比较起 来,是一项不太重要的因素。
(五)参数值——又称总体值,是关于总体中某一变量的 的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 –参数值只有对总体中每一个元素都进行调查或测量才 能得到。 (六)统计值——又称样本值,是关于样本中某一变量的 综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 –统计值是从样本中计算出来的,它是相应的参数值的 估计量。
一、简单随机抽样
(一)定义
又称纯随机抽样,是概率抽样的最基 本形式。 它是按等概率原则,直接从含有N个 元素的总体中随机抽取n个元素组成样本 (N>n)。
(二)选取样本的两种办法
1.抽签方式 (1)将总体名单从1到N编号,形成抽样框; (2)准备N张卡片,每张卡片上的号码与总体 名单编号对应,将卡片放在盒子里,混合均匀; (3)根据抽样设计的样本规模,从盒内n次取 出n张卡片; (4)根据取出的卡片上的号码,找到总体名单 上对应的元素,构成样本。
概率论与数理统计习题册.doc
第六章样本及抽样分布一、选择题1.设X1 , X 2 ,L , X n是来自总体X的简单随机样本, 则X1, X2,L , X n必然满足 ( )A. 独立但分布不同 ;B. 分布相同但不相互独立 ; C 独立同分布 ; D. 不能确定2.下列关于“统计量”的描述中,不正确的是().A.统计量为随机变量 B. 统计量是样本的函数C. 统计量表达式中不含有参数D. 估计量是统计量3 下列关于统计学“四大分布”的判断中,错误的是() .1~ F (n2 ,n1)A.若 F ~ F ( n1 , n2 ), 则FB.若 T ~ t( n),则 T 2 ~ F (1,n)C .若X ~ N ( 0,1),则X2~ x2(1)n) 2( X iD .在正态总体下i 1 2(n 1)2 ~ x4.设X i , S i2表示来自总体N ( i , i2 ) 的容量为 n i的样本均值和样本方差(i 1,2) ,且两总体相互独立,则下列不正确的是() .A. 22S12~ F (n1 1,n2 1) B.( X 1 X2) (1 2)2 2 2 2 ~ N (0,1) 1S2 1 2n1 n2C. X 1 1~ t(n1 ) D.(n 1)S2 2(n2 1) S1 / n1 2 2 2~ x21nX )25.设X1, X 2,L , X n是来自总体的样本, 则1 i ( X i 是( ).n 1A. 样本矩B. 二阶原点矩C. 二阶中心矩D. 统计量6 X1,X2,L , X n是来自正态总体N (0,1) 的样本, X , S2分别为样本均值与样本方差, 则( ).n X~ t( nA. X ~ N (0,1)B. nX ~ N (0,1)C. X i2 ~ x2 (n)D. 1)i 1 S9 9X i2 285, 则样本方差 S27. 给定一组样本观测值X1, X 2,L , X9且得X i 45,i 1 i 1的观测值为 ( ).A. 7.5B.60C. 20D.65 3 28 设X服从t (n)分布 , P{|X| } a ,则 P{ X } 为( ).A. 1a B. 2a C. 1 a D. 1 1 a2 2 29 设x1, x2,L , x n是来自正态总体N (0, 22 ) 的简单随机样本,若Y a( X 1 2X 2 ) 2 b( X 3 X 4 X 5)2 c( X 6 X 7 X 8 X 9 )2服从 x 2分布,则a, b, c 的值分别为() .A. 1,1,1B.8 12 161,1,1 C. 1,1,1 D. 1,1,120 12 16 3 3 3 2 3 410 设随机变量X和Y相互独立 , 且都服从正态分布N(0,32),设 X1,X2, , X9和9X iY1,Y2, ,Y9分别是来自两总体的简单随机样本,则统计量U i 1 服从分布是92Y ii 1( ).A. t(9)B. t (8)C. N (0,81)D. N (0,9)二、填空题1.在数理统计中,称为样本.2.我们通常所说的样本称为简单随机样本,它具有的两个特点是.3.设随机变量 X1,X2, , X n相互独立且服从相同的分布, EX , DX 2 ,令X 1 nX i ,则 EX ; DX . ni 14. (X1,X2, , X10) 是来自总体X ~ N(0,0.32) 的一个样本,则102P X i 1.44 .i 15.已知样本 X 1 , X 2 , , X 16 取自正态分布总体 N ( 2,1) ,X 为样本均值, 已知 P{ X} 0.5,则.10. 6 设总体 X ~ N(,2) , X 是样本均值, S n 2是样本方差, n 为样本容量,则常用的随2机变量 (n1)S n 服从分布 .2第七章 参数估计一、选择题1.设总体 X~N(, 2), X 1,, X n 为抽取样本,则 1 n ( X iX ) 2 是().n i 1( A) 的无偏估计 ( B)2的无偏估计(C )的矩估计(D )2的矩估计2 设 X 在 [0 , a] 上服从均匀分布, a 0 是未知参数,对于容量为 n 的样本 X 1 , , X n , a的最大似然估计为( )(A ) max{X 1,X 2,, X n }1n(B )X in i 1(C ) max{X 1,X 2, , X n } min{ X 1 , X 2 ,, X n }(D ) 11 n X i ;n i 13 设总体分布为 N ( , 2) ,,2为未知参数,则2的最大似然估计量为( ) .(A ) 1n( X i X ) 2( B ) 1n( X i X )2n i 1n 1 i 1(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 14 设总体分布为 N ( , 2) ,已知,则2的最大似然估计量为() .(A ) S2( B )n 1S 2n(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 15 X 1, X 2, X 3 设为来自总体 X 的样本,下列关于 E( X ) 的无偏估计中, 最有效的为().(A )1(X 1 X 2 )(B ) 1(X 1X 2 X 3 )23(C ) 1(X 1X 2 X 3 )(D ) 2X 12X 2 1 X 3)43336 设 X 1,X 2,, X n (n 2)是正态分布 N( ,2)的一个样本,若统计量n1K( X i 1 X i ) 2 为2的无偏估计,则K 的值应该为()i 1(A )1( B )11( C )1 2 (D )12n2n2nn 17. 设 为总体 X 的未知参数, 1 , 2 是统计量,1,2为 的置信度为 1 a(0a 1) 的置信区间,则下式中不能恒成的是() .A. P{ 12}1 aB.P{2}P{1}aC. P{2}1aD.P{2}P{1}a28设X~N( , 2)且2未知,若样本容量为 n ,且分位数均指定为“上侧分位数”时,则的 95%的置信区间为( )A. ( Xu0.025)B. ( XS t 0 .05(n1))nnC. ( XSD.( X St 0 .025 ( n1))t 0.025 (n))nn9 设 X ~ N ( ,2), ,2均未知,当样本容量为n 时,2的 95%)的置信区间为(A.(( n 1)S 2, (n 1)S 2B. ( (n 1)S 2 ( n 1)S 221) 2)2 (n , 2(n )x 0.975 ( n x 0.025 (n 1)x 0.025 1) x 0.975 1)(( n 1)S 2( n 1)S 2( XSt 0. 025 (n1)) C. 2, 2) D.nt 0. 025 (n 1) t 0.975 ( n 1)二、填空题1. 点估计常用的两种方法是:和.2. 若 X 是离散型随机变量,分布律是 P{ X x} P(x; ) ,( 是待估计参数) ,则似然函数是,X 是连续型随机变量,概率密度是f (x; ) ,则似然函数是.3. 设总体 X 的概率分布列为:X 012 3P p 2 2 p(1 -p ) p2 1- 2p 其中 p (0 p 1/ 2)是未知参数. 利用总体 X 的如下样本值:1 ,3,0,2,3,3,1,3则 p 的矩估计值为__ ___ ,极大似然估计值为.4. 设总体 X 的一个样本如下:,,,,则该样本的数学期望E(X ) 和方差 D(X ) 的矩估计值分别_ ___.5. 设总体 X 的密度函数为: f ( x) ( 1)x 0 x 10 其他,设 X 1 , , X n是X的样本,则的矩估计量为,最大似然估计量为.6. 假设总体 X ~ N( , 2),且 X 1 n X i , X1,X2, , X n 为总体 X 的一个样本,n i 1则 X 是的无偏估计 .7 设总体 X~N( , 2) , X1, X2, , X n为总体X的一个样本,则常数k=, 使nk X i X 为的无偏估计量 .i 18 从一大批电子管中随机抽取100只,抽取的电子管的平均寿命为1000小时,样本均方差为S 40 .设电子管寿命分布未知,以置信度为0.95 ,则整批电子管平均寿命的置信区间为(给定 Z0. 05 1.645 , Z0.025 1.96 ).9设总体X~N( , 2), , 2 为未知参数,则的置信度为 1-的置信区间为.10某车间生产滚珠,从长期实践可以认为滚珠的直径服从正态分布,且直径的方差为20.04 ,从某天生产的产品中随机抽取9 个,测得直径平均值为15 毫米,给定0.05则滚珠的平均直径的区间估计为. ( Z0.05 1.645 , Z 0.025 1.96)11.某车间生产滚珠,从某天生产的产品中抽取6 个,测得直径为:已知原来直径服从N ( ,0.06) ,则该天生产的滚珠直径的置信区间为,(0.05,Z0.05 1.645 , Z0.025 1.96).12.某矿地矿石含少量元素服从正态分布,现在抽样进行调查,共抽取12 个子样算得S 0.2 ,则的置信区间为(, 2 (11) 19.68 ,2 (11) 4.57 ).0.1 12 2第八章假设检验一、选择题1.关于检验的拒绝域W,置信水平, 及所谓的“小概率事件” , 下列叙述错误的是().A.的值即是对究竟多大概率才算“小”概率的量化描述B .事件 {( X1 , X 2 , , X n ) W |H0为真} 即为一个小概率事件C.设 W是样本空间的某个子集,指的是事件{( X1 , X 2 ,L , X n ) | H 0为真 }D.确定恰当的W是任何检验的本质问题2. 设总体 X~N( , 2 ), 2未知 , 通过样本X1, X2, , X n检验假设 H 0 : 0,要采用检验估计量 ( ).X 0B. X 0C.XD.XA.n S / n/ S/ n / n 3. 样本 X1, X 2, , X n来自总体 N ( ,122) ,检验 H 0 : 100 ,采用统计量( ).A. XB.X 100C.X 100D.X12 / n 12 / n S / n 1 S / n4设总体X ~ N( , 2 ), 2 未知 ,通过样本X1,X2, , X n检验假设 H 0 : 0,此问题拒绝域形式为.A. { X100 C} B. {X100 C } C. {X100 C} D. { X C}S / 10 S / n S / 105.设X1, X2, , X n为来自总体N ( ,32 ) 的样本,对于H 0 : 100 检验的拒绝域可以形如() .. { X C} { X 100 C} X 100C} { X 100 C}A B. C. {n D.S /6 、样本来自正态总体N( , 2 ) , 未知 ,要检验H0: 2 100 , 则采用统计量为( ).A. (n 1)S2B.(n 1) S2C.Xn D.nS 22 100 100 1007、设总体分布为N ( , 2),若已知,则要检验H0: 2 100 ,应采用统计量 ( ).n 2 n 2A. XB. (n 1)S2C. i 1 ( X i )D.i 1( Xi X ) S / n 2 100 100二、填空题1.为了校正试用的普通天平 , 把在该天平上称量为 100 克的 10 个试样在计量标准天平上进行称量 , 得如下结果 :, , , 101,2,,假设在天平上称量的结果服从正态分布, 为检验普通天平与标准天平有无显著差异, H0 为.2.设样本X1, X2, , X25来自总体 N( ,9), 未知.对于检验 H 0 : 0,H1: 0,取拒绝域形如X 0 k ,若取a 0.05,则 k 值为.第六章样本及抽样分布答案一、选择题1. ( C )2. ( C ) 注:统计量是指不含有任何未知参数的样本的函数3. ( D )对于答案 D, 由于 X i~ N (0,1), 1,2, , n ,且相互独立,根据 2 分布的定义有i Ln ) 2( X i2i 1(n)2~ x4.(C)注:X 11~ t (n 1 1) 才是正确的 .S 1 / n 15.(D)6C) 注: X ~ N(0,1),X ~ t(n 1)才是正确的 nS nP X 12 1 2PX 12 1 12PX1225 12512(5)1299222X i XX 9 Xi 2859 257.(A)S 2 i 11i 19 17.5 988.(A) 9.(B)解:由题意可知X 1 2X 2 ~ N(0,20) , X 3X 4 X 5 ~ N (0,12) ,X 6 X 7 X 8X 9 ~ N (0,16) ,且相互独立,因此222X 1 2X 2X 3 X 4 X 5X 6 X 7X 8 X 9 ~ 23,201216即 a1, b1, c120121610(A)999解:X i ~ N (0,9 2 )X i 9 ~ N 0,1 , Y i 2 9 ~29i 1i 1i 19X i 9由 t 分布的定义有i 1~t 992Y i 81i 1二、填空题1.与总体同分布,且相互独立的一组随机变量 2. 代表性和独立性 23.,n4. 0.16.2( n 1)第七章 参数估计一、选择题1. 答案: D.222?21 n2?1 n[ 解 ] 因为E(X )A 2X i,E (X) ,E(X )X i ,E( X ) A 1n i 1n i 1所以, ? 2?2?2( X )1n2.E( X) E( X i X )n i 12. 答案: A.[ 解 ] 因为似然函数 11 ,当 amax X i 时, L(a) 最大,L(a)(max X i ) n a nii所以, a 的最大似然估计为max{ X 1 , X 2 , , X n } .3答案A.n[ 解] 似然函数 L( ,2)i 11 exp 12 ( xi) 2 ,22由ln L 0, 2 ln L 0 ,得2A 2 .4. 答案 C.[ 解]在上面第 5题中用取代 X 即可.5答案 B.6. 答案 C. 7 答案 D. 8. 答案 D.9. 答案 B.二、填空题:1. 矩估计和最大似然估计;2.p(x i ; ) ,f ( x i ; );i i.31 , ; 4816/82,令 E(X)[ 解 ] ( 1) p 的矩估计值 X X i 3 4 pX ,i 1得 p的矩估计为p (3 X ) / 4 1/ 4 .?( 2)似然函数为8x i ) P( X 0)[ P( X 1)] 2P( X 2)[ P( X 3)] 4L( p)P( Xi 14 p(1 p) 2 (1 2 p)4ln L( p) ln 46ln p 2 ln(1 p) 4 ln(1 2 p)令 [ ln L ( p)]6 1 2 1 8 0 ,12 p 2 14 p 3 0pp2 pp (7 13) /12 . 由 0 p1/ 2 ,故 p (713) /12 舍去所以 p的极大似然估计值为 p (713) /120.2828 .?4、 ,;?? 2iX i 222[ 解 ]由矩估计有:),又因为 D(X) E( X ) [E(X)],E(X ) X,E(Xn?X 1.7 1.75 1.71.65 1.75 1.71所以 E(X)5?1n2( X iX )0.00138 .且D(X)n i 1n2X 1, n ln X i5、?? i 1 ;1 X n ln Xii 1[ 解 ] ( 1)的矩估计为:11 2 11E(X ) x ( 1) x d x x2 0 2样本的一阶原点矩为:1 nx i Xn i 1所以有:1 X ? 2X 12 1 X( 2)的最大似然估计为:n nL ( X 1 , , X n; ) ( 1) X i ( 1) n ( X i )i 1 i 1nln L n ln( 1) ln X ii 1d ln L n nln X i 0d 1 i 1n得:? n ln X ii 1.nln X ii 16、;[ 解] E(X) 1 nE( X i ) n .nn i 17、;2n(n1)[ 解] 注意到X1, X2, , X n的相互独立性,X i1X1 X2 (n 1) X i X n Xnn 1E( X i X ) 0, D ( X i 2X )n所以, X i X ~ N (0, n1 2),nz21n 1 22E(| X i X |) | z | e n dzn 12nz21 n 12 2 n 12 z e 2 dzn0 n 1 22nn nkn 2n 1因为: E k | X i X | k E | X i X |i 1 i 1 2 n所以, k2n( n 1).8、. [ , ] ;[ 解 ] 这是分布未知,样本容量较大,均值的区间估计,所以有:X 1000, S 40, 0.05 , Z 0.025 1.96 的 95%的置信区间是:[ X SZ0.025 , X S Z0.025 ] [ 992.16,1007.84] . n n9、(X St (n 1), XSt (n 1)) ;n 2 n 2[ 解 ] 这是 2 为未知的情形,所以X ~ t(n 1) .S / n10、 [ , ] ;[ 解 ] 这是方差已知均值的区间估计,所以区间为:[ x Z , xn Z ]n 2 2 由题意得: x 15 2 0.04 0.05 n 9 ,代入计算可得:[15 0.2 1.96,15 0.2 1.96] ,化间得:[14.869,15.131] .9 911、 [ ,];[ 解 ]这是方差已知,均值的区间估计,所以有:置信区间为: [ Xn Z , XnZ ]2 2由题得: X 1 (14.6 15.1 14.9 14.8 15.2 15.1) 14.95 60.05 Z0.025 1.96 n 6代入即得: [14.95 0.06 1.96,14.95 0.06 1.96]6 6所以为: [14.754,15.146]12、.[,];[ 解 ] 由2(n 1)S 2 2 得:1 22 22 (n 1) S2, 2(n 1)S22 2212所以的置信区间为: [ (n 1) S2,(n 1)S22 (11) 2] ,(11)212将 n 12 , S 0.2 代入得[ 0.15 , 0.31 ]. 第八章假设检验一、选择题、、、、、、、二、填空题1.1002.。
概率论与数理统计总结之第六章
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。
第六章样本及抽样分布例题
Xi
)2
+
16 (∑ i=13
Xi
)2
,问 c 取何值时,cY 服从 χ2 分布.
).
A. N (0, 1)B. Biblioteka (µ,C. χ2 (19)
D. χ2 (20)
n 1∑ 5. 设 总 体 X ∼ N (µ, σ 2 ), X1 , X2 , · · · , Xn 为 其 样 本,记 X = Xi , S 2 = n i=1 √ n 1 ∑ n(X − µ) 2 (Xi − X ) ,则 Y = 服从的分布是 ( ). n − 1 i=1 S
).
2. 设 随 机 变 量 X 和 Y 独 立 且 都 服 从 正 态 分 布 N (0, 32 ),而 X1 , X2 , · · · , X9 和 X1 + X2 + · · · + X9 Y1 , Y2 , · · · , Y9 分别来自总体 X 和 Y 的样本,则统计量 U = √ 2 Y1 + Y22 + · · · + Y92 服从 分布,参数为 . 三、解答题 1. 设 X1 , X2 , · · · , X16 是来自正态总体 N (0, 1) 的样本,记 Y =
学院
专业
班级
姓名
学号
概率论与数理统计练习题
2014 -2015学年第二学期
第六章 样本及抽样分布
一、选择题 1. X1 , X2 , X3 是取自总体 X 的样本,a 是一未知参数,则统计量是 ( ). 3 1∑ (Xi − a)2 A. X1 + aX2 B. X1 X3 C. aX1 X2 X3 D. 3 i=1 2. X1 , X2 , · · · , Xn 是取自总体 X 的样本,则 A. 样本矩 B. 二阶原点矩
浙江大学《概率论与数理统计》(第4版)【名校笔记+课后习题+考研真题】第6章 样本及抽样分布【圣才出
十万种考研考证电子书、题库视频学习平台
第 6 章 样本及抽样分布
6.1 复习笔记
一、抽样分布 1.样本统计量 (1)常用的统计量(见表 6-1-1)
表 6-1-1 常用统计量
2.经验分布函数 设 x1,x2,…, xn 是总体 F 的一个容量为 n 的样本值,将 x1,x2,…,xn 按从小到大的
1
4 / 5 4 / 5
0.2628
(2)记 M=max{X1,X2,X3,X4,X5},因 Xi X i 的分布函数为Φ((x-12)/2),则
M 的分布函数为
FM(m)=[Φ((m-12)/2)]5
因而
P{max{X1,X2,X3,X4,X5}>15}=P{M>15}=1-P{M≤15}=1-FM(15)=1-[Φ ((15-12)/2)]5=0.2923
①定理一
设 X1,X2,…,Xn 是来自正态总体 N (, 2 ) 的样本,其样本均值和样本方差为
X
1 n
n i 1
Xi,S2
1 n 1
n i 1
Xi X
2
a.
(n 1)S 2 2
~
2 (n 1)
b. X ~ N (, 2 ) n
c. X 与 S2 相互独立。
③定理二
设 X1,X2,…,Xn 是来自正态总体 N (, 2 ) 的样本, X ,S2 分别是该样本的均值和
且两者是相互独立,因此
X1 X 2 X3 ~ N 0,1 , X 4 X5 X 6 ~ N 0,1
3
3
又两者相互独立,按χ2 分布的定义
(X1+X2+X3)2/3+(X4+X5+X6)2/3~χ2(2)
即 1/3Y~χ2(2),因此所求常数 C=1/3。
概率论与数理统计6.第六章:样本及抽样分布
),
,
,
,
是来
Z=
(
-
证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§1 随机样本
X 的分布函数和数字特征就称为总体的分布 函数和数字特征. 今后将不区分总体与相应的随机 变量.
例如,我们检验自生产线出来的零件是次品还
是正品,以0表示产品是正品,以1表示产品为次品. 设出现次品的频率为 p(常数),那么总体是由一 些“0”和一些“1”所组成,这一总体对应于一个具有 参数为p的(0-1)分布:
由于每个个体的出现是随机的,所以相应的数量 指标的出现也带有随机性 . 从而可以把这种数量指 标看作一个随机变量X ,因此随机变量X的分布就 是该数量指标在总体中的分布.
总体就可以用一个随机变量及其分布来描述.
因此在理论上可以把总体与概率分布等同起来.
§1 随机样本
例如:研究某批灯泡的寿命时,关心的数量指标 就是寿命,那么,此总体就可以用随机变量X表示, 或用其分布函数F(x)表示.
n
f
(
xi
)
ne
n
i 1
xi
,
i 1
0,
xi 0, 其他.
§1 随机样本
例8 设总体 X 服从两点分布B(1, p),其中0 p 1, ( X1, X2, , Xn )是来自总体的样本, 求样本 ( X1, X2 , , Xn ) 的分布律. 解 总体 X 的分布律为
P{ X i} pi (1 p)1i (i 0, 1)
Байду номын сангаас
§1 随机样本 二、随机样本的定义
1.样本的定义
设 X 是具有分布函数 F 的随机变量, 若 X1, X 2 , , Xn 是具有同一分布函数F、相互独立的 随机变量, 则称 X1, X2 , , Xn 为从分布函数 F (或总体 F、或总体 X ) 得到的容量为 n 的简单 随机样本 , 简称样本 .
总体
寿命 X 可用一概率 (指数)分布来刻划
某批 灯泡的寿命
寿命总体是指数分布总体
鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .
§1 随机样本
类似地,在研究某地区中学生的营养状况时 , 若关心的数量指标是身高和体重,我们用X 和Y 分 别表示身高和体重,那么此总体就可用二维随机变 量(X,Y)或其联合分布函数 F(x,y)来表示.
概率论与数理分析
第六章 样本及抽样分布
§1 随机样本 §2 直线图和箱线图 §3 抽样分布
§1 随机样本
引言
随机变量及其所伴随的概率分布全面描述了随机 现象的统计性规律。
概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都 是在这已知是基础上得出来的。
但实际中,情况往往并非如此,一个随机现象所 服从的分布可能是完全不知道的,或者知道其分布概 型,但是其中的某些参数是未知的。
例2 某工厂10月份生产的灯泡寿命所组成的总 体中, 个体的总数就是10月份生产的灯泡数, 这是 个有限总体; 而该工厂生产的所有灯泡寿命所组成 的总体是一个无限总体, 它包括以往生产和今后生 产的灯泡寿命.
§1 随机样本
例3 在考察某大学一年级男生的身高这一试 试验中,若一年级男生共2 000人,每个男生的身高 是一个可能观察值,所形成的总体中共含2 000个 可能观察值,是一个有限总体.
( X1, X2, , Xn ) 是来自总体的样本, 求样本
( X1, X2, , Xn ) 的概率密度.
解 总体 X 的概率密度为
ex ,
f (x)
0,
x 0, x 0,
因为 X1, X2, , Xn 相互独立, 且与X 有相同的分布,
所以 ( X1, X2, , Xn )的概率密度为
fn( x1, x2 , , xn )
它们的观察值 x1, x2, , xn 称为样本值, 又称 为X 的 n 个独立的观察值.
§1 随机样本
2. 简单随机抽样的定义
获得简单随机样本的抽样方法称为简单随机抽样.
若X1, X2, , Xn为F 的一个样本, 则X1,X2, ,
X n相互独立,且 它 们 的 分 布 函 数 都 是 F,所以
§1 随机样本
例如:
某公路上行驶车辆的速度服从什么分布是未知的;
电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p是 未知的;
数理统计的任务则是以概率论为基础,根据试验 所得到的数据,对研究对象的客观统计规律性做出合 理的推断。
§1 随机样本 一、总体与个体
1.总体
P{X x} px(1 p)1 x, x 0,1
的随机变量.
§1 随机样本
在数理统计中,人们都是通过从总体中抽取 一部分个体, 根据获得的数据来对总体分布得出 判断的. 被抽出的部分个体叫做总体的一个样本.
所谓从总体抽取一个个体, 就是对总体X 进行 一次观察并记录其结果.
当n次观察一经完成,我们就得到一组实数 x1, x2 , , xn , 它们依次是随机变量X1, X 2 , , X n 的观察值,称为样本值 .
( X1,
X 2,
,
X
n
)
的
分
布
函
数
为 n
F *( x1, x2, , xn ) F ( xi ).
i 1
又若X具有概率密度 f, 则( X1, X2, , Xn ) 的
概率密度为 n
f *( x1, x2, , xn ) f ( xi ).
i 1
§1 随机样本
例7 设总体 X 服从参数为 ( 0) 的指数分布,
试验的全部可能的观察值称为总体.
2.个体
总体中的每个可能观察值称为个体.
例1 在研究2 000名学生的年 龄时,这些学生的年龄的全体 就构成一个总体,每个学生的 年龄就是个体.
§1 随机样本
3.容量
总体中所包含的个体的个数称为总体的容量.
4.有限总体和无限总体
容量为有限的称为有限总体. 容量为无限的称为无限总体.
例4 考察某一湖泊中某种鱼的含汞量, 所得 总体也是有限总体.
§1 随机样本
有些有限总体,它的容量很大, 我们可以认为 它是一个无限总体.
例5 考察全国正在使用的某种型号灯泡的寿 命所形成的总体, 由于可能观察值的个数很多,就 可以认为是无限总体.
§1 随机样本
5. 总体分布
我们关心的是总体中的个体的某项指标(如人的 身高、灯泡的寿命,汽车的耗油量…) .