[高等教育]第5章数理统计的基本知识
第五节数理统计的基础知识
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0-1)分布,但其中的参数p未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。
数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。
数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料。
二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量.容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系.在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X。
例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。
第五章《概率论与数理统计教程》课件
试决定常数 3.
X ,Y
C
使得随机变量 cY 服从分布
2
分布。
相互独立,都与 N ( 0 , 9 ) 有相同分布, X 分别是来自总体
X ,Y
1
, X 2 , , X 9和
Y1 ,Y 2 , ,Y 9
的样本,
Z
9
X
i
i1
6 - 23
Y
i1
9
则Z 服从—— ,自由度为——。
2 i
4.
X1, X 2, X 3, X 4
是来自总体
X ~ N ( , )
2
的样本,则随机变
量 Y
X3 X4
服从——分布,其自由度为———。
2
(X i )
i1
2
5.
设
X 1 , X 2 , , X 10
是来自总体 X
~ N ( ,4 )
2
的样本, ( S 2 P
a ) 0 .1
一. 单个正态总体的统计量的分布
X 1 , X 2 , X n是来自正态总体 ~ N ( , 2 )的样本, X
X , S 分别是样本均值和样本 方差
2
定理1
X
n
1
n
X i ~ N ( ,
n
2
);
i1
定理2 U
1
X
/
~ N ( 0 ,1 );
n
定理3
6 - 18
定理7
当 1
2
2 2
2 2 时, 令 S w
( n1 1) S 1 ( n 2 1) S 2
2
概率论与数理统计 第5章
n
n
性质2.(分布可加性):若X~2(n1),Y~2(n2),X与 Y独立,则
X + Y~2(n1+n2 )
3、2分布表及有关计算
(1)构成 P{2(n)>λ}=α,已知n, α可查表求得λ; (2)有关计算P 2 (n) 2 (n) 称为上侧α分位数
例5.1 设 X ~ N ( , 2 ) (X1,X2,…,Xn)为X的一个样本,
求(X1,X2,…,Xn)的密度。 解 (X1,X2,…,Xn)为X的一个样本,故
X i ~ N ( , 2 )
n
i 1,2,, n
f ( x1 , x2 ,, xn ) f ( xi )
16 2
解
i 1,2,,16
2 1 16 2 2 P ( X i ) P 8 2 (16) 16 2 16 i 1
2—分布的密度函数f(y)曲线
n/2 1 f ( y) 2 ( n / 2) y 0,
n y 1 2 2
e , y0 y0
2 例5.4 X ~ N ( , ) (X1,X2,X3)为X的一个样本
X 1 X 2 X 3 的分布。 求
(n)为整体记号
2
2 (n) 2 2 查表得 0 ( 25 ) 34 . 382 10) 18.307 .1 0.05 (
1 当n充分大时,近似有 (n ) (u 2n - 1) 2 2
2
练习1. P(2(n)<s)=1-p ∵P(2(n) < s)=1- P(2(n) s )=1-p ∴ P(2(n) s )=p 2 s p (n) 练习2. P(2(11)>s)=0.05,求s
概率论与数理统计(王明慈第二版)第5章数理统计的基本知识4-5
2
t 分布的概率密度函数图形如图所示
①关于x =0 对称; ②当k充分大时,其图形
k 30 k 3
与标准正态分布图形相似.
k 1
lim
k
ft ( x)
( x)
1
x2
e 2 ,xR
2π
t(30) N(0,1)
4/4/2020
13
例3. 设总体X和Y相互独立 ,且都服从 N (0,9),
X1, X 2 , , X 9和Y1,Y2 , ,Y9来自总体 X ,Y的样本,
自由度k:指χ 2
X
2 1
X
2中包含独立
k
变
量的个数.
特别地,当k=1时,若X1 ~ N (0,1),则X12 ~ (2 1)
4/4/2020
2
其概率密度函数:
1
k 1 x
f
2
(
x)
2
k 2
(
k 2
)
x
2
e 2 , x 0;
0,
x 0.
其图形随着参数k的变化而改变,如图所示
k2
k 6
k 1
26
第五节 正态总体统计量的分布
基本内容: 一、抽样分布——统计量的分布; 二、正态总体下的抽样分布
4/4/2020
27
一、统计量的分布
统计量是对样本信息的“加 它依赖于样本,
工”, 由于样本是随机变量,
所以统计量也是随机变量,
故统计量有一定的概率分布.
我们称统计量的分布为抽样分布.
4/4/2020
在这样的背景下,十九世纪初英国一位年经
酿酒化学技师Gosset W S,他在酒厂从事试验和
《概率论与数理统计》习题第五章数理统计的基本概念
第五章 数理统计的基本概念一. 填空题1. 设X 1, X 2, …, X n 为来自总体N(0, 2), 且随机变量)1(~)(221χ∑==ni iX C Y , 则常数C=___.解.∑=ni iX1~ N(0, n 2),)1,0(~1N n Xni iσ∑=所以21,1σσn c n c ==.2. 设X 1, X 2, X 3, X 4来自正态总体N(0, 22)的样本, 且243221)43()2(X X b X X a Y -+-=,则a = ______, b = ______时, Y 服从2分布, 自由度为______. 解. X 1-2X 2~N(0, 20), 3X 3-4X 4~N(0, 100))1,0(~20221N X X -, )1,0(~1004343N X X -201,201==a a ; 1001,1001==b b . Y 为自由度2的2分布.3. 设X 1, X 2, …, X n 来自总体2(n)的分布,则._____)(______,)(==X D X E解. 因为X 1, X 2, …, X n 来自总体2(n), 所以E(X i ) = n, D(X i ) = 2n (i = 1, 2, …, n),)(n X E = 22)()(221=⋅==∑=nnn nX D X D ni i二. 单项选择题1. 设X 1, X 2, …, X n 为来自总体N(0, 2)的样本,则样本二阶原点矩∑==n i i X n A 1221的方差为 (A)2 (B) n 2σ (C) n 42σ (D) n4σ 解. X 1, X 2, …, X n 来自总体N(0, 2), 所以,1)(),1(~)(222=σχσiiX E X 2)(2=σiX Dnn nn X D nX D A D ni ini i4242214212222))(()()(σσσσ=⋅===∑∑==. (C)是答案.2. 设X 1, X 2为来自正态总体N(,2)的样本, 则X 1 + X 2与X 1-X 2必 (A) 线性相关 (B) 不相关 (C) 相关但非线性相关 (D) 不独立 解. 假设 Y 1 = X 1 + X 2, Y 2 = X 1-X 2 所以 E(Y 2) = E(X 1)-E(X 2) = 0.cov(Y 1, Y 2) = E(Y 1Y 2)-E(Y 1)E(Y 2) = E(0)()()22212221=-=-X E X E X X . (B)是答案.3. 设X 服从正态分布N(0, 22), 而X 1, X 2, …, X 15为来自总体X 的简单随机样本, 则随机变量)(221521121021X X X X Y ++=所服从的分布为 (A) 2(15) (B) t(14) (C) F(10, 5) (D) F(1, 1)解.)10(~4221021χX X +, )5(~42215211χX X + 所以 )5,10(~204021521121021F X X X X ++++ , 即 )5,10(~)(221521121021F X X X X Y ++= (C)是答案.三. 计算题1. 设X 1, X 2, …, X 10为总体N(0, 0.32)的一个样本,求∑=>1012)44.1(i iXP .解. 因为X 1, X 2, …, X 10为总体N(0, 0.32)的一个样本, 所以)10(~3.0101222∑=i i X χ ()44.1(1012P X P i i=>∑=1.0)16)10(()09.044.13.0101222=>=>∑=i i P X χ 2. 从一正态总体中抽取容量为10的一个样本, 若有2的样本均值与总体均值之差的绝对值在4以上, 试求总体的标准差. 解. 因为总体X 服从N(,2),所以)1,0(~10/N X σμ-. 由02.0)4|(|=>-μX P 知 02.0)104|10/(|=>-σσμX P即 99.0)104(,01.0)104(=Φ=-Φσσ查表得.43.533.2104,33.2104===σσ3. 设总体X ~N(72, 100), 为使样本均值大于70的概率不小于0.95 , 问样本容量至少应取多大?解. 假设样本容量为n, 则)1,0(~1072),100,72(~N nX nN X -由 95.0)70(≥>X P 得P(n X 1072->95.0)107270≥-n 所以 0625.68,65.15,95.0)5(≥≥≤Φn nn.4. 设总体X 服从N(, 4), 样本(X 1, X 2, …, X n )来自X, X 为样本均值. 问样本容量至少应取多大才能使i. 1.0)|(|2≤-μX E ii. 95.0)1.0|(|2≥≤-μX P解. i. 1.04)(1)()|(|2≤===-nX D n X D X E μ 所以 n ≥ 40. ii. )1,0(~2),4,(~N nX nN X μμ-. 所以 P X P =≤-)1.0|(|μ(95.0)21.0|2|≥≤-nnX μ975.0)201(≥Φn , 查表得 ,96.1201≥n n ≥ 1537 5. 设∑==ni i X n X 11, 证明:i.∑=-ni iX12)(μ=∑=---ni i X n X X 122)()(μ;ii.∑∑==-=-ni ni i iX n X X X12122)()(.解. i.=-∑=ni iX12)(μ∑=-+-ni iX X X12)(μ=2)(12+-∑=ni iX X∑=+--ni i X X X 1))((μ∑=-ni X 12)(μ=2)(12+-∑=ni iX X∑=+--ni i X n X X 1))((μ2)(μ-X n=∑=---ni iX n X X122)()(μii.=-∑=ni i X X 12)(21121222)2(X n X X X X X X X ni i ni ini i i+-=+-∑∑∑====22122X n X n Xni i+-∑==212)(X n X ni i ∑=-。
第五章 数理统计的基本概念
线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)E
最小方差线性无偏估计量
定义:如果总体参数的 点估计 满足 ( 1 ) 是样本的线性函数; (2)对 的一切线性无偏估计量 0,D D 0
定理 (R-C不等式)
设总体X具有分布密度f ( x; )。抽取样本( x1 ,..., xn ), 设g ( )为 的一个可估函数,T T ( x1 ,..., xn )为g ( ) 的一个无偏估计量,且 满足正则条件
• 若12, 22已知
(X Y) ( 1 2 ) U ~ N (0,1)
2 1
n
2 2
m
• 若12, 22未知,但是12= 22
T (X Y) ( 1 2 ) ~ t (m n 2)
12
m
2 2
n
mS12
12
2 nS2 2 2
T
(X Y) (1 2 ) 1 1 2 mS12 nS2 /(m n 2) m n
~ t (m n 2)
推论:设( X 1 ,..., X n )和(Y1 ,..., Ym )分别为来自
2 2 正态总体N ( 1 , 1 )和N ( 2 , 2 )的两个相互
独立的样本,则随机变量
F
2 若 1 2 2
2 2 Sm / 1 2 Sn 2 / 2
~ F (m 1, n 1)
F
2 Sm 2 Sn
~ F (m 1, n 1)
第六章 参数估计
第一节 点估计
• 定义:设为总体分布中的未知参数,从X 中抽取样本 (x1,…,xn) ,构造适当的统计量 (x1,…,xn), 估计 (以的值作为的近似), 这种方法称为参数的点估计。 • 统计量称为的点估计量; • 对于一组样本观测值 (x1,…,xn) ,该统计量 相应的值(x1,…,xn)称为的点估计值 • 的点估计量和点估计值简称为的点估计。
概率论与数理统计第5章
X
1 n
n i 1
Xi
样本方差(sample variance)
S2 1 n n1i1
2
Xi X
整理课件
几个常用的统计量
设 (X1,X2, ,Xn)是总体 X 的一个样本,
样本均方差或标准差
1 n
2
S n1i1 Xi X
它们的观测值用相应的小写字母表示.反映总 体X取值的平均,或反映总体X取值的离散程度。
Sj XjW 1j Xj Xj1Xj Wj
频率直方图中的小矩形的面积近似地反映了样本数
据落在某个区间内的可能性大小,故它可近似描述X的分
布状况。
整理课件
第二.计算样本特征数
1.反映集中趋势的特征数:样本均值、中位数、众数等 样本均值MEAN 中位数MEDIAN 众数
X 90.3
91
91, 94
40≤n≤60
6≤k≤8
60≤n≤100
8≤k≤10
100≤n≤500
10≤k≤20
整理课件
数据分组数参考表
数 40 10 15 20 40 60 80 10 15 20 50 10
据 ~6 0 0 0 0 0 0 00 00 00 00 00
数0
0
分 6~ 7~ 10 16 20 24 27 30 35 39 56 74
整理课件
简单随机抽样
例如:要通过随机抽样了解一批产品的次品率, 如果每次抽取一件产品观测后放回原来的总量中,则 这是一个简单随机抽样。
但实际抽样中,往往是不再放回产品,则这不是一个 简单随机抽样。但当总量N很大时,可近似看成是简单 随机抽样。
整理课件
统计量
定义 设( X1,X2, ,Xn)为总体X的一个样本, f(X1,X2, ,Xn)为不含任何未知参数的连续函数,则 称 f(X1,X2, ,Xn)为样本( X1,X2, ,Xn)的一个统计量。
概率论数理统计基础知识第五章
C
]
(A)Y ~ 2 (n). (B)Y ~ 2 (n 1). (C)Y ~ F (n,1). (D)Y ~ F (1, n).
【例】设 随机变量X和Y都服从标准正态分布,则[ C ]
(A)X+Y服从正态分布.
2 2 2
(B)X2 +Y2服从 2分布. Y
2
2 X (C)X 和Y 都服从 分布. (D)
(X ) ~ t ( n 1) S n
客、考点 10,正态总体的抽样分布
33/33
34/33
35/33
【例】设总体 X ~ N (0,1),X 1 , X 2 , X1 X 2
2 2 X3 X4
, X n 是简单随机
2 X i. i 4 n
样本 , 试问下列统计量服从什么分布? (1 ) ; (2 ) n 1X1
记:F分布是两个卡方分布的商
2. F 分布的上侧分位数
设 F ~ F (k1 , k2 ) ,对于给定的 a (0,1) ,称满足条件
P{F Fa (k1 , k2 )}
Fa ( k1 ,k2 )
f F ( x)dx a
的数 Fa (k1 , k2 ) 为F 分布的上侧a 分位数。
服从F分布.
§5.5 正态总体统计量的分布
一、单个正态总体情形 总体
X ~ N ( , 2 ) ,样本 X1 , X 2 , , Xn ,
1 n 样本均值 X X i n i 1
n 1 2 样本方差 S 2 ( X X ) i n 1 i 1
1. 定理1 若设总体X~N(μ,σ2), 则统计量
有一约束条件
(X
i 1
课程释疑5 第五章 数理统计基本概念
三大分布的作用是什么? 问6.3 三大分布的作用是什么? 分布, 分布, 分布都是从正态总体中衍生出 答:χ 2分布,t分布,F分布都是从正态总体中衍生出 来的, 来的 , 几种常用的统计量的分布都与这三大分布有关 , 所以这三大分布在正态总体的统计推断中起着重要 的作用。 的作用。
a) 问题中涉及的研究对象为数很大,只能抽取部分 ) 问题中涉及的研究对象为数很大, 样品加以研究, 如测定10000支灯管的寿命 , 只能抽取 支灯管的寿命, 样品加以研究 , 如测定 支灯管的寿命 其中100支进行测试( 测试结束 ,这100支灯管就失去了 支进行测试(测试结束, 其中 支进行测试 支灯管就失去了 使用价值) 而这100支灯管的抽取是带随机性的。 支灯管的抽取是带随机性的。 使用价值),而这 支灯管的抽取是带随机性的 b) 数据的随机性来源于测量误差或者试验的随机误 ) 如考察产品的质量,温度和压力是重要因素。 差,如考察产品的质量,温度和压力是重要因素。但当 温度和压力取为定值时, 温度和压力取为定值时,质量仍因大量其他因素的影响 如原材料的差异, ,如原材料的差异,使用的设备和操作人员的经验差异 等而有一定的波动,试验结果仍包含有随机误差。 等而有一定的波动,试验结果仍包含有随机误差。
3) “ 有效地使用随机数据 ” 的含义即将抽得的随机数 ) 有效地使用随机数据” 据用有效的方式去集中,提取与研究问题有关的信息, 据用有效的方式去集中,提取与研究问题有关的信息,
并利用它对提出问题作出一定的结论,这种结论称为“ 并利用它对提出问题作出一定的结论 这种结论称为“ 这种结论称为 统计推断” 但统计推断并不是绝对精确和可靠的, 统计推断 ” 。 但统计推断并不是绝对精确和可靠的 , 这正是数据随机化带来的影响,然而推断应尽可能的 这正是数据随机化带来的影响, 可靠” 本教材中讨论的“点估计, “ 可靠 ” 。 本教材中讨论的 “ 点估计 , 区间估计和假 设检验”正是统计推断中的重要内容。显著性水平, 设检验 ” 正是统计推断中的重要内容 。 显著性水平 , 置信水平等相应的概率大小正反映这些统计推断方法 可靠性”的大小。 统计推断” 的 “ 可靠性 ” 的大小 。 “ 统计推断 ” 中有许多统计方 法来源于实践中产生的“统计思想”, 如 “ 极大似然 法来源于实践中产生的“ 统计思想” 矩法” 它有一定的合理性,但又不是“ 法 ” , “ 矩法 ” 等 , 它有一定的合理性 , 但又不是 “ 绝对精确” 绝对精确”。
题解第5章数理统计基本概念
习题1. 为了解2010年云南省某师范学院新生的每月消费情况,调查了该校50名新生。
试问:(1)研究的总体是什么?(2)研究的样本是什么?(3)样本容量是多少?解 (1)总体为该师范学院所有新生的每月消费。
(2)样本为50名该师范学院新生的每月消费。
(3)样本容量为50。
2. 某厂生产的灯泡使用寿命X 服从参数为λ的指数分布,为了研究其平均寿命,从中抽取一个样本容量为n 的样本12(,)n X X X ,试写出该样本的密度函数。
解 因为总体的密度函数为()0,0x 0.x e x f x λλ-⎧>=⎨≤⎩,,所以,样本12(,)n X X X 的密度函数为()112121,0,,()0ni i x nn n i i e x x x f x x x f x λλ=-=⎧∑⎪>==⎨⎪⎩∏ , , 其余.3. 设某厂大量生产某种产品,其次品率p 未知,每m 件产品包装为一盒,为了检查产品的质量,任意抽取n 盒,查其中的次品数,试在这个统计问题中说明什么是总体,样本以及它们的分布。
解 总体X 表示一盒产品中的产次品数,X 服从参数是(),m p 的二项分布。
这是由于产品的批量很大,次品率为p ,从大批产品中取m 件,可以认为每件产品的取出是相互独立的,从而次品数服从二项分布。
样本1(,,)n X X 表示所抽取的n 盒产品中的次品数。
由样本的独立性与代表性得1(,,)n X X 的联合分布列为11(,...,)n n P X x X x ===11()P X x =…()n n P X x == 111(1)(1)n n n x x m x xxm x m m C p p C p p ----=1[(1)]ii i nx x m x mi Cp p -=-∏.4. 从总体ξ中抽取了一个容量为5的样本,样本值为(5,3,1,2,0)--,试求ξ的经验分布函数。
解 经验分布函数为()0,3,1,31,52,10,53,02,54,25,51, 5.n x x x F x x x x <-⎧⎪-≤<-⎪⎪-≤<⎪⎪=⎨≤<⎪⎪⎪≤<⎪≥⎪⎩5. 研究某地区小学五年级男生身高的分布,抽取了100名男生进行测量。
数理统计基本概
第五章 样本及抽样分布从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节 数理统计的基本概念内容分布图示★ 引言 ★ 总体与总体分布 ★ 样本与样本分布 ★ 例1★ 例2 ★ 例3 ★ 例4★ 统计推断问题简述★ 分组数据统计表和频率直方图 ★ 例5 ★ 经验分布函数 ★ 例6★ 统计量 ★ 样本的数字特征★ 例7 ★ 例8 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题5-1 ★ 返回内容要点:一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义 统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x Λ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X Λ,一旦具体取定一组样本,便得到样本的一次具体的观察值),,,(21n x x x Λ,称其为样本值.全体样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: n X X X ,,,21Λ与所考察的总体具有相同的分布;2. 独立性: n X X X ,,,21Λ是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21Λ表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X Λ的联合分布函数为∏==ni i n x F x x x F 121)(),,,(Λ并称其为样本分布.特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为∏==ni i n x f x x x f 121)(),,,(Λ分别称)(x f 与),,,(21n x x x f Λ为总体密度与样本密度.若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为,)(},,,{),,,(12121∏======ni i n n x p x X x X x X p x x x p ΛΛ分别称)(i x p 与),,,(21n x x x p Λ为离散总体密度与离散样本密度.三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21Λ对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图 通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下: 设n x x x ,,,21Λ是样本的n 个观察值.(i) 求出n x x x ,,,21Λ中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm 在101左右): mab t m i t t t i i -=∆=∆+,,,2,1),,[Λ, 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn ∆=,以及),,2,1(,n i tfh i i Λ=∆=(iv) 在),[t t t i i ∆+上以i h 为高,t ∆为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。
概率论与数理统计(理工类.第四版)吴赣昌主编答案5,6,7,8章
第五章数理统计的基础知识5.1 数理统计的基本概念习题一已知总体X服从[0,λ]上的均匀分布(λ未知),X1,X2,⋯,Xn为X的样本,则().(A)1n∑i=1nXi-λ2是一个统计量;(B)1n∑i=1nXi-E(X)是一个统计量;(C)X1+X2是一个统计量;(D)1n∑i=1nXi2-D(X)是一个统计量.解答:应选(C).由统计量的定义:样本的任一不含总体分布未知参数的函数称为该样本的统计量.(A)(B)(D)中均含未知参数.习题2观察一个连续型随机变量,抽到100株“豫农一号”玉米的穗位(单位:cm),得到如下表中所列的数据. 按区间[70,80),[80,90),⋯,[150,160),将100个数据分成9个组,列出分组数据计表(包括频率和累积频率),并画出频率累积的直方图.解答:分组数据统计表X¯=1n∑i=1nXi与Sn2=1n∑i=1n(Xi-X¯)2分别表示样本均值和样本二阶中心矩,试求E(X¯),E(S2).解答:由X∼B(10,3100),得E(X)=10×3100=310,D(X)=10×3100×97100=2911000,所以E(X¯)=E(X)=310,E(S2)=n-1nD(X)=291(n-1)1000n.习题6设某商店100天销售电视机的情况有如下统计资料f(x)={λe-λx,x>00,其它,F(x)={1-e-λx,x>00,x≥0,X(2)的概率密度为f(2)(x)=2F(x)f(x)={2λe-λx(1-e-λx),x>00,其它,又X(1)的概率密度为f(1)(x)=2[1-F(x)]f(x)={2λe-2λx,x>00,其它.习题9设电子元件的寿命时间X(单位:h)服从参数λ=0.0015的指数分布,今独立测试n=6元件,记录它们的失效时间,求:(1)没有元件在800h之前失效的概率;(2)没有元件最后超过3000h的概率.解答:(1)总体X的概率密度f(x)={(0.0015)e-0.0015x,x>00,其它,分布函数F(x)={1-e-0.0015x,x>00,其它,{没有元件在800h前失效}={最小顺序统计量X(1)>800},有P{X(1)>800}=[P{X>800}]6=[1-F(800)]6=exp(-0.0015×800×6)=exp(-7.2)≈0.000747.(2){没有元件最后超过3000h}={最大顺序统计量X(6)<3000}P{X(6)<3000}=[P{X<3000}]6=[F(3000)]6=[1-exp{-0.0015×3000}]6=[1-exp{-4.5}]6≈0.93517.习题10设总体X任意,期望为μ,方差为σ2,若至少要以95%的概率保证∣X¯-μ∣<0.1σ,问样本容量n应取多大?解答:因当n很大时,X¯-N(μ,σ2n),于是P{∣X¯-μ∣<0.1σ}=P{μ-0.1σ<X¯<μ+0.1σ}≈Φ(0.1σσ/n)-Φ(-0.1σσ/n)=2Φ(0.1n)-1≥0.95,则Φ(0.1n)≥0.975,查表得Φ(1.96)=0.975,因Φ(x)非减,故0.1n≥1.96,n≥384.16,故样本容量至少取385才能满足要求.5.2 常用统计分布习题1对于给定的正数a(0<a<1),设za,χa2(n),ta(n),Fa(n1,n2)分别是标准正态分布,χ2(n),t(n),F(n1,n2)分布的上a分位点,则下面的结论中不正确的是().(A)z1-a(n)=-za(n);(B)χ1-a2(n)=-χa2(n);(C)t1-a(n)=-ta(n);(D)F1-a(n1,n2)=1Fa(n2,n1).解答:应选(B).因为标准正态分布和t分布的密度函数图形都有是关于y轴对称的,而χ2分布的密度大于等于零,所以(A)和(C)是对的.(B)是错的. 对于F分布,若F∼F(n1,n2),则1-a=P{F>F1-a(n1,n2)}=P{1F<1F1-a(n1,n2)=1-P{1F>1F1-a(n1,n2)由于1F∼F(n2,n1),所以P{1F>1F1-a(n1,n2)=P{1F>Fa(n2,n1)=a,即F1-a(n1,n2)=1Fa(n2,n1). 故(D)也是对的.习题2(1)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (1)X1-X2X32+X42;解答:因为Xi∼N(0,1),i=1,2,⋯,n,所以:X1-X2∼N(0,2),X1-X22∼N(0,1),X32+X42∼χ2(2),故X1-X2X32+X42=(X1-X2)/2X32+X422∼t(2).习题2(2)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (2)n-1X1X22+X32+⋯+Xn2;解答:因为Xi∼N(0,1),∑i=2nXi2∼χ2(n-1),所以n-1X1X22+X32+⋯+Xn2=X1∑i=2nXi2/(n-1)∼t(n-1).习题2(3)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(3)(n3-1)∑i=13Xi2/∑i=4nXi2.解答:因为∑i=13Xi2∼χ2(3),∑i=4nXi2∼χ2(n-3),所以:(n3-1)∑i=13Xi2/∑i=4nXi2=∑i=13Xi2/3∑i=4nXi2/(n-3)∼F(3,n-3).习题3设X1,X2,X3,X4是取自正态总体X∼N(0,22)的简单随机样本,且Y=a(X1-2X2)2+b(3X3-4X4)2,则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?解答:解法一Y=[a(X1-2X2)]2+[b(3X3-4X4)]2,令Y1=a(X1-2X2),Y2=b(3X3-4X4),则Y=Y12+Y22,为使Y∼χ2(2),必有Y1∼N(0,1),Y2∼N(0,1),因而E(Y1)=0,D(Y1)=1,E(Y2)=0,D(Y2)=1,注意到D(X1)=D(X2)=D(X3)=D(X4)=4,由D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2))=a(4+4×4)=20a=1,D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4)=b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,分别得a=120,b=1100.这时Y∼χ2(2),自由度为n=2.解法二因Xi∼N(0,22)且相互独立,知X1-2X2=X1+(-2)X2∼N(0,20),3X3-4X4=3X3+(-4)X4∼N(0,100),故X1-2X220∼N(0,1),3X3-4X4100∼N(0,1),为使Y=(X1-2X21/a)2+(3X3-4X41/b)2∼χ2(2),必有X1-2X21/a∼N(0,1),3X3-4X41/b∼N(0,1),与上面两个服从标准正态分布的随机变量比较即是1a=20,1b=100,即a=120,b=1100.习题4设随机变量X和Y相互独立且都服从正态分布N(0,32).X1,X2,⋯,X9和Y1,Y2,⋯,Y9是分别取自总体X和Y的简单随机样本,试证统计量T=X1+X2+⋯+X9Y12+Y22+⋯+Y92服从自由度为9的t分布.解答:首先将Xi,Yi分别除以3,使之化为标准正态.令X′i=Xi3,Y′i=Yi3,i=1,2,⋯,9,则X′i∼N(0,1),Y′i∼N(0,1);再令X′=X′1+X′2+⋯+X′9,则X′∼N(0,9),X′3∼N(0,1),Y′2=Y′12+Y′22+⋯+Y′92,Y′2∼χ2(9).因此T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),注意到X′,Y′2相互独立.习题5设总体X∼N(0,4),而X1,X2,⋯,X15为取自该总体的样本,问随机变量Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)服从什么分布?参数为多少?解答:因为Xi2∼N(0,1),故Xi24∼χ2(1),i=1,2,⋯,15,而X1,X2,⋯,X15独立,故X12+X22+⋯+X1024∼χ2(10),X112+X122+⋯+X1524∼χ2(5),所以X12+X22+⋯+X1024/10X112+X122+⋯+X1524/5=X12+X22+⋯+X1022(X112+X122+⋯+X152)=Y习题6证明:若随机变量X服从F(n1,n2)的分布,则(1)Y=1X服从F(n2,n1)分布;(2)并由此证明F1-α(n1,n2)=1Fα(n2,n1).解答:(1)因随机变量X服从F(n1,n2),故可设X=U/n1V/n2,其中U服从χ2(n1),V服从χ2(n2),且U与V相互独立,设1X=V/n2U/n1,由F分布之定义知Y=1x=V/n2U/n1,服从F(n2,n1).(2)由上侧α分位数和定义知P{X≥F1-α(n1,n2)}=1-α,P{1X≤1F1-α(n1,n2)=1-α,即P{Y≤1F1-α(n1,n2)=1-α,1-P{Y>1F1-α(n1,n2)=1-α,故P{Y>1F1-α(n1,n2)=α,而P{Y≥Fα(n2,n1)}=α.又Y为连续型随机变量,故P{Y≥1F1-α(n1,n2)=α,从而Fα(n2,n1)=1F1-α(n1,n2),即F1-α(n1,n2)=1Fα(n2,n1).习题7查表求标准正态分布的上侧分位数:u0.4,u0.2,u0.1与u0.05.解答:u0.4=0.253,u0.2=0.8416,u0.1=1.28,u0.05=1.65.习题8查表求χ2分布的上侧分位数:χ0.952(5),χ0.052(5),χ0.992(10)与χ0.012(10).解答:1.145,11.071,2.558,23.209.习题9查表求F分布的上侧分位数:F0.95(4,6),F0.975(3,7)与F0.99(5,5).解答:0.1623,0.0684,0.0912.习题10查表求t分布的下侧分位数:t0.05(3),t0.01(5),t0.10(7)与t0.005(10).解答:2.353,3.365,1.415,3.169.(2)P{X¯>4.5}=P{Z>4.5-42/9=1-P{Z≤2.25}≈1-Φ(2.25)=1-0.9878=0.0122.习题2设总体X服从正态分布N(10,32),X1,X2,⋯,X6是它的一组样本,设X¯=16∑i=16Xi.(1)写出X¯所服从的分布;(2)求X¯>11的概率.解答:(1)X¯∼N(10,326),即X¯∼N(10,32).(2)P{X¯>11}=1-P{X¯≤11}=1-Φ(11-1032)≈1-Φ(0,8165)≈1-Φ(0.82)=0.2061.习题3设X1,X2,⋯,Xn是总体X的样本,X¯=1n∑i=1nXi,分别按总体服从下列指定分布求E(X¯),D(X¯).(1)X服从0-1分布b(1,p);(2)*X服从二项分布b(m,p);(3)X服从泊松分布P(λ);(4)X服从均匀分布U[a,b];(5)X服从指数分布e(λ).解答:(1)由题意,X的分布律为:P{X=k}=Pk(1-P)1-k(k=0,1).E(X)=p,D(X)=p(1-p).所以E(X¯)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n⋅np=p,D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(X1)=1n2⋅np(1-p)=1np(1-p). (2)由题意,X的分布律为:P{X=k}=CmkPk(1-p)m-k(k=0,1,2,⋯,m).同(1)可得E(X¯)=mp,D(X¯)=1nmp(1-p).(3)由题意,X的分布律为:P{X=k}=λkk!e-λ(λ>0,k=0,1,2,⋯).E(X)=λ,D(X)=λ.同(1)可得E(X¯)=λ,D(X¯)=1nλ.(4)由E(X)=a+b2,D(X)=(b-a)212,同(1)可得E(X¯)=a+b2,D(X¯)=(b-a)212n.(5)由E(X)=1λ,D(X)=1λ2,同(1)可得D(X¯)=1λ,D(X¯)=1nλ2.习题4某厂生产的搅拌机平均寿命为5年,标准差为1年,假设这些搅拌机的寿命近似服从正态分布,求:(1)容量为9的随机样本平均寿命落在4.4年和5.2年之间的概率;(2)容量为9的随机样本平均寿命小于6年的概率。
概率论与数理统计第5章-大数定律和中心极限定理
DX } 1
(2
DX DX
)2
3 4
.
例 1.2 设随机变量 X ~ P(9) ,试根据切比雪夫不等式 估计概率 P{X 19}. 解 由于 X ~ P(9) ,所以 EX DX 9 ,且
P{X 9 10} P{X 1} 0 , 故有 P{X 19} P{X 9 10}
P{ X 9 10} 9 0.09 . 102
例 1.3 设随机变量 X ,Y 独立同分布,且 D(X ) 2 ,
试根据切比雪夫不等式估计概率 P{ X Y 2} .
解 由于 X ,Y 独立同分布,所以 E( X Y ) 0 ,且
D(X Y ) DX DY 4
lim
n
FYn
(
x)
(
x)
1
2
x
e
t2 2
dt
,
x
(,
)
.
【注 1】定理 2.1 称为列维—林德伯格中心极限定理,也 称为独立同分布随机变量序列的中心极限定理.
【注 2】由定理 2.1 表明,当 n 充分大时, FYn (x) (x) ,
近似
n
近似
即得Yn ~ N (0,1) ,从而有 Xi ~ N (n, n 2 ) .
P{ X Y 2} 1 D(X Y ) 1 ,
22
2
二、大数定律(了解) 1.相关概念
定义 1.1 设有随机变量序列 X1, X 2 ,L , X n ,L ,如果
存在常数 a ,使得对任意的 0 ,有
lim P{
n
Xn
a
}1,
概率论与数理统计第五章知识点
概率论与数理统计第五章知识点第五章的概率论与数理统计的知识点主要涉及到概率函数、统计推断、分布函数和多元正态分布等内容,这其中包括了多项式概率分布、超几何分布、二项分布、线性回归、假设检验、多重切线回归、卡方检验、小抽样检验、检验均值和协方差等内容。
首先,多项式概率分布是一种特殊的概率分布,它建立了在有限次试验中某个事件出现次数的概率,它由定义性的概率空间和一组完备的事件集合组成,并可以使用不同的统计技术来计算它们。
其次,超几何分布是一种分布,用于计算取样观测中某种特征发生次数的概率,它与多项式分布有着很大的不同,它建立了一个独立的取样模型,它是一种独立取样模型,它利用概率论中的概率空间来分析一个独立取样实验中观测到一个特征发生次数的概率。
再次,二项分布也是一种概率分布,它用来计算一系列试验中出现某种特征的次数的概率。
它是一种特殊的多项式分布,可以使用概率论的工具来应用二项式分布,以确定两个不同事件之间的概率。
此外,线性回归也是第五章概率论与数理统计中一个重要的概念,它是一种统计方法,用来预测一个变量的变化可能会导致另一个变量的变化。
线性回归的基本原理是拟合两个变量的关系,使回归线能够最佳地拟合所有数据,以找到其中的趋势。
另外,假设检验是一种重要的统计技术,在假设检验中,需要使用概率空间,以便计算假设检验中备择假设的概率,并判断假设是否成立。
另外,多重切线回归也是一种重要的统计方法,它是以多元关系作为因变量和因变量之间的关系来拟合数据,以确定多元回归线的最佳拟合方式,让其效果最好。
此外,卡方检验、小抽样检验和检验均值和协方差等也是第五章概率论与数理统计的重要内容。
其中,卡方检验是一种特殊的假设检验,用来判断一组数据的差异是否大于预期,以确定数据的分布情况。
而小抽样检验是一种统计方法,用于给出总体参数的精确估计,以帮助确定相关的总体统计量,用来估计总体参数。
最后,检验均值和协方差也是一种重要的统计方法,它可以帮助分析两个变量之间的关系,以确定两个变量之间的相关程度。
概率论与数理统计第5章
i 1
22
例1 设有30个电子元件,它们的寿命均服从参数为 0.1的指数分布(单位:小时),每个元件工作相互 独立,求他们的寿命之和超过350小时的概率.
解 设Ti为第i个元件的寿命, i 1,2,,30,T为寿命之和
显 然T1 ,T2 ,,T30相 互 独 立
30
且 Ti ~ E(0.1), i 1,2,.30 T Ti
且EX i , DXi 2 0,则x R,有
n
lim
P
i 1
Xi
n
x
x
n
n
1
t2
e 2 dt ( x)
2
莱 维n 中心 极 限 定 理表 明
记量 即Y的Yn n分当~•i布1NnX 函(ni 0数,1n,)收随敛机则于n变YX标量准ni为~序正 • Ni列 态 n1(inXn分1iX,的 布ni 的的标2标)分准准布化化函随随数. 机 机 变变 量
1
t2
e 2 dt ( x)
n np(1 p) 2
n
证明 由于 X n ~ B(n, p) 则X n X k , k 1
其中 X1, X2 ,, Xn 是相互独立的、服从同一
(0-1) 分布的随机变量, 分布律为
P{ Xk i} pi (1 p)1i , i 0, 1.
30
分nll设布ii其 (mm0X,随-P中Pn1则机)Xin分对X变k11n,nX1布任X量Xni 2n的意k,Xpn, n随x服,,X机从xn有x变是参量相数x,x互分n,1独布21p(立e律0et2的2为t2d2 dtp、t服1()从 x的) 同二一项
20
服从均匀分布。记 V Vk 求P{V>105}的近似值 k 1
概率论与数理统计-第五章
【数理统计简史】
1. 近代统计学时期
18 世纪末到 19 世纪,是近代统计学时期.这一 时期的重大成就是大数定律和概率论被引入统计 学.之后最小二乘法、误差理论和正态分布理论 等相继成为统计学的重要内容.这一时期有两大 学派:数理统计学派和社会统计学派.
【数理统计简史】 数理统计学派始于19世纪中叶,代表人物是比 利时的凯特莱( A.Quetelet , 1796-1874 ),著有 《概率论书简》《社会物理学》等,他主张用研 究自然科学的方法研究社会现象,正式把概率论 引入统计学,并最先用大数定律证明了社会生活 中随机现象的规律性,提出了误差理论.凯特莱 的贡献,使统计学的发展进入个了一个新的阶 段.
i =1 36
1 2 2 3 2 2 2 2 D( X ) = E ( X ) − E ( X ) = ( 0 + 1 + 2 + 3 ) − 4 2 5 = 4
2
二、样本与抽样 由于X1,X2,...,X36均与总体X同分布,且相互独 立,所以,Y的均值和方差分别为
E (Y ) = E ( ∑ X i ) = 36 E ( X ) = 54,
【数理统计简史】 18世纪到 19世纪初期,高斯从描述天文观测的 误差而引进正态分布,并使用最小二乘法作为估 计方法,是近代数理统计学发展初期的重大事件, 对社会发展有很大的影响.
【数理统计简史】 用正态分布描述观测数据的应用是如此普遍,以 至 在 19 世 纪 相 当 长 的 时 期 内 , 包 括 高 尔 顿 ( Galton )在内的一些学者,认为这个分布可用 于描述几乎是一切常见的数据.直到现在,有关 正态分布的统计方法,仍占据着常用统计方法中 很重要的一部分.最小二乘法方面的工作,在 20 世纪初以来,经过一些学者的发展,如今成了数 理统计学中的主要方法.
概率论与数理统计第五章
第 ×× 次课 2学时本次课教学重点:常用的统计量 本次课教学难点:总体,简单随机样本,统计量的概念。
本次课教学内容:第五章 数理统计的基础知识 第一节 数理统计的基本概念 教学组织: 一、引言在前五章中我们学习了概率论的基本内容,因为随机变量及其所伴随的概率分布全面描述了随机现象的统计规律性,所以在概率论的许多问题中,概率分布通常都是已知的,或者假设是已知的,而一切计算与推理都是在此基础上得出来的。
然而,实际情况往往并非如此。
一个随机现象所服从的分布概型可能完全不知道,或者只知道其概型而不知其分布函数中所含的参数。
例如,某工厂生产的灯泡的寿命服从什么分布是不知道的。
再如,某厂生产的一件产品是合格品还是不合格品,我们知道它服从两点分布,但其参数p 却不知道。
那么怎样才能知道一个随机现象的分布或其参数呢?这就是数理统计所要解决的一个首要问题。
为了获得灯泡的寿命分布,我们从所有的灯泡中抽出一部分进行观察与测试以取得相关信息,从而做出推断。
由于观察和测试是随机现象,依据有限个观察与测试对整体所做出的推断不可能绝对准确,这个不确定性我们用概率来表达。
数理统计学的基本问题就是依据观测或试验所取得的有限信息对整体做出推断,每个推断必须伴有一定的概率来表明其可靠程度。
这种伴有一定概率的推断称为统计推断。
二、总体与随机样本 1、总体在数理统计中,我们往往研究有关对象的某一数量指标(如灯泡的寿命这一数量指标)。
为此,考虑与这一数量指标相联系的随机试验,对这一数量指标进行试验或观察。
我们把研究对象的全体所构成的一个集合称为总体,总体中的每个对象称为个体。
总体中所包含的个体的个数称为总体的容量。
容量有限的总体称为有限总体,容量无限的总体称为无限总体。
例如,考察某批灯泡的质量,如这一批灯泡共有5000只,每个灯泡的寿命是一个可能的观察值,是一个个体。
所有5000只灯泡的寿命是一个有限总体。
大学数理统计的基本概念
大学数理统计的基本概念数理统计是一门应用数学学科,研究如何收集数据、分析数据并进行推断的方法和理论。
在大学的数学统计课程中,学生将学习一系列核心的基本概念,如样本、总体、概率、随机变量等等。
本文将介绍大学数理统计中的基本概念,并探讨它们在实际问题中的应用。
一、样本与总体在数理统计中,样本和总体是两个基本概念。
样本是从总体中选取的一部分个体或观测值的集合,而总体是研究对象的全体个体或观测值的集合。
样本的选择通常通过随机抽样来保证代表性。
二、概率与概率分布概率是描述随机事件发生可能性的数值,通常用0到1的数字表示。
在数理统计中,我们使用概率来描述随机变量的可能取值。
概率分布是随机变量取值的可能性分布,常见的概率分布包括均匀分布、正态分布等等。
概率和概率分布对于研究和预测随机事件至关重要。
三、随机变量与参数估计随机变量是在一个随机试验中可能取到的各种值,可以分为离散随机变量和连续随机变量。
参数估计是通过样本数据对总体参数进行估计的过程,主要包括点估计和区间估计两种方法。
参数估计是统计学的核心内容之一,对于从样本数据中推断总体特征非常重要。
四、假设检验与统计推断假设检验是判断关于总体参数的假设是否成立的一种方法。
在假设检验中,我们需要提出一个原假设和一个备择假设,并根据样本数据进行推断和判断。
统计推断是根据样本数据对总体进行推断和预测的过程,常用的方法包括参数估计和假设检验。
五、回归与方差分析回归分析是研究自变量和因变量之间关系的一种统计方法,用于建立数学模型并进行预测和解释。
方差分析是用于比较多个总体均值是否有显著性差异的统计方法,常用于实验设计和数据分析。
六、抽样调查与统计图表抽样调查是经济、社会和科学研究中常用的一种数据收集方法,通过从总体中选取样本进行调查和分析,得出对总体的推断。
统计图表是用来直观展示数据分布、关系和趋势的图形工具,包括条形图、折线图、饼图等等。
总结:大学数理统计的基本概念包括样本与总体、概率与概率分布、随机变量与参数估计、假设检验与统计推断、回归与方差分析以及抽样调查与统计图表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
x k 21 , x 0; k k 2 (k1 x k2 )
1 1 2
x 0.
图像: f ( x) F
(1,10)
O
2018/11/24
(4,10)
(10,10)
x
13
例4.设随机变量X~N(2,1), Y1 ,Y2 ,Y3 ,Y4均服从N (0,4)
令随机变量 且 X ,Yi (i 1,2,3,4)相互独立 ,
Z
16( X 2) 2
Y
i 1
4
2
i
试求Z的分布。
提示:
( X 2) 2 ( X 2) 2 Z 4 4 1 1 1 2 2 Yi ( Yi ) 16 i 1 4 i 1 2
14
2018/11/24
(2) F分布的性质
若 X~F(k1, k2 ), 则 1/ X ~ F (k2 ,k1 ).
证明: X~F(k1, k2 ), 由F分布的定义:
X 1 k1 X X 2 k2
其中X1 ~ 2 (k1 ), X 2 ~ 2 (k2 )
1 X 2 k2 ~ F (k2 , k1 ). X X 1 k1
其密度函数为
k 1 ( ) 2 x ( k 1) 2 2 f t ( x) (1 ) k k k ( ) 2
t分布的密度函数图像:
关于t=0对称; 当n充分大时,其图像
f t ( x)
k 40
k 3
k 1
t (40) N (0,1)
O
与标准正态分布密度图 像相似.
2 2 服从自由度为 k 的 2 分布, 记作 ~ (k ).
自由度k: 指 2 X12 X k2中包含独立变量的个数 .
2018/11/24 2
其概率密度函数为
k x 1 1 2 2 x e , x 0; k 2 k f ( x ) 2 ( ) 2 x 0. 0,
2
X2 试求解 Y 的概率分布 . 9
解:因为X~N(0,3), 所以
X ~ N (0,1) 3
2 X 2 X 且 ~ (1) 又因为 与Y 相互独立, 9 9
2
由可加性得
X2 2 Y ~ (4) . 9
5
2018/11/24
N (0,1)的 例2. 设X1 , X 2 ,, X 6为来自正态总体
所以
1 9 X i ~ N (0,1) 9 i 1
Yi 2 ( ) ~ 2 (1), i 1,2,,9. 3
10
而Yi ~ N (0,9), 故 Yi 3 ~ N (0,1) ,
故
2018/11/24
Yi 2 2 由可加性知 ( ) ~ (9) i 1 3
9
所以根据t分布的定义有
2 2
1 1 则 C7
2. t 分布
定义2. 设随机变量X 与Y 相互独立, 且
X ~ N (0,1), Y ~ 2 (k ),
则随机变量
X t Y/k
服从自由度为k 的t 分布,又称学生氏分布, 记作
t ~ t (k ).
2018/11/24 8
2018/11/24
x
9
,且都服从 N (0,9), 例3. 设总体X和Y相互独立
X1, X 2 ,, X 9和Y1,Y2 ,,Y9来自总体 X ,Y的样本,
求统计量 T的分布, 其中
T Xi
i 1 9 2 Y i i 1 9
,服从N (0,9), 解: 由于X1, X 2 ,, X 9相互独立
1 9 Xi 9 i 1 ~ t (9) 9 Yi 2 ( ) 9 i 1 3
故 T Xi
i 1
9
2 Y i ~ t (9). i 1
9
2018/11/24
11
3.F 分布
(1)定义
定义3. 设随机变量X与Y相互独立, 且
X ~ 2 (k1 ), Y ~ 2 (k2 ),
X3 X4 X5 X6 则 ~ N (0,1) 4
2018/11/24 6
X1 X 2 X3 X4 X5 X6 Y1 与Y2 相互独立 . 2 4
X1 X 2 2 X3 X4 X5 X6 2 所以 ( ) ( ) 2 4
Y1 Y2 ~ 2 (2).
一组样本 , 求C1, C2使得
Y C1 ( X1 X 2 )2 C2 ( X 3 X 4 X 5 X 6 )2
服从 2分布.
X1 X 2 ~ N (0,1) 解: 由于 X1 X 2 ~ N (0,2), 则Y1 2 又
X 3 X 4 X 5 X 6 ~ N (0,4)
2 2 i
此性质推广至多个变量的情形.
设 ~ (ki ), 且 (i 1,2,, n)相互独立 ,
2 i
则有 ~ (k1 k2 kn ).
2 1 2 2 2 n 2
2018/11/24 4
, 例1. 设X ~ N (0,9), Y ~ (3), 且 X , Y 相互独立
则随机变量
X / k1 F Y / k2
服从自由度为 (k1 , k 2 )的F分布, 记作
F ~ F (k1 , k2 ).
2018/11/24 12
其概率密度函数为
k1 k2 k 2 k ( 2 )k1 k2 f F ( x) k1 k 2 ( ) ( ) 2 2 0,
2
密度函数图像: f 2 ( x)
k 5
O
2018/11/24
k 1
k 2
x
3
2 (2) 分布的性质
2 且 可加性: 若随机变量12 和 2 相互独立 ,
2 12 ~ 2 (k1 ), 2 ~ 2 (k2 ),
则它们的和
~ (k1 k2 ).
2 1 2 2 2
第四节 2 分布 t分布 F分布
基本内容: 1. 三大抽样分布——
分布、t分布、F分布;
2
2. 概率分布的分位点概念.
2018/11/24
1
一、三大抽样分布
1. 分布
2
(1)定义
定义1.设 X1 , X 2 ,, X k 相互独立, 都服从标准
正态分布N(0,1), 则随机变量
2 2 X12 X 2 X k2