《概率论与统计原理》第5章
5第五章(二)统计推断概述2假设检验基本原理
13:06:12
16
统计结论:
1 检验统计量绝对值 <临界值0.05,则相伴概 率 P>0.05,接受H0 ,差异不显著;
2 临界值0.05<检验统计量绝对值 <临界值0.01, 则相伴概率 0.01<P<0.05,否定H0 ,差异 显著; 3 检验统计量绝对值 >临界值0.01,则相伴概 率 P<0.01,否定H0 ,差异极显著;
(2)相伴概率P:是指在原假设成立时检验统计 量值及所有比它更极端的可能值出现的概率之 和(P---)
13:06:12 15
假设检验的基本步骤
统计结论:
- 差异不显著:在=5%水平下, 检验统计量的观察值落在接受域中, - 差异显著:在=5%水平下,检 验统计量的观察值落在否定域中 - 差异极显著:在=1%水平下, 检验统计量的观察值落在否定域中
Biostatistics and Experimental Design
畜牧、兽医专业
生物统计 附 试验设计
13:06:12
1
统计推断概述内容1小节
一 二 三 四 五 统计推断的概念 抽样分布的概念 统计量的概率分布-抽样分布 正态总体样本平均数的抽样分布 参数估计
13:06:12
2
统计推断概述内容2
13:06:12
18
举例说明
(2)计算检验统计量
Z=
x- m
8.7 - 9 = = - 3.162 2 s n 2.5/ 10
13:06:12
19
(3)确定否定域:
若取 =5%,否定域为Z > 1.96 或 Z < 1.96,临界值U0.05=1.96 ,Z = -3.162 < -1.96,统 计量Z落入否定区,否定H0,相伴概率P<0.05 结论:该场猪的平均背膘厚与9mm差异显著
概率论与数理统计知识点总结!-知识归纳整理
《概率论与数理统计》 第一章随机事件及其概率§1.1 随机事件一、给出事件描述,要求用运算关系符表示事件: 二、给出事件运算关系符,要求判断其正确性: §1.2 概率古典概型公式:P (A )=所含样本点数所含样本点数ΩA 实用中经常采用“罗列组合”的想法计算补例1:将n 个球随机地放到n 个盒中去,问每个盒子恰有1个球的概率是多少?解:设A :“每个盒子恰有1个球”。
求:P(A)=?Ω所含样本点数:n n n n n =⋅⋅⋅...Α所含样本点数:!1...)2()1(n n n n =⋅⋅-⋅-⋅n n n A P !)(=∴补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少?解:设A i :“信箱中信的最大封数为i”。
(i =1,2,3)求:P(A i )=?Ω所含样本点数:6444443==⋅⋅A 1所含样本点数:24234=⋅⋅836424)(1==∴A PA 2所含样本点数:363423=⋅⋅C1696436)(2==∴A PA 3所含样本点数:4433=⋅C161644)(3==∴A P注:由概率定义得出的几个性质:知识归纳整理1、0<P (A )<12、P(Ω)=1,P(φ) =0 §1.3 概率的加法法则定理:设A 、B 是互不相容事件(AB=φ),则: P (A ∪B )=P (A )+P (B )推论1:设A 1、 A 2、…、 A n 互不相容,则 P(A 1+A 2+...+ A n )= P(A 1) + P(A 2) +…+ P(A n )推论2:设A 1、 A 2、…、 A n 构成完备事件组,则 P(A 1+A 2+...+ A n )=1推论3: P (A )=1-P (A )推论4:若B ⊃A ,则P(B -A)= P(B)-P(A) 推论5(广义加法公式):对任意两个事件A 与B ,有P(A ∪B)=P(A)+P(B)-P(A B) 补充——对偶律:nnAA A A A A ⋂⋂⋂=⋃⋃⋃ (2)121nnAA A A A A ⋃⋃⋃=⋂⋂⋂ (2)121§1.4 条件概率与乘法法则条件概率公式:P(A/B)=)()(B P AB P (P(B)≠0)P(B/A)= )()(A P AB P (P(A)≠0)∴P (AB )=P (A /B )P (B )= P (B / A )P (A )有时须与P (A+B )=P (A )+P (B )-P (AB )中的P (AB )联系解题。
概率论与数理统计 第五章
Xn ⎯ ⎯→ X 2. 依概率收敛与依分布收敛的关系
依概率收敛 ⇒ 依分布收敛
L
3. 定义:中心极限定理 设随机变量 X ~ N(0,1),{Xi },i = 1, 2, … 相互独 立,且数学期望和方差都存在, 若标准化随机变量序列
∑
n
i =1
Xi −
∑ E(X
i =1
n
i
)
∑
n
i =1
D(X i)
所以结论成立。 由此有,若X ~ B( n, p ),对于足够大的n,有 ⎧ m1 − np X − np m2 − np ⎫ ⎪ ⎪ < ≤ P{m1 < X ≤ m2 }= P ⎨ ⎬ np(1 − p) np(1 − p) ⎪ ⎪ np(1 − p) ⎩ ⎭
⎧ Yn − np ⎫ ⎪ ⎪ ≤ x ⎬ = Φ( x ) lim P ⎨ n →∞ ⎪ np(1 − p ) ⎪ ⎩ ⎭
证明:对于任意正整数n,随机变量Yn 可表示为 证明:对于任意正整数n Yn = X1+ X2+…+ Xn X1, X2,…, Xn 相互独立,Xi ~ B( 1, p ),且有 E( Xi ) = p , D( Xi ) = p(1-p) 所以随机变量序列{ Xi }, i =1,2,…满足独立同分布 中心极限定理条件。即有
切比雪夫不等式的应用 1)估计随机变量落在某个区间内的概率 (P125例5.5.2) 2)估计ε的值, 使 P(│X - E(X)│<ε) ≥ a (0<a<1) 3)证明大数定律。
二. 大数定律 定义: 依概率收敛 设{Xn}是一个随机变量序列,X 是一个随机变量 或常数,若对于任意的ε> 0,有 lim P{| X n − X |≥ ε } = 0
概率论与数理统计笔记
AB = A ∪ B
设 A1, A2, …, An 是样本空间 Ω 的一个划分, B 是任意一 个事件,且 p(B)>0,则 P(Ai|B)=
P ( AB ) . P ( A)
P( Ai ) P( B | Ai) P( Ai ) P( B | Ai) = n , i=1,..,n P(B) P( Ak ) P( B | Ak)
k 1
概率的乘法公式: 当 P(A)>0 时,P(AB)= P(A)P(B|A) 当 P(B)>0 时,P(AB)= P(B)P(A|B) 乘法公式还可以推广到 n 个事件的情况:
n 重贝努利(Bernoulli)试验: Pn(k) =
C
k n
pk(1-p)n-k, k=0, 1, 2, …, n.(q=1-p)
k 1
Ak) =
k 1
P(Ak)
性质: (1) 0 ≤ P(A) ≤ 1, P (Φ) = 0 (2) P(A∪B) = P(A) + P(B)-P(AB) 特别地,当 A 与 B 互不相容时,P(A∪B) = P(A) + P(B) 推广: 对于任意事件 A, B, C 有 P(A∪B∪C) = P(A) + P(B)
当 0 < P(A) < 1 时,A 与 A 就是 Ω 的一个划分,又设 B 为任一事件, 则全概率公式的最简单形式为 P(B)=P(A) P(B|A)+ P( A ) P(B| A ) 运算律: 交换律:A∪B = B∪A, A∩B = B∩A 结合律:A∪(B∪C) = (A∪B)∪C, A∩(B∩C) = (A∩B)∩C 分配律:A∪(B∩C) = (A∪B)∩(A∪C), A∩(B∪C) = (A∩B)∪(A∩C)
概率论与数理统计教案(48课时)(最新整理)
( x, y )G
,注意二重积分运算知识点的复习。
d) 二维均匀分布的密度函数的具体表达形式。
五.思考题和习题
思考题:1. 由随机变量 X ,Y 的边缘分布能否决定它们的联合分布?
2. 条件分布是否可以由条件概率公式推导? 3. 事件的独立性与随机变量的独立性是否一致? 4.如何利用随机变量之间的独立性去简化概率计算,试举例说明。 习题:
第四章 随机变量的数字特征 一.教学目标及基本要求
(1)理解数学期望和方差的定义并且掌握它们的计算公式;
(2)掌握数学期望和方差的性质与计算,会求随机变量函数的数学期望,特别是利用
期望或方差的性质计算某些随机变量函数的期望和方差。
(3)熟记 0-1 分布、二项分布、泊松分布、正态分布、均匀分布和指数分布的数学期
第四节 二维随机变量的函数的分布
已知(X,Y)的分布率 pij 或密度函数 (x, y) ,求 Z f ( X ,Y ) 的分布律或密度
函数Z (z) 。特别如函数形式: Z X Y , Z max( X ,Y ), Z min( X ,Y ) 。
2 学时
三.本章教学内容的重点和难点
a) 二维随机变量的分布函数及性质,与一维情形比较有哪些不同之处;
5.列举正态分布的应用。
习题:
第三章 多维随机变量及其分布
一.教学目标及基本要求
(1)了解二维随机变量概念及其联合分布函数概念和性质,了解二维离散型和连续 型随机变量定义及其概率分布和性质,了解二维均匀分布和正态分布。
(2)会用联合概率分布计算有关事件的概率,会求边缘分布。 (3)掌握随机变量独立性的概念,掌握运用随机变量的独立性进行概率计算。 (4)会求两个独立随机变量的简单函数(如函数 X+Y, max(X, Y), min(X, Y))的分布。
《统计学原理》第5章:抽样推断
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
《统计学》第5章 假设检验
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
统计学原理第五章习题
《统计学原理》第五章习题河南电大贾天骐一.判断题部分题目1:从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
()答案:×题目2:在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。
()答案:√题目3:抽样成数的特点是:样本成数越大,则抽样平均误差越大。
()答案:×题目4:抽样平均误差总是小于抽样极限误差。
()答案:×题目5:在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。
()答案:√题目6:从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。
()答案:√题目7:抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。
()答案:√题目8:在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。
()答案:√题目9:抽样估计的优良标准有三个:无偏性、可靠性和一致性。
()答案:×题目10:样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。
()答案:×题目11:抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。
()答案:×题目12:用来测量估计可靠程度的指标是抽样误差的概率度。
()答案:√题目13:总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。
()答案:×二.单项选择题部分题目1:抽样平均误差是()。
A、抽增指标的标准差B、总体参数的标准差C、样本变量的函数D、总体变量的函数答案:A题目2:抽样调查所必须遵循的基本原则是()。
A、准确性原则B、随机性原则C、可靠性原则 C、灵活性原则答案:B题目3:在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的()。
概率论与数理统计 五大数定理
[注]: X n P → a 注: 推论(辛钦大数定律) 推论(辛钦大数定律)
X n − a P → 0
设独立随机变量 X 1 , X 2 ,⋅ ⋅ ⋅, X n 服从同一分布 并且有数学 服从同一分布, 期望 µ 及方差 σ 2, X 1 , X 2 ,⋅ ⋅ ⋅, X n 的算术平均值当 n → ∞ 则 时,按概率收敛于µ, 即对于任何正数 ε,恒有 按概率收敛于 ,
第五章 大数定理与中心极限定理
“大数定律”: 用来阐明大量随机现象平均结果稳定性的定理 大数定律” 用来阐明大量随机现象平均结果稳定性的定理. 大数定律
一、切比雪夫不等式
切比雪夫不等式: 切比雪夫不等式: 设随机变量 X 有数学期望 EX 及方差 DX, , 下列不等式成立: 则对于任何正数 则对于任何正数 ε,下列不等式成立:
2 i
n
则:E(Yn ) =
2 µi , D(Yn ) = ∑σi2 = sn . ∑
n i =1
n
i =1
i =1
∴ Z n = Yn
1 = sn
∗
n Y n − EY n 1 n = = ∑ X i − ∑ µ i sn i =1 DY n i =1
∑ (X
i =1
n
i
− µ i ), 则有:E ( Z n ) = 0 , D ( Z n ) = 1 . 则有:
概率论中有关论证随机变量的和的极限分布是正态分布的定 概率论中有关论证随机变量的和的极限分布是正态分布的定 随机变量的和的极限分布是正态分布 是独立随机变量, 设 X 1 , X 2 ,⋅ ⋅ ⋅ , X n ,⋅ ⋅ ⋅ 是独立随机变量,并各有
EX i = µ i , DXi = σ , i = 1,2,⋅ ⋅ ⋅, n,⋅ ⋅ ⋅. 设 n = ∑Xi , Y
第5章概率论与假设检验简介
样本均 值分布
σ σx = n
µx = µ
2011-4-27
X
23
2.样本方差的分布
Statistics Statistics
设总体~ 的样本, 设总体 ~ N(µ,σ2 ), 取容量 的样本 , 则样 , 取容量n的样本 本方差 s2
χ2(n – 1):自由度为 :自由度为(n-1)的卡方分布 的卡方分布
1. 2.
密度函数f(x)曲线下的面积等于 曲线下的面积等于1 密度函数 曲线下的面积等于 分布函数是f(x) 下小于 x0 的面积 分布函数是
f(x)
F ( x0 )
x0
2011-4-27
x
8
期望和方差
Statistics Statistics
2011-4-27
E( X ) = ∫ xf (x)dx = µ
2011-4-27
12
正态分布标准化
Statistics Statistics
1. 标 准 化 线 性变换
2.
标准正态 分布的概 率密度和 分布函数
2011-4-27
13
一般正态分布
标准正态分布
σ
σ =1
µ
x
µ=0
Z
Excel:正态分布函数
Statistics Statistics
NORMDIST (x, mean, std, cumulative) Cumulative=0:返回指定平均值和标准差的正态分 : 布函数的概率密度 Cumulative=1:返回累积概率密度(分布函数值) :返回累积概率密度(分布函数值) NORMINV (prob, mean, std) NORMDIST (x, mean, std, 1)的反函数 的反函数 NORMSDIST(z) 返回标准正态分布函数的累积概率P(X ≤ z ) 返回标准正态分布函数的累积概率 NORMSINV(probability) NORMSDIST(z)的反函数 的反函数
天津理工大学概率论与数理统计第五章习题答案详解
第 5 章 大数定律与中心极限定理一、 填空题:1.设随机变量μξ=)(E ,方差2σξ=)(D ,则由切比雪夫不等式有≤≥-}|{|σμξ3P91 . 2.设n ξξξ,,,Λ21是n 个相互独立同分布的随机变量,),,,(,)(,)(n i D E i i Λ218===ξμξ对于∑==ni i n 1ξξ,写出所满足的切彼雪夫不等式 228εεξεμξn D P =≤≥-)(}|{| ,并估计≥<-}|{|4μξP n211- . 3. 设随机变量129,,,X X X L 相互独立且同分布, 而且有1i EX =,1(1,2,,9)i DX i ==L , 令91i i X X ==∑, 则对任意给定的0ε>, 由切比雪夫不等式直接可得{}≥<-ε9X P 291ε- . 解:切比雪夫不等式指出:如果随机变量X 满足:()E X μ=与2()D X σ=都存在, 则对任意给定的0ε>, 有 22{||}P X σμεε-≥≤, 或者22{||}1.P X σμεε-<≥- 由于随机变量129,,,X X X L 相互独立且同分布, 而且有1,1(1,2,9),i i EX DX i ===L 所以999111()()19,i i i i i E X E X E X μ===⎛⎫===== ⎪⎝⎭∑∑∑9992111()()19.i i i i i D X D X D X σ===⎛⎫===== ⎪⎝⎭∑∑∑4. 设随机变量X 满足:2(),()E X D X μσ==, 则由切比雪夫不等式,有{||4}P X μσ-≥ 116≤. 解:切比雪夫不等式为:设随机变量X 满足2(),()E X D X μσ==, 则对任意的0ε>, 有22{||}.P X σμεε-≥≤由此得 221{||4}.(4)16P X σμσσ-≥≤=5、设随机变量2σξμξξ==)(,)(,D E ,则≥<-}|{|σμξ2P43 . 6、设n ξξξ,,,Λ21为相互独立的随机变量序列,且),,(Λ21=i i ξ服从参数为λ的泊松分布,则≤-∑=∞→}{lim x n n P n i i n λλξ1∞--xt dt e 22 .7、设n η表示n 次独立重复试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则≈≤<}{b a P n η ⎰-----)1()1(2221p np npb p np npa t dt e π.8. 设随机变量n ξ, 服从二项分布(,)B n p , 其中01,1,2,p n <<=L , 那么, 对于任 一实数x , 有lim {|||}n n P np x ξ→+∞-<= 0 . 9. 设12,,,n X X X L 为随机变量序列,a 为常数, 则{}n X 依概率收敛于a 是指{}=<->∀+∞>-εεa X P n n lim ,0 1 ,或{}=≥->∀+∞>-εεa X P n n lim ,0 0 。
《概率论与数理统计》笔记
《概率论和数理统计》笔记一、课程导读“概率论和数理统计”是研究随机现象的规律性的一门学科在自然界,在人们的实践活动中,所遇到的现象一般可以分为两类:确定性现象随机现象确定性现象在一定的条件下,必然会出现某种确定的结果.例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落.我们把这类现象称为确定性现象(或必然现象).同样,任何物体没有受到外力作用时,必定保持其原有的静止或等速运动状态;导线通电后,必定会发热;等等也都是确定性现象.随机现象在一定的条件下,可能会出现各种不同的结果,也就是说,在完全相同的条件下,进行一系列观测或实验,却未必出现相同的结果.例如,抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪一面朝上.我们把这类现象称为随机现象(或偶然现象).同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中10环,也可能击中9环8环……甚至脱靶;等等也都是随机现象.统计规律性对随机现象,从表面上看,由于人们事先不能知道会出现哪一种结果,似乎是不可捉摸的;其实不然.人们通过实践观察到并且证明了,在相同的条件下,对随机现象进行大量的重复试验(观测),其结果总能呈现出某种规律性.例如,多次重复抛一枚硬币,正面朝上和反面朝上的次数几乎相等;对某个靶进行多次射击,虽然各次弹着点不完全相同,但这些点却按一定的规律分布;等等.我们把随机现象的这种规律性称为统计规律性.●使用例子摸球游戏中谁是真正的赢家在街头巷尾常见一类“摸球游戏”.游戏是这样的:一袋中装有16个大小、形状相同,光滑程度一致的玻璃球.其中8个红色、8个白色.游戏者从中一次摸出8个,8个球中.当红白两种颜色出现以下比数时.摸球者可得到相应的“奖励”或“处罚”:结果(比数) A(8:0)B(7:1)C(6:2)D(5:3)E(4:4)奖金(元)10 1 0.5 0.2 -2 注:表中“-2”表示受罚2元解: 此游戏(实为赌博),从表面上看非常有吸引力,5种可能出现的结果.有4种可得奖.且最高奖达10元.而只有一种情况受罚.罚金只是2元.因此就吸引了许多人特别是好奇的青少年参加.结果却是受罚的多,何以如此呢?其实.这就是概率知识的具体使用:现在是从16个球中任取8个.所有可能的取法为816C 种.即基本事件总数有限.又因为是任意抽取.保证了等可能性.是典型的古典概型问题.由古典概率计算公式.很容易得到上述5种结果.其对应的概率分别是:3807048730121800099460000155404848385828681878.C C C P(E);.C C 2C P(D);.C C 2C P(C);.C C 2C P(B);.C 2P(A)816816816816816==========假设进行了1000次摸球试验, 5种情况平均出现的次数分别为:0、10、122、487、381次,经营游戏者预期可得2×381-(10×0+1×10+0.5×122+0.2×487) =593.6(元). 这个例子的结论可能会使我们大吃一惊,然而正是在这一惊之中.获得了对古典概率更具体、更生动的知识.戏院设座问题乙两戏院在竞争500名观众,假设每个观众完全随意地选择一个戏院,且观众之间选择戏院是彼此独立的,问每个戏院至少应该设多少个座位才能保证观众因缺少座位而离开的概率小于5%?解 由于两个戏院的情况相同,故只需考虑甲戏院即可。
统计学第5章 假设检验
假设检验
第 5 章
假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验(自学)
5.1
假设检验的基本原理
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
假设检验的基本概念
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或 观测,得到统计样本,构造统计方法进行判断,以 决定是否接受这个假设。
1. 基本原理
小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
H0 :π ≤30%
H1 :π >30%
提出假设 (练习)
• 某厂生产的化纤的纤度服从正态分布,纤 维纤度的标准均值为1.04。某天测得25根 纤维的纤度均值为x=1.39,检验与原来设 计的标准均值相比是否有所变化,要求的 显著性水平为α =0.05,则假设形式为: •
H0 :μ =1.04
H1 :μ ≠1.04
假设检验的基本思想
抽样分布 这个值不像 我们应该得 到的样本均 值 ... ... 如果这是 总体的假设 均值 = 50 H0
... 因此我们 拒绝假设 = 50
20
《统计学原理》第5章:抽样推断
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
概率论与数理统计考试大纲
《概率论与数理统计》课程考试大纲一、考核内容与考核要求第1章随机事件与概率【考核的知识点和要求】考核知识点1.随机事件及其运算2.概率的定义及其确定方法3.概率的性质4.条件概率5.独立性考核要求1. 随机事件及其运算(1)简单应用:随机事件的运算。
2.概率的定义及其确定方法(1)简单应用:概率的定义。
(2)综合应用:确定概率的古典方法。
3.概率的性质(1)简单应用:概率的性质。
4.条件概率(1)简单应用:条件概率。
5.独立性(1)分析:独立性。
第2章随机变量及其分布【考核的知识点和要求】考核知识点1.随机变量及其分布2.随机变量的数学期望3.随机变量的方差与标准差4.常用离散分布5.常用连续分布6.随机变量函数分布考核要求1. 随机变量及其分布(1)简单应用:随机变量的分布。
2. 随机变量的数学期望(1)简单应用:随机变量的数学期望。
3. 随机变量的方差与标准差(1)简单应用:随机变量的方差与标准差。
4. 常用离散分布(1)简单应用:泊松分布。
(2)综合应用:二项分布。
5.常用连续分布(1)简单应用:指数分布。
(2)综合应用:正态分布。
6.随机变量函数分布(2)综合应用:随机变量函数分布。
第3章多维随机变量及其分布【考核的知识点和要求】考核知识点1.多维随机变量及其联合分布2.边际分布与随机变量的独立性3.多维随机变量函数的分布4.多维随机变量的特征数考核要求1. 多维随机变量及其联合分布(1)简单应用:多维随机变量的联合分布。
2.边际分布与随机变量的独立性(1)综合应用:边际分布与随机变量的独立性。
3.多维随机变量函数的分布(1)综合应用:多维随机变量函数的分布。
4.多维随机变量的特征数(1)识记:多维随机变量函数的数学期望、协方差和相关系数。
(2)简单应用:数学期望与方差的运算性质。
第4章大数定律与中心极限定理【考核的知识点和要求】考核知识点1.大数定律2.中心极限定理考核要求1. 大数定律(1)简单应用:大数定律。
概率论与数理统计第五章知识点
概率论与数理统计第五章知识点第五章的概率论与数理统计的知识点主要涉及到概率函数、统计推断、分布函数和多元正态分布等内容,这其中包括了多项式概率分布、超几何分布、二项分布、线性回归、假设检验、多重切线回归、卡方检验、小抽样检验、检验均值和协方差等内容。
首先,多项式概率分布是一种特殊的概率分布,它建立了在有限次试验中某个事件出现次数的概率,它由定义性的概率空间和一组完备的事件集合组成,并可以使用不同的统计技术来计算它们。
其次,超几何分布是一种分布,用于计算取样观测中某种特征发生次数的概率,它与多项式分布有着很大的不同,它建立了一个独立的取样模型,它是一种独立取样模型,它利用概率论中的概率空间来分析一个独立取样实验中观测到一个特征发生次数的概率。
再次,二项分布也是一种概率分布,它用来计算一系列试验中出现某种特征的次数的概率。
它是一种特殊的多项式分布,可以使用概率论的工具来应用二项式分布,以确定两个不同事件之间的概率。
此外,线性回归也是第五章概率论与数理统计中一个重要的概念,它是一种统计方法,用来预测一个变量的变化可能会导致另一个变量的变化。
线性回归的基本原理是拟合两个变量的关系,使回归线能够最佳地拟合所有数据,以找到其中的趋势。
另外,假设检验是一种重要的统计技术,在假设检验中,需要使用概率空间,以便计算假设检验中备择假设的概率,并判断假设是否成立。
另外,多重切线回归也是一种重要的统计方法,它是以多元关系作为因变量和因变量之间的关系来拟合数据,以确定多元回归线的最佳拟合方式,让其效果最好。
此外,卡方检验、小抽样检验和检验均值和协方差等也是第五章概率论与数理统计的重要内容。
其中,卡方检验是一种特殊的假设检验,用来判断一组数据的差异是否大于预期,以确定数据的分布情况。
而小抽样检验是一种统计方法,用于给出总体参数的精确估计,以帮助确定相关的总体统计量,用来估计总体参数。
最后,检验均值和协方差也是一种重要的统计方法,它可以帮助分析两个变量之间的关系,以确定两个变量之间的相关程度。
概率论与数理统计第四版_部分习题答案_第四版_盛骤__浙江大学
第一章 概率论的基本概念2、设A ,B ,C 为三事件,用A ,B ,C 的运算关系表示下列事件。
(1)A 发生,B 与C 不发生。
表示为:C B A 或A - (AB+AC )或A - (B ∪C )(2)A ,B 都发生,而C 不发生。
表示为:C AB 或AB -ABC 或AB -C(3)A ,B ,C 中至少有一个发生表示为:A+B+C(4)A ,B ,C 都发生,表示为:ABC(5)A ,B ,C 都不发生,表示为:C B A 或S - (A+B+C)或C B A ⋃⋃(6)A ,B ,C 中不多于一个发生,即A ,B ,C 中至少有两个同时不发生 相当于C A C B B A ,,中至少有一个发生。
故 表示为:C A C B B A ++。
(7)A ,B ,C 中不多于二个发生。
相当于:C B A ,,中至少有一个发生。
故 表示为:ABC C B A 或++ (8)A ,B ,C 中至少有二个发生。
相当于:AB ,BC ,AC 中至少有一个发生。
故 表示为:AB +BC +AC 3、设A ,B ,C 是三事件,且0)()(,41)()()(=====BC P AB P C P B P A P , 81)(=AC P . 求A ,B ,C 至少有一个发生的概率。
解:P (A ,B ,C 至少有一个发生)=P (A +B +C )= P (A )+ P (B )+ P (C )-P (AB )-P (BC )-P (AC )+ P (ABC )=8508143=+- 16、据以往资料表明,某一3口之家,患某种传染病的概率有以下规律:P (A )=P {孩子得病}=,P (B |A )=P {母亲得病|孩子得病}=,P (C |AB )=P {父亲得病|母亲及孩子得病}=。
求母亲及孩子得病但父亲未得病的概率。
解:所求概率为P (AB C )(注意:由于“母病”,“孩病”,“父病”都是随机事件,这里不是求P (C |AB )P (AB )= P (A )=P (B |A )=0.6×0.5=0.3, P (C |AB )=1-P (C |AB )=1-0.4=0.6. 从而P (AB C )= P (AB ) · P (C |AB )=0.3×0.6=0.18.17、已知10只晶体管中有2只次品,在其中取二次,每次随机地取一只,作不放回抽样,求下列事件的概率。
概率论与数理统计 五大数定理
,
i
1,2, , n, .
设Yn
Xi,
i 1
n
n
则: E Yn
i , D Yn
2 i
sn2 .
i 1
i 1
Zn
Yn
Yn
EYn DYn
1 sn
n i1
Xi
n i 1
i
1 n
sn i1
Xi i ,
则有:E(Zn ) 0, D( Zn ) 1.
11
林德伯格定理:
显然, 当n 时,P(Bn ) 1.
[注] 小概率事件尽管在个别试验中不可能发生,但在大量试验
中几乎必然发生。 10
第二节 中心极限定理
概率论中有关论证随机变量的和的极限分布是正态分布的定
理叫做中心极限定理。
设
X1
,
X
, , X , 是独立随机变量,并各有
2
n
n
EX i
i ,
DX i
2 i
的频率作为事件 A 的概率近似值时, 误差小于0.01的概率.
解
设事件A 在每次试验中发生的概率为 p,
在这10000次试验
中发生了X 次, 因此,所求事件的概率为
则 EX np 10000 p, DX 10000 p1 p,
P
X 10000
p
0.01 P
X 10000 p
100
P X EX 100 1 DX 1002
DX n
1 n2
nK
K n
由此,
当 n 充分大时,
随机变量
也就是说,
X 的值较紧密地聚集在它的数学期望 n
分散程度是很小的,
Xn
概率论与数理统计公式超全版
分布满足可加性:设
则
t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T服从自由度为n的t分布,记为T~t(n)。
F分布
设 ,且X与Y独立,可以证明 的概率密度函数为
我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母A,B,C,…表示事件,它们是 的子集。
为必然事件,?为不可能事件。
不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。
(6)事件的关系与运算
①关系:
如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):
几何分布
,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
设随机变量 的值只落在[a,b]内,其密度函数 在[a,b]上为常数 ,即
a≤x≤b
其他,
则称随机变量 在[a,b]上服从均匀分布,记为X~U(a,b)。
分布函数为
a≤x≤b
0,x<a,
?
1,x>b。
当a≤x1<x2≤b时,X落在区间( )内的概率为
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
连续型
在已知Y=y的条件下,X的条件分布密度为
;
在已知X=x的条件下,Y的条件分布密度为
(7)独立性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5.1 数理统计的基本概念
5.1.1 总体和样本
在实际中,我们把研究对象的全体组成的集合称 为总体;组成总体的每一个元素称为个体;总体 的一个子集称为样本。
在数学上,我们把随机变量X称为总体,并把随机 变量X的概率分布称为总体分布;把相互独立且与 总体X 同分布的随机变量(X1,X2,…,Xn)称 为来自总体X的一个简单随机样本;n称为样本容 量;把样本(X1,X2,…,Xn)的每一个具体值
区间估计是指根据估计可靠程度的要求,由样本确定 总体参数的一个区间范围。
5.3.2 参数的点估计 最常用的点估计方法:矩估计法和极大似然估计法。
一、矩估计法
矩估计法是用样本矩来估计总体矩,用样本矩的函数 来估计总体矩的相应函数的一种估计方法。
例7 设总体X服从参数为λ的指数分布,其中λ未知。 (X1,X2, ,Xn)是来自X的简单随机样本,求λ 的矩估计量 。
例4 根据例1(2)和例2中的数据,分别求其经验分布 函数。
§5.2 抽样分布
5.2.1 χ2分布
设(X1,X2,…,Xn)是来自正态总体N(0,1)的样 本,称统计量
χ2 =X12+X22+…+Xn2 服从自由度为n的χ2分布,记为χ2 ~ χ2(n)。
χ2分布上α分位点:对于给定的α(0<α<1),称满足条
(x1,x2,…,xn)称为样本(X1,X2,…,Xn)的 一组样本观测值或样本实现。
5.1.2 统计量
设(X1,X2,…,Xn)是来自总体X的一个简单随 机样本,称样本的函数T=g(X1,X2,…,Xn)为 统计量,如果它不依赖于任何未知参数。统计量的
具体值亦称做统计量的实现。
几个常用的统计量:
家庭数
18 35 76 24 19 14 14
求样本均值和样本方差近似值。 5.1.3 经验分布函数
对于任意实数x,设μn表示样本(X1,X2,…,Xn) 的n个观察值中不大于x的观察值的个数,则μn表 示在对总体X的n次独立重复观测中,事件{X≤x}出 现的次数。因此在对总体X的n次独立重复观测中, 事件{X≤x}出现的频率
n
L ( ) L(x1, x2 , , xn; ) f (xi ; ) i 1
为似然函数 。
对于给定的样本观测值(x1,x2, ,xn),使似
然函数L(θ)达到最大值的参数值 ˆ ,称为未知
参数θ的极大似然估计值,相应的统计量称为未知 参数θ的极大似然估计量。
极大似然估计量,可以用微积分中求函数的极大值 的方法来求.不过,这里求的不是函数的极大值, 而求是函数的极大值点。
件
P{ 2 2 (n)}
为χ2(n)分布的上α分位点。
5.2.2 t分布 随机变量X~N(0,1),Y~χ2(n),且X和Y相互独立,
则称随机变量 T X Yn
服从自由度为n的t分布,记为T~t(n)。 t分布上α分位点:对于给定的α(0<α<1),称满足条
件
P{t t (n)}
为t(n)分布的上α分位点。
统计假设的检验,简称假设检验,是指按照一定 规则即检验准则,根据样本来判断所作假设的真 伪,以决定接受还是否定假设。
(1)检验准则
检验准则,简称为检验,指接受还是否定假设所 依据的规则。检验准则通常用原假设的否定域来 表示。
否定域亦称拒绝域或临界域,假设H0的否定域是 样本空间的一个区域V,当样本值落入区域V时, 否定假设H0 。
ˆ
三、评价估计量的标准 1、无偏性
设ˆ 是未知参数θ的估计量,如果E ˆ=θ,则称 是ˆ θ
的无偏估计量。 例12 设X为任意总体,EX =μ,DX = σ2存在。(X1,
X2, ,Xn)是来自总体X的简单随机样本,证明 (1)样本均值是μ的无偏估计量;(2)样本方差 是σ2的无偏估计量。
2、有效性 设 ˆ1与 ˆ2 为未知参数θ的两个无偏估计量,如果
5.2.3 正态总体的抽样分布
设(X1,X2,…,Xn)是来自正态总体N(μ,σ2)的 一个样本,则
(1)样本均值 X ~ N (, 2 n)
(2)随机变量
2
(n 1)S 2
2
1
2
n
(Xi
i 1
X )2
~
2 (n 1)
(3)样本均值和样本方差相互独立
(4)随机变量 T X ~ t(n 1)
(2)假设检验的理论依据
小概率原则。所谓小概率原则,就是根据具体问 题的要求,指定一个可以认为“充分小”的数α (0<α<1),并且把概率不大于α的事件认为是 “实际不可能事件”,即认为这样的事件在一次 试验或观测中实际上不会出现。
4、假设检验的基本步骤
(1)根据实际问题的要求提出原假设H0和备择假设 H1,并且在作出最后的判断之前,将始终在假设 H0成立的假定下进行分析;
2、统计假设的基本类型
(1)参数假设与非参数假设 可以用有限个参数表示的统计假设称为参数假设, 否则称为非参数假设。
(2)原假设与备择假设 两个二者必居其一的假设,其中一个称做原假设, 习惯上记为H0;而另一个称做备择假设,习惯上 记为H1。原假设也称为零假设;备择假设也称为 对立假设。
3、统计假设的检验
P{ˆ1 ˆ2} 1
则称(随机)区间 (ˆ1,ˆ2 ) 称为参数θ的区间估计
或置信区间,称概率1-α为置信区间的置信度(水 平)。
二、一个正态均值μ的置信区间
1、 总体方差σ2已知
均值的1-α为置信区间为
( X u / 2
,X
n
u / 2
)
n
其中uα/2为标准正态分布双侧分位数。
例14 某企业生产的滚珠直径X服从N(μ,0.0006)。
Fn (x)
n (x)
nห้องสมุดไป่ตู้
称为总体X的经验分布函数或样本分布函数 。
对于给定的样本值(x1,x2,…,xn),经验分布函 数具有分布函数的一切性质,经验分布函数也是一 个阶梯型的函数;经验分布函数依概率收敛于总体 的分布函数。
经验分布函数依概率收敛于总体的分布函数这个结 论,为进行统计推断提供了依据。
的置信水平为0.95的置信区间。
三、一个总体方差σ2的置信区间
总体方差σ2的1-α置信区间为
(n
2 /
1)S 2 2 (n 1)
,
(n
2 1
1)S 2 /2 (n 1)
其中
2 p,
是是自由度为ν的χ2分布水平p的上侧分位数。
标准差的1-α置信区间为
(n 1)S 2
2 / 2 (n 1) ,
(n 1)S 2
2 1
/2
(n
1)
例16 从自动车床加工的一批零件中随机抽取了16件, 测得零件长度的平均值为2.125cm,标准差为 0.017cm。假设零件的长度服从正态分布,求零件 长度标准差的0.95置信区间。
§5.4 假设检验
一、假设检验的基本概念
1、统计假设的概念
统计假设是关于总体参数或数字特征、总体的分 布以及两个或两个以上总体之间的关系的一切论 断或命题,简称假设。通常用字母“H”表示假设。
Sn
例5 设总体X服从N(0,0.32),(X1,X2,…,X10) 是来自X的一个容量为10的样本,求概率
10
P{
X
2 i
1.44}
i 1
例6 假设一种电子元件的使用寿命X(小时)服从正
态分布N(3000,8002)。一名顾客购买了50个元
件,试求这50个元件的平均使用寿命超过3250的概
率。
最大统计量 X (n) max{ X 1, X 2 , , X n }
极差
R X (n) X (1)
例1 设假设总体X服从参数为p(0<p<1)的0-1分布, p未知。(X1,X2,…,X5)是来自X的简单随机 样本。
(1)指出X1+X3,min(X1,X2,…,X5),X5+2p (X5 -X2),X2-EX4,(X3-X5)2,中哪些是统计 量,哪些不是统计量 ?
D ˆ1 <D ˆ2 则称ˆ1 是比 ˆ2 有效的估计量。
在未知参数的任意两个无偏估计中,显然应该选更有 效的,即方差较小的。
3、一致性
设 ˆ 为未知参数θ的估计量,如果 依ˆ 概率收敛于θ,
则称 是θˆ的一致估计量。
例13 设X为任意总体,其k阶原点矩ak= EXk(k>0)
存 随 体k在机阶。样原设 本点( ,矩证Xa1,明k的X样无2,本偏k与阶,一原X致点n)估矩是计a来量k 自。1n总in体1 XXik的是简总单
例10 设总体X服从参数为p的0-1分布,求参数p的极 大似然估计量。
若从一大批产品中,用还原方法抽取了50件产品, 发现其中有2件是次品,求p的极大似然估计值。
例11 假设总体X~N(μ,σ2), μ与σ2都未知.试根
据来自X的简单随机样本(X1,X2, ,Xn),求 μ与σ2的极大似然估计量。
1、样本均值
X
1 n
n i 1
Xi
2、样本方差
S 2
1 n 1
n i 1
(Xi
X )2
3、样本标准差
S
1 n 1
n i 1
(Xi
X )2
4、样本k 阶原点矩
ak
1 n
n i 1
X
k i
5、样本k 阶中心矩
k
1 n
n
(Xi
i 1
X )k
6、顺序统计量 最小统计量 X (1) min{ X 1, X 2 , , X n }
由于lnx是x的严格单增函数,因此 L(θ)和ln L(θ)在同 一处取极大值,因此我们也称ln L(θ)为似然函数。