统计学第5-6章 正态分布、 统计量及其抽样分布
概率论与数理统计第六章统计量,样本及抽样分布
(2) X 1
~
2 (n1 ),
X2
~
2 (n2 ),
X1,
X
独
2
立
,
则
X 1 X 2 ~ 2 (n1 n2 ).
(3) X ~ 2 (n), E( X ) n, D( X ) 2n,
.
2021/3/11
20
(4). 2分布的分位点
对于给定的正数,0 1,
称满足条件
P
2 2 (n)
k 1
,
X
k 2
,,
X
k n
独立且与X
k同分布,
E
(
X
k i
)
k
k 1,2,,n 再由辛钦大数定律可得上述结论.
再由依概率收敛性质知,可将上述性质推广为
g( A1, A2 ,, Ak ) p g(1,2 ,,k ) 其中g为连续函数.
这就是矩估计法的理论根据.
2021/3/11
18
皮肌炎图片——皮肌炎的症状表现 数理统计
10
3. 总体、样本、样本值的关系
事实上我们抽样后得到的资料都是具体的、确 定的值. 如我们从某班大学生中抽取10人测量身高, 得到10个数,它们是样本取到的值而不是样本. 我 们只能观察到随机变量取的值而见不到随机变量.
2021/3/11
11
总体(理论分布) ?
样本
样本值
统计是从手中已有的资料--样本值,去推断总 体的情况---总体分布F(x)的性质.
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再由函数的性质有
lim h(t)
n
1 et2 2. 2
第5章--抽样分布与参数估计教案资料
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
《正态分布》说课稿
《正态分布》说课稿正态分布是统计学中非常重要的一个概念,它描述了大量随机变量的分布规律,被广泛应用于各个领域的数据分析和预测中。
本文将介绍正态分布的基本概念、性质、应用以及如何利用正态分布进行统计推断。
一、正态分布的基本概念1.1 正态分布的定义:正态分布又称高斯分布,是一种连续概率分布,其概率密度函数呈钟形曲线,左右对称,中间最高。
1.2 正态分布的特点:正态分布具有唯一的均值和标准差,均值决定了曲线的中心位置,标准差决定了曲线的宽度。
1.3 正态分布的标准化:通过标准化可以将正态分布转化为标准正态分布,即均值为0,标准差为1的正态分布。
二、正态分布的性质2.1 正态分布的均值和中位数相等:正态分布的均值和中位数相等,即曲线对称中心位置处的值。
2.2 正态分布的68-95-99.7法则:约68%的数据落在均值附近的一个标准差范围内,约95%的数据落在两个标准差范围内,约99.7%的数据落在三个标准差范围内。
2.3 正态分布的线性组合仍然是正态分布:对于正态分布的线性组合,如两个正态分布的和或差,仍然是正态分布。
三、正态分布的应用3.1 在自然科学中的应用:正态分布常用于测量误差、实验数据分析等领域,如物理学、化学等。
3.2 在社会科学中的应用:正态分布被广泛应用于人口统计、心理学研究、经济学分析等领域。
3.3 在工程技术中的应用:正态分布在质量控制、可靠性分析、风险评估等方面有重要应用。
四、利用正态分布进行统计推断4.1 正态分布的参数估计:通过样本数据估计总体的均值和标准差,得到对总体的估计。
4.2 正态分布的假设检验:利用正态分布进行假设检验,判断总体参数是否符合某种假设。
4.3 正态分布的置信区间估计:通过正态分布的性质,构建总体参数的置信区间,对总体参数进行估计。
五、结语正态分布作为统计学中重要的概念,具有丰富的性质和广泛的应用。
通过深入理解正态分布的基本概念和性质,我们可以更好地应用正态分布进行数据分析和推断,为各个领域的研究和实践提供有力支持。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
统计学第五章
2-分布
(性质和特点)
• 1. 期望为:E(2)=n,
•
方差为:D(2)=2n(n为自由度)
• 2. 可加性:
•
若U和V为两个独立的2分布随机变量,
U~2(n1),V~2(n2),则U+V这一随机变量服从 自由度为n1+n2的2分布
• 3. 当 n 时, 2分布的极限分布是正态
分布
不同自由度的2-分布
(central limit theorem)
从均值为,方差为 2的一个任意总体中抽取容量
为n的样本,当n充分大时,样本均值的抽样分布近 似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
中心极限定理
(2)系统抽样的评价 ——操作上简便易行 ——如果总体是按有关标志进行排列的话,可以提 高样本的代表性,改进抽样精度 ——对估计量方差的估计比较困难
4、整群抽样(cluster random sampling) (1)整群抽样的概念
整群抽样是指将总体分成群,从中随机抽取 若干群,群中的所有单位构成样本
E(x)
2 x
2
n
样本比例的分布
(proportion)
1. 总体(或样本)中具有某种属性的单位与全部单位 总数之比
– 不同性别的人与全部人数之比
– 合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
N0 或 1 N1
N
N
3. 样本比例可表示为
4.
p n0 或 1 p n1
2. 一种理论概率分布
2021统计学原理-《统计学》第五章统计量及其抽样分布试题(精选试题)
统计学原理-《统计学》第五章统计量及其抽样分布试题1、智商的得分服从均值为100,标准差为16的正态分布。
从总体中抽取一个容量为n的样本,样本均值的标准差为2,样本容量为____________。
2、样本均值与总体均值之间的差被称作____________。
3、从均值为50,标准差为5的无限总体中抽取容量为30的样本,则抽样分布的超过51的概率为____________。
4、某校大学生中,外国留学生占10%。
随机从该校学生中抽取100名学生,则样本中外国留学生比例的标准差为____________。
5、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。
A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从x²分布6、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。
A.保持不变B.增加C.减小D.无法确定7、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。
A.50,8B.50,1C.50,4D.8,88、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。
如果从中随机抽取30只灯泡进行检测,则样本均值( )。
A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时9、假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。
如果随机抽取100名学生,下列关于样本均值抽样分布描述不正确的是( )。
A.抽样分布的标准差等于3B.抽样分布近似服从正态分布C.抽样分布的均值近似为23D.抽样分布为非正态分布10、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望是( )。
A.150B.200C.100D.25011、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。
统计学第五版课后答案(贾俊平)之欧阳术创编
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:StatisticsMissing0Mean9.60Median10.00Mode10Std. Deviation 4.169Percentiles25 6.255010.007512.504.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 最小值)÷ 组数=(4115)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
河南科技大学2024年研究生自命题大纲 432 统计学考试大纲
河南科技大学2024年硕士生招生考试初试自命题科目考试大纲明栏里加备注。
河南科技大学硕士研究生招生考试《统计学》考试大纲考试科目代码:432 考试科目名称:统计学一、考试基本要求及适用范围概述掌握课程内容的基本理论和基本方法,具备学习统计学基础课、专业课的理解能力、解题表达叙述能力、计算能力、逻辑推理能力以及严谨的作风和严密的思想方法,进而培养抽象思维能力。
熟悉和掌握统计学的思维方法和研究方法具备解决问题的基本技能。
二、考试形式本课程考试形式为闭卷笔试,考试时间180分钟,总分150分。
三、考试内容第1章导论主要内容:统计及其应用领域,统计数据的类型,统计中的几个基本概念。
重点内容:统计数据的类型,统计中的几个基本概念。
第2章数据的搜集主要内容:数据的来源,调查数据,实验数据,数据的误差。
重点内容:调查数据,实验数据,数据的误差。
第3章数据的图表展示主要内容:数据的预处理,品质数据的整理与展示,数值型数据的整理与展示,合理使用图表。
第4章数据的概括性度量主要内容:集中趋势的度量,离散程度的度量,偏态与峰态的度量。
重点内容:集中趋势的度量,离散程度的度量,偏态与峰态的度量。
第5章概率与概率分布主要内容:随机事件及其概率,概率的性质与运算法则,离散型随机变量及其分布,连续型随机变量的概率分布。
重点内容:离散型随机变量及其分布,连续型随机变量的概率分布。
第6章统计量及其抽样分布主要内容:统计量,关于分布的几个概念,由正态分布导出的几个重要分布,样本均值的分布与中心极限定理,样本比例的抽样分布,两个样本平均值之差的分布,关于样本方差的分布。
重点内容:由正态分布导出的几个重要分布,样本均值的分布与中心极限定理,样本比例的抽样分布,两个样本平均值之差的分布,关于样本方差的分布。
第7章参数估计主要内容:参数估计的基本原理,一个总体参数的区间估计,两个总体参数的区间估计,样本量的确定。
重点内容:参数估计的基本原理,一个总体参数的区间估计,样本量的确定。
贾俊平《统计学》第五版第6章_统计量及其抽样分布
6. 3. 3 F分布 定义6.5 设随机变量Y与Z相互独立,且Y与Z分别服从自 由度为m和n的 2 分布
Y ~ 2 (m)
Z ~ 2 (n)
(6. 5)
Y/m nY 则称 X Z/n mZ
X服从第一自由度为m,第二自由度为n的F分布,记为 F(m,n),简记为X~F(m,n) 。
1 ( X i X )2 n 1 i1
2 2 (n 1)S x (m 1)S y
n
Sy
2
1 m (Yi Y )2 m 1 i1
S xy
nm2
6 - 23
( X Y ) ( 1 2 ) mn ~ t (n m 2) (6. 4) S xy mn
6-3
统计学(第三版)
6. 1
统计量
6. 1 统计量
6.1.1 统计量的概念 统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6-5
统计学(第三版)
统计学(第三版)
6.3 由正态分布得到的几个重要分布
证明:
X 1 1 X , Y i Yi n i 1 m i 1
n m
Sx
2
1 n 1 m 2 2 (Xi X ) , Sy (Yi Y ) 2 n 1 i 1 m 1 i 1
2
(n 1) S x
但对于较小的 n, t分布与N(0,1) 分布相差很大.
6 - 20
统计学(第三版)
6.3 由正态分布得到的几个重要分布
统计量及其分布ppt课件
图5.1.1 SONY彩电彩色浓度分布图q
表5.1.1 各等级彩电的比例(%)
等级
I
|X-m|<5/3
II
III
5/3<|X-m|<10/3 10/3 <|X-m|<5
IV
|X-m|>5
美产 33.3 33.3 33.3
0
日产 68.3 27.1 4.3
0.3
抽样 :
5.1.2 样本
要了解总体的分布规律,在统计分析工作中,往往 是从总体中抽取一部分个体进行观测,这个过程称为抽 样。样本
x 344 344 x 347 347 x 351 351 x 355
x 355
由伯努里大数定律:
第25页
两点分布,只要 n 相当大,Fn(x)依概率收敛于F(x) 。
更深刻的结论:格里纹科定理
定理5.2.1 设 x1,x2,L,xn 是取自总体分布函数为F(x) 的样本F,n ( x ) 为其经验分布函数,当n 时,有
若以 p 表示这堆数中1的比例(不合格品率), 则该总体可由一个二点分布表示:
X01 P 1p p
比如:两个生产同类产品的工厂的产品 的总体分布:
例5.1.2 在二十世纪七十年代后期,美国消费者购买
日产SONY彩电的热情高于购买美产 SONY彩电,原因何在?
原因在于总体的差异上!
➢ 1979年4月17日日本《朝日新闻》刊登调查报 告指出N(m, (5/3)2),日产SONY彩电的彩色浓 度服从正态分布,而美产SONY彩电的彩色浓 度服从(m5 , m+5)上的均匀分布。
元件数 4 8 6 5 3 4 5 4
寿命范围 (192 216] (216 240] (240 264] (264 288] (288 312] (312 336] (336 360] (360 184]
三大分布及正态总体统计量的分布
泊松分布在统计学中的应用
01
在计数数据分析和可靠性工程中,泊松分布在预测和解释随机 事件发生的频率方面非常有用。
02
在生物统计学中,泊松分布用于描述遗传变异和基因突变的频
率。
在物理学中,泊松分布用于描述放射性衰变和粒子碰撞的次数。
03
泊松分布的参数
λ
事件的平均发生率,决定了泊 松分布的形状和规模。
p
每次试验成功的概率,是一 个0到1之间的实数。
k
成功的次数,是一个0到n之 间的非负整数。
04
正态总体统计量的分布
样本均值的分布
1
样本均值是总体均值的无偏估计,其分布近似于 正态分布,当样本量足够大时,样本均值的分布具有对称性,即均值点是其对称 轴,标准差越小,分布越集中,对称性越好。
3
样本均值的标准误是衡量样本均值与总体均值差 异的指标,其计算公式为标准差除以样本量的平 方根。
样本方差的分布
01
样本方差是总体方差的估计量,其分布并不服从正 态分布,而是卡方分布。
02
样本方差的大小与样本量有关,样本量越大,方差 越小;样本量越小,方差越大。
03
样本方差的自由度等于样本量减去1。
二项分布在统计学中的应用
01
可靠性分析
在可靠性工程中,二项分布用于 描述产品在多次试验中失败的次 数。
遗传学
02
03
统计学
在遗传学中,二项分布用于描述 在n次独立重复的遗传试验中某 基因出现的次数。
在统计学中,二项分布用于描述 在n次独立重复的伯努利试验中 成功的次数。
二项分布的参数
n
试验次数,是一个非负整数 。
正态分布的性质
第六章 统计量及其
D( X (1) X ( 2) ) D( X (1) ) D( X ( 2) ) n1 n2 2 2 X1 X 2 ~ N ( 1 2 , 1 2 ) n1 n2
解:设600份报表中至少有一处错误的报表所 ˆ ,由题意知: p 占的比例为 p ˆ 0.02
p ˆ (1 )
n 0.02 (1 0.02) 0.0057 600
由中心极限定理, 有 (1 ) 2 ˆ N ( , ) p ˆ 即 ~ N (0.02,0.0057 ) p~ n 从而所求概率为:
即该统计人员所填写的报表中至少有一处错误的报 表所占的比例在0.025~0.070之间的概率为 19.02%。
第六节两个样本均值之差的分布
• 两个正态总体 2 (1) (1) (1) N ( ,1 )的一个 设 X 是独立地抽自总体 X ~ ) X ( 2是是独立地 容量为n1 的样本的样本均值, 抽自总体 X ( 2) ~N ( (1) , 2 2 ) 的一个容量为 n2 的样本的样本均值, 则有
(1)
( 2)
D( X
(1)
( 2)
) D( X ) D( X
(1)
( 2)
)
2 1
n1
2 2
n2
例6.8 甲、乙两所高校在某年录取新生时,甲 校的平均分为655分,且服从正态分布,标 准差为20分;乙校的平均分为625分,也服 从正态分布,标准差为25分.现从甲乙两校 各随机抽取8名新生计算其平均分数,出现 甲校比乙校的平均分低的可能性有多大? 解:因为两个总体均为正态分布,所以8名新 生的平均成绩X (1) , X (2) 也分别为正态分布, X (1) X ( 2 ) 也为正态分布,且 2 2 X (1) X ( 2 ) ~ N ( (1) ( 2) , 1 2 )
统计学著作
统计学著作
- 《统计学》(第7版):共十四章,第1章介绍统计的应用领域和数据类型等基本概念;第2~4章,介绍数据的搜集方法,数据的图表展示方式和数据的概括性度量等内容;第5~6章,介绍概率与概率分布、统计量及其抽样分布的变量和操作;第7~8章,介绍参数估计及其假设检验说明;第9~10章,介绍分类数据和方差两种分析方法;第11~12章,介绍一元线性和多元线性的两种回归预测方式;第13~14章,介绍时间序列分析和预测,各方面指数知识点。
- 《回归分析与经济数据建模》:作者何晓群,该书介绍了回归分析方法以及如何运用回归分析方法对经济数据进行建模,并通过实例演示了如何使用统计软件进行数据分析和模型诊断。
- 《多元统计分析》:作者何晓群,该书系统地介绍了多元统计分析的基本理论和方法,包括多元正态分布、多元统计推断、聚类分析、判别分析、主成分分析、因子分析、对应分析等内容。
- 《六西格玛管理理论与实践探索》:作者何晓群,该书以质量管理的科学理论和统计技术为基础,结合作者的实践经验,详细阐述了六西格玛管理的理念、方法和工具,并通过大量的案例分析,帮助读者更好地理解和应用六西格玛管理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5-6章 统计量及其抽样分布5.1正态分布5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。
概率密度曲线图例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量如果随机变量X 的概率密度为22()21(),2x f x ex μσπσ--=-∞<<∞则称X 服从正态分布。
记做2(,)X N μσ:,读作:随机变量X 服从均值为μ,方差为2σ的正态分布 其中,μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X的标准差5.1.2正态密度函数f(x)的一些特点:()0f x≥,即整个概率密度曲线都在x轴的上方。
曲线()f x相对于xμ=对称,并在xμ=处达到最大值,1()2fμπσ=。
1μ<2μ<3μ曲线的陡缓程度由σ决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当x趋于无穷时,曲线以x轴为其渐近线。
标准正态分布当0,1μσ==时,221()2xf x eπ-=,x-∞<<∞称(0,1)N为标准正态分布。
标准正态分布的概率密度函数:()xϕ标准正态分布的分布函数:()xΦ任何一个正态分布都可以通过线性变换转化为标准正态分布设2(,)X Nμσ:,则(0,1)XZ Nμσ-=:变量211(,)X Nμσ:与变量222(,)Y Nμσ:相互独立,则有221212+(+,+)X Y Nμμσσ:5.1.3 正态分布表:可以查的正态分布的概率值()1()x xΦ-=-Φ例:设(0,1)X N :,求以下概率(1)( 1.5)P X <(2) (2)P X >(3) (13)P X -<≤(4)(2)P X ≤解:(1) 1.5( 1.5)()(1.5)0.9332P X t dt ϕ-∞<==Φ=⎰(2)(2)1(2)1210.97730.0227P X P X >=-≤=-Φ=-=() (3)(13)(3)(1)(3)(1)(3)(1(1))0.9987(10.8413)0.84P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)(2)(22)(2)(2)(2)(1(2))2(2)10.9545P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=一般,若(0,1)X N :,则有()()()P a X b b a <≤=Φ-Φ()2()1P X a a ≤=Φ-例 设2(5,3)X N :,求以下概率(1)(10)P X ≤(2)(210)P X <<(3)(28)P X ≤≤(4)(56)P X -≤ (5)(59)P X -≤解:由2(5,3)X N :,5(0,1)3X N -: (1)1.675105(10)()335( 1.67)3()(1.67)0.9522X P X P X P t dt ϕ-∞--≤=≤-=≤==Φ=⎰(2)255105(210)()3335(1 1.67)3(1.67)(1)0.7938X P X P X P ---<<=<<-=-<<=Φ-Φ-=(3)25585(28)()3335(11)32(1)120.841310.6826X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=⨯-=(4)56(56)()335(2)32(2)120.977210.9544X P X P X P --≤=≤-=≤=Φ-=⨯-=(5)5(59)(3)32(3)120.998710.9974X P X P --≤=≤=Φ-=⨯-=一般,若2(,)X N μσ:,则有 ()()()b a P a X b μμσσ--<≤=Φ-Φ5.1.4 3σ准则若(0,1)X N :,则有(1)2(1)10.6826P X ≤=Φ-=(2)2(2)10.9545P X ≤=Φ-=(3)2(3)10.9973P X ≤=Φ-=即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%至一般正态总体,即2(,)X N μσ:,有()0.6826P X μσ-≤=(2)0.9545P X μσ-≤=(3)0.9973P X μσ-≤=显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在区间(3,3)μσμσ-+内——统计学的“3σ准则”5.1.5 正态分布函数的一个重要性质设变量211(,)X N μσ:,222(,)Y N μσ~,X 与Y 相互独立,则有221212+(+,+)X Y N μμσσ:221212-(-,+)X Y N μμσσ:5.1.6 求分位数Z α设()0,1X N :()()Z P X Z x dx ααϕα∞≥==⎰1-=-Z Z αα常用的几个Z 分位数:0.050.0251.64, 1.96Z Z ==0.950.975-1.64,-1.96Z Z ==5.2 由正态分布导出的几个重要分布三大分布:2,,t F χ分布5.2.12χ分布1 定义:设随机变量12,,,nX X X L 相互独立,且(0,1)i X N :(1,2,,)i n =L ,则它们的平方和服从自由度为n 的2x分布。
记做,22()i Xn χ∑:22x 分布的密度函数图形图形特点:(1)2x分布的变量值始终为正。
(2)2x分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,随着自由度的增大逐渐趋于对称。
(3)2x分布的期望为2()E n χ=,方差为2()2D n χ=(n 为自由度)。
(4)2x分布具有可加性。
若X Y与是相互独立的随机变量,21~(),X x n 22~()Y x n ,则它们的和服从于自由度为12n n +的2x分布,即212~()X Y x n n ++。
32x分布临界值表的使用,求得2x分布的分位数2x分布临界值表中给出的是概率为α时,2x α的取值,k 是自由度。
222()()x P x x f x dx ααα+∞≥==⎰x α例如,若随机变量2(10)X χ:,则查表可得20.05(10) 3.94χ=,20.95(10)18.307χ=,5.2.2 t 分布(student 分布)设随机变量,X Y互相独立,2~(0,1),~()X N Y x n ,则随机变量~()X t t n =——自由度为n 的t 分布t 分布概率密度函数图特点:① 关于y 轴对称,与标准正态分布的密度函数的图像非常相似。
② 厚尾:当x →∞时,t 分布的密度函数趋于0的速度要比标准正态分布密度函数慢,所以t 分布的密度函数的尾部要比(0,1)N 密度的尾部厚些。
③ 当自由度n 无限增大时,t 分布将趋近于标准正态分布。
所以,当n 很大时,t 分布可以用标准正态分布近似。
记()t n α为分布()t n 的α分位数。
在实际使用中,当30n ≥,就近似有 ()t n Z αα≈α由于t 分布密度曲线的对称性,可得1()()t n t n αα-=-例如,若随机变量(15)T t :,查表可得,0.05(15) 1.7531t =,而0.950.05(15)(15) 1.76531tt =-=-0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。
5.2.3 F分布设随机变量X与Y相互独立且分别服从自由度为m和n的2χ分布。
则随机变量//X mFY n=服从第一自由度为m第二自由度为n的F分布。
记为()F F m n:,xF分布的概率密度函数的图设随机变量(,) F F m n :,(,)F m nα表示分布(,)F m n的α分位数,α可以证明11(,)(,)F m n F n m αα-=例如查表得0.95F (8,9)=3.23,则0.050.950.31F F =11(9,8)==(8,9) 3.235.6 小概率原理指发生概率很小的随机事件在一次实验中几乎不可能出现。
6.1 统计量定义:设12,,,n X X X L 是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个不依赖于任何未知参数的函数12(,,,)n T X X X L ,则称函数12(,,,)n T X X X L 是一个统计量。
特点:由样本构造而得,是样本的函数 不含任何未知的参数当获得样本的一组具体观测值12(,,,)n x x x L ,带入T,计算出12(,,,)n T x x x L 的数值,称为统计量的值常用的统计量2,X S6.2 抽样分布抽样分布:统计量的分布 随机变量X精确分布:可以得到分布的数学表达式渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。
设()12,,,n X X X L 是取自总体X的一个样本,记()i E X μ=,2()i D X σ=,那么①()E X μ=,2()D X nσ=②22()E sσ=,221()nn E s nσ-= ③ 当n →∞时,PX μ−−→ lim ()1n P X με→∞-<=④ 当n →∞时,22P s σ−−→,22P n s σ−−→定理2:设()12,,,n X X X L 是取自正态总体2(,)N μσ的一个样本 ①2(,)X N n σμ:,或等价地(0,1)X N μ-:② 2222222()(1)(1)in X X nsn sn χσσσ--==-∑:③ X 与2s 相互独立设()12,,,nX X XL是取自正态总体2(,)Nμσ的一个样本,那么(1)Xt nμ--:简要证明:2(,)X Nμσ:(0,1)XN⇒:222(1)(1)n snχσ--:(1)Xt nμ-⇒-:独立(t分布的定义)即(1)Xt nμ--:推论2设()12,,,mX X XL是取自正态总体211(,)Nμσ的一个样本,()12,,,nY Y YL是取自正态总体222(,)Nμσ的一个样本,X与Y 相互独立,那么()()(0,1)X Y N μμ---:简要证明:211(,)X N μσ:211(,)X N m σμ⇒:222(,)Y N μσ:222(,)Y N nσμ⇒:独立,221212(,)X Y N mnσσμμ--+:12()()(0,1)X Y N μμ---:推论3:设()12,,,m X X X L 是取自正态总体21(,)N μσ的一个样本,()12,,,n Y Y Y L 是取自正态总体22(,)N μσ的一个样本,X 与Y 相互独立,那么()()(2)X Y t m n μμ---+-:其中,22212(1)(1)(2)pm s n s s m n -+-=+-简要证明:21(,)X N μσ:21(,)X N mσμ⇒:22(,)Y N μσ:22(,)Y N nσμ⇒:独立,2212(,)X Y N mnσσμμ--+:2212(1)(1)m sm χσ--:2222(1)(1)n sn χσ--:可加性2221222(1)(1)(2)m sn sm n χσσ--++-:()()(2)X Y t m n μμ---⇒+-:整理得()()(2)X Y t m n μμ---⇒+-:设22212(1)(1)(2)pm s n s s m n -+-=+-即()()(2)X Y t m n μμ---+-:推论4:设()12,,,m X X X L 是取自正态总体211(,)N μσ的一个样本, ()12,,,n Y Y Y L 是取自正态总体222(,)N μσ的一个样本,X与Y 相互独立,那么22112222/(1,1)/s F m n s σσ--: 简要证明: 正态211(,)X N μσ:22121(1)(1)m s m χσ-⇒-:222(,)Y N μσ:22222(1)(1)n s n χσ-⇒-:21212222(1)/(1)(1,1)(1)/(1)m s m F m n n sn σσ--⇒----:即22112222/(1,1)/s F m n s σσ--:非正态总体的情形定理:设()12,,,n X X X L 是取自总体X的一个样本,当n 较大时,近似地有①(0,1) XNμ-:②(0,1) XNμ-:(此文档部分内容来源于网络,如有侵权请告知删除,文档可自行编辑修改内容,供参考,感谢您的配合和支持)编辑版word。