数据分布与统计推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.期望值 E(T)=0 2.變異數 V(T)=v/(v-2),v>2
t(v)
α 0
3.為左右對稱的分配
4.當v → ∞,t 分配近似於標準 常態分配
t α ( v)
常見機率分配─t分配 (3)
設(X1,….,Xn)為抽自常態母體N(μ, σ2)之一組隨機 樣本, 則:
x- ~ t (n-1) 用來檢定母體平均數μ S/ n
九、举例: 某工序生产的螺栓长度服从参数μ=10.25, σ=0.06 的正态分布,规格为10.25±0.12。求其不合格率? 解:因为合格范围是[ 9.93 ,10.17 ], 则合格率为:P(9.93<=X<=10.17) =φ[(10.17-10.05 ) / 0.06 ]-φ[(9.93-10.05) / 0.06 ] =φ(2)-φ(-2) 所以,不合格率 = 1-[φ(2)-φ(-2)] = 2-2φ(2) = 2-2*0.9772499 = 4.55%
五、常用统计学种类
1、敘述統計(Descriptive Statistics) 樣本平均數、中位數、四分位數、 變異數、標準差……
2、推論統計(Deductive Statistics) 信賴區間估計(Confidence Interval)、 假設檢定(Hypothesis Test)
3、實驗設計 回歸分析(Regression)、 變異數分析(ANOVA,ANalysis Of VAriance)
2
則隨機變數F的機率分配是自由度v1與v2的F分 配,記為F~F(v1, v2)
常見機率分配─F分配 (2)
設(X1,….,Xn1)與(Y1,….,Yn2)為分別由常態母體 N(μ1, σ12)與N(μ2, σ22)抽出的兩組獨立的隨機樣本 , 則:
S2
1 2 1
S2
2 2 2
~ F ( n 1, n
n
2 ( x x ) i i 1
n
n
方差开方,总体标准差为:
2 ( x ) i N
四、正态分布的3σ原则:
对于任何正态分布的X~(μ、σ2)的随机变量X来说,不论 为何值,产品质量特性值 落在[μ-3σ、μ+3σ]范围的概率都是 99.73%。即它的值落在[μ-3σ、μ+3σ]区间内几乎是肯定的。统计 质量之父----休哈特正是利用了此原则发明控制图的。
三、正态的特点和性质: 特点----分布曲线有明显的中间高、两边低、左右对 称、两边延伸到无限的特点。 曲线用参数(μ、σ)来表示。
性质---1、曲线关于X=μ对称。 2、线在X=μ±σ处有拐点,以X轴为渐近线。 3、X=μ时曲线有最大值。σ越大、曲线越矮胖, σ越小、曲线越高瘦 无论参数μ、σ为何值都有P(X)>0(非负性)且 曲线下所覆盖面积等于1。
3 1
→平均=24;全距=54, =31.177
2 2 2 (6 - 24) (6 - 24) (60 - 24)
七、常見機率分配─常態分配(Normal Distribution)(1)
f ( x) 1 e 2
1 x 2 ( ) 2
,-∞<x<∞
常態分配特性:
1.期望值 E(x)=μ ….又稱 mean 2.變異數 V(x)=σ σ μ
3、参数和统计量: --总体特征值称为参数,如:总体均值、方 差;样本的特征数称为统计量,它是样本的函数,如: 样本均值、方差、极差等。 4、统计推断: --统计推断中存在两种分布,一是样本分布, 一是总体分布。从一个或一系列样本所得的统计量去 推断总体的结果,称为总体推断。统计推断包括假设 检验和参数估计两个基本点。 一般情况下,总体的μ、σ未知而通过样本的均值、 标准差来估计、推算总体的特征值的方法。
二、利用样本推断总体的理论基础: 大数定理----在抽样推断中,随着样本容量的增大 抽样平均数有接近于总体平均数的趋势。它揭示的是 大量实验中随机变量的平均结果。 中心极限定理----在抽样统计中,如果总体变量存 在着有限的平均值和方差,那么无论这个总体的分布 如何,随着样本容量的变大样本均值的分布总是趋于 正态分布。
2
3.為左右對稱的分配
常記為X~N(μ, σ2)
常見機率分配─常態分配(Normal Distribution)(2)
常態分配的機率分佈:
μ± σ…………68.27%
95.44% μ± 1.645σ…………90% μ± 1.96 σ…………95%
μ± 2
μ± 3
σ…………95.44%
σ…………99.73%
x i
n x
;則 x ~N(μ, ;則Z~N(0, 1)
~ N (0,1)
2
n
)
n
同理
x
Z稱為標準常態分配!!
常見機率分配─F分配 (1)
設
2 1 與
2 2 為獨立隨機變數,且
2 1
2 1 ~
(v1 )
2
2 2 2 ~ (v ) 2
又令: F
v v
1
2 2
2σ μ
2σ 1.5σ
μ± 6
σ…………(1-3.4PPM)?
1-0.002PPM
6σ
3.4ppm
μ
6σ
常見機率分配─常態分配(Normal Distribution)(3)
பைடு நூலகம்
若隨機變數X~N(μ, σ2),則
1.若Y=ΣXi ,i=1,2..,n;則Y~N(nμ, nσ2)
2.若 x 3.若 z
六、叙述统计介绍 --标准差与平均数
離散的程度:全距(Range)、標準差(Standard Deviation) 全距=最大值-最小值 2 ( xi x ) 樣本變異數Variance = ,i=1,2,…n
n 1
其中
x
x i
n
樣本標準差 s =
樣本變異數
三個樣本值分別為6, 6, 60 標準差s =
x Proof: z / n ~ N (0,1)
( n 1)s 2 2 (n 2
T Z W v
1)
X / n ( n 1) S 2
2
n 1
八、正态概率计算公式
1、P(X<=a) =φ[(x-μ)/ σ]
2、P(b<=X) =φ[(b-μ)/ σ] 3、P(a<=X<=b) =φ[(b-μ)/ σ] - φ[(x-μ)/ σ]
1
2
1)
用來檢定兩母體標準差是否相等(σ1= σ2)
常見機率分配─t分配 (1)
設Z與W為獨立的隨機變數,且Z~N(0, 1),W~ Z 2 ( v ) ,又令: T W v 則稱隨機變數T的機率分配,是自由度為v的 t分配,記為T~t(v)
常見機率分配─t分配 (2)
N(0,1)
t分配特性:
数字特征---1、μ 数学期望(平均值)-反映随机变量的集中趋势 离散型,N次测定值 X1 X2 X3.....XN
n次测定的平均值为: x 1 / n x i
1
n
2、σ方差-反映随机变量的离散程度 大样本服从正态分布。 离散型,总体方差为: 2
( xi )
i 1
n
2
一、统计基本概念 理论研究表明:如果一个随机变量受大量作用微小、 相互独立的随机因素影响, 则这个变量一般服从正态 分布,它两个相互独立参数是:μ和σ。前者描述的是样 本数据的集中位置(均值),后者是样本数据的分散程 度(标准差) 1、统计规律:
--大量同类随机现象所呈现出来的总体规律。 2、数理统计研究的对象 --研究随机现象规律性,统计规律性。通过对 局部进行次数有限的观测,从观测得到统计特征,去推 断事物的整体特征。
t(v)
α 0
3.為左右對稱的分配
4.當v → ∞,t 分配近似於標準 常態分配
t α ( v)
常見機率分配─t分配 (3)
設(X1,….,Xn)為抽自常態母體N(μ, σ2)之一組隨機 樣本, 則:
x- ~ t (n-1) 用來檢定母體平均數μ S/ n
九、举例: 某工序生产的螺栓长度服从参数μ=10.25, σ=0.06 的正态分布,规格为10.25±0.12。求其不合格率? 解:因为合格范围是[ 9.93 ,10.17 ], 则合格率为:P(9.93<=X<=10.17) =φ[(10.17-10.05 ) / 0.06 ]-φ[(9.93-10.05) / 0.06 ] =φ(2)-φ(-2) 所以,不合格率 = 1-[φ(2)-φ(-2)] = 2-2φ(2) = 2-2*0.9772499 = 4.55%
五、常用统计学种类
1、敘述統計(Descriptive Statistics) 樣本平均數、中位數、四分位數、 變異數、標準差……
2、推論統計(Deductive Statistics) 信賴區間估計(Confidence Interval)、 假設檢定(Hypothesis Test)
3、實驗設計 回歸分析(Regression)、 變異數分析(ANOVA,ANalysis Of VAriance)
2
則隨機變數F的機率分配是自由度v1與v2的F分 配,記為F~F(v1, v2)
常見機率分配─F分配 (2)
設(X1,….,Xn1)與(Y1,….,Yn2)為分別由常態母體 N(μ1, σ12)與N(μ2, σ22)抽出的兩組獨立的隨機樣本 , 則:
S2
1 2 1
S2
2 2 2
~ F ( n 1, n
n
2 ( x x ) i i 1
n
n
方差开方,总体标准差为:
2 ( x ) i N
四、正态分布的3σ原则:
对于任何正态分布的X~(μ、σ2)的随机变量X来说,不论 为何值,产品质量特性值 落在[μ-3σ、μ+3σ]范围的概率都是 99.73%。即它的值落在[μ-3σ、μ+3σ]区间内几乎是肯定的。统计 质量之父----休哈特正是利用了此原则发明控制图的。
三、正态的特点和性质: 特点----分布曲线有明显的中间高、两边低、左右对 称、两边延伸到无限的特点。 曲线用参数(μ、σ)来表示。
性质---1、曲线关于X=μ对称。 2、线在X=μ±σ处有拐点,以X轴为渐近线。 3、X=μ时曲线有最大值。σ越大、曲线越矮胖, σ越小、曲线越高瘦 无论参数μ、σ为何值都有P(X)>0(非负性)且 曲线下所覆盖面积等于1。
3 1
→平均=24;全距=54, =31.177
2 2 2 (6 - 24) (6 - 24) (60 - 24)
七、常見機率分配─常態分配(Normal Distribution)(1)
f ( x) 1 e 2
1 x 2 ( ) 2
,-∞<x<∞
常態分配特性:
1.期望值 E(x)=μ ….又稱 mean 2.變異數 V(x)=σ σ μ
3、参数和统计量: --总体特征值称为参数,如:总体均值、方 差;样本的特征数称为统计量,它是样本的函数,如: 样本均值、方差、极差等。 4、统计推断: --统计推断中存在两种分布,一是样本分布, 一是总体分布。从一个或一系列样本所得的统计量去 推断总体的结果,称为总体推断。统计推断包括假设 检验和参数估计两个基本点。 一般情况下,总体的μ、σ未知而通过样本的均值、 标准差来估计、推算总体的特征值的方法。
二、利用样本推断总体的理论基础: 大数定理----在抽样推断中,随着样本容量的增大 抽样平均数有接近于总体平均数的趋势。它揭示的是 大量实验中随机变量的平均结果。 中心极限定理----在抽样统计中,如果总体变量存 在着有限的平均值和方差,那么无论这个总体的分布 如何,随着样本容量的变大样本均值的分布总是趋于 正态分布。
2
3.為左右對稱的分配
常記為X~N(μ, σ2)
常見機率分配─常態分配(Normal Distribution)(2)
常態分配的機率分佈:
μ± σ…………68.27%
95.44% μ± 1.645σ…………90% μ± 1.96 σ…………95%
μ± 2
μ± 3
σ…………95.44%
σ…………99.73%
x i
n x
;則 x ~N(μ, ;則Z~N(0, 1)
~ N (0,1)
2
n
)
n
同理
x
Z稱為標準常態分配!!
常見機率分配─F分配 (1)
設
2 1 與
2 2 為獨立隨機變數,且
2 1
2 1 ~
(v1 )
2
2 2 2 ~ (v ) 2
又令: F
v v
1
2 2
2σ μ
2σ 1.5σ
μ± 6
σ…………(1-3.4PPM)?
1-0.002PPM
6σ
3.4ppm
μ
6σ
常見機率分配─常態分配(Normal Distribution)(3)
பைடு நூலகம்
若隨機變數X~N(μ, σ2),則
1.若Y=ΣXi ,i=1,2..,n;則Y~N(nμ, nσ2)
2.若 x 3.若 z
六、叙述统计介绍 --标准差与平均数
離散的程度:全距(Range)、標準差(Standard Deviation) 全距=最大值-最小值 2 ( xi x ) 樣本變異數Variance = ,i=1,2,…n
n 1
其中
x
x i
n
樣本標準差 s =
樣本變異數
三個樣本值分別為6, 6, 60 標準差s =
x Proof: z / n ~ N (0,1)
( n 1)s 2 2 (n 2
T Z W v
1)
X / n ( n 1) S 2
2
n 1
八、正态概率计算公式
1、P(X<=a) =φ[(x-μ)/ σ]
2、P(b<=X) =φ[(b-μ)/ σ] 3、P(a<=X<=b) =φ[(b-μ)/ σ] - φ[(x-μ)/ σ]
1
2
1)
用來檢定兩母體標準差是否相等(σ1= σ2)
常見機率分配─t分配 (1)
設Z與W為獨立的隨機變數,且Z~N(0, 1),W~ Z 2 ( v ) ,又令: T W v 則稱隨機變數T的機率分配,是自由度為v的 t分配,記為T~t(v)
常見機率分配─t分配 (2)
N(0,1)
t分配特性:
数字特征---1、μ 数学期望(平均值)-反映随机变量的集中趋势 离散型,N次测定值 X1 X2 X3.....XN
n次测定的平均值为: x 1 / n x i
1
n
2、σ方差-反映随机变量的离散程度 大样本服从正态分布。 离散型,总体方差为: 2
( xi )
i 1
n
2
一、统计基本概念 理论研究表明:如果一个随机变量受大量作用微小、 相互独立的随机因素影响, 则这个变量一般服从正态 分布,它两个相互独立参数是:μ和σ。前者描述的是样 本数据的集中位置(均值),后者是样本数据的分散程 度(标准差) 1、统计规律:
--大量同类随机现象所呈现出来的总体规律。 2、数理统计研究的对象 --研究随机现象规律性,统计规律性。通过对 局部进行次数有限的观测,从观测得到统计特征,去推 断事物的整体特征。