假设检验与置信区间
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验与置信区间
一、假设检验
•什么是假设检验呢(hypothesis testing)
(1)先是总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。
(2)逻辑上运用反证法,先认为假设成立,然后判断样板信息与假设是否矛盾,如果矛盾,就推翻原假设,否则不能拒绝原假设。
(3)统计上依据小概率原理。
1.原假设(null hypothesis)
(1)研究者想要收集证据予以反对的假设
(2)又称“0假设”
(3)总是有符号=、≤或≥
(4)表示为H0
假设检验
H0:μ=某一数值
指定为符号=、≤或≥ 例如H0=10cm
2.备择假设(alternative hypothesis)(1)研究者想要收集证据予以支持的假设(2)也称“对立假设”
(3)总是有符号≠、≤或≥
(4)表示为HA
HA:μ<某一数值,或>某一数值
例如:HA:μ<10cm,或μ>10cm
假设检验
•3.假设检验
(1)原假设和备择假设是一个完备事件组,而且相互对立。
(2)先确定备择假设,再确定原假设
(3)等号总是放在原假设上
(4)我们是对总体做检验
(5)因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)
假设检验
•
4.假设检验中的风险•
α=拒绝原假设,而实际上它为真的概率•
Α,第一类错误概率,也叫生产者的风险•β=无法拒绝原假设,而实际上它为假的概率
Β,第二类错误概率,也叫使用者的风险
被告的真正情况
无辜
有罪无辜(H 0)
正确判定错误(β)有罪(H A )错误(α)正确判定
判决真实统计学假设检验与美国司法体系的关系
假设检验
常用假设检验说明
序号
类型检验内容所用统计方法原假设(P》0.5)备择假设(P<0.5)正态性Anderson-Darling 数据是正态的数据不是正态的独立性游程数据是独立的数据不是独立的单样本或多样本平均值t检验μ值固定或μ1=μ2μ≠固定值或μ1≠μ2多组平均值ANOVA μ1=μ2=μ3=...μN 至少一对μ1≠μ23方差方差齐性
F检验(限二组正态独立)、Barlette,Levine σ1=σ2=σ3=..=σn 至少一对σ1≠σ2回归模型是否有效
ANOVA 回归模型无效回归模型有效a 0=0a 0≠0a 1=0a 1≠=0
a2=0a 2≠0
….….
a n =0a n ≠0
DOE模型是否有效ANOVA DOE模型无效DOE模型有效
失拟性F检验失拟性不存在失拟性存在
曲率F检验曲率不存在曲率存在
残差正态性Anderson-Darling 残差是正态的残差不是正态的
残差独立性游程残差是独立的残差不是独立的
a 0=0a 0≠0
a 1=0a 1≠=0
a2=0a 2≠0
….….t检验因子系数是否显著
5实验设计DOE 1
数据 平均值2
t检验因子系数是否显著回归4游程检验的含义?
置信区间
•含义
对于具有特定的发生概率的随机变量,其特定的价值区间-一个确定的数值范围。在一定置信水平时,以测量结果为中心,推断出的包括总体未知参数在内的可信范围。
为什么要关注置信区间(confidence interval )
基于以下理由:
像平均值()和标准差(s )这样的统计量仅仅是总体μ(m )和σ(s )的估计值,并且仅仅基于样本。因为样本与样本之间的估计值差别很大,运用基于统计基础的置信区间可以将我们的不确定性量化。大多数时候,我们计算95%的置信区间。
X
X
置信区间
•95%的样本平均值在总体平均值的两个标准差(2s )之内,理由为:正态曲线下面积分布,横轴区间μ±σ内面积为68.27%,横轴区间μ±1.64σ内的面积为90%,横轴区间μ±1.96σ内的面积为95%,横轴区间μ±2.58σ内的面积为99%。
• 1.平均值的置信区间
当我们估计流程绩效时,我们通过相对较小的流程样本来进行估计
对于Cp 和Cpk ,我们根据样本估计m 和s
所有的变异都有内部变异
2.参数置信区间
参数置信区间:当流程总体分布为正态或样本量大于30时,样本平均值呈现t 分布
平均值的参数置信区间的通用公式为
n
S t x n S t x 211n ,21ααμ---+≤≤-其中,xbar 是样本平均值,t 1-α/2,n -1是自由度为n-1,1-α/2处的t 值。
置信区间
•举例
已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命如下。建立该种灯泡平均使用寿命95%的置信区间。
1510152014801500
1450148015101520
1480149015301510
1460146014701470
置信区间
Minitab 求解
统计-基本统计量-单样本t
公式求解:
已知x~N (μ,δ2),n=16,1-α=95%,t 1-α/2=2.131带入公式
)2.1503,8.1476(2.1314901677.24*131.21490x 21=±=±=±-n s t α