金融统计03-假设检验与方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 工厂对收到的一批长度为2cm的零件抽检,检验 长度是否合格?
– 检验假设的设定:设u为平均长度,则 H 0:u2 H 1:u2
– 双边检验(同时检验小于、大于检验值的两种情况, 常用)
源自文库
整理ppt
4
假设检验的标准:显著水平
显著水平的定义
– 假设检验中的第一类错误(type I error):拒绝正确的原 假设(H0)
μ0 等于原假设的,比如10 – 从t分布表查出某一显著水平(比如5%)的临
界值t0.05 – 比较换算的t值与临界值t0.05 。如果|t值|> t0.05 ,
则拒绝原假设,反之,接受原假设
整理ppt
8
单边95t2.拒0概率显著临值绝界域值(t检约为验-22)示) 意图(双边检验,显著水平设为5%)
第3章 假设检验与方差分析
• 第1节 假设检验
• 第2节 方差分析
• 第3节 方差分析应用:恩格尔系数 的城乡比较
整理ppt
1
第1节 假设检验
• 主要内容
– 假设检验的概念 – 假设检验的标准 – 假设检验的步骤
整理ppt
2
假设检验的概念及形式
• 假设检验
– 对总体的某个参数或分布形式作出某种假设,然后利用 样本信息来判断假设是否成立
– 显著水平指犯第一类错误的最大概率,通常设定为5% 或1%
• 显著水平的理解
– 形象的说,显著水平为1%是指,拒绝100次原假设, 只有1次是拒绝错了(即只有1次原假设确实正确)
– 因为原假设往往是公认的观点、成熟的理论,甚至已 经反复检验证明是正确的,所以为了加强拒绝的说服
力,应设定一个严格的拒绝标准,即要将显著水平设 的很小
– 上述t值公式就是将样本均值换算成一个标准化的t值, 这与将正态变量换算成标准正态变量一样,所以t分布 的中心为0
– 显然,t值的绝对值越大,样本均值离原假设H0的值越
远,样本越不支持原假整设理ppt
7
显著水平的运用: t 检验
• 显著水平在t 检验中的运用过程如下:
– 假定原假设成立,比如 H0:u10 – 将样本统计量的值按前述公式换算成t值,其中
检验%5%水平 示 意 图
• 将样本均值换算成标准化的t值,如果|t值|>临界值,表明样本均值离原假
设的总体均值很远,样本来自于这个总体的可能性很小,于是原假设(H0)
成立的概率也很小,所以拒绝H0 整理ppt
9
假设检验的实用标准:P值
• 根据样本值计算的显著水平又称为P值
– 比如:5%显著水平下的临界值为4,而实际的样本均 值为3,小于临界值,则P值也小于5%(比如4%等)
– 显著水平越小,原假设值的允许变动范围就越大,备
择假设成立的范围就越小,备择假设成立的概率就越
小。如果能成立,则结论就很有说服力
整理ppt
5
某品491原冰概率显著0箱假使设用H0年=限不10 即同假显设某著品牌水合格平的比较(单边检验)
牌冰水平54
箱%0 总%
图中4为5%的临界值 9为40%的临界值
• (4)查表确定与显著水平相对应的t分布的临界值
• (5)将要检验的统计量换算成标准化的t值
• (6)根据要检验的统计量的|t值|大于还是小于临界 值,决定是否拒绝原假设( H0 )
• 如果使用统计软件,则只要(1)、(2)、(3) 步,然后看输出的P值是否小于显著水平决定是 否拒绝原假设
整理ppt
体
的
特
征
• 假设国家标准规定冰箱使用年限必须10年或以上
• 对某品牌抽样检验时,如果显著水平设为40%,则样本均值9年或以下
即可认定为不合格。显著水平设为5%,则样本均值4年或以下才可认
定为不合格,相当于把原假设放整理宽pp到t H0>4,更有说服力
6
显著水平的运用:t 统计量
• t 统计量的定义
– 假定总体服从正态分布,则抽取的样本的平均值可用 下列公式换算成t 分布的值(简称t值),该值可用来判 断样本平均值相对于总体平均值的误差程度
t x0.
s/ n
其中 x为样本均值 0为, 总体均 n为 值样 ,本
个体数s量 为, 样本的标 ,s/准n差 为样本均值的标准差
• t 统计量公式的理解
– 公式中总体均值μ0在假设检验时,等于原假设H0的值
• 统计软件作检验时,通常会根据样本值计算相应 的P值,所以一般直接使用P值作为假设检验的标
准,非常方便
• 判断原理如下
– 如果P值≤1%,则检验值在1%水平显著,拒绝H0 – 如果1%<P值≤5%,则检验值在5%水平显著,拒绝H0 – 如果P值>5%,则检验值不显著,接受H0
整理ppt
10
P值与t 统计量
• 假设检验的形式
– 假设分为原假设(H0)和备择假设(H1)两种 – 原假设(Null hypothesis):初始假定为真的假设
– 备择假设(Alternative hypothesis):与原假设的内容 相反,当原假设被拒绝时,被认为是真的假设
– 应用中,原假设一般是旧的、他人的观点或理论,备择 假设一般是新的、自己的观点或理论,而统计分析的目 的往往就是以新的数据来拒绝原假设,支持自己的观点
12
假设检验例
• 主要区别
– P值不依赖于样本变量的分布形式,适用于任何假设检验, 而t统计量依赖于样本变量的分布,适用范围有限
– P值可直接与显著水平比较,判断简单,而t统计量需查表、 换算,判断复杂
– 在应用统计的假设检验中,更多使用P值作为检验标准
• 主要联系
– 一般情况下, P值和t值有如下对应关系:
P值≤5%时,|t值|≥ 2
所以实用中(比如回归分析中),要获得有统计意义的结论 (即在5%显著水平拒绝原假设(H0)),可作下列任一 种判断:
看P值时,应≤5%
看|t值|时,应≥ 2
整理ppt
11
假设检验的步骤
• (1)选择要检验的统计量(比如样本均值)
• (2)确定原假设( H0 )和备择假设( H1) • (3)确定检验的显著水平(一般为5%)
– 所以,习惯上,能拒绝原假设的检验,称为显著的、有
统计意义的(Significant),否则为不显著
整理ppt
3
原假设(H0)和备择假设(H1)例
• 某汽车使用改进型发动机后声称油耗不超过百公 里6升,对此进行检验
– 检验假设的设定:设u为百公里平均油耗,则
H 0:u6 H 1:u6
– 单边检验(只检验小于或大于检验值中的一种情况)
– 检验假设的设定:设u为平均长度,则 H 0:u2 H 1:u2
– 双边检验(同时检验小于、大于检验值的两种情况, 常用)
源自文库
整理ppt
4
假设检验的标准:显著水平
显著水平的定义
– 假设检验中的第一类错误(type I error):拒绝正确的原 假设(H0)
μ0 等于原假设的,比如10 – 从t分布表查出某一显著水平(比如5%)的临
界值t0.05 – 比较换算的t值与临界值t0.05 。如果|t值|> t0.05 ,
则拒绝原假设,反之,接受原假设
整理ppt
8
单边95t2.拒0概率显著临值绝界域值(t检约为验-22)示) 意图(双边检验,显著水平设为5%)
第3章 假设检验与方差分析
• 第1节 假设检验
• 第2节 方差分析
• 第3节 方差分析应用:恩格尔系数 的城乡比较
整理ppt
1
第1节 假设检验
• 主要内容
– 假设检验的概念 – 假设检验的标准 – 假设检验的步骤
整理ppt
2
假设检验的概念及形式
• 假设检验
– 对总体的某个参数或分布形式作出某种假设,然后利用 样本信息来判断假设是否成立
– 显著水平指犯第一类错误的最大概率,通常设定为5% 或1%
• 显著水平的理解
– 形象的说,显著水平为1%是指,拒绝100次原假设, 只有1次是拒绝错了(即只有1次原假设确实正确)
– 因为原假设往往是公认的观点、成熟的理论,甚至已 经反复检验证明是正确的,所以为了加强拒绝的说服
力,应设定一个严格的拒绝标准,即要将显著水平设 的很小
– 上述t值公式就是将样本均值换算成一个标准化的t值, 这与将正态变量换算成标准正态变量一样,所以t分布 的中心为0
– 显然,t值的绝对值越大,样本均值离原假设H0的值越
远,样本越不支持原假整设理ppt
7
显著水平的运用: t 检验
• 显著水平在t 检验中的运用过程如下:
– 假定原假设成立,比如 H0:u10 – 将样本统计量的值按前述公式换算成t值,其中
检验%5%水平 示 意 图
• 将样本均值换算成标准化的t值,如果|t值|>临界值,表明样本均值离原假
设的总体均值很远,样本来自于这个总体的可能性很小,于是原假设(H0)
成立的概率也很小,所以拒绝H0 整理ppt
9
假设检验的实用标准:P值
• 根据样本值计算的显著水平又称为P值
– 比如:5%显著水平下的临界值为4,而实际的样本均 值为3,小于临界值,则P值也小于5%(比如4%等)
– 显著水平越小,原假设值的允许变动范围就越大,备
择假设成立的范围就越小,备择假设成立的概率就越
小。如果能成立,则结论就很有说服力
整理ppt
5
某品491原冰概率显著0箱假使设用H0年=限不10 即同假显设某著品牌水合格平的比较(单边检验)
牌冰水平54
箱%0 总%
图中4为5%的临界值 9为40%的临界值
• (4)查表确定与显著水平相对应的t分布的临界值
• (5)将要检验的统计量换算成标准化的t值
• (6)根据要检验的统计量的|t值|大于还是小于临界 值,决定是否拒绝原假设( H0 )
• 如果使用统计软件,则只要(1)、(2)、(3) 步,然后看输出的P值是否小于显著水平决定是 否拒绝原假设
整理ppt
体
的
特
征
• 假设国家标准规定冰箱使用年限必须10年或以上
• 对某品牌抽样检验时,如果显著水平设为40%,则样本均值9年或以下
即可认定为不合格。显著水平设为5%,则样本均值4年或以下才可认
定为不合格,相当于把原假设放整理宽pp到t H0>4,更有说服力
6
显著水平的运用:t 统计量
• t 统计量的定义
– 假定总体服从正态分布,则抽取的样本的平均值可用 下列公式换算成t 分布的值(简称t值),该值可用来判 断样本平均值相对于总体平均值的误差程度
t x0.
s/ n
其中 x为样本均值 0为, 总体均 n为 值样 ,本
个体数s量 为, 样本的标 ,s/准n差 为样本均值的标准差
• t 统计量公式的理解
– 公式中总体均值μ0在假设检验时,等于原假设H0的值
• 统计软件作检验时,通常会根据样本值计算相应 的P值,所以一般直接使用P值作为假设检验的标
准,非常方便
• 判断原理如下
– 如果P值≤1%,则检验值在1%水平显著,拒绝H0 – 如果1%<P值≤5%,则检验值在5%水平显著,拒绝H0 – 如果P值>5%,则检验值不显著,接受H0
整理ppt
10
P值与t 统计量
• 假设检验的形式
– 假设分为原假设(H0)和备择假设(H1)两种 – 原假设(Null hypothesis):初始假定为真的假设
– 备择假设(Alternative hypothesis):与原假设的内容 相反,当原假设被拒绝时,被认为是真的假设
– 应用中,原假设一般是旧的、他人的观点或理论,备择 假设一般是新的、自己的观点或理论,而统计分析的目 的往往就是以新的数据来拒绝原假设,支持自己的观点
12
假设检验例
• 主要区别
– P值不依赖于样本变量的分布形式,适用于任何假设检验, 而t统计量依赖于样本变量的分布,适用范围有限
– P值可直接与显著水平比较,判断简单,而t统计量需查表、 换算,判断复杂
– 在应用统计的假设检验中,更多使用P值作为检验标准
• 主要联系
– 一般情况下, P值和t值有如下对应关系:
P值≤5%时,|t值|≥ 2
所以实用中(比如回归分析中),要获得有统计意义的结论 (即在5%显著水平拒绝原假设(H0)),可作下列任一 种判断:
看P值时,应≤5%
看|t值|时,应≥ 2
整理ppt
11
假设检验的步骤
• (1)选择要检验的统计量(比如样本均值)
• (2)确定原假设( H0 )和备择假设( H1) • (3)确定检验的显著水平(一般为5%)
– 所以,习惯上,能拒绝原假设的检验,称为显著的、有
统计意义的(Significant),否则为不显著
整理ppt
3
原假设(H0)和备择假设(H1)例
• 某汽车使用改进型发动机后声称油耗不超过百公 里6升,对此进行检验
– 检验假设的设定:设u为百公里平均油耗,则
H 0:u6 H 1:u6
– 单边检验(只检验小于或大于检验值中的一种情况)