简单统计分析与过程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由于 chisq统计量值满足ci1<chisq<ci2,正好落在拒绝域外, 故接受原假设,认为方差没有发生显著变化。 另一方面,p=0.48018>0.05也表明,在0.05的显著性水平下, 接受原假设。
(二)单样本的非参数假设检验
• 总体分布的拟合优度检验
拟合优度检验是根据样本的经验分布对总体分布 作出的估计。
proc means var; var expend; freq number; output out=test var=varex; run; data A(drop=_type_); set test; k=_freq_-1; chisq=k*varex/17580; p=1-probchi(chisq,k); ci1=cinv(0.025,k); ci2=cinv(0.975,k); proc print data=a noobs; run;
由于检验变量dif=expend-720的t值=3.17, 概率pr>|t|的值为0.0020,小于显著性水平0.05,故 在0.05的显著性水平下推断出dif的均值显著不为0,也即居 民月均消费支出显著不等于720.
进一步检验 H0 : 720 0 H1 : 720 0
data a; set meant; k=_freq_-1; p=1-probt(tv,k); t1=tinv(0.95,k); proc print;run;
~
N (0,1)
当 2
2时,
0
t
x 0
sn
~
t(n 1)
u u1
t t1 (n 1)
对于总体均值的假设检验,可转化为均值是否为零 的检验,可通过PROC MEANS过程实现,只需在选 项中选择t,prt,和clm,alpha。 即检验H0 : 0 0 H1 : 0 0 •例6.1程序:
当p 时,必有z0 z 2,故拒绝H0,接受H1
因此,判断接受或拒绝H0只需看p大于还是小于 即可。
单样本和两样本下的假设检验
单样本的假设检验 (一)单样本的参数假设检验(正态分布总体)
• 总体均值的假设检验
原假设: H0 : 0 备责假设: H1 : 0
检验统计量:
拒绝域:
当 2
2时,
0
U
x 0 0 n
~百度文库
N (0,1)
u u1 2
当 2
02时,t
x 0
sn
~ t(n 1)
t t1 2(n 1)
原假设: H0 : 0 备责假设: H1 : 0
检验统计量:
拒绝域:
当 2
2时,
0
U
x 0 0 n
data consume; input expend number @@; dif=expend-720; cards; 500 8 600 15 750 30 800 25 900 13 1000 9 ; proc means mean t prt; var dif; freq number; output out=meant t=tv; run;
若3年前该市农村居民家庭月均消费支出服从N(720,17580), 假定2008年月均消费支出服从正态分布,问该市农村居民家庭 月均消费支出是否有显著提高?(显著性水平0.05)
即在方差未知的情况下检验 720是否成立。
统计量的计算值、临界值、显著性水平及检验 概率之间的关系
假定 原假设: H0 : 0 备责假设: H1 : 0
H1
:
2
2 0
检验统计量:
拒绝域:
n
2
( xi x )2
i 1
2 0
(n 1)S 2
2 0
~ 2(n 1)
2
2 1
2 (n
1)
或 2 2 2 (n 1)
例6.2:检验例6.1中居民消费支出的方差是否有 变化,即是否仍为17580。
原假设: H0 : 2 17580 备责假设: H1 : 2 17580
检验统计量Z服从正态分布 统计量的计算值:一次抽样观测值代入统计量Z后 得到的数值Z0. 临界值:在给定的显著性水平下,由
P{ z z 2} 计算出的z 2
当z0 z 2时,拒绝H0接受H1
统计量的计算值、临界值、显著性水平及检验 概率之间的关系
检验概率: 由P{ z z0}计算出的概率p 由临界值和检验概率的计算公式,可知
K.Pearson提出以下统计量:
拒绝域:
2 k ( f0i fei)2 ~ 2 (k 约束个数)
i1
fei
其中f0i为观测频数,
f
为理论频数。
ei
2
2 1
2 (k
约束个数)
或 2 2 2 (k 约束个数)
例6.3 某企业欲了解其产品订单的分布情况,在 随机选择的一周中发现,其订单频数分布如下表:
程序说明:
• chisq=k*varex/17580; 计算检验统计量 2 • p=1-probchi(chisq,k); 计算概率 p( 2 chisq) • ci1=cinv(0.025,k); ci2=cinv(0.975,k);
• 分别计算 2 分布的0.025和0.975分位数。
• p=1-probt(t,k) 计算概率 p(t tv)
t1=tinv(0.95,k);计算t分布的0.95分位数
显然,tv的值>t1且p值也<0.05,故在0.05的显著性水平下拒 绝原假设,也即接受居民月均消费支出显著大于720.
• 总体方差的假设检验
原假设:
H0
:
2
2 0
备责假设:
一、假设检验与SAS过程
例题6.1: 为了了解农村居民家庭消费水平是否有所提高, 2008年,某市对其农村居民家庭进行了一次抽样调查,其 中100户被抽样家庭的调查结果如下表:
表6.1 2008年某市农村居民家庭月均消费水平
平均每户消费支出 家庭数
500 600 700 800 900 1000 8 15 30 25 13 9
表6.3 订单频数分布表
星期一 星期二 星期三 星期四 星期五
7
(二)单样本的非参数假设检验
• 总体分布的拟合优度检验
拟合优度检验是根据样本的经验分布对总体分布 作出的估计。
proc means var; var expend; freq number; output out=test var=varex; run; data A(drop=_type_); set test; k=_freq_-1; chisq=k*varex/17580; p=1-probchi(chisq,k); ci1=cinv(0.025,k); ci2=cinv(0.975,k); proc print data=a noobs; run;
由于检验变量dif=expend-720的t值=3.17, 概率pr>|t|的值为0.0020,小于显著性水平0.05,故 在0.05的显著性水平下推断出dif的均值显著不为0,也即居 民月均消费支出显著不等于720.
进一步检验 H0 : 720 0 H1 : 720 0
data a; set meant; k=_freq_-1; p=1-probt(tv,k); t1=tinv(0.95,k); proc print;run;
~
N (0,1)
当 2
2时,
0
t
x 0
sn
~
t(n 1)
u u1
t t1 (n 1)
对于总体均值的假设检验,可转化为均值是否为零 的检验,可通过PROC MEANS过程实现,只需在选 项中选择t,prt,和clm,alpha。 即检验H0 : 0 0 H1 : 0 0 •例6.1程序:
当p 时,必有z0 z 2,故拒绝H0,接受H1
因此,判断接受或拒绝H0只需看p大于还是小于 即可。
单样本和两样本下的假设检验
单样本的假设检验 (一)单样本的参数假设检验(正态分布总体)
• 总体均值的假设检验
原假设: H0 : 0 备责假设: H1 : 0
检验统计量:
拒绝域:
当 2
2时,
0
U
x 0 0 n
~百度文库
N (0,1)
u u1 2
当 2
02时,t
x 0
sn
~ t(n 1)
t t1 2(n 1)
原假设: H0 : 0 备责假设: H1 : 0
检验统计量:
拒绝域:
当 2
2时,
0
U
x 0 0 n
data consume; input expend number @@; dif=expend-720; cards; 500 8 600 15 750 30 800 25 900 13 1000 9 ; proc means mean t prt; var dif; freq number; output out=meant t=tv; run;
若3年前该市农村居民家庭月均消费支出服从N(720,17580), 假定2008年月均消费支出服从正态分布,问该市农村居民家庭 月均消费支出是否有显著提高?(显著性水平0.05)
即在方差未知的情况下检验 720是否成立。
统计量的计算值、临界值、显著性水平及检验 概率之间的关系
假定 原假设: H0 : 0 备责假设: H1 : 0
H1
:
2
2 0
检验统计量:
拒绝域:
n
2
( xi x )2
i 1
2 0
(n 1)S 2
2 0
~ 2(n 1)
2
2 1
2 (n
1)
或 2 2 2 (n 1)
例6.2:检验例6.1中居民消费支出的方差是否有 变化,即是否仍为17580。
原假设: H0 : 2 17580 备责假设: H1 : 2 17580
检验统计量Z服从正态分布 统计量的计算值:一次抽样观测值代入统计量Z后 得到的数值Z0. 临界值:在给定的显著性水平下,由
P{ z z 2} 计算出的z 2
当z0 z 2时,拒绝H0接受H1
统计量的计算值、临界值、显著性水平及检验 概率之间的关系
检验概率: 由P{ z z0}计算出的概率p 由临界值和检验概率的计算公式,可知
K.Pearson提出以下统计量:
拒绝域:
2 k ( f0i fei)2 ~ 2 (k 约束个数)
i1
fei
其中f0i为观测频数,
f
为理论频数。
ei
2
2 1
2 (k
约束个数)
或 2 2 2 (k 约束个数)
例6.3 某企业欲了解其产品订单的分布情况,在 随机选择的一周中发现,其订单频数分布如下表:
程序说明:
• chisq=k*varex/17580; 计算检验统计量 2 • p=1-probchi(chisq,k); 计算概率 p( 2 chisq) • ci1=cinv(0.025,k); ci2=cinv(0.975,k);
• 分别计算 2 分布的0.025和0.975分位数。
• p=1-probt(t,k) 计算概率 p(t tv)
t1=tinv(0.95,k);计算t分布的0.95分位数
显然,tv的值>t1且p值也<0.05,故在0.05的显著性水平下拒 绝原假设,也即接受居民月均消费支出显著大于720.
• 总体方差的假设检验
原假设:
H0
:
2
2 0
备责假设:
一、假设检验与SAS过程
例题6.1: 为了了解农村居民家庭消费水平是否有所提高, 2008年,某市对其农村居民家庭进行了一次抽样调查,其 中100户被抽样家庭的调查结果如下表:
表6.1 2008年某市农村居民家庭月均消费水平
平均每户消费支出 家庭数
500 600 700 800 900 1000 8 15 30 25 13 9
表6.3 订单频数分布表
星期一 星期二 星期三 星期四 星期五
7