数学实验 统计推断

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题分析: 这道题没有原始数据,不能直接用 MATLAB 命令 test2 计算,我们转而假设所有的数据均
满足正态分布,且未知方差相等,利用 t 检验进行计算
模型建立: 此处是一个标准差未知的两总体均值假设检验,假定标准差相等,
若原假定成立
t 检验的规则是, 当
, 时接受 H0,否则拒绝
程序: Function 函数:
判断两次测验的难度是否相同。
20 名学生的两次测验成绩(每列是相同的学生)
第一次 93 85 79 90 78 76 81 85 88 68 92 73 88 84 90 70 69 83 83 85 第二次 88 89 86 85 87 88 75 93 88 78 86 86 80 89 85 79 78 88 88 90
73 88 84 90 70 69 83 83 85]; x2=[88 89 86 85 87 88 75 93 88 78 86 ...
86 80 89 85 79 78 88 88 90]; y1=jbtest(x1) y2=jbtest(x2) x=x1-x2; [h1,sig1,ci1]=ttest(x,0,0.05,0) [h2,sig2,ci2]=ttest2(x1,x2,0.05,0)
模型建立: 法一,与前一问一样,此题依然是总体均值的双侧检验:

时接受 H0,否则拒绝
取 alpha=0.05
法二,此处是一个标准差未知的两总体均值假设检验,假定标准差相等,
若原假定成立
t 检验的规则是, 当
, 时接受 H0,否则拒绝
程序: x1=[93 85 79 90 78 76 81 85 88 68 92 ...
%计算法二的方差,分位数和均值差
运行结果整理如下表:
法一
方差
分位数
均值差
法二
46.2211 方差
40.4263
2.0930 分位数 2.0930
3.1818 均值差 4.0703
也就是说面对同样的检验条件,两种方法被承认的条件是不同的,法一更加严苛一些。造 成这种结果的原因,并不是两者的分位数不同,而是两者的方差不同。而造成方差不同的原 因容易见得,就是因为法二忽略了同一批人考试的因素,所以法一算的的方差应该比法二小, 结果计算得比法二大,所以不被接受也是正常的。

H
Sig
1
0
1
0
1
0
1
0.0014
0
0.1505
1
0.0000
1
0.0104
0
1.0000
0
0.1096
0
0.4127
0
0.0956
1
0.0104

H
Sig
1
0
1
0.0000
1
0.0000
0
0.1386
0
1.0000
1
0.0000
1
0
1
0
1
0
1
0
1
0
1
0
结论:
对于假设:中国青少年与日本青少年身高相等
体重/(kg) 61.2700 (59.9023 , 62.6377) 6.8929 (6.0520 , 8.0073)
(3)拒绝身高不变的假设,因为 sig=1.7003e-006<<α = 0.05,所以即使把α改为 0.01,此 结论不变。同时接受体重不变的假设。
习题 12-8 20 名学生参加了某课程进行的、考查同样知识的两次测验,成绩如下表,根据这些数据
学生身高/ (cm) 频数
学生体重/ (kg) 频数
155-160
4 47-52
12
161-165
13 52-57
17
频数表 166-170
38 57-62
27
171-175
28 62-67
28
176-180
13 67-72
9
181-186
4 72-77
7
h1 = 0 h2 =0
(2) mu1 =170.2500 s1 = 5.4018 muci1 =169.1782 171.3218 smaci1 = 4.7428 6.2751 mu2 = 61.2700 s2 = 6.8929 muci2 = 59.9023 62.6377 smaci2 = 6.0520 8.0073
习题 12.10 表 12.10 中给出的中国 7~18 岁青少年身高资料来源于 95 年全国学生体质健康调研,分层
随机整体群抽样自除西藏、台湾外所有省,年龄 7-22 岁,共约 20 万各年龄段的数据。日本 7~18 岁青少年身高资料以 95 年日本学校保健调查为依据。表 2.5 中是各个样本的均值和标 准差。设法用这些数据判断中国和日本男女生身高是否有差异。 (表略)
问题分析: 本题的两组数据不能视为独立,故不可直接使用两总体均值的假设检验。 因为是两组不独立的数据,首先分析影响考试成绩的因素:一者是考试的难度,另一者是
考试者答题水平的涨落。前者是我们需要检验的内容,后者是我们在处理时需要尽量避免其 作用的因素。
用两种方法解此题,一种方法以������1 − ������2作为样本点,另一者以������1和������2作为样本点。因为 ������1和������2都满足正态分布,所以新的样本应该满足均值为 0 的正态分布。后者因为完全忽略了 同一列两组数据的联系,认为其独立是不正确的,在此仅作为讨论原理的切入口。
h=0; else
h=1; end
M 文件: m=5000;n=5000;alpha=0.05; xbar=[124.5 129.4 134.6 139.3 145.1 151.2 160.0 165.1 168.3 170.1 171.0 170.8]; ybar=[122.5 128.1 133.4 138.9 144.9 152.0 159.6 165.1 168.5 170.0 170.8 171.1]; s1=[5.7 5.6 6.0 6.6 7.2 8.1 8.0 7.0 6.3 6.3 6.0 5.8]; s2=[5.4 5.5 5.4 5.9 6.7 7.8 7.6 6.8 6.2 5.9 6.0 5.9]; xbar2=[123.4 128.4 134.3 140.0 146.7 152.5 156.3 157.7 158.9 159.3 159.3 159.1]; ybar2=[121.8 127.6 133.5 140.2 146.7 151.9 155.1 156.7 157.4 157.9 158.1 158.2]; s12=[5.4 5.5 6.2 6.9 7.0 6.6 6.0 5.5 5.6 5.4 5.4 5.3]; s22=[5.4 5.7 6.3 6.6 6.7 6.2 5.4 5.2 5.0 5.3 5.0 5.1]; for i=1:12
(3) h1 = 1 sig1 = 1.7003e-006 ci1 = 169.1782 171.3218 h2 = 0 sig2 = 0.1238 ci2 = 59.9023 62.6377
α = 0.05 身高 体重
假设μ = ������0 接受
拒绝
Sig 1.7003e-006
0.1238
ci (169.1782 , 171.3218) (59.9023 , 62.6377)
样本数据:100 名学生的身高(cm)和体重(kg)
问题分析: (1)要求用直观的图形描述指的是画出以上 100 个样本点的直方图,并用 MATLAB 函数检 验其正态性,若通过,则可以用 MATLAB 中的 normfit 函数,来估计总体的一些统计量。 (2)通过正态性检验后,分别计算均值点估计,均值区间估计,标准差点估计和标准差区 间估计。区间估计在取置信水平为 0.95 时,均值点落在估计区间的概率为 0.95. (3)这是一个关于总体均值的双侧检验。
模型建立: (3)记
H 0 : 0, H1 : 0
由于总体方差未知
X 0 ~ t(n 1)
若原假设成立,因为 s / n
,来自百度文库
取 t (n-1) 的分位数 1- ,记 t=
,
满足
t 检验规则为:
取 alpha=0.05

时接受 H0,否则拒绝
程序: (1)A=dlmread('height.m'); x=[A(1,:),A(2,:),A(3,:),A(4,:),A(5,:),A(6,:),A(7,:),A(8,:),A(9,:),A(1 0,:)]; B=dlmread('weight.m'); y=[B(1,:),B(2,:),B(3,:),B(4,:)]; subplot(1,2,1),hist(x,6),title('100名学生身高'),xlabel('身高 /(cm)'),ylabel('频数') subplot(1,2,2),hist(y,6),title('100名学生体重'),xlabel('体重 /(kg)'),ylabel('频数') n1=hist(x,6) n2=hist(y,6) h1=jbtest(x) h2=jbtest(y)
运行结果: y1 =0 y2 =0 h1 =1 sig1 = 0.0428 ci1 = -6.4818 h2 =0 sig2 = 0.1090 ci2 = -7.3703
-0.1182 0.7703
结论
两个样本均满足正态分布,用方法一(以两样本对应的数据之差为新样本点)和方法二(忽
略两样本间的联系)得出的结论不同。前者认为第二次测验更加简单,而后者则接受了两次
年龄 7
8
9
10 11 12 13 14 15 16 17 18
男 拒绝 拒绝 拒绝 拒绝 接受 拒绝 拒绝 接受 接受 接受 接受 拒绝 女 拒绝 拒绝 拒绝 接受 接受 拒绝 拒绝 拒绝 拒绝 拒绝 拒绝 拒绝
实验小结: 本次实验运用到了统计方面的知识较多,书和课件反反复复看了很多遍,才终于搞懂了原
测验难度相等的假设。
探究其原因:追溯其 t 检验的判据,编程如下:(数据输入略)
s=std(x);
s=s*s
alpha=0.05;
T=tinv(1-alpha/2,19)
t=T*sqrt(s/20)
%计算法一的方差,分位数和均值差
s1=std(x1); s2=std(x2); ss=(19*s1*s1+19*s2*s2)/38 T1=tinv(1-alpha/2,38) t1=T1*sqrt(ss/20+ss/20)
function [h,sig]=pttest2(xbar,ybar,s1,s2,m,n,alpha) spower=((m-1)*s1^2+(n-1)*s2^2)/(m+n-2); t=(xbar-ybar)/sqrt(spower/m+spower/n); a=tinv(1-alpha/2,m+n-2); sig=2*(1-tcdf(abs(t),m+n-2)); if abs(t)<=a
结论: (1)该样本中学生的身高体重直方图和频数表如上所示,且两者通过正态性检验均满足
正态分布
(2)学生身高均值和标准差的点估计和区间估计
身高/(cm)
均值点估计
170.2500
均值区间估计
(169.1782 , 171.3218)
标准差点估计
5.4018
标准差区间估计
(4.7428 , 6.2751)
[h,sig]=pttest2(xbar(i),ybar(i),s1(i),s2(i),m,n,alpha); H(i)=h; Sig(i)=sig; end H Sig (对比女性数据时直接修改 for 循环中的变量名称即可)
运行结果整理:
年龄/岁
7 8 9 10 11 12 13 14 15 16 17 18
实验 12:统计推断
系别:化工 班级:化 22 学号:2012011903 姓名:华丰
实验目的:
1. 掌握数据的参数估计、假设检验的基本原理、算法,和用 MATLAB 实现的方法 2. 练习用这些方法解决实际问题。
习题 12-6 学校随机抽取 100 名学生,测量他们的身高和体重,所得数据见表格 (1)对这些数据给出直观的图形描述,检验分布的正态性; (2)根据这些数据对全校同学的平均身高和体重做出估计,并给出估计的误差范围; (3)学校 10 年前做过普查,学生的平均身高为 167.5cm,平均体重为 60.2kg,根据这次 抽查的数据,对学生的平均身高和体重有无明显变化做出结论。
(2) [mu1 s1 muci1 smaci1]=normfit(x) [mu2 s2 muci2 smaci2]=normfit(y)
(3) [h1,sig1,ci1]=ttest(x,167.5,0.05,0) [h2,sig2,ci2]=ttest(y,60.2,0.05,0)
运行结果: (1)
相关文档
最新文档