概率统计(精)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率统计 复习第四讲
数理统计复习提纲
假设检验: 方差分析: 回归分析: 主成分分析 查统计表:N,t,χ2,F分布表 计算器,Excel的使用。
假设检验的概念
对参数假设检验、分布类型 假设检验,小概率原理,待 检假设,两类错误:第一类 (弃真)、第二类(取伪), 显著性水平,临界值,接受 域与拒绝域。
假设检验的分类及步骤
对参数还是对分布类型或独立性?
单正态总体还是双正态总体?对均值 还是方差?对均值时方差已知吗?
步骤:提出待检假设H0,在H0为真 的前提下找一个统计量U、T、χ2、F, 确定接受域与拒绝域。
依据——小概率原理:在一次实验中 小概率的事件几乎不可能发生。
假设检验
练习题
*结论____是正确的。
①假设检验是以小概率原理为依据 的
②假设检验的结果总是正确的
③由一组样本的值就能得出零假设 是否正确
④ 对同一总体,用不同的样本对同
一统计假设进行检验,其结果完 全相同。
习题选解
P.206习题六:10.解:双正态总体,方差未知但相 同,对总体均值差的假设检验:用枢轴量
n
练习题
*已知某产品使用寿命服从正态分布,
要求平均使用寿命不低于1000小时,
现从一批这种产品中随机抽出25只,
测得平均使用寿命为950小时,样本方
差为100小时,则可用___检验这批产
品是否合格?
① t-检验法
② χ2-检验法
③ Z-检验法
④ F-检验法
练习题
*假设检验时,当样本容量一定,
若缩小犯第Ⅰ类错误的概率,则
S2
1 n 1
n i1
(Xi
X)2
练习题
*某公司产品的不合格率过去为 0.02,今从五批产品中抽取500件 作为样本送给订货者检验,检验 出不合格率只有0.01.在显著水平 α=0.05下检验H0:p=0.02,对 H1:p<0.02 (Z0.95=1.645, Z0.975=1.96)
15 20 25 30 35 40 45
一元线性回归
n
n
naˆ bˆ xi i 1
yi i 1
由上式得:
n
n
n
aˆ i1 xi
bˆ
x
2 i
i 1
xiyi
i 1
aˆ bˆ x y 即 aˆ y bˆ x
用行列式法解得b:
n
n
n
10
yˆ aˆ bˆx 16.987 0.797*90 88.717
练习题
*随机抽访一家联谊社的会员,得 知四对夫妻的年龄(xi,yi)为 (47,41),(48,41),(46,42),(43,44),
求y对x的线性回归方程。 [2000年上卷之28.但原题中:求x对
y的线性回归方程(xy)。]
400 20 z1 2.32 H1
练习题
用热敏电阻测温仪间接测量地热,勘探井底温度,
测量7次,测得温度℃为112.0,113.4,111.2,112.0,
114.5,112.9,113.6,而用某精确办法测得温度为
112.6(可看做温度真值),试问用热敏电阻测温仪间
接测温有无系统偏差(α =0.05)?(设热敏电阻测温仪
测 得 的 温 度 总 体 X 服 从 正 态 分 布 N(μ ,σ 2), 已 知
t0.975(6)=2.447, t0.95(6)=1.943)
答:用T检验H0:μ=112.6,x=112.8,s2=1.29,
T 112.8 112.6 1.29
7
=0.4659<2.447=t0.975(7-1), (双侧)无系统偏差。
采桑 不采桑
患者人数 18
12
健康人数 4
78
合计
22
90
比例 0.19643 0.80357
合计 30 82 112
比例 0.267857 0.732143
2
n * (ad bc)2
~ 2 (1)
(a b) * (c d) * (a c) * (b d)
χ2=42.28,α=0.05时查表χα2 (1)=3.841 [=CHIINV(0.05,1)],χα2<χ2,∴拒绝原假 设,认为皮炎与工种有关。
u≤u0.95,∴接受原假设,认为占有率p不大
于 [=B1I/N6O。MDI小ST样(6本,27i,610 /P6(,XTRUEi))]0i.680 5C>i207.50625277i
习题选解
P.207习题六:17.解:这是对两总体的独立性检验, 设皮炎与工种无关,列2x2的联列表:
bˆ
i 1 n
i1 i1 n
i1 n
n
x
2 i
(
xi )2
中记 i1
i 1
(xi x)2
i 1
n
n
lxy (xi x)(yi y) xi yi nx y
i1
i1
lxx
n
(xi
i1
x)2
n i1
x
2 i
nx2则 bˆ
练习题
•设购买某种名牌摩托车的人的年 龄X~N(35,52).最近随机抽查了该车 的购买者400人,平均年龄为30岁,在 显著水平α=0.01下,检验H0:μ=35,对 H1:μ<35 (Z0.99=2.32,Z0.995=2.58)
这是方差已知,对均值 的单侧假设检验,
Z 30 35 5
3
3
9
54
55
156
18 18.33333 17.33333
3 6.333333 4.25
A4
计数
3
3
3
9
求和
60
48
51
159
平均
20
16
17 17.66667
方差
4
1
0
4.5
A2
计数
3
3
3
9
求和
51
45
63
159
平均
17
15
21 17.66667
方差
0
0
3 7.75
方差分析
总计
计数
12
12
12
求和
练习题
No. 丈夫年龄x 妻子年龄y x*y x*x y*y
1
47
41
1927 2209 1681
2
48
41
1968 2304 1681
3
46
42
1932 2116 1764
4
43
44
1892 1849 1936
∑ 184
168 7719 8478 7062
bˆ
4*7719 168*184 4 * 8478 1842
习题P.228№4
用Excel得结果如下:操作工之间差异显著,机器之间差
异不显著,交互作用也是显著的。 A3
方差分析:可重复双因素分析
SUMMARY 甲
乙
丙
A1
总计
计数 求和 平均 方差
3
3
3
9
48
51
54
153
16
17
18
17
1
1
0 1.25
计数 求和 平均 方差
3 47 15.66667 1.333333
犯第Ⅱ类错误的概率____。
① 变小 ② 变大 ③ 不变 ④ 不确定。
*假设检验时,若增大样本容量, 则犯两类错误的概率____。
① 都增大 ② 都减小 ③ 都不变 ④ 一个增大,一个减小。
练习题
*某电子元件的耐用时数服从均值为 1000小时的正态分布,现随机抽取10件 新工艺条件下生产的产品作耐用性能 测试,测得其平均耐用时数为1077小时, 修正样本标准差s=51.97小时,能否认为 新工艺条件下生产的产品之耐用性能 明显不同于老产品(α=0.05).
用Excel可以得结果如下:显著不同。
19
21
20
19
21
19
20
22
21
23
24
26
23
25
27
方差分析:单因素方差分析
SUMMARY
组
计数 求和 平均 方差
行1
5
100
20
1
行2
5
105
21
2.5
行3
5
125
25
2.5
方差分析
差异源 SS
df
MS
F P-value
组间
70
2
35 17.5 0.000277
交互
73.5
6
12.25 7.112903 0.000192 2.508187
内部
41.33333
24 1.722222
总计
144.75
35
一元线性回归
是否有因果关系? 选定控制变量; 步骤:数据列表,画散点
(布)图,看趋势,划直线; 最小二乘法与正规方程。
散 布 图 点线距离“大小”
500 450 400 350 300
36 56
0.643
n
n
aˆ
i1
xi
bˆ
i1
yi
168 (0.643) *184 71.578
n
4
回归分析计算法
㈠用Excel:列表,画散点图,选中图,图 表→添加趋势线,在“类型”页上选“线 性”,在“选项”页中选“显示公式”,点 “确定”按钮。
差异源 SS df MS F P-value F crit 组间 465.88 2 2 232.94 4=.A3V71E7RA0G.0E3(A191:F31.)68232
组内 799.26 1515 53.284 =6*DEVSQ(G1:G3)
总计 1265.1 1717
=DEVSQ(A1:F3)
习题P.228№2
受原假设,认为方差无显著差异。
习题选解
P.206习题六:14.解:单侧原假设H0:占有率 p≤1/6。27家中用H牌的有X家,X~B(27,1/6)
U
X*
X np npq
~
N(0,1)
u 6 27 / 6 36 27 0.7746
27 1 5
27 *5
α=0.05时查6 表6u0.95=1.645[=NORMSINV(0.95)],
方差分析
单因素的方差分析 (P.228 No.1) 用计算器解;Excel用“数据分 析”; 128.1 134.1 133.1 138.9 140.8 127.4 133.733
150.3 147.9 136.8 126 150.7 155.8 144.583 140.6 143.1 144.5 143.7 148.5 146.4 144.467
T
xy
(n1 1)S12 (n 2 1)S22 n1 n 2 2
1 1
n1
n2
t
465.13 422.16
5.736
155 54.82 73 49.22 1 1
156 74 2
156 74
α=0.01时查表t0.005(228)=2.598 [=TINV(0.01,228)],t0.005(228)<|t| ∴拒绝原假设,认为正常男女的红细
206
198
223
平均 17.16667 16.5 18.58333
方差 4.333333 2.272727 4.083333
差异源
SS
df
MS
F
P-value F crit
样本
2.75
3 0.916667 0.532258 0.664528 3.008786
列
27.16667
2 13.58333 7.887097 0.00233 3.402832
lxy lxx
练习题
*某校为了分析数学成绩x与物理
成绩y之间的关系,随机抽取
10名学生的成绩(xi,yi),
i=1,2,…,10,算得:n Xi 758
i 1
n
n
n
yi 774,
xi yi 59686 ,
x
2 i
58732
i 1
wk.baidu.com
i 1
i 1
求x=90时,y的线性回归估计值。
组内
24
12
2
F crit 3.88529
总计
94
14
习题P.228№4
用Excel输入数据如左,可重复双因素方差分析。
甲 乙丙 A1 15 19 16
15 19 18 17 16 21 A2 17 15 19 17 15 22 17 15 22 A3 15 18 18 17 17 18 16 16 18 A4 18 15 17 20 16 17 22 17 17
胞数有显著差异。
习题选解
P.206习题六:11.解:双正态总体,检验对总
体方差比的假设:H0:σ12=σ22,用枢轴量
F S12 S22
~ F(n1 1, n 2 1)
f s12 54.82 1.24
s
2 2
49.22
α=0.1时查F表f0.95(155,73)=0.7258, [=FINV(0.95,155,73)],f0.05(155,73) =1.4098[=FINV(0.05,155,73)],∴接
练习题
n
n
n
bˆ
n xiyi xi yi
i1
i1 i1
n
n
n
x2 ( i
xi )2
10*59686 758*774 10*58732 7582
i1
i1
10168 0.797, 12756
n
n
aˆ
yi bˆ xi
i1
i1
774 0.797*758 16.987
n
n
n xiyi xi yi
(xi x)(yi y)
bˆ
i 1 n
i1 i1 n
i1 n
n xi2 ( xi )2
(xi x)2
i1
i 1
i 1
一元线性回归
在: n
n
n
n xiyi xi yi
n
(xi x)(yi y)
数理统计复习提纲
假设检验: 方差分析: 回归分析: 主成分分析 查统计表:N,t,χ2,F分布表 计算器,Excel的使用。
假设检验的概念
对参数假设检验、分布类型 假设检验,小概率原理,待 检假设,两类错误:第一类 (弃真)、第二类(取伪), 显著性水平,临界值,接受 域与拒绝域。
假设检验的分类及步骤
对参数还是对分布类型或独立性?
单正态总体还是双正态总体?对均值 还是方差?对均值时方差已知吗?
步骤:提出待检假设H0,在H0为真 的前提下找一个统计量U、T、χ2、F, 确定接受域与拒绝域。
依据——小概率原理:在一次实验中 小概率的事件几乎不可能发生。
假设检验
练习题
*结论____是正确的。
①假设检验是以小概率原理为依据 的
②假设检验的结果总是正确的
③由一组样本的值就能得出零假设 是否正确
④ 对同一总体,用不同的样本对同
一统计假设进行检验,其结果完 全相同。
习题选解
P.206习题六:10.解:双正态总体,方差未知但相 同,对总体均值差的假设检验:用枢轴量
n
练习题
*已知某产品使用寿命服从正态分布,
要求平均使用寿命不低于1000小时,
现从一批这种产品中随机抽出25只,
测得平均使用寿命为950小时,样本方
差为100小时,则可用___检验这批产
品是否合格?
① t-检验法
② χ2-检验法
③ Z-检验法
④ F-检验法
练习题
*假设检验时,当样本容量一定,
若缩小犯第Ⅰ类错误的概率,则
S2
1 n 1
n i1
(Xi
X)2
练习题
*某公司产品的不合格率过去为 0.02,今从五批产品中抽取500件 作为样本送给订货者检验,检验 出不合格率只有0.01.在显著水平 α=0.05下检验H0:p=0.02,对 H1:p<0.02 (Z0.95=1.645, Z0.975=1.96)
15 20 25 30 35 40 45
一元线性回归
n
n
naˆ bˆ xi i 1
yi i 1
由上式得:
n
n
n
aˆ i1 xi
bˆ
x
2 i
i 1
xiyi
i 1
aˆ bˆ x y 即 aˆ y bˆ x
用行列式法解得b:
n
n
n
10
yˆ aˆ bˆx 16.987 0.797*90 88.717
练习题
*随机抽访一家联谊社的会员,得 知四对夫妻的年龄(xi,yi)为 (47,41),(48,41),(46,42),(43,44),
求y对x的线性回归方程。 [2000年上卷之28.但原题中:求x对
y的线性回归方程(xy)。]
400 20 z1 2.32 H1
练习题
用热敏电阻测温仪间接测量地热,勘探井底温度,
测量7次,测得温度℃为112.0,113.4,111.2,112.0,
114.5,112.9,113.6,而用某精确办法测得温度为
112.6(可看做温度真值),试问用热敏电阻测温仪间
接测温有无系统偏差(α =0.05)?(设热敏电阻测温仪
测 得 的 温 度 总 体 X 服 从 正 态 分 布 N(μ ,σ 2), 已 知
t0.975(6)=2.447, t0.95(6)=1.943)
答:用T检验H0:μ=112.6,x=112.8,s2=1.29,
T 112.8 112.6 1.29
7
=0.4659<2.447=t0.975(7-1), (双侧)无系统偏差。
采桑 不采桑
患者人数 18
12
健康人数 4
78
合计
22
90
比例 0.19643 0.80357
合计 30 82 112
比例 0.267857 0.732143
2
n * (ad bc)2
~ 2 (1)
(a b) * (c d) * (a c) * (b d)
χ2=42.28,α=0.05时查表χα2 (1)=3.841 [=CHIINV(0.05,1)],χα2<χ2,∴拒绝原假 设,认为皮炎与工种有关。
u≤u0.95,∴接受原假设,认为占有率p不大
于 [=B1I/N6O。MDI小ST样(6本,27i,610 /P6(,XTRUEi))]0i.680 5C>i207.50625277i
习题选解
P.207习题六:17.解:这是对两总体的独立性检验, 设皮炎与工种无关,列2x2的联列表:
bˆ
i 1 n
i1 i1 n
i1 n
n
x
2 i
(
xi )2
中记 i1
i 1
(xi x)2
i 1
n
n
lxy (xi x)(yi y) xi yi nx y
i1
i1
lxx
n
(xi
i1
x)2
n i1
x
2 i
nx2则 bˆ
练习题
•设购买某种名牌摩托车的人的年 龄X~N(35,52).最近随机抽查了该车 的购买者400人,平均年龄为30岁,在 显著水平α=0.01下,检验H0:μ=35,对 H1:μ<35 (Z0.99=2.32,Z0.995=2.58)
这是方差已知,对均值 的单侧假设检验,
Z 30 35 5
3
3
9
54
55
156
18 18.33333 17.33333
3 6.333333 4.25
A4
计数
3
3
3
9
求和
60
48
51
159
平均
20
16
17 17.66667
方差
4
1
0
4.5
A2
计数
3
3
3
9
求和
51
45
63
159
平均
17
15
21 17.66667
方差
0
0
3 7.75
方差分析
总计
计数
12
12
12
求和
练习题
No. 丈夫年龄x 妻子年龄y x*y x*x y*y
1
47
41
1927 2209 1681
2
48
41
1968 2304 1681
3
46
42
1932 2116 1764
4
43
44
1892 1849 1936
∑ 184
168 7719 8478 7062
bˆ
4*7719 168*184 4 * 8478 1842
习题P.228№4
用Excel得结果如下:操作工之间差异显著,机器之间差
异不显著,交互作用也是显著的。 A3
方差分析:可重复双因素分析
SUMMARY 甲
乙
丙
A1
总计
计数 求和 平均 方差
3
3
3
9
48
51
54
153
16
17
18
17
1
1
0 1.25
计数 求和 平均 方差
3 47 15.66667 1.333333
犯第Ⅱ类错误的概率____。
① 变小 ② 变大 ③ 不变 ④ 不确定。
*假设检验时,若增大样本容量, 则犯两类错误的概率____。
① 都增大 ② 都减小 ③ 都不变 ④ 一个增大,一个减小。
练习题
*某电子元件的耐用时数服从均值为 1000小时的正态分布,现随机抽取10件 新工艺条件下生产的产品作耐用性能 测试,测得其平均耐用时数为1077小时, 修正样本标准差s=51.97小时,能否认为 新工艺条件下生产的产品之耐用性能 明显不同于老产品(α=0.05).
用Excel可以得结果如下:显著不同。
19
21
20
19
21
19
20
22
21
23
24
26
23
25
27
方差分析:单因素方差分析
SUMMARY
组
计数 求和 平均 方差
行1
5
100
20
1
行2
5
105
21
2.5
行3
5
125
25
2.5
方差分析
差异源 SS
df
MS
F P-value
组间
70
2
35 17.5 0.000277
交互
73.5
6
12.25 7.112903 0.000192 2.508187
内部
41.33333
24 1.722222
总计
144.75
35
一元线性回归
是否有因果关系? 选定控制变量; 步骤:数据列表,画散点
(布)图,看趋势,划直线; 最小二乘法与正规方程。
散 布 图 点线距离“大小”
500 450 400 350 300
36 56
0.643
n
n
aˆ
i1
xi
bˆ
i1
yi
168 (0.643) *184 71.578
n
4
回归分析计算法
㈠用Excel:列表,画散点图,选中图,图 表→添加趋势线,在“类型”页上选“线 性”,在“选项”页中选“显示公式”,点 “确定”按钮。
差异源 SS df MS F P-value F crit 组间 465.88 2 2 232.94 4=.A3V71E7RA0G.0E3(A191:F31.)68232
组内 799.26 1515 53.284 =6*DEVSQ(G1:G3)
总计 1265.1 1717
=DEVSQ(A1:F3)
习题P.228№2
受原假设,认为方差无显著差异。
习题选解
P.206习题六:14.解:单侧原假设H0:占有率 p≤1/6。27家中用H牌的有X家,X~B(27,1/6)
U
X*
X np npq
~
N(0,1)
u 6 27 / 6 36 27 0.7746
27 1 5
27 *5
α=0.05时查6 表6u0.95=1.645[=NORMSINV(0.95)],
方差分析
单因素的方差分析 (P.228 No.1) 用计算器解;Excel用“数据分 析”; 128.1 134.1 133.1 138.9 140.8 127.4 133.733
150.3 147.9 136.8 126 150.7 155.8 144.583 140.6 143.1 144.5 143.7 148.5 146.4 144.467
T
xy
(n1 1)S12 (n 2 1)S22 n1 n 2 2
1 1
n1
n2
t
465.13 422.16
5.736
155 54.82 73 49.22 1 1
156 74 2
156 74
α=0.01时查表t0.005(228)=2.598 [=TINV(0.01,228)],t0.005(228)<|t| ∴拒绝原假设,认为正常男女的红细
206
198
223
平均 17.16667 16.5 18.58333
方差 4.333333 2.272727 4.083333
差异源
SS
df
MS
F
P-value F crit
样本
2.75
3 0.916667 0.532258 0.664528 3.008786
列
27.16667
2 13.58333 7.887097 0.00233 3.402832
lxy lxx
练习题
*某校为了分析数学成绩x与物理
成绩y之间的关系,随机抽取
10名学生的成绩(xi,yi),
i=1,2,…,10,算得:n Xi 758
i 1
n
n
n
yi 774,
xi yi 59686 ,
x
2 i
58732
i 1
wk.baidu.com
i 1
i 1
求x=90时,y的线性回归估计值。
组内
24
12
2
F crit 3.88529
总计
94
14
习题P.228№4
用Excel输入数据如左,可重复双因素方差分析。
甲 乙丙 A1 15 19 16
15 19 18 17 16 21 A2 17 15 19 17 15 22 17 15 22 A3 15 18 18 17 17 18 16 16 18 A4 18 15 17 20 16 17 22 17 17
胞数有显著差异。
习题选解
P.206习题六:11.解:双正态总体,检验对总
体方差比的假设:H0:σ12=σ22,用枢轴量
F S12 S22
~ F(n1 1, n 2 1)
f s12 54.82 1.24
s
2 2
49.22
α=0.1时查F表f0.95(155,73)=0.7258, [=FINV(0.95,155,73)],f0.05(155,73) =1.4098[=FINV(0.05,155,73)],∴接
练习题
n
n
n
bˆ
n xiyi xi yi
i1
i1 i1
n
n
n
x2 ( i
xi )2
10*59686 758*774 10*58732 7582
i1
i1
10168 0.797, 12756
n
n
aˆ
yi bˆ xi
i1
i1
774 0.797*758 16.987
n
n
n xiyi xi yi
(xi x)(yi y)
bˆ
i 1 n
i1 i1 n
i1 n
n xi2 ( xi )2
(xi x)2
i1
i 1
i 1
一元线性回归
在: n
n
n
n xiyi xi yi
n
(xi x)(yi y)