假设检验
假设检验一般概念
x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.
统计学——假设检验概念和方法
4. 我们想要证明(检验)大于或小于这两种可能 性中的任何一种是否成立
5. 建立的原假设与备择假设应为
6.
H0: = 10 H1:
10
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
/2
1 -
/2
临界值
H0值
样本统计量 临界值
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
率原理
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
...因此我们拒绝 假设 = 50
... 如果这是总 体的真实均值
20
m = 50
H0
样本均值
假设检验的过程
总体
☺☺ ☺
☺☺ ☺☺ ☺☺
提出假设
我认为人口的平 均年龄是50岁
抽取随机样本
☺X均=值20☺
作出决策 拒绝假设! 别无选择.
一项研究表明, 采用新技术生产后, 将会 使产品的使用寿命明显延长到1500小时 以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命 延长)是正确的
备择假设的方向为“>”(寿命延长)
建立的原假设与备择假设应为
H0:
1500
H1:
1500
单侧检验
(原假设与备择假设的确定)
一项研究表明, 改进生产工艺后, 会使产 品的废品率降低到2%以下。检验这一结 论是否成立
Z X m0
Sn
否
样本容量 n
小
用样本标 准差S代替
t 检验
t X m0 Sn
总体均值的检验
(2 已知或2未知大样本)
假设检验
假设检验原理
显著性水平
假设检验中犯第Ι类错误的概率被称为显著性水平 (Level of significance),记为α ,著名英国统计学家 Ronald Fisher在他的研究中把小概率的标准定为 0.05,这也是个通用的原则。 实际情况 H0为真 正确决策 第Ι 类错误α H0为假 第Π 类错误β 正确决策
单样本Z检验
Minitab 输出
length 的概率图
正态
99
分析结果
用正态性检验来检验一组样本数据是否来自服从正 态分布的总体: 如果数据来自正态分布的总体,数据点应该紧 密紧靠在拟合线上。 如果数据不是来自正态分布的总体,数据就是 远离拟合线。
Anderson-darling正态性检验也是假设检验的一种 • H0:数据来源于正态分布的总体 • H1:数据不是来源于正态分布的总体 正态性检验的 P=0.88,大于显著性水平α=0.05,所 以没有足够的证据拒绝原假设H0 ,即认为样本数据 来自正态分布的总体。
查看概率
Minitab 输出
分布图
正态, 均值=0, 标准差=1 0.4
分析结果
从图形可以看出,在标准正态分布的双侧检验下, α =0.05所对应的分位数为+/-1.96. 按此方法,可以计算T分布、weibull分布等分布下的 概率、概率密度和分位数。
0.3
密度
0.2
0.1
0.025 0.0 -1.96 0 X 1.96
单样本Z检验
增加图形输出,在Minitab中操作:
1、Ctrl + E 或者 点击 2、完成下图对话框,点击 图形
选中 数据箱线图,两次点击确定
单样本Z检验
Minitab 输出
假设检验名词解释
假设检验名词解释假设检验是统计学中一种重要的推断方法,用于判断针对总体参数的某个假设是否成立。
在进行假设检验时,我们首先提出一个关于总体参数的虚无假设(null hypothesis)和一个备择假设(alternative hypothesis),然后通过收集样本数据来进行推断和决策。
虚无假设是我们想要拒绝或证伪的假设,通常是基于无效、无差异或不相关等假设。
备择假设是我们希望接受的假设,即我们认为总体参数存在某种特定的差异或关联性。
假设检验的步骤可以分为以下几个阶段:1. 确定假设:根据问题的要求和研究的目标,明确虚无假设和备择假设。
2. 选择显著性水平:显著性水平(significance level)决定了拒绝虚无假设的标准。
常见的显著性水平有5%和1%。
3. 收集样本数据:从总体中抽取样本,并得到所需的统计指标。
4. 计算检验统计量:根据样本数据计算出与虚无假设相关的检验统计量。
常见的检验统计量有t检验、F检验和卡方检验等。
5. 确定拒绝域:通过设定显著性水平和计算的检验统计量,确定拒绝域(rejection region)。
如果检验统计量的计算值落在拒绝域内,就拒绝虚无假设。
6. 进行假设检验:将计算得到的检验统计量与拒绝域进行比较,根据比较结果得出对虚无假设的结论。
7. 给出结论:根据对虚无假设的判断,得出是否拒绝虚无假设,并给出相应的推断结论。
需要注意的是,假设检验并不能直接证明备择假设的正确性,只是提供了一种基于样本数据的推断方法。
假设检验面临两种错误,即第一类错误和第二类错误。
第一类错误是拒绝了真实的虚无假设,即误认为有差异存在;第二类错误是接受了虚无假设,即认为两个总体没有差异,而实际上有差异存在。
在实际应用中,假设检验广泛应用于医学、生物学、商业和社会科学等领域。
通过假设检验,我们能够在一定程度上验证假设、支持决策,并为进一步研究提供可靠的数据分析方法。
什么是假设检验?
减少主观臆断
假设检验基于客观数据和事实, 而非主观臆断,从而能够减少决 策过程中的主观性和不确定性。
提高决策科学性
假设检验能够提供一种相对可靠 的决策依据,提高决策的科学性 和准确性。
假设检验的未来发展
不断扩展应用领域
方法的改进和完善
随着科学技术的发展,假设检验的应 用领域将会越来越广泛,如人工智能 、生物技术、医学、社会科学等领域 。
随着数据的复杂性和规模的增加,假 设检验的方法也需要不断改进和完善 ,以适应不同场景和需求。
提高可解释性和透明 度
为了更好地理解和解释假设检验的结 果,需要提高其可解释性和透明度, 以便更多的人能够理解和应用。
正确理解和运用假设检验
01
理解基本概念
正确理解和运用假设检验需要深入理解其基本概念和方法,包括如何
社会学研究
社会调查
利用假设检验对社会现象进行调查研究,以揭示社会现象之间的内在联系和 规律。
行为研究
通过假设检验探讨人类行为和社会影响之间的相互作用,为政策制定和社会 干预提供依据。
06
结论
假设检验的意义
科学探究的基础
假设检验是科学探究中最为核心 的方法之一,它能够通过严谨的 逻辑和数学推理来验证或否定一 个特定的假设。
假设检验是统计分析的一部分,它是 一种方法论,用于根据样本数据推断 总体参数。
统计分析包括多种方法和技术,如描 述性统计、推断性统计和回归分析等 ,它们都是为了帮助我们更好地理解 和解释数据。
在进行假设检验时,需要使用统计分 析方法来对数据进行处理和分析,从 而得出结论。
02
假设检验的基本原理
假设的设定与分类
病因研究
通过对暴露因素与疾病之间关系的假设检验,探讨病因和预防策 略的有效性。
第八章 假设检验
x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
假设检验
U | X 0 | ~ N (0,1)
/ n
3° 在假设 H0成立的条件下,由样本判断 y 小概率事件是否发生。 y pU ( x )
P{| U | u / 2 }
2
2
当 0很小时 ,
uα / 2
O uα / 2
x
{| U | u / 2 }是个小概率事件 (如上图) .
第一节
假设检验的 基本概念
一、假设检验的基本原理 二、假设检验的基本概念 三、两类错误
回
四、假设检验的一般步骤
停 下
实验设计 数理统计 统计推断
参数估计 假设检验 (回归分析)
统计推断: 研究如何加工、处理数据,从而 对所考察对象的性质做出尽可能精确和可靠的 推断.
很难发生. 但“很难发生”不等于“不发生”, 因而 假设检验所作出的结论有可能是错误的. 这种错误 有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 错误, 这类错误是“以真为假”. 犯第Ⅰ类错误的概 率就是显著性水平 .
= P { 拒绝原假设H0 | H0为真 }
H0称为原假设或零假设, H1称为备择假设.
4. 拒绝域与临界点样本值x=(x1, x2, · · · , xn)所组成的集合. W1 = { x x 且使H0不成立}
W1 W1 : 拒绝原假设H0的检验统计量的取值范围.
W1 x x , U U
根据小概率原理, 如果H 0为真,则 | x 0 | 不应太大,则由一次试验得到
满足不等式
| u |
| x 0 |
/ n
假设检验的名词解释
假设检验的名词解释在统计学中,假设检验是一种通过收集和分析样本数据,用以对总体参数做出统计推断的方法。
简而言之,它帮助我们判断一个统计假设是否在给定的数据中是有效的。
一、什么是假设检验?假设检验是一种从样本推断总体特征的方法,它基于两个互补的假设:原假设(H0)和备择假设(H1或Ha)。
原假设通常是我们要进行推断的现象不存在或没有关联,而备择假设则相反。
通过收集样本数据并使用适当的统计方法,我们根据样本数据对两个假设进行比较,并得出结论。
二、假设检验的基本步骤假设检验通常分为以下几个基本步骤:1. 陈述原假设和备择假设:在开始假设检验之前,我们需要明确原假设和备择假设。
原假设通常是表达无关联或无效果的假设,备择假设则相反。
2. 选择适当的显著性水平:显著性水平代表了我们作出拒绝原假设的临界值。
通常使用的显著性水平是0.05或0.01,表示我们愿意在5%或1%的概率下犯出错误的可能性。
3. 收集样本数据并进行统计分析:根据采样设计,收集足够数量的样本数据。
然后使用适当的统计方法,如t检验、方差分析或卡方检验等,分析样本数据。
4. 计算检验统计量:根据样本数据和所选择的统计方法,计算出相应的检验统计量。
检验统计量是一个数值,用于度量样本数据与原假设之间的偏差程度。
5. 判断拒绝域:根据所选择的显著性水平和计算的检验统计量,确定拒绝域的范围。
拒绝域是样本数据落在其中,我们将拒绝原假设并接受备择假设的区域。
6. 做出判断和推断:比较计算得到的检验统计量与拒绝域的位置。
如果检验统计量落在拒绝域内,我们拒绝原假设并接受备择假设;否则,我们无法拒绝原假设。
7. 做出结论:根据判断和推断结果,给出对原假设的结论。
结论可以是关于总体参数是否存在、是否有效或是否有差异的。
三、常见的假设检验在实际应用中,有许多不同类型的假设检验方法,以下是其中一些常见的假设检验示例:1. 单样本t检验:用于比较一个样本平均值与一个已知或预期的总体平均值是否存在显著差异。
假设检验
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
假设检验
产品检验: ■全数检验 ■抽样检验
能最真实、完整的反映所有产品的特性结果 GB/T2828.1-2003 存在抽样误差
总体与样本
判断
总体
随机抽取
样本
测量
数据
根据样本的信息推断总体
2. 假设检验的基本原理:小概率反证法 小概率原理:指小概率事件(通常概率 α≤0.05称为“小概率事件)在一次试 验中基本不会发生,反证法思想是先提 出某项假设(H0 ),用统计方法确定假 设的可能性(即检验假设是否正确): 可能性小,即假设不成立,应拒绝原假 设;如果可能性大,则接受假设,则假 设成立。
⑹根据显著性水平α 及统计量、样本自由 度查概率分布表。获取在此显著性水平α 下的置信区间,即临界值。 双侧检验:根据α/2或(1-α/2)确定临界值 单侧检验:根据α或(1 -α) 确定临界值
⑺做出判断:将计算出的统计量与查表得 出的临界值进行比较,作出拒绝或接受H0 的判断。
五、应用实例
1.单个正态总体的均值检验——t 检验
s12 0.0955 F 2 3.66 s2 0.0261 计算统计量:
n1=8,则样本的自由度 1 n1 1 7 n2=9,则样本的自由度 2 n2 1 8 α =0.05,查F检验临界值(F2)表,P(F >F2)= α 得到:F0.05(7、8)= 3.50 F在拒绝域内 结论:原假设H0不成立,即甲机床的精度比乙机床低。
因此,可用计算确定均值µ及1—α 置信区间的 方法来检验上述假设是否成立。 如果计算出来的置信区间包括µ 0 ,则接受H0 ; 如果计算出来的置信区间不包括µ 0 ,则拒绝H0
三、假设检验类型
• 参数假设:总体分布类型已知,对未知参数 的统计假设。检验参数假设问题称为参数假 设检验。当总体分布类型为正态分布时,则 为正态总体参数检验。 • 非参数假设:总体分布类型不明确,对参数 的各种统计假设。检验非参数假设问题称为 非参数假设检验,也称分布检验。参数假设 检验和非正态总体参数检验都比较复杂,在 QC小组活动中很少应用。
假设检验的八种情况的公式
假设检验的八种情况的公式假设检验是统计学中常用的一种方法,用于判断样本数据与总体参数的关系是否具有显著性差异。
在进行假设检验时,我们需要根据实际问题和已知条件确定相应的假设检验公式。
以下是八种常见的假设检验情况及相应的公式。
1.单样本均值检验:在这种情况下,研究者想要判断一个样本的均值是否与一个已知的总体均值有显著性差异。
假设检验的公式为:其中,x̄为样本均值,μ为总体均值,s为样本标准差,n为样本容量,t为t分布的临界值。
2.双样本均值检验(方差已知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且已知两个样本的方差相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s为样本标准差,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
3.双样本均值检验(方差未知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且两个样本的方差未知且不相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s1和s2分别为样本1和样本2的标准差,n1和n2分别为样本1和样本2的容量,t为t分布的临界值。
4.单样本比例检验:在这种情况下,研究者想要判断一个样本的比例是否与一个已知的总体比例有显著性差异。
假设检验的公式为:其中,p̄为样本比例,p为总体比例,n为样本容量,z为标准正态分布的临界值。
5.双样本比例检验:在这种情况下,研究者想要判断两个样本的比例是否有显著性差异。
假设检验的公式为:其中,p̄1和p̄2分别为样本1和样本2的比例,p1和p2分别为总体1和总体2的比例,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
6.简单线性回归检验:在这种情况下,研究者想要判断自变量与因变量之间的线性关系是否显著。
假设检验的公式为:其中,β1为回归系数,se(β1)为标准误差,t为t分布的临界值。
数据分析中的假设检验方法
数据分析中的假设检验方法在数据分析领域,假设检验是一种常用的统计方法,用于验证关于总体或总体参数的假设。
通过对样本数据进行分析和比较,我们可以得出对总体或总体参数的推断。
假设检验方法的应用广泛,可以用于医学研究、市场调研、财务分析等各个领域。
一、什么是假设检验假设检验是一种基于统计学原理的推断方法,用于验证关于总体或总体参数的假设。
假设检验的基本思想是,我们先提出一个关于总体或总体参数的假设(称为原假设),然后通过对样本数据进行分析和比较,得出对原假设的结论。
原假设通常是我们希望推翻的,而备择假设则是我们希望得到支持的。
二、假设检验的步骤假设检验通常包括以下几个步骤:1. 提出假设:首先要明确原假设和备择假设。
原假设通常是我们希望推翻的假设,而备择假设则是我们希望得到支持的假设。
2. 选择检验统计量:根据具体问题的特点,选择适合的检验统计量。
检验统计量是用来对样本数据进行计算和比较的指标,可以是均值、比例、方差等。
3. 确定显著性水平:显著性水平是指在假设检验中,我们所允许的犯第一类错误的概率。
常用的显著性水平有0.05和0.01两种。
4. 计算检验统计量的观察值:根据样本数据,计算得到检验统计量的观察值。
5. 判断拒绝域:根据显著性水平和检验统计量的分布,确定拒绝域。
拒绝域是指当检验统计量的观察值落在该范围内时,我们拒绝原假设。
6. 得出结论:根据样本数据的观察值是否落在拒绝域内,得出对原假设的结论。
如果观察值在拒绝域内,我们拒绝原假设;如果观察值在拒绝域外,我们接受原假设。
三、常见的假设检验方法1. 单样本均值检验:用于检验总体均值是否等于某个给定值。
常用的检验统计量是t统计量。
2. 双样本均值检验:用于检验两个总体均值是否相等。
常用的检验统计量有独立样本t统计量和配对样本t统计量。
3. 单样本比例检验:用于检验总体比例是否等于某个给定值。
常用的检验统计量是z统计量。
4. 双样本比例检验:用于检验两个总体比例是否相等。
统计学中的假设检验
统计学中的假设检验是一种重要的统计推断方法,用于对数据进行推断和决策。
它帮助我们确定数据中的差异是否具有统计学意义,从而帮助我们做出合理的决策。
假设检验的基本原理是:根据样本数据对总体的参数进行推断。
根据现有的理论和经验,我们提出一个关于总体参数的假设,然后收集样本数据,通过统计方法来验证这个假设的可靠性。
假设检验的过程可以归纳为以下几个步骤:1.建立假设:假设检验首先需要提出一个原假设(H0)和一个备择假设(H1)。
原假设通常是默认情况下我们认为成立的假设,而备择假设则是我们想要证明的假设。
例如,原假设可能是“某个药物对疾病的治疗效果无显著影响”,备择假设则是“某个药物对疾病的治疗效果有显著影响”。
2.收集样本数据:在假设检验中,我们需要从总体中随机抽取一定数量的样本数据,并进行测量和观察。
3.计算检验统计量:根据样本数据计算出一个检验统计量,它是样本数据与假设之间的差异的度量。
检验统计量的计算方法根据不同的问题有所不同。
常见的检验统计量包括t值、z值、F值等。
4.设定显著性水平:显著性水平(significance level)是我们预先设定的一个概率阈值,用于判断检验统计量的结果是否具有统计学意义。
常见的显著性水平有0.05和0.01等。
5.判断统计显著性:根据检验统计量的计算结果和显著性水平,我们可以进行统计显著性的判断。
如果计算得到的检验统计量的值小于设定的显著水平,我们将拒绝原假设,认为结果是统计显著的;如果计算得到的检验统计量的值大于设定的显著水平,我们无法拒绝原假设,认为结果不具有统计学意义。
6.得出结论:根据统计显著性的判断结果,我们可以得出假设检验的结论。
如果拒绝原假设,则接受备择假设;如果无法拒绝原假设,则无法支持备择假设。
假设检验是统计学的重要工具,它可以帮助我们在实际问题中进行决策和推断。
通过对假设检验的使用,我们可以证明或者否定一些关于总体的假设,从而为我们的决策提供一臂之力。
假设检验
例2:某种零件的尺寸,要求其平均长度为4厘米,大于或小于4 厘米均属于不合格。该企业生产的零件平均长度是4厘米吗?
提出原假设 H0: = 4厘米
提出备择假设 H1: 4厘米
单边检验
例1:某灯泡制造商声称,该企业所生产的灯泡的平均使用 寿命在1000小时以上。该批产品的平均使用寿命超过1000小 时吗?
x 0 t ~ t (n 1) s n
正态总体、方差未知、小样本情况下,样本统计量的抽样分布
t
正态 分布
X S n
~ t (n 1)
正态分布 t (df = 13) t (df = 5)
t 分布
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
总体均值的检验—— t 检验(双边)
提出原假设H0: 1000 选择备择假设 H1: < 1000
例2:学生中通宵上网的人数超过25%吗?
提出原假设H0: 25%
选择备择假设 H1: 25%
例3:消费者协会接到消费者投诉,指控某品牌纸包装饮料 容量不足,有欺骗消费者之嫌。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,包装上标明的容量为250毫升, 但测试发现平均含量为248毫升,小于250毫升。这是生产中 正常的波动,还是厂商的有意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了消费者呢?
2 2
Z 1.96
2
决策准则
当 Z Z ,即Z Z 或Z Z 时 拒绝H 0
2 2 2
当 Z Z ,即 Z Z Z 时 接受H 0
什么是假设检验
什么是假设检验
假设检验(hypothesis testing)是指从对总体参数所做的一个假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上是可靠的,并做出承认还是拒绝该假设的判断。
如果进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验,称其为参数假设检验;若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称之为非参数假设检验。
此外,根据研究者感兴趣的备择假设的内容不同,假设检验还可分为单侧检验(单尾检验)和双侧检验(双尾检验),而单侧检验又分为左侧检验和右侧检验。
假设检验的基本思想是反证法思想和小概率事件原理。
反证法的思想是首先提出假设(由于未经检验是否成立,所以称为零假设、原假设或无效假设),然后用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它;如果可能性大,还不能认为它不成立。
小概率事件原理,是指小概率事件在一次随机试验中几乎不可能发生,小概率事件发生的概率一般称之为“显著性水平”或“检验水平”,用表示,而概率小于多少算小概率是相对的,在进行统计分析时要事先规定,通常取=0.01、0.05、0.10等。
假设检验
四 假设检验一 基本内容1.假设检验对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。
(1) 待检验假设或零假设记为0H ,正在被检验的与0H 相对立的假设1H 称为备选假设或对立假设。
(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。
(3) 假设检验的思路是概率性质的反证法。
即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。
(4) 假设检验可能犯的两类错误:① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即00{|}P H H α=拒绝为真。
② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即00{|}P H H β=接受不真。
③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。
2.假设检验的程序对任何实际问题进行假设检验,其程序一般为五步,即: ⑴ 根据题意提出零假设0H (或相应备选假设1H )。
⑵构造样本统计量并确定其分布;⑶给定显著性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。
3.假设检验的主要方法Z 检验法、t 检验法、2λ检验法、F 检验法。
4.关于一个正态总体的假设检验⑴2200(,),H X N μδδμμ 已知,检验假设:=Z 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②统计量0(0,1)()Z N H -=成立时。
③给出1122{}P Z ZZαααα--<=,,查正表定④ 由样本值12n x x x (,,,) 计算Z 的值 ⑤ 判断:若1122Z ZZαα--∈∞∈∞0(-,-)或Z (-,+),则拒绝H(这是对双侧检验提出的Z 检验法步骤,若是单侧可仿比) (2)2200(,),H X N μδδμμ 未知,检验假设:=t 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②0(1)()t t n H -=- 成立时。
假设检验
一.基本概念:(1)对总体参数的数值所作的陈述,称为统计假设。
(2)对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验。
(3)通常将研究者想收集证据予以支持的假设称为备(选)择假设,记作Hα或H1。
(4)通常将研究者想收集证据予以反对的假设称为原假设,或零假设,用H0表示。
(5)能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。
(6)根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。
(7)当原假设为真时拒绝原假设,称所犯错误为第一类错误,犯第一类错误的概率通常记为α。
(8)当原假设为假时没有拒绝原假设,称为所犯错误为第二类错误,犯第二类错误的概率通常记为β。
(9)假设检验中犯第一类错误的概率,称为显著性水平,通常用α表示。
二.确定检验类型:观察备择假设的符号:如果是“<”就是左侧检验(原假设的拒绝域在左边);如果是“>”就是右侧检验(原假设的拒绝域在右边);如果是“≠”就是双侧检验(原假设的拒绝域在两侧)。
三.常见数值:1. α=0.1(置信水平是90%)(1)左侧检验:Z=-1.28(2)右侧检验:Z=1.28(3)双侧检验(区间估计):Z=+1.645 Z=-1.6452. α=0.05(置信水平是95%)(1)左侧检验:Z=-1.645(2)右侧检验:Z=1.645(3)双侧检验(区间估计):Z=+1.96 Z=-1.963. α=0.01(置信水平是99%)(1)左侧检验:Z=-2.33(2)右侧检验:Z=2.33(3)双侧检验(区间估计):Z=+2.58 Z=-2.58四.计算时采用的分布:(1)均值检验:阅读题目,看看是大样本还是小样本(30)。
如果是大样本,就用标准正态分布分位数表;如果是小样本,再看总体方差是否已知,如果知道,仍然用标准正态分布分位数表;如果是小样本,而且总体方差还不知道,就用t分布临界值表。
统计学中的假设检验
统计学中的假设检验在统计学中,假设检验是一种重要的数据分析方法,用于确定一个统计推断是否支持或拒绝一个关于总体或总体参数的假设。
通过对样本数据进行分析,我们可以评估样本数据中的统计显著性,并作出关于总体的推断。
1. 假设检验的基本概念假设检验的基本思想是基于样本数据对总体特征做出推断。
通常,我们设置一个零假设(null hypothesis)H0,表示无效或无差异的假设,以及一个备择假设(alternative hypothesis)H1,表示有差异或有效的假设。
通过对样本数据进行分析,我们可以判断是否拒绝H0,并支持H1。
2. 假设检验的步骤(1)确定假设:明确零假设H0和备择假设H1。
(2)选择显著性水平:通常设定为0.05或0.01。
显著性水平表示我们拒绝H0的概率阈值,通常称为α。
(3)确定检验统计量:选择适当的统计量来检验H0和H1之间的差异。
(4)计算检验统计量:基于样本数据计算检验统计量的值。
(5)确定拒绝域:根据显著性水平,确定检验统计量的分布并确定拒绝域。
(6)做出结论:将计算得到的检验统计量与拒绝域进行比较,得出是否拒绝H0的结论。
3. 常见的假设检验方法(1)单样本假设检验:用于对一个总体的平均值或比例进行推断。
常用的方法有单样本t检验和单样本比例检验。
(2)两独立样本假设检验:用于比较两个独立样本的均值或比例是否有显著差异。
常用的方法有独立样本t检验和独立样本比例检验。
(3)配对样本假设检验:用于比较同一个样本在两个不同条件下的均值或比例是否有显著差异。
常用的方法有配对样本t检验和配对样本比例检验。
(4)方差分析:用于比较三个或三个以上样本的均值是否有显著差异。
常用的方法有单因素方差分析和多因素方差分析。
4. 结论的解释与结果分析当假设检验的结果显示拒绝了H0时,我们可以解释为拒绝了无效的假设,即我们对总体的推断得到了支持。
反之,如果结果不能拒绝H0,则无法得出对总体的有力推断。
假设检验(完整)
抽样分布
置信水平
1 -
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1 -
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
• 1. 第Ⅰ类错误(弃真错误)
x
~ N (0,1) s/ n
x ~ t(n 1)
s/ n
非正态分布 大样本 x ~ N (0,1) / n
x ~ N (0,1)
s/ n
非正态小样本情形不讨论。
3、拒绝域和接受域的确定
(双侧检验 )
抽样分布
拒绝H0
/2
1 -
置信水平 拒绝H0
/2
拒绝域
临界值
临界值
0 接受域
样本统计量 拒绝域
关统计) 6、《红楼梦》后40回作者的鉴定(文学统计)。 7、民间借贷的利率为多少?(金融统计) 8、兴奋剂检测(体育统计)
1、假设检验的基本思想
为研究某山区的成年男子的脉搏均数是否高于一般 成年男子脉搏均数,某医生在一山区随机抽查了25名 健康成年男子,得其脉搏均数x为74.2次/分,标准差 为6.0次/分。根据大量调查已知一般健康成年男子脉 搏均数为72次/分,能否据此认为该山区成年的脉搏 均数μ高于一般成年男子的脉搏均数μ0?
– 原假设为真时拒绝原假设
– 第Ⅰ类错误的概率记为
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为假时未拒绝原假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目八 假设检验、回归分析与方差分析实验1 假设检验实验目的 掌握用Mathematica 作单正态总体均值、方差的假设检验, 双正态总体的均值差、方差比的假设检验方法, 了解用Mathematica 作分布拟合函数检验的方法.单正态总体均值的假设检验(方差已知情形)例 1.1 (教材 例 1.1) 某车间生产钢丝, 用X 表示钢丝的折断力, 由经验判断),(~2σμN X , 其中228,570==σμ, 今换了一批材料, 从性能上看, 估计折断力的方差2σ不会有什么变化(即仍有228=σ), 但不知折断力的均值μ和原先有无差别. 现抽得样本, 测得其折断力为578 572 570 568 572 570 570 572 596 584取,05.0=α试检验折断力均值有无变化?根据题意, 要对均值作双侧假设检验570:,570:10≠=μμH H输入 <<Statistics\HypothesisTests.m执行后, 再输入data1={578,572,570,568,572,570,570,572,596,584}; MeanTest[data1,570,SignificanceLevel->0.05,KnownVariance->64,TwoSided->True,FullReport->True] (*检验均值, 显著性水平05.0=α, 方差083.02=σ已知*)则输出结果{FullReport-> Mean TestStatDistribution575.22.05548 NormalDistribution[]TwoSidedPValue->0.0398326,Reject null hypothesis at significance level ->0.05}即结果给出检验报告: 样本均值2.575=x , 所用的检验统计量为u 统计量(正态分布),检验统计量的观测值为 2.05548, 双侧检验的P 值为0.0398326, 在显著性水平05.0=α下, 拒绝原假设, 即认为折断力的均值发生了变化.例 1.2 (教材 例 1.2) 有一工厂生产一种灯管, 已知灯管的寿命X 服从正态分布)40000,(μN , 根据以往的生产经验, 知道灯管的平均寿命不会超过1500小时. 为了提高灯管的平均寿命, 工厂采用了新的工艺. 为了弄清楚新工艺是否真的能提高灯管的平均寿命,他们测试了采用新工艺生产的25只灯管的寿命. 其平均值是1575小时, 尽管样本的平均值大于1500小时, 试问: 可否由此判定这恰是新工艺的效应, 而非偶然的原因使得抽出的这25只灯管的平均寿命较长呢? 根据题意, 需对均值的作单侧假设检验1500:,1500:10>≤μμH H检验的统计量为 nX U /0σμ-=, 输入p1=NormalPValue[(1575-1500)/200*Sqrt[25]]ResultOfTest[p1[[2]],SignificanceLevel ->0.05,FullReport ->True]执行后的输出结果为OneSidedPValue ->0.0303964 {OneSidedPValue->0.0303964,Fail to reject null hypothesis at significance level ->0.05}即输出结果拒绝原假设单正态总体均值的假设检验(方差未知情形)例1.3 (教材 例1.3) 水泥厂用自动包装机包装水泥, 每袋额定重量是50kg, 某日开工后随机抽查了9袋, 称得重量如下:49.6 49.3 50.1 50.0 49.2 49.9 49.8 51.0 50.2设每袋重量服从正态分布, 问包装机工作是否正常(05.0=α)? 根据题意, 要对均值作双侧假设检验: 50:;50:10≠=μμH H输入data2={49.6,49.3,50.1,50.0,49.2,49.9,49.8,51.0,50.2};MeanTest[data2,50.0,SignificanceLevel ->0.05,FullReport ->True](*单边检验且未知方差,故选项TwoSided,KnownVariance 均采用缺省值*)执行后的输出结果为{FullReport->Mean TestStat Distribution,49.9 -0.559503 StudentTDistribution[8] OneSidedPValue ->0.295567,Fail to reject null hypothesis at significance level ->0.05}即结果给出检验报告: 样本均值9.49=X , 所用的检验统计量为自由度8的t 分布(t 检验),检验统计量的观测值为-0.559503, 双侧检验的P 值为0.295567, 在显著性水平05.0=α下, 不拒绝原假设, 即认为包装机工作正常.例1.4 (教材 例1.4) 从一批零件中任取100件,测其直径,得平均直径为5.2,标准差为1.6.在显著性水平05.0=α下,判定这批零件的直径是否符合5的标准.根据题意, 要对均值作假设检验:.5:;5:10≠=μμH H检验的统计量为ns T /0μ-=, 它服从自由度为1-n 的t 分布. 已知样本容量,100=n 样本均值2.5=X , 样本标准差6.1=s .输入StudentTPValue[(5.2-5)/1.6*Sqrt[100],100-1, TwoSided->True]则输出 TwoSidedPValue->0.214246即P 值等于0.214246, 大于0.05, 故不拒绝原假设, 认为这批零件的直径符合5的标准.单正态总体的方差的假设检验例1.5 (教材 例1.5) 某工厂生产金属丝, 产品指标为折断力. 折断力的方差被用作工厂生产精度的表征. 方差越小, 表明精度越高. 以往工厂一直把该方差保持在64(kg 2)与64以下. 最近从一批产品中抽取10根作折断力试验, 测得的结果(单位为千克) 如下:578 572 570 568 572 570 572 596 584 570由上述样本数据算得74.75,2.5752==s x .为此, 厂方怀疑金属丝折断力的方差是否变大了. 如确实增大了, 表明生产精度不如以前, 就需对生产流程作一番检验, 以发现生产环节中存在的问题. 根据题意, 要对方差作双边假设检验:64:;64:2120>≤σσH H输入data3={578,572,570,568,572,570,572,596,584,570};VarianceTest[data3,64,SignificanceLevel->0.05,FullReport->True](*方差检验,使用双边检验,05.0=α*)则输出{FullReport->Variance TestStat Distribution75.7333 10.65 ChiSquareDistribution[9] OneSidedPValue->0.300464,Fail to reject null hypothesis at significance level->0.05}即检验报告给出: 样本方差,7333.752=s 所用检验统计量为自由度4的2χ分布统计量(2χ 检验), 检验统计量的观测值为10.65, 双边检验的P 值为0.300464, 在显著性水平05.0=α 时, 接受原假设, 即认为样本方差的偏大系偶然因素, 生产流程正常, 故不需再作进一步的 检查.例1.6 (教材 例1.6) 某厂生产的某种型号的电池, 其寿命(以小时计) 长期以来服从方差50002=σ的正态分布, 现有一批这种电池, 从它的生产情况来看, 寿命的波动性有所改变. 现随机取26只电池, 测出其寿命的样本方差92002=s .问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取02.0=α)? 根据题意, 要对方差作双边假设检验:5000:;5000:2120≠=σσH H所用的检验统计量为,)1(2022σχS n -=它服从自由度为1-n 的2χ分布.已知样本容量,26=n 样本方差.92002=s输入 ChiSquarePValue[(26-1)*9200/5000, 26-1,TwoSided->True] 则输出 TwoSidedPValue->0.0128357.即P 值小于0.05, 故拒绝原假设. 认为这批电池寿命的波动性较以往有显著的变化.双正态总体均值差的检验(方差未知但相等) 例1.7 (教材 例1.7) 某地某年高考后随机抽得15名男生、12名女生的物理考试成绩如下:男生: 49 48 47 53 51 43 39 57 56 46 42 44 55 44 40 女生: 46 40 47 51 43 36 43 38 48 54 48 34从这27名学生的成绩能说明这个地区男女生的物理考试成绩不相上下吗?(显著性水平05.0=α).根据题意, 要对均值差作单边假设检验:211210:,:μμμμ≠=H H 输入data4={49.0,48,47,53,51,43,39,57,56,46,42,44,55,44,40}; data5={46,40,47,51,43,36,43,38,48,54,48,34};MeanDifferenceTest[data4,data5,0,SignificanceLevel->0.05,TwoSided->True,FullReport->True,EqualVariances->True,FullReport->True](*指定显著性水平05.0=α,且方差相等*) 则输出{FullReport->MeanDiff TestStat Distribution3.6 1.56528 tudentTDistribution[25], OneSidedPValue->0.13009,Fail to reject null hypothesis at significance level->0.05}即检验报告给出: 两个正态总体的均值差为3.6, 检验统计量为自由度25的t 分布(t 检验),检验统计量的观察值为1.56528, 单边检验的P 值为0.13009, 从而没有充分理由否认原假设, 即认为这一地区男女生的物理考试成绩不相上下.双正态总体方差比的假设检验例1.8 (教材 例1.8) 为比较甲、乙两种安眠药的疗效, 将20名患者分成两组, 每组10人, 如服药后延长的睡眠时间分别服从正态分布, 其数据为(单位:小时):甲: 5.5 4.6 4.4 3.4 1.9 1.6 1.1 0.8 0.1 -0.1 乙: 3.7 3.4 2.0 2.0 0.8 0.7 0 -0.1 -0.2 -1.6 问在显著性水平05.0=α下两重要的疗效又无显著差别.根据题意, 先在21,μμ未知的条件下检验假设:2221122210:,:σσσσ≠=H H输入list1={5.5,4.6,4.4,3.4,1.9,1.6,1.1,0.8,0.1,-0.1}; list2={3.7,3.4,2.0,2.0,0.8,0.7,0,-0.1,-0.2,-1.6}; VarianceRatioTest[list1,list2,1,SignificanceLevel->0.05,TwoSided->True,FullReport->True](*方差比检验,使用双边检验,05.0=α*) 则输出{FullReport->Ratio TestStat Distribution1.41267 1.41267 FratioDistribution[9,9], TwoSidedPValue->0.615073,Fail to reject null hypothesis at significancelevel->0.05}即检验报告给出: 两个正态总体的样本方差之比2221s s 为1.41267, 检验统计量的分布为)9,9(F 分布(F 检验), 检验统计量的观察值为1.41267, 双侧检验的P 值为0.615073. 由检验报告知两总体方差相等的假设成立.其次, 要在方差相等的条件下作均值是否相等的假设检验: 211210:,:μμμμ≠'='H H输入MeanDifferenceTest[list1,list2,0,EqualVariances->True,SignificanceLevel->0.05,TwoSided->True,FullReport->True](*均值差是否为零的检验,已知方差相等,05.0=α,双边检验*)则输出{FullReport->MeanDiff TestStat Distribution1.26 1.52273 StudentTDistribution[18], TwoSidedPValue->0.1452,Fail to reject null hypothesis at significance level->0.05}根据输出的检验报告, 应接受原假设,:210μμ='H 因此, 在显著性水平05.0=α下可认为21μμ=.综合上述讨论结果, 可以认为两种安眠药疗效无显著差异.例1.9 (教材 例1.9) 甲、乙两厂生产同一种电阻, 现从甲乙两厂的产品中分别随机抽取12个和10个样品, 测得它们的电阻值后, 计算出样本方差分别为,40.121=s .38.422=s 假设电阻值服从正态分布, 在显著性水平10.0=ε下, 我们是否可以认为两厂生产的电阻值的方差相等.根据题意, 检验统计量为,2221S S F =它服从自由度(1,121--n n )的F 分布.已知样本容量10,1221==n n , 样本方差.38.4,40.12221==s s 该问题即检验假设: 2221122210:,:σσσσ≠=H H输入FRatioPValue[1.40/4.38,12-1,10-1,TwoSided->True,SignificanceLevel->0.1]则输出TwoSidedPValue->0.0785523,Reject null hypothesis at significance level->0.1}所以, 我们拒绝原假设, 即认为两厂生产的电阻阻值的方差不同 分布拟合检验——2χ检验法 例1.10 (教材 例1.10) 下面列出84个伊特拉斯坎男子头颅的最大宽度(单位:mm):141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142 140 137 152 145试检验上述头颅的最大宽度数据是否来自正态总体(1.0=α)?输入数据data2={141,148,132,138,154,142,150,146,155,158,150,140, 147,148, 144,150,149,145,149,158,143,141,144,144,126,140, 144,142,141,140, 145,135,147,146,141,136,140,146,142,137, 148,154,137,139,143,140, 131,143,141,149,148,135,148,152, 143,144,141,143,147,146,150,132, 142,142,143,153,149,146, 149,138,142,149,142,137,134,144,146,147, 140,142,140,137,152,145}; 输入Min[data2]|Max[data2] 则输出126|158即头颅宽度数据的最小值为126, 最大值为158. 考虑区间[124.5,159.5], 它包括了所有的数据. 以5为间隔, 划分小区间. 计算落入每个小区间的频数, 输入 pshu=BinCounts[data2,{124.5,159.5,5}] 则输出{1,4,10,33,24,9,3}因为出现了两个区间内的频数小于5, 所以要合并小区间. 现在把频数为1, 4的两个区间合并, 再把频数为9, 3的两个区间合并. 这样只有5个小区间. 这些区间为(5.134,-∞),),,5.154(,],5.139,5.134(+∞为了计算分布函数在端点的值, 输入 zu=Table[129.5+j*5,{j,1,4}] 则输出{134.5,139.5,144.5,149.5}以这4个数为分点,把),(+∞-∞分成5个区间后,落入5个小区间的频数分别为5, 10, 33, 24, 12.它们除以数据的总个数就得到频率. 输入plv={5,10,33,24,12}/Length[data2]则输出⎭⎬⎫⎩⎨⎧71,72,2811,425,845 下面计算在0H 成立条件下, 数据落入5个小区间的概率. 输入nor=NormalDistribution[Mean[data2],StandardDeviationMLE[data2]]; (*Mean[data2]是总体均值的极大似然估计,StandardDeviationMLE[data2]是总体标准差的极大似然估计, NormalDistribution 是正态分布,因此nor 是由极大似然估计得到的正态分布*) Fhat=CDF[nor,zu] (*CDF 是分布函数的值*)则输出 {0.0590736,0.235726,0.548693,0.832687}此即0H 成立条件下分布函数在分点的值. 再求相邻两个端点的分布函数值之差, 输入 Fhat2=Join[{0},Fhat,{1}];glv=Table[Fhat2[[j]]-Fhat2[[j-1]],{j,2,Length[Fhat2]}]则输出 {0.0590736,0.176652,0.312967,0.283994,0.167313} 输入计算检验统计量2χ值的命令 chi=Apply[Plus,(plv-glv)^2/glv*Length[data2]] 则输出3.59235再输入求2χ分布的P 值命令ChiSquarePValue[chi,2] (*5-2-1=2为2χ分布的自由度*) 则输出 OneSidedPValue->0.165932这个结果表明0H 成立条件下, 统计量2χ取3.59235及比它更大的概率为0.165932, 因此不拒绝0H , 即头颅的最大宽度数据服从正态分布.实验2 回归分析实验目的 学习利用Mathematica 求解一元线性回归问题. 学会正确使用命令线性回归Regress, 并从输出表中读懂线性回归模型中各参数的估计, 回归方程, 线性假设的显著性检验结果, 因变量Y 在预察点0x 的预测区间等.例2.1 (教材 例2.1) 某建材实验室做陶粒混凝土实验室中, 考察每立方米)(3m 混凝土的水泥用量(kg)对混凝土抗压强度)/(2cm kg 的影响, 测得下列数据:7.894.866.822.804.771.742602502402302202103.711.686.646.613.589.56200190180170160150yx y x 抗压强度水泥用量抗压强度水泥用量(1) 画出散点图;(2) 求y 关于x 的线性回归方程,ˆˆˆx b a y+=并作回归分析; (3) 设2250=x kg, 求y 的预测值及置信水平为0.95的预测区间.先输入数据:aa = {{150,56.9},{160,58.3},{170,61.6},{180,64.6},{190,68.1},{200,71.3},{210,74.1},{220,77.4},{230,80.2},{240,82.6},{250,86.4},{260,89.7}};(1) 作出数据表的散点图. 输入ListPlot[aa,PlotRange->{{140,270},{50,90}}]则输出图2.1.图2.1(2) 作一元回归分析, 输入Regress[aa,{1,x},x,RegressionReport->{BestFit,ParameterCITable,SummaryReport}]则输出{BestFit->10.2829+0.303986x, ParameterCITable->Estimate SE CI 1 10.2829 0.850375 {8.388111,12.1776}, x 0.303986 0.00409058 {0.294872,0.3131} ParameterTable->Esimate SE Tstat PValue 110.28290.85037512.09222.71852710-⨯,x 0.303986 0.00409058 74.3137 4.884981510-⨯ Rsquared->0.998193,AdjustedRSquared->0.998012, EstimatedVariance->0.0407025,ANOV A Table->DF SumOfSq MeanSq Fratio PValue Model1 1321.43 1321.435522.524.773961510-⨯Error 10 2.3928 0.23928Total11 1323.82现对上述回归分析报告说明如下:BestFit(最优拟合)-> 10.2829+0.303986x 表示一元回归方程为x y 303986.02829.10+=;ParameterCITable(参数置信区间表)中: Estimate 这一列表示回归函数中参数a , b 的点估计为aˆ=10.2829 (第一行), b ˆ= 0.303986 (第二行); SE 这一列的第一行表示估计量a ˆ的标准差为0.850375, 第二行表示估计量bˆ的标准差为0.00409058; CI 这一列分别表示a ˆ的置信水平为0.95的置信区间是(8.388111,12.1776), bˆ的置信水平为0.95的置信区间是 (0.294872,0.3131).ParameterTable(参数表)中前两列的意义同参数置信区间表; Tstat 与Pvalue 这两列的第一行表示作假设检验(t 检验):0:,0:10≠=a H a H 时, T 统计量的观察值为12.0922, 检验统计量的P 值为2.71852710-⨯, 这个P 值非常小, 检验结果强烈地否定0:0=a H , 接受0:1≠a H ; 第二行表示作假设检验(t 检验): ,0:0=b H 0:1≠b H 时T 统计量的观察值为74.3137, 检验统计量的P 值为 4.884981510-⨯, 这个P 值也非常小, 检验结果强烈地否定,0:0=b H 接受0:1≠b H .Rsquared->0.998193, 表示.998193.0)()(2==总平方和回归平方和SST SSR R 它说明y 的变化有99.8%来自x 的变化; AdjustedRSquared->0.998012, 表示修正后的=2~R 0.998012.EstimatedVariance->0.0407025, 表示线性模型),0(~,2σεεN bx a y ++=中方差2σ的估计为0.0407025.ANOV A Table(回归方差分析表)中的DF 这一列为自由度: Model(一元线性回归模型)的自由度为1, Error(残差)的自由度为,102=-n Total(总的)自由度为.111=-nSumOfSq 这一列为平方和: 回归平方和=SSR 1321.43, 残差平方和=SSE 2.3928,总的平方和=+=SSE SSR SST 1323.82;MeanSq 这一列是平方和的平均值, 由SumOfSq 这一列除以对应的DF 得到, 即.23928.02,43.13211=-===n SSEMSE SSR MSR FRatio 这一列为统计量MSEMSRF =的值, 即.52.5522=F 最后一列表示统计量F 的P 值非常接近于0. 因此在作模型参数)(b =β的假设检验(F 检验):0:;0:10≠=ββH H 时, 强烈地否定0:0=βH , 即模型的参数向量.0≠β因此回归效果 非常显著.(3) 在命令RegressionReport 的选项中增加RegressionReport->{SinglePredictionCITable}就可以得到在变量x 的观察点处的y 的预测值和预测区间. 虽然0.14=x 不是观察点, 但是可以用线性插值的方法得到近似的置信区间. 输入aa=Sort[aa]; (*对数据aa 按照水泥用量x 的大小进行排序*)regress2=Regress[aa,{1,x},x,RegressionReport->{SinglePredictionCITable}](*对数据aa 作线性回归, 回归报告输出y 值的预测区间*)执行后输出{SinglePredictionCITable-> Observed PredictedSE CI56.9 55.8808 0.55663 {54.6405,57.121} 58.3 58.92060.541391 {57.7143,60.1269} 61.6 61.9605 0.528883 {60.7821,63.1389} 64.6 65.00030.519305 {63.8433,66.1574} 68.1 68.0402 0.51282 {66.8976,69.1828} 71.3 71.0801 0.509547 {69.9447,72.2154}} 74.1 74.1199 0.509547 {72.9846,75.2553} 77.4 77.1598 0.51282 {76.0172,78.3024} 80.2 80.1997 0.519305 {79.0426,81.3567} 82.6 83.2395 0.528883 {82.0611,84.4179} 86.4 86.2794 0.541391 {85.0731,87.4857} 89.7 89.3192 0.55663 {88.079,90.5595}上表中第一列是观察到的y 的值, 第二列是y 的预测值, 第三列是标准差, 第四列是相应的预测区间(置信度为0.95). 从上表可见在)4.77(220==y x 时, y 的预测值为77.1598, 置信度为0.95的预测区间为(76.0172,75.2553), 在)2.80(230==y x 时, y 的预测值为80.1997, 置信度为0.95的预测区间为{79.0426,81.3567}. 利用线性回归方程, 可算得=0x 225时, y 的预测值为78.68, 置信度为0.95的预测区间为(77.546, 79.814).利用上述插值思想, 可以进一步作出预测区间的图形. 先输入调用图软件包命令<<Graphics`执行后再输入{observed2,predicted2,se2,ci2}=Transpose[(SinglePredictionCITable/.regress2)[[1]]];(*取出上面输出表中的四组数据, 分别记作observed2,predicted2,se2,ci2*)xva12=Map[First,aa];(*取出数据aa中的第一列, 即数据中x的值, 记作xva12*)Predicted3=Transpose[{xva12,predicted2}];(*把x的值xva12与相应的预测值predicted2配成数对, 它们应该在一条回归直线上*)lowerCI2=Transpose[{xva12,Map[First,ci2]}];(*Map[First,ci2]取出预测区间的第一个值, 即置信下限. x的值xva12与相应的置信下限配成数对*)upperCI2=Transpose[{xva12,Map[Last,ci2]}];(*Map[Last,ci2]取出预测区间的第二个值, 即置信上限. x的值xva12与相应的置信上限配成数对*)MultipleListPlot[aa,Predicted3,lowerCI2,upperCI2,PlotJoined->{False,True,True,True},SymbolShape->{PlotSymbol[Diamond],None,None, None},PlotStyle->{Automatic,Automatic,Dashing[{0.04,0.04}],Dashing[{0.04,0.04}]}](*把原始数据aa和上面命令得到的三组数对predicted3,lowerCI2,upperCI2 用多重散点图命令MultipleListPlot在同一个坐标中画出来. 图形中数据aa的散点图不用线段连接起来, 其余的三组散点图用线段连接起来, 而且最后两组数据的散点图用虚线连接.*)则输出图2.2.图2.2从图形中可以看到, 由Y 的预测值连接起来的实线就是回归直线. 钻石形的点是原始数 据. 虚线构成预测区间.多元线性回归例2.2 (教材 例2.2) 一种合金在某种添加剂的不同浓度下, 各做三次试验, 得到数据如下表:8.323.327.298.277.288.301.306.321.313.274.297.312.318.292.250.300.250.200.150.10Yx 抗压强度浓度(1) 作散点图;(2) 以模型),0(~,22210σεεN x b x b b Y +++=拟合数据, 其中2210,,,σb b b 与x 无关;(3) 求回归方程,ˆˆˆˆ2210x b x b b y ++=并作回归分析. 先输入数据bb={{10.0,25.2},{10.0,27.3},{10.0,28.7},{15.0,29.8},{15.0,31.1},{15.0,27.8},{20.0,31.2},{20.0,32.6}, {20.0,29.7},{25.0,31.7},{25.0,30.1},{25.0,32.3}, {30.0,29.4},{30.0,30.8},{30.0,32.8}};(1) 作散点图, 输入ListPlot[bb,PlotRange->{{5,32},{23,33}},AxesOrigin->{8,24}]则输出图2.3.图2.3(2) 作二元线性回归, 输入Regress[bb,{1,x,x^2},x,RegressionReport->{BestFit,ParameterCITable,SummaryReport}](*对数据bb 作回归分析, 回归函数为,2210x b x b b ++用{1,x,x^2}表示, 自变量为x, 参数0b ,1b ,2b 的置信水平为0.95的置信区间)执行后得到输出的结果:{bestFit->19.0333+1.00857x-0.020381x 2, ParameterCITable->Estimate SE CI119.0333 3.27755{11.8922,26.1745} x 1.00857 0.356431{0.231975,1.78517}x 2 -0.0203810.00881488{-0.0395869,-0.00117497}ParameterTable->Estimate SE Tstat PValue 1 19.0333 3.277555.80718 0.0000837856 x1.008570.356431 2.829640.0151859 x 2 -0.0203810.00881488-2.312110.0393258Rsquared->0.614021,AdjustedRSquared->0.549692, EstimatedVariance->2.03968,ANOV A Table->DF SumOfSqMeanSq Fratio PValue Mode1 2 38.937119.4686 9.54490.00330658Error 12 24.47622.03968Total14 63.4133从输出结果可见: 回归方程为,020381.000857.10333.192x x Y -+=.020381.0ˆ,00857.1ˆ,0333.19ˆ210-===b b b 它们的置信水平为0.95的置信区间分别是 (11.8922,26.1745),(0.231975,1.78517),(-0.0395869,-0.00117497).假设检验的结果是: 在显著性水平为0.95时它们都不等于零. 模型),0(~,22210σεεN x b x b b Y +++=中,2σ的估计为2.03968. 对模型参数T b b ),(21=β是否等于零的检验结果是: .0≠β因此回归效果显著.非线性回归例2.3 下面的数据来自对某种遗传特征的研究结果, 一共有2723对数据, 把它们分成8类后归纳为下表.36.1937.1991.2079.2115.2342.257.2908.3887654321917461203246071021579y x 遗传性指标分类变量频率研究者通过散点图认为y 和x 符合指数关系:,c ae y bx += 其中c b a ,,是参数. 求参数c b a ,,的最小二乘估计.因为y 和x 的关系不是能用Fit 命令拟合的线性关系, 也不能转换为线性回归模型. 因此考虑用(1)多元微积分的方法求c b a ,,的最小二乘估计; (2)非线性拟合命令NonlinearFit 求c b a ,,的最小二乘估计.(1) 微积分方法 输入Off[Genera1::spe11] Off[Genera1::spe111] Clear[x,y,a,b,c]dataset={{579,1,38.08},{1021,2,29.70},{607,3,25.42},{324,4,23.15},{120,5,21.79},{46,6,20.91},{17,7,19.37},{9,8,19.36}}; (*输入数据集*)y[x_]:=a Exp[b x]+c (*定义函数关系*)下面一组命令先定义了曲线c ae y bx +=与2723个数据点的垂直方向的距离平方和, 记为).,,(c b a g 再求),,(c b a g 对c b a ,,的偏导数,,,cgb g a g ∂∂∂∂∂∂分别记为.,,gc gb ga 用FindRoot 命令解三个偏导数等于零组成的方程组(求解c b a ,,). 其结果就是所要求的c b a ,,的最小二乘估计. 输入Clear[a,b,c,f,fa,fb,fc]g[a_,b_,c_]:=Sum[dataset[[i,1]]*(dataset[[i,3]]-a*Exp[dataset[[i,2]]*b]-c)^2,{i,1,Length[dataset]}] ga[a_,b_,c_]=D[g[a,b,c],a]; gb[a_,b_,c_]=D[g[a,b,c],b]; gc[a_,b_,c_]=D[g[a,b,c],c]; Clear[a,b,c]oursolution=FindRoot[{ga[a,b,c]==0,gb[a,b,c]==0,gc[a,b,c]==0},{a,40.},{b,-1.},{c,20.}](* 40是a 的初值, -1是b 的初值, 20是c 的初值*)则输出{a->33.2221,b->-0.626855,c->20.2913} 再输入yhat[x_]=y[x]/.oursolution则输出20.2913+33.2221x e 626855.0-这就是y 和x 的最佳拟合关系. 输入以下命令可以得到拟合函数和数据点的图形:p1=Plot[yhat[x],{x,0,12},PlotRange->{15,55},DisplayFunction->Identity]; pts=Table[{dataset[[i,2]],dataset[[i,3]]},{i,1,Length[dataset]}];p2=ListPlot[pts,PlotStyle->PointSize[.01],DisplayFunction->Identity]; Show[p1,p2,DisplayFunction->$DisplayFunction];则输出图2.4.图2.4(2) 直接用非线性拟合命令NonlinearFit 方法 输入data2=Flatten[Table[Table[{dataset[[j,2]],dataset[[j, 3]]},{i,dataset[[j,1]]}],{j,1,Length[dataset]}],1]; (*把数据集恢复成2723个数对的形式*)<<Statistics`w=NonlinearFit[data2,a*Exp[b*x]+c,{x},{{a,40},{b,-1},{c,20}}]则输出x e 626855.02221.332913.20-+这个结果与(1)的结果完全相同. 这里同样要注意的是参数c b a ,,必须选择合适的初值.如果要评价回归效果, 则只要求出2723个数据的残差平方和.)ˆ(2∑-i iyy 输入 yest=Table[yhat[dataset[[i,2]]],{i,1, Length[dataset]}];yact=Table[dataset[[i,3]],{i,1,Length[dataset]}]; wts=Table[dataset[[i,1]],{i,1,Length[dataset]}]; sse=wts.(yact-yest)^2 (*作点乘运算*)则输出59.9664即2723个数据的残差平方和是59.9664. 再求出2723个数据的总的相对误差的平方和.]ˆ/)ˆ[(2∑-i i i y yy 输入sse2=wts.((yact-yest)^2/yest) (*作点乘运算)则输出2.74075由此可见, 回归效果是显著的.实验3 方差分析实验目的 学习利用Mathematica 求单因素方差分析的方法.例3.1 (教材 例3.1) 今有某种型号的电池三批, 它们分别是A ,B ,C 三个工厂所生产的. 为评比起质量, 各随机抽取5只电池为样品, 经试验得其寿命(单位:h)如下表:试在显著性水平0.05下检验电池的平均寿命有无显著的差异. 若差异是显著的, 试求均值差,B A μμ-C A μμ-及C B μμ-的置信水平为95%的置信区间.这是方差分析问题, 先把它转化为线性模型:Y = X β +ε.令 ,101101011011001001,515151⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛= X Y Y Y Y Y Y Y C C B B A A ,⎪⎪⎪⎭⎫⎝⎛--=A CA B A μμμμμβ⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=531352125111εεεεεεε则线性模型(3.3)与方差分析模型(3.1)完全等价. 模型(3.3)完全可以用DesignedRegress 命令作设计回归, 得到所要的方差分析表.我们面临的任务是:(1) 检验3个总体的均值是否相等,即作假设检验不全相等C B A C B A H H μμμμμμ,,:;:10==(2) 求均值差,B A μμ-C A μμ-及C B μμ-的置信水平为95%的置信区间. 任务(1)等价于对模型(3.3)作检验:不全等于零A C A B A C A B H H μμμμμμμμ--=-=-,:;0:10而任务(2)等价于求B C A C A B μμμμμμ---及,的置信区间. 在DesignedRegress 命令中加入选项RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}后便能完成上述任务.用回归分析作单因素方差分析完成对模型的假设检验和对模型参数的区间估计任务.输入设计矩阵和数据X1={{1.0,0,0},{1,0,0},{1,0,0},{1,0,0},{1,0,0},{1,1,0},{1,1,0},{1,1,0},{1,1,0},{1,1,0},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1}};Y1={40,42,48,45,38,26,28,34,32,30,39,50,40,50,43}; 再输入设计回归命令DesignedRegress[X1,Y1,RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}] (*回归报告输出参数的置信区间,均值的置信区间和总结报告*)执行后得到输出Estimate SE CI 1 42.6 1.89912 {38.4622,46.7378}{ParameterCITable->2 -12.6 2.68576 {-18.4518,-6.74822}3 1.8 2.68576 {-4.05178,7.65178}MeanPredictionCITable-> Observed Predicted SE CI 40. 42.6 1.89912 {38.4622,46.7378} 42. 42.6 1.89912 {38.4622,46.7378} 48. 42.6 1.89912 {38.4622,46.7378} 45. 42.6 1.89912 {38.4622,46.7378} 38. 42.6 1.89912 {38.4622,46.7378} 26. 30. 1.89912 {25.8622,34.1378} 28. 30. 1.89912 {25.8622,34.1378} 34. 30. 1.89912 {25.8622,34.1378} 32. 30. 1.89912 {25.8622,34.1378} 30. 30. 1.89912 {25.8622,34.1378} 39. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 40. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 43. 44.4 1.89912 {40.2622,48.5378}Estimate SE TStat PValue 1 42.6 1.89912 22.4314 3.63987×10-11{ParameterCITable->2 -12.6 2.68576 -4.6914 0.000521963 1.8 2.68576 0.6702 0.515421Rsquared->0.739904,AdjustedRSquared->0.696554, EstimatedVariance->18.0333,ANOV A Table->DF SumOfsq MeanSq Fratio PvalueModel 2 615.6 307.8 17.0684 0.000309602 Error 12 216.4 18.0333 Total 14 832.从参数置信区间表(ParameterCITable)可知: A μ的点估计是42.6, 估计量的标准差为1.89912, A μ的置信水平为0.95的置信区间是(38.4622,46.7378). A B μμ-的点估计是-12.6,标准差为2.68576, A B μμ-的置信水平为0.95的置信区间是).74822.6,4518.18(-- A C μμ-的点估计是1.8, 标准差为2.68576, A C μμ-的置信水平为0.95的置信区间是).65178.7,05178.4(-从均值置信区间表(MeanPredictionCITable)知: A μ的点估计, A μ的置信区间同参数置信区间表, B μ的点估计为30.0, 置信度为0.95的置信区间是),1378.34,8622.25(C μ的点估计为44.4, 置信度为0.95的置信区间是).5378.48,2622.40( 从参数表(ParameterTable)知: 关于A B μμ-是否等于零的假设检验结果是否定的, 即A B μμ-不等于零. 关于A C μμ-是否等于零的假设检验结果是不否定原假设, 即不否定A C μμ-等于零的假设.从Rsquared->0.739904知Y 的变化中的74%是由模型引起的,26%是由误差引起的. 从EstimatedVariance->18.0333知模型中的误差项ε的方差的估计是18.0333.最后从方差分析表知平方和的分解结果是:总的平方和=832.0,模型引起的平方和(效应平方和)=615.6,误差平方和=216.4. 作假设检验:不全等于零A C A B A C A B H H μμμμμμμμ--=-=-,:;0:10时, 统计量F 的观察值为17.0684, F 的P 值为0.000309602, 检验结果显然否定原假设,即三个工厂生产的电池的平均寿命有显著差异.总结起来: 三个工厂生产的电池的平均寿命有显著差异. B A μμ-的置信水平为0.95的置信区间是(6.74822,18.4518). C A μμ-的置信水平为0.95的置信区间是).05178.4,65178.7(-看来只有C B μμ-的置信区间未能求得.只要改变设计矩阵X , 再作一次设计回归.输入X2={{1.0,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{0,1,1},{0,1,1},{0,1,1},{0,1,1},{0,1,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1}};DesignedRegress[X2,Y1,RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}]就能得到类似于对11,y x 的设计回归结果(输出结果省略了),从参数置信区间表可以得到C B μμ-的置信水平为0.95的置信区间是).54822.8,2518.20(--例3.2 (教材 例3.2) 将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效. 下表中列出了5种常用的抗生素注入到牛的体内时, 抗生素与血浆蛋白质结合的百分比. 试在水平05.0=α下检验这些百分比的均值有无显著的差异.青霉素 四环素 链霉素 红霉素 氯霉素 29.6 27.3 5.8 21.6 29.2 24.3 32.6 6.2 17.4 32.8 28.5 30.8 11.0 18.3 25.0 32.0 34.8 8.3 19.0 24.2 本例也是单因素方差分析问题. 输入X3={{1.0,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,0,1},{1,0,0,0,1},{1,0,0,0,1},{1,0,0,0,1}};Y3={29.6,24.3,28.5,32.0,27.3,32.6,30.8,34.8,5.8,6.2,11.0,8.3,21.6,17.4,18.3,19.0,29.2,32.8,25.0,24.2};DesignedRegress[X3,Y3,RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}]执行以后得到输出{ParameterCITable->Estimate SE CI1 28.6 1.50456 {25.3931,31.8069}2 2.775 2.12777 {-1.76024,731024}3 -20.775 2.12777 {-25.3102,-16.2398}4 -9.525 2.12777 {-14.0602,-4.98976}5 -0.8 2.12777 {-5.33524,3.73524}{ParameterTable->Estimate SE TStat PValue1 28.6 1.50456 19.0088 6.58118×10-122 2.775 2.12777 1.30418 0.211833 -20.775 2.12777 -9.76373 6.83788×10-84 -9.525 2.12777 -4.47651 0.0004435975 -0.8 2.12777 -0.37598 0.712196Rsquared->0.915985,AdjustedRSquared->0.893581,EstimatedVariance->9.05483,ANOV ATable->DF Sumofsq MeanSq Fratio PvalueModel 4 1480.82 370.206 40.8849 6.73978×10-8Error 15 135.822 9.05483Total 19 1616.65α时,这些百分比的均值有显著差异. 因为F检验的P值非常小,所以即使在检验的水平01.0=注: 利用Mathematica语句, 我们也可以直接编程计算方差分析表. 有兴趣的读者可参考更高一级的实验教材(如[10],[11]等).。