第9章方差分析思考与练习带答案

合集下载

方差练习题及答案

方差练习题及答案

方差练习题及答案在统计学中,方差是用于衡量数据变异程度的重要概念。

为了帮助大家更好地理解和应用方差,下面将为大家提供一些方差练习题及答案。

通过练习,相信大家能够加深对方差的理解,并提升自己的统计学能力。

练习题1:某家电公司对一种新推出的电视机型进行了质量测试。

经过抽取一定数量的样本,得到了以下质量检测结果(单位:小时):样本A:120, 150, 140, 135, 130样本B:125, 130, 140, 135, 145样本C:130, 135, 125, 140, 130请计算样本A、样本B和样本C的方差,并分析样本数据的变异情况。

答案:首先,我们需要计算每个样本的平均值。

对于样本A,平均值为(120+150+140+135+130)/5 = 135,样本B的平均值为(125+130+140+135+145)/5 = 135,样本C的平均值为(130+135+125+140+130)/5 = 132。

然后,我们计算每个样本数据与平均值的偏差平方,得到如下结果:样本A的偏差平方:(120-135)²,(150-135)²,(140-135)²,(135-135)²,(130-135)²样本B的偏差平方:(125-135)²,(130-135)²,(140-135)²,(135-135)²,(145-135)²样本C的偏差平方:(130-132)²,(135-132)²,(125-132)²,(140-132)²,(130-132)²将每个样本的偏差平方相加,并求平均值,即可得到方差的计算结果:样本A的方差:((120-135)² + (150-135)² + (140-135)² + (135-135)² + (130-135)²)/5 = 112样本B的方差:((125-135)² + (130-135)² + (140-135)² + (135-135)² + (145-135)²)/5 = 100样本C的方差:((130-132)² + (135-132)² + (125-132)² + (140-132)² + (130-132)²)/5 = 17.6通过对样本数据的方差计算,我们可以看出样本A的方差最大,而样本C的方差最小。

(完整word版)应用回归分析,第9章课后习题参考答案

(完整word版)应用回归分析,第9章课后习题参考答案

第9章 含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0—1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。

出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。

对春夏秋冬四个季节引入4个0—1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然,(X ,D)中的第1列可表示成后4列的线性组合,从而(X ,D)不满秩,参数无法唯一求出。

这就是所谓的“虚拟变量陷井",应避免。

当某自变量x j 对其余p —1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型.称Tol j =1—2j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0。

0001。

也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。

而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。

⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα9。

2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。

一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。

方差分析习题与答案

方差分析习题与答案

统计教圆好分解训练题与问案一、单项采用题之阳早格格创做1.正在圆好分解中,()反映的是样本数据与其组仄衡值的好别A 总离好B 组间缺点C 抽样缺点D 组内缺点2.是()A 组内仄圆战B 组间仄圆战C 总离好仄圆战D 果素B的离好仄圆战3.是()A 组内仄圆战B 组间仄圆战C 总离好仄圆战D 总圆好4.单果素圆好分解中,估计F统计量,其分子与分母的自由度各为()A r,nB r-n,n-rC r-1.n-rD n-r,r-1两、多项采用题1.应用圆好分解的前提条件是()A 各个总体报从正态分散B 各个总体均值相等C 各个总体具备相共的圆好D 各个总体均值不等E 各个总体相互独力2.若考验统计量F= 近似等于1,证明()A 组间圆好中不包罗系统果素的做用B 组内圆好中不包罗系统果素的做用C 组间圆好中包罗系统果素的做用D 圆好分解中应中断本假设E圆好分解中应交受本假设3.对付于单果素圆好分解的组内缺点,底下哪种道法是对付的?()A 其自由度为r-1B 反映的是随机果素的做用C 反映的是随机果素战系统果素的做用D 组内缺点一定小于组间缺点E 其自由度为n-r4.为钻研溶液温度对付液体动物的做用,将火温统造正在三个火仄上,则称那种圆好分解是()A 单果素圆好分解B 单果素圆好分解C 三果素圆好分解D 单果素三火仄圆好分解E 单果素三火仄圆好分解三、挖空题1.圆好分解的脚法是考验果变量y与自变量x是可,而真止那个脚法的脚法是通过的比较.2.总变好仄圆战、组间变好仄圆战、组内变好仄圆战三者之间的闭系是 .3.圆好分解中的果变量是,自变量不妨是,也不妨是 .4.圆好分解是通过对付组间均值变同的分解钻研推断多个是可相等的一种统计要领.5.正在考查安排中,把要思量的那些不妨统造的条件称为,把果素变更的多个等第状态称为 .6.正在单果子圆好分解中,估计F统计量的分子是圆好,分母是圆好.7.正在单果子圆好分解中,分子的自由度是,分母的自由度是 .四、估计题1.有三台呆板死产规格相共的铝合金薄板,为考验三台呆板死产薄板的薄度是可相共,随机从每台呆板死产的薄板中各抽与了5个样品,测得截止如下:问:三台呆板死产薄板的薄度是可有隐著好别?2.养鸡场要考验四种饲料配圆对付小鸡删沉是可相共,用每一种饲料分别喂养了6只共一品种共时孵出的小鸡,共饲养了8周,每只鸡删沉数据如下:(克)配圆:370,420,450,490,500,450配圆:490,380,400,390,500,410配圆:330,340,400,380,470,360配圆:410,480,400,420,380,410问:四种分歧配圆的饲料对付小鸡删沉是可相共?3.今有某种型号的电池三批,它们分别为一厂、两厂、三厂三个工厂所死产的.为评比其本量,各随机抽与5只电池为样品,经考查测得其寿命(小时)如下:一厂:40,48,38,42,45两厂:26,34,30,28,32三厂:39,40,43,50,50试正在隐著性火仄下考验电池的仄衡寿命有无隐著的好别.4.一个年级有三个小班,他们举止了一次数教考查.现从各个班级随机抽与了一些教死,记录其结果如下:1班:73,89,82,43,80,73,66,60,45,93,36,772班:88,78,48,91,51,85,74,56,77,31,78,62,76,96,803班:68,79,56,91,71,71,87,41,59,68,53,79,15若各班教死结果遵循正态分散,且圆好相等,试正在隐著性火仄下考验各班级的仄衡分数有无隐著好别?一、单项采用题1. D 2. A 3. C 4. C两、多项采用题1. ACE 2. ABD 3. BE 4.AD三、挖空题1.独力、圆好2.总变好仄圆战=组间变好仄圆战+组内变好仄圆战. 3.数量型变量,本量型变量,数量型变量.4.正态总体均值5.果子,火仄或者处理.6.组间、组内7.m-1, n-m.四、估计题1.解:根据估计截止列出圆好分解表果为(2,12),故中断,认为各台呆板死产的薄板薄度有隐著好别.2.解:根据估计截止列出圆好分解表果为(3,20),故交受,即四种配圆的饲料对付小鸡的删沉不隐著的好别. 3.解:各总值均值间有隐著好别. 4.解:好别不隐著.。

概率论与数理统计_浙大四版_习题解_第9章_方差分析

概率论与数理统计_浙大四版_习题解_第9章_方差分析

概率论与数理统计(浙大四版)习题解 第9章 方差分析约定:以下各个习题所涉及的方差分析问题均满足方差分析模型所要求的条件。

【习题9.1】今有某种型号的电池三批,它们分别是C B A ,,三个工厂所生产的。

为评比其质量,各随机抽取5只电池为样品,经试验得其寿命(小时)如下表。

三批电池样品的寿命检测结果 A B C 40 42 26 28 39 50 48 45 34 32 40 50 383043(1)试在显著性水平0.05下检验电池的平均寿命有无显著的差异。

(2)若差异显著,试求B A μμ-、C A μμ-及C B μμ-的置信水平为0.95的置信区间。

〖解(1)〗设,,A B C μμμ分别表C B A ,,三厂所产电池的寿命均值,则问题(1)归结为检验下面的假设(单因素方差分析)01::,,不全相等A B CA B C H H μμμμμμ==设A 表因素(工厂),设,,,T R A CR 分别表样本和、样本平方和、因素A 计算数、矫正数,其值的计算过程和结果如下表。

样本数据预处理表A B C 预处理结果40 42 26 28 39 50 n=15 48 45 34 32 40 50 a=338 30 43 CR=22815 j T 213 150 222 T=585 2j j T n9073.8 4500 9856.8 A=23430.6 2ijx∑913745409970R=23647112221121158558522815152364723430.6jjj n aij j i n aijj i n a ij j j i T x T CR n R x A x n =============⎛⎫== ⎪ ⎪⎝⎭∑∑∑∑∑∑计算平方和及自由度如下23647228158321151142364723430.6216.41531223430.622815615.61312T E A SST R CR df n SSE R A df n a SSA A CR df a =-=-==-=-==-=-==-=-==-=-==-=-= 方差分析表方差来源 平方和 自由度 均方 F 值()0.052,12F因素A 615.6 2 307.8 17.07 3.89 误差 216.4 12 18.0333总和83214因17.07 3.89值F =>在拒绝域内,故在0.05水平上拒绝0H ,即认定各厂生产的电池寿命有显著的差异。

方差分析习题与答案

方差分析习题与答案

统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映地是样本数据与其组平均值地差异A 总离差B 组间误差C 抽样误差D 组内误差2.是()A 组内平方和B 组间平方和C 总离差平方和D 因素B地离差平方和3.是()A 组内平方和B 组间平方和C 总离差平方和D 总方差4A r,1AD2ACE3ACE4(AD12345.在试验设计中,把要考虑地那些可以控制地条件称为,把因素变化地多个等级状态称为 .6.在单因子方差分析中,计算F统计量地分子是方差,分母是方差.7.在单因子方差分析中,分子地自由度是,分母地自由度是 .四、计算题1.有三台机器生产规格相同地铝合金薄板,为检验三台机器生产薄板地厚度是否相同,随机从每台机器生产地薄板中各抽取了5个样品,测得结果如下:机器1:0.236,0.238,0.248,0.245,0.243机器2:0.257,0.253,0.255,0.254,0.261机器3:0.258,0.264,0.259,0.267,0.262问:三台机器生产薄板地厚度是否有显著差异?2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出地小鸡,共饲养了8周,每只鸡增重数据如下:(克)配方:370,420,450,490,500,450配方:490,380,400,390,500,410配方:330,340,400,380,470,360配方:410,480,400,420,380,410问:四种不同配方地饲料对小鸡增重是否相同?3.今有某种型号地电池三批,它们分别为一厂、二厂、三厂三个工厂所生产地.为评比其一厂二厂三厂41.1.1234567.四、计算题1.解:根据计算结果列出方差分析表因为(2,12)=3.89<32.92,故拒绝,认为各台机器生产地薄板厚度有显著差异.2.解:根据计算结果列出方差分析表。

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析

《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析第6章方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。

6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。

6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。

6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。

6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。

85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设;85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。

6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。

第7章相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。

(2)920232.0=r 。

(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。

7.2 (1)散点图(略)。

(2)8621.0=r 。

7.3 (1)0?β表示当0=x 时y 的期望值。

(2)1?β表示x 每变动一个单位y 平均下降0.5个单位。

(3)7)(=y E 。

7.4 (1)%902=R 。

(2)1=e s 。

7.5 (1)散点图(略)。

概率论与数理统计第九章 方差分析

概率论与数理统计第九章 方差分析

第九章方差分析在生产过程和科学实验中,我们经常遇到这样的问题:影响产品产量、质量的因素很多.例如,在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在20世纪20年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔,可以成功地应用在试验工作的很多方面.第一节单因素试验的方差分析在试验中,我们将要考察的指标称为试验指标,影响试验指标的条件称为因素.因素可分为两类,一类是人们可以控制的;一类是人们不能控制的.例如,原料成分、反应温度、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素,因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变,这样的试验称为单因素试验,如果多于一个因素在改变,就称为多因素试验.本节通过实例来讨论单因素试验.1.数学模型例9.1某试验室对钢锭模进行选材试验.其方法是将试件加热到700℃后,投入到20℃的水中急冷,这样反复进行到试件断裂为止,试验次数越多,试件质量越好.试验结果如表9-1.表9-1试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异.这里,试验的指标是钢锭模的热疲劳值,钢锭模的材质是因素,4种不同的材质表示钢锭模的4个水平,这项试验叫做4水平单因素试验.例9.2考察一种人造纤维在不同温度的水中浸泡后的缩水率,在40℃,50℃, (90)的水中分别进行4次试验.得到该种纤维在每次试验中的缩水率如表92.试问浸泡水的温度对缩水率有无显著的影响?表9-2 (%)单因素试验的一般数学模型为:因素A 有s 个水平A 1,A 2,…,A s ,在水平A j (j =1,2,…,s )下进行n j (n j ≥2)次独立试验,得到如表9-3的结果:表9-3x 11 x 12 … x 1s x 21 x 22 … x 2s … … … … 11n x 22n x … s n s xT ·1 T ·2 … T ·s1x • 2x • … s x •μ1 μ2 … μs假定:各水平A j (j =1,2,…,s )下的样本x ij ~N (j ,),i =1,2,…,n j ,j =1,2,…,s ,且相互独立. 故x ij -μj 可看成随机误差,它们是试验中无法控制的各种因素所引起的,记x ij -μj =εij ,则⎪⎩⎪⎨⎧==+=.,),0(~,,,2,1;,,2,1,2相互独立各ij ij j ij j ij N s j n i x εσεεμ (9.1) 其中μj 与σ2均为未知参数.(9.1)式称为单因素试验方差分析的数学模型.方差分析的任务是对于模型(9.1),检验s 个总体N (μ1,σ2),…,N (μs ,σ2)的均值是否相等, 即检验假设012112:;:,,,s s H H μμμσσσ===⎧⎨⎩不全相等. (9.2) 为将问题(9.2)写成便于讨论的形式,采用记号μ=11sj j j n n μ=∑,其中n =1sjj n=∑,μ表示μ1,μ2,…,μs 的加权平均,μ称为总平均.δj =μj -μ, j =1,2,…,s ,δj 表示水平Aj 下的总体平均值与总平均的差异.习惯上将δj 称为水平A j 的效应.利用这些记号,模型(9.1)可改写成:x ij =μ+δj +εij ,x ij 可分解成总平均、水平A j 的效应及随机误差三部分之和120,~(0,),.1,2,,;1,2,,.sj j j ijij j n N i n j s δεσε=⎧=⎪⎨⎪==⎩∑各相互独立 (9.1)′假设(9.2)等价于假设012112:0;:,,,s s H H δδδδδδ====⎧⎨⎩不全零.(9.2)′ 2.平方和分解我们寻找适当的统计量,对参数作假设检验.下面从平方和的分解着手,导出假设检验(9.2)′的检验统计量.记S T =211()jn sijj i xx ==-∑∑, (9.3)这里111jns ij j i x x n ===∑∑,S T 能反应全部试验数据之间的差异.又称为总变差.A j 下的样本均值 11jn j iji jx xn •==∑. (9.4)注意到2222()()()()2()()ij ij j j ij j j ij j j x x x x x x x x x x x x x x ••••••-=-+-=-+-+--,而 1111()()()()jj n n ssij j j j ij j j i j i x x x x x x x x ••••====⎡⎤--=--⎢⎥⎣⎦∑∑∑∑=11()0.j n sj ij j j j i x x x n x ••==⎛⎫--= ⎪ ⎪⎝⎭∑∑记 S E =211()jn sijj j i xx •==-∑∑, (9.5)S E 称为误差平方和;记 S A =22111()()jn ssjj j j i j xx n x x ••===-=-∑∑∑, (9.6)S A 称为因素A 的效应平方和.于是S T =S E +S A . (9.7)利用εij 可更清楚地看到S E ,S A 的含义,记111jns ij j i n εε===∑∑为随机误差的总平均,11jn j iji jn εε•==∑, j =1,2,…,s .于是S E =221111()()jjn n ssijj ij j j i j i xx εε••====-=-∑∑∑∑; (9.8)S A =2211()()ssj jj j j j j n xx n δεε••==-=+-∑∑. (9.9)平方和的分解公式(9.7)说明.总平方和分解成误差平方和与因素A 的效应平方和.(9.8)式说明S E 完全是由随机波动引起的.而(9.9)式说明S A 除随机误差外还含有各水平的效应δj ,当δj 不全为零时,S A 主要反映了这些效应的差异.若H 0成立,各水平的效应为零,S A 中也只含随机误差,因而S A 与S E 相比较相对于某一显著性水平来说不应太大.方差分析的目的是研究S A 相对于S E 有多大,若S A 比S E 显著地大,这表明各水平对指标的影响有显著差异.故需研究与S A /S E 有关的统计量.3.假设检验问题当H 0成立时,设x ij ~N (μ,σ2)(i =1,2,…,n j ;j =1,2,…,s )且相互独立,利用抽样分布的有关定理,我们有22~(1)AS s χσ-, (9.10) 22~()ES n s χσ-, (9.11)F =()(1)AEn s S s S -- ~F (s -1,n -s ). (9.12)于是,对于给定的显著性水平α(0<α<1),由于P {F ≥F α(s -1,n -s )}=α, (9.13)由此得检验问题(9.2)′的拒绝域为F ≥F α(s -1,n -s ).(9.14)由样本值计算F 的值,若F ≥F α,则拒绝H 0,即认为水平的改变对指标有显著性的影响;若F <F α,则接受原假设H 0,即认为水平的改变对指标无显著影响. 上面的分析结果可排成表9-4的形式,称为方差分析表.当F ≥F 0.05(s -1,n -s )时,称为显著, 当F ≥F 0.01(s -1,n -s )时,称为高度显著.在实际中,我们可以按以下较简便的公式来计算S T ,S A 和S E .记T ·j =1jn iji x=∑, j =1,2,…,s ,T ··=11jn sijj i x==∑∑,即有22221111222211,,.j jn n s s T ij ij j i j i s s j A j j j j j E T AT S x nx x n T T S n x nx n n S S S ••====••••==⎧=-=-⎪⎪⎪⎪=-=-⎨⎪⎪=-⎪⎪⎩∑∑∑∑∑∑ (9.15) 例9.3 如上所述,在例9.1中需检验假设H 0:μ1=μ2=μ3=μ4;H 1:μ1,μ2,μ3,μ4不全相等.给定α=0.05,完成这一假设检验.解 s =4,n 1=7,n 2=5,n 3=8,n 4=6,n =26.S T =22211(4257)69895926jn sij j i T x n ••==-=-∑∑=1957.12, S A =2221(4257)697445.4926sj j j T T n n •••=-=-∑=443.61, S E =S T -S A =1513.51.得方差分析表9-5.表9-5因 F (3,22)=2.15<F 0.05(3,22)=3.05. 则接受H 0,即认为4种生铁试样的热疲劳性无显著差异.例9.4 如上所述,在例9.2中需检验假设H 0:μ1=μ2=…=μ6; H 1:μ1,μ2,…,μ6不全相等.试取α=0.05,α=0.01,完成这一假设检验.解 s =6, n 1=n 2=…=n 6=4,n =24.S T =2211jn sij j i T x n ••==-∑∑=112.27,S A =221sj j j T T n n•••=-∑=56,S E=S T-S A=56.27.得方差分析表9-6.0.050.01由于 4.25=F0.01(5,18)>F A=3.583>F0.05(5,18)=2.77,故浸泡水的温度对缩水率有显著影响,但不能说有高度显著的影响.本节的方差分析是在这两项假设下,检验各个正态总体均值是否相等.一是正态性假设,假定数据服从正态分布;二是等方差性假设,假定各正态总体方差相等.由大数定律及中心极限定理,以及多年来的方差分析应用,知正态性和等方差性这两项假设是合理的.第二节双因素试验的方差分析进行某一项试验,当影响指标的因素不是一个而是多个时,要分析各因素的作用是否显著,就要用到多因素的方差分析.本节就两个因素的方差分析作一简介.当有两个因素时,除每个因素的影响之外,还有这两个因素的搭配问题.如表9-7中的两组试验结果,都有两个因素A和B,每个因素取两个水平.表9-7(b)表9-7(a)中,无论B在什么水平(B1还是B2),水平A2下的结果总比A1下的高20;同样地,无论A是什么水平,B2下的结果总比B1下的高40.这说明A和B单独地各自影响结果,互相之间没有作用.表9-7(b)中,当B为B1时,A2下的结果比A1的高,而且当B为B2时,A1下的结果比A2的高;类似地,当A为A1时,B2下的结果比B1的高70,而A为A2时,B2下的结果比B1的高30.这表明A的作用与B所取的水平有关,而B的作用也与A所取的水平有关.即A 和B不仅各自对结果有影响,而且它们的搭配方式也有影响.我们把这种影响称作因素A和B的交互作用,记作A×B.在双因素试验的方差分析中,我们不仅要检验水平A和B的作用,还要检验它们的交互作用.1.双因素等重复试验的方差分析设有两个因素A,B作用于试验的指标,因素A有r个水平A1,A2,…,Ar,因素B有s个水平B1,B2,…,B s,现对因素A,B的水平的每对组合(A i,B j),i=1,2,…,r;j=1,2,…,s都作t(t≥2)次试验(称为等重复试验),得到如表9-8的结果:表9-8设x ijk ~N (ij ,), i =1,2,…,r ; j =1,2,…,s ; k =1,2,…,t ,各x ijk 独立.这里ij ,均为未知参数.或写为⎪⎩⎪⎨⎧===+=.,,,2,1),,0(~,,,2,1;,,2,1,2相互独立各ijkijk ijk ij ijk t k N s j r j x εσεεμ (9.16) 记μ=111,r s ij i j rs μ==∑∑, 11si ij j s μμ•==∑, i =1,2,…,r ,11rj ij i r μμ•==∑, j =1,2,…,s ,,i i αμμ•=-, i =1,2,…,r , j j βμμ•=-, j =1,2,…,s ,ij ij i j γμμμμ••=--+.于是 μij =μ+αi +βj +γij . (9.17)称μ为总平均,αi 为水平A i 的效应,βj 为水平B j 的效应,γij 为水平A i 和水平B j 的交互效应,这是由A i ,B j 搭配起来联合作用而引起的.易知1rii α=∑=0,1sjj β=∑=0,1riji γ=∑=0, j =1,2,…,s ,1sijj γ=∑=0, i =1,2,…,r ,这样(9.16)式可写成⎪⎪⎪⎩⎪⎪⎪⎨⎧=======++++=∑∑∑∑====.,,,2,1;,,2,1;,,2,1),,0(~,0,0,0,0,21111相互独立各ijkijk s j ij r i ij s j j r i i ijk ij j i ijk t k s j r i N x εσεγγβαεγβαμ (9.18) 其中μ,αi ,βj ,γij 及σ2都为未知参数.(9.18)式就是我们所要研究的双因素试验方差分析的数学模型.我们要检验因素A ,B 及交互作用A ×B 是否显著.要检验以下3个假设:⎩⎨⎧=====.,,:,0:21112101不全为零r r H H αααααα ⎩⎨⎧=====.,,:,0:21122102不全为零s s H H ββββββ ⎩⎨⎧=====.,,:,0:121113121103不全为零rs rs H H γγγγγγ 类似于单因素情况,对这些问题的检验方法也是建立在平方和分解上的.记1111r s tijk i j k x x rst ====∑∑∑, 11tij ijk k x x t •==∑, i =1,2,…,r ; j =1,2,…,s ,111s ti ijk j k x x st ••===∑∑, i =1,2,…,r , 111r tj ijk i k x x rt ••===∑∑, j =1,2,…,s , S T =2111()rstijk i j k x x ===-∑∑∑. 不难验证,,,i j ij x x x x •••••分别是μ,μi ·,μ·j ,μij 的无偏估计.由 ()()()()ijk ijk ij i j ij i j x x x x x x x x x x x x ••••••••••-=-+-+-+--+,1≤i ≤r ,1≤j ≤s ,1≤k ≤t得平方和的分解式:S T =S E +S A +S B +S A ×B , (9.19)其中S E =2111()rstijkij i j k xx •===-∑∑∑,S A =1()2ri i stxx ••=-∑,S B =21()sj j rtxx ••=-∑,S A ×B =211()rsij i j i j txx x x •••••==--+∑∑.S E 称为误差平方和,S A ,S B 分别称为因素A ,B 的效应平方和,SA ×B 称为A ,B 交互效应平方和.当H 01:α1=α2=…=αr =0为真时,F A =[](1)(1)A ES S r rs t -- ~F (r -1,rs (t -1));当假设H 02为真时,F B =[](1)(1)BES S s rs t --~F (s -1,rs (t -1));当假设H 03为真时,F A ×B =[](1)(1)(1)A BES S r s rs t ⨯--- ~F ((r -1)(s -1),rs (t -1)).当给定显著性水平α后,假设H 01,H 02,H 03的拒绝域分别为:(1,(1));(1,(1));(1)(1),(1)).A B A BF F r rs t F F s rs t F F r s rs t ααα⨯≥--⎧⎪≥--⎨⎪≥---⎩ (9.20) 经过上面的分析和计算,可得出双因素试验的方差分析表9-9.在实际中,与单因素方差分析类似可按以下较简便的公式来计算S T ,S A ,S B ,S A ×B ,S E . 记 T ···=111r s tijki j k x===∑∑∑,T ij ·=1tijkk x=∑, i =1,2,…,r ; j =1,2,…,s ,T i ··=11stijkj k x==∑∑, i =1,2,…,r ,T ·j ·=11r tijki k x==∑∑, j =1,2,…,s ,即有221112212212211,1,1,1,.r s tT ijk i j k r A i i s B j j r s A B ij A B i j E T A B A B T S x rst T S T st rst T S T rt rst T S T S S t rst S S S S S •••===•••••=•••••=•••⨯•==⨯⎧=-⎪⎪⎪=-⎪⎪⎪⎨=-⎪⎪⎪=---⎪⎪⎪=---⎩∑∑∑∑∑∑∑ (9.21) 例9.5 用不同的生产方法(不同的硫化时间和不同的加速剂)制造的硬橡胶的抗牵拉强度(以kg ·cm -2为单位)的观察数据如表9-10所示.试在显著水平0.10下分析不同的硫化时间(A ),加速剂(B )以及它们的交互作用(A ×B )对抗牵拉强度有无显著影响.表9-10010203r =s =3, t =2, T ···,T ij ·,T i ··,T ·j ·的计算如表9-11.表9-11S T =22111,r s tijki j k T xrst•••===-∑∑∑=178.44, S A =2211r i i T T st rst•••••=-∑=15.44,S B =2211s j j T T rt rst •••••=-∑=30.11,S A ×B =22111r s ij A B i j T T S S t rst••••==---∑∑ =2.89,S E =S T -S A -S B -S A ×B =130,得方差分析表9-12.由于F 0.10(2,9)=3.01>F A ,F 0.10(2,9)>F B ,F 0.10(4,9)=2.69>F A ×B ,因而接受假设H 01,H 02,H 03,即硫化时间、加速剂以及它们的交互作用对硬橡胶的抗牵拉强度的影响不显著.2.双因素无重复试验的方差分析在双因素试验中,如果对每一对水平的组合(A i ,B j )只做一次试验,即不重复试验,所得结果如表9-13.这时ij x •=x ijk ,S E =0,S E 的自由度为0,故不能利用双因素等重复试验中的公式进行方差分析.但是,如果我们认为A ,B 两因素无交互作用,或已知交互作用对试验指标影响很小,则可将S A ×B 取作S E ,仍可利用等重复的双因素试验对因素A ,B 进行方差分析.对这种情况下的数学模型及统计分析表示如下:由(9.18)式,112,0,0,~(0,),1,2,,;1,2,,,.ij i j ij r si j i j ij ijk x N i r j s μαβεαβεσε===+++⎧⎪⎪==⎪⎨⎪==⎪⎪⎩∑∑各相互独立 (9.22)要检验的假设有以下两个:⎩⎨⎧=====.,,:,0:21112101不全为零r r H H αααααα ⎩⎨⎧=====.,,:,0:21122102不全为零s s H H ββββββ 记 1111111,,,r s s rij i ij j ij i j j i x x x x x x rs s r ••=======∑∑∑∑平方和分解公式为:S T =S A +S B +S E , (9.23)其中 22111(),(),rssT ijA i i j j S xx S s x x •====-=-∑∑∑22111(),(),srsB j E ij i j j i j S r x x S x x x x •••====-=--+∑∑∑分别为总平方和、因素A ,B 的效应平方和和误差平方和.取显著性水平为α,当H 01成立时,F A =(1)AEs S S - ~F ((r -1),(r -1)(s -1)), H 01拒绝域为F A ≥F α((r -1),(r -1)(s -1)). (9.24)当H 02成立时,F B =(1)BEr S S - ~F ((s -1),(r -1)(s -1)), H 02拒绝域为F B ≥F α((s -1),(r -1)(s -1)). (9.25)得方差分析表9-14.例9.6 测试某种钢不同含铜量在各种温度下的冲击值(单位:kg ·m ·cm ),表9-15列出了试验的数据(冲击值),问试验温度、含铜量对钢的冲击值的影响是否显著?(α=0.01)解 由已知,r =4,s =3,需检验假设H 01,H 02,经计算得方差分析表9-16.0.01A 01F 0.01(2,6)=10.92<F B ,拒绝H 02.检验结果表明,试验温度、含铜量对钢冲击值的影响是显著的.第三节 正交试验设计及其方差分析在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果.1.正交试验设计的基本方法正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表.正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义:(1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2.列数↓L4 (23)↑↑行数水平数(2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个.最多能安排的因素数↓L4(23)↑↑试验次数水平数(3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的.L4(23)↑↑实际试验数理论上的试验数正交表的特点:(1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次.(2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.凡满足上述两性质的表都称为正交表(Orthogonal table).常用的正交表有L9(34),L8(27),L16(45)等,见附表.用正交表来安排试验的方法,就叫正交试验设计.一般正交表L p(n m)中,p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.例9.7 提高某化工产品转化率的试验.某种化工产品的转化率可能与反应温度A,反应时间B,某两种原料之配比C和真空度D有关.为了寻找最优的生产条件,因此考虑对A,B,C,D这4个因素进行试验.根据以往的经验,确定各个因素的3个不同水平,如表9-18所示.表9-18分析各因素对产品的转化率是否产生显著影响,并指出最好生产条件.解本题是4因素3水平,选用正交表L9(34).将各因素的诸水平所表示的实际状态或条件代入正交表中,得到9个试验方案,如表9-20所示.表9-20从表9-20看出,第一行是1号试验,其试验条件是:反应温度为60℃,反应时间为2.5小时,原料配比为1.1∶1,真空度为500毫米汞柱,记作A1B1C1D1.依此类推,第9号试验条件是A3B3C2D1.由此可见,因素和水平可以任意排,但一经排定,试验条件也就完全确定.按正交试验表9-20安排试验,试验的结果依次记于试验方案右侧,见表9-21.2.试验结果的直观分析正交试验设计的直观分析就是要通过计算,将各因素、水平对试验结果指标的影响大小,通过极差分析,综合比较,以确定最优化试验方案的方法.有时也称为极差分析法.例9.7中试验结果转化率列在表9-21中,在9次试验中,以第9次试验的指标86为最高,其生产条件是A 3B 3C 2D 1.由于全面搭配试验有81种,现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢?还需进一步分析. (1) 极差计算在代表因素A 的表9-21的第1列中,将与水平“1”相对应的第1,2,3号3个试验结果相加,记作T 11,求得T 11=151.同样,将第1列中与水平“2”对应的第4,5,6号试验结果相加,记作T 21,求得T 21=183.一般地,定义T ij 为表9-21的第j 列中,与水平i 对应的各次试验结果之和(i =1,2,3; j =1,2,3,4).记T 为9次试验结果的总和,R j 为第j 列的3个T ij 中最大值与最小值之差,称为极差.显然T =31iji T=∑,j =1,2,3,4.此处T 11大致反映了A 1对试验结果的影响,T 21大致反映了A 2对试验结果的影响, T 31大致反映了A 3对试验结果的影响,T 12,T 22和T 32分别反映了B 1,B 2,B 3对试验结果的影响, T 13,T 23和T 33分别反映了C 1,C 2,C 3对试验结果的影响, T 14,T 24和T 34分别反映了D 1,D 2,D 3对试验结果的影响.R j 反映了第j 列因素的水平改变对试验结果的影响大小,R j 越大反映第j 列因素影响越大.上述结果列表9-22.(2) 极差分析(Analysis of range)由极差大小顺序排出因素的主次顺序:主→次 B ;A 、D ;C这里,R j 值相近的两因素间用“、”号隔开,而R j 值相差较大的两因素间用“;”号隔开.由此看出,特别要求在生产过程中控制好因素B ,即反应时间.其次是要考虑因素A 和D ,即要控制好反应温度和真空度.至于原料配比就不那么重要了.选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好,则应选取指标大的水平.反之,若希望指标越小越好,应选取指标小的水平.例9.7中,希望转化率越高越好,所以应在第1列选最大的T 31=185;即取水平A 3,同理可选B 3C 1D 3.故例9.7中较好的因素水平搭配是A 3B 3C 1D 3.例9.8 某试验被考察的因素有5个:A ,B ,C ,D ,E .每个因素有两个水平.选用正交表L 8(27),现分别把A ,B ,C ,D ,E 安排在表L 8(27)的第1,2,4,5,7列上,空出第3,6列仿例9.7做法,按方案试验.记下试验结果,进行极差计算,得表9-23.试验目的要找出试验结果最小的工艺条件及因素影响的主次顺序.从表9-23的极差R j的大小顺序排出因素的主次顺序为主 → 次 A 、B ;D ;C 、E最优工艺条件为A 2B 1C 1D 2E 1.表9-23中因没有安排因素而空出了第3,6列.从理论上说,这两列的极差R j 应为0,但因存有随机误差,这两个空列的极差值实际上是相当小的.3.方差分析正交试验设计的极差分析简便易行,计算量小,也较直观,但极差分析精度较差,判断因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.设有一试验,使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记T =1pi i y =∑, y =11p i i Ty p p ==∑,S T =21()pii yy =-∑为试验的p 个结果的总变差;S j =222111nn ij ij i i T T T r T r p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和,其中r =p/n .可证明S T =1mij S=∑即总变差为各列变差平方和之和,且S T 的自由度为p -1,S j 的自由度为n -1.当正交表的所有列没被排满因素时,即有空列时,所有空列的S j 之和就是误差的变差平方和S e ,这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时,即无空列时,取S j 中的最小值作为误差的变差平方和S e .从以上分析知,在使用正交表L p (n m )的正交试验方差分析中,对正交表所安排的因素选用的统计量为:F =1jeeS S n f -.当因素作用不显著时,F ~F (n -1,f e ),其中第j 列安排的是被检因素.在实际应用时,先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时,则这第j 列就可当作误差列并入S e 中去,这样使误差S e 的自由度增大,在作F 检验时会更灵敏,将所有可当作误差列的S j 全并入S e 后得新的误差变差平方和,记为S e Δ,其相应的自由度为f e Δ,这时选用统计量F =1je eS S n f - ~F (n -1,f e Δ).例9.9 对例9.8的表9-23作方差分析.解 由表9-23的最后一行的极差值R j ,利用公式S j =2211n ij i T T r p=-∑,得表9-24.表9-24表9-24中第3,6列为空列,因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125,S 7/f 7=0.1251=0.125比S e /f e 小,故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ=3.整理成方差分析表9-25.eeS fC 3.125 1 3.125 6.818D 6.125 1 6.125 13.364E Δ 0.125 1 0.125 e 1.1250 2 0.625 e Δ 1.37530.458由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ,B 作用高度显著,因素C 作用不显著,因素D 作用显著,这与前面极差分析的结果是一致的.F 检验法要求选取S e ,且希望f e 要大,故在安排试验时,适当留出些空列会有好处的.前面的方差分析中,讨论因素A 和B 的交互作用A ×B .这类交互作用在正交试验设计中同样有表现,即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关.当试验考虑交互作用时,也可用前面讲的基本方法来处理.本章就不再介绍了.小 结本章介绍了数理统计的基本方法之一:方差分析.在生产实践中,试验结果往往要受到一种或多种因素的影响.方差分析就是通过对试验数据进行分析,检验方差相同的多个正态总体的均值是否相等,用以判断各因素对试验结果的影响是否显著.方差分析按影响试验结果的因素的个数分为单因素方差分析、双因素方差分析和多因素方差分析.1. 单因素方差分析的情况.试验数据总是参差不齐,我们用总偏差平方和S T =211()jn sijj i xx ==-∑∑来度量数据间的离散程度.将S T 分解为试验随机误差的平方和(S E )与因素A 的偏差平方和(S A )之和.若S A 比S E 大得较多,则有理由认为因素的各个水平对应的试验结果有显著差异,从而拒绝因素各水平对应的正态总体的均值相等这一原假设.这就是单因素方差分析法的基本思想.2. 双因素方差分析的基本思想类似于单因素方差分析.但双因素试验的方差分析中,我们不仅要检验因素A 和B 各自的作用,还要检验它们之间的交互作用.3. 正交试验设计及其方差分析.根据因素的个数及各个因素的水平个数,选取适当的正交表并按表进行试验.我们通过对这少数的试验数据进行分析,推断出各因素对试验结果影响的大小.对正交试验结果的分析,通常采用两种方法,一种是直观分析法(极差分析法),它通过对各因素极差R j 的排序来确定各因素对试验结果影响的大小.一种是方差分析法,它的基本思想类似于双因素的方差分析. 重要术语及主题单因素试验方差分析的数学模型 S T =S E +S A单因素方差分析表 双因素方差分析表 正交试验表极 差分析表习题九1.灯泡厂用4种不同的材料制成灯丝,检验灯线材料这一因素对灯泡寿命的影响.若灯泡寿命服从正态分布,不同材料的灯丝制成的灯泡寿命的方差相同,试根据表中试验结果记录,在显著性水平0.05下检验灯泡寿命是否因灯丝材料不同而有显著差异?2.一个年级有三个小班,他们进行了一次数学考试,现从各个班级随机地抽取了一些学生,试在显著性水平0.05下检验各班级的平均分数有无显著差异.设各个总体服从正态分布,且方差相等.4.为了解3种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的猪各选3头进行试验,分别测得其3个月间体重增加量如下表所示,取显著性水平α=0.05,试分析不同饲料与不同品种对猪的生长有无显著影响?假定其体重增长量服从正态分布,且各种配比的方5.研究氯乙醇胶在各种硫化系统下的性能(油体膨胀绝对值越小越好)需要考察补强剂(A)、防老剂(B)、硫化系统(C)3个因素(各取3个水平),根据专业理论经验,交互4(2) 给定α=0.05,作方差分析与(1)比较.6.某农科站进行早稻品种试验(产量越高越好),需考察品种(A),施氮肥量(B),氮、磷、钾肥比例(C),插植规格(D)4个因素,根据专业理论和经验,交互作用全忽略,早(1) 试作出最优生产条件的直观分析,并对4因素排出主次关系.(2) 给定α=0.05,作方差分析,与(1)比较.。

方差分析习题与答案

方差分析习题与答案

统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映的是样本数据与其组平均值的差异A 总离差B 组间误差C 抽样误差D 组内误差2.是()A 组内平方和B 组间平方和C 总离差平方和D 因素B的离差平方和3.是()A 组内平方和B 组间平方和C 总离差平方和D 总方差4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为()A r,nB r-n,n-rC r-1.n-rD n-r,r-1二、多项选择题1.应用方差分析的前提条件是()A 各个总体报从正态分布B 各个总体均值相等C 各个总体具有相同的方差D 各个总体均值不等E 各个总体相互独立2.若检验统计量F= 近似等于1,说明()A 组间方差中不包含系统因素的影响B 组内方差中不包含系统因素的影响C 组间方差中包含系统因素的影响D 方差分析中应拒绝原假设E方差分析中应接受原假设3.对于单因素方差分析的组内误差,下面哪种说法是对的?()A 其自由度为r-1B 反映的是随机因素的影响C 反映的是随机因素和系统因素的影响D 组内误差一定小于组间误差E 其自由度为n-r4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是()A 单因素方差分析B 双因素方差分析C 三因素方差分析D 单因素三水平方差分析E 双因素三水平方差分析三、填空题1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过的比较。

2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。

3.方差分析中的因变量是,自变量可以是,也可以是。

4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。

5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。

6.在单因子方差分析中,计算F统计量的分子是方差,分母是方差。

7.在单因子方差分析中,分子的自由度是,分母的自由度是。

四、计算题1.有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下:机器1:0.236,0.238,0.248,0.245,0.243机器2:0.257,0.253,0.255,0.254,0.261机器3:0.258,0.264,0.259,0.267,0.262问:三台机器生产薄板的厚度是否有显著差异?2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克)配方:370,420,450,490,500,450配方:490,380,400,390,500,410配方:330,340,400,380,470,360配方:410,480,400,420,380,410问:四种不同配方的饲料对小鸡增重是否相同?3.今有某种型号的电池三批,它们分别为一厂、二厂、三厂三个工厂所生产的。

方差分析与回归分析习题答案精修订

方差分析与回归分析习题答案精修订

方差分析与回归分析习题答案SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#第九章 方差分析与回归分析习题参考答案1. 为研究不同品种对某种果树产量的影响,进行试验,得试验结果(产量)如下表,试分析果树品种对产量是否有显着影响.(0.05(2,9) 4.26F =,0.01(2,9)8.02F =)解:r=3,12444n n 321=++=++=n n ,T=120 ,12001212022===n T C 计算统计值?7228.53,38A A A e e SS f F SS f ==≈……方差分析表结论:由于0.018.53(2,9)8.02,A F F ≈>=故果树品种对产量有特别显着影响.2.2700=10.523.56=≈结论: 由以上方差分析知,进器对火箭的射程有特别显着影响;燃料对火箭的射程有显着影响. 3.为了研究某商品的需求量Y 与价格x 之间的关系,收集到下列10对数据:2231,58,147,112,410.5,i i i i i i x y x y x y =====∑∑∑∑∑(1)求需求量Y 与价格x 之间的线性回归方程; (2)计算样本相关系数;(3)用F 检验法作线性回归关系显着性检验. 解:引入记号10, 3.1,5.8n x y ===∴需求量Y 与价格x 之间的线性回归方程为(2)样本相关系数32.80.955634.3248l r-==≈≈- 在0H 成立的条件下,取统计量(2)~(1,2)Ren S FF n S -=-计算统计值22(32.8)15.967.66,74.167.66 6.44R xy xx e yy R S l l S l S ==-≈=-≈-=故需求量Y 与价格x 之间的线性回归关系特别显着.4. 随机调查10个城市居民的家庭平均收入(x)与电器用电支出(y)情况得数据(单位:千元)如下:(1) 求电器用电支出y 与家庭平均收入x 之间的线性回归方程; (2) 计算样本相关系数; (3) 作线性回归关系显着性检验;(4) 若线性回归关系显着,求x =25时, y 的置信度为的预测区间. 解:引入记号10,27,1.9n x y ===∴电器用电支出y 与家庭平均收入x 之间的线性回归方程为(2)样本相关系数 0.9845l r==≈在0H 成立的条件下,取统计量(2)~(1,2)Rn S FF n S -=-e计算统计值2243.6354 5.37,5.54 5.370.17xy xx yy s l l s l s ==≈=-≈-=R e R故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. 相关系数检验法 01:0;:0H R H R =≠故家庭电器用电支出y 与家庭平均收入x 之间的线性回归关系特别显着. (4) 因为0xx =处,0y 的置信度为1α-的预测区间为其中00.025垐 1.42640.123225 1.6536,(8) 2.31,0.1458y t σ=-+⨯====代入计算得当x =25时, y 的置信度为的预测区间为。

部编版高中数学必修二第九章统计带答案知识点总结全面整理

部编版高中数学必修二第九章统计带答案知识点总结全面整理

(名师选题)部编版高中数学必修二第九章统计带答案知识点总结全面整理单选题1、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x ,方差为s 2,则( ) A .x =5,s 2=2B .x =5,s 2=1.6 C .x =4.9,s 2=1.6D .x =5.1,s 2=22、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是( )A .各班植树的棵数不是逐班增加的B .4班植树的棵数低于11个班的平均值C .各班植树棵数的中位数为6班对应的植树棵数D .1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳 3、下列抽样方法是简单随机抽样的是( )A .某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B .从10个手机中逐个不放回地随机抽取2个进行质量检验C .从空间直角坐标系中抽取10个点作为样本D .饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查 4、3个数1,3,5的方差是( ) A .23B .34C .2D .835、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.36、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.57、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.198、为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5B.86.75,86.67C.86.75,85D.85,85多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少10、(多选)下列调查方式合适的是()A.为了了解炮弹的杀伤力,采用抽样调查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式11、某学校为了了解学生一周内在生活方面的支出情况,从全校学生中随机抽取n名学生进行调查,得到频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是()A.样本中数据的中位数小于41B.样本中支出不少于40元的人数为132C.全校学生支出的众数约为45元D.若该校有2000名学生,则约有600人的支出在[50,60]内填空题12、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.13、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.部编版高中数学必修二第九章统计带答案(四十二)参考答案1、答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.2、答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.3、答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.4、答案:D分析:由题得3个数的平均数为3,再利用方差公式求解.由题得3个数的平均数为3,所以S2=13[(1−3)2+(3−3)2+(5−3)2]=83.故选:D5、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题6、答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案. 一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.7、答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.8、答案:B分析:根据平均数和中位数的定义求解即可由题意可知,平均数约为(0.03×77.5+0.05×82.5+0.06×87.5+0.04×92.5+0.02×97.5)×5=86.75;因为前2组的频率和为5×0.03+5×0.05=0.4<0.5,前3组的频率和为5×0.03+5×0.05+5×0.06=0.7>0.5,所以中位数在[85,90)内,设中位数为x,则5×0.03+5×0.05+(x−85)×0.06=0.5,解得x≈86.67. 所以估计这部分人的测试成绩的平均数和中位数分别是86.75,86.67.故选:B.9、答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+53=130,故D正确.故选:ABD.10、答案:AC分析:根据普查和抽样方法的特点判断.了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.故选:AC.11、答案:BCD分析:设样本数据的中位数为x,根据(0.01+0.024)×10+(x−40)×0.036=0.5求出x可判断A;计算出样本中支出在[50,60]内的频率可得样本中支出不少于40元的人数可判断B;由频率分布直方图得样本中学生支出的众数再估算全校学生支出的众数可判断C;若该校有2000名学生乘以0.3可判断D.在A中,设样本数据的中位数为x,则(0.01+0.024)×10+(x−40)×0.036=0.5,解得x≈44.44>41,故A错误;在B中,样本中支出在[50,60]内的频率为1−(0.01+0.024+0.036)×10=0.3,样本中支出不少于40元的+60=132,故B正确;人数为0.36×60=45(元),所以全校学生支出的众数约为在C中,由频率分布直方图得样本中学生支出的众数约为40+50245元,故C正确;在D中,若该校有2000名学生,则约有2000×0.3=600人的支出在[50,60]内,故D正确.故选:BCD.12、答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]=2,6所以答案是:213、答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.。

方差练习题及答案.doc

方差练习题及答案.doc

方差练习题及答案I.一组数据I, - b 0, -1, 1的方差和标准差分别是A. 0, 0 B.0. 8, 0. 6C. 1, 1 D. 0. 8,2.某制衣厂要确定一种衬衫不同号码的生产数量,在做市场调查时,该商家侧重了解的是这种衬衫不同号码的销售数量的A.平均数B.众数C.标准差D.中位数3.在统计学中,样本的方差可以近似地反映总体的A.平均状态B.分布规律C.波动大小D.最大值和最小值.甲,乙两个样本的方差分别为s甲=6.6, s乙=14.31, 由此反映A.样本甲的波动比样本乙大样本乙的波动比样本甲大 C.样本甲和样本乙的波动大小一样D.样本甲和样本乙的波动大小无法确定5.已知:一组数据xl, x2, x3, x4, x5的平均数是2,方差是,那么另一组数据xl - 2, 3x2 - 2, 3x3 - 2, 3x4 -2, 3x5-2的平均数和方差分别是A. 2,B. 2, 1C. 4,D. 4, 322二、填空题21.数据2, 2, 3, 4, 4的方差S二.质检部门对甲、乙两工厂生产的同样产品抽样调查,计算岀甲厂的样本方差为0.99,乙厂的样本方差为1.02,那么,由此可以推断出生产此类产品,质量比较稳定的是___________________ 厂..数据8, 10, 12, 9, 11的极差和方差分别是_______________ ..—组数据的方差S二22[++•••+],则这组数据的平均数是??2225. 一组数据的方差为S,将这组数据的每个数据都乘2,____________________________________ 所得到的一组新数据的方差是___________________________ .三、解答题②乙班优秀的人数多于甲班优秀的人数;③甲班成绩的波动比乙班大.上述结论正确的是______________ •2.为了比较甲、乙两种水稻秧苗是否出苗整齐,每种秧苗随机各取5株量出每株的长度如下表所示??经计算,所抽取的甲、乙两种水稻秧苗长度的平均数都是13厘米,方差S甲二3. 6厘米,那么S乙二___________________ 2厘米,因此__________ 种水稻秧苗出苗更整齐••现有A, B两个班级,每个班级各有45人参加一次测验,每名参加者可获得0, 1, 2, 3, 4, 5, 6, 7, 8, 9分这几种不同的分值中的一种,测试结果A班的成绩如下表所示,B班成绩如下图表22示.哪个班的平均分较高.若两个班合计共有60人及格,则参加者最少获几分才可以及格.4.某篮球队运动员进行3分球投篮成绩测试,每人每天投3分球10次,对甲、乙两名队员在5天中进球的个数统计如果如下:经过计算,甲进球的平均数为甲和方差s 甲=3. 2.2求乙进球的平均数乙和方差s乙;现在需要根据以上乙结果,从甲、乙二人中选出一人去参加3分球投篮大赛,你认为应该选哪名队员?为什25.某校高中一年级组建篮球队,对甲、乙两名备选同学进行定位投篮测试,每次投10个球共投10次,甲、乙两名同学测试情况如图所示.根据如图所提供的信息填写下表:如果你是高一学生会文体委员,会选择哪名同学进入篮球队?请说明理由.答案一、选择题ID. 2B. 3C. 4B. 5D.二、填空题1.S 二..甲.3.是..??.25..三、解答题1.2.S乙二厘米,因此乙种水稻秧苗出苗更整齐..A 班的平均成绩高;即参加者最少获4分才可以及格.4.某篮球队运动员进行3分球投篮成绩测试,每人每天投3分球10次,对甲、乙两名队员在5天中进球的个数统计如果如下:经过计算,甲进球的平均数为甲和方差s 甲=3. 2.2求乙进球的平均数乙和方差s乙;现在需要根据以上乙结果,从甲、乙二人中选出一人去参加3分球投篮大赛,你认为应该选哪名队员?为什解答:解:乙二宁5=8, 222S 乙二[++•••+] 4--0. 8,•・•甲〉乙,.•.选甲合适;Ts甲>$乙,.•.乙成绩稳,选乙合适..某校高中一年级组建篮球队,对甲、乙两名备选同学进行定位投篮测试, 每次投10个球共投10次,甲、乙两名同学测试情况如图所示.=7;乙的数据中,8出现的最多,故众数是&平均数为=7;2222选甲:平均数与乙一样,甲的方差小于乙的方差,甲的成绩较乙的成绩稳定.选乙:平均数与甲一样,乙投中篮的众数比甲投中篮的众数大,且从折线图看出,乙比甲潜能更大.统计学方差分析练习题与答案一、单项选择题1.在方差分析中,反映的是样本数据与其组平均值的差异A总离差B组间误差C抽样误差D组内误差A组内平方和B组间平方和C总离差平方和D因素E的离差平方和3.是A组内平方和B组间平方和C总离差平方和D总方差4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为A r, nB r-n, n-rC r~l.n-rD n-r, r~l二、多项选择题1.应用方差分析的前提条件是A各个总体报从正态分布B各个总体均值相等C 各个总体具有相同的方差D各个总体均值不等E各个总体相互独立2.若检验统计量F二近似等于1,说明A组间方差中不包含系统因素的影响B组内方差中不包含系统因素的影响C组间方差中包含系统因素的影响D方差分析中应拒绝原假设E方差分析中应接受原假设3.对于单因素方差分析的组内误差,下面哪种说法是对的?A其自由度为r-1 B反映的是随机因素的影响C反映的是随机因素和系统因素的影响D组内误差一定小于组间误差E其自由度为n-r4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是A单因素方差分析B双因素方差分析C三因素方差分析D单因素三水平方差分析E双因素三水平方差分析三、填空题1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过的比较。

(完整版)第9章方差分析思考与练习带答案

(完整版)第9章方差分析思考与练习带答案

第九章方差分析第九章方差分析【思考与练习】一、思考题1. 方差分析的基本思想及其应用条件是什么?2. 在完全随机设计方差分析中各表示什么含义?SS SS SS、、总组间组内3. 什么是交互效应?请举例说明。

4. 重复测量资料具有何种特点?5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?二、最佳选择题1. 方差分析的基本思想为A. 组间均方大于组内均方B. 误差均方必然小于组间均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著组间方差显著大于组内方差时,该因素对所考察指标的影响显著E.第九章 方差分析3.完全随机设计的方差分析中,下列式子正确的是4. 总的方差分析结果有P<0.05,则结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为A. kb k b --B. 1kb k b ---C. 2kb k b ---D. 1kb k b --+E. 2kb k b --+6. 2×2析因设计资料的方差分析中,总变异可分解为A. MS MS MS =+B A 总B. MS MS MS =+B 总误差C. SS SS SS =+B 总误差D. SS SS SS SS =++B A 总误差E. SS SS SS SS SS =+++B A A B 总误差7.观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是A. 析因设计的方差分析第九章方差分析B. 随机区组设计的方差分析C. 完全随机设计的方差分析D. 重复测量设计的方差分析E. 两阶段交叉设计的方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是A.39B.36C.26D.9E.39. 采用单因素方差分析比较五个总体均数得,若需进一步了解其中一P0.05个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是A. Z检验B. t检验C. Dunnett–t检验D. SNK–q检验E. Levene检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A 高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。

方差分析习题与答案完整版

方差分析习题与答案完整版

方差分析习题与答案 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】统计学方差分析练习题与答案一、单项选择题1.在方差分析中,()反映的是样本数据与其组平均值的差异A 总离差B 组间误差C 抽样误差D 组内误差2.是()A 组内平方和B 组间平方和C 总离差平方和D 因素B的离差平方和3.是()A 组内平方和B 组间平方和C 总离差平方和D 总方差4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为()A r,nB r-n,n-rC r-1.n-rD n-r,r-1二、多项选择题1.应用方差分析的前提条件是()A 各个总体报从正态分布B 各个总体均值相等C 各个总体具有相同的方差D 各个总体均值不等E 各个总体相互独立2.若检验统计量F= 近似等于1,说明()A 组间方差中不包含系统因素的影响B 组内方差中不包含系统因素的影响C 组间方差中包含系统因素的影响D 方差分析中应拒绝原假设E方差分析中应接受原假设3.对于单因素方差分析的组内误差,下面哪种说法是对的()A 其自由度为r-1B 反映的是随机因素的影响C 反映的是随机因素和系统因素的影响D 组内误差一定小于组间误差E 其自由度为n-r4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是()A 单因素方差分析B 双因素方差分析C 三因素方差分析D 单因素三水平方差分析E 双因素三水平方差分析三、填空题1.方差分析的目的是检验因变量y与自变量x是否,而实现这个目的的手段是通过的比较。

2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是。

3.方差分析中的因变量是,自变量可以是,也可以是。

4.方差分析是通过对组间均值变异的分析研究判断多个是否相等的一种统计方法。

5.在试验设计中,把要考虑的那些可以控制的条件称为,把因素变化的多个等级状态称为。

t检验与方差分析思考与练习

t检验与方差分析思考与练习

t检验与方差分析【思考与练习】一、思考题1.两样本均数比较t检验的应用条件是什么?答:方差是否齐性是否符合正态分布2. 方差分析的基本思想及其应用条件是什么?基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

应用条件:1.各观察值相互独立,且每一水平下的观察值均服从正态分布。

2.个总体方差相等,即具有方差齐性。

完全随机设计的方差分析3. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?答:方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别,因此,若希望进一步了解两两的差别。

需进行多重比较。

二、综合分析题1.将20名某病患者随机分成两组,分别用甲、乙两种药物治疗,用药一个月后测得治疗前后的血沉(mm/h)如下表。

表1 甲、乙两药治疗前后的血沉(mm/h)甲药组乙药组受试者编号治疗前治疗后受试者编号治疗前治疗后1 10 6 1 9 42 13 9 2 10 23 6 3 3 9 54 11 10 4 13 65 10 10 5 8 36 7 4 6 6 37 8 2 7 10 48 8 5 8 11 29 5 3 9 10 510 9 3 10 10 4问:甲药是否有效?答:两独立样本的t检验1 建立检验假设,确立检验水准H0:μ1=μ2,甲、乙两种药物的治疗效果无差别H1:μ1≠μ2, 甲、乙两种药物的治疗效果有差别α=0.05甲、乙两种药物的疗效有无差别?n1=10,X1=3.20 mm/h S1=1.93mm/hn2=10,X2=5.80mm/h S2=1.81mm/ht=3.10, p=0.0062. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表2所示。

方差分析习题答案

方差分析习题答案

方差分析习题答案【篇一:方差分析习题】lass=txt>班级_______ 学号_______ 姓名________ 得分_________一、单项选择题1、方差分析所要研究的问题是() a、各总体的方差是否相等 b、各样本数据之间是否有显著差异 c、分类型自变量对数值型因变量的影响是否显著 d、分类型因变量对数值型自变量是否显著2、组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()a、只包含随机误差b、只包含系统误差c、既包含随机误差也包含系统误差d、有时包含随机误差,有时包含系统误差3、组内误差() a、只包含随机误差b、只包含系统误差 c、既包含随机误差也包含系统误差d、有时包含随机误差,有时包含系统误差4、在单因素方差分析中,各次实验观察值应()a、相互关联b、相互独立c、计量逐步精确d、方法逐步改进5、在单因素方差分析中,若因子的水平个数为k,全部观察值的个数为n,那么()a、sst的自由度为n b 、ssa的自由度为k c、 sse的自由度为n-k-1 d、sst的自由度等于sse的自由度与ssa的自由度之和。

6、在方差分析中,如果拒绝原假设,则说明()a、自变量对因变量有显著影响b、所检验的各总体均值之间全部相等c、不能认为自变量对因变量有显著影响d、所检验的各样本均值之间全不相等7、在单因素分析中,用于检验的统计量f的计算公式为() a、ssa/sseb、ssa/sst c、msa/msed、mse/msa8、在单因素分析中,如果不能拒绝原假设,那么说明组间平方和ssa () a、等于0 b、等于总平方和c、完全由抽样的随机误差所决定d、显著含有系统误差9、ssa自由度为()a、r-1b、n-1c、n-rd、r-n二、实验分析题1、某公司采用四种颜色包装产品,为了检验不同包装方式的效果,抽样得到了一些数据并进行单因素方差分析实验。

实验依据四种包装方式将数据分为4组,每组有5个观察值,用excel中的数据分析工具,在0.05的显著水平下得到如下方差分析表:方差分析(1)填表:请计算表中序号标出的七处缺失值,并直接填在表上。

生物统计学答案 第九章 两因素及多因素方差分析

生物统计学答案  第九章 两因素及多因素方差分析

第九章两因素及多因素方差分析9.1双菊饮具有很好的治疗上呼吸道感染的功效,为便于饮用,制成泡袋剂。

研究不同浸泡时间和不同的浸泡温度对浸泡效果的影响,设计了一个两因素交叉分组实验,实验结果(浸出率)见下表[52]:浸泡温度/℃浸泡时间/min10 15 2060 23.72 25.42 23.5880 24.84 28.32 29.5595 30.64 31.58 32.21对以上结果做方差分析及Duncan检验。

该设计已经能充分说明问题了吗?是否还有更能说明问题的设计方案?答:无重复二因素方差分析程序及结果如下:options linesize=76 nodate;data hermed;do temp=1 to 3;do time=1 to 3;input effect @@;output;end;end;cards;23.72 25.42 23.5824.84 28.32 29.5530.64 31.58 32.21;run;proc anova;class temp time;model effect=temp time;means temp time/duncan alpha=0.05;run;The SAS SystemAnalysis of Variance ProcedureClass Level InformationClass Levels ValuesTEMP 3 1 2 3TIME 3 1 2 3Number of observations in data set = 9The SAS SystemAnalysis of Variance ProcedureDependent Variable: EFFECTSum of MeanSource DF Squares Square F Value Pr > FModel 4 87.0707778 21.7676944 12.56 0.0155Error 4 6.9321778 1.7330444Corrected Total 8 94.0029556R-Square C.V. Root MSE EFFECT Mean0.926256 4.741881 1.31645 27.7622Source DF Anova SS Mean Square F Value Pr > FTEMP 2 78.7202889 39.3601444 22.71 0.0066TIME 2 8.3504889 4.1752444 2.41 0.2058The SAS SystemAnalysis of Variance ProcedureDuncan's Multiple Range Test for variable: EFFECTNOTE: This test controls the type I comparisonwise error rate, notthe experimentwise error rateAlpha= 0.05 df= 4 MSE= 1.733044Number of Means 2 3Critical Range 2.984 3.050Means with the same letter are not significantly different.Duncan Grouping Mean N TEMPA 31.477 3 3B 27.570 3 2C 24.240 3 1The SAS SystemAnalysis of Variance ProcedureDuncan's Multiple Range Test for variable: EFFECTNOTE: This test controls the type I comparisonwise error rate, notthe experimentwise error rateAlpha= 0.05 df= 4 MSE= 1.733044Number of Means 2 3Critical Range 2.984 3.050Means with the same letter are not significantly different.Duncan Grouping Mean N TIMEA 28.447 3 3AA 28.440 3 2AA 26.400 3 1从方差分析结果可以得知,温度是极显著的影响因素,时间是不显著因素。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章方差分析【思考与练习】一、思考题1. 方差分析的基本思想及其应用条件是什么?2. 在完全随机设计方差分析中SS SS SS、、各表示什么含义?总组间组内3. 什么是交互效应?请举例说明。

4. 重复测量资料具有何种特点?5. 为什么总的方差分析的结果为拒绝原假设时,若想进一步了解两两之间的差别需要进行多重比较?二、最佳选择题1. 方差分析的基本思想为A. 组间均方大于组内均方B. 误差均方必然小于组间均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大于组间方差时,该因素对所考察指标的影响显著E. 组间方差显著大于组内方差时,该因素对所考察指标的影响显著3. 完全随机设计的方差分析中,下列式子正确的是4. 总的方差分析结果有P<0.05,则结论应为 A. 各样本均数全相等 B. 各总体均数全相等 C. 各样本均数不全相等 D. 各总体均数全不相等 E. 至少有两个总体均数不等5. 对有k 个处理组,b 个随机区组的资料进行双因素方差分析,其误差的自由度为A. kb k b --B. 1kb k b ---C. 2kb k b ---D. 1kb k b --+E. 2kb k b --+6. 2×2析因设计资料的方差分析中,总变异可分解为 A. MS MS MS =+B A 总 B. MS MS MS =+B 总误差 C. SS SS SS =+B 总误差D. SS SS SS SS =++B A 总误差E. SS SS SS SS SS =+++B A AB 总误差7. 观察6只狗服药后不同时间点(2小时、4小时、8小时和24小时)血药浓度的变化,本试验应选用的统计分析方法是 A. 析因设计的方差分析 B. 随机区组设计的方差分析 C. 完全随机设计的方差分析D. 重复测量设计的方差分析E. 两阶段交叉设计的方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标的数据40个,若采用完全随机设计方差分析进行统计处理,其组间自由度是 A. 39 B. 36 C. 26 D. 9 E. 39. 采用单因素方差分析比较五个总体均数得0.05P <,若需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用的检验方法是 A. Z 检验 B. t 检验 C. Dunnett –t 检验 D. SNK –q 检验 E. Levene 检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A 低剂量,一般疗法+药物A 高剂量三种处理,测量一个月后患者红细胞的升高数(102/L),结果如表9-1所示。

问三种治疗方案有无差异?表9-1 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)编号一般疗法一般疗法+A1 一般疗法+A21 0.81 1.32 2.352 0.75 1.41 2.503 0.74 1.35 2.434 0.86 1.38 2.365 0.82 1.40 2.446 0.87 1.33 2.467 0.75 1.43 2.408 0.74 1.38 2.439 0.72 1.40 2.2110 0.82 1.40 2.4511 0.80 1.34 2.3812 0.75 1.46 2.402. 在药物敏感试验中,欲比较三种弥散法的抑菌效果,每种方法均采用三种药物,观察其抑菌效果,以抑菌环的直径为观察指标,结果如表9-2所示,试比较三种方法的抑菌效果。

表9-2 三种药物在不同弥散法下的抑菌效果(mm)药物弥散法纸片挖洞钢圈黄芪27.5 24.3 20.0 27.6 24.6 21.026.9 25.0 20.627.3 27.7 20.8大黄20.9 24.6 19.121.2 24.7 19.320.5 23.9 18.721.3 24.8 18.5青霉素27.4 22.0 29.6 27.6 21.7 30.2 26.9 21.8 29.5 26.7 22.3 30.43. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇的效果有无差别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表9-3所示,请问两种疗法降胆固醇效果有无差异。

表9-3 不同治疗方法下胆固醇变化情况(mmol/L)编号饮食治疗药物治疗试验前试验后试验前试验后1 6.11 6.00 6.40 6.352 7.59 7.28 7.00 7.103 6.42 6.30 6.53 6.414 6.94 6.64 7.31 6.835 9.17 8.42 6.81 6.736 7.61 7.22 8.16 7.657 6.60 6.65 6.98 6.524. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示。

问这三个年级学生周日锻炼时间是否不同?表9-4 初中不同年级学生的锻炼时间(分)一年级二年级三年级37.856 59.164 48.77870.793 36.650 51.05786.928 38.511 47.60958.785 48.945 48.42873.923 29.367 42.81461.435 41.988 52.30364.130 69.419 54.32767.169 33.109 35.59149.099 38.872 55.01362.728 53.401 36.08452.534 62.814 21.30745.230 38.454 46.41940.400 32.802 41.83644.399 37.683 37.48133.091 48.944 35.78163.469 48.869 31.35441.704 41.920 45.19062.268 46.859 40.92458.209 65.067 38.87763.319 38.403 27.259经数据分析结果见下表:表9-5 三个年级之间的t检验结果组别t P一年级和二年级 2.85 0.0071一年级和三年级 4.09 0.0002二年级和三年级 1.12 0.2710问:(1) 该资料采用的是何种统计分析方法?(2) 所使用的统计分析方法是否正确?为什么?(3) 若不正确,可以采用何种正确的统计分析方法。

请作分析?【习题解析】一、思考题1. 方差分析的基本思想是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,来判断总体均数间的差别是否具有统计学意义。

应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本方差齐性。

是各观测值与总均值之差的平方和,即总离均差平方和,表示总变异的大2. SS总表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误小;SS组间表示组内变异,指同一处理组内部各观察值之间的变异,是由差造成的;SS组内随机误差造成的。

3. 交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个因素之间存在交互效应。

例如:某实验研究A、B两种药物在不同剂量情况下对某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。

4. 重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离得越近的数据相关性越高。

5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。

因此,若希望进一步了解两两间的差别,需进行多重比较。

二、最佳选择题1. C2. C3. A4. E5. D6. E7. D8. E9. C三、综合分析题1. 解:本题采用完全随机设计的方差分析。

表9-6 三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)一般疗法 一般疗法+A1一般疗法+A2合计 X0.81 1.32 2.35 0.75 1.41 2.50 0.74 1.35 2.43 0.86 1.38 2.36 0.82 1.40 2.44 0.87 1.33 2.46 0.75 1.43 2.40 0.74 1.38 2.43 0.72 1.40 2.21 0.82 1.40 2.45 0.80 1.34 2.38 0.751.462.40 i n12 12 12 36 (n ) i X ∑ 9.43 16.60 28.81 54.84(X ∑) i X0.7858 1.3833 2.40082i X ∑ 7.438522.982869.228199.6494(2X ∑)(1) 方差分析1) 建立检验假设,确定检验水准0H :123μμμ==,即三种方案治疗后缺铁性贫血患者红细胞升高数相同 1H :321μμμ、、不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同α=0.05 2) 计算检验统计量22()/(54.84)/36=83.5396C X N ==∑22()99.6494-83.5396=16.1098SS X X X C =-=-=∑∑总136135N ν=-=-=总22()=() i i i i SS n X X X n C =--∑∑∑组间2229.4316.6028.81()83.539616.0022121212=++-=1312k ν=-=-=组间16.109816.00220.1076SS SS SS =-=-=总组内组间33N k ν=-=组内 /= 2452.7216/MS SS v F MS SS v ==组间组间组间组内组内组内方差分析结果见表9-7。

表9-7 完全随机资料的方差分析表3) 确定P 值,作出统计推断查F 界值表(附表4)得P <0.01,按α=0.05水准,拒绝0H ,接受1H ,差别有统计学意义,可以认为三种不同方案治疗后患者红细胞升高数的总体均数不全相同。

(2) 用Dunnett-t 法进行多重比较。

1) 建立检验假设,确定检验水准0H :任一实验组与对照组的总体均数相同 1H :任一实验组与对照组的总体均数不同 0.05α= 2) 计算检验统计量0.0033e MS = 12312n n n ===0.02T C X X S -===表9-8 多个样本均数的Dunnett-t 检验计算表 对比组 (1)均数差值 (2) 标准误 (3) D t(4) Dunnett -t 界值P一般疗法与一般疗法+A1 0.60 0.02 30 2.32 <0.05 一般疗法与一般疗法+A21.620.02812.32<0.053) 确定P 值,作出统计推断将表9-8中D t 取绝对值,并以计算e MS 时的自由度 33e ν=和实验组数a =k −1=2(不含对照组)查Dunnett-t 界值表得P 值,列于表中。

相关文档
最新文档