excel中的概率统计(非常好的资料)
如何使用excel进行概率统计
数理统计实验1Excel基本操作1.1单元格操作1.1.1单元格的选取Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示.1.1.2选取单元格范围(矩形区域)可以按如下两种方式选取单元格范围.(1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可.(2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键.1.1.3选取特殊单元格在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况.第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可.第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可.1.1.4公式中的数值计算要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号.提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式.(2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式.公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和.=(B4+25)/SUM(D5:F5)1.1.5公式中的语法公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel 从等号(=)开始,从左到右计算公式.可以通过修改公式语法来控制计算的顺序.例如,公式=5+2*3的结果为11,将2 乘以3(结果是6),然后再加上5.因为Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括号内的内容将首先被计算.公式=(5+2)*3的结果为21,即先用5 加上2,再用其结果乘以3.1.1.6单元格引用一个单元格中的数值或公式可以被另一个单元格引用.含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值.只要被引用单元格做了修改,包含引用公式的单元格也就随之修改.例如,公式“=B15*5”将单元格B15 中的数值乘以5.每当单元格B15 中的值修改时,公式都将重新计算.公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志.在默认状态下,Excel 使用A1 引用类型.这种类型用字母标志列(从A 到IV ,共256 列),用数字标志行(从1 到65536).如果要引用单元格,请顺序输入列字母和行数字.例如,D50 引用了列D 和行50 交叉处的单元格.如果要引用单元格区域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用.下面是引用的示例.1.1.7工作表函数Excel 包含许多预定义的,或称内置的公式,它们被叫做函数.函数可以进行简单的或复杂的计算.工作表中常用的函数是“SUM”函数,它被用来对单元格区域进行加法运算.虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM”工作表函数还可以方便地计算多个单元格区域.函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=).当生成包含函数的公式时,公式选项板将会提供相关的帮助.使用公式的步骤:A. 单击需要输入公式的单元格.B. 如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮.C. 单击“函数”下拉列表框右端的下拉箭头.D. 单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.E. 输入参数.F. 完成输入公式后,请按ENTER 键.1.2几种常见的统计函数1.2.1均值Excel计算平均数使用AVERAGE函数,其格式如下:AVERAGE(参数1,参数2,…,参数30)范例:AVERAGE(12.6,13.4,11.9,12.8,13.0)=12.74如果要计算单元格中A1到B20元素的平均数,可用AVERAGE(A1:B20).1.2.2标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差.(1)样本标准差Excel计算样本标准差采用无偏估计式,STDEV函数格式如下:STDEV(参数1,参数2,…,参数30)范例:STDEV(3,5,6,4,6,7,5)=1.35如果要计算单元格中A1到B20元素的样本标准差,可用STDEV(A1:B20).(2)总体标准差Excel 计算总体标准差采用有偏估计式STDEVP 函数,其格式如下:STDEVP (参数1,参数2,…,参数30)范例:STDEVP (3,5,6,4,6,7,5)=1.251.2.3 方差方差为标准差的平方,在统计上亦分样本方差与总体方差.(1)样本方差S 2=1)(2--∑n x x iExcel 计算样本方差使用VAR 函数,格式如下:VAR (参数1,参数2,…,参数30)如果要计算单元格中A1到B20元素的样本方差,可用 VAR(A1:B20). 范例:VAR (3,5,6,4,6,7,5)=1.81(2)总体方差S 2=n x x i ∑-2)(Excel 计算总体方差使用VARP 函数,格式如下:VARP (参数1,参数2,…,参数30)范例:VAR (3,5,6,4,6,7,5)=1.551.2.4 正态分布函数Excel 计算正态分布时,使用NORMDIST 函数,其格式如下:NORMDIST(变量,均值,标准差,累积)其中:变量(x):为分布要计算的x值;均值(μ):分布的均值;标准差(σ):分布的标准差;累积:若为TRUE,则为分布函数;若为FALSE,则为概率密度函数.范例:已知X服从正态分布,μ=600,σ=100,求P{X≤500}.输入公式=NORMDIST(500,600,100,TRUE)得到的结果为0.158655,即P{X≤500}=0.158655.1.2.5正态分布函数的反函数Excel计算正态分布函数的反函数使用NORMINV函数,格式如下:NORMINV(下侧概率,均值,标准差)范例:已知概率P=0.841345,均值μ=360,标准差σ=40,求NORMINV函数的值.输入公式=NORMINV(0.841345,360,40)得到结果为400,即P{X≤400}=0.841345.注意:(1) NORMDIST函数的反函数NORMINV用于分布函数,而非概率密度函数,请务必注意;(2) Excel 提供了计算标准正态分布函数NORMSDIST(x),及标准正态分布的反函数NORMSINV(概率).Φ=P{X<2}.输入公式范例:已知X~N(0,1), 计算(2)=NORMSDIST(2)Φ=0.97725.得到0.97725,即(2)范例:输入公式=NORMSINV(0.97725) ,得到数值2.若求临界值uα(n),则使用公式=NORMSINV(1-α).1.2.6t分布Excel计算t分布的值(查表值)采用TDIST函数,格式如下:TDIST(变量,自由度,侧数)其中:变量(t):为判断分布的数值;自由度(v):以整数表明的自由度;侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.范例:设T服从t(n-1)分布,样本数为25,求P(T>1.711).已知t=1.711,n=25,采用单侧,则T分布的值:=TDIST(1.711,24,1)得到0.05,即P(T>1.711)=0.05.若采用双侧,则T分布的值:=TDIST(1.711,24,2)得到0.1,即()1.7110.1P T >=. 1.2.7 t 分布的反函数Excel 使用TINV 函数得到t 分布的反函数,格式如下:TINV (双侧概率,自由度)范例:已知随机变量服从t (10)分布,置信度为0.05,求t 205.0(10).输入公式=TINV(0.05,10)得到2.2281,即()2.22810.05P T >=.若求临界值t α(n ),则使用公式=TINV(2*α, n ).范例:已知随机变量服从t (10)分布,置信度为0.05,求t 0.05 (10).输入公式=TINV(0.1,10)得到1.812462,即t 0.05 (10)= 1.812462.1.2.8 F 分布Excel 采用FDIST 函数计算F 分布的上侧概率1()F x -,格式如下:FDIST(变量,自由度1,自由度2)其中:变量(x ):判断函数的变量值;自由度1(1n ):代表第1个样本的自由度;自由度2(2n ):代表第2个样本的自由度.范例:设X 服从自由度1n =5,2n =15的F 分布,求P (X >2.9)的值.输入公式=FDIST(2.9,5,15)得到值为0.05,相当于临界值α.1.2.9 F 分布的反函数Excel 使用FINV 函数得到F 分布的反函数,即临界值12(,)F n n α,格式为:FINV(上侧概率,自由度1,自由度2)范例:已知随机变量X 服从F (9,9)分布,临界值α=0.05,求其上侧0.05分位点F 0.05(9,9).输入公式=FINV(0.05,9,9)得到值为3.178897,即F 0.05(9,9)= 3.178897.若求单侧百分位点F 0.025(9,9),F 0.975(9,9).可使用公式=FINV(0.025,9,9)=FINV(0.975,9,9)得到两个临界值4.025992和0.248386.若求临界值F α(n 1,n 2),则使用公式=FINV(α, n 1,n 2).1.2.10 卡方分布Excel 使用CHIDIST 函数得到卡方分布的上侧概率1()F x -,其格式为:CHIDIST(数值,自由度)其中:数值(x ):要判断分布的数值;自由度(v ):指明自由度的数字.范例:若X 服从自由度v =12的卡方分布,求P (X >5.226)的值.输入公式=CHIDIST(5.226,12)得到0.95,即1(5.226)F -=0.95或(5.226)F =0.05.1.2.11 卡方分布的反函数Excel 使用CHIINV 函数得到卡方分布的反函数,即临界值2()n αχ.格式为:CHIINV (上侧概率值α,自由度n )范例:下面的公式计算卡方分布的反函数:=CHIINV(0.95,12)得到值为5.226,即20.95(12)χ=5.226.若求临界值2αχ(n),则使用公式=CHIINV(α, n). 1.2.12 泊松分布计算泊松分布使用POISSON 函数,格式如下:POISSON(变量,参数,累计)其中:变量:表示事件发生的次数;参数:泊松分布的参数值;累计:若TRUE ,为泊松分布函数值;若FALSE ,则为泊松分布概率分布值.范例:设X服从参数为4的泊松分布,计算P {X =6}及P {X ≤6}.输入公式=POISSON(6,4,FALSE)=POISSON(6,4,TRUE)得到概率0.104196和0.889326.在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT ,开平方函数SQRT ,和函数SUM ,等等.关于这些函数的具体用法,可以查看Excel 的关于函数的说明,不再赘述.2 区间估计实验计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.2.1 单个正态总体均值与方差的区间估计:2.1.1 2已知时的置信区间 置信区间为22x u x u n n αα⎛⎫-+ ⎝. 例1 随机从一批苗木中抽取16株,测得其高度(单位:m )为:1.14 1.10 1.131.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.141.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ =0.01(米). 步骤:(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据.(2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:=average(b3:g5)-normsinv(1-0.5*α)*σ/sqrt(count(b3:g5))=average(b3:g5)+normsinv(1-0.5*α)*σ/sqrt(count(b3:g5))上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平α和标准差σ是具体的数值而不是符号.本例中,=0.05, 0.01σ=,上述两个公式应实际输入为=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5))=average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))计算结果为(1.148225, 1.158025). 2.1.2 2未知时的置信区间置信区间为 22((x t n x t n n n αα⎛⎫--+- ⎝. 例2 同例1,但σ未知.输入公式为:=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) =average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) 计算结果为(1.133695, 1.172555).2.1.3未知时2的置信区间:置信区间为2222122(1)(1),(1)(1)n nn ns sααχχ-⎛⎫ ⎪--⎪--⎪⎝⎭.例3从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间(单位:s)如下:50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5试求总体方差2σ的0.9的置信区间(设总体为正态).操作步骤:(1)在单元格B3:C7分别输入样本数据;(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7);(3)在单元格C10中输入置信水平0.1.(4)计算样本方差:在单元格C11中输入公式=VAR(B3:C7)(5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12(7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1)=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)2.2 两正态总体均值差与方差比的区间估计2.2.1 当12 =22 =2但未知时1-2的置信区间置信区间为 ()1212211(2)w x y t n n S n n α⎛⎫-±+-+ ⎪ ⎪⎝⎭.例4 在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为甲:12.6 13.4 11.9 12.8 13.0乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ1-μ2所在的范围.(取α=0.05)实验步骤:(1)在A2:A6输入甲组数据,在B2:B8输入乙组数据;(2)在单元格B11输入公式=AVERAGE(A2:A6),在单元格B12中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值.(3)分别在单元格C11和C12分别输入公式=VAR(A2:A6),=VAR(B2:B8),计算出两组样本的方差.(4)在单元格D11和D12分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小.(5)将显著性水平0.05输入到单元格E11中.(6)分别在单元格B13和B14输入=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)和=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)计算出置信区间的下限和上限.2.2.21和未知时方差比σ21/σ22的置信区间置信区间为22 112221221212211,(1,1)(1,1)s ss F n n s F n nαα-⎛⎫⎪⎪----⎪⎝⎭.例5有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是SA=0.5419,SB=0.6065.设σ2A和σ2B分别是A、B所测量的数据总体(设为正态分布)的方差.求方差比σ2A/σ2B的0.95置信区间.操作步骤:(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度.(2)在B4和B5利用公式输入=C2/(C3*FINV(1-D2/2,B2-1,B3-1))和=C2/(C3*FINV(D2/2,B2-1,B3-1))计算出A组和B组的方差比的置信区间上限和下限.2.3练习题1. 已知某树种的树高服从正态分布,随机抽取了该树种的60株林木组成样本.样本中各林木的树高资料如下(单位:m)22.3, 21.2, 19.2, 16.6, 23.1, 23.9, 24.8, 26.4, 26.6, 24.8, 23.9, 23.2, 23.3, 21.4,19.8, 18.3, 20.0, 21.5, 18.7, 22.4, 26.6, 23.9, 24.8, 18.8, 27.1, 20.6, 25.0, 22.5,23.5, 23.9, 25.3, 23.5, 22.6, 21.5, 20.6, 25.8, 24.0, 23.5, 22.6, 21.8, 20.8, 19.5,20.9, 22.1, 22.7, 23.6, 24.5, 23.6, 21.0, 21.3, 22.4,18.7, 21.3, 15.4, 22.9, 17.8,21.7, 19.1, 20.3, 19.8试以0.95的可靠性,对于该林地上全部林木的平均高进行估计.2. 从一批灯泡中随机抽取10个进行测试,测得它们的寿命(单位:100h)为:50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5.试求总体方差的0.9的置信区间(设总体为正态).3. 已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量(kg)如下:第一实验区:62 57 65 60 63 58 57 60 60 58第二实验区:56 59 56 57 60 58 57 55 57 55试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产量均值之差的范围(α=0.05)3假设检验实验实验内容:单个总体均值的假设检验;两个总体均值差的假设检验;两个正态总体方差齐性的假设检验;拟合优度检验.实验目的与要求:(1)理解假设检验的统计思想,掌握假设检验的计算步骤;(2)掌握运用Excel进行假设检验的方法和操作步骤;(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.3.1单个正态总体均值μ的检验3.1.12已知时μ的U检验例1 外地一良种作物,其1000m2产量(单位:kg)服从N(800, 502),引入本地试种,收获时任取5块地,其1000m2产量分别是800,850,780,900,820(kg),假定引种后1000m2产量X也服从正态分布,试问:=800kg 有无显著变化.(1)若方差未变,本地平均产量μ与原产地的平均产量μ0(2)本地平均产量μ是否比原产地的平均产量μ=800kg高.0=800kg低.(3)本地平均产量μ是否比原产地的平均产量μ0操作步骤:(1)先建一个如下图所示的工作表:(2)计算样本均值(平均产量),在单元格D5输入公式=AVERAGE(A3:E3);(3)在单元格D6输入样本数5;(4)在单元格D8输入U检验值计算公式=(D5-800)/(50/SQRT(D6);(5)在单元格D9输入U检验的临界值=NORMSINV(0.975);(6)根据算出的数值作出推论.本例中,U的检验值1.341641小于临界值1.959961,故接受原假设,即平均产量与原产地无显著差异.(7)注:在例1中,问题(2)要计算U检验的右侧临界值:在单元格D10输入U检验的上侧临界值=NORMSINV(0.95).问题(3)要计算U检验的下侧临界值,在单元格D11输入U检验下侧的临界值=NORMSINV(0.05).3.1.22未知时的t检验例2某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:250 238 265 242 248 258 255 236 245 261254 256 246 242 247 256 258 259 262 263该引擎制造商宣称引擎的平均速度高于250 km/h,请问样本数据在显著性水平为0.025时,是否和他的声明抵触?操作步骤:(1)先建如图所示的工作表:(2)计算样本均值:在单元格D8输入公式=AVERAGE(A3:E6);(3)计算标准差:在单元格D9输入公式=STDEV(A3:E6);(4)在单元格D10输入样本数20.(5)在单元格D11输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10)),得到结果1.06087;(6)在单元格D12输入t检验上侧临界值计算公式=TINV(0.05, D10-1).欲检验假设H0:μ=250;H:μ>250.1已知t统计量的自由度为(n-1)=20-1=19,拒绝域为t>t=2.093.由上面计算得025.0到t检验统计量的值1.06087落在接收域内,故接收原假设H0.3.2两个正态总体参数的假设检验3.2.1当12 =22 =2但未知时μ-μ的检验12在此情况下,采用t检验.例试验及观测数据同11.2中的练习题3,试判别磷肥对玉米产量有无显著影响?欲检验假设H0:μ1=μ2;H:μ1>μ2.1操作步骤:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“t-检验:双样本等方差假设”.(4)选择“确定”.显示一个“t-检验:双样本等方差假设”对话框;(5)在“变量1的区域”输入A2:A11.(6)在“变量2的区域”输入B2:B11.(7)在“输出区域”输入D1,表示输出结果放置于D1向右方的单元格中.(8)在显著水平“α”框,输入0.05.(9)在“假设平均差”窗口输入0.(10)选择“确定”,计算结果如D1:F14显示.得到t值为3.03,“t单尾临界”值为1.734063.由于3.03>1.73,所以拒绝原假设,接收备择假设,即认为使用磷肥对提高玉米产量有显著影响.3.2.2σ21与σ22已知时12μ-μ的U检验例3 某班20人进行了数学测验,第1组和第2组测验结果如下:第1组:91 88 76 98 94 92 90 87 100 69第2组:90 91 80 92 92 94 98 78 86 91已知两组的总体方差分别是57与53,取α =0.05,可否认为两组学生的成绩有差异?操作步骤:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“z-检验:双样本平均差检验”;(4)选择“确定”,显示一个“z-检验:双样本平均差检验”对话框;(5)在“变量1的区域”输入A2:A11;(6)在“变量2的区域”输入B2:B11;(7)在“输出区域”输入D1;(8)在显著水平“α”框,输入0.05;(9)在“假设平均差”窗口输入0;(10)在“变量1的方差”窗口输入57;(11)在“变量2的方差”窗口输入53;(12)选择“确定”,得到结果如图所示.计算结果得到z=-0.21106(即u统计量的值),其绝对值小于“z双尾临界”值1.959961,故接收原假设,表示无充分证据表明两组学生数学测验成绩有差异.3.2.3两个正态总体的方差齐性的F检验例5羊毛在处理前与后分别抽样分析其含脂率如下:处理前:0.19 0.18 0.21 0.30 0.41 0.12 0.27处理后:0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12问处理前后含脂率的标准差是否有显著差异?欲检验假设H0:σ21=σ22;H1:σ21≠σ22.操作步骤如下:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”; (3)选定“F-检验 双样本方差”.(4)选择“确定”,显示一个“F-检验:双样本方差”对话框; (5)在“变量1的区域”输入A2:A8. (6)在“变量2的区域”输入B2:B9. (7)在显著水平“α”框,输入0.025. (8)在“输出区域”框输入D1. (9)选择“确定”,得到结果如图所示.计算出F 值2.35049小于“F 单尾临界”值5.118579,且P(F<=f)=0.144119>0.025,故接收原假设,表示无理由怀疑两总体方差相等.4 拟合优度检验拟合优度检验使用统计量221()ki i i i n np np χ=-=∑, (11.1) i i n np k 其中为实测频数,为理论频数,为分组数。
如何在Excel中使用EXPONDIST函数计算指数分布的概率密度
如何在Excel中使用EXPONDIST函数计算指数分布的概率密度在Excel中使用EXPONDIST函数计算指数分布的概率密度Excel是一款强大的电子表格软件,广泛应用于各个领域的数据分析和计算中。
其中,EXPONDIST函数是用来计算指数分布的概率密度的重要函数之一。
本文将介绍如何在Excel中使用EXPONDIST函数来计算指数分布的概率密度。
一、指数分布概述指数分布是一种常见的概率分布,常用于描述连续事件之间的时间间隔。
它的概率密度函数为:f(x) = λ * exp(-λ * x)其中,x为随机变量的取值,λ为指数分布的均值参数。
二、Excel中的EXPONDIST函数EXPONDIST函数是Excel中用来计算指数分布概率密度的函数,其语法如下:EXPONDIST(x,λ,cumulative)其中,x为要计算概率密度的随机变量的值,λ为指数分布的均值参数,cumulative为一个逻辑值,表示是否计算累积概率密度。
当cumulative为FALSE时,EXPONDIST函数计算的是概率密度函数;当cumulative为TRUE时,EXPONDIST函数计算的是累积概率密度函数。
三、使用EXPONDIST函数计算指数分布的概率密度在Excel中,使用EXPONDIST函数计算指数分布的概率密度非常简单。
首先,在一个单元格中输入EXPONDIST函数的公式,例如=EXPONDIST(A2, 1, FALSE),其中A2表示要计算概率密度的随机变量的值,1表示指数分布的均值参数(可以根据实际情况调整),FALSE表示计算概率密度函数。
然后,将需要计算概率密度的随机变量的值填入相应单元格,即可得到指数分布的概率密度。
可以通过拖动单元格的填充手柄来一次性计算多个随机变量的概率密度。
四、使用EXPONDIST函数计算指数分布的累积概率密度除了计算概率密度函数,EXPONDIST函数还可以用来计算累积概率密度函数。
如何在Excel中使用CHIDIST函数计算卡方分布的累积概率
如何在Excel中使用CHIDIST函数计算卡方分布的累积概率在Excel中,使用CHIDIST函数可以计算卡方分布的累积概率。
卡方分布是一种常见的统计分布,用于判断随机变量的观察值与理论值之间的偏差程度。
本文将向您介绍如何使用CHIDIST函数进行卡方分布的累积概率计算。
首先,我们需要了解CHIDIST函数的语法。
CHIDIST函数的参数有两个,分别为x和自由度(deg_freedom)。
其中,x代表要计算的值,自由度代表卡方分布的自由度。
在Excel中,我们可以通过以下步骤来计算卡方分布的累积概率:1. 打开Excel,并创建一个新的工作表。
2. 在A1单元格中输入标题"卡方分布累积概率计算"。
3. 在A3单元格中输入标题"观察值",在A4单元格中输入标题"自由度"。
4. 在B3单元格中输入要计算的观察值,例如5。
在B4单元格中输入卡方分布的自由度,例如3。
5. 在C3单元格中输入标题"累积概率"。
6. 在C4单元格中输入CHIDIST函数的公式,即"=CHIDIST(B3,B4)"。
7. 按下Enter键,即可得到卡方分布的累积概率值。
通过上述步骤,我们就可以在Excel中使用CHIDIST函数计算卡方分布的累积概率了。
下面,我们将通过一个示例来进一步说明。
假设我们要计算观察值为5,自由度为3的卡方分布的累积概率。
按照上述步骤,在B3单元格中输入5,在B4单元格中输入3。
然后按下Enter键,我们可以得到C4单元格中的卡方分布的累积概率值。
需要注意的是,CHIDIST函数计算的是右尾概率,即大于等于给定值的概率。
如果需要计算左尾概率(小于等于给定值的概率),可以使用CHIINV函数。
在使用CHIDIST函数计算卡方分布的累积概率时,我们还可以使用Excel提供的其他功能,如填充函数、自动计算等,以提高效率和准确性。
Excel在统计中的应用 第4章 概率分布与抽样分布
图4-12 建立工作表
图4-13 产生随机数
图4-14 取整函数对话框
图4-15 选定参数对话框
图4-16 索引函数对话框
图4-17 抽样结果 返回本节
4.2.2 总体分布与抽样分布
总体分布与抽样分布之间具有一定数量关系, 这个数量关系可以描述为: 值; x
E ( x)
,即
1.二项分布函数
二项分布函数适用于固定次数的独立试验,当 试验的结果只包含成功或失败两种情况时,且 当成功的概率在试验期间固定不变,该函数返 回一元二项式分布的概率值,其计算公式为
n x n x 1 b ( x , n, p ) p p x
语法:BINOMDIST(number_s,trials,probability_s,cumulative)
图4-1 BINOMDIST函数工作表
图4-2 BINOMDIST函数计算结果
2.累积二项分布函数
该函数可以计算使累积二项分布大于或等于临 界值的最小整数值。累积二项分布函数可以用 于质量检验。例如,使用函数 CRITBINOM 来 决定最多允许出现多少个有缺陷的部件,才可 以保证整个产品在离开装配线时检验合格。 语法:CRITBINOM(trials,probability_s,alpha)
图4-3 CRITBINOM函数工作表
图4-4 CRITBINOM函数计算结果
3.负二项分布函数
该函数返回负二项式分布。当成功概率为常量 probability_s时,函数 NEGBINOMDIST返回在 到达number_s次成功之前,出现number_f次失 败的概率。此函数与二项式分布函数相似,只 是它的成功次数固定,试验总数为变量。与二 项式分布类似的是,试验次数被假设为自变量, 其计算公式为:
Excle做概率累计曲线粒度
excel做概率分布累积曲线步骤绝对详细的用excel做概率分布累积曲线的好东西,是我一步一步的摸索出来的,热的哦,有问题也可以发消息我解答的。
1. 建立模板建立模板. A. 新建EXCEL 文件, 在A1 : A17 单元格内输入数字“0”, 在B1 : B17 单元格内分别输入数字99. 99 , 99.9 ,99 ,95 ,90 ,80 ,70 ,60 ,50 ,40 ,30 ,20 ,10 ,5 ,1 ,0. 1 ,0. 01 。
前者作为横坐标, 代表将来纵轴与横轴的交叉位置, 其数值以后要根据实际情况调整。
后者代表纵轴以百分数表示的概率刻度值。
B. 选择C1 单元后击粘贴函数(见图1 中箭头所指位置) , 待出现粘贴函数菜单后选取统计类的NORMSINV 函数。
C. 出现新的对话框后, 在probability 后输入“B1/ 100”, 然后确定. D.这时C1 单元格内就有了一个函数值, 拖动C1单元格的填充柄(C1 单元格右下角的小黑块) 向下填充, 则C2 : C17 单元格内都自动生成了函数值。
E. 设置C1 : C17 单元格格式, 将其数值的小数位数定为“2”。
2.做草图 2.做草图选中A1 : A17 和C1 : C17 单元格后, 选择图表向导, 按照提示进行: A.在4 步骤之1 中, 选择X、Y 散点图类型中的第一子类型, 后单击下一步; B.在4 步骤之2 中, 确认系列产生在列(点中“列”前面的小圈) , 后单击下一步; C.在4 步骤之3 中, 可暂不做选择, 直接单击下一步; D.在4 步骤之4 , 根据喜好选图表位置, 本文中选“新工作表”, 单击“完成”后草图就算做成了. 3. 修图 A.首先先去掉图例框、绘图区背景色以及网格线,便于下面的修改; B. 选择数值( Y) 轴, 按鼠标右键弹出菜单后选“坐标轴格式”, 在“坐标轴格式” 菜单中做如下设置: ①在“图案” 项中将主、次刻度线类型及刻度线标志均选“无” ; ②在“刻度”项中,最小值选“-3. 72 ”, 最大值选“3. 72 ”,数值( X) 轴交叉于( C) : 选“-3. 72 ” ; C. 选择数据系列, 按鼠标右键弹出菜单后选“数据系列格式”, 在该菜单作如下设置: ①将图案中的“数据标记样式”选为短横线作为纵轴刻度线; ②在“数据标志”项中选“显示值”, 然后确定。
excel概率标准差计算
在Excel中计算标准差可以使用函数STDEV.S或STDEV.P。
具体操作如下:
1. 输入统计对象。
2. 选中要获得标准差的单元格。
3. 输入计算公式,例如,如果要计算样本标准差,可以使用公式STDEV.S(A2:A6)。
4. 确认后,即可显示标准差的计算结果。
总体标准差和样本标准差的区别:总体标准差是针对总体数据的偏差,样本标准差是针对从总体抽样。
样本标准偏差也称实验标准偏差,为了使算出的值与总体水平更接近,就必须将算出的标准偏差的值适度放大,即1/(N-1)。
总体标准偏差的计算使用“有偏差”和“n”方法,即分母是n²的算法;如果数据代表的是总体的一个样本,则必须使用函数STDEV、STDEVA来估算标准偏差。
标准偏差的计算使用“无偏差”和“n-1”方法,即分母是n(n-1)。
以上内容仅供参考,建议咨询专业人士获取更准确的信息。
常用分布概率计算的excel应用 (1)
上机实习常用分布概率计算的Excel应用利用Excel中的统计函数工具,可以计算二项分布、泊松分布、正态分布等常用概率分布的概率值、累积(分布)概率等。
这里我们主要介绍如何用Excel来计算二项分布的概率值与累积概率,其他常用分布的概率计算等处理与此类似。
§3.1 二项分布的概率计算一、二项分布的(累积)概率值计算用Excel来计算二项分布的概率值P n(k)、累积概率F n(k),需要用BINOMDIST函数,其格式为:BINOMDIST (number_s,trials, probability_s, cumulative)其中 number_s:试验成功的次数k;trials:独立试验的总次数n;probability_s:一次试验中成功的概率p;cumulative:为一逻辑值,若取0或FALSE时,计算概率值P n(k);若取1或TRUE时,则计算累积概率F n(k),。
即对二项分布B(n,p)的概率值P n(k)和累积概率F n(k),有P n(k)=BINOMDIST(k,n,p,0);F n(k)= BINOMDIST(k,n,p,1)现结合下列机床维修问题的概率计算来稀疏现象(小概率事件)发生次数说明计算二项分布概率的具体步骤。
例3.1某车间有各自独立运行的机床若干台,设每台机床发生故障的概率为0.01,每台机床的故障需要一名维修工来排除,试求在下列两种情形下机床发生故障而得不到及时维修的概率:(1)一人负责15台机床的维修;(2)3人共同负责80台机床的维修。
原解:(1)依题意,维修人员是否能及时维修机床,取决于同一时刻发生故障的机床数。
设X表示15台机床中同一时刻发生故障的台数,则X服从n=15,p=0.01的二项分布:X~B(15,0.01),而 P(X= k)= C15k(0.01)k(0.99)15-k,k = 0, 1, …, 15故所求概率为P(X≥2)=1-P(X≤1)=1-P(X=0)-P(X=1)=1-(0.99)15-15×0.01×(0.99)14=1-0.8600-0.1303=0.0097(2)当3人共同负责80台机床的维修时,设Y表示80台机床中同一时刻发生故障的台数,则Y服从n=80、p=0.01的二项分布,即Y~B(80,0.01)此时因为 n=80≥30, p=0.01≤0.2所以可以利用泊松近似公式:当n很大,p较小时(一般只要n≥30,p≤0.2时),对任一确定的k,有(其中 =np)λλ--≈ekqpCkknkkn!来计算。
概率函数在EXCEL中的使用方法
概率函数在EXCEL中的使用方法在Excel中,概率函数被称为统计函数,用于计算概率分布函数(Probability Distribution Function,简称PDF)和累积分布函数(Cumulative Distribution Function,简称CDF)的值。
概率函数在统计分析和数据建模中非常有用,可以帮助我们计算出特定事件发生的可能性。
下面将介绍Excel中一些常用的概率函数的使用方法。
1.概率密度函数(PDF):在Excel中,我们可以使用函数DENSITY函数来计算概率密度函数的值。
这个函数的语法如下:DENSITY(x, mean, standard_dev, cumulative)其中,x是要计算PDF的数值;mean是概率分布的平均值;standard_dev是概率分布的标准偏差;cumulative是一个逻辑值,用于指示是否计算累积分布函数(CDF)的值。
如果cumulative为TRUE(默认值),则计算CDF的值;如果为FALSE,则计算PDF的值。
2.累积分布函数(CDF):在Excel中,我们可以使用函数NORM.DIST来计算累积分布函数的值。
这个函数的语法如下:NORM.DIST(x, mean, standard_dev, cumulative)其中,x是要计算CDF的数值;mean是概率分布的平均值;standard_dev是概率分布的标准偏差;cumulative是一个逻辑值,指示是否计算累积分布函数(CDF)的值。
如果cumulative为TRUE(默认值),则计算CDF的值;如果为FALSE,则计算PDF的值。
3.正态分布:在Excel中,正态分布是一种非常常见的概率分布,可以使用NORM.DIST函数来计算正态分布的概率密度函数(PDF)和累积分布函数(CDF)的值。
4.t-分布:在Excel中,t-分布是一种常用的概率分布,用于小样本的假设检验。
excel均匀分布函数计算概率
一、概述Excel是一款功能强大的电子表格软件,广泛应用于数据分析、统计计算等领域。
在使用Excel进行数据分析时,经常需要计算概率分布,以便进行概率统计和决策分析。
Excel提供了多种函数来计算不同类型的概率分布,其中包括均匀分布函数。
本文将详细介绍如何使用Excel 的均匀分布函数来计算概率,帮助读者更好地掌握Excel在统计计算中的应用。
二、均匀分布概念及特点1. 均匀分布概念均匀分布是概率论中常见的一种连续概率分布,它的概率密度函数在一定区间内具有相同的取值,即概率密度函数呈现为水平的直线。
均匀分布的特点是在给定区间内各个取值的概率是相等的,因此也被称为等概率分布。
2. 均匀分布特点- 概率密度函数在一定区间内呈水平直线,各取值的概率相等;- 均匀分布的期望值等于区间的中点,方差等于区间长度的平方除以12。
三、Excel中均匀分布函数在Excel中,可以使用UNIFORM.DIST函数来计算均匀分布的概率。
UNIFORM.DIST函数的语法如下:UNIFORM.DIST(x, min, max, cumulative)- x:表示要计算概率的数值;- min:表示区间的下限;- max:表示区间的上限;- cumulative:表示是否计算累积概率,可以为TRUE或FALSE。
四、使用Excel计算均匀分布概率1. 计算概率密度要使用Excel计算均匀分布的概率密度,可以利用UNIFORM.DIST函数。
以下是一个示例:假设区间是[3, 7],要计算x=5的概率密度,可以使用以下公式: =UNIFORM.DIST(5, 3, 7, FALSE)函数的返回值为0.25,表示在区间[3, 7]中取值为5的概率密度为0.25。
2. 计算累积概率如果需要计算均匀分布的累积概率,可以将UNIFORM.DIST函数的cumulative参数设置为TRUE。
以下是一个示例:假设区间是[3, 7],要计算x小于等于6的累积概率,可以使用以下公式:=UNIFORM.DIST(6, 3, 7, TRUE)函数的返回值为0.75,表示在区间[3, 7]中取值小于等于6的累积概率为0.75。
用EXCEL计算二项分布概率值的操作步骤
⽤EXCEL计算⼆项分布概率值的操作步骤⽤Excel计算⼆项分布概率值的操作步骤1、进⼊Excel界⾯,单击某⼀单元格。
2、选择【插⼊】——【函数】选项从【选择类别】窗⼝中选择“统计”从【选择函数】窗⼝中选择“BINOMDIST”,单击【确定】3、当【BINOMDIST】对话框出现时:在【Number-s】中输⼊2(成功的次数X)在【trials】中输⼊3(实验的总次数n)在【Probability-s】中输⼊0.05(每次实验成功的概率p)在【Cumulative】中输⼊0(或False),表⽰计算成功次数恰好等于制定数值的概率(输⼊1或True表⽰计算成功次数⼩于或等于制定数值的累计概率值)。
选择【完成】即可得到结果。
计算超⼏何分布概率的步骤与上述过程类似,只不过在第2步【选择函数】窗⼝中选择“HYPGEOMDIST”函数,在第3步中输⼊相应的值即可。
如下在【sample-s】中输⼊成功的次数在【Number-sample】输⼊样本量在【population-s】中输⼊总体中成功的次数在【Number-pop】中输⼊总体中的个体总数单击【确定】即可。
⽤Excel计算泊松分布概率值的操作步骤1、进⼊Excel界⾯,单击某⼀单元格2、选择【插⼊】——【函数】选项从【选择类别】窗⼝中选择“统计”从【选择函数】窗⼝中选择“POISSON”,单击【确定】3、当【POISSON】对话框出现时在【x】中输⼊事件出现的次数在【Mean】中输⼊泊松分布的均值在【Cumulative】中输⼊0或(False),表⽰计算事件出现次数恰好等于指定数值的概率(输⼊1或True表⽰计算成功次数⼩于或等于制定数值的累计概率值)。
只需在【X】选项中,分别填⼊1,2,3即可计算出相应概率。
excel中概率密度分布函数
excel中概率密度分布函数概率密度分布函数(probability density function)是统计学中的一种描述随机变量概率分布的函数,通常简称为概率密度函数或密度函数。
概率密度函数可以用来描述随机变量在某个取值范围内的概率分布情况,它的值越大表示该取值出现的可能性越大。
在Excel中,计算概率密度函数可以通过使用统计函数来完成。
常见的统计函数包括:NORM.DIST、NORM.S.DIST、EXP.DIST、BINOM.DIST等等。
1. NORM.DISTNORM.DIST函数可以用来计算标准正态分布中的概率密度函数值。
该函数的语法如下:NORM.DIST(x,mean,standard_dev,cumulative)参数说明:x:要计算概率密度函数值的自变量值。
mean:标准正态分布的均值,通常默认为0。
cumulative:一个逻辑值,用于确定要计算的概率密度函数值是累积值还是概率密度值。
如果cumulative为TRUE,则表示计算累积分布函数值,即Z值小于等于x的概率;如果cumulative为FALSE,则表示计算概率密度函数值,即在给定的x处概率密度值。
=NORM.DIST(1.5,0,1,FALSE)该公式返回的结果是0.12951。
rate:指数分布的速率参数。
例如,要计算速率参数为0.5时,指数分布中x=3处的概率密度函数值,可以使用以下公式:trials:试验次数。
probability:成功概率。
综上所述,Excel中提供了多种统计函数用于计算不同类型的概率密度函数。
通过合理使用这些函数,可以方便地计算任意随机变量的概率密度函数值,为数据的分析和处理提供有力的支持。
excel标准正态分布概率
excel标准正态分布概率Excel标准正态分布概率。
Excel是一款功能强大的电子表格软件,除了常见的数据处理和分析功能外,它还可以进行统计学计算,包括正态分布的计算。
正态分布是统计学中非常重要的一种分布,也称为高斯分布,它在自然界和社会现象中都有着广泛的应用。
在Excel中,我们可以利用一些内置的函数来计算标准正态分布的概率,本文将介绍如何在Excel中进行这一计算。
首先,我们需要了解一下标准正态分布。
标准正态分布是均值为0,标准差为1的正态分布,其概率密度函数可以用数学公式表示为:f(x) = (1/√(2π)) e^(-x^2/2)。
其中,x为随机变量的取值,e为自然对数的底,π为圆周率。
在Excel中,我们可以利用内置的函数NORM.DIST来计算标准正态分布的概率。
具体来说,NORM.DIST函数的语法为:NORM.DIST(x, mean, standard_dev, cumulative)。
其中,x为随机变量的取值,mean为分布的均值,standard_dev为分布的标准差,cumulative为一个逻辑值,用于指定计算累积分布函数还是概率密度函数。
如果cumulative为TRUE,则计算累积分布函数;如果cumulative为FALSE,则计算概率密度函数。
下面我们通过一个实例来演示如何在Excel中计算标准正态分布的概率。
假设我们要计算标准正态分布随机变量取值小于1的概率。
首先,在Excel的一个单元格中输入随机变量的取值1,比如A1单元格。
然后,在另一个单元格中输入NORM.DIST函数的公式:=NORM.DIST(A1, 0, 1, TRUE)。
按下回车键,即可得到随机变量取值小于1的概率。
除了NORM.DIST函数外,Excel还提供了NORM.S.DIST和NORM.INV函数,用于计算标准正态分布的累积分布函数和反函数。
NORM.S.DIST函数的语法与NORM.DIST函数类似,用于计算标准正态分布的累积分布函数;NORM.INV函数则用于计算标准正态分布的反函数,即给定概率值,求对应的随机变量取值。
第10章-Excel软件在数理统计中的应用
第10章Excel软件在概率统计中的应用10.1 中文Excel的基本介绍10.1.1中文Excel的概述Excel是一个功能多、技术先进、使用方便的表格式数据综合管理和分析系统,它采用电子表格的形式进行数据处理,工作简单明了,提供了丰富的函数,可以进行数据处理、统计分析和决策,同时,还具有较好的制图功能。
工作表区由单元格组成,每个单元格由列标和行号识别。
工作表区的最上面一行为列标,用A,B,…,Z,AA,AB, …,AZ,BA,BB, …,BZ, …,IA, …,IV等表示,工作表区左边一列为行号,用1,2,3,…表示, Excel 2007及Excel 2010增大了数据容量,列数最多可为16384,行数最多可为1048576。
单元格“A1”表示单元格位于A列第1行。
单元格区域则规定为矩形,例如“A1:E4”表示一矩形区域,如图10-1,A1和E4分别为该区域的主对角线两端的单元格。
每张工作表有一个标签与之对应,例如:“sheet 1”,“sheet 2”, “sheet 3”.工作表隶属于工作簿,一个工作簿最多可由255个不同的工作表组成。
图10-110.1.2.Excel函数的调用方法1)首先选择函数值存放的单元格, 若是Excel2003版,使用“插入”菜单—“函数”选项,如图10-2所示,或使用“常用”工具栏中的“粘贴函数”按钮进入“粘贴函数”对话框;若是Excel2010版,使用“公式”菜单—“插入函数”选项。
图10-22)点击“函数”选项后,将出现如图10-3所示的对话框。
图10-33)在“选择类别”列表中选择“统计”,如图10-4,然后在“函数名”列表中选择相应的函数,如选中函数“AVERAGE”,点击“确定”按钮,出现输入数据或单元格范围的对话框;如图10-5图10-4 图10-54)输入数据或单元格范围,点击“确定”按钮,在函数值存放的单元格即计算出(返回)函数值。
注:若对某函数的使用不太熟悉,可以点击图10-5左下方的“有关该函数的帮助”按钮,即可获得帮助。
Excel在数理统计中的应用
图 2-3 例 2.2.1 福建师范大学数计学院 05 级数本专业成绩数据(具体数据附表 2-1),计算数理 统计成绩的平均值、方差和标准差。 步骤 1 :“插入”=>“函数”=> 选择常用函数下选择函数中的 AVERAGE =>在“函数 参数”窗口参数选择数据区域 S4:S204(或直接输入=AVERAGEZ(S4:S204) ) , 得 68.37 分 步骤 2 :“插入”=>“函数”=> 选择常用函数下选择函数中的 VARP =>在“函数参数” 窗口参数选择数据区域 S4:S204(或直接输入=VARP(S4:S204) ) , 得 237.43 步骤 3 :“插入”=>“函数”=> 选择常用函数下选择函数中的 STDEVP =>在“函数参 数”窗口参数选择数据区域 S4:S204(或直接输入 =STDEVP(S4:S204)) , 得 15.41 数理统计的平均成绩 68.37 分,方差为 237.43,标准差为 15.41
•
一元二项式概率密度函数的计算公式为: b( x, n, p ) = ⎜ ⎟ p (1 − p ) BINOMDIST(x,n,p,0)
n
⎛n⎞ ⎝x⎠
x
n− x
,相当于
•
一元二项式累积分布函数的计算公式为: B ( x, n, p ) = BINOMDIST(n,x,p,1)
∑ b( x, n, p )
x=0
,相当于
CRITBINOM(trials,probability_s,alpha) 返回使累积二项式分布大于等于临界值的最小 值。Trials 伯努利试验次数。Probability_s 每次试验中成功的概率。Alpha 临界值。 NEGBINOMDIST(number_f,number_s,probability_s) 返回负二项式分布。 当成功概率为常 量 probability_s 时,函数 NEGBINOMDIST 返回在到达 number_s 次成功之前,出现 number_f 次失败的概率。Number_f 失败次数。Number_s 成功的极限次数。Probability_s 成功的概率。
excel中的概率统计(非常好的资料)
excel中的概率统计(⾮常好的资料)数理统计实验1 Excel 基本操作1.1 单元格操作1.1.1 单元格的选取Excel启动后⾸先将⾃动选取第A列第1⾏的单元格即A1(或a1)作为活动格,我们可以⽤键盘或⿏标来选取其它单元格.⽤⿏标选取时,只需将⿏标移⾄希望选取的单元格上并单击即可.被选取的单元格将以反⾊显⽰.1.1.2选取单元格范围(矩形区域)可以按如下两种⽅式选取单元格范围.(1)先选取范围的起始点(左上⾓),即⽤⿏标单击所需位置使其反⾊显⽰.然后按住⿏标左键不放,拖动⿏标指针⾄终点(右下⾓)位置,然后放开⿏标即可.(2)先选取范围的起始点(左上⾓),即⽤⿏标单击所需位置使其反⾊显⽰.然后将⿏标指针移到终点(右下⾓)位置,先按下Shift 键不放,⽽后点击⿏标左键.1.1.3选取特殊单元格在实际中,有时要选取的单元格由若⼲不相连的单元格范围组成的.此类有两种情况.第⼀种情况是间断的单元格选取.选取⽅法是先选取第⼀个单元格,然后按住[Ctrl] 键,再依次选取其它单元格即可.第⼆种情况是间断的单元格范围选取.选取⽅法是先选取第⼀个单元格范围,然后按住[Ctrl]键,⽤⿏标拖拉的⽅式选取第⼆个单元格范围即可.1.1.4公式中的数值计算要输⼊计算公式,可先单击待输⼊公式的单元格,⽽后键⼊=(等号),并接着键⼊公式,公式输⼊完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel 将⾃动插⼊⼀个等号.提⽰:(1)通过先选定⼀个区域,再键⼊公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输⼊同⼀公式.(2)可以通过另⼀单元格复制公式,然后在⽬标区域内输⼊同⼀公式.公式是在⼯作表中对数据进⾏分析的等式.它可以对⼯作表数值进⾏加法、减法和乘法等运算.公式可以引⽤同⼀⼯作表中的其它单元格、同⼀⼯作簿不同⼯作表中的单元格,或者其它⼯作簿的⼯作表中的单元格.下⾯的⽰例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和.=(B4+25)/SUM(D5:F5)1.1.5公式中的语法公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守⼀个特定的语法:最前⾯是等号(=),后⾯是参与计算的元素(运算数)和运算符?每个运算数可以是不改变的数值(常量数值)、单元格或区域引⽤、标志、名称,或⼯作表函数.在默认状态下,Excel从等号(=)开始,从左到右计算公式?可以通过修改公式语法来控制计算的顺序?例如,公式=5+2*3的结果为11,将2乘以3 (结果是6),然后再加上5 ?因为Excel先计算乘法再计算加法;可以使⽤圆括号来改变语法,圆括号内的内容将⾸先被计算?公式=(5+2)*3的结果为21,即先⽤5加上2,再⽤其结果乘以3.1.1.6 单元格引⽤⼀个单元格中的数值或公式可以被另⼀个单元格引⽤. 含有单元格引⽤公式的单元格称为从属单元格,它的值依赖于被引⽤单元格的值?只要被引⽤单元格做了修改,包含引⽤公式的单元格也就随之修改.例如,公式“=B15*5 ”将单元格B15中的数值乘以5 ?每当单元格B15中的值修改时,公式都将重新计算.公式可以引⽤单元格组或单元格区域,还可以引⽤代表单元格或单元格区域的名称或标志.在默认状态下,Excel使⽤A1引⽤类型?这种类型⽤字母标志列(从A到IV , 共256列),⽤数字标志⾏(从1到65536)?如果要引⽤单元格,请顺序输⼊列字母和⾏数字.例如,D50引⽤了列D和⾏50交叉处的单元格.如果要引⽤单元格区域,请输⼊区域左上⾓单元格的引⽤、冒号(:)和区域右下⾓单元格的引⽤?下⾯是引⽤的⽰例.1.1.7 ⼯作表函数Excel包含许多预定义的,或称内置的公式,它们被叫做函数?函数可以进⾏简单的或复杂的计算?⼯作表中常⽤的函数是“SUM”函数,它被⽤来对单元格区域进⾏加法运算?虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM ”⼯作表函数还可以⽅便地计算多个单元格区域.函数的语法以函数名称开始,后⾯是左圆括号、以逗号隔开的参数和右圆括号. 如果函数以公式的形式出现,请在函数名称前⾯键⼊等号(=)?当⽣成包含函数的公式时,公式选项板将会提供相关的帮助.使⽤公式的步骤:A.单击需要输⼊公式的单元格.B.如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮C.单击“函数”下拉列表框右端的下拉箭头.D.单击选定需要添加到公式中的函数. 如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.E.输⼊参数.F.完成输⼊公式后,请按ENTER键.1.2⼏种常见的统计函数1.2.1均值Excel计算平均数使⽤AVERAGE函数,其格式如下:AVERAGE (参数1,参数2,…,参数30)范例:AVERAGE (12.6,13.4,11.9,12.8,13.0) =12.74如果要计算单元格中A 1到B20元素的平均数,可⽤AVERAGE(A1:B20).1.2.2标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,⽽依据总体计算的结果称作总体标准差.(1)样本标准差Excel计算样本标准差采⽤⽆偏估计式,STDEV函数格式如下:STDEV (参数1,参数2,…,参数30)范例:STDEV (3, 5, 6, 4, 6, 7, 5)= 1.35如果要计算单元格中A 1到B20元素的样本标准差,可⽤STDEV(A1:B20).(2)总体标准差Excel计算总体标准差采⽤有偏估计式STDEVP函数,其格式如下:STDEVP (参数1,参数2,…,参数30)范例:STDEVP (3, 5, 6, 4, 6, 7, 5)= 1.251.2.3⽅差⽅差为标准差的平⽅,在统计上亦分样本⽅差与总体⽅差.(1)样本⽅差2以x)2&=—n 1Excel计算样本⽅差使⽤VAR函数,格式如下:VAR (参数1,参数2,…,参数30)如果要计算单元格中A 1到B20元素的样本⽅差,可⽤VAR(A1:B20). 范例:VAR (3, 5, 6, 4, 6, 7, 5)= 1.81(2)总体⽅差Excel 计算总体⽅差使⽤ VARP 函数,格式如下:VARP (参数1,参数2,…,参数 30)范例:VAR (3, 5, 6, 4, 6, 7, 5)= 1.55 1.2.4正态分布函数Excel 计算正态分布时,使⽤NORMDIST 函数,其格式如下:NORMDIST (变量,均值,标准差,累积)其中:变量(x ):为分布要计算的x 值;均值(分布的均值;标准差(0):分布的标准差;累积:若为TRUE ,则为分布函数;若为 FALSE ,则为概率密度函数.范例:已知X 服从正态分布,⼫600,⼫100,求P{X W 500}.输⼊公式=NORMDIST ( 500, 600, 100, TRUE ) 得到的结果为 0.158655,即 P{X <500}=0.158655 .1.2.5正态分布函数的反函数Excel 计算正态分布函数的反函数使⽤NORMINV 函数,格式如下:NORMINV (下侧概率,均值,标准差)范例:已知概率 P = 0.841345,均值⼫360,标准差⼫40,求NORMINV 函数的值.输⼊公式=NORMINV ( 0.841345 , 360, 40) 得到结果为 400,即⼙ P{X W400}=0.841345 .注意:(1) NORMDIST 函数的反函数 NORMINV ⽤于分布函数,⽽⾮概率密度函数,请务必注意;(2) Excel 提供了计算标准正态分布函数NORMSDIST(x),及标准正态分布的反函数 NORMSINV(概率).范例:已知X ?N (0,1),计算 (2) =P{X<2}.输⼊公式=NORMSDIST(2)得到 0.97725,即 (2)=0.97725 .范例:输⼊公式=NORMSINV(0.97725),得到数值2. 若求临界值 u ?(n),则使⽤公式 =NORMSINV(1- a). 1.2.6 t 分布Excel 计算t 分布的值(查表值)采⽤ TDIST 函数,格式如下: TDIST (变量,⾃由度,侧数)其中:变量(t ):为判断分布的数值;⾃由度(v ):以整数表明的⾃由度;S=(X i x)2n侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.范例:设T服从t(n-1)分布,样本数为25,求P (T>1.711).已知t= 1.711, n=25,采⽤单侧,贝U T分布的值:=TDIST(1.711,24,1)得到0.05,即P (T>1.711) =0.05 .若采⽤双侧,则T分布的值:=TDIST(1.711,24,2)得到0.1,即⼙ P T 1.711 0.1.1.2.7t分布的反函数Excel使⽤TINV函数得到t分布的反函数,格式如下:TINV (双侧概率,⾃由度)范例:已知随机变量服从t(10)分布,置信度为0.05,求t 0.05 (10).输⼊公式""2"=TINV(0.05,10)得到 2.2281,即 P T 2.2281 0.05 .若求临界值t?(n),则使⽤公式 =TINV(2* a n).范例:已知随机变量服从t(10)分布,置信度为0.05,求t0.05 (10).输⼊公式=TINV(0.1,10)得到 1.812462,即t0.05 (10)= 1.812462 .1.2.8F分布Excel采⽤FDIST函数计算F分布的上侧概率1 F(x),格式如下:FDIST(变量,⾃由度1,⾃由度2)其中:变量(x):判断函数的变量值;⾃由度1( nJ:代表第1个样本的⾃由度;⾃由度2 (门2):代表第2个样本的⾃由度.范例:设X服从⾃由度n 1=5, n2=15的F分布,求P(X>2.9)的值.输⼊公式=FDIST(2.9,5,15)得到值为0.05,相当于临界值 a.1.2.9 F 分布的反函数Excel 使⽤FINV 函数得到 F 分布的反函数,即临界值F (n1,n2) ,格式为:。
excel 2019 t分布 概率 和 分位数
Excel 2019 中的 t 分布概率和分位数一、t 分布的概念和特点1.1 t 分布的概念t 分布是由英国统计学家威廉·塞利德出版的“学生”(Student)的笔名所命名,是统计学中常用的一种概率分布。
它是正态分布的一种推广,常用于对小样本数据进行参数估计和假设检验。
1.2 t 分布的特点t 分布的形状和自由度相关,自由度越大,t 分布趋近于正态分布。
在实际应用中,t 分布常用于估计总体均值、总体均值之差以及总体标准差等参数。
二、Excel 2019 中 t 分布的概率计算2.1 使用 T.DIST 函数计算 t 分布的概率在 Excel 2019 中,可以使用 T.DIST 函数来计算 t 分布的概率。
T.DIST 函数的语法为:T.DIST(x, degrees_freedom, cumulative)。
其中,x 为 t 值,degrees_freedom 为自由度,cumulative 为累积分布函数的标志。
若要求 t 分布在 t 值为1时的概率,自由度为10,则可以使用以下公式:=T.DIST(1, 10, TRUE)2.2 使用 T.DIST.RT 函数计算 t 分布的右尾概率在 Excel 2019 中,还可以使用 T.DIST.RT 函数来计算 t 分布的右尾概率。
T.DIST.RT 函数的语法为:T.DIST.RT(x, degrees_freedom)。
其中,x 为 t 值,degrees_freedom 为自由度。
若要求 t 分布在 t 值为1时的右尾概率,自由度为10,则可以使用以下公式:=T.DIST.RT(1, 10)2.3 t 分布的概率计算实例假设某研究人员对一批产品的尺寸进行抽样检验,假设总体均值为100,样本容量为15,样本平均值为98,样本标准差为5。
现需计算样本均值的 t 值,并确定在自由度为14的情况下,t 分布在该 t 值时的概率及右尾概率。
正态分布excel公式
正态分布excel公式正态分布(normaldistribution)是概率论中最常用的概率分布,它是一种双峰分布形式,也称为高斯分布或钟形曲线。
正态分布的曲线具有非常广泛的应用,在数理统计学中,它是最重要的概率分布之一。
以Excel表格建模的正态分布可以迅速帮助数理统计学家和决策者更好地理解和分析统计数据。
正态分布的Excel公式是统计数据分析中常用的工具,用于快速计算正态分布曲线上概率评分。
正态分布曲线左右对称,因此该曲线的概率线也是对称的,可以用Excel函数NORM.DIST计算具有某概率的点分值,以及具有某分值的点的概率分值。
NORM.DIST数的参数包括样本值,值μ,标准差σ,以及概率类型指示器。
Excel中构建正态分布图形可以帮助快速建立概率评分函数,并且可以用于进行实证分析,找出控制变量的理论指标,以及用于扩展模型和理论研究,从而获得可靠的结果。
正态分布可以使用Excel中的曲线工具绘制出更加完整的正态分布图,并计算不同自变量分布的可能性,从而让决策者能够更加精准地做出正确的选择。
正态分布的Excel函数可以快速便捷地检验统计模型的参数,以及检验数据是否呈现出正态分布。
此外,正态分布可以计算概率密度函数,以计算分布曲线上某个特定值处的概率,也可以计算最大似然估计,可以预测未来的概率值。
Excel中的正态分布公式可以帮助研究人员和决策者“一口气”解决多种数据分析问题,而且这个公式的应用非常的方便。
正态分布的Excel公式可以帮助决策者快速分析和解释数据,及时做出正确的决策,并由此让组织取得较好的成果。
正态分布公式可以通过Excel工具实时计算出统计模型和历史统计数据,研究人员可以利用它一口气解决多种数据分析问题,从而让解决方案的效率提升得更快、更准确,从而提高组织的效率和绩效。
总的来说,Excel中的正态分布公式可以帮助数理统计学家和决策者更好地理解和分析统计数据,有助于更全面、更迅速地建模和实现数据分析,提高组织的效率和绩效,为研究者和决策者提供更精准、更快速的解决方案。
如何在Excel中使用GAMMADIST函数计算伽马分布的概率密度
如何在Excel中使用GAMMADIST函数计算伽马分布的概率密度Excel是一款功能强大的电子表格软件,它提供了许多内置函数,方便我们进行数据分析和计算。
其中,GAMMADIST函数是一个用于计算伽马分布的概率密度的重要函数。
本文将介绍如何在Excel中使用GAMMADIST函数计算伽马分布的概率密度。
伽马分布在概率统计中经常被使用,它在描述连续随机变量的正态分布方面具有广泛的应用。
由于GAMMADIST函数可以方便地计算伽马分布的概率密度,因此学习如何正确使用这个函数非常重要。
要在Excel中使用GAMMADIST函数,首先需要了解一些基本的概念。
伽马分布具有两个参数:alpha和beta。
其中,alpha是形状参数,beta是尺度参数。
有了这两个参数,我们就可以使用GAMMADIST函数来计算伽马分布的概率密度。
在Excel中,GAMMADIST函数的语法如下:=GAMMADIST(x,alpha,beta,cumulative)其中,x表示要计算概率密度的值;alpha表示伽马分布的形状参数;beta表示伽马分布的尺度参数;cumulative表示一个逻辑值,用于指定计算概率密度函数还是分布函数。
如果cumulative为TRUE,表示计算分布函数;如果cumulative为FALSE,表示计算概率密度函数。
接下来,我们通过一个实例来演示如何使用GAMMADIST函数计算伽马分布的概率密度。
假设我们要计算伽马分布中x为2,alpha为3,beta为4时的概率密度。
首先,在Excel中选择一个单元格,输入以下公式:=GAMMADIST(2,3,4,FALSE)按下回车键后,我们会得到结果0.103776874,这个结果就是伽马分布的概率密度。
通过上述实例,我们可以看到,使用GAMMADIST函数可以方便地计算伽马分布的概率密度。
在使用GAMMADIST函数时,需要注意输入正确的参数值,并根据具体情况选择计算概率密度还是分布函数。
如何在Excel中使用GAMMADIST函数计算伽玛分布的概率密度函数值
如何在Excel中使用GAMMADIST函数计算伽玛分布的概率密度函数值伽玛分布是统计学中常用的一种概率分布,它主要用于描述随机变量服从伽玛分布的概率情况。
在Excel中,我们可以使用GAMMADIST函数来计算伽玛分布的概率密度函数值,从而实现对伽玛分布的概率计算。
本文将介绍如何在Excel中使用GAMMADIST函数来计算伽玛分布的概率密度函数值。
首先,在使用GAMMADIST函数计算伽玛分布的概率密度函数值之前,我们需要了解一些基本的背景知识。
伽玛分布是一种连续概率分布,它由两个参数形成:形状参数(shape parameter)和尺度参数(scale parameter)。
伽玛分布的概率密度函数形式如下:f(x) = (x^(k-1) * e^(-x/θ)) / (θ^k * Γ(k))其中,x表示随机变量的取值,k表示形状参数,θ表示尺度参数,Γ(k)表示伽玛函数。
GAMMADIST函数就是用来计算伽玛分布概率密度函数值的函数。
接下来,我们将介绍如何在Excel中正确地使用GAMMADIST函数来计算伽玛分布的概率密度函数值。
首先,打开Excel表格,选择一个单元格作为输出结果的位置。
然后,在该单元格中输入以下公式:=GAMMADIST(x,k,θ,FALSE)其中,x表示要计算概率密度函数值的变量的取值,k表示形状参数的值,θ表示尺度参数的值,FALSE表示要计算的是概率密度函数值(而不是累积分布函数值)。
举个例子来说明。
假设我们要计算伽玛分布的概率密度函数值,其中形状参数k为2,尺度参数θ为3,要计算的变量取值为1。
我们可以在某个单元格中输入以下公式:=GAMMADIST(1,2,3,FALSE)然后按下回车键,Excel就会自动计算并在该单元格中给出结果。
需要注意的是,输入的参数值必须合理有效。
形状参数和尺度参数必须为正数,而且要计算的变量取值也必须为非负数。
此外,还要注意Excel中的GAMMADIST函数默认计算的是累积分布函数值,而不是概率密度函数值。
如何在Excel中使用POISSON函数计算泊松分布的概率密度
如何在Excel中使用POISSON函数计算泊松分布的概率密度在Excel中使用POISSON函数计算泊松分布的概率密度Excel是一款功能强大的电子表格软件,广泛应用于数据分析和统计计算。
POISSON函数是Excel提供的一个用于计算泊松分布的概率密度的统计函数。
本文将介绍如何在Excel中使用POISSON函数来进行泊松分布的概率密度计算。
一、什么是泊松分布泊松分布是概率论中的一种离散概率分布,用于描述在一个固定时间或空间内,某事件发生的次数的概率分布。
泊松分布的特点是事件在时间或空间上的发生是相互独立的,且平均发生率在时间或空间上是恒定的。
泊松分布的概率质量函数为:P(X=k) = (e^(-λ) * λ^k) / k!其中,P(X=k)表示事件发生k次的概率,λ表示单位时间或单位空间内事件发生的平均次数。
二、使用POISSON函数计算泊松分布的概率密度在Excel中,POISSON函数可用于计算泊松分布的概率密度。
POISSON函数的语法为:PO ISSON(x, λ, cumulative)其中,x表示事件发生的次数;λ表示单位时间或单位空间内事件发生的平均次数;cumulative表示计算累积概率还是概率密度,取值为TRUE或FALSE,TRUE表示计算累积概率,FALSE表示计算概率密度。
下面以一个实例来演示如何使用POISSON函数计算泊松分布的概率密度。
假设某快递公司每天平均接收到10个包裹,现在需要计算恰好接收到5个包裹的概率密度。
首先,在Excel中选择一个单元格,输入以下函数:=POISSON(5, 10, FALSE)然后按下回车键,Excel会自动计算出恰好接收到5个包裹的概率密度。
在本例中,计算结果为0.037833。
三、使用POISSON函数计算泊松分布的累积概率除了计算概率密度,POISSON函数还可以计算泊松分布的累积概率。
累积概率是指事件发生的次数小于或等于某个值的概率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计实验1Excel基本操作1.1单元格操作1.1.1单元格的选取Excel启动后首先将自动选取第A列第1行的单元格即A1(或a1)作为活动格,我们可以用键盘或鼠标来选取其它单元格.用鼠标选取时,只需将鼠标移至希望选取的单元格上并单击即可.被选取的单元格将以反色显示.1.1.2选取单元格范围(矩形区域)可以按如下两种方式选取单元格范围.(1) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后按住鼠标左键不放,拖动鼠标指针至终点(右下角)位置,然后放开鼠标即可.(2) 先选取范围的起始点(左上角),即用鼠标单击所需位置使其反色显示.然后将鼠标指针移到终点(右下角)位置,先按下Shift键不放,而后点击鼠标左键.1.1.3选取特殊单元格在实际中,有时要选取的单元格由若干不相连的单元格范围组成的.此类有两种情况.第一种情况是间断的单元格选取.选取方法是先选取第一个单元格,然后按住[Ctrl]键,再依次选取其它单元格即可.第二种情况是间断的单元格范围选取.选取方法是先选取第一个单元格范围,然后按住[Ctrl]键,用鼠标拖拉的方式选取第二个单元格范围即可.1.1.4公式中的数值计算要输入计算公式,可先单击待输入公式的单元格,而后键入=(等号),并接着键入公式,公式输入完毕后按Enter键即可确认..如果单击了“编辑公式”按钮或“粘贴函数”按钮,Excel将自动插入一个等号.提示:(1) 通过先选定一个区域,再键入公式,然后按CTRL+ENTER 组合键,可以在区域内的所有单元格中输入同一公式.(2) 可以通过另一单元格复制公式,然后在目标区域内输入同一公式.公式是在工作表中对数据进行分析的等式.它可以对工作表数值进行加法、减法和乘法等运算.公式可以引用同一工作表中的其它单元格、同一工作簿不同工作表中的单元格,或者其它工作簿的工作表中的单元格.下面的示例中将单元格B4 中的数值加上25,再除以单元格D5、E5 和F5 中数值的和.=(B4+25)/SUM(D5:F5)1.1.5公式中的语法公式语法也就是公式中元素的结构或顺序.Excel 中的公式遵守一个特定的语法:最前面是等号(=),后面是参与计算的元素(运算数)和运算符.每个运算数可以是不改变的数值(常量数值)、单元格或区域引用、标志、名称,或工作表函数.在默认状态下,Excel 从等号(=)开始,从左到右计算公式.可以通过修改公式语法来控制计算的顺序.例如,公式=5+2*3的结果为11,将 2 乘以3(结果是6),然后再加上5.因为Excel 先计算乘法再计算加法;可以使用圆括号来改变语法,圆括号内的内容将首先被计算.公式=(5+2)*3的结果为21,即先用 5 加上2,再用其结果乘以3.1.1.6单元格引用一个单元格中的数值或公式可以被另一个单元格引用.含有单元格引用公式的单元格称为从属单元格,它的值依赖于被引用单元格的值.只要被引用单元格做了修改,包含引用公式的单元格也就随之修改.例如,公式“=B15*5”将单元格B15 中的数值乘以5.每当单元格B15 中的值修改时,公式都将重新计算.公式可以引用单元格组或单元格区域,还可以引用代表单元格或单元格区域的名称或标志.在默认状态下,Excel 使用A1 引用类型.这种类型用字母标志列(从A 到IV ,共256 列),用数字标志行(从 1 到65536).如果要引用单元格,请顺序输入列字母和行数字.例如,D50 引用了列 D 和行50 交叉处的单元格.如果要引用单元格区域,请输入区域左上角单元格的引用、冒号(:)和区域右下角单元格的引用.下面是引用的1.1.7工作表函数Excel 包含许多预定义的,或称内置的公式,它们被叫做函数.函数可以进行简单的或复杂的计算.工作表中常用的函数是“SUM”函数,它被用来对单元格区域进行加法运算.虽然也可以通过创建公式来计算单元格中数值的总和,但是“SUM”工作表函数还可以方便地计算多个单元格区域.函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号.如果函数以公式的形式出现,请在函数名称前面键入等号(=).当生成包含函数的公式时,公式选项板将会提供相关的帮助.使用公式的步骤:A. 单击需要输入公式的单元格.B. 如果公式以函数的形式出现,请在编辑栏中单击“编辑公式”按钮 .C. 单击“函数”下拉列表框 右端的下拉箭头.D. 单击选定需要添加到公式中的函数.如果函数没有出现在列表中,请单击“其它函数”查看其它函数列表.E. 输入参数.F. 完成输入公式后,请按 ENTER 键.1.2 几种常见的统计函数1.2.1均值 Excel 计算平均数使用AVERAGE 函数,其格式如下:AVERAGE (参数1,参数2,…,参数30)范例:AVERAGE (12.6,13.4,11.9,12.8,13.0)=12.74如果要计算单元格中A1到B20元素的平均数,可用 AVERAGE(A1:B20).1.2.2 标准差计算标准差可依据样本当作变量或总体当作变量来分别计算,根据样本计算的结果称作样本标准差,而依据总体计算的结果称作总体标准差.(1)样本标准差Excel 计算样本标准差采用无偏估计式,STDEV 函数格式如下:STDEV (参数1,参数2,…,参数30)范例:STDEV (3,5,6,4,6,7,5)=1.35如果要计算单元格中A1到B20元素的样本标准差,可用 STDEV(A1:B20).(2)总体标准差Excel 计算总体标准差采用有偏估计式STDEVP 函数,其格式如下:STDEVP (参数1,参数2,…,参数30)范例:STDEVP (3,5,6,4,6,7,5)=1.251.2.3 方差方差为标准差的平方,在统计上亦分样本方差与总体方差.(1)样本方差S 2=1)(2--∑n x x iExcel 计算样本方差使用VAR 函数,格式如下:VAR (参数1,参数2,…,参数30)如果要计算单元格中A1到B20元素的样本方差,可用 VAR(A1:B20).范例:VAR (3,5,6,4,6,7,5)=1.81(2)总体方差S 2=n x x i ∑-2)(Excel 计算总体方差使用VARP 函数,格式如下:VARP (参数1,参数2,…,参数30)范例:VAR (3,5,6,4,6,7,5)=1.551.2.4 正态分布函数Excel 计算正态分布时,使用NORMDIST 函数,其格式如下:NORMDIST (变量,均值,标准差,累积)其中:变量(x ):为分布要计算的x 值;均值(μ):分布的均值;标准差(σ):分布的标准差;累积:若为TRUE ,则为分布函数;若为FALSE ,则为概率密度函数.范例:已知X 服从正态分布,μ=600,σ=100,求P {X ≤500}.输入公式=NORMDIST (500,600,100,TRUE )得到的结果为0.158655,即P {X ≤500}=0.158655.1.2.5 正态分布函数的反函数Excel 计算正态分布函数的反函数使用NORMINV 函数,格式如下:NORMINV (下侧概率,均值,标准差)范例:已知概率P =0.841345,均值μ=360,标准差σ=40,求NORMINV 函数的值.输入公式=NORMINV (0.841345,360,40)得到结果为400,即P {X ≤400}=0.841345.注意:(1) NORMDIST 函数的反函数NORMINV 用于分布函数,而非概率密度函数,请务必注意;(2) Excel 提供了计算标准正态分布函数 NORMSDIST(x),及标准正态分布的反函数 NORMSINV(概率).范例:已知X~N(0,1), 计算(2)Φ=P {X <2}.输入公式=NORMSDIST(2)得到0.97725,即(2)Φ=0.97725.范例:输入公式=NORMSINV(0.97725) ,得到数值2.若求临界值u α(n ),则使用公式=NORMSINV(1-α).1.2.6 t 分布Excel 计算t 分布的值(查表值)采用TDIST 函数,格式如下:TDIST (变量,自由度,侧数)其中:变量(t ):为判断分布的数值;自由度(v ):以整数表明的自由度;侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.范例:设T 服从t (n-1)分布,样本数为25,求P (T >1.711).已知t =1.711,n =25,采用单侧,则T 分布的值:=TDIST(1.711,24,1)得到0.05,即P (T >1.711)=0.05.若采用双侧,则T 分布的值:=TDIST(1.711,24,2)得到0.1,即()1.7110.1P T >=. 1.2.7 t 分布的反函数Excel 使用TINV 函数得到t 分布的反函数,格式如下:TINV (双侧概率,自由度)范例:已知随机变量服从t (10)分布,置信度为0.05,求t 205.0(10).输入公式=TINV(0.05,10)得到2.2281,即()2.22810.05P T >=.若求临界值t α(n ),则使用公式=TINV(2*α, n ).范例:已知随机变量服从t (10)分布,置信度为0.05,求t 0.05 (10).输入公式=TINV(0.1,10)得到1.812462,即t 0.05 (10)= 1.812462.1.2.8 F 分布Excel 采用FDIST 函数计算F 分布的上侧概率1()F x -,格式如下:FDIST(变量,自由度1,自由度2)其中:变量(x ):判断函数的变量值;自由度1(1n ):代表第1个样本的自由度;自由度2(2n ):代表第2个样本的自由度.范例:设X 服从自由度1n =5,2n =15的F 分布,求P (X >2.9)的值.输入公式=FDIST(2.9,5,15)得到值为0.05,相当于临界值α.1.2.9 F 分布的反函数Excel 使用FINV 函数得到F 分布的反函数,即临界值12(,)F n n α,格式为:FINV(上侧概率,自由度1,自由度2)范例:已知随机变量X 服从F (9,9)分布,临界值α=0.05,求其上侧0.05分位点F 0.05(9,9).输入公式=FINV(0.05,9,9)得到值为3.178897,即F 0.05(9,9)= 3.178897.若求单侧百分位点F 0.025(9,9),F 0.975(9,9).可使用公式=FINV(0.025,9,9)=FINV(0.975,9,9)得到两个临界值4.025992和0.248386.若求临界值F α(n 1,n 2),则使用公式=FINV(α, n 1,n 2).1.2.10 卡方分布Excel 使用CHIDIST 函数得到卡方分布的上侧概率1()F x -,其格式为:CHIDIST(数值,自由度)其中:数值(x ):要判断分布的数值;自由度(v ):指明自由度的数字.范例:若X 服从自由度v =12的卡方分布,求P (X >5.226)的值.输入公式=CHIDIST(5.226,12)得到0.95,即1(5.226)F -=0.95或(5.226)F =0.05.1.2.11 卡方分布的反函数Excel 使用CHIINV 函数得到卡方分布的反函数,即临界值2()n αχ.格式为:CHIINV (上侧概率值α,自由度n )范例:下面的公式计算卡方分布的反函数:=CHIINV(0.95,12)得到值为5.226,即20.95(12)χ=5.226. 若求临界值2αχ(n),则使用公式=CHIINV(α, n). 1.2.12 泊松分布计算泊松分布使用POISSON 函数,格式如下:POISSON(变量,参数,累计)其中:变量:表示事件发生的次数;参数:泊松分布的参数值;累计:若TRUE ,为泊松分布函数值;若FALSE ,则为泊松分布概率分布值. 范例:设X服从参数为4的泊松分布,计算P {X =6}及P {X ≤6}.输入公式=POISSON(6,4,FALSE)=POISSON(6,4,TRUE)得到概率0.104196和0.889326.在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT ,开平方函数SQRT ,和函数SUM ,等等.关于这些函数的具体用法,可以查看Excel 的关于函数的说明,不再赘述.2 区间估计实验计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.2.1 单个正态总体均值与方差的区间估计:2.1.1 2已知时的置信区间置信区间为22x u x u n n αα⎛⎫-+ ⎝. 例1 随机从一批苗木中抽取16株,测得其高度(单位:m )为:1.14 1.10 1.131.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ =0.01(米).步骤:(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据.(2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:=average(b3:g5)-normsinv(1-0.5*α)*σ/sqrt(count(b3:g5))=average(b3:g5)+normsinv(1-0.5*α)*σ/sqrt(count(b3:g5))上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平α和标准差σ是具体的数值而不是符号.本例中, =0.05, 0.01σ=,上述两个公式应实际输入为=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))计算结果为(1.148225, 1.158025).2.1.2 2未知时的置信区间置信区间为 22(1),(1)x t n x t n n n αα⎛⎫--+- ⎪⎝⎭. 例2 同例1,但σ未知.输入公式为:=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5))=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5))计算结果为(1.133695, 1.172555).2.1.3 未知时2的置信区间:置信区间为 2222122(1)(1),(1)(1)n n n n s s ααχχ-⎛⎫ ⎪-- ⎪-- ⎪⎝⎭. 例3 从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间(单位:s)如下:50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5试求总体方差2σ的0.9的置信区间(设总体为正态).操作步骤:(1)在单元格B3:C7分别输入样本数据;(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7);(3)在单元格C10中输入置信水平0.1.(4)计算样本方差:在单元格C11中输入公式=VAR(B3:C7)(5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12(7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1)=(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)2.2 两正态总体均值差与方差比的区间估计2.2.1 当12 =22 =2但未知时1-2的置信区间 置信区间为 ()1212211(2)w x y t n n S n n α⎛⎫-±+-+ ⎪ ⎪⎝⎭. 例4 在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为甲:12.6 13.4 11.9 12.8 13.0乙:13.1 13.4 12.813.5 13.3 12.7 12.4蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ1-μ2所在的范围.(取α=0.05)实验步骤:(1)在A2:A6输入甲组数据,在B2:B8输入乙组数据;(2)在单元格B11输入公式=AVERAGE(A2:A6),在单元格B12中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值.(3)分别在单元格C11和C12分别输入公式=VAR(A2:A6),=VAR(B2:B8),计算出两组样本的方差.(4)在单元格D11和D12分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小.(5)将显著性水平0.05输入到单元格E11中.(6)分别在单元格B13和B14输入=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)和=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)计算出置信区间的下限和上限.2.2.21和未知时方差比σ21/σ22的置信区间置信区间为22112221221212211,(1,1)(1,1)s ss F n n s F n nαα-⎛⎫⎪⎪----⎪⎝⎭.例5有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是SA=0.5419,SB=0.6065.设σ2A和σ2B分别是A、B所测量的数据总体(设为正态分布)的方差.求方差比σ2A/σ2B的0.95置信区间.操作步骤:(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度.(2)在B4和B5利用公式输入=C2/(C3*FINV(1-D2/2,B2-1,B3-1))和=C2/(C3*FINV(D2/2,B2-1,B3-1))计算出A组和B组的方差比的置信区间上限和下限.2.3练习题1. 已知某树种的树高服从正态分布,随机抽取了该树种的60株林木组成样本.样本中各林木的树高资料如下(单位:m)22.3, 21.2, 19.2, 16.6, 23.1, 23.9, 24.8, 26.4, 26.6, 24.8, 23.9, 23.2, 23.3, 21.4, 19.8, 18.3,20.0, 21.5, 18.7, 22.4, 26.6, 23.9, 24.8, 18.8, 27.1, 20.6, 25.0, 22.5, 23.5, 23.9, 25.3, 23.5,22.6, 21.5, 20.6, 25.8, 24.0, 23.5, 22.6, 21.8, 20.8, 19.5, 20.9, 22.1, 22.7, 23.6, 24.5, 23.6,21.0, 21.3, 22.4,18.7, 21.3, 15.4, 22.9, 17.8, 21.7, 19.1, 20.3, 19.8试以0.95的可靠性,对于该林地上全部林木的平均高进行估计.2. 从一批灯泡中随机抽取10个进行测试,测得它们的寿命(单位:100h)为:50.7,54.9,54.3,44.8,42.2,69.8,53.4,66.1,48.1,34.5.试求总体方差的0.9的置信区间(设总体为正态).3. 已知某种玉米的产量服从正态分布,现有种植该玉米的两个实验区,各分为10个小区,各小区的面积相同,在这两个实验区中,除第一实验区施以磷肥外,其它条件相同,两实验区的玉米产量(kg)如下:第一实验区:62 57 65 60 63 58 57 60 60 58第二实验区:56 59 56 57 60 58 57 55 57 55试求出施以磷肥的玉米产量均值和未施以磷肥的玉米产量均值之差的范围(α=0.05)3假设检验实验实验内容:单个总体均值的假设检验;两个总体均值差的假设检验;两个正态总体方差齐性的假设检验;拟合优度检验.实验目的与要求:(1)理解假设检验的统计思想,掌握假设检验的计算步骤;(2)掌握运用Excel进行假设检验的方法和操作步骤;(3)能够利用试验结果的信息,对所关心的事物作出合理的推断.3.1单个正态总体均值μ的检验3.1.12已知时μ的U检验例1 外地一良种作物,其1000m2产量(单位:kg)服从N(800, 502),引入本地试种,收获时任取5块地,其1000m2产量分别是800,850,780,900,820(kg),假定引种后1000m2产量X也服从正态分布,试问:=800kg 有无显著变化.(1)若方差未变,本地平均产量μ与原产地的平均产量μ0=800kg高.(2)本地平均产量μ是否比原产地的平均产量μ0=800kg低.(3)本地平均产量μ是否比原产地的平均产量μ0操作步骤:(1)先建一个如下图所示的工作表:(2)计算样本均值(平均产量),在单元格D5输入公式=AVERAGE(A3:E3);(3)在单元格D6输入样本数5;(4)在单元格D8输入U检验值计算公式=(D5-800)/(50/SQRT(D6);(5)在单元格D9输入U检验的临界值=NORMSINV(0.975);(6)根据算出的数值作出推论.本例中,U的检验值1.341641小于临界值1.959961,故接受原假设,即平均产量与原产地无显著差异.(7)注:在例1中,问题(2)要计算U检验的右侧临界值:在单元格D10输入U检验的上侧临界值=NORMSINV(0.95).问题(3)要计算U检验的下侧临界值,在单元格D11输入U 检验下侧的临界值=NORMSINV(0.05).3.1.22未知时的t检验例2某一引擎制造商新生产某一种引擎,将生产的引擎装入汽车内进行速度测试,得到行驶速度如下:250 238 265 242 248 258 255 236 245 261254 256 246 242 247 256 258 259 262 263该引擎制造商宣称引擎的平均速度高于250 km/h,请问样本数据在显著性水平为0.025时,是否和他的声明抵触?操作步骤:(1)先建如图所示的工作表:(2)计算样本均值:在单元格D8输入公式=AVERAGE(A3:E6);(3)计算标准差:在单元格D9输入公式=STDEV(A3:E6);(4)在单元格D10输入样本数20.(5)在单元格D11输入t检验值计算公式=(D8-250)/(D9/(SQRT(D10)),得到结果1.06087;(6)在单元格D12输入t检验上侧临界值计算公式=TINV(0.05, D10-1).欲检验假设H0:μ=250;H1:μ>250.=2.093.由上面计算得到t 已知t统计量的自由度为(n-1)=20-1=19,拒绝域为t>t025.0检验统计量的值1.06087落在接收域内,故接收原假设H0.3.2两个正态总体参数的假设检验μ-μ的检验3.2.1当12 =22 =2但未知时12在此情况下,采用t检验.例试验及观测数据同11.2中的练习题3,试判别磷肥对玉米产量有无显著影响?欲检验假设H0:μ1=μ2;H1:μ1>μ2.操作步骤:甲方乙方t-检验: 双样本等方差假设62565759甲方乙方6556平均60576057方差7.111111112.666666676358观测值10105857合并方差 4.888888895760假设平均差06055df186057t Stat 3.033899385855P(T<=t) 单尾0.00356934t 单尾临界 1.73406359P(T<=t) 双尾0.00713869t 双尾临界 2.10092204(2)选取“工具”—“数据分析”;(3)选定“t-检验:双样本等方差假设”.(4)选择“确定”.显示一个“t-检验:双样本等方差假设”对话框;(5)在“变量1的区域”输入A2:A11.(6)在“变量2的区域”输入B2:B11.(7)在“输出区域”输入D1,表示输出结果放置于D1向右方的单元格中.(8)在显著水平“α”框,输入0.05.(9)在“假设平均差”窗口输入0.(10)选择“确定”,计算结果如D1:F14显示.得到t值为3.03,“t单尾临界”值为1.734063.由于3.03>1.73,所以拒绝原假设,接收备择假设,即认为使用磷肥对提高玉米产量有显著影响.3.2.2σ21与σ22已知时12μ-μ的U检验例3 某班20人进行了数学测验,第1组和第2组测验结果如下:第1组:91 88 76 98 94 92 90 87 100 69第2组:90 91 80 92 92 94 98 78 86 91已知两组的总体方差分别是57与53,取α =0.05,可否认为两组学生的成绩有差异?操作步骤:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“z-检验:双样本平均差检验”;(4)选择“确定”,显示一个“z-检验:双样本平均差检验”对话框;(5)在“变量1的区域”输入A2:A11;(6)在“变量2的区域”输入B2:B11;(7)在“输出区域”输入D1;(8)在显著水平“α”框,输入0.05;(9)在“假设平均差”窗口输入0;(10)在“变量1的方差”窗口输入57;(11)在“变量2的方差”窗口输入53;(12)选择“确定”,得到结果如图所示.计算结果得到z=-0.21106(即u统计量的值),其绝对值小于“z双尾临界”值1.959961,故接收原假设,表示无充分证据表明两组学生数学测验成绩有差异.3.2.3两个正态总体的方差齐性的F检验例5羊毛在处理前与后分别抽样分析其含脂率如下:处理前:0.19 0.18 0.21 0.30 0.41 0.12 0.27处理后:0.15 0.13 0.07 0.24 0.19 0.06 0.08 0.12问处理前后含脂率的标准差是否有显著差异?欲检验假设H0:σ21=σ22;H1:σ21≠σ22.操作步骤如下:(1)建立如图所示工作表:(2)选取“工具”—“数据分析”;(3)选定“F-检验双样本方差”.(4)选择“确定”,显示一个“F-检验:双样本方差”对话框;(5)在“变量1的区域”输入A2:A8.(6)在“变量2的区域”输入B2:B9.(7)在显著水平“α”框,输入0.025.(8)在“输出区域”框输入D1.(9)选择“确定”,得到结果如图所示.计算出F值2.35049小于“F单尾临界”值5.118579,且P(F<=f)=0.144119>0.025,故接收原假设,表示无理由怀疑两总体方差相等.4拟合优度检验拟合优度检验使用统计量221()ki ii in npnpχ=-=∑,(11.1)i in np k其中为实测频数,为理论频数,为分组数。