dps统计软件操作指导书
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DPS数据分析平台操作指导书杜双奎 于修烛 李志西 张国权 编
西北农林科技大学
二〇一二年七月
DPS是Data Processing System的缩写。
该系统采用多级下拉式菜单,用户使用时整个屏幕犹如一张工作平台,随意调整,自如操作,称其为DPS数据处理工作平台,简称DPS平台。
它是一款国产的数据处理软件,除了输出结果较为简单外,其功能十分齐全,是一个“通用多功能数理统计和数学模型处理软件”。
与国外同类专业统计分析软件(如SAS、SPSS、STAT、STATISTICA 等)相比,DPS系统是独特的,它在使用时不必拘泥于一般电子表格的行列规定,行和列由系统辨认。
DPS在统计分析及模型模拟方面功能齐全,易于掌握,特别是对于广大中国用户更为方便。
DPS平台将数值计算、统计分析、模型模拟以及画线制表等功能融为一体,具体表现在以下几方面:
①它提供了包括均匀设计、混料均匀设计在内的丰富的试验设计功能,并在均匀设计中采用了独创算法,实现了大型均匀设计表构造的重大突破。
②完善的统计分析功能涵盖了几乎所有的统计分析技术,是目前国内统计分析功能最全的软件包。
其一般线性模型可以处理各种类型试验设计方差分析,特别是一些用SPSS菜单操作无法解决、用SAS编程很难实现的多因素裂区混杂设计、格子设计等方差分析问题,在DPS
中可轻松搞定。
③独特的非线性回归建膜技术实现了“可想即可得”的用户需求,且参数拟合精度高。
④不断丰富的专业统计分析模块可适合各个学科的特殊需求,如先后增加了顾客满意度指数(结构方程)模型、数学生态学方法、生物测定、地理统计、遗传育种、生存分析、水文频率分析、量表分析、质量控制图、ROC曲线分析等内容,并且还在不断地扩充。
⑤DPS=Excel十SPSS。
它既有Excel那样方便地在工作表里面处理基础统计分析的功能,又实现了SPSS高级统计分析技术。
DPS提供的十分方便的可视化操作界面,可借助图形处理的数据建模功能为处理复杂模型提供最直观的途径。
这些功能是同类软件中所欠缺的。
⑥有些不是统计分析的功能,如模糊数学方法、灰色系统方法、各种类型的线性规划、非线性规划、层次分析法、BP神经网络、径向基函数(RBF)等,在DPS里面也都可以找到。
⑦根据用户要求,不断吸纳新的统计方法,如小波分析、偏最小二乘回归、投影寻踪回归、灰色系统方法、混合分布参数估计、含定性变量的多元逐步回归分析等,并在不断探索,吸纳更多功能,使系统更加完善。
第一章 DPS平台简介 (1)
1.1DPS的启动与退出 (1)
1.2DPS用户工作界面 (1)
1.3DPS的基本操作 (2)
1.3.1 文件操作 (2)
1.3.2 数据的输入 (2)
1.3.3 数据统计分析及其建模基本步骤 (3)
第二章 基本统计分析 (5)
2.1基本参数计算 (5)
2.2常用统计分布及DPS统计函数 (6)
2.2.1 正态分布norm(x) (6)
2.2.2 二项分布bin(n,m,p) (6)
2 (6)
2.2.3 χ分布函数probchi(n,x)
2.2.4 t分布函数probt(n,x) (6)
(6)
2.2.5 F分布函数probf(n,n,x)
12
第三章 单样本和两样本统计假设检验 (7)
3.1单个样本平均数和总体均数差异检验 (7)
3.2样本率和总体率的比较 (8)
3.3两样本差异检验 (9)
3.3.1 成对数据平均数的比较 (10)
3.3.2 两组数据平均数比较 (11)
第四章 方差分析 (14)
4.1单因素试验资料的方差分析 (14)
4.2单因素区组试验资料的方差分析 (16)
4.3二因素无重复试验资料的方差分析 (17)
4.4二因素等重复试验资料的方差分析 (19)
4.5多因素试验资料的方差分析 (21)
4.6一般线性模型(GLM)在方差分析中的应用 (24)
4.6.1 线性模型基本原理 (25)
4.6.2 GLM模型用户操作界面 (27)
4.6.3 一般方差分析的GLM模型 (30)
第五章 非参数检验 (35)
2 (35)
5.1χ检验
2 (35)
5.1.1 χ检验的定义
5.1.2 适合性检验 (36)
5.1.3 独立性检验 (37)
5.2两样本配对符号检验 (42)
5.3两样本配对W ILCOXON符号-秩检验 (43)
5.4两样本W ILCOXON检验 (45)
5.5K RUSKAL W ALLIS检验 (46)
5.6F RIEDMAN检验 (48)
第六章 回归分析 (53)
6.1线性回归分析简介 (53)
6.1.1 线性回归模型 (53)
6.1.2 参数的最小二乘估计 (53)
6.1.3 多元回归统计检验 (54)
6.2一元线性回归 (55)
6.3多元线性回归 (57)
6.4逐步线性回归 (58)
6.5一元非线性回归 (60)
6.6二次多项式逐步回归 (62)
第七章 正交试验设计与分析 (64)
7.1正交试验方案设计 (64)
7.2正交试验结果分析 (65)
7.2.1 不考虑交互作用正交试验结果分析 (65)
7.2.2 考虑交互作用正交试验结果分析 (66)
7.2.3 混合水平正交试验结果分析 (67)
7.2.4 有重复正交试验结果分析 (68)
第八章 二次回归设计与分析 (71)
8.1二次回归设计步骤 (71)
8.2二次回归设计试验的统计分析 (72)
8.2.1 二次回归正交旋转组合设计的应用 (72)
8.2.2 二次通用旋转组合设计的应用 (78)
练习题 (82)
第一章 DPS 平台简介
1.1 DPS 的启动与退出
单击Windows 的“开始”菜单,在“程序”菜单里点击“DPS”按钮,即可启动DPS 系统,启动后会弹出如图1-1的窗口。
Exit
命令,或者单击×关闭。
图1-1 DPS 窗口界面
1.2 DPS 用户工作界面
进入编辑状态后,系统会出现如图1-1所示的用户工作界面。
DPS 工作界面包含标题栏、菜单栏、工具栏、下拉菜单、工作表、当前工作表、活动单元格、工作表标签及文本编辑区等部分。
(1)标题栏
标题栏告诉用户正在运行的程序名称和正在打开的文件名称。
如图1所示,标题栏显示此窗口的应用程序为DPS ,在DPS 中打开的当前文件的文件名为“DPS 数据处理系统(试用版)”。
(2)菜单栏
菜单栏显示 “文件”、“数据编辑”、“数据分析”、“试验设计”、“试验统计”、“分类数据统计”、“专业统计”、“多元分析”、 “数学模型”、“运筹学”、“数值计算”、“时间序列”及“其他”等菜单项。
当选中某一菜单项时,会引出一个下拉式菜单,可以从中选取相应的子菜单。
另外,在屏幕的不同地方单击鼠标右键时,“快捷菜单”将出现在鼠标指针处。
选取“快捷菜单”中的命令如同从菜单栏的菜单上选取相应命令的效果是一样的,但选取速度明显增快。
(3)工具栏
DPS提供了几种工具栏,这些工具可简化用户操作。
工具栏中的按钮都是常用命令,当鼠标指向某一按钮时,片刻后会在按钮右下方显示该按钮命令的含义。
工具栏的第一行是常用工具栏。
常用工具栏中为用户准备了使用DPS编辑、处理数据最常用命令的快捷按钮,如“新建文件”按钮、“打开文件”按钮、“保存文件”按钮。
“格式”按钮处理那些和文本外观有关的命令,如字体、字号、对齐方式及其他选项。
工具栏的第二行是数据矩阵处理快捷按钮。
该工具栏处理当前活动单元格的数据阵列。
可以对活动单元格的数据进行矩阵相加、相减、相乘、矩阵求逆等运算,还可以解正规方程组。
(4)工作表
工作表窗口可有多张独立的工作表。
开始时,窗口中显示第一张工作表“第l页”,该表为当前工作表。
当前工作表只有一张,用户可通过点击工作表下方的标签激活其他工作表为当前工作表。
工作表是一个由行和列组成的表格。
行号和列号分别用字母和数字区别。
行由上到下范围l-65535,列号则由左到右采用字母编号A—IV。
因此每张表最大可为255列×65535行。
在此范围内,工作表的大小可以由用户自己设定。
每一个行、列坐标所指定的位置称之为单元格。
在单元格中用户可以键入符号、数值、公式以及其他内容。
(5)工作表标签
工作表标签通常用“第1页”、“第2页”等名称来表示,用户也可以通过用鼠标右击标签名来对其进行修改。
DPS一般同时显示工作表队列中的前三个标签。
利用标签队列左边的一组标签滚动按钮可显示队列中的后续工作表的标签。
工作簿窗口中的工作表称之为当前工作表,当前工作表的标签为白色,其他为灰色。
(6)滚动栏
当工作表很大时,可以使用工作簿窗口右边及下边的滚动栏,使窗口在整张表上移动以方便查看表中的全部内容。
(7)状态栏
状态栏位于DPS窗口底部,它的左端是信息区,右端是键盘状态区。
在信息区中,显示的是DPS当前的工作状态。
DPS软件除具备齐全的统计分析功能外,还提供了包括多种类型的试验设计技术。
如随机区组设计、拉丁方设计、正交设计、正交回归设计及均匀试验设计等试验设计技术。
由于DPS 功能齐全,易于掌握,尤其是对广大中国用户,其工作界面友好,只需熟悉它的一般操作规则就可灵活应用。
1.3 DPS的基本操作
1.3.1 文件操作
(1)新建文件:进入“文件”菜单栏,选择“新建”即可创建一个新的DPS数据文件。
(2)打开文件:进入“文件”菜单栏,选择“打开”子菜单,可在DPS中打开一个已经存在的数据文件。
它可以是DPS的数据文件,也可是文本文件或Excel数据文件。
(3)保存文件:进入“文件”菜单栏,选择“保存”命令,可保存当前数据文件。
如果选择“另存为”,可将当前工作簿存为一个新的文件。
1.3.2 数据的输入
(1)手动输入
建立一个新的DPS文件之后,便可进行数据的输入操作。
DPS中以单元格为单位进行数据的输入操作。
一般用上下左右光标键,Tab键或用鼠标选种某一单元格,然后输入数据。
DPS数据通常可分为数值型、字符型、日期型3种类型。
DPS软件可根据输入数据的格式自动判断数据属于什么类型。
如日期型的数据输入格式为“月/日/年”、“月-日-年”或“时:分:秒”。
要输入数据由数字与小数点构成,DPS自动将其识别为数字型。
要注意的是,数据统计分析要求是数值型的,数值型数据字体显示是蓝色的,而字符型数据是黑色的。
(2)复制生成数据
DPS数据也可由复制生成。
实际上,在生成的数据具有相同的规律性的时候,大部分的数据可以由复制生成。
可以在不同单元格之间复制数据,也可以在不同工作表或不同工作簿之间复制数据,可以一次复制一个数据,也可同时复制一批数据,为数据输入带来了极大的方便。
这和常用的Excel电子表格操作类似。
另外,数据的剪切、复制和粘贴,是和Windows其它应用程序共享数据的有力工具,可以通过这种方式和Word,Excel,SPSS等其它应用程序互相交换数据:如可将数据从Excel表格里面复制过来,进行统计分析,然后将统计分析得到的结果通过复制的方式,放到Word里面形成统计报告,
(3)公式生成数据
DPS数据也可由公式直接生成。
例如:在当前工作表中A1和B1单元格中已输入了数值数据,欲将A1 与B1 单元格的数据相加结果放入C1单元格中,可按如下步骤操作:用鼠标选定C1单元格,然后输入公式“=A1+B1”或输入“=SUM(a1:b1)”,回车之后即可完成操作。
C1 单元格此时存放实际上是一个数学公式“A1+B1”,因此C1单元格的数值将随着A1、B1单元格的数值的改变而变化。
DPS提供了完整的算术运算符,如+(加)、-(减)、*(乘)、/(除)、^(指数)和丰富的函数,在DPS公式输入的帮助中可以查到各类算术运算符和函数的完整使用说明。
1.3.3 数据统计分析及其建模基本步骤
1. 数据统计分析基本步骤
(1)将数据编辑之后,进行统计分析之前,须将分析数据定义成数据块。
在数据块中的数据一般是一行为一个记录(样本),每个记录有多个变量,各个变量因子可用x1,x2,…,x m表示参与运算。
图1-2为被定义的一个数据块,它有7个变量,21个样本。
图1-2 数据编辑与定义格式图
数据块的定义最通用的方法是将鼠标位置移到数据块的块首,按下左钮并拖动鼠标到数据块的块尾位置,然后松开按钮,即可完成数据块的定义。
如在按下Ctrl键时再按下并拖动鼠标,则可定义第二个数据块。
此外,如果要选定某行或列的连续数据区域,还可单击区域的第一个或最后一个单元格,然后按下 SHIFT 键,并双击与选定单元格区域方向一致的单元格。
公式块的定义方法是将鼠标位置移到公式块的块首,按下右钮并拖动鼠标到公式块的块尾位置,然后松开按钮,即可完成公式块的定义。
(2)进入菜单选择相应的统计功能项。
(3)当光标位于菜单上相应功能项时点击鼠标按钮,系统即对数据矩阵块内的数据进行分析,并将分析结果返回到编辑器中,系统也返回编辑状态。
2.数学模型分析的基本步骤
(1)在电子表格中编辑和定义数据矩阵块。
数据编辑格式一般以列代表变量,以行代表样本,并拖动鼠标定义数据块。
这时灰色背景部分即为可进行统计分析的数据矩阵块。
(2)在下部的文本编辑器中编辑和定义数学公式。
公式中用“x +数字”表示数据块中某列数据,用“c+数字”表示模型中待求参数。
例如,将测定的某种肉鸡在良好生长过程的数据资料,按图1-3方式编辑,定义数据块,块中的第1列数据为测定时间(周),为自变量,第2列数据是体重(kg),为因变量。
若对这两列数据建立Logistic 模型1a bx K y e
+=+,只需令c 1=K ,c 2=a ,c 3=b ,并在编辑器中写入如下公式,再拖动鼠标定义公式块。
x 2=c 1/(1+exp(c 2+c 3*x 1)),
式中x 1和x 2表示数据块中第1、2列数据,c 1,c 2,c 3表示模型的待求参数。
(3)进入菜单操作,在菜单下选择“数学模型”®“单因变量模型参数估计”®“麦夸特法”,即可求解模型参数及有关统计量的分析结果(图1-3)。
定义数据
定义公式
分析结果
图1-3 数据统计分析建模示意图
第二章 基本统计分析
2.1 基本参数计算
试验资料经整理输入到DPS电子表格之后,用鼠标选中数据,按下鼠标右按钮,即可计算一系列的统计特征数。
如图2-1所示。
最常用的统计特征数是和(sum)、平均数(mean)、方差(variance)、标准差(standard deviation)、斜差(skewness)、峰态(kurtosis)等。
图2-1 基本参数运算
该运算也可在快捷工具栏或菜单下完成。
先在DPS处理平台上,将资料定义成数据块,然
后在工具栏中执行“基本统计参数”按钮,即可得到基本参数。
需要说明的是每次点击“基本
统计参数”仅仅针对试验的某一个指标运算,而不能同时运算多个指标。
主要参数应用范围及注意事项:
(1)算术均数
适用于呈正态分布的资料。
对其他分布资料在用函数变换后,经正态性检验符合正态分布后亦可用。
(2)标准差
常用于表示观察值间波动的大小,如精密度的大小。
当资料服从正态分布时,可结合均数估计正常值范围。
(3)标准误
常用于表示抽样误差的大小,可结合均数估计参数的可信区间。
(4)变异系数
常用于比较均数相差悬殊的几组资料的变异程度,或比较度量单位不同的几组资料的变异程度。
(5)标准差、标准误与样本含量的关系
S 标准差随着样本含量的增多逐渐趋于稳定;标准误随着样本含量的增多逐渐减小。
如均数的标谁误,当标准差不变时,与样本含量的平方根成反比;当样本含量不变时,与标准差成正比。
2.2 常用统计分布及DPS 统计函数
2.2.1 正态分布norm (x )
函数norm(x )即是计算正态分布的概率,亦即当随机变量x 满足N (0,1)分布时,求出小于x 值的概率。
例2-1 设x 服从N (0,1),试求:(1)p (x <0.64);(2) p (1.53≤x );(3) p ( -2.12≤x <-0.25)。
目前在数理统计分析中,求解上述概率是要查正态分布表的,根据查表结果求出上述分布函数。
而在DPS 平台上,可用函数形式直接求出。
例如对p (x <0.64)=Φ(0.64),在DPS 平台的计算状态下,输入“=norm(0.64)”,即可得到结果0.738914。
同理,p (1.53 x )=1-p (x <1.53)=1-Φ(1.53),输入“=1-norm(1.53)”即可得到其结果0.063008;p (-2.12≤x <-0.25) =Φ(-0.25)-Φ(-2.12),输入“=norm(-0.25)-norm(-2.12)”即可得到结果0.38429。
2.2.2 二项分布bin(n ,m ,p )
函数bin(n ,m ,p )可用于计算二项分布的概率,亦即进行n 次独立实验中出现事件a 不少于m 次的概率。
例如,某种生活用品的检验合格率为96%,现随机抽样100份,试求合格品在97份以上的概率。
根据二项分布原理,现n =100,p =0.96,m =97,由此可在DPS 处理平台上应用二项分布函数来求得。
在计算状态下输入“=bin(100,97,0.96)”,即可得到结果为0.42947557,即100份合格品在97份以上的概率为0.4295。
2.2.3 χ2分布函数probchi(n ,x )
例如,自由度n =20,卡方值为5时,其分布函数的计算只需在DPS 平台上键入“=probchi(20,
5)”,即可得到结果为0.000277。
如求它的上侧概率,即键入“=1-probchi(20,5)”,便可得到结果0.999723。
2.2.4 t 分布函数probt(n ,x )
例如,自由度n =4,t =1.5时的分布函数计算,只需在DPS 平台上键入“=probt (4,1.5)”,即可得到结果0.7920。
如求它的上侧概率,方法是键入“=1-probt(4,1.5)”,便可得到结果0.2080。
2.2.5 F 分布函数probf(n 1,n 2,x )
计算F 分布概率所定义的函数中,n 1是大均方自由度,n 2是小均方自由度,x 为随机变量,F 分布的显著水平a =1-probf(n 1,n 2,x )。
如n 1=4,n 2=1,x =0.4,其分布函数的计算,只需在DP 平台上键入“=probf (4,1,0.4)”,即可得到结果为0.189004。
第三章 单样本和两样本统计假设检验
3.1 单个样本平均数和总体均数差异检验
在实际研究工作中,往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。
已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。
基于正态分布的单样本检验有2种情形:
(1)总体方差已知情况下的单样本检验—u (z )检验
在总体方差已知时,构造u 统计量,服从标准正态分布,采用u 检验,u 统计量计算公式为
x u = 式中μ0为已知总体平均数,σ是总体标准差,n 为样本含量。
(2)总体方差未知情况下的单样本检验—t 检验
在总体方差未知时,对于小样本资料(n <30),需构造t 统计量,服从自由度df =n -1的t 分布,采用t 检验,此时t 统计量计算公式为
0x x t S μ-=
式中x S =n 为样本含量。
对于以上两种情形的统计检验,在DPS 系统中以工作表的形式提供给用户。
图3-1是DPS 为用户提供的单样本统计检验工作表。
用户操作时,首先打开单样本检验工作表(文件名 dps_test.cll),然后根据已知条件在相应工作表中填入所要分析的数据,即可得到相应统计量及其显著水平p 值。
图3-1 单样本统计检验工作表 例3-1 某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N (500,64) (单位,g)。
某日随机抽查10瓶罐头,得净重为505,512,497,493,508,515,502,495,490,510。
试分析装罐机当日工作是否正常?
由于总体方差是已知的,计算样本均数为502.7,样本数为10。
经验已知总体均数为500,总体方差为σ2=64,标准差为8。
在DPS 操作平台的单样本统计检验工作表(dps_test.cll )中填入相应数据,即可得到u 值为1.067,双侧检验p 值为0.2859>0.05(图3-1)。
表明当日装罐机工作是正常的。
当总体方差未知时,已知样本均数是181.52,而样本标准差是40,样本数是100。
经验已知总体均数是190。
当这些数据填入工作表(dps_test.cll )上部的相应输入框中,可立即得到t 值为2.12,双侧检验p 值为0.0365。
如果备择假设是样本均值是否小于总体,那么就需要看工作表中的单侧检验p 值,这里是0.0183,见图3-1所示。
3.2 样本率和总体率的比较
二项分布的重要应用是样本率和总体率的比较。
比较的方法有基于正态分布的大样本方法,和小样本时的精确方法两种。
(1)正态理论方法
当样本数量n 较大,且P 0和1-P 0都不太小,nP 0(1-P 0)≥5时,利用样本率的分布近似正态分布原理,可对样本率P 与已知总体率P 0比较,其检验统计量公式为
u =
根据u 值可计算其显著水平p 值。
(2)精确方法 正态理论方法仅当nP 0(1-P 0)≥5时才能应用。
当该条件不能满足时,可用基于二项分布的
精确检验方法计算。
如记X 是二项分布的随机变量,具有参数n 及p 。
令
p x 是观察到的事件数。
那么双侧检验时的概率p 值计算依赖于备择假设为x n =,
0p p ≤还是 0p p >。
如果 p ≤p 0,则p =2×Pr (X ≤x )= min[000
2(1)n
k k n k n k C p p -=-∑]
,1如果
p ≥p 0,则p =2×Pr (X ≥x )=min[002(1)n k k n k n k x
C p p -=-∑ ,1在DPS 系统中也是以工作表的形式提供给用户。
图3-2是DPS 为用户提供的对样本率和总体率差异进行检验的工作表。
用户操作时,先打开单样本检验工作表(文件名 dps_test.cll),然后在工作表中填入自己的数据,就可以立即得到统计量及其显著水平p 值。
图3-2 样本率和总体率差异检验工作表(文件名dps_test.cll)
对某疾病采用常规治疗方法的治愈率是45%,现改用新的治疗方法,随机抽取180名该3-2所示输入各大于5时,应该用基于二项分布的精确检验方法。
例如,设某一核能布资料处理类似,参见3下部分的大样本方法进行检验。
例如,某溶液原来当样本数量n 较大,nP 0(1-P 0)≥5时,可利用正态近似方法对样本率P 与已知总体率P 0比较。
例3-2疾病的患者应用新法进行治疗,治愈100人。
问新疗法是否比常规疗法更为有效?
根据nP 0(1-P 0)=180×0.45×0.55=44.55>5,故可用正态近似方法来检验。
当如图个指标后,即可得到样本率估计值等于0.556,统计检验的单侧备择假设p 值为0.0022。
即新法比常规疗法效果要好。
当样本较小,nP 0(1-P 0)不工厂中55~64岁男性中死亡13人而其中5人死于癌。
如果人口普查,死亡人中约20%的死亡者能归因于某种癌而死亡,问该核能厂因癌而死亡与总体的20%有无差异。
这里因样本较少,nP 0(1-P 0)=2.1,小于5。
故应该用精确检验方法。
检验时,如图3-2所示,在图的上部分工作区域内输入各个指标后,立即得到样本率估计值等于0.3846,统计检验的双侧备择假设p 值为0.1983。
即该核能厂中因癌死亡比例和一般人群相比,没有显著差异。
对于Poisson 分布资料而言,进行样本均数和总体均数比较时,和二项分单样本检验工作表(文件名 dps_test.cll)。
当样本观察数x 较大(>10)时,可使用图3-平均含细菌80个/mL ,以某低剂量的辐射后取1mL 培养得细菌40个,问该低剂量辐射是否有杀菌效果。
这里因为有杀菌效果,则细菌数有所下降,因此是单侧检验。
由于观察数较大,可用大样本方法。
在DPS 工作表中,只要在观察数下面输入40,在总体μ下面输入80,即可得到卡方值等于20.00,显著水平p 值等于0.0000(一般在文章中表达为p <0.0001)。
结论是低剂量辐射有杀菌作用。
图3-3 观察率和总均数差异检验工作表(文件名dps_test.cll) 当观察数较小时可用菌3/ml 。
某研究者3.3 两样本差异检验
t 检验方法对两个直接法进行检验。
例如据以往大量观察,某溶液有细个想了解该溶液放在5°C 冰箱中3天时间的细菌数量是否增加。
检查结果这时的细菌数是5个/mL ,试统计分析。
这里的样本均数是5,总体均数是3,在DPS 工作表中,只要在观察数下面输入5,在总体μ下面输入3即可得到结果0.184737。
注意这里需要的是单侧检验结果,即推断细菌数量是否有所增长。
如果只断定样本均数是否和总体均数是否相同(不考虑谁大谁小),这时应用双侧检验,其p 值是0.3695。
对于两个样本的检验,当样本数量较大时,可以假定样本呈正态分布,可用样本平均值的差异进行显著性检验。
两个处理平均数的检验实际上包括4个方面:①成对数据t 检验;②等方差两独立样本均值比较t 检验;③两样本方差相等性检验;④不同方差情形
下两个独立样本的t 检验。
在DPS 中,系统将同时给出这4个检验的结果,用户可根据自己的需要进行取舍。
3.3.1 成对数据平均数的比较
成对数据比较要求两样本各个观察值间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。
成对数据,由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以有效控制试验误差,具有较高的精确度。
在成对数据的比较分析中,可将各对数据的差数d 作为一个单组随机变量样本看待,差数的总体平均数记为μ。
如果两处理在效应上没有差异,则每对间的差数平均数d 应是总体平均差数μ=0的无偏估计量,即原假设H 0:μ=0。
检验μ=0的方法就是t 检验,计算
d d
d d t S S μ-== 式中,d 是每对数据的差数d 的平均数,d S 是平均差数的样本标准误差,其计算公式为
d S =式中,n 是匹配的数据个数,即差数的样本含量。
根据t 值,可检测其显著水平。
对于成对数据两样本的统计分析,只需在DPS 电子表格中将两个处理各个观察值对应输入,然后定义成数据块进行分析即可得到分析结果。
例3-3 为研究电渗处理对草莓果实中钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表3-1。
试分析电渗处理对草莓钙离子含量是否有影响? 表3-1 电渗处理对草莓钙离子含量的影响
品种编号
1 2 3 4 5 6 7 8 9 10 电渗处理X 1/ mg
22.2323.42 23.25 21.3824.4522.4224.3721.75 19.82 22.56 对照X 2/ mg 18.0420.32 19.64 16.3821.3720.4318.4520.04 17.38 18.42 操作步骤如下:
1) 进入DPS 数据处理平台,输入配对样本数据,如图3-4所示;
2) 将配对样本数据定义数据块;
3) 点击“试验统计”菜单,选择“两样本比较”中的“配对两处理t 检验”,即可得t 检验结果,如图3-5所示。
由分析结果可以看出,配对后的差数的均值为3.5180,标准误为0.42091,其差数95%的置信区间为2.5658~4.4702。
统计检验t 值等于8.3580,df =9,
p =0.0000,小于0.01,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。
图3-4 成对数据资料的输入。