统计软件DPS数据处理系统_简版
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中位数(值): 中位数是指观测值由大到小或由小到大依次排 列,居于中间位臵的数据。记作Me ( n为奇数) ( n为偶数) 在环境与资源研究中收集的数据,有时会比较 分散,个别是离群较远,所以,对比较分散的数据 往往要用中位数来表征平均特征。中位数不受极端 数值的影响,在总体标志值差异很大时,具有较强 的代表性。
定义数据块后点击按钮 ,或点“数据分析”→ “常用图表” →在图形选择对话框中选择图类型(2D、3D) → 下一步→ 显示 图形 →标出坐标轴代表的项目名称、符号、单位以及图题、图 注、图例等。 过程见下面图:
得到如下所示图: 选相应项作图。
Q--Q图 利用Q--Q图也可判断数据是否符合正态分布规律,即可作数据 正态分布检验。 在Q--Q图上,若所有数据散点分布在一条直线附近时,表明符 合正态分布,否则,不符合正态分布。
序号
9 10 11 12 13 14 15
x
0.4 0.43 0.42 0.41 0.39 0.39 0.4
2)试验设计菜单
完全随机及随机区组设计 完全随机分组(用于产生随机数) 单因素随机设计 二因素随机设计 正交设计 30个正交表 2水平互作设计
正交回归组合设计
3)试验统计菜单
次数分布及平均数比较
检验方法有: 3S法(3σ法)——数据要服从正态分布 狄克松(Dixson)法 格拉布斯(Grubbs)法——数据要服从正态分布
②异常值检验
例 对某物理量测量15次数据如下,检查有 无异常值.
序号
1 2 3 4 5 6 7 8
x
0.42 0.43 0.4 0.43 0.42 0.43 0.39 0.3
2.主要主菜单、 下拉菜单命令及应用
1)数据分析菜单 DPS 数据分析下拉菜单常用命令: ①基本参数估计 数据分析→基本参数估计 试验资料经整理后,可以计算一系列的统计指标,以说明资 料的特征和对资料进行进一步统计分析。
例:现取甜菜块根蔗糖 含量100个样本资料中 的40个,做基本参数 估计示例。 步骤: 将数据在电子表格区 (即数据编辑器)输入 后,定义成数据块, 然后点数据分析→ 基本参数估计。就 会立即得到基本参数: (见软件)
三、数据统计分析及其建模基本步骤 1.数据统计分析基本步骤 在DPS电子表格中输入数据 → 定义数据块 → 进入菜单选统计菜 单,执行统计分析。 定义数据块:将鼠标移至数据块块首,按下左键拖到块尾位 臵即可。 2.数学模型分析基本步骤 1)在DPS电子表格中输入数据,在下方公式编辑区输入模型。 2)先定义公式块 → 再定义数据块 → 点数学模型 → 单因变量模型 参数估计 → 麦夸特法 → 当弹出“臵初值并用空格隔开”对话框 时选默认 → 选OK → 结束
完全随机设计
正交实验方差分析 二次回归(正交)旋转组合设计 二次通用旋转组合设计 二次多项式回归分析 新版本里几个设计,数据处理通用了 : 二次通用组合设计、 二次正交旋转设计、 二次正交回归设计, 做统计分析时如果不做区组,都在实验统计下拉菜单里的实验优 化分析→二次多项式回归分析操作。
DPS数据处理系统及应用 一、用户界面
公式编辑区:用于数学模型分析时,数学公式的编辑、定 义。 电子表格区(即数据编辑器):用于数据编辑和数据计算。 在此区内完成各种数据编辑和计算操作,输出统计结果。
1.系统主菜单
系统主菜单均有下拉菜单。当 把待分析的数据编辑好并定义 成数据矩阵块后,点击主菜单, 在其下拉菜单中选择相应的操 作即可。
回归分析 :
线性回归
4)多元分析
二次多项式逐步回归 多因子及互作项逐步回归 多因子及平方项逐步回归
5)数学模型
一元非线性回归模型(用于一元非线性回归)
单因变量模型参数估计
二、 t 检验
主要用于检验两个处理平均数差异是否显著。条件是要 求资料呈正态分布或近似正态分布。 1)单样本均数与总体均数比较的t检验
11.8
14.1 12.8 14.6 14.9 10.1 11.6
13.1
11.9 15.3 10.4 15 12.4 12.2
2
16.7 12.6 13.4 12.1 10.8 7.5
8.7
7.4 16.1 14.6 12.6 11.3 13.4
11
15.1 13.4
13
14.9 10.6
9.2
注意:复制过来的文本数据应该放在DPS系 统工作表的第一列里面,否则,不能转换。
2.字符串转换数值 DPS中,数据应在“英文数字”方式下输入。 如果忘记,在“全角、中文汉字输入方式下输入了字符型 全角数字,这些全角型数字,在单元格里显示呈黑色。DPS系 统不能对这些数据进行统计分析计算。 如果输入了字符型全角数字,解决方法: 点击数据编辑 →“字符串转换为数值”即可,
用于检验一个样本均数与总体均数差异是否显著。 例 随机测得7个儿童身高为:137,133,136,129,133, 130,131cm, 已知该班身高总体平均数为131cm,检验样 本均数与总体均数差异是否显著。
左偏(负偏)
标准正态分布
右偏(正偏)
△峰度 反映与正态分布相比,某一分布的尖锐度或平坦度。 峰值为正时(>0),表示相对尖锐的分布。 峰值为负时(<0),表示分布相对平坦。 峰值为0时,表示是标准的正态分布。
操作步骤: 先将待检验数据输入 →定义为数据块 →数 据分析 →异常值检验 →弹出异常数据剔除 检验对话框 →选一种检验分析方法和显著 水平 →确定。 如果有异常数据,则异常数据就会变为红色或 系统有具体提示。
DPS数据处理 系统及应用
DPS介绍
一、DPS 基本操作
1.文件基本操作 打开文件:可以打开DPS数据文件;文本文件;或 Excel数据文件 新建文件: 保存文件:
文件打印
2.数据输入和复制 1)数据输入 建立新的DPS文件后,便可进行输入数据操作,DPS中以单元格为 单位进行数据的输入,选中单元格即可输入数据。 DPS中数据类型分为3类:数值型;字符型;日期型。DPS根据输 入数据的格式自动判断数据属于什么类型。 如日期型的数据输入格式为:“月/日/年”、“月-日-年”或 “时;分;秒”。 如输入的数据由数字与小数点构成,DPS自动将其识别为数值型。 数据数据统计分析要求是数值型数据。数值型数据显示为蓝色。 字符型数据显示为黑色。
(3)平均偏差(adev) 平均偏差是描述个体值间的变异,即观察 值的离散度的指标之一。 平均偏差较小,表示观察值围绕均数的波 动较小,若平均偏差大,则观察值围绕均数的 波动较大。平均偏差计算式为:
(4)极差(Range) 极差描述个体值间差异变异范围,极差 越大,样本变异范围越大,反之,极差越 小,样本变异范围越小。 极差计算公式 :
3.数据删除,行列插入、删除 数据删除: 直接选中单元格数据→敲Delete删除 整行、整列插入、删除: 用鼠标选中单元格,点击插入行按钮 ,会在该单元格上方插 入一行。 用鼠标选中单元格,点击插入列按钮 ,会在该单元格左方插 入一列 用鼠标选中要删除的行,点击删除行按钮 ,可删除该行。 用鼠标选中要删除的列,点击删除列按 ,可删除该列。
12.6 6.5
7
14.1 11
基本参数估计输出结果中的基本参数: (1)总和(sum):样本数的总和 (2)均值(Mean):平均值,是分析计量资料的基本统计量,均 值表示一组性质相同的观察值的平均水平。 平均值包括:算术平均值、几何平均值、中位数。 在基本参数估计中的均值是指算术平均值。 计算式为:
基本参数估计时DPS正态性检验结果格式如下: 正态性检验(100个甜菜块根蔗糖含量的结果)
△偏度 表示以平均值为中心的分布的不对称度。 如果样本符合正态分布时,偏度参数(系数)等于0,此例中 偏度系数为 -0.6373,属于负偏态,P<0.01属于正态分布,但 不是标准正态分布,为左偏分布。 如果偏度系数大于1时,样本肯定不符合正态分布。
算术平均值主要适用于描述具有对称分布资料的集中趋势。 当数据为正态分布时常用算术平均值,在一组等精度的测量中, 算术平均值为最佳值或最可信赖值。
几何平均值: 它是n个观测值的连乘积开n次方的根,记作G
它用于反映对数正态分布或近似对数分布资料 以及等比级数资料的集中趋势。 对一组测量数值取对数,所得图形的分布曲线呈对称分布时,常 用几何平均值。
在DPS系统内,各因子都用x1、x2、… 、xm表示,所有常数都 用 c1、c2、 … 、cm表示。 所以,在数学模型分析时,要将方程中的自变量和因变量换成 x1、x2、… 、xm;将所有常数换成 c1、c2、 … 、cm。
四、图表处理 DPS常用图表处理 : 常用图表有二维和三维图,可以绘条形图、折线图、阶梯图、饼 图等。
但如果输入行数小于已有文件存放数据的最大行数时,系统 会提示如下。此时,应将行数增加。
二、文本转换数值及字符串转换数值 1.文本转换数值 当从其他文本编辑器复制数据到DPS的电子表格时,会 发现数据都是放在第一列里,而不是一个一个数据 分布在单元格里。原因是原来数据之间是用空格隔开 的,DPS不能自动识别这种格式,只能以字符串的格式 直接放进来。 解决方法: 点击数据编辑→“文本转换为数值”,可将文本行里的 各个数值分离开,放在后面各个单元格里
(5)方差(VAR) Variance 方差是衡量观察值间的离散程度。方差较小, 表示观察值围绕均数的波动较小。 方差小时,其估计值就比较可靠,方差越小指 标越稳定。 方差计算式 :
(6)标准差(SD) std. Deviation 它描述个体观察值间的变异程度的大小,即观察值的离散程度。 标准差较小,表示观察值围绕均数的波动较小,说明数据越集中。 标准差越大,说明数据越分散。可用标准差表示试验精度。标准 差小些好。 SD计算公式: 当观察值呈正态分布或近似正态分布时,可将均数及标准差同 时写出。如
点击工具栏的(设臵单元格格式)按钮,弹出“单元格属性” 对话框,可以改变当前数据块中的文字字体、字号、对齐方式等 格式。
2)数据复制 可以在不同单元格之间复制数据,也可以在不同工作表之间复制数 据。可以一次复制一个数据,也可以同时复制一批数据。 复制方法: (1)同word; (2)利用填充柄复制 即选中单元格数据,然后缓慢移动鼠标到单元格的右下角, 当鼠标形状变为黑色实心“十”字后,拖动鼠标到目标单元格即 可完成复制。
4.当前工作表规格定义 DPS工作表,每张表最大可为255列×65535行。在此 范围内,工作表大小可根据需要自己设定。 设定方法: 点击工具栏里的设臵表格行列数按钮 (或 点击数据编辑→表格尺寸), DPS会根据当前工作表的 大小给出一个工作表大小的缺省值对话框,
可以重新输入行列数,调整工作表的大小。
(7)标准误(SE) std. Error 标准误差 它描述样本均数变异程度及抽样误差的大小 ,即样本统计 量与总体参数的接近程度。 SE叫做样本平均数的标准误差,简称 为标准误。 标准误小,表示抽样误差小,则统计量较稳 定并与参数较接近。 可将统计量及其标准误同时写出,如
(8)变异系数(CV) 又称离散系数,是用于衡量一系列测定值的相对离 散程度的一种特征数。变异系数无单位。 变异系数是一个相对变异度量,它是样本的标准差与 均数的比值。变异系数CV小了好。
注意:a.两种单位不同的样本之间作变异程度比较时, 不能用标准差,要用变异系数。 b.平均数不同的两个样本也不能用标准差进行比较, 要用变异系数。 c.两个样本基数不一致或基数相差较大时,不能用 标准差,要用变异系数。
(9)正态性检验 正态性检验的目的就是要判定数据资料是否服从正态分布,或 样本是否来自正态总体。 正态性检验是检验各样本所属的总体参数差异显著性的前提 条件。 只有样本都来自正态总体或近似正态总体这个条件符合时, 才能用t检验法和F检验法来检验各样本所属的总体参数差异显著 性。 就是说,在统计分析前先要对数据进行正态性检验,只有当符 合正态分布时,才能进行进一步统计分析。