数据处理总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
本课程的主要内容
一、资料的整理及统计分析
平均数
标准差
标准误
二、显著性检验
1. 平均数间差异显著性检验
2. F 检验法
三、相关与回归
四、试验设计
五、Excel 、DPS 统计软件系统
常用术语
1. 总体与样本
总体( polulation )是指根据研究目的确定的、符合指定条件的研究对象的全体。它是由相同性质的(个体)成员所构成的集团。样本( sample )是指从总体中抽取一定数量的个体所组成的集合。
2. 参数与统计量
参数( parameter )是指由总体计算的用来描述总体的特征性数值。它是一个真值,通常用希腊字母表示。如总体
平均数以□表示,总体标准差以b表示。
统计量( statistics )是指由样本计算的用来描述样本的特征性数值。
3. 误差与错误
误差( error )是指试验中由无法控制的非试验因素所引起的差异。它是不可避免的,试验中只能设法减少,而不能
消除。
错误( mistake )是指试验过程中人为的作用所引起的差错,在试验中完全可以避免。
4. 精确性与准确性
精确性( precision )是指试验或调查中同一试验指标或性状的重复观察值彼此的接近程度。
准确性( accuracy )是指试验或调查中某一试验指标或性状的观察值(统计量)与真值(或总体参数)之间的接近程度。
5. 试验指标
在某项试验设计中,用来衡量试验效果的特征量称为试验指标,也称试验结果。试验指标可分为定量指标和定性指标两类。
6. 试验因素试验中对试验指标可能产生影响的原因或要素称为试验因素,也称为因子。
7. 因素水平试验中试验因素所处的各种状态或取值称为因素水平,简称水平。
8. 试验处理试验中各试验因素的水平所形成的一种具体组合方式称为试验处理,简称处理,是在试验单位上的一种具体实现。
9. 试验单位
在试验中能接受不同试验处理的试验载体叫做试验单位。
10. 重复
在一项试验中,将1 个处理在两个或两个以上的试验单位上实施的称为重复。1 个处理所实施的试验单位数称为处理的重复数,或者说某个水平组合重复n 次试验,这个处理的重复数就是n。
试验设计应遵循的基本原则重复随机化局部控制第二章
第一节样品的采集与前处理
一、资料的来源
经常性记录
试验研究记录
调查记录
二、数据资料的类型
定量数据(数量性状)
定性数据(质量性状)
2.1 数量性状数据(定量数据)
数量性状的度量有计数和量测两种方式。
a 不连续性或间断性变量指用计数方法获得的数据。
b 连续性变量指称量、度量或测量方法所得到的数据。
2.2 质量性状数据(定性数据)定性数据是指能观察而不能度量的质量性状资料,如食品的颜色、果实表面是否有毛和酒的香绵等。
A 统计次数法一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。
B 计量表示法(给分法)给予每类性状以相对数量的方法
第二节数据的整理
1 连续性变量资料的次数分布表
具体步骤:
(1 )数据排序(sort)首先对数据按从小到大排列(升序)或从大到小排列(降序)。
求极差(range)所有数据中的最大观察值和最小观察值的差数,称为极差,亦即整个样本的变异幅度。
(2 )确定组数
100-200 9 —12
200-500 12 —17
> 500 17 —30
(3 )确定组距(class interval )
根据极差分为若干组,每组的距离相等,称为组距。
每组最大值与最小值之差称为组距。
组距=全距/组数=27/9=3
(4)选定组限和组中值
组中值确定后,就可以求得组限。每组有两个组限,数值小的称为下限,数值大的称为上限(5 )制作次数分布表
3质量性状资料的次数分布表
质量性状资料,也可以用类似次数分布的方法来整理。
在整理前,把资料按各种质量性状进行分类,分类数等于组数;
然后根据各个体在质量属性上的具体表现,分别归入相应的组中;
即可得到属性分布的规律性认识。
统计表由标题、横标目、纵标目、线条、数字及合计构成
统计表:简单表,复合表
统计图:条形图、折线图、饼图
离均差平方和((简称平方和
)SS
样本SS =
2
(XO
总体SS =
n
' (X j - x)2
i
n -1
样本均方是总体方差的无偏估计值
总体方差: 样本标准差: 总体标准差:
N
'•(X i」)2
2 _ _1 _________________
-N
' (x-x)2
;n -1
样本标准差是总体标准差的估计值。
样本均方:
统计意义:是指样本内独立而能自由变动的离均差个数。
标准差的计算方法:
A直接法
B矫正数法
一Ix(x-x)2 _ F X2-(送x):/n I n— 1
一:n 一1
C加权法
若样本较大,已生成次数分布表,可采用加权法计算标准差,其公式为:
上f i(x i —X)2理f j X j2 J ' f j X j)2 n s = [ 右_1 =[ n -1
s
CV 100%
X
变异系数
变异系数是一个不带单位的纯数,可用以比较二个事物的变异度大小。
(' x)2,'n
其中项称为矫正数,记作C