第七章 试验设计与统计分析
试验设计与统计分析绪论
它决定了观察记载的工作量
17
• 水平(level):因素的不同状态或者数量等 级
• 处理(treatment):试验中的具体比较项目
研究A1、A2、A3、 A4、 A5 不同品种的产量表现。 ➢处理数为:A1、A2、A3、 A4、 A5 5个处理
一、提供试验或调查设计的方法
试验设计这一概念有广义与狭义之分:
广义的试验设计是指试验研究课题设计 也 就是指整个试验计划的拟定,包含课题名称、 试验目的,研究依据、内容及预期达到的效果, 试验方案,供试单位的选取、重复数的确定、 试验单位的分组,试验的记录项目和要求,试 验结果的分析方法,经济效益或社会效益的估 计 , 已具备的条件 , 需要购置的仪器设备,参 加研究人员的分工,试验时间、地点、进度安 排和经费预算,成果鉴定,学术论文撰写等内 容。
品测定的结果,用y表示。
y=μ+ε
误差
ε= y-μ
观察值
处理真实值
25
1. 误差的种类
• 系统误差(systematic error)
准确性
指在相同的条件下,多次测量同一量时,误差的绝对
值和符号保持恒定,在条件改变时,则按某一确定的
规律变化的误差。理论上系统误差是可以消除的。
• 偶然误差(random error/spontaneous
研究不同品种(A1、A2、A3)在不同氮肥施用量 (B1、B2)下的产量表现。 ➢处理数为:A1B1、A1B2、 A2B1、A2B2、 A3B1、 A3B2 6个处理
18
(二)试验指标的试验效应
• 试验效应(experimental effect):试验 因素对指标所起的增加或减少的作用。
第七章 试验设计与统计分析
二级及二级以上的抽样就称为多层次抽样
多层次抽样方法适合于资源调查、传染病(寄生虫病)调查、 流行病学调查、经济学调查、遗传学试验、育种学试验, 等
(三)双重抽样法
当所研究的性状比较复杂,或所需经费较 多,或须将试验动物宰杀后才能测定,因 而不大可能进行重复性试验,或采用直接 抽样试验,或试验有较大的难度,可采用 双重抽样法
第七章 试验设计与统计分析
&7.1 抽样原理与方法
总体 n ∞
不可行
生物统计学的特点之一是其概率归纳原理,即通过对某 一特定的、具体的样本进行分析,在一定概率保证下 进行总体的推断。
例如,对水体污染进行检查,对空气质量检查, 不需要也不可能对整个水体、整个空气逐一进行检查, 只需要抽取一小部分的水、空气进行分析
被抽取的这一小部分水、空气就是样本 抽取水和空气的这一过程就是抽样
如何抽样? 抽样应当遵循什么原则? 什么样的样本才能认为符合标准?
抽样需遵循的总的原则是: 样本必须来自于所研究的总体 样本必须能代表所研究的总体 抽样方法必须与抽样目的相一致
抽样认真、抽样方法正确、客观,样本就具有代 表性;反之,抽样马虎、草率、武断、主观、 弄虚作假,样本就差,就不具有代表性
容量
n
4s2 L2
4 9.72 2.52
60.22 60
又例:总体的大致标准差为 15.9,调查允许误差为
L = 10,求调查所需样本容量
暂设 t0.05 1.96 2
则
n
4 15.92 102
10
由于 n 较小,因此应重求 n 值,查 t 值表,得
t0.05,101 2.262
则
n
样本单位群的抽取既可以用随机抽样法得到, 也可以有选择地取得
田间试验与统计分析 第七章 单因素试验设计与结果分析
77.4
38.7
10
34.4
38.0
72.4
36.2
11
34.8
30.8
65.6
32.8
12
36.4
34.4
70.8
35.4
CK4
35.8
27.0
62.8
31.4
马铃薯品比试验(间比法)的产量结果分析II
品种
CK1 1 2 3 4 CK2 5 6 7 8 CK3 9 10 11 12 CK4
各重复小区产量
575.11 480.38 480.38 413.51 480.38 553.35 505.36 480.38 474.14
位次
1 (5)
4 7 (5) 2 3 (5) 6
(二)间比法试验设计结果分析
例:有12个品系的马铃薯品比试验,另加—推广品种为对照,采 用2次重复间比法设汁,小区计产面积15m2。每隔4个品系设—对 照,田间小区排列和产量(kg/15m2)如下图所示,试分析各品系 的相对生产力。
第一节 顺序排列试验设计及结果分析
(一)对比法试验设计及结果分析 (二)间比法试验设计及结果分析
(一)对比法试验设计及结果分析
p22
1 CK 2
Ⅰ
3 CK 4
5 CK 6
7 CK 8
Ⅱ 7 CK 8 1 CK 2 3 CK 4 5 CK 6
Ⅲ 5 CK 6 7 CK 8 1 CK 2 3 CK 4
产量结果表I
品种 Ⅰ
A 26 CK 21 B 22 C 21 CK 24 D 30 E 26 CK 25 F 26
各重复小区产量 Ⅱ Ⅲ 总和 30 29 85 25 25 71 25 24 71 23 24 68 29 26 79 31 30 91 27 28 81 25 27 77 25 25 76
《试验统计与统计分析》全套课件579页
例如:产量、生长量等。 (2)定性指标:指不能用数据描述的性状。
例如:花色、果实的颜色等。
9、试验效应 (experimental effect): 指试验因素对试验指标所起的增加或减少
的作用。 10、简单效应 (simple effect):
指同一因素内两种水平间试验指标的差异。
第二章 科研课题申请书的拟定
◆ 科研课题可能的来源 ◆ 选定课题的准备工作 ◆ 申请书的主要格式及内容
一、科研课题可能ห้องสมุดไป่ตู้来源
1、国家根据各行业发展的需要所提出的研究任务
例如:国家、省级的自然科学基金、重点攻关、高新技 术引进专项等。
2、生产中急需要解决的问题
在各专业生产经营过程中,存在一些技术性亟待解决 的问题,这就要求科学技术人员要深入生产第一线找课题。
的研究和推广; 三.树木病虫害的综合防治。
2、科学研究的基本要求
一.试验目的要明确; 二.试验要有代表性和先进性; 三.试验结果要正确可靠 。
○ 在进行田间试验的过程中,必须严格控制试验条件,尽可能减少试验误差, 要努力提高试验的准确性和精确性,使试验结果正确、可靠。
准确度:指试验中试验处理的某一性状(产 量或其它性状)的观察值与其对应的真值的接近 程度。
一.树木、茶树都是多年生植物,生活周期长,研究周期长; 二.田间试验环境条件复杂,试验的误差大; 三.林业涉及的树种多、产品类型复杂; 四.茶叶试验不仅包括田间试验,还兼有工业性试验。
二、林业、 茶叶科学试 验的任务与 要求
一.林业、茶学科学试验的主要任务
一.品种改良; 二.林业、茶叶生产中的新技术、新方法
3、水平(level): 指每个试验因素的不同状态,或每个试验因素
试验设计与统计分析
副处理的重复次数比主处理多,所以,副处理比主处理试验 精度高。
试验精度要求高的因素 副处理
副区
试验精度要求低的因素 主处理
主区
一、裂区设计
A1
A2
A3
(1) 根据试验因素的重要性,明确因素的主次; (2) 根据试验的重复数将试验场地划分成与重复数相同的若干
区组。 (3) 在一个区组中,先按主因素的水平数划分出主区,安排主处
区组 Ⅱ 13.5 15.0 22.7 18.3 69.5 18.0 24.2 24.8 26.7 93.7
163.2
Ⅲ 13.2 15.2 22.3 19.6 70.3 20.5 25.4 28.4 27.6 101.9 172.2
TAB
xt
40.5 45.7 66.0 56.8 TA1=209.0 57.8 71.8 78.5 80.2 TA2=288.3 T=497.3
A×B平方和: SSAB SSt SSA SSB 18.70
副区误差平方和:SSe b SST -SSm -SSB SSAB 7.24
(2)平方和和自由度的分解
变异来源
主
区组
区
A因素
主区误差
副
B因素
区
A×B互作
副区误差
总变异
df n-1=2 a-1=1 (a-1)(n-1)=2 b-1=3 (a-1)(b-1)=3 a(b-1)(n-1)=12 abn-1=23
第二步,将主区因素A(肥料)的3个水平(高、 中、低)独立随机地排列在每个区组的3个主区中。
第三步,将各区组的每个主区划分为6个副区。
第四步,将副区因素B(品种)的6个水平1、2、 3、4、5、6品种独立随机地排列在每个主区的6个副 区中,即得裂区设计的田间排列。
试验设计及其统计分析
实验问题的合理解释(3)
• 或许会有人有疑问。 • 因为他的测量从来没有在夜间进行,甚至,在正午以外的
时间也没有进行过。 • 所以, (1)我们还不能认为这个实验已经完整地回答了问题。如
果在晚上进行测量,这个模型就被质疑了。
(2)有限的结论:天空在正午是蓝色的。
6. 如何用实验结论来描绘现实?
假设与模型
定义术语
• 实验是根据问题或假说来进行的。 • 以“天空是什么颜色的?为例来讨论如何设计实验。 • 首先需要定义术语: (1)定义颜色为“可见光” (2)定义“天空”。例如,仪器是指向正上方还是指向水 平线的?还是其它。
时间进程
• 在时间上进行多次测量叫做时间进程。可以用于了解任何 特定的点上的测量是否具有代表性,以及在不同的条件下 系统是否会发生基础性变化。
• 每5min测量一次。 • 在时间进程实施之前,科学家已对“天空是什么颜色的?”
预言了一个简单的答案。随着时间进程的发展,发现天空 不只是一个颜色;相反,它在时时变化着。因此,科学家 不能仅仅给出一个简单的结论来。而是,需要建立一个适 应这些数据的新模型。
• 连续测量7天。
重复
对照
• 首先需要有一个“仪器对照”,保证相应的波长是可以被 测量到的。需要阳性对照和阴性对照。
(1)提出一系列问题,如天空是蓝色的?绿色的?黄色的? 红色的?
(2)测量中午时所有可见光的波长。 (3)得出结论:天空是蓝色的。
实验问题的合理解释(2)
• 天空真的是蓝色吗? (1)连续测量。30天,27天是蓝色,3天是灰色的(阴天) (2)显著性检验:差异显著 (3)认为,“天空是蓝色的”正确。
例:用A1、A2 、 A3三种饲料喂鸡,每种饲料饲喂30只鸡。一 个月后称重。该如何操作?
【2024版】试验设计与统计分析教案
教学目的和要求
试验设计与统计分析是运用数理统计理论与方法研究农业科学研究和技术工作中,所需的试验设计设计、实施和试验资料统计分析方法的一门应用学科,是农学类、植物保护类专业的专业基础课。本课程在高等数学、概率论与数理统计等课程的基础上,介绍数理统计的基本概念和基本原理,讲解试验设计的基本要求、设计实施和试验资料统计分析方法,既涉及一些严谨的数学理论和方法,又紧密结合农业生产和科学研究实践。
从而保证数据资料的完整、真实和可靠。
第二节资料的整理(1学时)
一、试验资料的分类(连续性资料,离散性资料)
(一)数量性状的资料:(1)用计数方法获得的不连续或间断性变数;
(2)用量测方法获得的连续性变数。
(二)质量性状的资料:(1)用计数方法所得的资料;
(2)给予每类性状以相当等级方法所得资料。
教
学
试验误差的概念,试验误差的来源分为:(一)试验材料固有的差异;(二)农事操作和管理技术不一致;(三)土壤差异以及肥力不均、病虫害侵袭等。控制误差的途径
本章思考题
1.举例说明田间试验的特点和对田间试验的要求;
2.分析试验地土壤差异的特点,如何通过小区技术和试验设计控制土壤差异?
3.一个长江中下游地区的棉花品种试验,供试品种10个,采用四次重复随机区组设计,小区面积10平方米,试画出田间种植图。
作为农学类、植物保护类等专业专科生必修的一门专业基础课,教学目的是为进一步学习遗传学、作物栽培学、作物育种学等专业基础课和专业课奠定必备的基础,为开展农业科学研究和技术工作提供统计分析工具,同时,还要培养学生分析问题和解决问题的能力。要求学生掌握常用的统计分析方法,基本的试验设计方法,Excel的统计分析功能。
试验设计与统计分析 第七章 统计分析的基本原理
2、随机试验的特性 (1)试验可以在相同条件下多次重复进行; (2)每次试验的可能结果不止一个 ,并且事先 知道会有哪些可能的结果; (3)每次试验总是恰好出现这些可能结果中的 一个 ,但在一次试验之前却不能肯定这次试验 会出现哪一个结果。
三、概 率
1、概率的定义:
例:一批种子的发芽试验:
种子数n 10 20 50 100 200 500 1000
=0.97889
◆计算x取值所在区间的概率
例2、 x~N(10,52)求x取值为15至25的概率
解:依题意可知,变量x所在的总体的平均数 μ=10 ,标准差 σ=5,该总体不是服从标准的正态分布。所以必须先进行标 准化,将x变量转换成U变量 变量标准化转换:x U,变量U所在总体的 μ =0,σ =1 x 25 10 x 15 10 U 2= = =3 U1= = = 1 5 5
发芽数 m
发芽率 m/n
8
0.8
17
0.85
42
0.84
79
0.79
164
082
409
0.818
816
0.816
在相同条件下进行n次重复试验,如果随机事 件A发生的次数为m,那么m/n称为随机事件A的 频率(frequency);当试验重复数n逐渐增大时, 随机事件A的频率越来越稳定地接近某一数值 p , 那么 就 把 p称为随机事件A的概率。
0.0729
0.0081
0.00045 0.00005
q=0.1 n=5
3
2
1
0
X
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0
P(X=x)
p=q=0.5, n= 5
试验设计与统计分析 教学大纲
山西农业大学信息学院《试验设计与统计分析》教学大纲课程名称:试验设计与统计分析Experiment Design and Statistical Analysis课程编码:105011课程类别:专业基础课学时/学分:48学时/3学分适用专业:资环、环科等专业一、前言1、课程性质《试验设计与统计分析》,是数理统计学在生物科学领域的应用,主要涉及科学研究中的试验设计、抽样观测和统计推断,是一门应用数学。
课程还同时融入国际权威的SAS统计分析,通过上机处理试验实例的数据,巩固和加深理解所学统计原理及方法。
课程不仅讨论如何科学地设计试验,而且还讨论如何科学地收集数据、整理数据、分析数据、解释数据和做出结论,是从事科学研究必不可少的基础知识。
《试验设计与统计分析》是资环、环科专业的一门专业基础必修课程。
2、教学目标通过课堂讲授、课下作业和上机数据处理三个环节的教学过程,使学生掌握基本的试验设计与统计分析方法,掌握试验数据处理的程式步骤和技能。
3、教学要求针对试验设计与统计分析的学科特点,结合专业的性质,讲授课程时理论与方法并重,力图把统计原理讲解的清晰易懂,使学生了解典型内容的基本原理和方法,理解统计方法的理论背景,掌握一些基本技能,从而培养学生分析解决实际问题的能力。
4、先修课程高等数学、线性代数、概率论等二、课程内容绪论教学内容及总体要求:掌握:(1)试验设计与统计分析的概念、特点;(2)总体与样本、样本含量、参数与统计量的概念;(3)统计分析的基本要求。
了解:(1)试验设计与统计分析的作用及其主要内容;(2)试验设计与统计分析的发展概况;(3)错误与误差、准确性与精确性的概念。
教学目标:通过学习,使学生掌握试验设计与统计分析的概念、特点;总体与样本、样本含量、参数与统计量的概念;统计分析的基本要求。
教学方式方法建议:课堂讲授、课堂讨论学时:2学时一、试验在科学研究中的作用二、试验研究的一般程式及过程三、试验设计与统计分析的涵义四、试验设计与统计分析的必要性五、课程特点与学习方法六、常用术语和基本概念思考题:1、总体与样本、样本含量、参数与统计量的概念;2、统计分析的基本要求第一章田间试验设计(6学时)第一节田间试验设计基础1、田间试验设计概述2、试验设计中的基本概念第二节田间试验的种类1、按试验性质分类2、按因子多少分类第三节田间试验的特点和要求一、田间试验的特点二、田间试验的基本要求第四节试验误差与土壤差异一、田间试验的误差二、试验地的土壤差异三、试验地的选择和培养第五节田间试验设计原则一、重复二、随机排列三、局部控制第六节试验小区的控制技术一、试验小区的面积二、小区的形状三、重复次数四、对照区的设置五、保护行的设置六、重复区和小区的排列第七节常用的试验设计方法一、完全随机设计二、随机区组设计三、拉丁方设计四、巢式设计五、裂区设计掌握:(1)试验设计的概念、特点和基本要求、试验方案的拟定;(2)试验设计的基本原则、作用及其相互关系;(3)完全随机试验设计、随机区组设计的概念及其方法、特点和试验结果的统计分析方法;(4)试验研究中样本含量的估计。
试验设计与统计分析
二、试验资料的性质与分类
(一) 数量性状资料 数量性状(quantitative trait)的度量有计数和量测两种
方式,其所得变数不同。 1. 不连续性或间断性变数( discontinuous or discrete
variable ) 指用计数方法获得的数据。 2. 连续性变数( continuous variable ) 指称量、度量或测
一、 间断性变数资料的整理
每穗小穗数在15—20的范围内变动, 把所有观察值按每穗小穗数多少加 以归类,共分为6组,组与组间相差 为1小穗,称为组距。这样可得表2 形式的次数分布表。
从表2中看到,一堆杂乱的原 始资料表,经初步整理后,就可了 解资料的大致情况,另外,经过整 理的资料也便于进一步的分析。
则组距为179/12=14.9g,为分组方便起见,可以15g作为组距。
二、 连续性变数资料的整理
4. 选定组限( class limit )和组中点值( 组值,class value ) ➢ 以表3中140行水稻产量为例,选定第一组的中点值 为75g,与最小观察值75g相等;则第二组的中点值为 75+15=90g,余类推。 ➢ 各组的中点值选定后,就可以求得各组组限。每组 有两个组限,数值小的称为下限( lower limit ),数值大的 称为上限( upper limit )。上述资料中,第一组的下限为该 组中点值减去1/2组距,即75-(15/2)=67.5g,上限为中 点值加1/2组距,即75+(15/2)=82.5g。故第一组的组限 为67.5—82.5g。按照此法计算其余各组的组限。
第2章 数据的组织与表达
Arrangement and Presentation of Data
第7章 试验设计
因素与水平的选取方法 选择实验因素的原则: ①因素数目要适中 ②因素水平范围适当 ③实验指标要定量
虽然近代工程中,20-50个因素一 起试验并不罕见,但以7-8个因素为 宜,这样可以充分发挥试验设计方法 的效果。
选取因素时要特别注意交互作用: 这些因素同时改变时其效果超过单独 改变某一因素的作用。
只有按照科学的统计方法设计试验 得到的试验数据才能进行科学的分析 统计,得到客观有效的结论。
反之,如果试验设计存在缺点,一 大堆不符合统计学原理的数据可能毫 无作用,降低了研究的价值。
(4)均匀设计——大型试验
方开泰
王元
1978年方开泰研究员和数学家王元共同 提出的,在极多因素、极多水平大型试验中 发挥作用,航天工程、汽车工业、三峡工程 中得到广泛应用,近年来走向国际。
不了解均匀设计是试验研究方法是 不完整的。
方开泰
王元
1978年方开泰研究员和数学家王元共同提
出的,在多因素、多水平试验中发挥作用,航
天工程、汽车工业、三峡工程中得到广泛应用。
近年来走向国际。
D——均匀度偏差,越小表示分散性越好
刘文卿《实验设计》:
*表示两种不同的均匀设计表
*表示两种不同的均匀设计表
选取哪些因素进行试验研究显然需要深 厚的理论基础和丰富的实践经验。
正交试验一般应安排验证试验。
7.3 均匀设计
(极多因素水平的试验设计)
李云雁《试验设计与数据处理》P162
1978年方开泰研究员和数学家王 元共同提出的,在多因素、多水平试 验中发挥作用,航天工程、汽车工业、 三峡工程中得到广泛应用。近年来走 向国际。
李教材P166
错误提法
演示作业:P170第2题
试验设计与统计分析教案
《试验设计与统计分析》教案《试验设计与统计分析》教案(章节备课)《试验设计与统计分析》教案(章节备课)第二节 单个平均数的假设测验和区间估计(学时) 一、单个样本平均数的假设测验 (一)测验方法复习样本平均数的抽样分布知识: 1.从2已知的总体抽样,无论样本容量的大小,其样本平均数x 的抽样分布必做正态分布,具有平均数μμ=x 和方差n 22x σσ=。
2.从2未知的总体抽样,当样本容量足够大时(n>30),其样本平均数x 的抽样分布趋于近正态分布,具有平均数μμ=x 和方差n 22x σσ=。
3.从2未知的总体抽样,样本容量n<30时 ,其样本平均数x 的的抽样分布服从t 分布。
由抽样分布可知,单个平均数的假设测验方法有U 测验和t 测验两种:U 测验: σ2已知(无论n ≥30 ,还是 n <30 ),x -x u σμ=;σ2未知,但n ≥30(大样本),x s -x u μ=。
t 测验:从2未知的总体抽样,样本容量n<30时,x s -x t μ=。
(二)测验步骤 P42 例 讲解 二、总体平均数的区间估计参数的区间估计概念点估计和区间估计,置信区间和置信限,置信度的概念。
参数的区间估计原理 (一)符合u 分布的区间估计1.σ2已知2. σ2未知,但n ≥30(大样本) (二)符合t 分布的区间估计 P45 例 讲解三、影响估计误差范围的因素1. 样本容量 n ,n 越大,误差范围越小。
2. 显著水平a ,a 越小,ua(ta)越大,误差范围越大。
3. 样本标准差S ,S 越大,误差范围越大。
12和22已知或未知(假设12=22、12≠22)不受12和22的影响U-测验: 已知单个样本平均数 U-测验: 未知,大样本的假设测验 t –测验:未知,小样本平均数的假设测验 U-测验: 已知或未知,大样本成组数据 t –测验:未知,小样本1= 2t –测验:未知,小样本1≠2两个样本平均数的假设测验成对数据 t –测验np,nq<5时,通过二项展开式计算概率;单个样本百分数 5 <np,nq<30时,进行 u测验,但要矫正;的假设测验 np,nq>30时,进行u测验。
第七章 方差分析 《试验设计与统计分析》PPT课件
否定 H0
:
2 t
2,接
e
受H
A
:
2 t
2 e
;
• 即品种间变异在0.01水平上显著大于品种内
(即误差)变异,说明不同品种的单株鲜重在
0.01水平上有显著差异(P=2.05×10-)5。
• 在统计分析过程中,一般将自由度和平方 和分解及F检验结果,归纳整理成方差分析 表,并在F值右上角用“*”、“**”分别 标注=0.05和=0.01的显著性,如表7.3所示。
表7.3 不同饲草品种单株鲜重的方差分析表
变异来源 DF SS
MS
显著标准
P
F
F0.05(4,10) F0.01(4,10)
品种间
4 116010.3 29002.57 28.06** 3.48
品种内(误差) 10 10335.3 1033.53
总的
14 126345.6
5.99 2.05×10-5
|
t (dfe
)
亦即t t (dfe )
• 所以, FPLSD法实质上仍是t检验。
• 其中t,为显著水平为时,误差项自由度dfe 下的t临界值。
• 在t检验中,
• s x1 x2 为平均数差数的标准误,且
• 当n1=n2=n时,
s x1 x2
2se2 ; n
S 2 SS1 SS2 e df1 df2
第七章 方差分析
第一节 方差分析的意义
• 3个以上平均数间的差异进行显著性检验, 若仍采用t检验法两两检验,将存在以下三 方面的缺陷:
• 其一,检验过程非常烦琐。 • 其二,不能充分利用试验资料的全部信息,
精度不高。
• 其三,随着k的增大,犯第一类错误的概率 也将增加。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机抽样法有以下几种方法: 抓阄法 随机数字法 伪随机数字法
通过随机抽样法得到样本后,一般需计算样本的特 征数,用以估计总体参数
几乎所有调和试验都可以采用随机抽样法进行抽 样
(二)整群抽样和多层次抽样法
从总体中抽取数个样本单位群,对单位群内 的全部个体作全面调查,或用整个单位群 进行试验
样本单位群的抽取既可以用随机抽样法得到, 也可以有选择地取得
建立多元回归方程
建立回归方程的原则是其 r(或其绝对值)或 R 必须很大, 以表明用 x 或 xi 估测 y 其效果比较好
而较大的样本在调查或试验中仅测 xi 性状,并将这 一样本中所有被测个体的 xi 代入上述回归方程中 以求得相应的 y 估计值
这样获得的较大样本 y 的估计值,能达到一定的精
度 这一抽样方法即为双重抽样法
在整群抽样的基础上,对抽得的样本单位群不作全面调查, 或不是整个样本单位群进入试验,而是在样本单位中继续 抽取一定量的个体(数据)组成样本,这就是二级抽样
如果二级抽样得到的不是个体(或数据),而是更小的单位 群,再从中进行抽样,这就是三级抽样
以此类推
二级及二级以上的抽样就称为多层次抽样
多层次抽样方法适合于资源调查、传染病(寄生虫病)调查、 流行病学调查、经济学调查、遗传学试验、育种学试验, 等
且当总体的排序具有周期性变化,而这种周期性变 化恰好与抽样相重时,所得样本将严重失真
因此顺序抽样法一般不单独使用,而是与其他方法 结合,如可以和随机抽样法结合、与整群抽样法 结合,等等
样本容量小:样本代表性差,抽样误差 增大,统计推断的精确性降低
样本容量大:抽样误差小,增加人、财、 物等的耗费,延长试验时间
双重抽样法示意图:
总体
μ yi
xy
小样本
y=b0+Σbixi x
大样本
双重抽样法的适用范围:
遗传学试验、育种学试验、繁殖学试验、 生理生化学试验、疾病防治试验,等
双重抽样法的优点是:
对于复杂性状的调查或试验仅需破坏较小的样本 即能获得较大样本的精确性 当目标性状为破坏性性状时,这是唯一行之有效 的方法
这些性状称为辅助性状,用 xi 表示
从总体中抽取两个样本,一个大样本,一个小样本
先对小样本进行调查,或先用小样本进行试验,对这一小样
本既测 y 性状,同时也测 xi 性状,获得n 对 y 和 xi,并 建立 xi 与 y 的回归方程,最简单的回归方程就是只有一 个 xi 的简单回归方程,也可以是曲线回归方程,也可以
(三)双重抽样法
当所研究的性状比较复杂,或所需经费较 多,或须将试验动物宰杀后才能测定,因 而不大可能进行重复性试验,或采用直接 抽样试验,或试验有较大的难度,可采用 双重抽样法
采用双重抽样法,首先需将所需要进行 研究的性状定为目标性状(或称为靶性
状),用 y 表示,然后根据文献或其他
方法确定一个或几个简单易测、不具破 坏性、与靶性状相关性比较紧密的性状,
第七章 试验设计与统计分析
抽样需遵循的总的原则是: 样本必须来自于所研究的总体 样本必须能代表所研究的总体 抽样方法必须与抽样目的相一致
抽样认真、抽样方法正确、客观,样本就具有代 表性;反之,抽样马虎、草率、武断、主观、 弄虚作假,样本就差,就不具有代表性
试验、调查的目的不同,试验、调查 的方法不同、抽样的方法也不同
(四)顺序抽样法
顺序抽样法适合于总体不是很大、且较均质的 情况
将总体内的个体或数据按一定的规则顺序排列, 根据总体和样本的关系按一个比例从总体中 抽取一批个体或数值组成样本
例如,总体编号后按凡能被 15 除尽的个体或 数据抽取出来组成样本
当总体比较整齐、均质,而编号又是按随机的原则 进行的,则这一差异方法可最大限度地避免人为 的影响和干扰但顺序抽样法所得到的样本其统计 量是没有统计学意义的,也不能用来估计参数
例:已知一总体大致的标准差为 9.7,若规定在抽
样时允许存在 L = 2.5 的误差,求抽样时的样本
容量
n4L s224 2.95.27260.2260
又例:总体的大致标准差为 15.9,调查允许误差为
s n
其中,t 一般取1.96(置信度为 95%)
因此:
n t2
s2 L2
4s2 L2
显然,人为定出的允许误差越大,所需样本量就小
反之,人为定出的允许误差越小(即对试验的要求 的精确度越高),所需的样本量就越大
一般来讲,当所需要的样本量不大时(n<100), 应当进行反复试求,最后使得 n 稳定在某一个值 上,如果发现所得 n 偏大或偏小,还应当调整 L 值重求 n
随机抽样 简单随机抽样 整群抽样 分层抽样 双重抽样
顺序抽样 典型抽样
(一)随机抽样法
总体比较整齐、变异程度小、群体分布均匀,可用随 机抽样法
随机抽样法的原则是: 总体内每一个体(数据)都有同等的机会进入样本 样本中每一个体(数据)进入任何一个组的机会也是
相等的 随机抽样法可以完全排除个人的主观性 随机抽样法是最简单、最常用的抽样方法
的提高其效能将逐步下降
样本容量的确定原则和确定方法
总体有限、且很大时,同时主要抽样的代表性,样本可 占总体的千分之一到百分之一
总体不很大时,样本占总体的百分之五 在试验中,同一水平或同一组合的变异情况越严重,所
需样本越大,同一组合的供试样本越整齐,可适当减 少样本数
试验越规范,试验结束后使用的统计方法越严格, 所需样本数可适当减少
随着样本容量的增大,当样本容量大到一定程度
时,再增大样本容量,试验或调查其精确性的提
高就渐趋缓慢:
sx
s n
当标准差一定时,标准误的大小与样本容量的平
方根成反比,样本容量较小时,随着样本容量的
增长,标准误会急剧减小,但当样本容量大到一
定程度后再增大样本容量,标准误的减小将会变
得越来越慢,即继续增大样本容量,试验精确性
试验时,考虑的因子数越多,每一组合内的供试动 物数可少一些,单因子试验则每一水平内的供试 动物数应多一些
在不知道总体的大小和情况时,可以从试验要求的 精确性来考虑样本容量:
根据参考文献、他人或自己的经验、专业知识等人
为地定出一个样本平均值与总体平均值的离差,
即允许误差 L: L x
而
L tsx t