第六章 抽样方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 问题: – 简述该类抽样的基本操作步骤? – 顺序抽样的优点? – 顺序抽样的缺点? – 常用的顺序抽样方法有哪些?
知识要点
• 该方法简单且易于操作,应用较普遍。 • 抽样时选好一定的间隔,等距离抽取一定 数量的样本,计数样本内的个体数。 • 优点:简便,省时省工,样方在总体中分 布均匀。 • 缺点:选取的样本代表性较差,不同分布 的种群宜采用不同的顺序抽样方法。如果 选择的方法不适合,得到的平均值可信度 不高。
第六章 抽样方法
• • • • • • 各种取样工具 随机抽样 分层抽样 选择抽样 顺序抽样 多重抽样
生态学研究中的取样工具
பைடு நூலகம்
水体采 样工具
网捕
网捕
敲打振落法
诱集法
诱 捕
吸取式取 样工具
捕捉网
第一节 随机抽样 Random sampling
• 基本观点 – 抽样不受主观或其它因素的偏袒所影 响,即总体内所有个体都有同等被抽 出的机会。 • 下面这些抽样属于随机抽样吗?
选择聚集抽样的步骤:
(1)在研究区随机抽取一定数量的样方。 (2)在抽取的样方中选择含有研究个体的样 方。 (3)在每个选择样方周围进行继续选样,形 成多个网状样方组。 (4)继续选样直到选择的样方中不含有研究 个体数为止。 (5)进行种群密度及置信区间的估计。
参数估计
• 平均数估计
w x n
xi
x
j 1
m
所有样方中的平均个体数为:
ij
m
x
x
i 1
n
i
n
n
亚样方 基本样 基本样 基本样 基本样 方1 方2 方3 方4 46 33 27 39 亚样方1 m 亚样方2 30 21 14 31
亚样方3
平均
42
39.33
56
36.67
65
35.33
45
38.33
多重抽样数的确定方法
NO RANDOM !
A
B
C:在42个样方
中随意抽取5个 样方进行数量 调查?
一、随机抽样的步骤
• 抽样前对所有样方进行编号和定位。 • 确定需抽取的样方数。 • 在编好号的样方中随机抽取需要的样方数。 – 抽签法 – 随机数字法 • 对抽到的样方进行调查 Q:编号是按顺序编号好?还是随机编号好?
一、使用步骤
• 对研究区进行分层:按种群密度、地理 区域等划分。 • 在每层区域内采用随机抽样进行个体数 的调查。 • 计算每层区域的平均值和方差。 • 计算研究区种群总体的平均数和方差。 • 总体平均数置信区间估计。
二、参数估计方法
• 平均数的计算
x ST
N x N
h h
h
Nh:h 层的大小,即h层的总样方数
• 抽取的基本样方数?亚样方数? • 每个样方中理想的抽样元素数(亚样方 数 )m :
m
S S
2 2 2 U
基本样方内抽 样元素的方差 基本样方间的 方差组成
基本样方的方差:
S
2 1
n
(x
i 1
m
n
i
x)
2
n 1
( xij x i )
2
基本样方内抽 S 样元素的方差: 基本样方间方 差的组成:
(Wh S h )
2
四、如何进行分层?
调查区分几层,各层的界限如何确定?
• 一般不宜超过6层 • cum f 法(样方频率累积平方根法)
分层步骤
• 按一定标准对研究区进行级别划分,如水深、 密度、湿度等; • 统计在各级别区域内抽取的样方数(频次); • 计算各级别区域样方频次的平方根并累积; • 按下式计算各层的分界点的:
i
wi:第i个网状样 方组中的平均个 体数 n:为随机抽取的 样方数
• ••
•1 •
•• •
• • • •3 • • • •• •
•
w1=2/8=0.25 w2=2/5=0.4 w3=4/10=0.4 w4=1/5=0.2 x=(0.25+0.4 +0.4+0.2)/4= 0.3125
•4
••
•
• 方差估计
分界点的累 积平方根
max(cum f ) i L
水深 14 15 18 19 20 21 22 23 24 25 26
样方数 4 1 2 3 4 1 2 5 4 2 2
样方平方根 2 1 1.414 1.732 2 1 1.41421 2.23507 2 1.41421 1.41421
累积 河蚌数 2 34,128,13,0 3 27 4.414 361,4 6.146 0,5,363 8.146 176,32,122,41 9.146 21 10.56 0,0 12.796 9,112,255,3,65 14.796 122,102,0,7 16.210 18,1 17.625 14,9
h
h
ch )
• 各层抽样数:
N h Sh nh n N h Sh
• 标准误一定时,总抽样数n:
n
( Wh S h ch )( Wh S h / ch ) V (1 / N )( Wh S )
2 h
V=(d / t )2
• 各层抽样数:
抽样 花费 不明 时:
N h Sh n 2 nh n V (1 /N N )( W S ) S h h h h
• 下列情况可考虑 采用分层抽样 –研究区个体的 空间分布极不 均一时。如图 5-1。 –研究区的环境 异质性极高时。
• 分层抽样的优点 – 可适合于不同人员同时调查总体的不 同部分。 – 可对各亚群分别进行平均数和置信区 间的估计。 – 抽样时对不同亚群可区分对待。 – 可得到较精确的结果。
• 常用的顺序抽样方法有: –五点取样:适宜随机分布种群 –对角线取样:适宜随机分布种群 –棋盘式取样:随机和核心分布 –平行跳跃式取样:核心分布 –z字形取样:负二项分布 • 在统计上没有严格意义上的方差估计方法
五点取样
单对角线取样
双对角线取样
棋盘式取样
Z字形取样
平行跳跃式取样
第五节 多重抽样 Multistage sampling
抽样层 各层 大小
抽取 样方数
各样方中的 个体数
路边
草地 林地
10
12 20
5
6 10
0,4,10,1,5
2,0,0,1,0,3 0,0,4,0,1,2,0,6,0,2
试估计研究区车前草种群的密度?
路边平均密度=(0+4+10+1+5)/5=4株/样方
草地平均密度=(2+1+3)/6=1株/样方 林地平均密度=(4+1+2+6+2)/10=1.5株/样方
思考题
• 请说说哪些情形的生态学调查不需采用 分层抽样方法? – 研究区同质性很高时不需采用。 – 研究前不明白研究变量产生变异的来 源时,不宜采用。
第三节 选择抽样Adaptive sampling
• 在调查过程中,研究者有在已发现研究 对象的区域周围进行取样的倾向。 • 这种倾向在聚集分布和个体数相当少的 种群中表现更为突出。 • 选择性聚集抽样是选择抽样中的一种常 用方法。 • 该方法的准确性一般比随机抽样高。
• 抽样总成本C=c0+chnh – ch:在h层上抽一个样的开支 – nh:h层上抽取的总样方数 • 总开支一定时,以最小标准误为原则来 确定抽样数。 • 标准误一定时,以最小开支为原则来确 定抽样数。
• 总开支一定时,总抽样数n:
n
(C c0 ) ( N h S h / ch )
(N S
车前草密度=(4×10+1×12+1.5×20)/(10+12+20)=1.95
• 方差的计算
W S (1 nh / N h ) S nh
2 2 h 2 h
• 各层在总体中的权重值Wh。 – Wh=Nh / N • Nh:h层包含的样方数 • N:研究区的总样方数 • nh:h层的抽样数
• 最优分配法Optimal allocation
比例分配法
• 95%置信水平下需抽的总抽样数
n
4 Wh S d
2
2 h
• 按一定比例向每个层次亚群中分配抽样数。 –比例可以是人为规定的比例,如每层中抽取10 %的样方。 –比例也可按权重值。 –每个亚群中最少要抽2个以上样方。
最优分配法
• 考虑抽样成本,以最经济为依据。
二、 随机抽样参数的估计
• • • • • • 平均数:平均每样方中的数量 调查总体的总数X 平均数的方差 平均数的标准误 平均数的置信限 种群总个体数的标准误为:S x
NS x
第二节 分层随机抽样 Stratified random sampling
• 基本观点: – 先将总体划分为不重叠的亚群,亚群 的面积或形状大小可以不同。 – 总体中的个体数为各亚群中的个体数 之和,即N=N1+N2+…+NL(L为亚群 数 )。
2 2
i 1 j 1
n( m 1)
2 2
S S (S / M )
2 U 2 1
M为每个基本样方中的亚样 方单位个数
讨论题
• 对紫金山针叶松种群数量进行估计,你 认为可采取何种抽样方法? (针叶松在较高海拔区域分布多,但适 生性也较广)
• 多重抽样有多个水平,其两重抽样是基 础。 • 对抽样单位进行不同层次的划分,如林、 树、枝、叶(四重)。
问题?
• 多重抽样与分层抽样有何不同?
分层抽样是对研究区的分层,没有亚样方。 多重抽样是对样方的分层,形成亚样方。
参数估计方法
• 如选择n个样方,并在每一个样方中选取 m个亚样方(称为元素)进行调查。 • 第i个样方中所含生物个体的平均数为:
• 对由路边、草地和林地所组成的研究区 内车前草种群数量进行调查。经测定三 种区域的大小分别为:路边由10个1m2的 样方组成,草地由10个2m2的样方组成, 林地由10个4m2的样方组成。则三种类型 地的权重分别为:
1/7
2/7
4/7
三、各层中抽样数的分配方法
• 比例分配法Proportional allocation
• 在同一个取样单位(如样方)中进行多次亚 取样Subsample。 • 如,1000L水中浮游动物的数量,可随机抽 取100个1ml水,计数其中的浮游动物数量, 从而估计1000L水中的数量。 • 又如,调查枫树上蚜虫的数量,对选取的 每株枫树(抽样单位),随机抽取100张叶, 计数其上的蚜虫数,从而估计每株树上的 平均蚜虫量。
S
2
( w x)
i
2
n(n 1)
(有放回抽样,n 为抽取的样方数)
2
S
2
( N n) (wi x) (无放回抽 Nn(n 1)
样,N为总样方 数)
讨论题
• 哪些情形的种群调查不宜采用选择性聚 集抽样方法? –当大部分样方中均有一到多个研究个体 时不宜采用。
第四节 顺序抽样(自学3min) Systematic sampling
知识要点
• 该方法简单且易于操作,应用较普遍。 • 抽样时选好一定的间隔,等距离抽取一定 数量的样本,计数样本内的个体数。 • 优点:简便,省时省工,样方在总体中分 布均匀。 • 缺点:选取的样本代表性较差,不同分布 的种群宜采用不同的顺序抽样方法。如果 选择的方法不适合,得到的平均值可信度 不高。
第六章 抽样方法
• • • • • • 各种取样工具 随机抽样 分层抽样 选择抽样 顺序抽样 多重抽样
生态学研究中的取样工具
பைடு நூலகம்
水体采 样工具
网捕
网捕
敲打振落法
诱集法
诱 捕
吸取式取 样工具
捕捉网
第一节 随机抽样 Random sampling
• 基本观点 – 抽样不受主观或其它因素的偏袒所影 响,即总体内所有个体都有同等被抽 出的机会。 • 下面这些抽样属于随机抽样吗?
选择聚集抽样的步骤:
(1)在研究区随机抽取一定数量的样方。 (2)在抽取的样方中选择含有研究个体的样 方。 (3)在每个选择样方周围进行继续选样,形 成多个网状样方组。 (4)继续选样直到选择的样方中不含有研究 个体数为止。 (5)进行种群密度及置信区间的估计。
参数估计
• 平均数估计
w x n
xi
x
j 1
m
所有样方中的平均个体数为:
ij
m
x
x
i 1
n
i
n
n
亚样方 基本样 基本样 基本样 基本样 方1 方2 方3 方4 46 33 27 39 亚样方1 m 亚样方2 30 21 14 31
亚样方3
平均
42
39.33
56
36.67
65
35.33
45
38.33
多重抽样数的确定方法
NO RANDOM !
A
B
C:在42个样方
中随意抽取5个 样方进行数量 调查?
一、随机抽样的步骤
• 抽样前对所有样方进行编号和定位。 • 确定需抽取的样方数。 • 在编好号的样方中随机抽取需要的样方数。 – 抽签法 – 随机数字法 • 对抽到的样方进行调查 Q:编号是按顺序编号好?还是随机编号好?
一、使用步骤
• 对研究区进行分层:按种群密度、地理 区域等划分。 • 在每层区域内采用随机抽样进行个体数 的调查。 • 计算每层区域的平均值和方差。 • 计算研究区种群总体的平均数和方差。 • 总体平均数置信区间估计。
二、参数估计方法
• 平均数的计算
x ST
N x N
h h
h
Nh:h 层的大小,即h层的总样方数
• 抽取的基本样方数?亚样方数? • 每个样方中理想的抽样元素数(亚样方 数 )m :
m
S S
2 2 2 U
基本样方内抽 样元素的方差 基本样方间的 方差组成
基本样方的方差:
S
2 1
n
(x
i 1
m
n
i
x)
2
n 1
( xij x i )
2
基本样方内抽 S 样元素的方差: 基本样方间方 差的组成:
(Wh S h )
2
四、如何进行分层?
调查区分几层,各层的界限如何确定?
• 一般不宜超过6层 • cum f 法(样方频率累积平方根法)
分层步骤
• 按一定标准对研究区进行级别划分,如水深、 密度、湿度等; • 统计在各级别区域内抽取的样方数(频次); • 计算各级别区域样方频次的平方根并累积; • 按下式计算各层的分界点的:
i
wi:第i个网状样 方组中的平均个 体数 n:为随机抽取的 样方数
• ••
•1 •
•• •
• • • •3 • • • •• •
•
w1=2/8=0.25 w2=2/5=0.4 w3=4/10=0.4 w4=1/5=0.2 x=(0.25+0.4 +0.4+0.2)/4= 0.3125
•4
••
•
• 方差估计
分界点的累 积平方根
max(cum f ) i L
水深 14 15 18 19 20 21 22 23 24 25 26
样方数 4 1 2 3 4 1 2 5 4 2 2
样方平方根 2 1 1.414 1.732 2 1 1.41421 2.23507 2 1.41421 1.41421
累积 河蚌数 2 34,128,13,0 3 27 4.414 361,4 6.146 0,5,363 8.146 176,32,122,41 9.146 21 10.56 0,0 12.796 9,112,255,3,65 14.796 122,102,0,7 16.210 18,1 17.625 14,9
h
h
ch )
• 各层抽样数:
N h Sh nh n N h Sh
• 标准误一定时,总抽样数n:
n
( Wh S h ch )( Wh S h / ch ) V (1 / N )( Wh S )
2 h
V=(d / t )2
• 各层抽样数:
抽样 花费 不明 时:
N h Sh n 2 nh n V (1 /N N )( W S ) S h h h h
• 下列情况可考虑 采用分层抽样 –研究区个体的 空间分布极不 均一时。如图 5-1。 –研究区的环境 异质性极高时。
• 分层抽样的优点 – 可适合于不同人员同时调查总体的不 同部分。 – 可对各亚群分别进行平均数和置信区 间的估计。 – 抽样时对不同亚群可区分对待。 – 可得到较精确的结果。
• 常用的顺序抽样方法有: –五点取样:适宜随机分布种群 –对角线取样:适宜随机分布种群 –棋盘式取样:随机和核心分布 –平行跳跃式取样:核心分布 –z字形取样:负二项分布 • 在统计上没有严格意义上的方差估计方法
五点取样
单对角线取样
双对角线取样
棋盘式取样
Z字形取样
平行跳跃式取样
第五节 多重抽样 Multistage sampling
抽样层 各层 大小
抽取 样方数
各样方中的 个体数
路边
草地 林地
10
12 20
5
6 10
0,4,10,1,5
2,0,0,1,0,3 0,0,4,0,1,2,0,6,0,2
试估计研究区车前草种群的密度?
路边平均密度=(0+4+10+1+5)/5=4株/样方
草地平均密度=(2+1+3)/6=1株/样方 林地平均密度=(4+1+2+6+2)/10=1.5株/样方
思考题
• 请说说哪些情形的生态学调查不需采用 分层抽样方法? – 研究区同质性很高时不需采用。 – 研究前不明白研究变量产生变异的来 源时,不宜采用。
第三节 选择抽样Adaptive sampling
• 在调查过程中,研究者有在已发现研究 对象的区域周围进行取样的倾向。 • 这种倾向在聚集分布和个体数相当少的 种群中表现更为突出。 • 选择性聚集抽样是选择抽样中的一种常 用方法。 • 该方法的准确性一般比随机抽样高。
• 抽样总成本C=c0+chnh – ch:在h层上抽一个样的开支 – nh:h层上抽取的总样方数 • 总开支一定时,以最小标准误为原则来 确定抽样数。 • 标准误一定时,以最小开支为原则来确 定抽样数。
• 总开支一定时,总抽样数n:
n
(C c0 ) ( N h S h / ch )
(N S
车前草密度=(4×10+1×12+1.5×20)/(10+12+20)=1.95
• 方差的计算
W S (1 nh / N h ) S nh
2 2 h 2 h
• 各层在总体中的权重值Wh。 – Wh=Nh / N • Nh:h层包含的样方数 • N:研究区的总样方数 • nh:h层的抽样数
• 最优分配法Optimal allocation
比例分配法
• 95%置信水平下需抽的总抽样数
n
4 Wh S d
2
2 h
• 按一定比例向每个层次亚群中分配抽样数。 –比例可以是人为规定的比例,如每层中抽取10 %的样方。 –比例也可按权重值。 –每个亚群中最少要抽2个以上样方。
最优分配法
• 考虑抽样成本,以最经济为依据。
二、 随机抽样参数的估计
• • • • • • 平均数:平均每样方中的数量 调查总体的总数X 平均数的方差 平均数的标准误 平均数的置信限 种群总个体数的标准误为:S x
NS x
第二节 分层随机抽样 Stratified random sampling
• 基本观点: – 先将总体划分为不重叠的亚群,亚群 的面积或形状大小可以不同。 – 总体中的个体数为各亚群中的个体数 之和,即N=N1+N2+…+NL(L为亚群 数 )。
2 2
i 1 j 1
n( m 1)
2 2
S S (S / M )
2 U 2 1
M为每个基本样方中的亚样 方单位个数
讨论题
• 对紫金山针叶松种群数量进行估计,你 认为可采取何种抽样方法? (针叶松在较高海拔区域分布多,但适 生性也较广)
• 多重抽样有多个水平,其两重抽样是基 础。 • 对抽样单位进行不同层次的划分,如林、 树、枝、叶(四重)。
问题?
• 多重抽样与分层抽样有何不同?
分层抽样是对研究区的分层,没有亚样方。 多重抽样是对样方的分层,形成亚样方。
参数估计方法
• 如选择n个样方,并在每一个样方中选取 m个亚样方(称为元素)进行调查。 • 第i个样方中所含生物个体的平均数为:
• 对由路边、草地和林地所组成的研究区 内车前草种群数量进行调查。经测定三 种区域的大小分别为:路边由10个1m2的 样方组成,草地由10个2m2的样方组成, 林地由10个4m2的样方组成。则三种类型 地的权重分别为:
1/7
2/7
4/7
三、各层中抽样数的分配方法
• 比例分配法Proportional allocation
• 在同一个取样单位(如样方)中进行多次亚 取样Subsample。 • 如,1000L水中浮游动物的数量,可随机抽 取100个1ml水,计数其中的浮游动物数量, 从而估计1000L水中的数量。 • 又如,调查枫树上蚜虫的数量,对选取的 每株枫树(抽样单位),随机抽取100张叶, 计数其上的蚜虫数,从而估计每株树上的 平均蚜虫量。
S
2
( w x)
i
2
n(n 1)
(有放回抽样,n 为抽取的样方数)
2
S
2
( N n) (wi x) (无放回抽 Nn(n 1)
样,N为总样方 数)
讨论题
• 哪些情形的种群调查不宜采用选择性聚 集抽样方法? –当大部分样方中均有一到多个研究个体 时不宜采用。
第四节 顺序抽样(自学3min) Systematic sampling