生物统计学第六章
生物统计学 第六章 统计假设检验

由假设检验做出的决策既可能犯“弃真错误”又可 能犯“取伪错误”。“弃真错误”称作假设检验的 “第Ⅰ类错误”,“取伪错误”称作假设检验的“第 Ⅱ类错误”。假设检验犯第Ⅰ类错误的原因是,在原 假设为真的情况下,检验统计量不巧刚好落入小概率 的拒绝区域,从而导致拒绝了原假设。
H 0 : 300,
H1 : 300
(1)取检验统计量 T
X 0 S n
~ t (9 1)
(2)给出显著水平 0.05
2
需要求
P{| T | t } 0.05
查表求得
t 2.306
2
拒绝域 I1 (,2.306] [2.306,)
( B) 0或 0 0 (C) 0或 0 0
二、假设检验的步骤 1. 提出原假设 H 0和备择假设 H 1
原假设又称零假设,是对未知总体参数做出的、正 待检验的假设。备择假设是对立假设,其含义是, 一旦否定原假设 H 0 ,这个假设 H 1 供你选择。
一般而言,若原假设 H 0 : 0 , 为总体某个参数,根据 具体问题,备择假设可有三种选择: (1) H 1 : 0 (2) H 1 : 0 (3) H 1 : 0 (1)称为双侧检验, ( 2) 、 (3)右侧、左侧检验 右侧检验和左侧检验统称为单侧检验。采用双侧检验还是单侧检 验,应视所研究的问题的性质而定。
引例 已知豌豆籽粒重量X服从正态分布 N (377.2,3.32 ). 在改善栽培条件后,随机抽取9粒,其样本平均重量
x 379.2m g,
若标准差不变,即 3.3, 问改善条件
以后是否显著提高了豌豆籽粒的重量?
生物统计学习题集答案

.. 生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为 连续 变量和 非连续 变量。
2 样本统计数是总体 参数 的估计量。
3 生物统计学是研究生命过程中以样本来推断 总体 的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了 古典记录统计学、 近代描述统计学现代推断统计学 3个阶段。
6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。
7 试验误差可以分为__随机误差 、系统误差 两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章 试验资料的整理与特征数的计算一、填空1 1 资料按生物的性状特征可分为资料按生物的性状特征可分为资料按生物的性状特征可分为_________数量性状资料数量性状资料数量性状资料__变量和变量和______变量性变量性状资料状资料__变量。
2 2 直方图适合于表示直方图适合于表示直方图适合于表示______计量计量计量 、、 连续变量连续变量__资料的次数分布。
3 3 变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即变量的分布具有两个明显基本特征,即__集中性集中性__和____离散性离散性离散性__。
4 4 反映变量集中性的特征数是反映变量集中性的特征数是反映变量集中性的特征数是______平均数平均数平均数______,反映变量离散性的特征,反映变量离散性的特征数是数是______变异数(标准差)变异数(标准差)变异数(标准差)__。
生物统计学3

2.样本相关系数
n
n
n
同样的有: ( yi y)2 ( yi yˆ)2 ( yˆi y)2
i 1
i 1
i 1
1
于是: N
n
( yi
i 1
y)2
1 N
n
( yi
i 1
yˆi )2
1 N
n
( yˆi
b)两个变量均为随机变量 如:林木胸径与树高之间的关系,对于同一胸径的的林木、胸高不尽相同,反过来对于同一 树高的林木,胸径也不尽相同,二者都是随机变量,且都存在相应的概率分布,这种两变量之 间的关系,称为相关关系(即不能确定谁依赖于谁)。
四.回归分析前提
线性、独立、正态、等方差
6.1 一元线性回
2 u
2
2 u
2 y
则称:
2 u
2 y
n
( yi y)(zi z)
i 1
cov(z, y)
n
n
(zi z ) ( yi y) 2
z y
i 1
i 1
为总体相关系数
说明:①| |≤1,| |1 线性关系紧密,| |0,线性关系不紧密。 ② >0,y 随z增大而增大,称正相关。
i 1
i 1
i 1
令:
n
u ( yˆi y)2 : 称回归平方和
i1
n
Q ( yi yˆi )2 : 称剩余平方和
i1
于是有 : Lyy u Q
得到如下检验方法:(原理省略)
生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。
2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46;第三章概率与概率分布3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值:(1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96;(5)P(-2.58<u≤2.58)。
【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。
3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值:(1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。
【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。
3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。
(1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率;(2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。
生物统计学 第六章 方差分析

������������������
������
F分布右尾从F 到+∞的概率为:
P( F F ) 1 F ( F )
F
f ( F )dF
方差分析
图6-1 F分布密度曲线
F分布的取值范围是(0,+∞),其平均值为������������ =1。 附表4列出了不同自由度条件下的右尾概率。 应用举例 当������������1 =3, ������������2 =18时,������0.05(3,18) =?? 方差分析
方差分析
第四步
列出方差分析表 方差分析表
平方和 (SS) 24.3215 0.0060 24.3275 自由度 (df) 3 16 19
变异来源 处理间 处理内 总变异
均方(MS) 8.1072 0.0004
F值 20268**
方差分析
5.多重比较 F检验的结果显著,仅说明k个平均数间有显著差异, 但不能说明哪些平均数间有显著差异。 定义:判断不同处理平均数两两间差异的显著性, 每个处理的平均数都要与其他的处理进行比较, 这个种差异显著性检验方法就叫做多重比较。 方法:主要有(1)最小显著差数法LSD,(2) 最小显著极差法LSR(q检验法和邓肯检验法)
方差分析
线性数学模型 ������������������ = ������ + ������������ + ������������������ ������������������ = ������.. + (������������. − ������.. ) + (������������������ − ������������. ) kn观测值的总变异=处理间的变异+处理内的变异 其中第i处理j个观测值分解为:全试验观测值总体的 平均数(������)、第i个处理的效应(������������ )和试验误差(������������������ )。 ������������������ 相互独立且服从正态分布,所以各处理A������ 所属总 体也服从正态分布N(������������ ,������ 2 )。 基本假定 效应的可加性、分布的正态性、方差 的同质性(各处理的方差相等)。
wjf生物统计学第六章PPT课件

Learning Is Not Over. I Hope You Will Continue To Work Hard
演讲人:XXXXXX 时 间:XX年XX月XX日
第六章 参数估计
• 参数估计(estimation of parameter):由 样本统计量估计总体参数。有点估计和区 间估计。
• 估计量(estimator):即估计总体参数的 统计量。
点估计
• 点估计(point estimator):用由样本数据所计 算出来的单个数值,对总体参数所做的估计。
• 作为点估计的统计量有:样本平均数y ,中位数 或众数。
• 好的估计量的条件:无偏性、有效性、相容性。
• 无偏估计量(unbiased estimator):如果 一个统计量的理论平均数,即它的数学期 望等于总体参数,这个统计量就被称为无 偏估计量。
• 有效估计量(efficient estimator):在样本 含量相同的情况下,如果一个统计量的方 差小于另一个统计量的方差,则前一个统 计量是更有效的估计量。
• 其中这个给定的概率值称为置信度或置信水平 (confidence level)。
• 这个建立起来的包含待估计函数的区间称为置信区 间(confidence interval):指总体参数值落在样本统 计值某一区内的概率;而置信区间是指在某一置信 水平下,样本统计值与总体参数值间误差范围。置 信区间越大,置信水平越高。划定置信区间的两个 数值分别称为置信下限(lower confidence limit,lcl) 和置信上限(upper confidence limit,ucl)
• 用数轴上的一段经历或一个数据区间,表示总体参 数的可能范围.这一段距
生物统计学 第六章 方差分析

该法是最小显著差数(Least significant difference) 法的简称,是Fisher 1935年提出的,多用于检验某一对 或某几对在专业上有特殊探索价值的均数间的两两比 较,并且在多组均数的方差分析没有推翻无效假设H0 时也可以应用。该方法实质上就是t检验,检验水准无 需作任何修正,只是在标准误的计算上充分利用了样 本信息,为所有的均数统一估计出一个更为稳健的标 准误,因此它一般用于事先就已经明确所要实施对比 的具体组别的多重比较。
xij i ij
它是方差分析的基础。
6.2 方差分析的原理
方差分析的基本原理是认为不同处理组的均数间 的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差 异,称为组内差异,用变量在各组的均值与该组内变 量值之偏差平方和的总和表示,记作 SS e ,组内自由度 df e 。 (2) 实验条件,即不同的处理造成的差异,称为组间 差异。用变量在各组的均值与总均值之偏差平方和表 示,记作 SSt ,组间自由度 df t 。 总偏差平方和 SST SSt SSe 。
6.1 方差分析的相关术语
研究马氏珠母贝三亚、印度品系在不同地区的生 长差异,选择同一批繁殖的两品系马氏珠母贝的稚贝, 分别在海南黎安港、广东流沙港、广西防城港三个海 区进行养殖,每个地区每个品系养殖1000个,1年后 测定马氏珠母贝壳高与总重,比较生长差异。 这里壳高与总重称为试验指标,在试验中常会测定 日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生 理生化和体型指标(如血糖含量、体高、体重)等,这些 都是试验指标,就是我们需要测量的数据。
6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。
生物统计学-方差分析ppt课件

精选课件
16
一、相关术语
• 试验单位(Experimental unit):试验载体,即根据研 究目的而确定的观测总体
• 重复(Repetition):一个处理实施在两个或者两个以 上的试验单位上,称为处理有重复。 试验单位数称为处理的重复数
精选课件
17
二、方差分析的基本原理
方差分析是关于k(k≥3)个样本平均数的假设测
2)由于只能大于30mm才能合格,故单尾检验
解:(1)假设 H0:030,即该棉花品种纤维长度不能达到
纺织品生产要求含量。对 HA:0
(2)选取显著水平 0.05
(3)检验计算 s s 2.5 0.125
x n 400
x 3.023.00
u
1.6
s
0.125
x
(4)推断 u<u0.05=1.64, P>0.05 ,显著水平上接受H0,拒绝HA。
精选课件
9
方差分析由英国统 计学家R.A.Fisher首创,
为纪念Fisher,以F命名, 故方差分析又称 F 检 验 (F -test)。用于推
断多个总体均数有无差 异
精选课件
10
方差分析的定义
方差分析是对两个或多个样本平均数差异显著性 检验的方法。它是将测量数据的总变异按照变异 来源分解为处理效应和试验误差,并做出其数量 估计。
株号
1 2 3 4 5 和
表 2-1
Ⅰ 64.6 65.3 64.8 66.0 65.8 326.5
5个小麦品系株高调查结果
株
高
Ⅱ
64.5 65.3 64.6 63.7 63.9 322.0
Ⅲ
76.8 66.3 67.1 66.8 68.5 336.5
生物统计学复习资料(整理)

生物统计学复习资料第一章1.生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性3)提供由样本推断总体的方法4)提供试验设计的一些重要原则3.总体:具有相同性质的个体所组成的集合4.个体:组成整体的基本单元5.样本:从总体中抽出的若干个体所构成的集合6.变量:相同性质的事物间表现差异性的某项特征。
按其性质分为连续变量和非连续变量。
变量可以是定量的,也可以是定性的。
7.连续变量:表示在变量范围内可抽出某一范围的所有值8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:对总体特征的度量11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:试验因素相对独立的作用13.误差:是试验中不可控因素所引起的观测值偏离真值的差异14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:是指在试验过程中,人为因素所引起的差错。
17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章1.次数分布:在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在5.质量性状资料的方法:统计次数法,评分法统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数给分法:给予每类性状以相对数量的方法。
生物统计学第五版第6章课后题答案完整版

生物统计学第五版第6章课后题答案完整版1、自由生活的扁形动物是()[单选题]A.绦虫B.血吸虫C.涡虫(正确答案)D.华枝睾吸虫2、蒸腾作用是植物体重要的生理活动之一。
以下相关叙述错误的是[单选题] * A.水可以通过叶片的气孔散失到大气中B.蒸腾作用为水和无机盐运输提供动力C.蒸腾作用有助于降低叶片表面的温度D.植物在不同条件下蒸腾速率是相同的(正确答案)3、21.下列关于“探究发生在口腔内的化学消化”实验的叙述,错误的是[单选题] * A.充分反应后滴加碘液,乙试管中液体变蓝(正确答案)B.唾液腺分泌的唾液中合有淀粉酶C.两试管置于37 ℃条件下反应一段时间D.淀粉液与清水或唾液应充分混合4、细胞膜的完整性可用台盼蓝染色法进行检测[判断题] *对(正确答案)错5、细胞间的信息交流大多与细胞膜的结构和功能有关[判断题] *对(正确答案)错6、下列身体变化中,不属于青春期生理特点是的()[单选题] * A.身高体重迅速增长B.身体腹部明显发胖(正确答案)C.心肺功能明显增强D.身体出现第二性征7、控制物质进出人体肝脏细胞的结构是() [单选题] *A.细胞壁B.细胞膜(正确答案)C.细胞质D.细跑核8、蚯蚓一般生活在潮湿、疏松的土壤中。
它进行气体交换依靠的是()[单选题] *A.刚毛B.湿润的体表(正确答案)C. 环带D.体节9、蝉蜕是昆虫在生长发育过程中特有的()[单选题]A.身体由小长大的现象B.发育过程中逐渐长大的现象C.外骨骼脱落的蜕皮现象(正确答案)D.昆虫在进行生殖交配的现象10、67.2021年2月,新版《国家重点保护野生动物名录》颁布,下列四种都是此次新增或提升保护级别的动物,其中属于爬行动物的是[单选题] *A.怒江金丝猴B.棱皮龟(正确答案)C.猎隼D.君主绢蝶11、水螅的身体呈()[单选题]A.两侧对称B.前后对称C.辐射对称(正确答案)D.不规则形态12、下列各组疾病中与激素均有关的一组是()[单选题] *A.夜盲症、呆小症、侏儒症B.巨人症、糖尿病、坏血病C.呆小症、糖尿病、侏儒症(正确答案)D.佝偻病、贫血症、巨人症13、生理功能不同的人体细胞吸收葡萄糖的方式可能不同[判断题] *对(正确答案)错14、质壁分离彻底复原后的细胞,将不再吸水,此时细胞液的浓度与外界溶液的浓度相等[判断题] *对错(正确答案)15、下列各项中,属于特异性免疫的是( )A.皮肤和黏膜阻挡病原体侵入人体B.抗体抵抗相应的病原体(正确答案)C.唾液中的溶菌酶使病菌溶解D.体液中的吞噬细胞将病原体吞噬16、8、“螳螂捕蝉,黄雀在后”主要描述了生物之间的()[单选题] * A.共生关系B.捕食关系(正确答案)C.竞争关系D.合作关系17、达尔文进化论的核心内容是()[单选题] *A.自然选择学说(正确答案)B.遗传变异理论C.大量繁殖学说D.生存竞争理论18、鱼类、鸟类和哺乳动物的共同特征是()[单选题]A.都能生活在陆地上B..体温恒定C.都用肺呼吸D.都有由脊椎骨构成的脊柱(正确答案)19、蚯蚓身体表面生有许多刚毛,其作用是()[单选题] *A.协助运动(正确答案)B.刺杀小动物C. 抵抗敌害D.减少运动时的阻力20、固醇类激素进入靶细胞的过程属于主动运输[判断题] *对错(正确答案)21、22、下列有关毛细血管的叙述,与物质交换功能无关的是()[单选题] *A.管壁由一层上皮细胞构成B. 连通最小的动脉和静脉之间的血管(正确答案)C.管内的红细胞呈单行通过D.管内血流速度最慢的血管22、25.(2021·湘潭)橘子是生活中常见的水果。
第六章 方差分析 华中农业大学生物统计学讲义

报警器型号
A1(甲型) A2(乙型) A3(丙型) A4(丁型)
反应时间
∑ xi
5.2 6.3 4.9 3.2 6.8 26.4 5.28 7.4 8.1 5.9 6.5 4.9 32.8 6.56
3.9 6.4 7.9 9.2 4.1 31.5 6.30
12.3 9.4 7.8 10.8 8.5 48.8 9.76
假定有k组观测数据,每组有ni个观测值
处理 重复 1 2 … i … k
1
x11 x21
…
xi1
… xk1
2
x12 x22
… …xi2
… xk2
… …… …… ……
j
x1j x2j
…
xij
… xkj
… …… …… ……
ni
x1n1 x2n2
…
xini
… xknk
平均
x1
x2
…
xi
…
xk
x
方差
S12 S22
试问(1)各种型号报警器的反应时间有无显 著差异? (2)如果各种型号报警器的反应时间有显著 差异,那么何种最优?
分析: 因素是报警器的型号,记作A;
因素A的不同水平是各种具体的型号:甲型 乙型、丙型、丁型,分别记作A1,A2,A3,A4; 我们关心的指标值是反应时间.在方差分析中 我们主要希望解决下面两个问题: (1)因素对指标有无显著影响?(2)若因 素有显著影响,取何种水平时指标值最优?
缺点
1.检验过程烦琐。
试验包含4个处理
t 检验: C42 = 6次
2.推断的可靠性低,检验时犯α错误概率大。
t检验: C42 =6次
6次检验 相互独立
08生物统计学第6章2

第六章 相关与回归分析(2)
第六章 相关与回归分析
第一节 第二节 第三节 第四节 变量间的相关关系 一元线性回归 多元线性回归 可化为线性回归的曲线回归
学习目标
1. 掌握相关系数的含义、计算方法和应用 2. 掌握一元线性回归基本原理和参数最小二乘 估计方法 3. 掌握回归方程的显著性检验 4. 利用回归方程进行预测 5. 掌握多元线性回归分析的基本方法 6. 了解可化为线性回归的曲线回归 7. 用 Excel 和 SPSS进行回归分析
b0
b <0
30
几种常见的非线性模型
S 型曲线
1. 基本形式:
2. 线性化方法 令:y' = 1/y,x'= e-x, 则有y' = + b x'
3. 图像
31
非线性回归
(实例)
【例6.6】为研究某水体中藻类密度与水质指标 A之间的关系,记录数据如下表。试拟合适当 的模型。
水藻密度与水质指标A的关系
Ô Ã ¶ å Ü È
6000
33
非线性回归
(实例)
1. 用线性模型:y =b0b1x+ ,则有
y = 2.671+0.0018x 2. 用指数模型:y = b x ,则有 y =4.05(1.0002)x
3. 比较: 直线的残差平方和=5.3371<指数模型的残差 平方和=6.11。 直线模型略好于指数模型。
ˆ ˆ ˆ ˆ ˆ y b 0 b1 x1 b 2 x2 b p x p
ˆ ˆ ˆ ˆ b 0 , b1 , b 2 ,, b p 是 估计值 ˆ y 是 y 的估计值
b 0 , b1 , b 2 ,, b p
生物统计学第6章

ANOVA基本步骤
生物统计
Chap.6 Analysis of Variance I
• 零假设:处理无效( 1= 2= 3= 4) • 备择假设:处理有效(至少两个均数不等)
• 基本计算(1): X i. X i.
X .. X
• 基本计算(2): SST SSE SSA dfT dfA dfE
组内变异: 由于同组内的个体来自同一总体(接受同
一处里),因此组内变异仅仅是由于个体之间的 随机误差造成。 组间变异:
不同组个体间的变异,除了个体之间的随机 误差以外,还包括不用处理(不同的组来自不用 总体)所造成的差异。
方差分析法的基本思想:
组间变异 组内变异
检验统计量
比较组间变异和组内变异,如果组间变异显
误差均方
• 显著性水平:
c
总的一型错误概率 需要比较的次数
饲料
1 2 • 34例
增重 57 42 60 37 54 13 33 19 39 41 13 29 20 15 13 18 22 13 24 38
N = 20, X·· = 600, X
生物统计
Chap.6 Analysis of Variance I
dfT N 1 32 1 31
dfE N k 32 4 28 dfA k 1 4 1 3
定义统计量 均方(MS) 平方和自由度
MSA
SSA df A
85.8563 3 16.855, MSE
SSE dfE
47.5409 1.6979 28
实例-小鼠脾脏
生物统计
Chap.6 Analysis of Variance I
生物统计
Chap.6 Analysis of Variance I
生物统计学答案 第六章 参数估计

第六章参数估计6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]:y/(μg · L-1)s/(μg · L-1)n对照组 4.20 0.35 125-羟色胺处理组8.49 0.37 9建立对照组和5-羟色胺处理组平均数差的0.95置信限。
答:程序如下:options nodate;data common;alpha=0.05;input n1 m1 s1 n2 m2 s2;dfa=n1-1; dfb=n2-1;vara=s1**2; varb=s2**2;if vara>varb then F=vara/varb;else F=varb/vara;if vara>varb then Futailp=1-probf(F,dfa,dfb);else Futailp=1-probf(F,dfb,dfa);df=n1+n2-2;t=tinv(1-alpha/2,df);d=abs(m1-m2);lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2));ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2));k=vara/n1/(vara/n1+varb/n2);df0=1/(k**2/dfa+(1-K)**2/dfb);t0=tinv(1-alpha/2,df0);lcldmsun=d-t0*sqrt(vara/n1+varb/n2);ucldmsun=d+t0*sqrt(vara/n1+varb/n2);cards;12 4.20 0.35 9 8.49 0.37;proc print;id f;var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun;title1 'Confidence Limits on the Difference of Means';title2 'for Non-Primal Data';run;结果见下表:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664首先,方差是具齐性的。
生物统计学第六章方差的全面分析

t检 验 的 统 计 量 是
x1x2
(n11)s1 2(n21)s2 2 n1n22
n 11n 12
这部分是对差 原 2的 始估 数计 据, 方它样 只本 用的 了数 两
但我们 a个有 样本,没有 时被 的全 利部 用同 来 2。估 所以,我们 2的 认估 为计 对有待改善。
因此,两两t检验生的物统精计学确第六性章方有差的待全面提。 分析高
a5时1作 次 0 检 H 0被 验接 ,受1 的 ) 1概 = 00.9率 15 = 00.5 为 98 (
I型错 1- 0 误 .59= 80.4 7013
通过以上分 a的析 增, 大随 , I型 着 检错 验误 的的 大大增大,是 这不 样可 的靠 检的 验。
生物统计学第六章方差的全面分析
原因(3)检验统计量的精确性低
生物统计学第六章方差的全面分析
5、试验处理(treatment):在试验对象上实施的事先设计 好的具体项目,简称处理。在进行单因素试验时,试验因 素的一个水平就是一个处理;对于双因素试验,处理的个 数等于两个因素水平个数的乘积。每个处理可以看做是一 个总体,每个处理得到的一组数据可以看做是从这个处理 总体中抽取的一个样本的数据。
2、试验指标(experiment index):为衡量试验结果的好坏 或处理效应的高低,在试验中具体测定的性状或观测的项目。
3、试验因素(experiment factor):试验中所研究的影响试 验指标的因素:单因素、双因素或多因素试验。
4、因素水平(level of factor):因素的具体表现或数量等级。
(二)两类方差
1、处理内方差:在因素的同一水平(同一个总体)下,样本 数据的方差
2、处理间方差:因素的不同水平(不同总体)下,各样本之 间的方差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章参数估计6.1以每天每千克体重52 mol 5-羟色胺处理家兔 14天后,对血液中血清素含量的影响如下表[9]:y/(g · L-1)s/(g · L-1)n对照组 4.200.3512建立对照组和5-羟色胺处理组平均数差的0.95置信限。
答:程序如下:options nodate;data common;alpha=0.05;input n1 m1 s1 n2 m2 s2;dfa=n1-1; dfb=n2-1;vara=s1**2; varb=s2**2;if vara>varb then F=vara/varb;else F=varb/vara;if vara>varb then Futailp=1-probf(F,dfa,dfb);else Futailp=1-probf(F,dfb,dfa);df=n1+n2-2;t=tinv(1-alpha/2,df);d=abs(m1-m2);lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));k=vara/n1/(vara/n1+varb/n2);df0=1/(k**2/dfa+(1-K)**2/dfb);t0=tinv(1-alpha/2,df0);lcldmsun=d-t0*sqrt(vara/n1+varb/n2);ucldmsun=d+t0*sqrt(vara/n1+varb/n2);cards;12 4.20 0.35 9 8.49 0.37;proc print;id f;var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun;title1 'Confidence Limits on the Difference of Means';title2 'for Non-Primal Data';run;结果见下表:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664首先,方差是具齐性的。
在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。
0.95置信区间为3.959 07 ~ 4.620 93。
6.2不同年龄的雄岩羊角角基端距如下表[27]:年龄/a y/cm s/cm n建立平均数差的0.95置信区间,对应于H0:μ1-μ2=0,H A:μ1-μ2 ≠ 0的假设,推断两者间的差异显著性。
答:结果如下:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.26433 0.34528 0.05 0.93873 4.84127 0.90910 4.87090因为方差具齐性,所以平均数差的0.95置信区间为:0.938 73 ~ 4.841 27。
置信区间内不包括0,因此两者间的差异是显著的。
6.3了解我国风险识别、风险评价和风险缓解的现状,对于应对突发事件有重要作用。
以下是关于应对突发公共卫生事件能力调查(共调查了60个单位)的部分数据[28]:6作重点分别计算上述三个项目的0.95置信区间。
答:程序如下:options nodate;data clbi;n=60; m=35; p=m/n; alpha=0.05;do lphi=0.0001 to p by 0.00001;ltailp=1-probbnml(lphi,n,m-1);if abs(ltailp-alpha/2)<0.00001 then goto lower;end;lower:put m n p ltailp lphi;do uphi=p to 0.9999 by 0.00001;utailp=probbnml(uphi,n,m);if abs(utailp-alpha/2)<0.00001 then goto upper;end;upper:put m n p utailp uphi;proc print;id m;var n p ltailp utailp lphi uphi;title 'Confidence Limits for Binomial Population';run;结果如下:项目(1):Confidence Limits for Binomial PopulationM N P LTAILP UTAILP LPHI UPHI35 60 0.58333 0.024993 0.025006 0.44883 0.70931项目(2):Confidence Limits for Binomial PopulationM N P LTAILP UTAILP LPHI UPHI17 60 0.28333 0.024993 0.025002 0.1745 0.41443项目(3):Confidence Limits for Binomial PopulationM N P LTAILP UTAILP LPHI UPHI6 60 0.1 0.024996 0.025008 0.03759 0.205056.4乳腺癌患者有着沉重的心理负担,主要表现为:焦虑、怀疑和否认、恐惧、依赖、自私、悲观失望等。
经心理护理后,在很多方面都到改善,护理前y )见下表[29]:和护理后的评分(s表现心理护理前/评分心理护理后/评分样本含量(n)计算上述各种表现平均数差的0.95置信区间。
(注意方差不具齐性的情况。
)答:结果见下表:F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN6.5紫杉烷类物质具有优良的抗癌作用,近年来已成功地开发出紫杉烷类抗癌新药紫杉醇和多烯紫杉醇。
由此也引起人们对药源植物云南红豆杉的关注,测定了紫杉烷类物质在不同类型云南红豆杉中的含量。
下面给出其中的两种物质的测定结果[30]:种类y/%s/%n计算两种物质平均数差的0.95置信区间,并以H0:μ1-μ2=0,H A:μ1-μ2 ≠ 0的假设推断两者间的差异显著性。
答:结果见下表:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.28444 0.037999 0.05 .00026156 .0021384 .00026152 .0021385F的显著性概率P=0.037 999,P >0.025,方差具齐性。
方差具齐性时的0.95置信区间为:0.000 261 56 ~ 0.002 138 4。
在置信区间内不包括0,因此紫杉醇和三尖杉宁碱的含量差异显著。
6.6流行病学调查表明,高同型半胱氨酸(Homocysteine,Hcy)是导致动脉粥样硬化性血管病的一个新的独立危险因素。
测定了脑梗死组和对照组的Hcy,y )如下表[31]:结果(s组 别n Hcy/(μ -1计算两组平均数差的0.95置信区间,并解释所计算的结果。
答:结果如下:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN2.69346 .0000020008 0.053.92068 6.61932 3.93589 6.60411可以很明显看出,方差是不具齐性的。
0.95置信区间为:3.935 89 ~ 6.60411。
置信区间内不包含0,因此脑梗死病人的同型半胱氨酸显著高于对照组。
高同型半胱氨酸很可能是动脉粥样硬化性血管病的危险因素之一。
6.7 30名受试者同时采取两份静脉血,分别用传统的魏氏法和自动血沉仪测定血沉[32],结果为分别:)h /mm (7266.0=魏氏法-血沉仪法y ,)mm/h (5993.2=魏氏法-血沉仪法s 。
在α = 0.05水平上,通过置信区间检验两种方法的差异显著性。
答:所用程序如下:options nodate;data esr;input n mean std ;alpha=0.05;talpha=-tinv(alpha/2,n-1);lclm=mean-talpha*std/sqrt(n);uclm=mean+talpha*std/sqrt(n);cards;30 0.2667 2.9935;proc print;id n;var mean std alpha lclm uclm ;title1 'Confidence Limits for Mu';title2 'Sigma Is Unknown';run;结果见下表:Confidence Limits for MuSigma Is UnknownN MEAN STD ALPHA LCLM UCLM30 0.2667 2.9935 0.05 -0.85109 1.38449在置信区间内包含0,因此传统魏氏法和自动血沉仪法测得的结果差异不显著。
6.8生长激素缺乏症的患儿,在用生长激素治疗前和治疗6个月后的身高和体重数据如下表[33]:项目治疗前sy±治疗后sy±样本含量n先用t检验,推断治疗前和治疗后的平均身高和平均体重在α= 0.05水平上的差异显著性,再用治疗前和治疗后的平均数差数的0.95置信区间验证。
你认为这是一种很好的实验设计吗?怎样做检验的效果可能会更好?答:1. 先做成组数据t检验:(1)身高:T-Test for Non-Primal DataF FUTAILP T DF TUTAILP1.17361 0.36536 1.51668 38.0000 0.0688121.17361 0.36536 1.51668 37.7591 0.068838(2)体重:T-Test for Non-Primal DataF FUTAILP T DF TUTAILP3.82025 .0026673 3.05542 38.0000 .00204823.82025 .0026673 3.05542 28.3091 .00243042. 计算置信区间:(1)身高:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.17361 0.36536 0.05 -2.0085214.0085 -2.01020 14.0102(2)体重:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN3.82025 .0026673 0.05 1.11356 5.48644 1.08871 5.51129根据问题的要求,本例的t检验应为双侧检验,当t的显著性概率小于0.025时拒绝H0。