广西大学研究生高级生物统计作业
《生物统计学》习题集总参考答案
《生物统计学》习题集总参考答案第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
生物统计学习题集
生物统计学姓名:班级:学号:第一章概论一、填空1 变量按其性质可以分为_______变量与_______变量。
2 样本统计数就是总体_______得估计量。
3 生物统计学就是研究生命过程中以样本来推断_______得一门学科。
4 生物统计学得基本内容包括_______、_______两大部分。
5 统计学得发展过程经历了_______、_______、_______3个阶段。
6 生物学研究中,一般将样本容量_______称为大样本。
7 试验误差可以分为_______、_______两类。
二、判断( )1 对于有限总体不必用统计推断方法。
( )2 资料得精确性高,其准确性也一定高。
( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
( )4 统计学上得试验误差,通常指随机误差。
三、名词解释样本总体连续变量非连续变量准确性精确性第二章试验资料得整理与特征数得计算一、填空1 资料按生物得性状特征可分为_______变量与_______变量。
2 直方图适合于表示_______资料得次数分布。
3 变量得分布具有两个明显基本特征,即_______与______。
4 反映变量集中性得特征数就是_______,反映变量离散性得特征数就是_______。
5 样本标准差得计算公式s=_______。
二、判断( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( ) 2 条形图与多边形图均适合于表示计数资料得次数分布。
( )3 离均差平方与为最小。
( )4 资料中出现最多得那个观测值或最多一组得中点值,称为众数。
( )5 变异系数就是样本变量得绝对变异量。
三、名词解释资料数量性状资料质量性状资料计数资料计量资料普查抽样调查全距(极差)组中值算数平均数中位数众数几何平均数方差标准差变异系数四、单项选择( )1 下面变量中属于非连续性变量得就是_______。
A 身高 B 体重 C 血型 D 血压( )2 对某鱼塘不同年龄鱼得尾数进行统计分析时,可做成_______图来表示。
“生物统计学”课程作业(R语言)及参考答案
“生物统计学”课程作业(R语言)第一次作业:请各位同学用如下格式提交作业:题目一:题目:2006年四川省5个县奶牛的增长率(与2005年相比)如下,绘制成长条图。
解:代码:x<-c(22.6,13.8,18.2,31.3,9.5)barplot(x,col=rainbow(5),ylab='增长率%',xlab='县名',main='2005~2006四川省5个县奶牛的增长率',names.arg=c('双流县','名山县','宣汉县','青川县','泸定县'))图片:题目二:题目:1~9周龄大型肉鸭杂交组合GW 和GY 的料肉比如下表所示,绘制成线图。
解:双流县名山县宣汉县青川县泸定县2005~2006四川省5个县奶牛的增长率县名增长率%051015202530代码:x<-1:9y<-c(1.42,1.56,1.66,1.84,2.13,2.48,2.83,3.11,3.48)plot(y~x,type="l",col="red",ylab='料肉比',xlab='周龄',main='1~9周龄大型肉鸭杂交组合GW 和GY 的料肉比')z<-c(1.47,1.71,1.80,1.97,2.31,2.91,3.02,3.29,3.57)lines(z~x,type="l",col="blue")legend(1,3.0,'GW-red')legend(1,3.25,'GY-blue')图片:24681.52.02.53.03.51~9周龄大型肉鸭杂交组合GW 和GY 的料肉比周龄料肉比GW-redGY-blue题目三:附加题set.seed(学号后8位)data <- rnorm(100, 10.5, 1.0)data 为某场猪一月龄体重记录1. 求数据data 的平均数、标准差和变异系数平均数:10.62118标准差:1.076999变异系数:0.10140112. 选择合适的统计图,展示数据data 的总体分布情况作图软件:R统计图:(请将做好的统计图粘贴到此处)020*********8910111213某场猪一月龄体重记录100头猪标号体重代码:(若使用R,或SAS,请将代码粘贴到此处,若使用的软件不需代码则可忽略此部分)set.seed(20020125)data<-rnorm(100,10.5,1.0)dataplot(data,type="p",ylab='体重',xlab='100头猪标号',main='某场猪一月龄体重记录')结果解释:(100字以内解释该统计图中看到的结果)由统计图可知,该场猪一月龄体重主要介于8~14kg之间,但在该区间内,猪的体重数据分布较分散,相对来说数据较为集中的区域为10~11kg。
生物统计习题(含答案)
《生物统计学》练习题一、单项选择题1、为了区别,统计上规定凡是参数均用希腊字母表示,如总体平均数用符号( C )。
A、σB、xC、μD、S2、资料中最大值与最小值之差称为( D )。
A、组距B、组限C、组中值D、全距3、同一性状重复观察,各观察值彼此接近的程度称为( C )。
A、准确性B、可靠性C、精确性D、随机性4、常用于表示间断性变数、质量性状资料的次数分布状况的统计图是( A )。
A、折线图B、矩形图C、多边形图D、条形图5、连续性资料的整理与分组是采用:( C )A、统计次数法B、单项式分组法C、组距式分组法D、评分法6、在一定条件下可能出现也可能不出现的现象称为( D )。
A、不可能事件,B、小概率事件。
C、必然事件。
D、随机事件。
7、任何事件(包括必然事件、不可能事件、随机事件)的概率都在( B )。
A、-1与+1之间。
B、0与1之间。
C、-1与0之间。
D、+1与-1之间。
8、应用标准差表示样本的变异程度比用全距要好得多,•因它考虑了每个数据与( C )。
A、中数的离差。
B、众数的离差。
C、平均数的离差。
D、中位数的离差。
9、正态分布密度曲线向左、向右无限延伸,以( D )。
A、y轴为渐近线。
B、y =a轴为渐近线。
C、x =b轴为渐近线。
D、x轴为渐近线。
10、对于正态分布,标准差σ的大小决定了曲线的“胖”、“瘦”程度。
若σ越小,曲线越“瘦”,变量越集中在( B )。
A、原点0的周围取值。
B、平均数μ的周围取值。
C、x的周围取值。
D、y的周围取值。
11、正态分布密度曲线的“胖”、“瘦”程度是由( A )大小决定的。
A、σB、μC、μ+σD、μ-σ12、已知x~N(μ,σ2),若对x作下列之一种变换( D ),则就服从标准正态分布。
A、a=(f+μ)/σ。
B、b=(μ-x)/σ。
C、t=(x-μ)/σ2。
D、u=(x-μ)/σ。
13、若随机变量X 服从标准正态分布记为X ~N(85.2,16),其标准差为( B )A 85.2B 4C 不确定D 1614、用一个正态总体的样本平均数估计( C )的估计值,这种估计方法叫点估计。
生物统计作业(二)
1.为测定A,B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A 病毒,另半叶接种B病毒,以叶面出现枯斑病的多少作为致病力强弱的指标,的结果如下表所示。
试检验两种病毒的致病力是否有显著差异。
(显著性水平 =0.05,t0.05(7) = 2.356)
2.对某班级的数学成绩进行统计分析,SPSS(explore)结果如下。
请说明平均成绩,95%置信度的置信区间,标准差,标准误,全距。
3. 研究一个班级3组同学(分别接受3种不同的教学方法)在数学成绩上是否有显著差异,单因素方差分析结果如下,请分析该结果。
4. 某班级的数学成绩与化学成绩的相关性分析如下,请分析该结果。
高级生物统计学考试题和答案
1.何为多重共线性?它对资料分析有何影响?如何处理?(10分)答:多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
对多重共线性的两点认识:1)在实际中,多重共线性是一个程度问题而不是有无的问题,有意义的区分不在于有和无,而在于多重共线性的程度。
2)多重共线性是针对固定的解释变量而言,是一种样本的特征,而非总体的特征。
自变量之间存在较强的线性关系,这些自变量通常是相关的,如果这种相关程度非常高,使用最小乘法建立回归方程就有可能失效,引起不良后果:1)参数估计值的标准误变得很大,从而使t值变得很小;2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化;3)t检验不准确,误将应保留在方程中的重要变量舍弃;4)估计值的正负符号与客观实际不一致。
消除多重共线性有多种方法,消除多重共线性的方法:1)增加样本容含量;2)定义新的自变量代替高度多重共线性的变量,或将一组具有多重共线性的自变量合并成一个变量;3)删除不必要的解释变量:如在自变量中剔除某个造成共线性的自变量,重新建立回归方程;4)其它方法:逐步回归法和主成分分析法;采用逐步回归方法也能有效限制有较强相关关系的自变量同时进入方程。
2.如何评价所建立的多元线性回归方程的优劣?(10分)答:评价所建立的多元线性回归方程的优劣,可以采用方差分析法对所有自变量X1,X2…...等作为一个整体来检验他们与应变量Y之间是否有线性关系,并对回归方程的预测或解释能力做出综合评价。
除了方程分析法,另外可以用决定系数(R2),R2可用来评价回归方程优劣。
随着自变量增加,R2不断增大,对两个不同个数自变量回归方程比较,须考虑方程包含自变量个数影响,应对R2进行校正。
所谓“最优”回归方程指最大者。
还有复相关系数等。
对各自变量的假设和评价可以采用偏回归系数、t检验法和标准化回归系数等方法。
高级生物统计学基础习题详解
高级生物统计学基础习题计算题1、某小麦品种的常年平均亩产量为μ=210公斤, 现从外地引种一新品种, 在6 个试验点试种, 得平均亩产是X=224公斤,其标准差为S=4.63公斤, 试问该新品种的产量是否与原来的品种有显著差异?(α=0.05)答:(1)假设H0:μ=μO;对H A: μ≠μO(2)S y=S/√n= 4.63/√6=1.891T=(x-μ)/ S y=7.41(3)按自由度V=5查两尾表得: t0.05=2.571. 现实得∣t∣ >t0.01,故P<0.05(4)推断: H Aμ≠μ,即新品种产量与原品种产量有显著差异。
2.有一水稻品种的比较试验, 参试品种有4个, 对照品种一个(CK), 随机区组设计, 设置三次重复, 小区面积0.03亩, 试验结果如下:进行方差分析变异来源平方和df 均方F值p值区组8.8573 2 4.4287 2.7702 0.1219品种81.8307 4 20.4577 12.7967 0.0015误差12.7893 8 1.5987总和103.4773 14通过方差分析表可以看出,区组间差异不显著,而品种间差异显著。
SSR多重比较品种均值5%显著水平1%极显著水平C 29.9333 a AB 29.1667 ab AA 27.7667 ab AD 27.3667 b ACK 23.2000 c B3.有一杂交水稻品种, 田间随机抽样调查10株主穗的穗粒数, 得以下数据: 株号 1 2 3 4 5 6 7 8 9 10 穗粒数110 112 128 131 125 104 117 121 115 126 试描述这组数据的主要特征特性.样本数 和均值几何平均中位数 平均偏差 极差 方差标准差标准误 变异系数 95%置信区间99%置信区间101189.00 118.9 118.611197.32776.54 8.752.770.074112.65~125.6109.91~127.89 4、有一水稻品种和栽插密度的两因子试验, 参试品种4个(a=4), 栽插密度3个(b=3), 设置三次重复, 小5、有一晚稻品种的联合区域试验, 参试品种6个, 对照品种一个(CK), 共7个品种随机区组试验, 设置三次重复, 小区面积0.04亩, 试验结果如下: 各品种的小区平均产量(公斤)为:XA=19.4 XB=20.8 XC=12.5 XD=15.8 XE=20.4 XF=16.8 X(CK)=17.6验(α=0.05)答:多重比较表(LSD )处理 平均值 X-12.5 X-15.8 X-16.8 X-17.6 X-17.6 X-19.4 XB 20.8 8.3* 5.0 4 3.2 1.4 0.4 XE 20.4 7.9* 4.6 3.6 2.8 1.0 XA 19.4 6.9 3.6 2.6 1.8 C(CK) 17.6 5.1 1.8 0.8 XF 16.8 4.3 1 XD 15.8 3.3 XC12.5经过计算 LSD0.05=••J -X )(df 0.05S *t e =2.447×2.84=6.95 LSD0.01=••J -X df 0.01S *t e )(=3.707×2.84=10.53然后将多重比较表中的差值和两个LSD 值进行比较,小于LSD0.05不标,大于LSD0.05小于LSD0.01表为显著“*”,大于LSD0.01标为极显著“**”。
生物统计习题(含参考答案)
⽣物统计习题(含参考答案)《⽣物统计学》练习题⼀、单项选择题1、为了区别,统计上规定凡是参数均⽤希腊字母表⽰,如总体平均数⽤符号( C )。
A、σB、xC、µD、S2、资料中最⼤值与最⼩值之差称为( D )。
A、组距B、组限C、组中值D、全距3、同⼀性状重复观察,各观察值彼此接近的程度称为( C )。
A、准确性B、可靠性C、精确性D、随机性4、常⽤于表⽰间断性变数、质量性状资料的次数分布状况的统计图是( A )。
A、折线图B、矩形图C、多边形图D、条形图5、连续性资料的整理与分组是采⽤:( C )A、统计次数法B、单项式分组法C、组距式分组法D、评分法6、在⼀定条件下可能出现也可能不出现的现象称为( D )。
A、不可能事件,B、⼩概率事件。
C、必然事件。
D、随机事件。
7、任何事件(包括必然事件、不可能事件、随机事件)的概率都在( B )。
A、-1与+1之间。
B、0与1之间。
A、中数的离差。
B、众数的离差。
C、平均数的离差。
D、中位数的离差。
9、正态分布密度曲线向左、向右⽆限延伸,以( D )。
A、y轴为渐近线。
B、y =a轴为渐近线。
C、x =b轴为渐近线。
D、x轴为渐近线。
10、对于正态分布,标准差σ的⼤⼩决定了曲线的“胖”、“瘦”程度。
若σ越⼩,曲线越“瘦”,变量越集中在( B )。
A、原点0的周围取值。
B、平均数µ的周围取值。
C、x的周围取值。
D、y的周围取值。
11、正态分布密度曲线的“胖”、“瘦”程度是由( A )⼤⼩决定的。
A、σB、µC、µ+σD、µ-σ12、已知x~N(µ,σ2),若对x作下列之⼀种变换( D ),则就服从标准正态分布。
A、a=(f+µ)/σ。
B、b=(µ-x)/σ。
C、t=(x-µ)/σ2。
D、u=(x-µ)/σ。
13、若随机变量X 服从标准正态分布记为X ~N(85.2,16),其标准差为( B )A 85.2B 4C 不确定D 1614、⽤⼀个正态总体的样本平均数估计( C )的估计值,这种估计⽅法叫点估计。
生物统计作业-5
生物统计作业-5(207-209页)计算所马力4解:由于各处理间3个叶片之间没有必然联系,不同萝卜因素A 与叶片的影响因素B 是系统分组的情况。
P=4,q=3,r=2。
W = x ijk 22k =1=3j =14i =1228.0139P =1 x i ··2=pi =11 x i ··2=4i =1225.3038 TR =1 x ij ·2=qj =1p i =11 x ij ·23j =14i =1=227.9341 C =1pqr x ···2=14∗3∗2x ···2=217.7435 由此可将平方和进行分解:S A =P −C =225.3038−217.7435=7.5603S B =TR −P =227.9341−225.3038=2.6303. S e =W −TR =228.0139−227.9341=0.0798 S T =W −C =228.0139−217.7435=10.2704自由度可分解为:df A =p −1=4−1=3 df B =p q −1 =43−1 =8 df e =pq r −1 =4∗3 2−1 =12 df T =pqr −1=4∗3∗2−1=23由上述表格可知,不同萝卜间的叶子含钙量有显著的差异,同一个萝卜不同叶子间的含钙量有极为显著的差异。
R 语言结果:上述F 检验表明:不同萝卜和萝卜上不同叶子以及萝卜和叶子之间的差异都显著。
不同萝卜含钙量有显著差异,且萝卜不同叶子之间的含钙量也有差异。
6:在一个完全随机设计的实验中,6组雄性大白鼠在不同的饲料下增重量(g )如下:解:高、低蛋白为因素A ,不同的饲料成分牛肉、谷类和猪肉为因素B 。
是系统分组的情况。
且p=2,q=3,r=10。
W = x ijk 210k =1=3j =12i =1479044P=1x i··2=pi=11x i··2=2i=1466079.1TR=1x ij·2=qj=1pi=11x ij·23j=12i=1=467510.8C=1pqrx···2=12∗3∗10=462881.7由此可将平方和进行分解:S A=P−C=466079.1−462881.7=3197.4S B=TR−P=467510.8−466079.1=1431.7S e=W−TR=479044−467510.8=11533.2S T=W−C=479044−462881.7=16162.3自由度可分解为:df A=p−1=2−1=1df B=p q−1=2∗3−1=4df e=pq r−1=2∗3∗10−1=54df T=pqr−1=2∗3∗10−1=59R 语言结果:上述结果表明:不同高、低蛋白的配料对小鼠体重的影响较为显著,而不同组成成分之间对小鼠的体重影响不显著。
生物统计学高级考试试题
生物统计学高级考试试题一、选择题(每题2分)1. 下列哪项是描述对应受试者人数与受试者分组情况的统计学方法?A. 方差分析B. 配对t检验C. 卡方检验D. 相关系数2. 在生物统计学中,P值通常用于表征什么?A. 抽样误差B. 假设检验结果的可靠性C. 效应量的大小D. 样本大小3. 方差分析主要用于比较不同组之间的什么?A. 样本均值B. 样本中位数C. 样本众数D. 样本极差4. 在生物统计学中,什么是Type I错误?A. 拒绝了真实的零假设B. 接受了真实的零假设C. 拒绝了虚假的零假设D. 接受了虚假的零假设5. 生物统计学中,当两个变量的相互关系不是线性的,可通过以下哪种方法进行分析?A. 相关系数B. t检验C. 方差分析D. 非参数检验二、简答题(每题10分)1. 请简要说明双样本t检验的原理和应用场景。
2. 解释ANOVA(方差分析)的基本概念和基本原理。
3. 在生物统计学中,解释p值的含义和如何进行p值的解读与判断。
4. 请简要介绍非参数统计学方法,并给出一个例子说明其应用。
5. 描述一下在生物统计学中常用的相关系数及其计算方法。
三、计算题(每题20分)1. 某次药物试验分为观察组和对照组,观察组有50人,对照组有50人。
观察组的效果评分平均值为8,标准差为2;对照组的效果评分平均值为6,标准差为3。
请使用双样本t检验,判断两组效果评分是否存在显著差异(取α=0.05)。
2. 在一个实验中,研究人员观察了两种药物对肿瘤体积的影响。
随机选择了20例患者,其中10例给予药物A治疗,另外10例给予药物B治疗。
研究人员记录了治疗后肿瘤体积的变化情况(单位:cm^3)。
请使用配对样本t检验,判断两种药物对肿瘤体积是否有显著影响(取α=0.05)。
四、应用题(每题30分)某研究小组针对不同沙漠地区的植物寿命进行了调查研究,随机选取了4个地区进行采样,并记录下每个地区的植物寿命数据(单位:年)。
高级生物统计试题(2010.12.5)
《高级生物统计与试验设计》课程考试试题开卷适用专业年级:研究生2010级姓名:学号:专业:年级:本试题共四道大题,共2页,满分100分。
考试时间180分钟。
2.试卷若有雷同以零分计。
一、单项选择题。
(每小题2分,共10分)1. 一试验拟研究4个试验因素,每个试验因素设置5个水平,则全部水平组合有( )个。
A. 625B. 20C. 10D. 10242. 取值范围是[-1,1]的统计数是( )。
A. 决定系数B. 相关指数C. 相关系数D. 回归系数3. 用均匀设计表U*10(1010)进行试验设计,最多可以安排10水平的因素数是()。
A. 4B. 5C. 6D. 104. 关于通径系数,叙述错误的是()。
A. 通径系数实际上就是标准化变量的偏回归系数。
B. 通径系数是反应自变量对依变量直接作用大小和性质的一个统计数。
C. 通径系数可以用来度量各自变量对依变量影响的相对重要性。
D. 通径系数既具有相关系数的性质,也具有回归系数的性质。
5. 对于3因素,每因素设置5个水平的试验,用()所得到的水平组合数最少。
A. 均匀设计B. 二次回归正交组合设计C. 二次回归几乎正交旋转组合设计D. 二次回归通用旋转组合设计二、判断题(叙述正确的在括号内打√ ;叙述错误的括号内打×;每小题2分,共10分)。
( ) 1. 二次回归正交组合设计在中心点设置重复可以估计真正的试验误差,以便对回归方程进行失拟性检验。
( ) 2. 多元线性回归分析中,偏回归系数既可以用t检验,也可以用F检验,且t检验与F检验的结果是一致的。
( ) 3. 二次回归通用旋转组合设计中,平方项偏回归系数b jj间相互独立。
SS 。
( ) 4. 通径分析中,依变量的平方和1y( ) 5. 多元线性回归分析中,各自变量对依变量影响的相对重要性可以用偏回归系数来度量。
三、试验设计(40分)某研究拟进行水稻品种内香2550的高产配套栽培技术研究,以播种期(Z1)、移栽密度(Z2)、秧龄(Z3)和施氮量(Z4)为试验因素,试验指标为产量(y)。
生物统计习题(含参考答案)
《生物统计学》练习题一、单项选择题1、为了区别,统计上规定凡是参数均用希腊字母表示,如总体平均数用符号( C )。
A、σB、xC、μD、S2、资料中最大值与最小值之差称为( D )。
A、组距B、组限C、组中值D、全距3、同一性状重复观察,各观察值彼此接近的程度称为( C )。
A、准确性B、可靠性C、精确性D、随机性4、常用于表示间断性变数、质量性状资料的次数分布状况的统计图是( A )。
A、折线图B、矩形图C、多边形图D、条形图5、连续性资料的整理与分组是采用:( C )A、统计次数法B、单项式分组法C、组距式分组法D、评分法6、在一定条件下可能出现也可能不出现的现象称为( D )。
A、不可能事件,B、小概率事件。
C、必然事件。
D、随机事件。
7、任何事件(包括必然事件、不可能事件、随机事件)的概率都在( B )。
A、-1与+1之间。
B、0与1之间。
C、-1与0之间。
D、+1与-1之间。
8、应用标准差表示样本的变异程度比用全距要好得多,•因它考虑了每个数据与( C )。
A、中数的离差。
B、众数的离差。
C、平均数的离差。
D、中位数的离差。
9、正态分布密度曲线向左、向右无限延伸,以( D )。
A、y轴为渐近线。
B、y =a轴为渐近线。
C、x =b轴为渐近线。
D、x轴为渐近线。
10、对于正态分布,标准差σ的大小决定了曲线的“胖”、“瘦”程度。
若σ越小,曲线越“瘦”,变量越集中在( B )。
A、原点0的周围取值。
B、平均数μ的周围取值。
C、x的周围取值。
D、y的周围取值。
11、正态分布密度曲线的“胖”、“瘦”程度是由( A )大小决定的。
A、σB、μC、μ+σD、μ-σ12、已知x~N(μ,σ2),若对x作下列之一种变换( D ),则就服从标准正态分布。
A、a=(f+μ)/σ。
B、b=(μ-x)/σ。
C、t=(x-μ)/σ2。
D、u=(x-μ)/σ。
13、若随机变量X 服从标准正态分布记为X ~N(85.2,16),其标准差为( B )A 85.2B 4C 不确定D 1614、用一个正态总体的样本平均数估计( C )的估计值,这种估计方法叫点估计。
生物统计复习题答案汇总
高级生物统计学总复习题1. 如何对单因素、双因素、随机区组方差分析差异平方和的分解过程。
P4,922单因素总差异平方和分解:LT=LA+Le LT: 总差异平方和LA :因素水平间差异平方和Le:水平内平方和(误差)双因素总差异平方和分解:LT=LA+LB+Le (无交互作用)LT=LA+LB+LA*B+Le (有交互作用的)LA*B :A、B 交互效应差异平方和随机区组方差分析:单因素完全随机区组试验:LT=LA+L 区组+Le双因素完全随机区组试验:LT= LAB +L 区组+Le 其中LAB= LA+LB+LA*B2. 何为正交试验设计法。
正交实验设计法:这种方法打破了多因素多水平,全部组合试验的传统思维方法。
他是从全部的组合中做一部分试验单元并能反应出全部组合试验的面貌,而且最好的组合方案还不会被丢掉。
他是按照一种规格化的表格进行设计,可以利用该表进行直观分析、方差分析。
正交实验设计法体现了多快好省的原则。
3. 多元回归对数据中心化变换后的正规方程组的系数矩阵中L 阵有什么特点。
L 阵是对称矩阵4. 在多元线性回归检验中,统计量F 是如何计算的?其中回归平方和U 和剩余平方和Q 是如何计算的,写出计算公式,其自由度各是多少。
P55 纸上的前二页5. 多元线性回归的研究中,各自变量xj 对回归方程的贡献用什么公式表示?称其为什么平方和?数学上完全以证明,各自变量对回归关系的贡献Vi 可以用以下式表示,称偏回归平方和,Cii是A (或L)逆矩阵C中对角线上的元素。
Vi=bi2/Cii对某偏回归关系的检验,其实就是对该归回系数的检验(用 F 检验法或者t 检验法)6. 在多元相关分析中,一般研究几种相关关系,各相关系数如何表示,各有什么意义。
P57(此处应鞋上计算式)在多元相关回归中一般研究简相关、偏相关、复相关三中相关关系。
(1)简相关任意两变量间的紧密程度关系称简相关(未排除其他因素的影响)用简相关系数rij 表示(2)偏相关(也称净相关或纯相关)任意两变量间的紧密程度,但是不包含其他变量间影响称偏相关其指标数用偏相关系rij.,riy 。
大学生物统计学---相关习题
[答案:综合值χ²=0.0820,同质性χ²=89.1797]
习题8
一些夏季害虫盛发期的早迟和春季温度上下有关。武进连续9年测定3月下旬至4月中旬旬平均温度累积值〔x,旬·度〕和水稻一代三化螟盛发期〔y,以5月10日为0〕的关系,得结果于下表,试作分析。
6.6测定4种密度下金皇后玉米的千粒重〔g〕各4次,得结果如下表。试对4种密度下的千粒重作相互比拟,并作出差异显著性结论。
【答案:密度间F=69.79,SE=2.52g】
种植密度〔株/667㎡〕
千
粒
重
ห้องสมุดไป่ตู้〔g〕
2000
4000
6000
8000
247
238
214
210
258
244
227
204
256
246
221
[答案:χ²=11.25,不显著]
7.2假定有6个样本容量均各为5的样本,其方差各为33.64,14.27,16.94,1.28,2.56和2.04,试检验方差的同质性。
[答案:χ²=14.21,不显著]
7.3试用χ²法〔需连续性矫正〕测验下表各样本观察次数的否适合各相应的理论比率:
样本号
观察次数
理论比率
[答案:χ²=0.6430,不显著]
7.7某一杂交组合的第三带〔F3〕共有810系,在温室鉴别各系幼苗对某种病害的反响,并在田间鉴别植株对此病害的反响,所得结果列于下表,试测验两种反响间是否相关?
温室幼苗反响
田间反响
抗病
别离
感染
生物统计学习题集2
生物统计学习题集生物统计学课程组编写第一章概论1.什么是生物统计学?生物统计学的主要内容和作用是什么?2.解释并举例说明以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
3.误差与错误有何区别?4.田间试验有哪些特点?保证田间试验质量的基本要求有哪些?第二章试验资料的整理与特征数的计算1.试验指标试验因素因素水平试验处理试验小区总体样本样本容量随机样本总体准确性精确性2.什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有那些?制表和绘图时应注意什么?3.标准误与标准差有何联系与区别?4.算术平均数与加权平均数形式上有何不同?为什么说他们的实质是一致的?5.平均数与标准差在统计分析中有什么用处?他们各有哪些特征?6.试验资料分为哪几类?各有何特点?7.简述计量资料整理的步骤。
8.常用的统计表和统计图有哪些?9.算术平均数有哪些基本性质?10.总体和样本差的平均数、标准差有什么共同点?又有什么联系和区别?11.在对果树品种调查研究中,经观测所得的干周、冠高、冠幅、新梢生长量、萌芽率、花数、果数、座果率、单果重、产量等一系列数量资料,哪些是连续性数量,哪些是非连续性数量?-1试根据所给资料编制次数分布表。
13.根据习题12的次数分布表,绘制直方图和多边形图,并简述其分布特征。
14.根据习题12的资料,计算平均数、标准差和变异系数。
15.根据习题12的资料,计算中位数,并与平均数进行比较。
16.试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19金皇后:16,21,24,15,26,18,20,19,22,19第三章概率与概率分布1.试解释必然事件、不可能事件、随机事件。
生物统计习题.doc
.判断题(1X10=10分)1.u表示总体平均数,表示样本平均数。
(V)2.鸡的产蛋量属于数量性状资料中的计量资料。
(X)3.随机事件发生的概率是不固定的。
(V) 4.连续型分布单点概率为0,只有区间概率。
(V)5.如果方差不齐,两独立样本T检验和单因素方差分析都不能采用。
(X )6.统计推断中差异极显著(sig.v0.01)表示差异极大。
(X )7.fisher, s exact test其实不属于四表格(2 X 2)卡方检验,只是一种特殊条件下的补充方法,不适于其它的R X C列表卡方检验。
(X )8.相关指数R2是相关系数r的平方,大小介于。
和1之间,R2越接近1表明曲线(或直线)拟合越好。
(X )9.设置重复的主要作用在于估计试验误差和降低试验误差。
(V)10.在都满足条件的情况下,参数检验比非参数检验更加精确。
(V ).单项选择题(2X10=20分)1 .描述偏态分布资料集中趋势的常用统计参数:(C )A.算术平均数B.标准差C.中位数D.四分位数2.根据有效数字的计算规则,1.0* 102 +1.00*103+ 1.0 = ( B )A. 1.10*103B.1101.0C. 1.1*103D. 1.0 * 1033.pH=13.15,其有效数字是(A )A.小数部分的两位;B.整数部分的两位;C.全部4位。
D.左边3位。
4.大样本一般是指样本数不少于:(B )A. 10B.30C.100D. 10005.对某一性状进行遗传学实验,呈显性的有419株,呈隐性的有213株。
检验这些植物的遗传性状从数量上说是否符合4: 1的比例,应选用:(B )A.单样本K-S检验B.非参数检验的卡方检验C.单一样本T检验D.两独立样本T检验6.测定2种溶液的pH值,每种溶液重复测定5次,比较2种溶液pH值是否有显著差异,(已知数据正态分布,可加及方差齐性),选用:(D ) A.两独立样本T检验 B.两配对样本T 检验C.单因素方差分析D.两独立样本的非参数检验(mann-whitney U检验)7.若上述数据呈正态分布,但方差不齐,选用:(D ) A.两独立样本T检验 B.两配对样本T检验C.单因素方差分析D.两独立样本的非参数检验(mann-whitney U检验)8.测定3种溶液的pH 值,每种溶液重复测定5次,比较3种溶液pH值是否有显著差异,(已知数据正态分布,可加及方差齐性),选用:(C ) A.两独立样本T检验 B.两配对样本T检验C.单因素方差分析D.多独立样本非参数检验(Kruskal-wallis秩和检验)9.若上述数据方差不齐,应选用(D ) A.两独立样本T检验 B.两配对样本T检验C.单因素方差分析D.多独立样本非参数检验(Kruskal-wallis秩和检验)10.不属于实验设计费雪(R.A.Fisher)二原则的是:(C ) A.重复 B.随机 C.齐同可比原则 D. 局部控制(对照).简答体(30分)1.简述样本标准差与样本标准误的区别和联系(4分)标准差和标准误都是变异指标,但它们之间有区别,也有联系。
生物统计作业2
技能训练二平均数、标准差、变异系数1、某品种10头仔猪的初生重(单位:kg)为:1.5、1.2、1.3、1.4、1.8、1.1、0.9、1.0、1.6、1.2。
求该品种仔猪初生重的平均数、标准差、标准误、变异系数。
2、八、随机测量了某品种126只基础母羊的体重,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值次数36.0~ 37.5 139.0~ 40.5 142.0~ 43.5 645.0~ 46.5 1848.0~ 49.5 2651.0~ 52.5 2754.0~ 55.5 2657.0~ 58.5 1260.0~ 61.5 763.0~ 64.5 2合计1263、在鱼塘中10个点取水样,测定水中含氧量(单位:mg/l),得数据:4.33、4.62、3.89、4.14、4.78、4.64、4.52、4.55、4.48、4.26.计算平均数、标准差、标准误、变异系数。
4、下表为某纯系蛋鸡200枚蛋重资料次数分布表,计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)44.15—45.0 347.55—48.4 1649.25—50.1 2250.95—51.8 3052.65—53.5 4454.35—55.2 2856.05—56.9 3057.75—58.6 1259.45—60.3 561.15—62.0 4合计2005、检测12只鸡每只月产蛋量(单位::枚)得数据:20、21、18、23、24、19、21、19、20、21、18、19,计算平均数、标准差、标准误、变异系数。
6、抽样调查某品种猪的窝产仔数(单位:头)与断奶时窝重(单位:kg)的数据资料如下,请计算这两个生物性状的平均数、标准差、标准误、变异系数,说明哪个性状离散程度大。
窝产仔数10 11 14 9 12 11 10 13 断奶时窝85.6 92.0 90.5 88.3 95.2 90.3 92.6 89.4重7、某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《高级生物统计》期末试题院系:农学院专业:学号:姓名:一、有一玉米氮、磷肥用量配比试验,施氮量(纯N ,kg/666.67m 2)为0,5,10,15共四个水平,施磷肥(P 2O 5,kg/666.67m 2)为0,4,8,12共四个水平,总共处理数为16个。
试验结果如下表,请用正交多项式回归进行分析,并列出回归方程。
(14分)2解:(一)建立正交多项式回归方程1、根据试验数据的性质,确定选配回归方程的类型。
从数据的趋势看,玉米产量随氮肥施用量的增加而增加,最初增产率大,后逐渐变小,似呈抛物线趋势;磷肥也有相同而且有交互作用的迹象,可考虑配二元二次多项式回归方程以表达之。
以x 代表氮肥,z 代表磷肥,得回归方程:)(111202012201000xz b z b z b x b x b b y +++++=ˆ2、根据各自变量水平数N ,查相应的正交多项式表,方法与配一元正交多项式相似。
本题氮肥用量有4个水平,4=xN ;磷肥用量也是4个水平,4=z N 。
在N =4的正交多项式表中,找到与二元二次多项式回归方程(1)式的次数相应的各次带参数的正交多项式值,用以替换相应的各次项。
本题4=xN ,x的一次项以)(x X 1代替,二次项以)(x X 2代替;4=z N ,z 的一次项、二次项也分别以)(z Z 1、)(z Z 1代替。
故式(1)就被替换为:)(2)()()()()()(ˆ111120210122011000z Z x X b z Z b z Z b x X b x X b b y'+'+'+'+'+'=3、抄取正交多项式表中相应数值,列表计算偏回归统计数ij b 及偏回归平方和j U 。
正交多项式表中相应数值和偏回归平方和的计算结果均列于表1.1中。
计算表的计算方法为: ① 计算j A :∑=2jj x A α16111222200=+++==∑ αx A80313222211=++-+-==∑ )()(αx A x 16111222222=++-+==∑ )(αx A x 80333222211=++-+-==∑ )()(αz A z 16111222222=+++==∑ αz A z 4009392222=+++==∑ xzxz z A α ② 计算j B :ααy x B j j ∑=810376513001253100=⨯++⨯+⨯==∑ ααy x B10976513001253122=⨯++⨯-+⨯==∑ )(ααy x B x338776533003253311=⨯++⨯-+⨯-==∑ )()(ααy z B z20776513001253122-=⨯++⨯+⨯==∑ ααy z B z 159765930032539=⨯++⨯+⨯==∑ ααy z B xz xz③ 计算jb ':j j jA B b ='4375506168103000.==='A B b 6875463735111.==='x x xA B b 8125616209222.==='x x xA B b 3375423387111.==='z z zA B b 93751216207222.-=-=='z z zA B b 39750400159.==='xz xz xzA B b ④ 计算j U :jj j A B U 2=812517437780373521211.===x x x A B U 56257421610922222.===x x x A B U 112514339780338721211.===z z z A B U 373576533001253311=⨯++⨯-+⨯-==∑ )()(ααy x B x062526781620722222.)(=-==z z z A B U 20256340015922.===xz xz xz A B U2表中X 1(x)Z 1(z) 所在列的数值是X 1(x a ) 和Z 1(z a ) 所在列同行数值相乘的结果。
(二)回归方程及各次项偏回归系数的显著性检验 ① 计算平方和()937533077922./=-=∑∑N y y ss 总75253212582121.=++++==∑xz z z x x j U U U U U U ss 回19.9521=-=回总剩ss ss ss② 计算自由度151161=-=-=N df 总5161=-=-=M df 回10=-=回总剩df df df于是列出F 检验表(见表1.2)及氮、磷交互作用(Fx 2、Fz 2、Fx 1z 1 < F 0.05)不显著,说明宜配一次二元正交多项式,即:)(3337542687546437550611)(.)(..ˆz Z x X y ++=(三)建立二元二次多项式回归方程对配得的一元一次正交多项式回归方程作回代整理,得出所要配的一元一次多项式回归方程。
因为: X 1(x ) =(x ﹣x)/h x =(x ﹣7.5)/5=x/5﹣3/2 Z 1(z ) =(z ﹣z)/h z =(z ﹣6)/4=z/4﹣3/2 将它们代入式(3),整理得一元一次多项式回归方程为:zx y 5843810337599372...ˆ++= (4)此回归方程就是所要配的二元一次多项式回归方程,它能够较准确地表达玉米产量与氮肥、磷肥用量之间的数量关系。
二、进行甘蔗施肥试验,氮肥、磷肥、钾肥的施用水平如下表,若采用三元二次回归正交设计进行试验,请列出本试验的氮肥、磷肥、钾肥各个水平的编码值、回归正交设计方案以及结构矩阵。
(14分)表2 甘蔗氮肥、磷肥、钾肥配比试验单位:kg/666.67m2解:设计方法:(1)确定γ值:m c=2P=23 =8(全实施),假定m0=1,据此查表(教材34页),得γ=1.215。
(2)确定变化间距:计算各因素的零水平:Z0N=(50+10)/2=30 (kg/666.67m2)Z0P=(50+5)/2=27.5 (kg/666.67m2)Z0K=(60+10)/2=35 (kg/666.67m2)计算各因素的变化间距(△j):△N=(50-30)/1.215=16.4609 (kg/666.67m2)△P=(50-27.5)/1.215=18.5185 (kg/666.67m2)△N=(50-30)/1.215=20.5761 (kg/666.67m2)(3)对试验因素各水平进行编码并制定试验方案:表2.2 甘蔗三元二次回归正交组合设计方案三、有一水稻氮肥、磷肥、钾肥施肥试验,各个肥料的施用水平如下表,若用二次回归正交旋转组合设计进行试验,请列出该试验的肥料水平编码值、二次通用旋转组合设计方案及其结构矩阵。
(14分)表3 水稻氮肥、磷肥、钾肥配比试验单位:kg/666.67m2解:设计方法:(1)确定参数:P=3(全实施),查二次正交旋转组合设计参数表(教材46页),得M c=8,Mγ=6,M0=9,N=23(即共23个处理),γ=1.682。
(2)确定变化间距:计算各因素的零水平:Z0N=(10+2)/2=6 (kg/666.67m2)Z0P=(6+0)/2=3 (kg/666.67m2)Z0K=(8+0)/2=4 (kg/666.67m2)计算各因素的变化间距(△j):△N=(10-6)/1.682=2.3781 (kg/666.67m2)△P=(6-3)/1.682=1.7836 (kg/666.67m2)△N=(8-4)/1.682=2.3781 (kg/666.67m2)(3)对试验因素各水平进行编码并制定试验方案:表3.1 水稻氮肥、磷肥、钾肥施肥因素水平编码表表3.3 水稻三元二次正交旋转组合设计的结构矩阵计算表四、为研究甘蔗氮肥和钾肥的用量对甘蔗产量的影响,采用二因子二次回归D-最优设计(7点方案)进行试验,重复两次。
氮肥和钾肥上下水平见下表。
请列出该试验的试验因子编码值、试验方案及其结构矩阵。
(14分)2解: (1)2(2)根据P=2的二次回归D-最优设计方案(7点设计)X 1、X 2的水平编码值(教材第68~69页),由式子j j j j x Z Z αα∆+=0,计算Z 1(N )、Z 2(K 2O )的真实值,结果列于表4.2。
2(3)拟定试验处理方案:2)(3) 结构矩阵:x0x1x2x1x2x12x221 -1 -1 1 1 11 1 -1 -1 1 11 -1 1 -1 1 11 1 1 1 1 1X=1 -0.092 0.092 -0.008464 0.008464 0.0084641 1 -0.067 -0.067 1 0.0044891 0.067 -1 -0.067 0.004489 1五、为研究水稻的氮肥、磷肥、钾肥、石灰的配比试验,各个肥料的施用的上下水平如下表所示,采用“416—B”最优混合设计,请列出该试验的各个肥料各水平的编码值、试验方案以及结构矩阵。
(14分)表5 水稻氮肥、磷肥、钾肥、石灰配比试验单位:kg/666.67m2解:22)表5.3 结构矩阵六、水稻氮肥、钾肥配比试验,研究其施用量与水稻生产的效应关系。
氮(N )肥用量0—15kg/666.7m²,钾(K 2O )肥用量0—10 kg/666.7m²,每个因素分为7个水平,采用均匀设计。
请列出各个肥料的编码值、试验方案及结构矩阵。
(14分)解:222)建立多项式回归方程22222111121221102ˆx b x b x b x b x b b y+++++= 若试验各处理重复2次,式中的结构矩阵X 为:x 0x 1x 2x 1x 2x 12x 221-3 -1 3 9 1 1 -2 2 -4 4 4 1 -1 -2 2 1 4 1 0 1 0 0 1 1 1 -3 -3 1 9 1 2 0 0 4 0 1 3 3 9 9 9若试验各处理重复2次,式中的结构矩阵X 为:x 0x 1x 2x 1x 2x 12x 221 -3 -1 3 9 1 1 -2 2 -4 4 4 1 -1 -2 2 1 4 1 0 1 0 0 1 1 1 -3 -3 1 9 1 2 0 04 0 1 3 3 9 9 9 1 -3 -1 3 9 1 1 -2 2 -4 4 4 1 -1 -2 2 1 4 1 0 1 0 0 1 1 1 -3 -3 1 9 1 2 0 0 4 0 1 3 3 9 9 9七、调查多个玉米品种的株高(x1)、穗长(x2)、千粒重(x3)对产量(y )的影响,经计算得各单相关系数和直接通径系数为:r 12 = 0.704694 , r 13 = -0.144536 , r 23 = 0.176717r 1y = 0.506915 , r 2y = 0.735833 , r 3y = 0.263702 P1y=0.059493 株高(x1)通向产量(y )的直接通径系数 P2y=0.666606 穗长(x2)通向产量(y )的直接通径系数P3y=0.154500 千粒重(x3)通向产量(y )的直接通径系数请计算出间接通径系数,绘出通径图,并采用相关系数和直接通径系数综合判断各个性状对产量的影响力大小。