研究生生物统计学复习题及答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( y y) s n 1
二项分布:
2
( y ) N
2
s
x
2
( x)2 n n 1
P( x) Cnx p x (1 p) n x
泊松分布:
np
np(1 p)
2 np(1 p)
2
P( x)
x
x!
e
P(B/A3)=0.01, 有贝叶斯公式可得,P(A1/B)=P(A1)P(B/A1)/ 3 ������ =1 ������(������������)������(������/������������) =0.2*0.3/(0.2*0.3+0.5*0.1+0.3*0.01)=0.06/0.113=0.531 同理可得,P(A2/B)=0.05/0.113=0.442 P(A3/B)=0.003/0.113=0.027 例题 3 仓库中有四批种子, 第一批占仓库种子总数的 10%, 第二批占 20%, 第三批占 30%, 第四批占 40%, 已知第一批种子的发芽率为 0.8, 第二批为 0.7, 第三批为 0.6, 第四批为 0.5, 今随机从仓库中抽取一粒种子, 问其不发芽种子的概率为多少?如果抽取到的种子为发芽种 子,试问该种子来自第三批的可能性为多大? 解:设 A1,A2,A3,A4 分别表示第一批,第二批,第三批,第四批种子,B 表示发芽 P(A1)=0.1,P(A2)=0.2,P(A3)=0.3,P(A4)=0.4,P(B/A1)=0.8,P(B/A2)=0.7, P(B/A3)=0.6,P(B/A4)=0.5 所以抽取 1 粒种子发芽的概率 P(B)=0.1*0.8+0.2*0.7+0.3*0.6+0.4*0.5=0.6 所以抽取 1 粒种子不发芽的概率 P(������)=1-P(B)=1-0.6=0.4 P(A3/B)=P(A3)P(B/A3)/P(B)=0.3*0.6/0.6=0.3 重要公式:
( x )2 2 2
np
x
正态分布:
1 f ( x) e 2
u
Hale Waihona Puke Baidu
第四章 抽样估计:用抽样调查所得到的一部分单位的数量特征来估计和推算总体的数量特征 抽样分布: 从已知的总体中以一定的样本容量进行随机抽样, 由样本的统计数所对应的概率 分布称为抽样分布 置信区间:指由样本统计量所构造的总体参数的估计区间 概率:概率是事件在试验结果中出现可能性大小的定量计量,是事件固有的属性。 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称 为随机误差。 α 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称 为 α 错误。 β 错误:指如果 H0 不是真实的,假设检验时却接受了 H0,否定了 HA 这样就犯了 接受不真实假设的错误,称为 β 错误。 统计推断:指从样本的统计数对总体参数做出的推断。 参数估计:由样本结果对总体参数在一定概率水平下所做出的估计 统计学——研究随机现象规律性的方法学;是一门关于如何收集、分析、解释和表达数据的 科学
第五章 一、填空 1.统计推断主要包括(假设检验)和(参数估计)两个方面。 2.参数估计包括(点估计)估计和(区间估计)估计。 3.假设检验首先要对总体提出假设,一般要作两个: (无效)假设和(备择)假设。 2 2 2 2 4.总体方差 σ1 和 σ2 已知,或总体方差 σ1 和 σ2 未知,但两个样本均为大样本时应采用 u 检验法 5.在频率的假设检验中,当 np 或 nq(小于)30 时,需进行连续性矫正。 二、判断 1.作假设检验时,若|u|﹥uα ,应该接受 H0,否定 HA。(F) 2.若根据理知识或实践经验判断甲处理的效果不会比乙处理的效果差,分析的目的在于推 断甲处理是否真的比乙处理好,这时应用单侧检验。(R) 3.小概率事件在一次试验中实际上是不可能发生的。(R) 4.当总体方差σ 2 未知时需要用 t 检验法进行假设检验。(F) 5.在进行区间估计时,α 越小,则相应的置信区间越大。(R) 6.在小样本资料中,成组数据和成对数据的假设检验都是采用 t 检验的方法。(R) 7.在同一显著水平下,双尾检验的临界正态离差大于单尾检验。(R) 三、单选 1.两样本平均数进行比较时,分别取以下检验水平,以(A)所对应的犯第二类错误的概率最 小。 A.α =0.20 B.α =0.10 C.α =0.05 D.α =0.01 2.当样本容量 n﹤30 且总体方差σ 2 未知时,平均数的检验方法是(A)。 A.t 检验 B.u 检验 C.F 检验 D.χ2 检验 3.两样本方差的同质性检验用(C)。 A.t 检验 B.u 检验 C.F 检验 D.χ2 检验 4.进行平均数的区间估计时,(B)。 A.n 越大,区间越大,估计的精确性越小。 B.n 越大,区间越小,估计的精确性越大。 C.σ 越大,区间越大,估计的精确性越大。 D.σ 越大,区间越小,估计的精确性越大。 5.已知某批 25 个小麦样本的平均蛋白含量 ������ 和σ ,则其在 95%置信信度下的蛋白质含量 的点估计 L=(D)。 A.������±u0.05σ B.������±t0.05σ C.������±u0.05������������ D.������±t0.05������������ 计算题 例题 1 某鱼塘水中的含氧量,多年平均为 4.5ml/L,现在该鱼塘设 10 个点采水样,测得水 中含氧量分别为: 4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26ml/L,试检验该次抽样测定的 水中含氧量与多年平均值有无显著差别。 解:假设 H0:μ =4.5 4.5 ml L-1,备择假设 HA: μ ≠4.5 ml L-1 该样本为总体标准差未知,且为小样本容量,故采用 t 检验,选择显著水平α =0.05 ������ = 10
第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(实验设计)和(统计推断)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学) 、 (近代描述统计学)和(现代推断统 计学)3 个阶段。 6.生物学研究中,一般将样本容量(n 大于等于 30)称为大样本。 7.试验误差可以分为(系统误差)和(随机误差)两类。 判断 1.对于有限总体不必用统计推断方法。 (F) 2.资料的精确性高,其准确性也一定高。 (F) 3.在试验设计中,随机误差只能减小,而不能完全消除。 (R) 4.统计学上的试验误差,通常指随机误差。 (R) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量形状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性) 。 4.反映变量集中性的特征数是(平均数) ,反映变量离散性的特征数是(变异性) 。 5.样本标准差的计算公式 s=(
1 10 ������ =1 ������������
=
4.33+4.62+⋯+4.26 10
A. 标准差 B.方差 C.变异系数 D.平均数
第三章 填空 1. 如果事件 A 和事件 B 为独立事件, 则事件 A 与事件 B 同时发生的概率 P (AB) = P(A)P(B)。 2.二项分布的形状是由(n)和(p)两个参数决定的。 3.正态分布曲线上, (μ)确定曲线在 x 轴上的中心位置, (σ )确定曲线的展开程度。 4.样本平均数的标准误������������ =(σ ������) 。 5.事件 B 发生条件下事件 A 发生的条件概率,记为 P(A/B),计算公式: (P(AB)/P(B)) 判断题 1.事件 A 的发生和事件 B 的发生毫无关系,则事件 A 和事件 B 为互斥事件。 (F) x x n-x n 2.二项分布函数 Cn p q 恰好是二项式(p+q) 展开式的第 x 项,故称二项分布。 (F) 3.样本标准差 s 是总体标准差σ 的无偏估计值。 (F) 4.正态分布曲线形状和样本容量 n 值无关。 (R) 2 5.х 分布是随自由度变化的一组曲线。 (R) 单项选择题 1.一批种蛋的孵化率为 80%,同时用 2 枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概 率为(A) 。 A. 0.96 B. 0.64 C. 0.80 D. 0.90 2. 关于泊松分布参数λ 错误的说法是(C). A. μ =λ B. σ 2=λ C. σ =λ D.λ =np 3. 设 x 服从 N(225,25),现以 n=100 抽样,其标准误为(B) 。 A. 1.5 B. 0.5 C. 0.25 D. 2.25 4. 正态分布曲线由参数μ 和σ 决定, μ 值相同时, σ 取(D)时正态曲线展开程度最大,曲线最 矮宽. A. 0.5 B. 1 C. 2 D. 3 计算题 例题 1 甲、乙、丙三人向同一飞机射击,设甲、乙、丙射中的概率分别为 0.4,0.5,0.7, 又设若只有一人射中,飞机落下的概率为 0.2,若两人击中,飞机落下的概率为 0.6,若三人 击中飞机必落,求三人射击一次,飞机落下的概率? 解:记 B=“飞机坠毁” ,Ai=“有 i 人击中” ,其中 i=0、1、2、3. 显然 A0,A1,A2,A3 是完备事件组,运用概率加法和乘法定理, P(A0)=0.6X0.5X0.3=0.09 P(A1)=0.4X0.5X0.3+0.6 X 0.5 X 0.7=0.36 P(A2)=0.6 X0.5 X0.7+0.4 x 0.5 x0.7+ 0.4x 0.5 x 0.3 =0.41 P(A3)=0.4 x 0.5 x 0.7 =0.14 根据题意可知,P(B/A0)=0,P(B/A1)=0.2,P(B/A2)=0.6,P(B/A3)=1 利用全概率公式,则有: 3 ������ P B = ������ ������������ ������ = 0.09 x 0 + 0.36 x0.2 + 0.41 x 0.6 + 0.14 x 1 = 0.458 ������������ ������ =0 例题 2 中年男性人群中,20%超重,50%正常,30%体重偏低,他们患动脉硬化的概率分别 为 0.3,0.1,0.01,从中随机抽取一人,恰为动脉硬化患者,求他可能来自各人群的概率? 解:设 A1,A2,A3 分别表示超重,正常,偏轻,B 表示动脉硬化 邮题意,P(A1)=0.2,P(A2)=0.5,P(A3)=0.3,P(B/A1)=0.3,P(B/A2)=0.1,
������ 2 − ������−1
������ 2 ������
) 。
判断题 1.计数资料也称连续性变量资料,计量资料也称非连续性变量资料。 (F) 2. 条形图和多边形图均适合于表示计数资料的次数分布。 (F) 3. 离均差平方和为最小。 (R) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。 (R) 5. 变异系数是样本变量的绝对变异量。 (F) 单项选择 1. 下列变量中属于非连续性变量的是(C). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成(A)图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是(B). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4.如果对各观测值加上一个常数 a,其标准差(D) 。 2 A. 扩大 a 倍 B.扩大 a 倍 C.扩大 a 倍 D.不变 5.比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C) 。