统计学试卷2008a
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国科学院武汉教育基地
2007—2008学年第一学期期末考试试卷
课程名称:生物统计学
考试时间:2008年1月21日下午2:30-5:00
一、选择题(每题选择一个最佳答案。每小题1分,共17分)
1、为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地
2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()。
A、该地所有20-29的健康女性
B、该地所有20-29的健康女性的血红蛋白测量值
C、抽取的这2000名20-29岁女性
D、抽取的这2000名20-29岁女性的血红蛋白测量值
2、下列说法正确的是()。
A.系统误差可以完全消除B.随机误差可以完全消除
C.两种误差都可以完全消除D.两种误差都不可以完全消除
3、算术均数与中位数相比,()。
A、抽样误差更大
B、不易受极端值的影响
C、更充分利用数据信息
D、更适用于分布不明及偏态分布资料
4、在一个右偏(峰在左边,右边有较长的尾巴)的分布中,反映集中趋势的数值
最大的是()。
A.中位数B.算数平均数C.众数D.几何平均数
5、对于标准正态分布变量,()范围内有90%变量值。
A、0~1.96
B、-1.96~1.96
C、-1.645~∞
D、-1.645~1.645
6、在抽样方式和样本容量不变的条件下,置信区间愈大,则()。
A.可靠性愈大B.可靠性愈小
C.估计的效率愈高D.估计的效率愈低
7、利用t分布构造置信区间的条件是()。
A.总体服从正态分布,且方差已知
B.总体服从正态分布,且方差未知
C.总体不一定服从正态分布,但要求是大样本
D.总体不一定服从正态分布,但要求方差已知
8、比较两药的疗效时,哪种情况应做单侧检验()。
A. 已知甲乙两药均有效
B. 不知甲乙两药哪种好
C. 已知甲药不会优于乙药
D. 不知甲乙两药是否有效
9、作两样本均数差别的t检验中,P值与α值中()。
A、α值是研究者指定的
B、P值是研究者指定的
C、两者意义相同,数值不同
D、两者意义相同,数值相同
10、对一批经过长途运输的货物损坏率是否超过0.003进行假设检验。假设途中实
际损坏率为0.0025,而决策人根据检验结果认为损坏率超过了0.003,这时()。
A.出现了第一类错误B.出现了第二类错误C.可能出现第一类错误,也可能出现第二类错误D.无法判断
11、当假设检验的显著性水平为α=0.01时,H0被拒绝,则当显著性水平改为α=0.05
时,H0()。
A.一定会被拒绝B.一定不会被拒绝
C.可能被拒绝,也可能不被拒绝D.无法判断
12、在两组资料比较的t检验中,结果为P < 0.05,差别有显著性。P愈小,则()。
A.说明两样本均数差别愈大B.愈有理由认为两总体均数不同
C.说明两总体均数差别愈大D.愈有理由认为两样本均数不同
13、完全随机设计的方差分析中,用SS表示离均差平方和,MS表示均方差,则
必有()。
A、SS组内 B、MS组内< MS组间 C、MS总=MS组间+MS组内 D、SS总=SS组间+SS组内 14、协方差分析中,根据各组的x平均数对y进行矫正,要求x与y之间()。 A.相关B.建立回归方程C.独立D.有显著回归关系 15、将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级 划分为治愈、好转和无效。欲知两种方案的疗效何者较优,宜作()。 A.两样本均数比较的t检验B.两组多类构成比比较的 2检验 C.两样本率比较的假设检验D.两样本比较的秩和检验 16、变量x和y的相关系数r = 0.5,如果建立y对x的回归模型,则y的变异中 由于引入了自变量x而使总平方和减小的部分占了()。 A.25% B.50% C.75% D.45% 17、在多元线性回归模型y=A+B j x j中,若自变量x j对因变量y的影响不显著,则 它的回归系数B j的取值可能是()。 A.0 B.1 C.小于0 D.大于1 二、填空题(每空1分,共18分) 1、在对连续型变量进行统计描述时,平均水平指标,如均数、,反映变 量的趋势;而变异指标,如标准差、,则反映变量的趋势。 2、若)(~2l χξ、)(~2k χη,且ξ、η相互独立,则ξ + η服从 分布。 3、某地大规模调查显示健康人血清总胆固醇的99%置信区间为 4.742~5.258 mmol/L ,则它的95%置信区间为 。 4、对于有14个样本的双变量正态分布资料,对其回归系数b 进行F 检验,结果F =4.0。如果这两个变量的相关系数r 进行t 检验,则t = ,这两个变量 (是/不是)相关的(注t 0.05, 12=1.782)。 5、为了建立最优多元线性回归方程,则其中应该包含所有对因变量 的自变量,而不包含 的自变量。 6、研究样品或变量的亲疏程度的数量指标有两种,一种是 ,另一种是 。 7、在进行聚类分析时,既可以对 进行聚类,也可以对 进行聚类。 8、在生存分析中,生存时间是指从起始事件至 事件所经历的时间间隔,截尾数据是指从起点至 所经历的时间。 9、因子分析利用某个问题中可直接测量的、 的诸指标间接反应少数几个在专业上有意义、但不可直接测量且 的因子的状态。 三、是非题(在小题号后面分别打“√”和“×”,每小题1分,共15分) 1、个体间的变异是抽样误差的主要来源。 2、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。 3、即使变量X 偏离正态分布,只要样本含量相当大,从X 抽取的样本均数也近似正态分布。 4、Possion 分布的拟合优度检验结果p>0.05,就证明该事物的分布是随机的。 5、在嵌套设计中,次要因素的各个水平是嵌套在主要因素的水平下的,因而在统计时不能分析其交互作用。 6、k 组(k ≥ 3)均数经方差分析不全相等时,其中两组均数的差数用LSD 法检验显著,用Duncan 法或S-N-K 法检验则一定显著。 7、由于样本观察结果具有不确定性,故不能根据样本推论总体。 8、正态分布资料也可用非参数统计方法作分析,但平均统计效能偏低。 9、在单因素方差分析中,要求各组均数相差不大。 10、单因素随机区组实验资料的方差分析,实质上就是两因素不具重复观察值的方差分析。 11、在正交设计中,通过方差分析得到的不同变量的不同水平的最优组合可以不包含在试验设计的水平组合中。 12、两样本率的比较可采用u 检验,也可采用四格表χ2检验。 13、如果X 与Y 存在相关关系,则一定存在回归关系。 14、在建立判别函数时,训练样本的分类准确程度对其判别效率没有太大的影响。 15、在主成分分析中,数据越相关,降维效果就越好。