生物统计学(版)杜荣骞课后习题答案统计数据的收集与整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章统计数据的收集与整理
1.1算术平均数是怎样计算的?为什么要计算平均数?
n
、y
i -4 y = _
答:算数平均数由下式计算:
n ,含义为将全部观测值相加再被观测值的个数
除,所得之商称为算术平均数。 计算算数平均数的目的, 是用平均数表示样本数据的集中点, 或是说是样本数据的代表。
1.2既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?
答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。
1.3标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之 间有什么不同?
答:变异系数可以说是用平均数标准化了的标准差。 在比较两个平均数不同的样本时所
得结果更可靠。
1.4完整地描述一组数据需要哪几个特征数?
答:平均数、标准差、偏斜度和峭度。
1.5下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数 据,不要忘记,体
重是通过度量得到的, 属于连续型数据。根据表中所给出的数据编制频数 分布表。
序和计算结果如下:
proc format; value hfmt 56-57='56-57' 62-63='62-63'
68-69='68-69' 70-71=70-71' 72-73=72-73' 74-75=74-75:
run;
data weight;
in file 'E:\data\exer1-5e.dat';
64
6
66
62
64
7
66 5 7 13 4 66 6 6 6
66 64
64
4 6 10 3 6 6 6 7 6 9 6 12 7
6 6 6 6 6
16 4 3 7 6 6 6 6 6
14 2 8 7 6 6 6 6 6 566 7
66
74
64
75
62
6664646469
64
64
66
64
64
64
66
62 726166
64
6
66
66
6661
答:首先建立一个外部数据文件,名称和路径为:
62
6
66
6
7264
62
7
72
E:\data\exer1-5e.dat 。所用的 SAS 程
58-59='58-59' 64-65='64-65' 60-6仁'60-61' 66-67='66-67'
in put bw @@;
run;
proc freq;
table bw;
format bw hfmt.;
run;
The SAS System
Cumulative Cumulative
BW Freque ncy Perce nt Freque ncy Perce nt
56-573 1.03 1.0
58-594 1.37 2.3
60-61227.3299.7
62-634615.37525.0
64-658327.715852.7
66-677725.723578.3
68-694515.028093.3
70-7113 4.329397.7
72-735 1.729899.3
74-7520.7300100.0
1.6将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。它们的平均数相等吗?标准差相等吗?能够解释为什么吗?
答:用means过程计算,两个样本分别称为y1和y2 ,结果见下表:
The SAS System
Variable N Mea n Std Dev
Y1 10 64.5000000 3.5039660
Y2 10 63.9000000 3.1780497
随机抽出的两个样本,它们的平均数和标准差都不相等。因为样本平均数和标准差都是统计
量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。
1.7从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?为什
么?本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?
答:不是简单的随机样本。从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。
n n
送(y「—丁2=送山—y)2, 其中y: = yi士c。y;=业、、/ =Cy
1.8证明i# 若用C或y i 一Cy i
编码时,前式是否仍然相等?
答: (1 )令 y i 二 y i —c
则 y'y —C
平均数特性之③。
n
2
Z (yTJ
i 4 n 八 Wi _c 一 y _c 2 i 4
n 2
=s
(y i — y)
i 4
n
2
、y i -y
i 4
F
- x 2
y i y ; c 丿 n _ i - c" 用第二种编码方式编码结果,两式不再相等。 1.9有一个样本:y i ,y 2,…,y n ,设B 为其中任意一个数值。证明只有当 B = y 时, n ' y-B 2 i 吕 最小。这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到 该特性。 阮(y_B ( 答:令P 八,y -B 2,为求使p 达最小之B ,令 ?B - 1.10检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共 100株, 数据如下⑴: 10.0 9.3 7.2 9. 1 8.5 8. 0 10.5 10.6 9.6 10.1 7.0 6.7 9.5 7. 10.5 7. 8.1 9.6 7.6 9.4 8 9 10.0 7.5 7.2 5. 7.3 8. 7.1 6.1 5.2 6.8 7 10.0 9.9 7.5 4. 7.6 7. 9.7 6.2 8.0 6.9 5 8.3 8.6 10.0 4. 4.9 7. 8.3 8.4 7.8 7.5 8 0 6.6 10.0 6.5 9. 5 8.5 11.0 9.7 6.6 10.0 5.0 6.5 8.0 8.4 8. 7.4 7. 8.1 7.7 7.5 7.1 3 4 7.8 7.6 8.6 6. 7.0 6. 6.7 6.3 6.4 11.0 4 10.5 7.8 5.0 8. 7.0 7. 5.2 6.7 9.0 8.6 4 4.6 6.9 3.5 6. 9.7 6. 5.8 6.4 9.3 6.4 (2)令 则 平均数特性之②。 n =z i 1 则 2 'r —B " B Jy n