2019精选医学统计数据的收集与整理.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计数据的收集与整理

1.1 算术平均数是怎样计算的?为什么要计算平均数?

答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。

1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?

答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。

1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?

答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。

1.4 完整地描述一组数据需要哪几个特征数?

答:平均数、标准差、偏斜度和峭度。

1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。

6669646564666865626469616168665766696665 7064586766666766666266666462626564656672 6066656161666762656561646264656265686865 6768626370656465626662636865685767666863 6466686463606469656667676765676766686467 5966656356666363666763706770626472696767 6668646571616361646467697066646564637064 6269706865636566646869656367637065686769 6665676674646965646565686765656667726567 6267716965657562696868656366666562616865 6467666460616867635965606463696271696063 5967616869666469656867646466697368606063 3862676565696567657266676461646663636666 6663656367686662636166616368656669646670 6970636465646767656662616565606365626664

答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下:

proc format;

value hfmt

56-57='56-57' 58-59='58-59' 60-61='60-61'

62-63='62-63' 64-65='64-65' 66-67='66-67'

68-69='68-69' 70-71='70-71' 72-73='72-73'

74-75='74-75';

run;

data weight;

infile 'E:\data\exer1-5e.dat';

input bw @@;

run;

proc freq;

table bw;

format bw hfmt.;

run;

The SAS System

Cumulative Cumulative

BW Frequency Percent Frequency Percent

-----------------------------------------------------

56-57 3 1.0 3 1.0

58-59 4 1.3 7 2.3

60-61 22 7.3 29 9.7

62-63 46 15.3 75 25.0

64-65 83 27.7 158 52.7

66-67 77 25.7 235 78.3

68-69 45 15.0 280 93.3

70-71 13 4.3 293 97.7

72-73 5 1.7 298 99.3

74-75 2 0.7 300 100.0

1.6 将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。它们的平均数相等吗?标准差相等吗?能够解释为什么吗?

答:用means过程计算,两个样本分别称为和,结果见下表:

The SAS System

Variable N Mean Std Dev

----------------------------------------

Y1 10 64.5000000 3.5039660

Y2 10 63.9000000 3.1780497

----------------------------------------

随机抽出的两个样本,它们的平均数和标准差都不相等。因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。

1.7 从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?为什么?本课程

要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?

答:不是简单的随机样本。从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。

1.8 证明其中若用或编码时,前式是否仍然相等?

答:(1)令

则平均数特性之③。

(2)令

则平均数特性之②。

用第二种编码方式编码结果,两式不再相等。

1.9 有一个样本:,设B为其中任意一个数值。证明只有当

最小。这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。

相关文档
最新文档