中南大学统计学课件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题
《卫生统计学》第五版(五年制预防医学用)
(一)名词解释与简答题
1.名词解释
(1)负担系数(2)总和生育率(3)生存率(4)潜在减寿年数
(5)试比较发病率与患病率, 死亡率与病死率。
2、简述二项分布、Poisson分布、正态分布的区别与联系。
3、简述控制图的基本原理。
4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。
5、样本均数的抽样分布有何特点?
6、样本均数的标准误的意义是什么?与标准差有何区别和联系?
7、与标准正态分布比较,t分布的特点是什么?
8、用同一份样本指标去估计总体参数的95%置信区间与99%置信区间,两者比较,哪一
个估计的精度好?为什么?
9、假设检验的理论依据是什么?
10、假设检验的两类错误之间的区别与联系是什么?
11、t检验的应用条件是什么?
12、假设检验中P值的意义是什么?
13、如何确定检验水准?
14、如何恰当地应用单侧与双侧检验?
15、什么情况下可以借用正态近似法估计总体概率的置信区间?
χ检验的用途。
16、简述2
17、比较两个独立样本频数分布的χ2检验,和比较配对样本两个频数分布的χ2检验在设计
方法、资料整理、假设检验等方面的差别是什么?
18、举例说明如果实验效应用等级资料表示,比较两组总体效应间差别是否有统计学意义
χ检验?
为什么不能用2
19、为什么有些四格表(或R×C表)必须要计算确切概率?
20、实验研究和调查研究的根本区别是什么?
21、实验设计的三个基本原则是什么?
22、在临床试验中使用安慰剂的目的是什么?
23、随机化的目的是什么?
24、试验设计的基本要素包括哪些?
25、估计样本含量时,所定容许误差与样本量有何关系?
26、配对设计的目的是什么?
27、避免医生和病人对实验效应观察的偏性,设计时应注意什么?
28、为明确某新化妆品对皮肤有无损害作用,将12只大白兔的左背部涂抹该化妆品,右侧
涂生理盐水作为对照,72小时后观察皮肤反应。
这属于什么对照?
29、琴纳用牛痘疫苗接种23人后再接种天花,结果无人患天花,而当时一般人接触天花病
人后,天花的发病率约90%。
琴纳所用的属于什么对照?
30、为比较A、B两种减肥药对肥胖病人的减肥效果。
将60名肥胖患者按性别相同,体重
相近配成30对。
每对患者随机分配入A、B两药组,30天后比较A、B两组患者体重的下降值(kg)。
(1)该实验属何种设计方案?
(2)变量或资料(体重下降值)属何种类型
(3)其结果可用何种统计分析方法进行分析
31、什么是析因设计?其主要特点是什么?
32、何为交叉设计?它有何优缺点?
33、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算?
34、两样本t检验与完全随机设计资料的ANOV A有何关系?配对样本t检验与随机区组设
计资料的ANOV A又有何关系?
35、举例说明何谓交互效应?并绘制交互效应图。
36、SNK−q检验Dunnett−t检验都可用于均数的多重比较,它们有何不同?
37、数据变换在资料处理中的作用是什么?
38、秩和检验有哪些优缺点?
检验?
39、两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2
40、调查研究与实验研究有何异同?二者能否同时使用或结合使用?
41、究主要有哪些方法,各有何优缺点?
42、大多数的调查研究是抽样调查研究?比较常用的四种概率抽样方法。
43、哪些情况下最适合于用小组调查法。
44、法的意义与思想是什么?直接法与间接法的主要区别是什么?
45、面一些说法是否正确,若不正确,提出正确者:
(1)如果只需要比较各个年龄组的死亡率,可以不做标准化。
(2)只有当要比较总体死亡情况,而且希望归因为人口分布不同之外的其它因素时,标准化才有意义。
(3)虽然人口分布不同,但各个年龄组的死亡率相同或相差不大时没有必要做标准化。
(4)不同比较组的人口分布不同,各年龄组的死亡率也不同,但有明显的交叉,此时不宜做标准化。
46、简述线性回归、logistic回归和Cox回归的区别。
47、简述Cox回归中回归系数与相对危险度RR值的关系。
48、简述综合评价的一般步骤。
49、简述Topsis法的基本思想和步骤。
50、简述层次分析法的基本思想和步骤。
51、何谓Meta分析?
52、.说明Meta分析的用途。
53、说明Meta分析的两类统计模型。
54、说明Meta分析的基本步骤。
(二)分析计算题
1.1985年某省农村120例6-7岁正常男童胸围(cm)测量结果如表所示。
120例6-7岁正常男童胸围(cm)测量结果
51.6 54.1 51.3 56.6 51.2 53.6 56.0 58.3
54.0 56.9 55.5 57.7 56.0 57.4 55.2 53.6
57.7 55.5 57.4 53.5 56.3 54.0 57.5 55.4
58.3 55.4 55.9 53.3 54.1 55.9 57.2 56.1
53.8 57.7 56.0 58.6 57.6 56.0 58.1 49.1
51.3 53.8 50.5 53.8 56.8 56.0 54.5 51.7
57.3 54.8 58.1 56.5 51.3 50.2 55.5 53.6
52.1 55.3 58.3 53.5 53.1 56.8 54.5 56.1
54.8 54.7 56.2 53.7 52.4 58.1 56.6 56.7
53.4 57.1 54.4 53.7 54.1 59.0 56.2 55.7
53.1 55.9 56.6 56.4 50.4 53.3 56.7 50.8
51.4 54.6 56.1 58.0 54.2 53.8 55.3 55.9
56.1 61.8 56.7 52.7 52.4 51.4 53.5 56.6
59.3 56.8 58.1 59.0 53.1 54.2 54.0 54.7
59.8 53.9 52.6 54.6 52.7 56.4 55.5 54.4
(1)试编制胸围数据的频数表,绘制直方图,概括其分布特征。
(2)用合适的统计量描述胸围数据的集中趋势、变异趋势。
(3)计算P25、P50、P75。
2. 在某项治疗膀胱癌的研究中,细胞增殖抑制率(=(1-实验组A值/对照组A值)×100%))数据如表所示:
细胞增殖抑制率
分组细胞增殖抑制率(%)
第1天第3天第5天第7天实验组133 123 54 140
对照组100 98 162 250 试依据上述数据绘制合适的统计图。
(注:A值为上述研究中某实验指标)
3. 1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应为医院20.38,妇幼保健机构
4.66,卫生院16.38,其他58.58。
试用合适的统计图表达上述资料。
4.1985年我国北方某地区某医生记录10名儿童乳牙萌出月龄(月)数据如下:
4, 6, 5.5, 8, 11, 10, 13, 11, 9, 8。
试描述该10名儿童乳牙萌出的平均时间。
5. 某卫生防疫站对30名麻疹易感儿童气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下表。
试计算其平均滴度。
抗体滴度1:8 1:16 1:32 1:64 1:128 1:256 1:512 例数 2 6 5 10 4 2 1
6. 某地通过卫生服务的基线调查得到下表的资料,试作如下分析:
(1)计算全人口的性别比;(2)计算育龄妇女(15~49岁)占总人口的百分比;
(2)计算总负担系数;(4)计算老年人口系数
某地人口构成情况
年龄组(岁) 男(%) 女(%) 年龄组(岁) 男(%) 女(%)
0~ 4.2 4.0 45~ 2.4 2.7
5~ 3.2 3.1 50~ 2.1 2.4
10~ 4.4 4.2 55~ 1.2 2.2
15~ 5.5 5.3 60~ 1.3 2.4
20~ 5.1 5.2 65~ 1.1 1.4
25~ 6.0 6.1 70~ 0.8 1.2
30~ 4.3 4.5 75~ 0.5 0.9
35~ 3.2 3.3 80~ 0.2 0.5
40~ 2.3 2.5 85~ 0.1 0.2
7.假定虚症患者中,气虚型占30%。
现随机抽查30名虚症患者,求其中没有1名气虚型的概率;有4名气虚型的概率。
8.假定某批出厂半年的中药潮解率为6%。
从中抽取20丸,求恰有1丸潮解的概率、不超过1丸潮解的概率和有1至3丸潮解的概率。
9.某溶液平均1毫升中含有大肠杆菌3个。
摇匀后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少?
10.某人群中12岁男孩身高的分布近似于正态分布,均数为144.00cm,标准差为5.77cm。
(1)该人群中80%的12岁男孩身高集中在哪个范围?
(2)求该人群中12岁男孩身高的95%和99%参考值范围。
(3)求该人群中12岁男孩身高低于140cm的概率。
(4)求该人群中12岁男孩身高超过160cm的概率。
11.某地白血病的发病率为0.0001,现检查4万人,求没有发现白血病患者的
概率和发现白血病患者不超过3人的概率。
12. 某车间经检测每升空气中平均约有37颗粉尘,请估计该车间每升空气中有大于50颗粉尘的概率。
13. 某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。
某医师从已确诊的神经衰弱病人中随机抽取了两份样本, 一份样本是20例病人服用该种新药,计算得到平均睡眠时间为6.39小时, 标准差为2.24小时; 另一份样本是93例病人也服用该种新药,计算得到平均睡眠时间为6.45小时, 标准差为2.51小时。
若睡眠时间服从正态分布,试分别估计这种新安眠药的平均睡眠时间的95%置信区间;并比较这两个区间有何不同,用哪一个估计总体参数更可靠?
14. 为了解中年男性高血压患病情况,某研究单位在某市城区随机调查了45~54岁男性居民2660人,检查出高血压病人775人,试估计该市中年男子高血压患病1.大量研究显示
汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm。
某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.95 9.33 9.49 9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27。
试问该地区男性新生儿临产前双顶径(BPD)的是否大于一般新生儿。
15.为探讨习惯性流产与ACA(抗心磷抗体)的lgG的关系,研究人员检测了33例不育
症(流产史>2次)妇女ACA的lgG,得样本均数为1.36单位,标准差为0.25单位;同时检
测了40例正常(有1胎正常足月产史)育龄妇女ACA的lgG,相应样本均数为0.73单位,标准差为0.06单位。
习惯性流产者与正常妇女lgG水平是否不同?
16.两组十二指肠溃疡患者。
其中A组20例,幽门螺杆菌(Hp)皆阳性。
测得其生长抑
制素(SS)样本均数为260.20(wn/10-9),标准差为27.50 (wn/10-9);B组10例,Hp皆
阴性。
其SS样本均数为387.40(wn/10-9),标准差为34.50(wn/10-9)。
试问,Hp对生长抑
制素含量有无影响?
17. 两组肿瘤患者,单纯放疗组(A)13 例,口服平消胶囊+放疗组(B)12 例,接受
放疗前后,血清Sil-2R水平(U/ml)如表所示。
试评价平消胶囊对接受放疗患者血清Sil-2R
水平的影响?
两组肿瘤患者的血清Sil-2R水平
A组 No. 1 2 3 4 5 6 7 治疗前 1183.03 822.52 1294.00 852.50 568.89 532.12 896.36
治疗后 983.08 469.34 704.39 979.66 1040.33 895.93 612.27
No. 8 9 10 11 12 13
治疗前 530.46 808.22 375.44 1055.26 614.55 450.22
治疗后 616.70 870.14 1245.54 1753.67 1850.56 538.45
B组 No. 1 2 3 4 5 6 7 治疗前 992.85 767.33 645.85 709.54 995.41 1043.40 1022.76
治疗后 236.66 293.00 166.77 204.81 127.27 186.63 200.80
No. 8 9 10 11 12
治疗前 486.27 694.28 871.44 973.73 1063.76
治疗后 151.47 254.49 178.09 147.19 111.22
⒙在探讨硫酸氧钒降糖作用的实验中,测得两组动物每日进食量如表6-6
所示。
试问两组动物每日进食量是否相同?
两组动物每日进食量
糖尿病加钒组糖尿病组
26.46 46.89
25.19 47.21
28.70 42.42
23.70 47.70
24.48 40.75
25.19 41.03
28.01 45.98
23.70 43.46
26.10 44.34
24.62 45.32
19. 22~33岁单胎初孕妇女具有妊娠高危因素者123人随机分为两组。
A组63人从孕28周起到分娩止每日口服含钙胶囊;B组60人同期口服安慰剂。
结果A组出现妊高症6例,B组出现14例。
试问,补钙对妊高症是否具有预防作用?
20. 在甲地区抽取10万人口回顾调查, 知1990~1993年因脑血管病死亡123人,在乙地
区也抽取10万人口作回顾调查, 知同期因脑血管病死亡97人。
两地区脑血管病死亡水平是否
相同?
率的95%置信区间。
21.某医院收治186例重症乙型脑炎患者,随机分成两组,分别用同样的方
剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表所示。
加人工牛黄治疗乙型脑炎效果
治疗效果
疗法治愈未愈合计
不加人工牛黄26 45 71
加人工牛黄68 47 115
合计94 92 186
问加人工牛黄是否增加该方剂的疗效?
22.某研究人员观察了其他基本情况相似的60岁以上老人126名,其中患冠心病的52名,未患冠心病的74名,询问他们食盐的情况,其结果见表
冠心病患病与食盐情况
冠心病
食盐情况
合计超标未超标
有36 16 52
无42 32 74
合计78 48 126
问患冠心病和未患冠心病的老人食盐超标的概率是否不同?
23.为比较三种方剂治疗胃溃疡的效果,将200名患者随机分到三个治疗组,疗效见表,分析三个方剂的治疗效果有无差别?
三种方剂治疗胃溃疡的效果
治疗方法
治疗效果
合计有效无效
甲方剂42 18 60
乙方剂38 27 65
丙方剂56 19 75
合计136 64 200
24.为比较甲、乙两种方法的诊断效果,某研究人员随机抽查110名乳腺癌患者,同时用甲乙两种方法对各位患者进行检查,将检查结果整理成表的形式。
问两种方法对乳腺癌的检出概率有无差别?
甲乙两种方法检查乳腺癌患者的情况
甲方法
乙方法合计检出未检出
检出未检出42
30
8
30
50
60
据文献,该苗在全程接种后必须提高8%以上才有推广价值。
(1)如果取α=0.05,1–β=0.80,单侧检验时,需要多大的样本含量才能实现研究目的?
(2)如果取1–β=0.90,又需要多大的样本含量?
(3)根据两个样本含量的比较,你得出什么结论?
28.为研究母乳喂养和人工喂养对婴儿血红蛋白的影响,根据文献,经母乳喂养的婴儿42天血红蛋白均数为117.7g/l,人工喂养为103.3g/l,42天婴儿血红蛋白的总体标准差σ=10.2 g/l。
α取单侧0.05,检验功效为0.80,每组例数相等,问每组需要多少病例才能发现差异?若母乳喂养组样本含量占整个样本含量的60%,则每组又各需多少病例?
29.探讨复方丹参注射液对Ⅱ型糖尿病多发性末梢神经病变的治疗效果,以维生素B l、B12治疗为对照。
根据有关文献的报道,对照组的总有效率为55.6%;复方丹参注射液总有效率为88.2%。
若取单侧α=0.05,β=0.10,两组病例数相同的情况下,各组需要多少病例才能发现有差别?
30.为研究铅作业与工人尿铅含量的关系,随机抽查了3种作业工人的尿铅结果如表所示。
问3种作业工人的尿铅含量是否不同?
3种铅作业工人尿铅含量(mg/L)测定结果
铅作业组调离铅作业组非铅作业组
0.01 0.11 0.09
0.16 0.23 0.02
0.24 0.18 0.05
0.18 0.14 0.02
0.28 0.20 0.01
0.14 0.12 0.10
0.40 0.13 0.04
0.15 0.00 0.14
31.某医师为研究人体肾上腺皮质3β–HSD(羟基类固醇脱氢酶)活性在四个季节是否有差别,采用分光光度计随机测定了部分研究对象,其数据如表所示,请作统计分析。
四个季节人体肾上腺皮质3β–HSD活性
季节n X S
春季42 0.78 0.13
夏季40 0.69 0.22
秋季32 0.68 0.14
冬季36 0.58 0.20
32.利血平可以使小鼠脑中去甲肾上腺素(NE)等递质下降,现考察某种新药MWC是否具有对抗利血平使递质下降的作用,将24只小鼠随机等分为四组,并给予不同处理后,测定脑中NE的含量(ng/g湿组织),结果如表所示:
小鼠经不同处理后脑中NE的含量
蒸馏水组利血平组MWC组利血平+MWC组
630 181 715 407
760 103 663 397
687 138 638 378
676 141 887 363
892 197 625 438
523 193 648 412
问:(1)该资料属何种设计方案?
(2)该新药MWC是否具有对抗利血平使递质下降的作用?
33.为研究雌激素对子宫发育的作用,用四个种系的未成年雌性大白鼠各3只,每只按一定剂量注射雌激素,至一定时间取出子宫并称重,结果如表所示,试比较雌激素的作用在三种剂量间、四个种系大白鼠间是否不同。
未成年雌性大白鼠的子宫重量(mg)
种系
雌激素剂量(μg/100g)
0.2 0.4 0.8
甲106 116 145
乙42 68 115
丙70 111 133
丁42 68 115
34.将10名中度甲状腺机能亢进病人随机分为两组,分别用地巴唑和地巴唑+普奈洛尔
治疗,治疗前和治疗后4周的心率测量结果如表所示。
试分析治疗方法的主效应、治疗时间
的主效应以及两者的交互效应。
甲状腺机能亢进病人治疗前后的心率(次/分)
治疗方法受试对象编号治疗前治疗后4周
1 115 91
2 120 94
地巴唑 3 124 88
4 116 82
5 114 96
6 11
7 83
地巴唑+ 7 110 80
普奈洛尔8 118 92
9 119 85
10 122 84
36为研究克拉霉素的抑菌效果,某实验室对28个短小芽孢杆菌平板依据菌株的来源不
同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低
剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TH)。
给予不同的处理后,观
察抑菌圈的直径,结果见表9-31,请对该资料进行分析。
28个平板给予不同处理后的抑菌圈直径(mm)
区组SL SH TL TH
1 18.0
2 19.41 18.00 19.46
2 18.12 20.20 18.91 20.38
3 18.09 19.56 18.21 19.64
4 18.30 19.41 18.24 19.50
5 18.2
6 19.59 18.11 19.56
6 18.02 20.12 18.13 19.60
7 18.23 19.94 18.06 19.54
37.为研究长跑运动对增强普通高校学生的心功能的效果,某学院对随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如表所示,问长跑锻炼后的晨脉次
数有否降低?
某校15名学生5个月长跑锻炼前后的晨脉次数(单位:次/分钟)
学生号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 锻炼前70 76 56 63 63 56 58 60 67 65 75 66 56 59 72 锻炼后48 54 60 64 48 55 54 45 50 48 56 48 62 49 50
38.分别对8名未患妊娠合并症的孕妇和9名患有妊娠合并症的孕妇进行葡萄糖耐受水
平的测试,结果见表。
问两类孕妇的葡萄糖耐受能力是否不同?
两组孕妇葡萄糖耐受水平的测试结果
未患妊娠合并症组110 119 133 127 141 117 135 122
患有妊娠合并症组120 140 162 184 132 128 177 143 181
39.用中草药治疗不同类型的小儿肺炎,其疗效分为4个等级,结果见表,试比较该药
物对不同类型的小儿肺炎疗效有无差别?
用某中草药治疗不同类型的小儿肺炎的疗效
疗效病毒性肺炎细菌性肺炎合计秩次范围平均秩次合计(1)(2)(3)(4)(5)(6)=(2) (5)
控制65 42 107 1~107 54 2268
显效18 6 24 108~131 119.5 717
有效30 23 53 132~184 158 3634
无效13 11 24 185~208 197 2167
合计126 82 208 8786 40.某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%)(下表),试比较三组吞噬率有无差别?
不同菌种对小鼠巨噬细胞的吞噬率(%)
A菌组B菌组对照组
45.0 64.0 70.0 51.0 62.0 89.0 46.0 44.0
56.0 66.0 71.0 51.0 68.0 91.0 31.0 36.0
56.0 66.0 74.0 54.0 68.0 93.0 56.0 36.0
57.0 66.0 74.0 54.0 70.0 48.0 24.0
60.3 66.0 76.0 59.0 70.0 43.0 18.0
63.0 67.0 73.0 61.0 71.0 24.0 36.0
64.0 70.0 93.0 61.0 70.0 18.0 44.0
64.0 70.0 95.0 61.0 87.0 36.0 36.0
41.欲对三位运动员的综合技术作出评价,以不同专业层次的8位教师对三位运动员的技术作评分(下表),问不同教师对三位运动员技术水平的评价有无不同?
不同教师对三位运动员的技术所作评分
教师编号运动员A 运动员B 运动员C
1 5.3 6.
2 5.8
2 5.5 6.4 6.0
3 5.1 4.8 5.5
4 5.2 5.0 5.5
5 5.3 6.0 5.6
6 5.2 4.9 5.4
7 5.6 6.7 6.0
8 5.5 6.2 5.9
42.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如表,试检验两者有无相关关系?
8个城市的肺癌标化死亡率和大气中苯并(a)芘浓度
城市编号 1 2 3 4 5 6 7 8
肺癌标化死亡率
(1/10万)
5.6 18.50 1
6.23 11.40 13.80 8.13 18.00 12.10
苯并(a)芘
(μg/100m3)
0.05 1.17 1.05 0.10 0.75 0.50 0.65 1.20
43.试就下表资料分析肾重与心重间的关系。
10名成年男子(尸检)肾重与心重检测结果
编号肾重(克)
(x)
心重(克)
(y)
编号
肾重(克)
(x)
心重(克)
(y)
1 333 271 6 340 305
2 357 439 7 369 404
3 361 328 8 312 262
4 30
5 32
6 9 268 255
5 269 27
6 10 354 350
44. 某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果见表。
问患者年龄与疗效间有无关联?
地方性甲状腺肿患者各年龄组疗效观察结果
年龄(岁)
疗效
合计治愈显效好转无效
11~35 1 1 3 40
20~32 8 9 2 51
30~17 13 12 2 44
40~15 10 8 2 35
50~10 11 23 5 49
合计109 43 53 14 219
45. 某医院为探讨流行性出血热临床发病情况和治疗原则之间的关系,得到了446例病情转化资料(下表),试分析早期分度与最后定型之间有无关联。
流行性出血热不同分度病情转化情况
早期分度
最后定型
合计轻型中型重危型
轻度111 21 1 133
中度 5 163 20 188
重度0 1 124 125
合计116 185 145 446
46.某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为三个阶段,失血量分为三个等级,共调查了224例,结果见表。
问失血量的多少与妊娠阶段之间有无关联?
妊娠各阶段胎盘过早剥离者的出血人数分布
妊娠阶段
失血量
合计较少中等较多
早期23 4 6 33
中期47 29 23 99
晚期51 19 22 92
合计121 52 51 224
47.试用表资料分析"右下腹压痛"与"是否患了阑尾炎"之间有无关联?
201例就诊者有无右下腹压痛与手术证实是否患有阑尾炎之间的关系
有无右下腹压痛
是否患有阑尾炎
合计是否
有93 27 120
无15 66 81
合计108 93 201
48.用如下数据计算相关系数,并检验其总体相关系数是否为零;计算回归系数,并检验其总体回归系数是否为零;解释相关系数与回归系数的含义、比较并解释两个检验结果;计算总体回归系数的95%置信区间。
X 2 4 4 5 6
Y 5 6 7 9 12
49.15个儿童的身高与肺死腔容积的观测数据如表所示.
儿童的身高与肺死腔容积的观测数据
对象号身高(cm) 肺死腔容积(ml), Y
1 110 44
2 116 31
3 12
4 43 4 129
45 5 131
56 6 138
79 7 142
57 8 150
56 9 153
58 10 155
92 11 156
78 12 159
64 13 164
88 14 168
112 15 174 101 试用该资料进行相关与回归分析:
(1)计算基本统计量;
(2)计算相关系数;
(3)进行相关系数等于零的假设检验;
(4)计算样本回归方程的截距与回归系数;
(5)进行回归系数等于零的假设检验;
(6)验证是否存在F t t b r == 的关系 ;
(7)估计回归系数β的95%置信区间;
50.研究者调查16个不同地区在某一固定时期内到中心医院的就诊率,同时测量了每一地区中心点到医院的距离,结果如表所示:
16个地区到中心医院的距离和就诊率
地区编号 距离(km )(X ) 就诊率% (Y )
1 6.8 21
2 10.
3 12
3 1.7 30
4 14.2 8
5 8.8 10
6 5.8 26
7 2.1 42
8 3.3 31
9 4.3 21
10 9.0 15
11 3.2 19
12 12.7 6
13 8.2 18
14 7.0 12
15 5.1 23
16 4.1 34
(1) 请用该数据进行回归分析。
(2) 求回归系数的95%置信区间。
51. 为何总体回归线置信带的上下缘是对称于回归线的两条弧形线,而不是平行线?
52. 为何个体值预测带的上下缘曲线要比回归线置信带的上下缘曲线离回归直线更远?
53. 什么是回归系数的标准误?什么是预测值的标准误?后者如何受前者影响?
(1)如果X 的均数为20,Y 的均数为50,X 与Y 的相关系数为r ,试写出Y 依X 的回归方程。
(2)用如下年龄与血红蛋白的检测数据分别拟合简单线性、二次与三次多项式,并评价
何种模型为优?
年龄 6 8 10 12 14 16 18 20 22
HB(克%)10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20
(3)某一食品中不同维生素E含量(X)对小白鼠喂养三月后的增重(Y)数据如下,
试问用何种回归模型最能描述其关系?
X0.34 0.29 0.28 0.42 0.29 0.40 0.66 0.74 0.45 0.60 Y0.62 0.35 0.75 1.35 0.48 0.92 6.35 5.98 2.32 1.15
(4)观察某地破伤风预防接种率与发病率数据如下表所示,试问:何种回归模型最能综
合表达该地破伤风发病率(Y)与预防接种率(X)的关系?
接种率X0.00 0.10 0.20 0.32 0.50 0.66 0.72 0.78 1.00 发病率Y8.70 7.80 5.59 3.53 2.18 1.98 1.85 1.50 1.35
54.给定R2=.44,N =50,k = 12,试计算调整确定系数2
a
R。
55.在多重回归分析中,将某一自变量(X i)的值乘以10,会对该自变量的回归系数产生何种影响?如果是对自变量值乘以10,又会对标准化回归系数产生何种影响?
56.考虑有四个与某疾病有关的因素与该病的患病率资料如表所示,试用该数据进行多重回归分析。
某疾病的患病率与四个影响变量
X1X2X3X4患病率(%)
Y
17 25 14 26 56.9
4 56 24 38 87.4
8 42 12 27 65.4
11 32 9 48 88.5
7 52 7 34 96.2
11 58 10 24 109.2
4 67 1
5
6 103.3
2 34 20 46 82
1 20 18 56 98.7
25 47 6 30 115.8
2 42 24 42 82.6
12 66 12 14 120.3
10 67 9 13 108.8
7 26 6 60 78.5
1 29 15 5
2 74.3
12 56 9 21 102.2
4 62 37 2
5 78.8
57.获得年龄与血红蛋白测量数据如下,试用该数据拟合简单线性、二次、三次多项式模型,并评价模型的拟合优度。
年龄中值 6 8 10 12 14 16 18 20 22 HB(g%)10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20
58. 如表是随机抽取的11名儿童的智力测试数据,试以IQ为因变量拟合多重线性回归模型。
并讨论本例应用回归分析所存在的问题。
儿童智力测试数据
常识X1 算术
X2
理解
X3
拼图
X4
积木
X5
译码
X6
IQ
Y
14 13 28 14 22 39 54
10 14 15 14 34 35 37
12 12 19 13 24 39 28
7 8 7 9 20 24 19
13 12 24 12 26 38 36
19 15 23 16 24 38 28
19 16 26 21 38 69 53
9 10 14 9 31 46 40
10 8 15 13 15 43 51
9 8 12 10 22 43 55
12 10 20 14 12 28 42 59.根据下表的数据,计算:
①奥克拉荷马州和蒙塔那州的标准化死亡率;
②奥克拉荷马州和蒙塔那州的期望寿命。
美国1960年的人口分布及两个州的死亡率
年龄1960年美国人口
(千人)
奥克拉荷马州
死亡率r i(‰)
蒙塔那州
死亡率r i(‰)
0~4112 25.5 25.8
1~16209 1.2 1.2
5~35456 0.5 0.5
15~24020 1.2 1.6
25~22818 1.6 1.8
35~24081 2.9 3.1
45~20486 6.9 7.5
55~15572 14.8 16.3
65~10997 32.4 37.3
75~4634 79.0 87.3
85~929 190.4 202.8
合计179323
取自:Grove , R. D., and Hetzel,A.M.(1963). Vital Statistics Rates in the United States, 1940-1960.
National Center for Health Statistics, Washington DC.
60.根据表16-14的资料编制简略寿命表,并且分别将0岁组死亡率和60岁组死亡率改变为原来的50%、30%、10%再计算其期望寿命,比较0岁组期望寿命的变化。
1958年中国某山区少数民族男性人口数、死亡数
年龄组人口数死亡数年龄组人口数死亡数
0~99997 3521 40~90555 1651
1~96494 1156 45~88908 2439
5~95339 630 50~86484 3857
10~94621 438 55~82622 5789
15~94230 454 60~76840 8407
20~93856 637 65~68430 11508
25~93157 648 70~56923 14705
30~92471 829 75~42220 16329
35~91666 1112 80~25890 25890 61.2002年云南某地女性人口数、死亡数和肿瘤死亡数见表.
(1)请编制全死因简略寿命表。
(2)编制去肿瘤死亡后的去死因寿命表。
2002年云南某地女性人口数、死亡数和肿瘤死亡数资料
年龄组人口数死亡数肿瘤死亡数年龄组人口数死亡数肿瘤死亡数
0- 29890 563 1 45- 90756 265 153 1- 87540 113 3 50- 85671 429 196 5- 99862 120 9 55- 70682 598 292 10- 139541 135 13 60- 63842 894 348 15- 195424 155 15 65- 40685 1123 405 20- 211138 196 19 70- 30857 1568 269 25- 186543 234 37 75- 10364 1684 107 30- 126952 201 48 80- 4216 785 79 35- 103280 198 56 85- 986 452 11 40- 91258 210 76
62. 真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况列于表, 请分析不同治疗方案的白血病发病率及其相对危险性。
真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况
治疗方案治疗人数白血病发病人数
未接受放射治疗133 1
接受X-线治疗 79 7
接受P32 治疗228 25
接受X-线 + P32 治疗 72 12
合计512 45
63. 一项石棉与肺癌死亡的历史前瞻性研究结果列于表, 试用分层分析方法阐明石棉对肺癌发病的影响, 并与不分层的分析结果相比较。
石棉与肺癌死亡的历史前瞻性研究资料
石棉工人非石棉工人
工龄(年)
人年数死亡数死亡率人年数死亡数死亡率10~89462 36 4.02 74395 14 1.88
20~51925 164 31.58 62528 86 13.75
30~17001 177 104.11 19360 96 45.59
40~8465 109 128.77 7236 41 56.66
合计166853 486 29.13 163519 237 14.49
64. 就第63题的资料(资料引自: 陈镜群主编: 职业流行病学)分别考察石棉工人中和非石棉工人中肺癌死亡率是否有随年龄上升的趋势。
65.一项膀胱癌患者及对照者吸烟史的病例-对照研究资料列于表, 试分析膀胱癌与吸
烟史之间的关系。
膀胱癌患者及对照者吸烟史资料
观察组有吸烟史无吸烟史合计
膀胱癌患者192 129 321
对照者156 181 337
合计348 310 658
66. 一项心肌梗塞发生前饮酒量的病例-对照研究结果列于表, 试计算优势比并进行趋势检验。
心肌梗塞患者及对照者的每日饮酒量
每日饮酒量(g) 病例数对照数
0 136 110
0~100 202 238
100~200 42 46
250+ 11 24
调查总数391 418
67. 两个重要命题:病例-对照研究中不同疾病状态下暴露于危险因素这一事件的优势之比等于追踪研究中不同暴露水平下发病这一事件的优势之比; 在发病率很低(如小于1%)的情况下, 后者很接近相对危险度。
(1)以D和D表示病例和对照,E和E表示暴露和无暴露,试用条件概率
()D E P,()D E P,()D E P和()D E P以及()E D P,()E D P,()E D P和()E D P表示上述两
种优势比。
(2)试利用Bayes公式证明这两种优势比相等。
(3) 证明发病率很低时, 后者很接近相对危险度。
68. 一项乳腺癌与授乳史关系的1:1配对病例-对照研究资料列于表, 试计算优势比以分析有无授乳史对乳腺癌发病的影响。
如果按非配对公式计算优势比, 其数值有何变化?
乳腺癌与授乳关系的1:1配对病例-对照研究资料
乳腺癌病人的授乳史
对照者授乳史有授乳史无授乳史合计
有授乳史27 65 92
无授乳史23 43 66
合计50 108 158
69. 42名确诊的白血病患者被随机分为2组,其中一组服用6-疏嘌呤(6-MP),另一组服安慰剂,服药后症状缓解时间如表所示。
试估计两组缓解率并绘制生存曲线,给出各组中位缓解时间并推断生存曲线是否不同?
70. 为探讨某恶性肿瘤的预后,收集了31名该肿瘤患者的生存时间T(月)、结局Y(0为死亡,1为删失)及可能的影响因素。
影响因素包括病人年龄age (岁)、性别sex (1男,0女)、组织学类型type(1为高分化,0为低分化)、治疗方式treat (1为传统方法,0为新方法)、是否有淋巴结转移lym(1是,0否)等。
分别作每个自变量的单因素Cox回归、包括所有自变量的多因素Cox回归以及逐步回归,结果如表1、表2和表3所示,试就此结果做出你认为合理的分析结论。
表1 31名恶性肿瘤患者生存资料单因素Cox回归结果
变量自由度回归系数b b的标准误2χP值-2ln(L) RR∧RR95%置信区间上限下限
age 1 -0.00251 0.02074 0.0146 0.9037
133.893 0.997 0.958
1.039
sex 1 1.25673 0.46349 7.3519 0.0067
125.795 0.285 0.115 0.706
0.151 0.827
type 1 1.04060 0.43375 5.7557 0.0164
128.140 0.353
treat 1 0.56352 0.47830 1.3881 0.2387
132.406 1.757 lym 1 -0.37253 0.45450 0.6718 0.4124
133.206 0.689 0.688 4.486
0.283
1.679
表2 31名恶性肿瘤患者生存资料多因素Cox回归结果(-2ln(L)=104.979)
变量自由度回归系数b b的标准误2χP值
RR∧RR95%置信区间上限下限。