统计学二项分布习习题

合集下载

统计学 练习题

统计学 练习题

注:关于运用EXCEL进行统计分析的练习,参考上机材料“统计实训指导-EXCLE2010版本.doc”。

第1章引论一、判断题(在前后面括弧内,正确的画√,错误的划×)【V】1、所谓统计学规律性,就是大量现象的数量规律性。

【V】2、《政治算术》的作者是威廉·配第。

【V】3、统计指标一定能够用数量表达。

【V】4、统计学是一门如何搜集、整理、分析数据的方法论科学。

【X】5、统计研究所关注的是个体的数量特征,而不是总体的数量特征。

【X】6、统计调查过程中采用的大量观察法,是指观察的个体越多越好。

【X】7、样本中包含的个体个数称为样本个数。

【X】8、电话号码是定量数据。

第2章数据的收集一、单选题(下列每小题备选答案中,只有一个最佳答案)【D】1、构成统计总体的个别事物称为A、调查单位B、标志值C、样本D、总体单位【B】2、对某城市工业企业未安装设备进行普查,总体单位是A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业企业【A】3、下列数据属于定类数据的是A.专业:工商管理、工程管理 B.出生年:1986年、1987年C.统计学成绩:优、良 D.年龄:20岁、21岁【B】4、下列数据属于定序数据的是A.专业:工商管理、工程管理 B.出生年:甲子年、乙丑年C.学生人数:20人、30人 D.年龄:20岁、21岁【D】5、在各种类型的数据中,有绝对零点的数据是A.定类数据 B.定序数据 C.定距数据 D.定比数据【D】6、抽样调查的主要目的是A、随机抽取样本单位B、对调查单位作深入研究C、计算和控制抽样误差D、用样本指标来推算或估计总体指标【A】7、下列调查中,哪个一定属于全面调查A、普查B、重点调查C、典型调查D、抽样调查【A】8、普查是为了某种特定的目的而A、专门组织的一次性的全面调查B、专门组织的非全面调查C、非专门组织的一次性的全面调查D、非专门组织的经常性的全面调查【D】9、要了解上海市居民家庭的收支情况,最适合的调查方式是A、普查B、重点调查C、统计报表制度D、抽样调查【A】10、下例调查中,最适合采用重点调查的是A、了解全国钢铁生产的总量情况B、了解全国经济增长速度C、了解上海市居民家庭的收支情况D、了解某校学生的学习情况【B】11、为了了解某产品的市场销售情况,而到销量最大的10家商场搜集其销售记录,这种数据搜集方式属于A.抽样调查 B.重点调查 C.普查 D.统计报表制度【D】12、中秋节对某商场的月饼质量进行调查,最宜使用的调查方式是A.普查 B.重点调查 C.典型调查 D.随机抽样调查【B】13、对某地区工业企业职工进行调查,调查对象是A、各工业企业B、各工业企业的全体职工C、一个工业企业D、每一位职工【D】14、为了了解新生的外语成绩,从全校新生110个班中随机抽出20个班,计算这20个班的每个学生平均分,这种抽样组织形式属于A.机械抽样 B.多阶段抽样 C.分层抽样 D.整群抽样【D】15、从N个元素组成的总体中抽取n个元素作为样本,并且总体中每一个元素被抽到的机会相同,这样的抽样组织形式称为A.整群抽样 B.分层抽样 C.分层抽样 D.纯随机抽样【C】16、农业调查中,把耕地按地形分为山区、丘陵、平原,然后分别从各种地形中抽取一部分地块组成样本,这种抽样组织形式属于A.整群抽样 B.多阶段抽样 C.分层抽样 D.机械抽样二、判断题(在前后面括弧内,正确的画√,错误的划×)【X】1、全面调查和非全面调查的划分依据就是调查结果是否包括被调查单位各方面的数据。

统计学(第二版)课后答案

统计学(第二版)课后答案

附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。

(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 4610.015.035~40 40~45 45~50 159637.522.515.0合计40 100.0 直方图(略)。

2.4 (1)排序略。

(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。

2.5 (1)属于数值型数据。

(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。

2.6 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。

2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。

(2)17.21=s (万元)。

2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

统计样本和总体的分析练习题

统计样本和总体的分析练习题

统计样本和总体的分析练习题1. 引言统计学是用来研究从观察数据中获取知识和信息的科学方法。

在统计学中,样本和总体是两个基本的概念。

样本是指从总体中抽取的一部分数据,而总体则是所有有关个体或对象的信息。

了解如何进行样本和总体的分析是统计学的基础,本文将通过练习题的形式来加深对这一概念的理解。

2. 练习题1某企业有100名员工,其中50人是男性,50人是女性。

现在从中随机抽取10个员工,问:(1)抽到的员工中有多少男性,多少女性?(2)抽样并得到的结果是否具有代表性?解答:(1)依据题意,从100名员工中随机抽取10个员工,可以使用统计学中的二项分布进行分析。

设X为男性员工的数量,则X服从二项分布B(10,0.5)。

P(X=0) = C(10,0) × (0.5)^0 × (1-0.5)^10 = 0.00098P(X=1) = C(10,1) × (0.5)^1 × (1-0.5)^9 = 0.00977P(X=2) = C(10,2) × (0.5)^2 × (1-0.5)^8 = 0.04395P(X=3) = C(10,3) × (0.5)^3 × (1-0.5)^7 = 0.11719P(X=4) = C(10,4) × (0.5)^4 × (1-0.5)^6 = 0.20508P(X=5) = C(10,5) × (0.5)^5 × (1-0.5)^5 = 0.24609P(X=6) = C(10,6) × (0.5)^6 × (1-0.5)^4 = 0.20508P(X=7) = C(10,7) × (0.5)^7 × (1-0.5)^3 = 0.11719P(X=8) = C(10,8) × (0.5)^8 × (1-0.5)^2 = 0.04395P(X=9) = C(10,9) × (0.5)^9 × (1-0.5)^1 = 0.00977P(X=10) = C(10,10) × (0.5)^10 × (1-0.5)^0 = 0.00098根据上述计算结果可知,在随机抽取的10个员工中,男性员工的数量和女性员工的数量服从二项分布,并可通过计算得到相应的概率。

医学统计学二项分布

医学统计学二项分布

率20的21/抽12样/11误差
从 =中随机抽样,样本含量为100的 10000个样本率的频率分布图
率20的21/抽12样/11分布特点 当总体率时为正偏态;当时为负偏态,当时为对称分布。 在n较大,且率和(1- )都不太小时即n和n(1-)均大于5,率的抽样分布近似正态分布。
率20的21/标12准/11误
二20项21/分12布/11(binomial distribution)
二分类资料:观察对象的结局只有相互对立的两种结果。
例如:
生存、死亡 阳性、阴性 发病、不发病 治愈、未愈
先20看21/一12个/11例子
已知:小白鼠接受某种毒物一定剂量时, 死亡概率=80% 生存概率=20%
每只鼠独立做实验,相互不受影响 若每组各用3只小白鼠(甲、乙、丙) 3只小白鼠的存亡方式符合二项分布
医学统计学二项分布
主20要21/内12容/11
数据分布 二项分布
数20据21/分12布/11
对于一组变量值,若以该变量为横轴,数据出现的频数(或频率)为纵轴作图,该数据在坐标 系中呈一定的图形,称为数据的分布。
数20据21/分12布/11
分布是统计方法产生的基础 常用的数据分布有正态分布、二项分布、Poisson分布等
Page 17
2021/12/11
如已知n=3,,则恰有1例阳性的概率P(1)为:
P(1)
C
1 n
(1
) n1
1
3! 1!(3 1)!
(1
0.8)31 0.81
0.096
二项分布的概率
2021/12/11
• 例已知某种动物关于某毒物的50%致死剂量(LD50),现有5只这样的动物注射了该剂量,试 分别计算死亡动物数X=0,l,2,3,4,5的概率。

统计学(第三版课后习题答案

统计学(第三版课后习题答案

18.29(元);原因:尽管两个企业的单位成本相同,但单位
成本较低的产品在乙企业的产量中所占比重较大,因此拉低了
总平均成本。
2.11 =426.67(万元);(万元)。
2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不
多相同,因为均值和标准差的大小基本上不受样本大小的影
响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因
错误。
6.5 (1)检验统计量,在大样本情形下近似服从标准正态分布;
Hah 和网速是无形的
1:各章练习题答案
2.1 (1) 属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质 家庭数 频率%
量等级 (频率)
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计 100
100
(3)条形图(略)
2.2 (1)频数分布表如下:
40个企业按产品销售收入分组表
幼儿组身高的离散系数:;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿
组身高的离散程度相对较大。
2.15 下表给出了一些主要描述统计量,请读者自己分析。
方法
方法
方法
A
B
C
平均 165.6 平均 128.73 平均 125.53
中位
中位
中位
数 165 数 129 数 126
众数 164 众数 128 众数 126
为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (10)第6章统计量及其抽样分布 (11)第7章参数估计 (11)第8章假设检验 (13)第9章分类数据分析 (14)第10章方差分析 (16)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (30)第1章导论 (30)第2章数据的搜集 (30)第3章数据的图表展示 (30)第4章数据的概括性度量 (31)第5章概率与概率分布 (32)第6章统计量及其抽样分布 (33)第7章参数估计 (33)第8章假设检验 (34)第9章分类数据分析 (34)第10章方差分析 (36)第11章一元线性回归 (37)第12章多元线性回归 (38)第13章时间序列分析和预测 (40)第14章指数 (41)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

统计学习题

统计学习题

考核分为3部分:1. 平时成绩,主要以到课情况为依据。

一般占总成绩10%左右。

2. 上机SAS软件操作考试。

一般占总成绩的20%~40%。

3. 期末卷面理论考核,占总成绩的50%~70%。

下面的统计学试题供同学们参考:《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体(population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异(variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是:A.这300名高血压患者B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。

统计学练习题

统计学练习题

第一部分:单选题(一)1、一位教授计算了全班20个学生考试成绩均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?()A 全班65%的同学的考试成绩高于平均值B全班65%的同学的考试成绩高于中数C全班65%的同学的考试成绩高于众数D全班同学的考试成绩是负偏态2、一个N=10的总体,若其离差平方和是200,则其离差的和Σ(X i-μ)是()A 14.14B 200C 数据不足,无法计算D 以上都不对3、中数在一个分布中的百分等级是()。

A 50B 75C 25D 50~514、平均数是一组数据的()。

A 平均差B 平均误C 平均次数D 平均值5、六名考生在作文题上的得分为12、8、9、10、13、15,其中数为()。

A 12B 11C 10D 96、下列描述数据集中情况的统计量是()。

A M M dμB M0 M d SC S ωσD M M d M g7、对于下列实验数据:1,108,11,8,5,6,8,8,7,11,描述其集中趋势用()最为适宜,其值是()A 平均数,14.4B 中数,8.5C 众数,8 D众数,118、一个n=10的样本其均值是21,在这个样本中增添了一个分数,得到的新样本均值是25,这个增添的分数值为()。

A 40B 65C 25D 219、有一组数据其均值是20,对其中的每一个数据都加上10,那么得到的这组新数据的均值是()。

A 20B 10C 15D 3010、有一组数据其均值是25,对其中的每一个数据都乘以2,那么得到的这组新数据的均值是()。

A 25B 50C 27D 211、一个有10 个数据的样本,它们中的每一个分别与20相减后所得的差相加是100,那么这组数据的均值是()。

A 20B 10C 30D 5012、下列数列4、6、7、8、11、12的中数为()。

A 7.5B 15C 7D 813、下列易受极端数据影响的统计量是()。

统计学二项分布

统计学二项分布

统计学二项分布统计学中的二项分布是一种重要的离散概率分布,广泛应用于各个领域的实际问题中。

本文将介绍二项分布的概念、特点以及相关的应用。

一、二项分布的概念二项分布是指在n次独立重复试验中,成功事件发生的次数X服从的概率分布。

其中,每次试验的成功概率为p,失败概率为q=1-p。

二项分布的概率质量函数可以表示为P(X=k)=C(n,k)*p^k*q^(n-k),其中C(n,k)表示组合数。

二、二项分布的特点1. 二项分布的取值范围是0到n,表示成功事件发生的次数。

2. 二项分布是离散分布,因为试验结果只能是整数。

3. 二项分布的期望值和方差分别为E(X)=np和Var(X)=npq。

4. 当n趋向于无穷大时,二项分布逼近于正态分布。

三、二项分布的应用1. 品质控制:在生产过程中,可以利用二项分布来进行抽样检验,判断产品合格率是否满足要求。

2. 市场调研:在调查问卷中,可以利用二项分布来统计不同选项的选择情况。

3. 生物统计学:在遗传学研究中,可以利用二项分布来分析基因型的分布情况。

4. 投资决策:在金融领域,可以利用二项分布来评估风险和回报的概率。

四、二项分布的实例分析假设某种产品的合格率为0.8,现在从中抽取10个产品进行检验,问其中恰好有8个产品合格的概率是多少?根据二项分布的概率质量函数,可以计算出P(X=8)=C(10,8)*0.8^8*0.2^2=0.301。

这意味着从10个产品中抽取8个合格的概率为30.1%。

可以看出,该产品合格率较高,相对来说,抽取8个合格产品的概率也相对较大。

五、总结二项分布作为统计学中的一种重要概率分布,具有广泛的应用场景。

通过对二项分布的研究,我们可以更好地理解和分析实际问题中的概率情况。

在实际应用中,我们可以根据二项分布的特点和公式进行计算和分析,从而得出有价值的结论。

通过深入了解二项分布,我们可以更好地应用统计学知识解决实际问题。

医学统计学题库完整

医学统计学题库完整

医学统计学题库完整第⼀章绪论习题⼀、选择题1.统计⼯作和统计研究的全过程可分为以下步骤:(D )A. 调查、录⼊数据、分析资料、撰写论⽂B. 实验、录⼊数据、分析资料、撰写论⽂C. 调查或实验、整理资料、分析资料D. 设计、收集资料、整理资料、分析资料E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为⼩概率事件。

A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.⾓度资料3.某偏僻农村144名妇⼥⽣育情况如下:0胎5⼈、1胎25⼈、2胎70⼈、3胎30⼈、4胎14⼈。

该资料的类型是( A )。

4.分别⽤两种不同成分的培养基(A 与B )培养⿏疫杆菌,重复实验单元数均为5个,记录48⼩时各实验单元上⽣长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。

该资料的类型是(C )。

5.空腹⾎糖测量值,属于( C )资料。

6.⽤某种新疗法治疗某病患者41⼈,治疗结果如下:治愈8⼈、显效23⼈、好转6⼈、恶化3⼈、死亡1⼈。

该资料的类型是(B )。

7.某⾎库提供6094例ABO ⾎型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。

该资料的类型是(D )。

8. 100名18岁男⽣的⾝⾼数据属于(C )。

⼆、问答题1.举例说明总体与样本的概念.答:统计学家⽤总体这个术语表⽰⼩异的对象全体,通常称为⽬标总体,⽽资料常来源于⽬标总体的⼀个较⼩总体,称为研究总体。

实际中由于研究总体的个体众多,甚⾄⽆限多,因此科学的办法是从中抽取⼀部分具有代表性的个体,称为样本。

例如,关于吸烟与肺癌的研究以英国成年男⼦为总体⽬标,1951年英国全部注册医⽣作为研究总体,按照实验设计随机抽取的⼀定量的个体则组成了研究的样本。

统计学王文华练习题

统计学王文华练习题

统计学王文华练习题一、基本概念与数据收集1. 列举统计学中的四大基本概念。

2. 简述抽样调查与全面调查的区别。

3. 如何判断数据的准确性、完整性和可靠性?4. 举例说明什么是品质数据,什么是数值数据。

5. 简述数据收集的步骤。

二、数据的整理与展示4. 简述直方图与条形图的区别。

5. 如何选择合适的统计图表展示数据?三、描述统计量5. 简述标准差的意义。

四、概率与概率分布1. 抛掷一枚硬币,求正面朝上的概率。

2. 从一副52张的扑克牌中随机抽取一张,求抽到红桃的概率。

3. 简述随机变量与概率分布的关系。

4. 举例说明离散型随机变量与连续型随机变量的区别。

五、统计推断1. 简述参数估计与假设检验的区别。

2. 举例说明点估计与区间估计。

3. 如何计算一个样本的置信区间?4. 简述假设检验的基本步骤。

六、回归分析与相关分析1. 简述线性回归与非线性回归的区别。

2. 举例说明简单线性回归模型。

3. 如何计算相关系数?5. 简述多元线性回归的基本概念。

七、时间序列分析与预测1. 简述时间序列的组成部分。

2. 举例说明趋势、季节性、周期性和随机波动在时间序列中的作用。

3. 如何对时间序列数据进行平稳性检验?4. 简述移动平均法和指数平滑法的基本原理。

5. 计算一个简单的时间序列的AR(1)模型参数。

八、统计软件与应用1. 列举三种常用的统计软件。

2. 简述如何使用Excel进行数据分析。

3. 如何在R语言中导入数据并进行基本的数据清洗?4. 举例说明如何在SPSS中进行线性回归分析。

5. 简述Python中Pandas库的基本功能。

九、多变量统计分析1. 简述主成分分析的基本原理。

2. 举例说明聚类分析的应用场景。

3. 如何进行因子分析?4. 简述判别分析的基本步骤。

十、实验设计与质量控制1. 简述完全随机设计、随机区组设计和拉丁方设计的特点。

2. 举例说明如何在实验中应用因素分析。

3. 简述质量控制图的基本原理。

统计学习题答案 第3章 概率与概率分布

统计学习题答案 第3章  概率与概率分布

第3章 概率与概率分布——练习题(全免)1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。

试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。

并说明几个计算结果之间有何关系?解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/22. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。

试求这种零件的次品率。

解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A )的概率()P A 。

考虑逆事件A =“任取一个零件为正品”,表示通过三道工序都合格。

据题意,有:()(10.2)(10.1)(10.1)0.648P A =---=于是 ()1()10.6480.352P A P A =-=-=3. 已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。

试求任一参考人员成绩优秀的概率。

解:设A 表示“合格”,B 表示“优秀”。

由于B =AB ,于是)|()()(A B P A P B P ==0.8×0.15=0.124. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。

某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。

求该选手两发都脱靶的概率。

解:设A =第1发命中。

B =命中碟靶。

求命中概率是一个全概率的计算问题。

再利用对立事件的概率即可求得脱靶的概率。

)|()()|()()(A B P A P A B P A P B P +==0.8×1+0.2×0.5=0.9脱靶的概率=1-0.9=0.1或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.15.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。

统计学(第三版课后习题答案

统计学(第三版课后习题答案

Hah 和网速是无形的1:各章练习题答案2.1 (1)属于顺序数据。

(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。

2.4 (1)排序略。

(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。

2.5 (2)分组结果如下:分组天数(天)-25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60(3)直方图(略)。

2.6 (1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.7 (1)茎叶图如下:(2)A 且平均成绩较A 班低。

2.82.9 L U (2)17.21=s (万元)。

2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

期末复习题---统计学

期末复习题---统计学

期末复习题---统计学第⼀章1.总体是指()。

A 我们所要研究的所有基本单位的总和B 个体的数量⽅⾯C 总体单位具有的特征或属性D ⼀部分单位2.统计所研究的是()。

A 总体的数量⽅⾯B 个体的数量⽅⾯C 总体或个体的数量⽅⾯D 总体或个体的属性⽅⾯3.《政治算术》学派的代表⼈物是()A.海门尔.康令B.阿亨⽡尔C.威廉.配第D.凯特勒第⼆章⼀、单选1.平均指标反映( )。

A. 总体分布的集中趋势B. 总体分布的离散趋势C. 总体分布的⼤概趋势 D. 总体分布的⼀般趋势2. 众数是()。

A. 出现次数最少的次数B. 出现次数最少的标志值C. 出现次数最多的标志值 D. 出现次数最多的频数3、加权算术平均数的⼤⼩()。

A. 主要受各组标志值⼤⼩的影响,⽽与各组次数的多少⽆关B. 主要受各组次数⼤⼩的影响,⽽与各组标志值的多少⽆关C. 既受各组标志值⼤⼩的影响,⼜受各组次数多少的影响D. 既与各组标志值的⼤⼩⽆关,也与各组次数的多少⽆关4、从均值为100、标准差为10的总体中,抽出⼀个的简单随机样本,样本均值的数学期望和⽅差分别为()。

A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2 5.数据的计量尺度由低到⾼、由粗到精可以分为()。

A .列名尺度、间隔尺度、⽐率尺度、顺序尺度B .间隔尺度、列名尺度、⽐率尺度、顺序尺度50 nC.列名尺度、顺序尺度、间隔尺度、⽐率尺度D.列名尺度、⽐率尺度、顺序尺度、间隔尺度6.在⼀组数据中,每个数据类型出现的次数称为()。

A.参数 B.频数 C.众数 D.组数7.对于右偏分布,均值、中位数和众数之间的关系是()A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数8、企业按资产总额分组()A:只能使⽤品质标志分组; B:只能使⽤组距式分组;C:可以⽤品质标志分组,也可以⽤组距式分组;D:⽆法分组。

9、权数对算术平均数的影响作⽤,实质上取决于()。

统计学导论习题解答

统计学导论习题解答
1、确定分布类型:二项分布
2、确定参数n=100,p=0.51
P(X=51)0.0796 Matlab代码:a=binopdf(51,100,0.51)
27
练习2.4.5
分析:设X为在10次试验中出现点数之和为 8的次数.
1、确定分布类型:二项分布 2、确定参数n=10, p=5/36 P(X=1)0.3616 Matlab代码:a=binopdf(1,10,5/36)
2、确定参数=399/35=11.4
(1) P( =0)1.1195×10-5 Matlab代码:a1=poisspdf(0, 11.4)
30
练习2.4.10 (2) P( <20)= P( 19) 0.9868 Matlab代码:a2=poisscdf(19, 11.4) (3) P( 20)= 1-P( 19) 0.0132
(3)至少有三个发生
ABC ABD ACD BCD
(4)至多一个发生
A B C D AB C D A BC D A B CD A B C D
8
练习2.1.4
Ak 表示一小时内至多有k-1次呼唤;
Ak Ak 1 表示一小时内有k次呼唤.
9
练习2.1.7 解:“当掷一枚骰子时,出现‘1点’的 概率是1/6”的含义:
且A ( B AB) , AB B
P A B P( A) P( B AB) P( A) P( B) ( AB)
13
练习2.2.12 证明:假设 P( A) P( B) ,那么 P( A) P( B) P( A)
P ( A B ) P ( A) P ( B ) P ( A B ) P( B) P( A B) P ( A B ) P ( A) P ( A) P ( B ) 另一方面 (P ( A) P ( B )) P ( A B ) 2 2 P ( A) ( P ( A) P ( B ) P ( A B )) P ( A) P ( B ) P ( A B ) P( A B) 0 P ( A B ) (P ( A) P ( B )) 2 综上所述,题设成立。

华北理工卫生统计学实验指导06常用概率分布

华北理工卫生统计学实验指导06常用概率分布

实验六:常用概率分布【目的要求】1.掌握正态分布的特点和面积分布规律,掌握参考值范围的制定方法。

2.掌握二项分布、泊松分布的正态近似。

【案例分析】案例1: 2000年某地艾滋病病毒感染率为十万分之七,该地10万人口,2001年感染了艾滋病病毒的人数为17人,有人说,该地2001年总体上艾滋病病毒感染率与2000年持平。

如果是这样的话,该地2001年感染了艾滋病病毒人数为17人这种情况发生的概率为0006.0!177)17(177===-eX P 因为发生的概率太小了,所以说该地2001年总体上艾滋病病毒感染率与2000年持平的说法是不成立的。

该分析是否正确,为什么?【练习题】一、填空题1. 分布的总体均数等于总体方差。

2.二项分布在 时服从正态分布。

3. 泊松分布在 时服从正态分布。

4.确定医学参考值范围的方法有 和 。

二、选择题1.标准正态分布的均数与标准差是( )A. 0,1B. 1,0C. 0,0D. 1,1 2.正态分布的两个参数μ与 σ,( )对应的正态曲线愈趋扁平。

A. μ愈大 B. μ愈小 C. σ愈大 D. σ愈小 3.正态分布的两个参数μ与 σ,( )对应的正态曲线平行右移。

A. 增大μ B. 减小μ C. 增大σ D. 减小σ4. 随机变量X 服从正态分布N(μ1,σ12),随机变量Y 服从正态分布N(μ2,σ22),X 与Y 独立,则X-Y 服从( )A. N(μ1+ μ2,σ12- σ22)B. N(μ1- μ2,σ12- σ22)C. N(μ1-μ2,σ12+σ22)D. N(0σ12+σ22) 5. 二项分布的概率分布图在( )条件下为对称图形。

A. n>50 B. π=0.5 C. n=1 D. π=1 6.( )的均数等于方差。

A. 正态分布B. 二项分布C. Poisson 分布D. 对称分布7. 设X1,X2分别服从以λ1,λ2为均数的Poisson 分布,且X1,X2独立,则X1+X2服从以( )为方差的Poisson 分布。

统计习题——精选推荐

统计习题——精选推荐

统计习题习题《卫⽣统计学》第五版(五年制预防医学⽤)(⼀)名词解释与简答题1.名词解释(1)负担系数(2)总和⽣育率(3)⽣存率(4)潜在减寿年数(5)试⽐较发病率与患病率, 死亡率与病死率。

2、简述⼆项分布、Poisson分布、正态分布的区别与联系。

3、简述控制图的基本原理。

4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。

5、样本均数的抽样分布有何特点?6、样本均数的标准误的意义是什么?与标准差有何区别和联系?7、与标准正态分布⽐较,t分布的特点是什么?8、⽤同⼀份样本指标去估计总体参数的95%置信区间与99%置信区间,两者⽐较,哪⼀个估计的精度好?为什么?9、假设检验的理论依据是什么?10、假设检验的两类错误之间的区别与联系是什么?11、t检验的应⽤条件是什么?12、假设检验中P值的意义是什么?13、如何确定检验⽔准?14、如何恰当地应⽤单侧与双侧检验?15、什么情况下可以借⽤正态近似法估计总体概率的置信区间?16、简述2χ检验的⽤途。

17、⽐较两个独⽴样本频数分布的χ2检验,和⽐较配对样本两个频数分布的χ2检验在设计⽅法、资料整理、假设检验等⽅⾯的差别是什么?18、举例说明如果实验效应⽤等级资料表⽰,⽐较两组总体效应间差别是否有统计学意义为什么不能⽤2χ检验?19、为什么有些四格表(或R×C表)必须要计算确切概率?20、实验研究和调查研究的根本区别是什么?22、在临床试验中使⽤安慰剂的⽬的是什么?23、随机化的⽬的是什么?24、试验设计的基本要素包括哪些?25、估计样本含量时,所定容许误差与样本量有何关系?26、配对设计的⽬的是什么?27、避免医⽣和病⼈对实验效应观察的偏性,设计时应注意什么?28、为明确某新化妆品对⽪肤有⽆损害作⽤,将12只⼤⽩兔的左背部涂抹该化妆品,右侧涂⽣理盐⽔作为对照,72⼩时后观察⽪肤反应。

这属于什么对照?29、琴纳⽤⽜痘疫苗接种23⼈后再接种天花,结果⽆⼈患天花,⽽当时⼀般⼈接触天花病⼈后,天花的发病率约90%。

统计学练习题2答案

统计学练习题2答案

统计学练习题2答案1.重点调查中的重点单位是指A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是。

A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。

由此可知两个班考试成绩的离散程度A.甲班较大B.乙班较大C.两班相同D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为A.520公斤B.530公斤C.540公斤D.550公斤5.时间序列若无季节变动,则其各月季节指数应为 A.100% B.400% C.120% D.1200%6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是A. 上升趋势B.下降趋势C.水平态势D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买的商品。

A.10.71%B.21.95%C.12%D.13.64%8.置信概率表达了区间估计的A.精确性B.可靠性C.显著性D.规范性9.H0:μ=μ0,选用Z统计量进行检验,接受原假设H0的标准是A.|Z|≥ZαB.|Z|-Zα10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题1.抽样调查的特点有。

A.抽选调查单位时必须遵循随机原则B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是A. 单位成本计划完成程度为80%B. 单位成本计划完成程度为101.05%C.没完成单位成本计划D.完成了单位成本计划E.单位成本实际比计划少降低了1个百分点3.数据离散程度的测度值中,不受极端数值影响的是 A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数4.下列指标属于时点指标的是A.增加人口数B.在校学生数C.利润额D.商品库存额E.银行储蓄存款余额5.两个变量x与y之间完全线性相关,以下结论中正确的是A.相关系数 ?r?=1B.相关系数 ?r?=0C.估计标准误差Sy=0D.估计标准误差Sy=1E.判定系数r2=1F.判定系数r2=0五、简答题加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

欢迎阅读
(一)单项选择题
1.某地人群中高血压的患病率为π,由该地区随机抽查n 人,则( )
A .样本患病率p =X /n 服从
B (n , π)
B .n 人中患高血压的人数X 服从B (n , π)
C .患病人数与样本患病率均不服从B (n , π)
D .患病人数与样本患病率均服从B (n , π)
答案:B
[评析] 本题考点:二项分布概念的理解。

二项分布中所指的随机变量X 代表n 次试验中出现某种结果的次数,具体到本题目就是指抽查的n
2 [n ,π)案为D 。

3. A C [记。

4. 95% A C [评析]本题考点:Poisson 分布的正态近似性。

当X 较大(一般大于50)时,Poisson 分布近似正态分布,按照正态分布资料的计算公式计算该地区井水中平均每升细菌含量的95%可信区间,再除以1000即得平均每毫升井水中细菌的平均含量(设1000X Y =,有1000100001000==X Y S S )。

(二) 是非题
从装有红、绿、蓝三种颜色的乒乓球各500、300、200只的暗箱中随机取出10个球,以X 代表所取出球中的红色球数,则X 服从二项分布B (10,0.5)。

( )
答案:正确。

[评析] 本题考点:二项分布的定义。

二项分布成立的条件是:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。

此题目所述情况完全满足后两个条件,关键在于第一个条件的判断,从表面上看,每次试验的结果有三种,但本题目所关心的试验结果是“红色与否”,因而该试验结果仍为两种互斥的情况—“红色”和“非红色”。

所以,此题目所述情况满足以上三个条件,X服从二项分布B (10,0.5)。

(三)计算题
炮击命中目标的概率为0.2,共发射了14发炮弹。

已知至少要两发炮弹命中目标才能摧毁之,试求摧毁目标的概率。

答案:0.802
[评析]本题的考点:二项分布概率函数的理解和应用能力。

摧毁目标的概率即有两发或两发以上炮弹命中目标的概率,此概率又等于1减去只有一发命中
1. = X1+X2
2.
4.
5.
的数量,若进行100次这样的抽查,其中的95次所得数据应在以下范围内()。

A.5~195 B.80.4~119.6
C.95~105 D.74.2~125.8
(三)简答题
1.服从二项分布及Poisson分布的条件分别是什么?
2.二项分布、Poisson分布分别在何种条件下近似正态分布?
3.在何种情况下,可以用率的标准误S p描述率的抽样误差?
(四)计算题
1. 已知我国成人乙肝病毒表面抗原平均阳性率为10%,现随机抽查某地区10位成人的血清,其中3人为阳性。

该地区成人乙肝表面抗原阳性率是否高于全国平均水平?
2. 对甲、乙两种降压药进行临床疗效评价,将某时间段内入院的高血压病人随机分为两组,每组均为100人。

甲药治疗组80位患者有效,乙药治疗组50位患者有效,两种降压药有效率有无差别?
3. 某放射性物质发生脉冲频率为100/克/小时,已知某矿区矿石中该放射性物质的含量为4克/千克,今又测得另一矿区同种矿石每千克发生脉冲频率为1000/小时,问两个矿区矿石中该放射性物质的含量是否相等?
4. 一台仪器在10000个工作时内平均发生10次故障,试求在100个工作时内故障不多于两次的概率。

五、习题答题要点
(一)名词解释
1.
则称此记为X~B(n,
2.
)。

1
1.
2.
分布N(
分布。

3.
1. 建立检验假设
H0:该地区成人乙肝表面抗原阳性率为10%;
H1:该地区成人乙肝表面抗原阳性率大于10%。

α=0.05。

从总体率为10%的人群随机抽取10人,3人或3人以上阳性的概率为:
P(X≥3)=1-[P(X=0)+P(X=1)+P(X=2)]=1-[0.910+10*0.1*0.99+45*0.12*0.98]=0.0702
P(X≥3)>0.05,在α=0.05水平上,不拒绝H0,不能认为该地区成人乙肝表面抗原阳性率高于全国水平。

2. 建立检验假设
H0:两种药有效率无差别;
H 1:两种药有效率有差别。

α=0.05。

6312.2114
.05.08.0=-=
u >2.58,P <0.01 在α=0.05水平上,拒绝H 0,接受H 1,即两种降压药有效率有显着差别,甲药比乙药有效率高。

3. 放射性物质含量为4克/千克的矿石每千克的平均脉冲记数为μ=100*4=400/小时,μ值较大,可利用Poisson 分布的近似正态分布特性进行计算。

H 0:两矿区矿石中该放射性物质含量相等,即后一矿区矿石发生脉冲频率的总体均数为400/小时;H 1:两矿区矿石中该放射性物质含量不相等,即后一矿区矿石发生脉冲频率的总体均数不等于400/小时。

α=0.05。

在α4. )三者之和。

而如下:。

相关文档
最新文档