统计学数据的描述性分析习题
统计学习题第四章数据分布特征的描述习题答案

第四章 静态指标分析法(一)一、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和用于测度品质数据集中趋势的分布特征,用于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、几何平均数是计算和的比较适用的一种方法。
4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当一组工人的月平均工资悬殊较大时,用他们工资的比其算术平均数更能代表全部工人工资的总体水平。
二.选择题单选题:1.反映的时间状况不同,总量指标可分为( )A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )A 接近标志值小的一方B 接近标志值大的一方C 接近次数少的一方D 接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( )A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( )A 提高B 不变C 降低D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( )A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越高C 说明变量值越分散,平均数代表性越高D 说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:07.7,70==甲甲σX ;乙数列:41.3,7==乙乙σX 根据以上资料可直接判断( )A 甲数列的平均数代表性大B 乙数列的平均数代表性大C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百人手机拥有量为90部,这个指标是 ( )A 、比例相对指标B 、比较相对指标C 、结构相对指标D 、强度相对指标 9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为 ( ) A 、左偏分布 B 、右偏分布 C 、对称分布 D 、无法判断10、加权算术平均数的大小 ( )A 主要受各组标志值大小的影响,与各组次数多少无关;B 主要受各组次数多少的影响,与各组标志值大小无关;C 既与各组标志值大小无关,也与各组次数多少无关;D 既与各组标志值大小有关,也受各组次数多少的影响11、已知一分配数列,最小组限为30元,最大组限为200元,不可能是平均数的为 ( ) A 、50元 B 、80元 C 、120元 D 、210元12、比较两个单位的资料,甲的标准差小于乙的标准差,则 ( ) A 两个单位的平均数代表性相同 B 甲单位平均数代表性大于乙单位C 乙单位平均数代表性大于甲单位D 不能确定哪个单位的平均数代表性大 13、若单项数列的所有标志值都增加常数9,而次数都减少三分之一,则其算术平均数 ( ) A 、增加9 B 、增加6C 、减少三分之一 D 、增加三分之二 14、如果数据分布很不均匀,则应编制( )A 开口组B 闭口组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( ) A 总体性B 全面性C 同质性D 可比性16、某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为()A1500元 B 1600元 C 1750元D 2000元 17、统计分组的首要问题是( )A 选择分组变量和确定组限B 按品质标志分组C 运用多个标志进行分组,形成一个分组体系D 善于运用复合分组18、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开支情况,最合适的调查方式是:() A 普查B 抽样调查C 典型调查D 重点调查21、已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为 ( )A 甲大于乙B 乙大于甲C 一样的D 无法判断 22、加权算术平均数的大小取决于( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变.那么算术平均数( ) A 不变 B 扩大到5倍 C 减少为原来的1/5 D 不能预测其变化 24、 计算平均比率最好用 ( )A 算术平均数B 调和平均数C 几何平均数D 中位数25、若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用() A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布B正态分布 C 右偏分布DU型分布28、一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
第一讲——数据的描述性分析

M
D
=
∑
x − x n
−
i=1
加权式平均差
n
M
D
=
∑
x − x f
i
−
i=1
i
∑
f
i=1
i
2.1.3标准差与方差
标准差又称均方差,它是各单位变量值与其平 均数离差平方的平均数的方根,通常用 σ 表示。 它是测度数据离散程度的最主要方法。
◆简单式标准差 ◆总体与样本标准差 ◆加权式标准差
方差是各变量值与其算术平均数离差平方和的 平均数,即是标准差的平方,用 σ 2 表示总体的 方差;用 s 2 表示样本的方差。
分位数
2.1.1由未分组数据确定中位数 由未分组数据确定中位数
对未分组数据资料,需先将各变量值按大小顺 + 序排列,并按公式 n 2 1 确定中位数的位置。 当一个序列中的项数为奇数时,则处于序列中间 位置的变量值就是中位数。 例: 7 6 8 2 3 7、6、8、2、3 当一个序列的项数是偶数时,则应取中间两个数 的中点值作为中位数,即取中间两个变量值的平均数 为中位数。 例: 2、5、7、8、11、12
中位数是一组数据按大小顺序排列后, 处于中间位置的那个变量值,通常用M 表 示。其定义表明,中位数就是将某变量的 全部数据均等地分为两半的那个变量值: 一半数值小于中位数,另一半数值大于中 位数。中位数是一个位置代表值,因此它 不受极端变量值的影响。
e
◆由未分组数据确定中位数 ◆由单项数列确定中位数
数据分布的特征
数据水平 (位置) 位置)
数据差异 (离散程度) 离散程度) 分布形状 (偏态和峰态) 偏态和峰态)
一、 集中趋势的描述 二、 离散程度的描述 三、 分布的偏态与峰度
统计学习题1

第2章统计数据的描述练习:2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
2.2某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
2.3在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300 19300~400 30400~500 42500~600 18600以上11合计120计算120家企业利润额的均值和标准差。
第二章 统计描述习题 医学统计学习题

第二章统计描述习题一、选择题1.描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位数间距E.方差2.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对3.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是()。
A.标准差B.标准误C.全距D.四分位数间距E.变异系数5.测量了某地152人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。
A.算术均数B.中位数C.几何均数D.众数E.调和均数6.测量了某地237人晨尿中氟含量(mg/L),结果如下:尿氟值:0.2~0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~频数:7567302016196211宜用()描述该资料。
A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差7.用均数和标准差可以全面描述()资料的特征。
A.正偏态资料B.负偏态分布C.正态分布D.对称分布E.对数正态分布8.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距9.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差10.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数11.现有某种沙门菌食物中毒患者164例的潜伏期资料,宜用()描述该资料。
A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差12.测量了某地68人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。
统计学各章习题及答案

统计学习题目录第一章绪论 _________________________________________________ 2第二章数据的收集与整理 _____________________________________ 4第三章统计表与统计图 _______________________________________ 6第四章数据的描述性分析 _____________________________________ 8第五章参数估计 ____________________________________________ 12第六章假设检验 ____________________________________________ 16第七章方差分析 ____________________________________________ 20第八章非参数检验 __________________________________________ 23第九章相关与回归分析 ______________________________________ 26第十章多元统计分析 ________________________________________ 30第十一章时间序列分析 ______________________________________ 34第十二章指数 ______________________________________________ 37第十三章统计决策 __________________________________________ 41第十四章统计质量管理 ______________________________________ 44第一章绪论习题一、单项选择题1。
推断统计学研究(D)。
A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2。
统计学-数据的描述性分析

92801.20 10
80 70 1.43 7
计算结果表明,第二次考试成绩更好些.
② 对称分布中的 3 法则
4、如要分别反映甲、乙、丙三个班的考试情况,你会 选择用哪些指标来衡量?
5、如要比较甲、乙、丙三个班的考试情况的优劣,你 又会选择什么样的指标来衡量? 6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么?
由组距数列确定中位数
n
先计算各组的累计次数,再按公式
i
1
fi
xnfn
fi
i1
fi
xi
例3.1.1 一位投资者持有一种股票,2019,2019,2019,2000年 收益率分别为4.5% ,2.0% ,3.5% ,5.4% .计算该投资者在这四 年内的平均收益率.
例3.1.2 某企业四个车间流水作业生产某产品, 一车间产 品合格率99%,二车间为95%,三车间为92%,四车间为90%,
适用范围
众数主要用于分类数据,也可用于顺序数据和数值型数据, 对于未分组数据和单项式分组数据,众数位置确定之后便 找到了众数.
例:分类数据的众数
例:顺序数据的众数
②.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
负偏 注: (1)中位数总是介于众数和平均数之间.
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
3.1.2 位置平均数
①.众数(Mode)
一组数据中出现次数最多的变量值.
主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
统计学考试题及答案

统计学考试题及答案一、选择题(每题2分,共20分)1. 以下哪项不是描述性统计分析的内容?A. 计算平均数B. 计算中位数C. 计算标准差D. 进行假设检验答案:D2. 总体和样本的关系是:A. 样本是总体的一部分B. 总体是样本的一部分C. 总体和样本是相同的D. 总体和样本没有关系答案:A3. 以下哪个不是统计量?A. 平均数B. 方差C. 众数D. 总体答案:D4. 标准正态分布的均值和标准差分别是:A. 0, 1B. 1, 0C. -1, 1D. 1, 1答案:A5. 以下哪个是参数估计的步骤?A. 收集数据B. 建立假设C. 计算统计量D. 所有选项都是答案:D6. 相关系数的取值范围是:A. (-1, 1)B. (0, 1)C. [-1, 1]D. 无限制答案:C7. 以下哪个是统计推断的前提?A. 随机抽样B. 总体分布已知C. 样本量足够大D. 所有选项都是答案:A8. 以下哪个是时间序列分析的目的?A. 预测未来趋势B. 描述过去数据C. 分析数据关系D. 以上都是答案:A9. 以下哪个是统计图表?A. 散点图B. 柱状图C. 饼图D. 所有选项都是答案:D10. 以下哪个是统计软件?A. ExcelB. RC. SPSSD. 所有选项都是答案:D二、简答题(每题10分,共30分)1. 描述统计与推断统计的区别是什么?答案:描述统计主要关注数据的收集、整理和描述,它通过图表和数值来描述数据的特征,如平均数、中位数、众数等。
而推断统计则是基于样本数据来推断总体特征,它涉及概率论和假设检验,目的是估计总体参数或检验关于总体的假设。
2. 什么是正态分布?其特点有哪些?答案:正态分布是一种连续概率分布,其概率密度函数呈钟形曲线。
其特点包括:对称性,均值、中位数和众数相等;其均值为0,标准差为1的标准正态分布曲线是正态分布的基准形式;大多数数据值集中在均值附近。
3. 什么是假设检验?其基本步骤有哪些?答案:假设检验是统计推断的一种方法,用于基于样本数据对总体参数进行估计或检验。
统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。
其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。
调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。
(2)绘制一张条形图,反映学历分布。
2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。
2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。
(2)用茎叶图将原始数据表现出来。
2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。
男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。
Chap04_数据的描述性分析

i 1
n
1 xi
加权调和平均数
xH m1 m2 ...... mn m m1 m2 ...... n x1 x2 xn
m
i 1 n
n
i
mi i 1 x i
调和平均数是算术平均数的变形
xH
m
i 1 n
n
i
mi i 1 xi
x
i 1 n
n
相对指标应用的原则
1、可比性原则 (1)正确选择对比基数 (2)保持对比指标的可比性 2、相对指标与总量指标结合运用原则 3、多种相对指标结合运用原则
集中趋势
集中趋势(Central Tendency)反映 的是一组数据向某一中心值靠拢的倾向, 在中心附近的数据数目较多,而远离中心 的较少。对集中趋势进行描述就是寻找数 据一般水平的中心值或代表值。
例题
峰度
峰度(Kurtosis)是分布集中趋势高峰的形状。在 变量数列的分布特征中,常常以正态分布为标准, 观察变量数列分布曲线顶峰的尖平程度,统计上称 之为峰度。
v4
4
3
x
n i 1
i
x fi
4
i 1
n
3
fi 4
正态分布的峰度系数为0,当>0时为尖峰分布, 当<0时为平顶分布。 例题
例题
离散系数 离散程度的绝对指标 对应的平均指标
V
x
100%
是非标志的平均数和方差
π是一个比率,它表示具有某种特征的个体的 数量占总体中个体总数的比重,即总体成数。 是非标志的平均数为:
x
2021管理类-统计学讲义(统计基本知识+描述统计+推断统计+统计分析+习题答案)158页

目录第一篇统计基础知识...........................................................................................1第一章导论..........................................................................................................1第二篇描述统计...................................................................................................8第二章数据的搜集..............................................................................................8第三章数据的图表展示.....................................................................................18第四章数据的概括性度量.................................................................................35第三篇推断统计.................................................................................................52第九章方差分析................................................................................................87第十章线性回归分析.......................................................................................100第十一章静态分析—统计指标.......................................................................119第十二章动态分析—时间序列分析...............................................................126第十三章指数分析..........................................................................................第五章概率与概率分布.....................................................................................52第六章统计量及其抽样分布.............................................................................63第七章参数估计................................................................................................72第八章假设检验................................................................................................79第四篇统计分析.................................................................................................87143参考答案. (152)第一篇统计基础知识第一章导论【案例导引】统计与我们的工作、生活息息相关。
第三章 统计学习题

第三章统计数据的描述(1)一、填空题2、动态相对指标有_______和_______两种基本形式。
3、某现象的某一指标在同一时间不同空间上的指标值对比的结果是_______,在同一空间不同时间上的指标值对比的结果是_______。
4、同质总体中部分数值与总体全部数值对比的结果是_______,各部分数值相互对比的结果是_______。
7、相对指标一般都采用______的形式来表现,有些特殊的相对数,则采用_______的形式来表现。
9、强度相对指标的分子、分母一般可以互换,因而有_______和_______之分。
10、长期计划执行结果的检查方法有两种,一种是_______,另一种是_______。
11、计算和应用计划完成程度相对指标时,当计划任务是按最低限额规定时,则计划完成百分数以_______100%为好,当计划任务是按最高限额规定时,则计划完成百分数以_______100%为好。
12、结构相对数的取值介于_______之间,各组结构相对数的和恒等于_______。
15、比例相对数是一种_______性比例,而比较相对数则是一种_______性比例。
二、单选题3、某厂劳动生产率计划比上年提高8%,实际仅提高4%,则其计划完成百分数为()。
A.4% B.50% C.96.30% D.103.85%4、某厂某产品的单位产品成本计划规定比去年降低5%,实际降低了7%,则其计划完成百分数为():、A.97.9% B.140.0% C.102.2% D.71.4%5、联合国粮农组织依据恩格尔系数的高低,提出的富裕标准是恩格尔系数为()。
A.30%以下B.30%—40%C.40%—50%D.50%—59%7、总体各部分结构相对数的和应()。
A.等于100% B.小于100% C.大于100% D.小于或等于100%10、将相对指标与总量指标结合应用,通常是计算()。
A.平均增长水平B.平均发展速度C.平均增长速度D.增长1%的绝对值11、反映总体各部分之间数量联系程度和比例关系协调平衡状况的综合指标是()。
统计学习题和答案解析[完整]
![统计学习题和答案解析[完整]](https://img.taocdn.com/s3/m/51a359cd0242a8956bece4c6.png)
第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布D.对称分布 E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态 B.近似正态 C.左偏态 D.右偏态 E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数 B.标准差 C.中位数 D.四分位数间距 E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n外,还可计算,S和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常 0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
统计学练习题及答案

统计学练习题及答案数据分布特征的描述1.下面是我国人口和国土面积资料:────────┬─────────────── │根据第四人次人口普查调整数├──────┬──────── │1982年│ 1990年────────┼──────┼──────── 人口总数│ __ │ __ 男│ __ │ __ 女│ __ │ __────────┴──────┴────────国土面积960万平方公里。
试计算所能计算的全部相对指标。
2.某企业2022年某产品单位成本520元,2022年计划规定在上年的基础上单位成本降低5%,实际降低6%,试确定2022年单位成本的计划数与实际数,并计算2022年降低成本计划完成程度指标。
3.某市共有50万人,其市区人口占85%,郊区人口占15%,为了解该市居民的收入水平,在市区抽查了1500户居民,每人平均收入为1400元;在郊区抽查了1000 户居民,每人年平均收入为1380元,若这两个抽样数字具有代表性,则计算该市居民年平均收入应采用哪一种形式的平均数方法进行计算?4.有两个班级统计学成绩如下:根据上表资料计算:(1)哪个班级统计学成绩好?(2)哪个班级的成绩分布差异大?5.2022年8月份甲、乙两农贸市场资料如下:────┬──────┬─────────┬─────────品种│价格(元/斤)│甲市场成交额(万元)│乙市场成交量(万斤)────┼──────┼─────────┼───────── 甲│ 1.2 │ 1.2 │ 2 乙│ 1.4 │ 2.8 │ 1 丙│ 1.5 │ 1.5 │ 1────┼──────┼─────────┼───────── 合计│ ── │ 5.5 │ 4────┴──────┴─────────┴─────────试问哪一个市场农产品的平均价格较高?并说明原因。
6.某车间有甲、乙两个生产组,甲组平均每个工人的日产量36件,标准差9.6件。
统计学练习题及答案

统计学练习题及答案统计学练习题及答案统计学是研究数据收集、分析和解释的科学。
在现代社会中,统计学在各个领域都扮演着重要的角色。
无论是市场调研、医学研究还是经济预测,统计学都能提供有力的支持和指导。
为了加深对统计学知识的理解和应用,下面将提供一些统计学练习题及答案。
一、描述性统计1. 以下是某班级学生的身高数据(单位:厘米):165、170、168、172、175、166、178、180、169、173。
请计算这组数据的平均值、中位数和众数。
答:平均值 = (165 + 170 + 168 + 172 + 175 + 166 + 178 + 180 + 169 + 173) / 10 = 171.6中位数:按照从小到大的顺序排列数据,中间的数即为中位数。
因此,中位数= 170众数:出现次数最多的数即为众数。
这组数据中没有重复的数,所以没有众数。
2. 某公司的销售额数据如下(单位:万元):50、60、80、70、65、75、85、90、95、100。
请计算这组数据的标准差。
答:首先计算平均值:(50 + 60 + 80 + 70 + 65 + 75 + 85 + 90 + 95 + 100) / 10 = 77然后计算每个数据与平均值的偏差:(-27, -17, 3, -7, -12, -2, 8, 13, 18, 23)接下来计算偏差的平方:(729, 289, 9, 49, 144, 4, 64, 169, 324, 529)再计算平方的平均值:(729 + 289 + 9 + 49 + 144 + 4 + 64 + 169 + 324 + 529) / 10 = 311.1最后计算标准差:√311.1 ≈ 17.63二、概率1. 一副标准扑克牌中,红桃和黑桃各有26张,红桃A的概率是多少?答:红桃A的数量为1,总共有52张牌,所以红桃A的概率为1/52。
2. 有一个装有10个红球和15个蓝球的袋子,从中随机抽取一个球,如果抽到红球,则不放回,再次抽取;如果抽到蓝球,则放回,再次抽取。
医学统计学4. 定性数据的统计描述

已知健康男童体重近似服从正态分布,某年某地 150名12岁健康男童体重的均数为35kg,标准差为 6kg,试估计
1)该地12岁健康男童体重在50kg以上者占该地12岁健康男 童总数的百分比;
2)该地12岁健康男童体重30-40公斤占该地12岁健康男童的 百分比;
3)该地80%的12岁健康男童集中在哪个范围;
应用相对数的注意事项
例如,某医师对口腔门诊不同年龄龋齿患病情况 (表5-3)进行了分析,得出40~49岁组患病率高, 0~9岁组和70岁及以上组患病率低的错误结论。
年龄组(岁)
0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计
表 5-3 口腔门诊龋齿患者年龄构成
患者人数
患者构成比(%)
一、统计学指标
绝对数:反应实际水平 相对数----两个数值的比,包括: 率 构成比 相对比
(一)率
率:
说明某现象或某事物在它可能发生的范围内实际发 生的频率或强度,又称频率指标或强度指标。
常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10万)等表示,计算公式为:
率
某时期内实际发生某现象的观察单位数 同时期可能发生某现象的观察单位总数
比例基数
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性
病的发生或流行情况,其计算公式为
某病患病率
某地某时点某病患病例数 该地同期内平均人口数
比例基数
以上比例基数可为100%、1000‰、10000/万、 100000/10万,实际中患病率的分母通常为调查 的总人数,分子为患病的人数。
医学统计学定性资料统计描述思考与练习带答案

第五章定性资料的统计描述【思考与练习】一、思考题1.应用相对数时需要注意哪些问题?2。
为什么不能以构成比代替率?3. 标准化率计算的直接法和间接法的应用有何区别?4. 常用动态数列分析指标有哪几种?各有何用途?5。
率的标准化需要注意哪些问题?二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%()、52。
0%()和17。
4%()。
该结论是否正确?为什么?三、最佳选择题1。
某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为B A。
率B. 构成比C. 发病率D。
相对比E. 时点患病率2。
标准化死亡比SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D。
预期发病数/实际发病数E。
预期发病数/预期死亡数3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人.可计算出这样一些相对数:, ,,,,该地男性居民五种心血管疾病的死亡率为DA。
B.C。
D。
E。
4. 根据第3题资料,该地居民五种心血管病的总死亡率为EA。
B。
C.D.E.5。
根据第3题资料,该地男、女性居民肺心病的合计死亡率为DA.B。
C.D。
E。
6。
某地区2000~2005年结核病的发病人数为,则该地区结核病在此期间的平均增长速度是DA.B.C.D。
E。
7. 经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89。
94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93。
52/10万,发生此现象最有可能的原因是CA。
甲地的诊断技术水平更高B。
乙地的恶性肿瘤防治工作做得比甲地更好C. 甲地的老年人口在总人口中所占比例比乙地多D. 乙地的老年人口在总人口中所占比例比甲地多E。
描述统计作业及参考答案

第一章练习题1.1统计一词有哪几种含义?1.2什么是统计学?怎样理解统计学与统计数据的关系?1.3怎样理解描述统计和推断统计在统计方法探索数量规律性中的地位和作用?1.4统计学与数学有何区别与联系?1.5怎样理解统计学与其他学科的关系?第二章练习题2.1某家用电器生产厂家想通过市场调查了解以下问题:a.企业产品的知名度;b.产品的市场占有率;c.用户对产品质量的评价及满意程度。
要求:(1) 请你设计出一份调查方案;(2 ) 你认为这项调查采取哪种调查方法比较合适?(3 ) 设计出一份调查问卷。
2.2根据上面的数据进行适当的分组,编制频数分布表,并绘制频数分布的直方图和茎叶图。
2.3要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累计频数和累计频率;(2)如果按企业成绩规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、—般企业、落后企业进行分组。
2.4已知1991—1997年我国的国内生产总值数据如下表:其中:在1997年的国内生产总值中,第一产业为13969亿元,第二产业为36770亿元,第三产业为24033亿元。
(1)根据1991—1997年的国内生总值数据,绘制折线图、条形图;(2)根据1997年的国内生产总值及其构成数据,绘制圆形图(饼图)2.5某贸易公司销售额计划比去年增长3%,实际比去年增长5%,试问该公司计划完成情况是多少?又知该公司经营的产品每台成本应在去年699元的基础上降低12元,实际今年成本672元,试确定降低成本的计划完成情况指标。
2.6选择题:1.相对指标值的大小()。
(1)随总体范围扩大而增大(2)随总体范围扩大而减小(3)随总体范围缩小而减小(4)与总体范围大小无关(5)可用于不同总体的比较2. 以最髙限度为任务提出的计划指标,计划完成程度()。
(1)以<100%为完成好计划(2)以>100%为完成好计划(3)以<或=100%为完成好计划(4)以>或=100%为完成好计划(5)以=100%为完成好计划3. 时点指标数值()。
统计学数据的描述性分析习题【最新资料】

一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。
) 1、众数是总体中出现最多的次数。
( )2、权数对算术平均数的影响作用只表现为各组出现次数的多少,与各组次数占总数的比重无关。
( )二、单项选择题 1、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较。
A.标准差系数B.平均差C.全距D.均方差2、某车间7位工人的日产零件数为16、20、25、23、12、35、27件,则它的全距为( )A 、 25B 、17、C 、23D 、103、某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足( )。
A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数4、对于一个右偏的频数分布,一般情况下( )的值最大。
A 、中位数 B 、众数 C 、算术平均数 D 、调和平均数6.甲乙两数列,甲数列的标准差甲σ大于乙数列的标准差乙σ,则两个数列的平均数的代表性为( ).A 、甲大于乙B 、乙大于甲C 、相同D 、无法判断 7、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小 C 、标志值本身的大小 D 、标志值数量的多少8.某变量数列如下:53,55,54,57,56,55,54,55,则其中位数为( ). A 、54 B 、55 C 、56.5 D 、57 9.如果某个分布是极度右偏,则其偏度系数为( ).A 、-0.3B 、0.3C 、-2.9D 、2.9 三、多项选择题1、平均数的种类有( )。
A 、算术平均数B 、众数C 、中位数D 、调和平均数E 、几何平均数2、在什么条件下,加权算术平均数等于简单算术平均数()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。
)1、众数是总体中出现最多的次数。
( )
2、权数对算术平均数的影响作用只表现为各组出现次数的多少,与各组次数占总数的比重
无关。
( )
二、单项选择题
1、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来比较。
A.标准差系数
B.平均差
C.全距
D.均方差
2、某车间7位工人的日产零件数为16、20、25、2
3、12、35、27件,则它的全距为( )
A 、 25
B 、17、
C 、23
D 、10
3、某10位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计算平均数,结果满足( )。
A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数
4、对于一个右偏的频数分布,一般情况下( )的值最大。
A 、中位数 B 、众数 C 、算术平均数 D 、调和平均数
6.甲乙两数列,甲数列的标准差大于乙数列的标准差,则两个数列的平均数的代
甲σ乙σ表性为( ).
A 、甲大于乙
B 、乙大于甲
C 、相同
D 、无法判断
7、权数对算术平均数的影响作用,实质上取决于( )
A 、作为权数的各组单位数占总体单位数比重的大小
B 、各组标志值占总体标志总量比重的大小
C 、标志值本身的大小
D 、标志值数量的多少
8.某变量数列如下:53,55,54,57,56,55,54,55,则其中位数为( ).
A 、54
B 、55
C 、56.5
D 、57
9.如果某个分布是极度右偏,则其偏度系数为( ).
A 、-0.3
B 、0.3
C 、-2.9
D 、2.9
三、多项选择题
1、平均数的种类有( )。
A、算术平均数
B、众数
C、中位数
D、调和平均数
E、几何平均数
2、在什么条件下,加权算术平均数等于简单算术平均数()。
A、各组次数相等
B、各组变量值不等
C、变量数列为组距数列
D、各组次数都为1
E、各组次数占总次数的比重相等
四、计算题
1.某企业产品的有关资料如下:
品种单位成本1998年总成本1999年总产量
甲乙丙15
20
30
2100
3000
1500
215
75
50
试指出哪一年的总平均成本高,为什么?
2.有甲乙两个品种的粮食作物,经播种实验后得知甲品种的平均亩产量为998斤,标准差为162.7斤。
乙品种实验资料如下:
亩产量(斤/亩)播种面积(亩)
1000 950 1100 900 10500.8
0.9
1.0 1.1 1.2
试研究两个品种的平均亩产量,以确定哪一种具有较大稳定性,更有推广价值。
3. 为了了解大学生每月伙食费的支出情况,在北京某高校随机抽取了250名学生进行调查,得到样本数据如下:
月伙食费用支出额(元)人数(户)
150以下10
150~20020
200~250110
250~30090
300~35015
350以上5
合计250
根据表中的样本数据:
(1)每月伙食支出在200~300之间的人数占总人数的百分比是多少?
(2)计算大学生每月伙食费的算术平均数;
(3)计算大学生每月伙食的样本标准差.
4、某厂甲、乙两个工人班组,每班组有8名工人,每个班组每个工人的月生产量记录如下:
甲班组:20、40、60、70、80、100、120、70
乙班组:67、68、69、70、71、72、73、70
计算甲、乙两组工人平均每人产量;
计算全距,平均差、标准差,标准差系数;比较甲、乙两组的平均每人产量的代表性。
一、判断题1、× 2、×二、单项选择题
1、A
2、C
3、D
4、C 6、D 7、A 8、B 9、D
三、多项选择题
1、ABCDE
2、ADE 四、计算题
1、解:1998年平均单位产品成本:
1999年平均单位产品成本:
所以由以上结果可知1998年的总成本高。
2.
解:甲组:16.0998
7
.162x V ==
=
甲
甲δ
乙组:公斤/亩1.847f
xf
x =∑∑=
170.1
f
f
x x 2
=∑-∑=)(乙δ2.0847.1
1
.170x V ==
=
乙
乙
乙δ > 所以甲组更有代表性,更稳定、更值得推广
乙V 甲V 3、解:(1)每月伙食费支出在200~300元之间的人数占总人数的百分比:
11090
80%250
+=(2)算术平均数:
125101752022511027590325153755
244
250
i i
i
x f x f
⨯+⨯+⨯+⨯+⨯+⨯=
=
=∑∑元
3.18340
1500
15003225507521530*5020*7515*215=++=++++=
=
∑∑f
xf x 元41.19340660030
1500203000152100150030002100x m m ==++++==∑∑x
(3
)样本标准差:
46.88
s =
==4、解
甲班组:平均每人产量 全距 件70=∑=n
x x 件
10020120min max =-=-=x x R 平均差 AD 标准差 件5.228180
==
-∑=
n
x x ()件6.298
70002
==-∑=
n x x σ标准差系数 %
29.4270
6.29===x V σσ乙班组:平均每人产量 全距 件70=∑=n
x x 件
66773min max =-=-=x x R 平均差 AD=
件5.1812==-∑n
x x 标准差 标准差系数 ()件5.38
28
2
==-∑=
n
x x σ%00.5705.3==
=x V σσ分析说明:从甲、乙两组计算结果看出,尽管两组的平均每人产量相同,但乙班组的
标志变异指标值均小于甲班组,所以,乙班组的人均产量的代表性较好。