用统计量描述数据习题
高中统计练习题及讲解
高中统计练习题及讲解一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?- A. 方差- B. 标准差- C. 平均数- D. 极差2. 一组数据的中位数是50,众数是60,这组数据的分布可能是怎样的?- A. 正偏态分布- B. 负偏态分布- C. 对称分布- D. 无法确定二、填空题1. 某班级学生数学成绩的平均数为80分,方差为100,如果一个学生的成绩是90分,那么他的标准分是______。
2. 已知一组数据的中位数为40,如果将这组数据的每个数值都增加10,新的中位数为______。
三、解答题1. 某公司员工的月收入数据如下:4000元,5000元,6000元,7000元,8000元。
请计算这组数据的平均数、中位数和众数。
2. 某班学生期末考试成绩如下:70分,80分,90分,100分。
计算这组数据的方差和标准差。
四、数据分析题某市中学生的身高数据如下(单位:厘米):165,170,175,180,185。
请分析这组数据的分布特征,并计算其平均身高、中位数、众数、方差和标准差。
高中统计练习题讲解一、选择题1. C. 平均数是描述数据集中趋势的统计量,它表示数据集中所有数值的算术平均。
2. A. 如果中位数小于众数,通常意味着数据集呈现正偏态分布。
二、填空题1. 标准分是指一个数值与平均数的差除以标准差。
首先计算平均数:(4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000。
然后计算标准差:√(100) = 10。
最后计算标准分:(90 - 6000) / 10 = -5。
2. 当数据集中的每个数值都增加一个常数时,中位数也会增加相同的常数。
因此,新的中位数为40 + 10 = 50。
三、解答题1. 平均数 = (4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000元。
中位数 = 6000元(中间的数值)。
众数 = 6000元(出现次数最多的数值)。
用统计量描述数据习题(1)
第3章习题一、选择题1. 一组数据中出现频数最多的变量值称为()。
A.众数B.中位数C.四分位数D.均值2.一组数据排序后处于中间位置上的变量值称为()。
A.众数B.中位数C.四分位数D.均值3. n个变量值乘积的n次方根称为()。
A.众数B.中位数C.四分位数D.几何平均数4. 标准差与均值的比值称为()。
A.异众比率B.离散系数C.平均差D.标准差5. 一组数据的最大值与最小值之差称为()。
A.平均差B.标准差C.极差D.四分位差6. 如果一个数据的标准分数是-2,表明该数据()。
A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7. 一组数据的标准分数,其()。
A.均值为1,方差为0 B.均值为0,方差为1C.均值为0,方差为0 D.均值为1,方差为18. 经验法则表明,当一组数据对称分布式,在均值加减1个标准差的范围内大约有()。
A.68%的数据B.95%的数据C.99%的数据D.100%的数据9. 离散系数的主要用途是()。
A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平10. 两组数据相比较()。
A.标准差大的离散程度也大B.标准差大的离散程度也小C.离散系数大的离散程度也大D.离散系数大的离散程度也小11. 某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
在上面的描述中,众数是()。
A.1200 B.经济管理学院C.200 D.理学院12. 对于分类数据,测度其离散程度使用的统计量主要是()。
A.众数B.异众比率C.标准差D.均值13. 对于右偏分布,均值、中位数和众数之间的关系是()。
A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数14. 在某行业中随即抽取10家企业,第一季度的利润额(单位:万元)分别为72,,,,29,,25,,23,20。
第二讲习题 统计数据的描述
一、单项选择题1.美国10家公司在电视广告上的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。
下列图示法不宜用于描述这些数据的是( )。
A.茎叶图B.散点图C.直方图D.饼图2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本均值可作如下解释( )。
A.大多数女性MBA的起薪是54 749美元B.最常见到的起薪是54 749美元C.样本起薪的平均值为54 749美元D.有一半的起薪低于54 749美元3.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本中位数可作如下解释( )。
A.大多数女性MBA的起薪是47 543美元B.最常见到的起薪是47 543美元C.样本起薪的平均值为47 543美元D.有一半女性的起薪高于47 543美元4.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本标准差可作如下解释( )。
A.最高起薪与最低起薪之差是10 250美元B.大多数的起薪在44 499美元和64 999美元之间C.大多数的起薪在37 293美元和57 793美元之间D.大多数的起薪在23 999美元和85 499美元之间5.对于右偏分布,均值、中位数和众数之间的关系是( )。
A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的离散程度的测度指标是( )。
中级经济师基础第二十四章描述统计习题
第二十四章描述统计一、单项选择题1、某种商品的销售总额由其销售量决定,这两个变量的关系为()。
A、完全相关B、不完全相关C、完全不相关D不相关2、如果两种相关现象之间不表现为直线的关系,而是近似于某种曲线方程的关系。
则这种相关关系称为()。
A、完全相关B、线性相关C、不完全相关D非线性相关3、测度数据分布偏度的统计量称为()。
A、中位数B、离散系数C、偏态系数D标准分数4、一组数据的偏态系数SK=2说明这组数据的分布形态为()。
A、对称B、轻度右偏C、中度右偏D严重右偏5、()是指一组数据向某一中心值靠拢的程度,反映一组数据中心点的位置所在。
A、离散程度B、集中趋势C、平均位置D偏态6、下列适用于测度顺序数据的指标是()。
A、中位数B、方差C、标准差D均值7、某能源公司有9个分公司,每个分公司的主营产品分别是:煤制品、有机化工原料、火电、煤制品、热力、电解结、火电、煤制品、煤制品,则该能源公司分公司主营产品的众数为()。
A、火电B、电解结C、煤制品D有机化工原料&下列选项中,()是测度数据离散趋势的指标。
A、均值B、方差C、平均数D中位数9、2015年底,某高校学生年龄的算术平均数为20岁,标准差为2岁,则该校学生年龄的离散系数为()°A、10%B、20%C、30%D 40%10、当相关系数r = - 1时,变量x和y的相关关系为()°A、高度相关B、不完全相关关系C、完全正相关关系D不相关关系11、以下关于Pearson相关系数的说法中,错误的是()。
A、Pearson相关系数的取值范围在+1和-1之间B、P ears on系数大于0小于等于1说明变量之间存在正线性相关关系C、Pearson系数为0的时候变量之间没有任何关系D Pearson系数等于-1说明变量之间为完全负相关关系12、下列选项中变量之间的相关程度最弱的是()。
A、劳动生产率与工作水平的相关系数0.63B、销售额与平均流通费用率的相关系数-0.8C、商品流转规模与流通费用的相关系数-0.35D投资额与国民收入的相关系数0.43二、多项选择题1、下列属于分布形态测度的指标有()。
统计学习题1
第2章统计数据的描述练习:2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
2.2某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
2.3在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300 19300~400 30400~500 42500~600 18600以上11合计120计算120家企业利润额的均值和标准差。
描述统计部分练习题
描述统计练习题及参考答案单选题1.某考生在一项测验中得分6060,,经换算百分等级为7070,这表明在所有考生中,得分低于该,这表明在所有考生中,得分低于该考生的人数占总人数的A .30 A .30%% B.40 B.40%% C C..6060%% D D..7070%%2.用于描述两个变量之间相关关系的统计图是A .直方图.直方图B B B.线形图.线形图.线形图C C C.条形图.条形图.条形图D D D.散点图.散点图3.将Z 分数转换成T 分数时,需要进行A .正态化转换.正态化转换B B B.非正态化转换.非正态化转换.非正态化转换C C C.线性转换.线性转换.线性转换D D D.非线性转换.非线性转换4. 4. 已知某次学业成就测验的平均分数是已知某次学业成就测验的平均分数是8080,标准差为,标准差为4。
如果某考生得分为9292,则该分数,则该分数转换为标准分后是A .1B 1 B..2C 2 C..3D 3 D..45.现有一列数据,它们是4,4,5,3,5,5,2。
这列数据的平均数、众数和全距依次是A .4,4,2 B. 42 B. 4,,5,3 C 3 C..5,4,4 D 4 D..5,5,16.一组数据的平均数是100100,标准差是,标准差是2525,这组数据的变异系数是(,这组数据的变异系数是() A A..4% B B..2525%% C C..4 D 4 D..257.有一组数据:.有一组数据:33,6,2,7,3232,,4,8,6,5。
要描述这组数据的特征,受极端数据值影响的统计量是()A A.平均数.平均数.平均数B B B.中数.中数.中数C C C.四分位数.四分位数.四分位数D D D.众数.众数8.在某次考试中,小明的语文、数学成绩均为8080,英语成绩为,英语成绩为7575。
已知全班三科平均成绩。
已知全班三科平均成绩都为6565,语文标准差为,语文标准差为1010,数学标准差为,数学标准差为1515,英语标准差为,英语标准差为5。
统计学第三版书后答案第二章
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下单位万元257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 1计算该百货公司日销售额的均值、中位数和四分位数2计算日销售额的标准差。
解1将全部30个数据输入Excel表中同列点击列标得到30个数据的总和为8223 于是得该百货公司日销售额的均值见Excel练习题2.9 xxn822330274.1万元或点选单元格后点击“自动求和”→“平均值”在函数EVERAGE 的空格中输入“A1A30”回车得到均值也为274.1。
在Excel表中将30个数据重新排序则中位数位于30个数据的中间位置即靠中的第15、第16两个数272和273的平均数Me2722732272.5万元由于中位数位于第15个数靠上半位的位置上所以前四分位数位于第1第15个数据的中间位置第8位靠上四分之一的位置上由重新排序后的Excel 表中第8位是261第15位是272从而QL2612732724261.25万元同理后四分位数位于第16第30个数据的中间位置第23位靠下四分之一的位置上由重新排序后的Excel表中第23位是291第16位是273从而QU2912732724290.75万元。
2未分组数据的标准差计算公式为s30211iixxn 利用上公式代入数据计算是个较为复杂的工作。
手工计算时须计算30个数据的离差平方并将其求和再代入公式计算其结果得s21.1742。
见Excel练习题2.9 我们可以利用Excel表直接计算标准差点选数据列A列的最末空格再点击菜单栏中“∑”符号右边的小三角“▼”选择“其它函数”→选择函数“STDEV”→“确定”在出现的函数参数窗口中的Number1右边的空栏中输入A1:A30→“确定”即在A列最末空格中出现数值21.17412即为这30个数据的标准差。
统计学基础练习题库及参考答案
:第一章定量资料的统计描述1第一部分一、单选题1、甲乙丙三位研究者评价人们对四种方便面的喜好程度。
甲让评定者先挑选出最喜欢的品牌,然后挑出剩余三种最喜欢的,最后挑出剩余两种比较喜欢的。
研究者乙让评定者把四种品牌分别给予1~5的等级评定(1表示最不,5表示最喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
三位研究者所使用的数据类型是:BA.称名数据-顺序数据-计数数据B.顺序数据-等距数据-称名数据C.顺序数据-等距数据-顺序数据D.顺序数据-等比数据-计数数据2、调查200名不同年龄组的被试对手表的偏好程度如下:表1 200名不同年龄组的被试对手表的偏好程度该题自变量和因变量的数据类型是:DA.称名数据-顺序数据B.计数数据-等比数据¥C.顺序数据-等距数据 D.顺序数据-称名数据3、的实上限是:CA.B.157.65 C.D.4、随机现象的数量化表示称为:BA.自变量B.随机变量C.因变量 D.相关变量5、实验或研究对象的全体称为:AA.总体B.样本点C.个体D.元素6、下列数据中,哪个数据是顺序变量:C【A.父亲月收入2400元B.迈克的语文成绩是80分C.约翰100米短跑得第2名D.玛丽某项技能测试得了5分。
二、概念题数据类型、变量、观测值、随机变量、总体、样本、个体、次数、比率、概率、参数、统计量、μ、ρ、r、σ、S、β、n。
第一章定量资料的统计描述2一、单选题1、一批数据中各个不同数据值出现的次数情况是:AA.次数分布B.概率密度C.累积概率密度D.概率】2、以下各种图形中,表示连续数据频次分布的是:CA.条图B.圆图C.直方图D.散点图3、特别适用于描述具有百分比结构的分类数据的统计图:BA.散点图B.圆图C.条图D.线图5、以下各种统计图中,表示离散数据频次分布的:AA.圆图B.直方图C.散点图D.线形图6、相关变量的统计图是:AA.散点图B.圆图C.条图D.线图.7、适用于描述某种事物在时间上的变化趋势,以及一事物随另外一事物的发展变化的趋势,还适用于比较不同人物群体在心理或教育现象上的变化特征以及相互联系的统计图是:D A.散点图B.圆图C.条图D.线图二、多选题1、频次分布可以为:ABCDA.简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布2、以下各种图形中,表示连续数据频次分布的是:BDA.圆图B.直方图C.条图D.线图3、累加曲线的形状大约有:ABD,A.正偏态B.负偏态C.F分布D.正态分布4、统计图按照形状划分为:ABCDA.直方图B.曲线图 C.圆图D.散点图三、简答题1、简述条图、直方图、圆图、线图、散点图的用途。
医学统计学第3版,02计量资料的统计描述试题
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
统计学习题及答案(完整)2
统计学习题及答案(完整)2第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
选择适当的统计量描述一组数据的集中趋势
20. 1. 1平均数与加权平均数一、教学目标通过实例了解加权平均数的意义,会计算加权平均数并对计算结果进行简单分析.二、 教学重点:了解加权平均数的意义,会计算加权平均数教学难点:会计算加权平均数并对计算结果进行简单分析三、 教学过程:(一)平均数和加权平均数1、权的概念(1) . 一组数据88, 72, 86, 90, 75的平均数是;(2) 一组数据 12, 12, 12, 12, 4, 4, 4, 4, 4, 13,的平均数是;(3) 一组数据有5个20, 4个30, 3个40, 8个50,则这20个数的平均数为.归纳:其中50有 个,其中个数8就叫做数据50的权。
如数据20的权是_数据的权表示数据的相对“重要程度”;平均数用符号“项”读作:“x 拔”总结:刀个数的加权平均数:一般说来,如果在刀个数中,明出现,工2出现£次,…,X k 出现九次,则天..... + Xkfkfl + fl +... f k其中fl ' fl .....、fk 叫做权。
2、加权平均数的求法:某市三个郊县的人数及人均耕地面积如下表:郊县人数(万)人均耕地面积(公顷)A 150. 15B70. 21C100. 18求这个市郊县的人均耕地面积是多少?(精确到0. 01公顷))(分析:人均耕地面积=总耕地面积总人口解:.••总耕地面积=__________________________总人口 =_____________人均耕地面积=___________________________________________归纳小结:1、 加权平均的公式:一般地,2、 加权平均数中的“权”的常见见形式:(1)各个数据出现的次数(2)各个数据所占的成分比(3)比例的形式四、反馈检测:1、 某中学举行“红五月”歌咏比赛,六位评委对某位选手的打分为77, 82, 78, 95, 83, 75去掉一个最高分和一个最低分后的平均分是 分。
经济基础知识 章节练习题库 第24章 描述统计
单项选择题(每题1分)1.关于相关系数的说法,正确的是()。
A.取值范围是-l<r<lB.当r=-1时,说明两变量完全负相关C.当r=l时,说明两变量低度线性相关D.当r=0时,说明两变量完全无任何关系答案: B解析:本题考查相关系数。
相关系数的取值范围是-1≤r≤1选项A错误。
当r=1时,说明两变量高度线性相关,选项C错误。
r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,选项D错误。
2.集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。
数据的离散程度越大,集中趋势的测度值对该组数据的代表性()。
A.越好B.越差C.始终不变D.在一定区间内反复变化答案: B解析:本题考查离散程度的测度。
数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。
3.(2015年)根据2014年某城市金融业和制造业各1000人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是()。
A.标准分数B.相关系数C.变异系数D.偏态系数答案: C解析:本题考查离散系数。
离散系数也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。
4.(2016年)下列统计量中,适用于分析两个定量变量间相互关系的是()。
A.离散系数B.标准分数C.相关系数D.偏态系数答案: C解析:本题考查相关系数。
相关系数是度量两个变量间相关关系的统计量。
5.当一个现象的数量由小变大,另一个现象的数量相反地由大变小,这种相关称为()。
A.负相关B.正相关C.不相关D.不完全相关答案: A解析:本题考查负相关。
当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。
6.下列关于相关关系的说法,错误的是()。
A.当∣r∣≥0.8时,可视为高度相关B.当0.5≤∣r∣<0.8时,可视为中度相关C.当0.3≤∣r∣≤0.8时,视为低度相关D.当∣r∣<0.3,视为无线性相关答案: C解析:本题考查相关系数。
统计学基础练习题库及参考答案
第一章 定量资料的统计描述 1第一部分一、单选题1、甲乙丙三位研究者评价人们对四种方便面的喜好程度。
甲让评定者先挑选出最喜欢的品 牌,然后挑出剩余三种最喜欢的, 最后挑出剩余两种比较喜欢的。
研究者乙让评定者把四种 品牌分别给予 1~5 的等级评定 (1 表示最不 , 5 表示最喜欢 ),研究者丙只是让评定者挑出 自己最喜欢的品牌。
三位研究者所使用的数据类型是: BA .称名数据 -顺序数据 -计数数据B .顺序数据 -等距数据 -称名数据C .顺序数据 -等距数据 -顺序数据D .顺序数据 -等比数据 -计数数据2、调查 200 名不同年龄组的被试对手表的偏好程度如下:表 1 200该题自变量和因变量的数据类型是: A .称名数据 -顺序数据 C .顺序数据 -等距数据3、 157.5 的实上限是: CA . 157.75B . 157.65 4、随机现象的数量化表示称为 :B A .自变量 B .随机变量 5、实验或研究对象的全体称为: AA .总体B .样本点 6、下列数据中,哪个数据是顺序变量: A .父亲月收入 2400 元C .约翰 100 米短跑得第 2 名 二、概念题 数据类型、变量、观测值、随机变量、总体、样本、个体、次数、比率、概率、参数、统计 量、 μ、ρ、r 、 σ、 S 、 β、 n 。
第一章 定量资料的统计描述 2一、单选题1、一批数据中各个不同数据值出现的次数情况是: AA .次数分布B .概率密度C .累积概率密度D .概率2、以下各种图形中,表示连续数据频次分布的是: CA .条图B .圆图C .直方图D .散点图3、特别适用于描述具有百分比结构的分类数据的统计图 :BC .157.55D .158.5 C .因变量 D. 相关变量 C .个体 D .元素 C B .迈克的语文成绩是 80 分 D .玛丽某项技能测试得了 5 分。
DB .计数数据 -等比数据A.散点图B.圆图C.条图 D .线图5、以下各种统计图中,表示离散数据频次分布的:AA.圆图B.直方图C.散点图 D .线形图6、相关变量的统计图是: AA.散点图B.圆图C.条图 D .线图7、适用于描述某种事物在时间上的变化趋势,以及一事物随另外一事物的发展变化的趋势,还适用于比较不同人物群体在心理或教育现象上的变化特征以及相互联系的统计图是: DA散点图B圆图C条图D.线图二、多选题1、频次分布可以为:ABCDA .简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布2、以下各种图形中,表示连续数据频次分布的是:BDA .圆图B.直方图C.条图D.线图3、累加曲线的形状大约有:ABDA .正偏态B.负偏态C.F 分布D.正态分布4、统计图按照形状划分为:ABCDA直方图B曲线图C圆图D.散点图三简答题1、简述条图、直方图、圆图、线图、散点图的用途。
选择适当的统计量描述一组数据的集中趋势
谢谢!
Thank You!
B.14
C.15
D.16
综合应用
如图是连续十周测试甲、乙两名运动员体能 训练成绩的折线统计图,教练组规定:体能测试 成绩70分以上(包括70分)为合格.
1.请根据图中所提供的信息填下表:
平均数 中位数 众数 体能测试成绩合格次数
甲 60
65 65
2
乙 60 57.5 80
4
2.请从不同的角度对运动员体能测试结果进行判断: (1)根据平均数与成绩合格次数比较甲和乙,谁的 成绩最好? 乙 (2)根据平均数与中位数比较甲和乙,谁的成绩最 好? 甲 (3)根据折线统计图和成绩合格的次数,指出哪个 的训练效果最好? 乙
根据例4中的样本数据,你还有其 他方法评价(2)中这名选手在这次比 赛中的表现吗?
知识点 2 众数
众数:一组数据中出现次数最多的数据.
月收入/ 元
人数
45000 18000 10000 5500 5000 3400 3000 1000
1
1
1
3
6
1 11 1
求下列数据的众数.解释意义
5,2,6,7,6,3,3,4,3,7,6
请找出这些 工人日加工零件 数的中位数,并 说明这个中位数 的意义.
解:由条形图知这组数据中从小到大排列为:4个3, 5个4,8个5,9个6,6个7,4个8共36个数,则这组数 据的中位数为处在中间两个数6,6的平均数,因此这 些工人日加工零件的中位数为6.
这个中位数的意义:根据这个中位数,可以估计 其车间工人日加工零件个数大于或小于这个数的人数 各占一半.
教学反思
中位数和众数是数据分析中的两个重要元素. 从以往的教学经验看,学生容易混淆这两个数的 意义或不能正确找出一组数据的中位数或众数.学 生自学时,应该在这方面给予提醒.本课时的两个 层次中,一定要注意将中位数与众数进行对比, 帮助学生区分其异同,真正理解它们的意义,并 能正确找出一组混乱数据的中位数和众数.在教学 时,应充分发挥学生的主动性,通过与学生的互 动和交流,加深学生对本课时所学知识的认识.
统计初步——用数据特征表描述数据(一)
乙9 5 7 8 7 6 8 6 7 7
(3)应该选择哪一人参赛?
由(1)(2)计算知,甲、乙两人的平均成绩相等,但s乙2 s甲2 ,
§6.2.2 用样本的数字特征描述数据(一)
一组数据中的最大值与最小值的差叫做极差。 极差也是分析数据离散程度的一个统计量。
从甲、乙两名学生中选拔一人参加射击比赛,对他 们的射击水平进行了测试,两人在相同的条件下各射 击10次,命中环数如下:
甲 7 8 6 8 6 5 9 10 7 4
乙9 5 7 8 7 6 8 6 7 7
甲 7 8 6 8 6 5 9 10 7 4
乙9 5 7 8 7 6 8 6 7 7
(2)甲、乙命中环数的方差各是多少?
s2 甲
1(7 7)2 (8 7)2 (4 7)2
பைடு நூலகம்
3
10
s乙2
1(9 10
7)2 (5
7)2 (7
7)2
1.2
从上面的计算可以知道,谁的成绩波动比较大?
§6.2.2 用样本的数字特征描述数据(一)
我们通常采用各偏差平方的平均数来衡量数据的稳定性
一般地,设样本的元素为x1, x2,, xn ,样本的平均数为x,定义
S 2
1 n
( x1
x)2
(x2
x)2
(xn
x)2
S2表示样本方差。
1、方差是衡量数据稳定性的一个统计量; 2、方差的大小跟数据的大小有关,还跟数据的个数有关, 所以我们比较两组数据的稳定性时,应取相同的样本
统计学第四版问题详解(贾俊平)
第1章统计和统计数据1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第3章用统计量描述数据););=426.67;,,第五章1.23.4.5.6.7.5.8 (1)(3.02%,16.98%)。
(2)(1.68%,18.32%)。
5.9 详细答案:(4.06,24.35)。
5.10详细答案: 139。
5.11 详细答案: 57。
5.12 769。
第6章假设检验平看电,绝平,,绝,,绝在,,=100 =50=14.8 =10.4=0.8 =0.6对,,绝。
对设,。
统计学习题
第一章绪论(一)判断题1、统计数字的具体性是统计学区别于数学的根本标志。
()2、社会经济统计是在质与量的联系中,观察和研究社会经济现象的数量方面。
()3、离散变量的数值包括整数和小数。
()4、总体和总体单位的概念不是固定不变的,任何一对总体和总体单位都可以互相变换。
()5、统计指标系是对许多指标的总称。
()(二) 单项选择题1、统计研究的数量必须是()抽象的量具体的量连续不断的量可直接相加的量2、统计总体最基本的特征是( )数量性同质性综合性差异性3、统计总体的同质性是指( )总体单位各标志值不应有差异总体的各项指标都是同类性质的指标总体全部单位在所有标志上具有同类性质总体全部单位在所有某一个或几个标志上具有同类性质4、一个统计总体()只能有一个标志只能有一个指标可以有多个标志可以有多个指标5、总体和总体单位不是固定不变的,由于研究目的不同()总体单位有可能变换为总体,总体也有可能变换为总体单位总体只能变换为总体单位,总体单位不能变换为总体总体单位只能变换为总体,总体不能变换为总体单位任何一对总体和总体单位都可以互相变换6、某小组学生数学考试分别为60分、68分、75分和85分。
这四个数字是()标志指标标志值变量五)简答题1、为什么说社会经济统计是认识社会的有力武器?2、什么是总体和总体单位?试举例说明它们之间的关系。
3、什么是标志?它有哪些分类?4、指标和标志有何区别和联系?Answer1:(一)判断题1.(√)2。
(√)3.(×) 4。
(×) 5.(×)(二)单项选择题1.②2。
②3。
④ 4.④ 5.①6。
③(五)简答题1.社会经济统计是认识社会的有力武器,其理由有二.第一,因为任何事物都是质与量的对立统一,任何事物的量都依存于一定的质,而任何事物的质都可以在一定的条件下,通过一定的形式表现为一定的量。
第二,社会经济统计量最基本的特点就是以数字为语言,研究事物的量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用统计量描述数据习题 Company number【1089WT-1898YT-1W8CB-9UUT-92108】第3章习题一、选择题1. 一组数据中出现频数最多的变量值称为()。
A.众数B.中位数C.四分位数D.均值2.一组数据排序后处于中间位置上的变量值称为()。
A.众数B.中位数C.四分位数D.均值3. n个变量值乘积的n次方根称为()。
A.众数B.中位数C.四分位数D.几何平均数4. 标准差与均值的比值称为()。
A.异众比率B.离散系数C.平均差D.标准差5. 一组数据的最大值与最小值之差称为()。
A.平均差B.标准差C.极差D.四分位差6. 如果一个数据的标准分数是-2,表明该数据()。
A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7. 一组数据的标准分数,其()。
A.均值为1,方差为0 B.均值为0,方差为1C.均值为0,方差为0 D.均值为1,方差为18. 经验法则表明,当一组数据对称分布式,在均值加减1个标准差的范围内大约有()。
A.68%的数据B.95%的数据C.99%的数据D.100%的数据9. 离散系数的主要用途是()。
A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平10. 两组数据相比较()。
A.标准差大的离散程度也大B.标准差大的离散程度也小C.离散系数大的离散程度也大D.离散系数大的离散程度也小11. 某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
在上面的描述中,众数是()。
A.1200 B.经济管理学院C.200 D.理学院12. 对于分类数据,测度其离散程度使用的统计量主要是()。
A.众数B.异众比率C.标准差D.均值13. 对于右偏分布,均值、中位数和众数之间的关系是()。
A.均值>中位数>众数B.中位数>均值>众数C.众数>中位数>均值D.众数>均值>中位数14. 在某行业中随即抽取10家企业,第一季度的利润额(单位:万元)分别为72,,,,29,,25,,23,20。
该组数据的极差为()。
A.22 B.32C.42 D.5215. 某班学生的平均成绩是80分,标准差是10分。
如果已知该班学生的考试分布为对称分布,可以判断成绩在60分~100分之间的学生大约占()。
A.95%B.89%C.68% D.99%16. 若一组数列为 11 2 5 9 13 6 3 ,则该组数据的中位数为()17. 在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是()。
A.对称的B.左偏的C.右偏的D.无法确定18. 对某个高速路段行驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差为4公里/小时,下列哪个车速可以看作异常值()。
A.78公里/小时B.82公里/小时C.91公里/小时D.98公里/小时19. 一组样本数据为3,3,1,5,13,12,11,9,7。
这组数据的中位数是()。
A.3 B.13C.D.720. 当一组数据中有一项为零时,不能计算()。
A.均值B.中位数C.几何平均数D.众数21. 一组数据的离散系数为,均值为20,则标准差为()。
A.80 B.C.4 D.822. 在测度数据集中趋势的统计量中,不受极端值影响的是()。
A.均值B.几何平均数C.调和平均数D.中位数23. 两组数据的均值不等,但标准差相等,则()。
A.均值小的,离散程度大B.均值大的,离散程度大C.均值小的,离散程度小D.两组数据的离散程度相同24. 测度数据对称性的统计量是()。
A.偏态系数B.峰态系数C.离散系数D.标准差25. 下列叙述正确的是()。
A.众数可以用于数值型数据B.中位数可以用于分类数据C.几何平均数可以用于顺序数据D.均值可以用于分类数据26. 调查了一个企业10名员工上个月的缺勤天数,有3人缺勤0天,2人缺勤2天,4人缺勤3天,1人缺勤4天。
则缺勤天数的()A.中位数为2 B 中位数为2.5 C 中位数为4 D 众数为427、对数据实行标准化之后得到的z分数()。
A.没有计量单位 B.服从正态分布C.取值在0-1之间 D.取值在-1到1之间。
28、一个对称分布的峰度系数等于,则该数据的统计分布()。
A、为尖峰分布B、为扁平分布C、为左偏分布D、为右偏分布二、填空题1. 对一足球队十名球员的两项技术指标的测试结果如下表:在比较两个测试指标差异大小时,用_____离散系数____统计量度量较合适。
差异性最大的技术指标是_____传球偏差______。
2. 某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是_众数<中位数<均值_______3. 对某班级所授英语课程进行期末考试,并对100个学生的成绩进行分析,成绩均值为75,标准差为5。
那么有____95____名学生的考试成绩在65-85之间。
4.一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A 项测试中得了115分,在B 项测试中得了425分,与平均分相比,该位应试者更为理想的能力测试是_____A__________。
5. 对分类数据进行集中趋势侧度,其适用的测度值是___众数_____。
6.对比率的数据求其平均,适用的测度值是_____几何平均数_______. 7.众数、中位数、上四分位数、下四分位数、总体均值的符号可分别表示为_____μLueQ Q M M 0_______.8. 数据分布的偏斜程度较大时,用来反映数据集中趋势的测度值应该选择____众数或中位数______。
9. 总体方差、样本方差、总体标准差、样本标准差的符号可以分别表示为_______s s σσ22_______。
10. A 、B 两个班英语期末成绩的标准差分别为8,9;A 班的平均成绩为70,B 班的平均成绩为72,请问成绩差异较大的班是__B_____。
11. 一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg ;女生的平均体重为50kg,标准差为5kg 。
请问男生的体重差异___小于____女生的体重差异(大于、小于、等于),男生中有___ 68__%的人体重在55kg 到65kg 之间。
三、计算题1. 警察记录显示了冬季样本和夏季样本的每日犯罪报告数,抽样结果如下:冬季 18 20 15 16 21 20 12 16 19 20 夏季28 18 24 32 18 29 23 38 28 18(1) 计算每个季节犯罪报告数的极差冬季的极差=21-12=9 夏季的极差=38-18=20(2) 计算每个季节犯罪报告数的标准差冬季的平均数7.1710201520181=++++=x冬季犯罪报告数的标准差 夏季的平均数6.2510182418282=++++=x夏季犯罪报告数的标准差(3) 比较两个季节犯罪报告数的变异程度冬季162.07.17869.21===x s V 夏季261.06.2567.62===x s V 因为21V V <,所以冬季差异小 2. 现有如下数据:24 27 27 29 25 23 24 23 26 25 26 26 32 31 22(1) 计算均值,中位数,众数对数据排序:22 23 23 24 24 25 25 26 26 26 27 27 29 31 32 众数260=M(2) 计算上、下四分位数,并画出箱线图下四分位数 3.754的位置==nQ L 75.23)2324(75.023==-+L Q 上四分位数11.2543的位置==nQ U 27=U Q (图略) (3) 计算极差和标准差极差=32-22=10 标准差Nx i∑-2)(=μσ=(4) 是否有异常值最小值的z 分数=40.185.22622-=-=-σμx 最大值的z 分数=11.285.22632=-=-σμx 绝对值都小于3,所以无异常值。
3. 某公司招收推销员,要测定男女推销员的推销能力是否有差别,随机抽选了8人,经过一段时间销售,取得数据如下:男推销员销售额 (千元)女推销员销售额(千元)31 35 12 27 52 24 51 22 20 55 19 49 28 14 2944(1) 绘制箱线图比较男女推销员销售额数据的分布。
图略(2) 并用描述数据集中趋势的测度值说明男女推销员销售额的差异。
男推销员销售额的均值= 中位数= 女推销员销售额的均值= 中位数=31 结论:女推销员的销售额略高于男推销员。
4. 某种产品需要人工组装,现有三种可供选择的组装方法。
为比较哪种方法更好,随机抽取10个工人,让他们分别用三种方法组装。
下面是10个工人分别用三种方法在相同时间内组装产品数量(单位:个)的描述统计量:(1)从统计角度看(即不考虑其他经济因素),你准备采用什么方法来评价组装方法的优劣试说明理由。
从集中趋势的测度值来看,方法1的平均值大于其它两种方法,且众数,中位数也是方法1最高。
从离散程度角度讲,由于三种方法的平均水平不一样,应该用变异系数来进行比较,方法1的离散系数为,方法2的离散系数为,方法3的离散系数为。
(2)如果让你选择一种方法,你会做出怎样的选择试说明理由。
应该选择方法1,因为方法1的平均水平高,且离散系数最小,因此更加一致可靠。