第二讲习题 统计数据的描述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、单项选择题
1.美国10家公司在电视广告上的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。
下列图示法不宜用于描述这些数据的是( )。
A.茎叶图B.散点图C.直方图D.饼图
2.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本均值可作如下解释( )。
A.大多数女性MBA的起薪是54 749美元
B.最常见到的起薪是54 749美元
C.样本起薪的平均值为54 749美元
D.有一半的起薪低于54 749美元
3.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本中位数可作如下解释( )。
A.大多数女性MBA的起薪是47 543美元
B.最常见到的起薪是47 543美元
C.样本起薪的平均值为47 543美元
D.有一半女性的起薪高于47 543美元
4.1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。
对样本标准差可作如下解释( )。
A.最高起薪与最低起薪之差是10 250美元
B.大多数的起薪在44 499美元和64 999美元之间
C.大多数的起薪在37 293美元和57 793美元之间
D.大多数的起薪在23 999美元和85 499美元之间
5.对于右偏分布,均值、中位数和众数之间的关系是( )。
A.均值>中位数>众数B.中位数>均值>众数
C.众数>中位数>均值D.众数>均值>中位数
6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的离散程度的测度指标是( )。
A.方差B.极差C.标准差D.变异系数
7.根据下列样本数据3,5,12,10,8,22计算的中位数为( )。
A.9 B.10 C.12 D.11
8.根据下列样本数据3,5,12,10,8,22计算的标准差为( )。
A。
45.2 B.6.’72 C.6.13 D.37.67
9.在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是( )。
A.对称的B.左偏的C.右偏的D.无法确定
10.用极差度量离散程度的缺陷是( )。
A.基于均值计算离散程度B.基于绝对值计算,不易使用
C.易于计算D.没有使用所有数据的信息
11.下列叙述中正确的是( )。
A.如果计算每个数据与均值的离差,则这些离差的和总是等于零
B.如果考试成绩的分布是钟形的,均值为75,标准差为12,则考试成绩在63和75分之间的比例大约为95%
C.均值和中位数相等
D.中位数大于均值
12.如果数据的分布是左偏的,下列叙述中正确的是( )。
A.均值在中位数的右侧
B.均值等于中位数
C.分布的“尾部”在图形的右边
D.均值在中位数的左侧
13.除了( )之外,下列都是中位数的特征。
A.中位数是一组数据中的大小数值的平均
B.中位数是数据集中趋势的一种度量
C.中位数的位置由公式(n+1)/2确定,其中n是数据的个数
D.中位数等于第二个四分位数
14.下图是表示定量数据的( )的一个例子。
10 2 8
20 5 5 7 9
31 3 5 6 8 8
44 4 6 8
A.饼图B.直方图C.散点图D.茎叶图
15.研究人员在分析数据时,他通常需要对数据的离散程度或( )进行定量描述。
A.均值B.众数C.方差D.集中趋势
16.度量集中趋势最常见的指标是( ),用所有数据的和除以数据个数即可得到。
A.中位数B.标准差C.众数D.算术平均数
17.现有数据:3,3,1,5,13,12,ll,9,7。
它们的中位数是( )。
A.3 B.11 C.7.1 D.7
18.下列数据是某班.的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,55,95,86,78,86,85,87,92,73,82。
这些成绩的极差是( )。
A.78 B.84 C.80 D.40
19.当( )时,均值只受变量值大小的影响,而与次数无关。
A.变量值较大而次数较小B.变量值较大且次数较大
c.各变量值出现的次数相等D.变量值较小且次数较小
20.如果分布是左偏的,则( )。
A.众数>均值>中位数B.众数>中位数>均值
C.均值>中位数>众数D.均值>众数>中位数
21.当数据分布有对称的集中趋势时,其均值( )。
A.趋于变量值大的一方B.趋于变量值小的一方
C.趋于权数大的变量值D.趋于哪方很难判定
22.在离散程度的测度中,最容易受极端值影响的是( )。
A.极差B.四分位数C.标准差D.方差
23.变异系数为0.4,均值为20,在标准差为( )。
A.80 B.0.02 C.4 D.8
24.某校9个英语班的学生人数分别为12,15,9,12,13,12,14,11,10。
据此计算的结果是( )。
A.均值=中位数=众数B.众数>中位数>均值
C.中位数>均值>众数D.均值>中位数>众数
25.有8个变量值,它们对数值6的离差分别为—3,—2,0,0,4,3,4,2。
由此可知( )。
A.这8个数中有负数B.这8个数的均值为0
C.这8个数的均值为7 D.这8个数的均值为6
26.在数据集中趋势的测量中,不受极端值影响的测度是( )。
A.均值B.几何平均数
C.调和平均数D.众数
27.在比较两组数据的离散程度时,不能直接比较它们的方差,因为两组数据的( )。
A.标准差不同B.方差不同
C.数据个数不同D.计量单位不同
28.已知一组数据的均值为500,变异系数为0.3,则方差为( )。
A.225 B.500 C.50 000 D.22 500
29.
30.某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是( )。
A.众数>中位数>均值B.均值>中位数>众数
C.中位数>众数>均值D.中位数>均值>众数
31.某城市对1 000户居民的一项调查显示,人均收入在2 000~3 000元的、家庭占24%,在3 000~4 000元的家庭占26%,在4 000~5 000元的家庭占29%,在5 000~6 000元的家庭占10%,在6 000~7 000元的家庭占7%,在7 000元以上的家庭占4%。
从此数据可以判断,该城市收人数据是( )。
A.右偏的B.左偏的C.对称的D.正态的
32.某城市对1 000户居民的一项调查显示,人均收入在2 000~3 000元的家庭占24%,在3 000~4 000元的家庭占26%,在4 000~5 000元的家庭占29%,在5 000~6 000元的家庭占10%,在6 000~7 000元的家庭占7%,在7 000元以上的家庭占4%。
从此数据可以判断,用( )描述该城市的收入状况较好。
A.均值B.中位数C.众数D.极差
33.某企业有两个生产车间,共有工人50人。
据统计,A车间人均日加工产品数为78件,标准差为8件;B车间人均日加工产品数为72件,标准差为10件。
如果两个车间的工人数相等,则该企业工人人均日加工产品数为( )件。
A.75 B.80 C.85 D.70
34.两组工人生产相同的零件,A组日产零件数为32,25,29,28,26。
B组日产零件数为30,25,22,36,27。
哪组工人日产零件数的离散程度大?( )。
A.A组B.B组
C.两组的离散程度相同D.无法确定
35.直方图一般可用于表示( )。
A.次数分布的特征B.累积次数的分布
C.变量之间的函数关系D.数据之间的相关性
36.若基尼系数为0,表示收入分配( )。
A.比较平均B.绝对平均
C.绝对不平均D.无法确定
37.下列关于集中趋势的测度中,易受极端值影响的是( )。
A.均值B.众数C.中位数D.众数和中位数
38.某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12。
据此数据计算的结果是( )。
A。
均值=中位数=众数B.众数>中位数>均值
C.中位数>均值>众数D.均值>中位数>众数
39.离散程度的测度中最易受极端值影响的是( )。
A.极差B.方差C.标准差D.变异系数
40.计算方差所依据的中心数据是( )。
A.众数B.中位数C.均值D.几何平均数
41.均值为20 ,变异系数为0.4,则标准差为( )。
A.50 B.8 C.0.02 D.4
42.两组数据的均值不等,但标准差相等,则( )。
A.均值小,差异程度大B.均值大,差异程度大
C.两组数据的差异程度相同D.无法判断
43.在数据集中趋势的测度中,不受极端值影响的测度是( )。
A.众数B.几何平均数
C.调和平均数D.算术平均数
44.一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤。
据此数据可以判断( )。
A.男生体重的差异较大
B.女生体重的差异较大
C.男生和女生的体重差异相同
D.无法确定
45.对数据对称性的测度是( )。
A.偏度B.峰度C.变异系数D.标准差
46.从某地区抽取120家企业并按利润进行分组可知,其中19家企业的利润在200万~300万元之间,30家企业的利润在300万~400万元之间,42家企业的利润在400万~500万元之间,18家企业的利润在500万~600万元之间,11家企业的利润在600万元以上。
这120家企业的平均利润为( )。
A.456.23 B.426.67 C.512.56 D.400.12
47.从某地区抽取120家企业并按利润进行分组可知,其中19家企业的利润在200万~300万元之间,30家企业的利润在300万~400万元之间,42家企业的利润在400万~500万元之间,18家企业的利润在500万~600万元之间,11家企业的利润在600万元以上。
这120家企业利润的标准差为( )。
A.129.45 B.200.34 C.116.48 D.121.67
48.
49.当数据中出现零时,不宜计算( )平均数。
A.几何B.调和C.算术D.简单
85.在计算增长率的平均数时,通常采用( )。
A.几何平均数B.调和平均数
C.算术平均数D.简单平均数
50.
51.某股票在2000年、2001年、2002年和2003年的年收益率分别为4.5 %,2.1%,25.5 %,1.9%,则该股票在这四年的平均收益率为( )。
A.8.079%B.7.821%C.8.5%D.7.5%
52.一组数据的最大值与最小值之差被称为( )。
A.标准差B.方差C.平均差D.全距
53.
54.测度集中趋势的统计指标有( )。
A.标准差B.方差C.平均差D.众数
55.对于左偏分布,有( )。
A.均值大于中位数B.均值大于众数
C.均值小于众数D.均值大于方差
56.对于右偏分布,有( )。
A.均值小于中位数B.均值小于众数
C.均值大于方差D.均值大于中位数
57.下列叙述正确的是( )。
A.众数可以用于数值型数据
B.中位数可以用于分类数据
C.几何平均数可以用于顺序数据
D.均值可以用于分类数据
58.当偏态系数大于零时,分布是( )。
A.左偏的B.右偏的C.对称的D.无法确定的
59.当偏态系数小于零时,分布是( )。
A.左偏的B.对称的C.无法确定的D.右偏的
60.当峰态系数大于零时,表明分布是( )。
A.尖峰的B.扁平的C.左偏的D.右偏的
61.正态分布的峰态系数( )。
A.大于零B.等于零C.小于零D.大于或等于零
62.对10名成年人和10名幼儿的身高进行了抽样调查,其中成年人的身高为(单位:厘米):166,169,172,177,180,170,172,174,168,173;幼儿的身高为(单位:厘米):68,69,68,70,71,73,72,73,74,75。
如果要比较成年人和幼儿的身高差异,应该采用的统计量是( )。
A.标准差B.方差C.极差D.变异系数
63.对10名成年人和10名幼儿的身高进行了抽样调查,其中成年人的身高为(单位:厘米):166,169,172,177,180,170,172,174,168,173;幼儿的身高为(单位:厘米):68,69,68,70,71,73,72,73,74,75。
如果要比较成年人和幼儿的身高差异,结果是( )。
A.幼儿身高的差异较大
B.成年人身高的差异较大
C.幼儿和成年人身高的差异相同
D.幼儿和成年人身高的差异无法比较
64.一个总体由5个元素组成:3,7,8,9,13。
该总体的方差为( )。
A.8 B.7.5 C.9.7 D.10.4
65.计算离散系数的目的之一是为了( )。
A.消除计量单位的影响B.简化计算过程
C.消除差异程度的影响D.消除标准差的影响
66.数据的离散程度越大,集中趋势的测度值对该组数据的代表性( )。
A.越差B.越好C.不变D.无法确定
67.各变量值与其( )的离差之和等于零。
A.中位数B.众数C.均值D.标准差
68.各变量值与其( )的离差平方和最小。
A.中位数B.众数C.标准差D.均值
69.下列关于众数的叙述,不正确的是( )。
A.一组数据可能存在多个众数B.众数主要适用于分类数据
C.一组数据的众数是唯一的D.众数不受极端值的影响
70.如果已知一组数据的众数小于中位数,中位数又小于均值,则可以判断该数据是( )。
A.右偏的B.左偏的C.对称的D.尖峰的
71.一组数据包含10个观察值,则中位数的位置为( )。
A.4 B.5 C.6 D.5.5
72.一组数据包含9个观察值,则上四分位数的位置为( )。
A.7 B.8 C.7.5 D.9.5
73、在全距一定的情况下,组距的大小与组数的多少成()
A、正比
B、反比
C、无比例关系
D、有时成正比有时成反比
74、统计表的横行标题表示各组的名称,一般应写在统计表的()
A、上方
B、左方
C、右方
D、均可以
75、在填写统计表时,当发生某项不应有数字时,用()符号表示
A、O
B、X
C、—
D、...
76、按某一标志分组的结果表现为()
A、组内同质性,组间同质性
B、组内同质性,组间差异性
C、组间差异性,组间同质性
D、组间差异性,组间差异性
77、累计次数或累计频率中的“向上累计”是指()
A、将各组变量值由小到大依次相加
B、将各组次数或频率由小到大依次相加
C、将各组次数或频率从变量值最低的一组向最高的一组依次相加
D、将各组次数或频率从变量值最高的一组向最低的一组依次相加
78、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,末组的组中值为()。
A、260
B、215
C、230
D、185
79.对于右偏分布,均值、中位数和众数之间的关系是()
A、均值> 中位数> 众数
B、中位数> 均值> 众数
C、众数> 中位数> 均值
D、众数> 均值> 中位数
80、某10位举重运动员体重分别为:101kg、102 kg、103 kg、108 kg、102 kg、105 kg、102 kg、110 kg、
105 kg、102 kg,据此计算平均数,结果满足()。
A.算术平均数=中位数=众数B.众数>中位数>算术平均数
C.中位数>算术平均数>众数D.算术平均数>中位数>众数
81、甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41,平均数为70,则()。
A.甲数列平均数代表性高;B.乙数列平均数代表性高;
C.两数列的平均数代表性相同;D.甲数列离散程度大;
二、计算题
1
要求:
(1)计算该企业职工平均工资
(2)计算标准差
(3)计算方差
2、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。
乙班考试成绩的
要求:(1)计算乙班考试成绩的众数、中位数、均值及标准差;
(2)比较甲乙两个班哪个班考试成绩的离散程度大?
3、甲企业生产的袋装食品采用自动打包机包装,每袋标准要求重量为100克。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:
(2)若乙企业产品的离散系数为0.02,比较甲乙哪个企业的产品重量离散程度较大;
4、
要求:
(1)计算各班学生的平均成绩
(2)计算各班学生成绩的方差
(3)计算个班学生成绩的离散系数
(4)通过计算说明哪个班学生平均成绩的代表性强(4分)
5
要求:
(1)比较哪个企业职工年龄偏高
(2)比较哪个企业职工平均年龄更具代表性
6、某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;
(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
7
8、在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)企业数(个)
200~300 19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120家企业利润额的均值和标准差。
9、对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:
成年组166 169 172 177 180 170 172 174 168 173
幼儿组68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?
(2)比较分析哪一组的身高差异大?。