统计学基础第一次作业
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24、 不受极端值影响的集中趋势度量指标有 __中位数 _和 _众数 __。
25、 一组数据的最大值与最小值之差称 __极差 ___。
26、 __标准差系数 __是一组数据的标准差与其相应的平均数之比。
27、 数据分布的不对称性是 _偏态 _。
28、 数据分布的平峰或尖峰程度称 _峰态 __。
29、 当偏态系数为正数时,说明数据的分布是 _右偏分布 __。
欢迎下载
3
—
不及格人数和优秀生的人数都较少,分别为
7.5%和 10%。大部分同学成绩集中在 70~90 分
之间,说明该班同学成绩总体良好。
考试成绩一般用正整数表示时,可视为离散变量,也可用单项式分组,但本班学生成
绩波动幅度大, 单项式分组只能反映成绩分布的一般情况, 而组距分组分配数列可以明显看
出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。
10、 参数是用来描述 _总体特征 _______ 的概括性数字度量;而用来描述样本特征的概括
性数字度量,称为 ___统计量 _____。
11、 参数是用来描述 _总体特征 _的概括性数字度量;而用来描述样本特征的概括性数字
度量,称为 _统计量 _。
12、 统计数据有两种不同来源:一是 _直接来源 __,二是 __间接来源 ___。
2、 甲乙两班各有 30 名学生,统计学考试成绩如下:
考试成绩
优 良 中 差
甲班 4 8 14 4
人数
乙班 5 13 9 3
(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图;
(2)比较两班考试成绩分布的特点。
答:乙班学生考试成绩为优和良的比重均比甲班学生高,
而甲班学生考试成绩为中和差的比
重比乙班学生高。因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出
甲班 2 5 10 17 6 40
学生人数
乙班 4 7 14 18 7 50
欢迎下载
5
—
试分别计算两个班的平均成绩和标准差,并比较说明哪个班的外语考试成绩差异程度更大。 答:英语统考成绩 学生人数 A 班 B 班 60 以下 4 6 60 ~ 70 12 13 70 ~ 80 24 28 80 ~ 90 6 8 90以上 4 5 合计 50 60
30、 集中趋势度量指标中的算术平均数、调和平均数
_数值 _______(容易、不易)受极
端变量值影响。
31、 中位数适用于顺序变量和定量变量,不适用于
_名义变量和次序变量 _______。
二、简答题
1、 什么是数据的集中趋势?反映数据集中趋势的指标有哪些?
答:数据的集中趋势在统计学中是指一组数据向某一中心值拢的程度,
4、 体重的数据类型是: clear all 。
5、 民族的数据类型是: CHAR。
6、 空调销量的数据类型是:电器。
7、 支付方式(购买商品)的数据类型是:分类变量。
8、 学生对教学改革的态度(赞同、中立、反对)的数据类型是:顺序数据。
9、 从总体中抽出的一部分元素的集合,称为 ___样本 _____。
答:特点: 众数是总体中出现次数最多的标志值。 反映了标志值分布的集中趋势, 是一种由
位置决定的平均数。可以没有众数也可有两个。
众数是一种位置代表值,它的应用场合比
较有限。 如:在编制物价指数时, 农贸市场上某种商品的价格常以很多摊位报价的众数值为
代表。
中位数是将总体中各数据排序后,位于中点位置的。中位数也反映标志值的集中趋势,
它反映了一组数据中
心点的位置所在。
反映数据集中趋势的指标主要有:众数、中位数、分位数、平均数等。
2、 什么是数据的离散程度?常用的测度离散程度的指标有哪些?
答:离散程度反映的是各变量值远离其中心值的程度。
常用的测度离散程度的指标有:四分位差、方差、标准差、极差、离散系数等。
3、 简述众数、中位数和均值的特点和关系。
也是由位置决定的平均数。如 , 要在若干个连锁店间选择仓库或商品配送中心就可以利用这
一性质,因而在工程设计中有应用价值。
欢迎下载
2
—
均值集算术平均数, 是数据集中趋势的最主要测度值。 它反映了一组数据中心点或代表
值,是数据误差互相抵消后客观事物必然性数量特征的反映。
总之,众数最容易计算,但
不是永远存在, 同时作为集中趋势代表值应用的场合较少;中位数很容易理解、很直观,它
统计学基础 第一次作业
一、填空题
1、 按照所采用的计量尺度不同,可以将统计数据分为
_分类数据 _、 _顺序数据 _和 _数值型
数据 _。
2、 按照数据的收集方法的不同,可将统计数据分为
_观测数据 _和 __实验数据 _。
3、 按照被描述的对象与时间的关系,可将统计数据分为
_截面数据 __和 _时间序列数
关系: 若数据足够多,而且次数分布适度偏斜情况下,均值、
中位数和众数三者间有较
固定的关系。 不论是在右偏还是左偏, 中位数始终居于均值与众数之间。 如果将均值和众数
之间的距离视为 1,则中位数与均值之间的距离为,中位数与众数之间的距离约占。根据这
一关系,当已知其中两个代表值时,可用公式求出第三个代表值。
16、 按取值的不同,数值型变量可分为 _离散型变量 __和 _连续型变量 _。
17、 在数据分组中, _离散型变量 _______可以进行单变量值分组, 也可以进行组距分组,
而___连续型变量 _____只能进行组距式分组。
18、 组距分组中,向上累积频数是指某组 _上限以下 _的频数之和。
19、 将某地区 100 个工厂按产值多少分组而编制的频数分布中,频数是
4、 某企业工人生产产品件数的分组资料如下:
( 1) 计算该企业工人的平均产量 答: X=41.88 ( 2) 计算该企业工人产量的平均差和均方差; 答: M d=6.25 s=7.39 5、 某学院二年级两个班的学生外语考试成绩如下表:
外语考试成绩
50~ 60 60~ 70 70~ 80 80~ 90 90 ~ 100 合计
不受极端值的影响, 这既是它有价值的方面, 也是它数据信息利用不够充分的地方; 均值是
对所有数据平均后计算的一般水平代表值, 数据信息提取的最充分。 特别是当要用样本信息
对总体进行推断时,均值就更显示出它的各种优良特征。均值在整个统计方法中应用最广,
对经济、管理和工程等实际工作也是最为重要的一个代表值和统计量。
_各组的工厂数
__。
20、 频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这
—
种分布的类型是 _U 型分布 _。
21、 一组数据向某一中心值靠拢的倾向反映了数据的
_中心点 _。
22、 __众数 _是一组数据中出现次数最多的变量值。
23、 一组数据排序后处于中间位置上的变量值称 _中位数 __。
13、 统计数据的误差有两种类型,即 __抽样误差 _和 _非抽样误差 。
14、 统计表由 _数据 __、 __表头 __、 ___行标题 _和 __列标题 __四个部分组成。
15、 统计分组应遵循“不 ____ 重_____不 __漏 _______”、“ ___上限 ______不在组内”的
原则。
( 1) 将该班学生分为不及格、及格、中、良、优五组,编制一张分数统计表。
考试成绩
学生人数 / 人
比率 %
60 分以下
3
7.5
60-70
6
15
70-80
15
37.5
80-90
12
30
90-100
4
10
合计
40
100
( 2) 指出分组标志及类型、分组方法的类型、分析本班学生考试情况。 答:分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同学
四、实操题(附加题) 完成教材 P71Excel 操作题,完成后将 Excel 文件连同此 Word答案文档一同打包上传,完
成效果如下图所wenku.baidu.com。
欢迎下载
6
三、综合计算题 1、 某班 40 名学生考试成绩如下:
66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76
85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定: 60 分以下为不及格, 60-70 分为及格, 70-80 分为中, 80-90 分为良, 90-100 分 为优。
" 两头大,中
欢迎下载
4
—
间小 " 的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。 3、 某班级 25 名学生的统计学考试成绩数据如下: 89, 95, 98, 95, 73, 86, 78,67, 69,82, 84, 89, 93, 91, 75, 86, 88, 82, 53, 80, 79, 81, 70, 87, 60 试计算: (1)该班统计学成绩的均值、中位数和四分位数; 答: X=81.2 M e=82 Q l =74 Q M=89 (2)该班统计学成绩的方差、标准差。 答: S=11.18 S 2=124.92