数据的数字特征
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、平均数
由于平均数与每一个样本的数据有关, 所以任何一个样本数据的改变都会引起平均 数的改变,这是众数、中位数都不具有的性 质。
也正因如此 ,与众数、中位数比较起来,平 均数可以反映出更多的关于样本数据全体的 信息。
样本的众数、中位数和平均数常用来表示样 本数据的“中心值”,其中众数和中位数容易 计算,但只能表达样本数据中的少量信息. 平 均数代表了数据更多的信息,但受样本中每个 数据的影响,越极端的数据对平均数的影响也 越大.当样本数据质量比较差时,使用众数、中 位数或平均数描述数据的中心位置,可能与实 际情况产生较大的误差,难以反映样本数据的 实际状况,因此,我们需要一个统计数字刻画 样本数据的离散程度.
复习回顾
前面我们学习了利用统计图表显示数 据的特征
条形统计图
统计图
折线统计图 扇形统计图
茎叶图
一、数据的特征除了利用统计图表外,还可以利
用一些统计量来表述,前面我们在表示数据的集 中趋势和离散程度时,我们利用平均数、中位数, 众数、极差、方差等来表示。
(1)平均数:就是一组数据的平均,设有n个数据, x1 ,x2, …,xn,这组数据的平均数为:
直径/mm
1
2
3
4
5 6 7 产源自文库编号
8
9 10
用不同的方式刻画数据离散程度,其理 想的形式满足一下三条 :
1°应充分利用数据,以便提供更确却的信息
2°仅用一个数据来刻画数据的离散程度 3°对于不同的数据,当离散程度大时,该数亦 大
问题3 分别计算上题中的甲乙车床的标准差? 根据标准差计算公式
s ( x1 x ) ( x 2 x ) ( x n x )
1 2 n
0
24
4、数据a 1 , a 2 a n , 的方差为 S 的方差为( ) A
1 2 S
2
2
,则 2 a , 2 a
1
2
2an
B
S
2
C
2S
2
D
4S
2
25
小结:
• 1 . 众数、中位数、平均数的概念
• 2. 三种数字特征的优缺点 • 3. 极差、方差、标准差的概念
• 4. 如何利用标准差刻画数据的离 散程度?
2°你能从上图中分别比较甲 乙两组数据的平均数和方差 的大小吗?
88400 752 00 31 8
1 2 3 4 5
028 02337 12448 238
例1某公司员工的月工资情况如表:
我的工资是 1500
我的工资 是2000
职员D
职员c
我的工 资是 4000
我的可以拿 到???
工程师
应聘者
月工资/元 员工数/人
2 2 2
n
甲:s=0.16(mm) 乙:s=0.077(mm) 因为甲的标准差比乙大,因此乙更稳定
练
习
1、下列说法中正确的有___________ (1)在统计中,把所需考察对象的全体 叫做总体, (2)一组数据的平均数一定大于这组数 据中的每一个数据, (3)平均数、众数、中位数,从不同的 角度描述一组数据的集中趋势, (4)一组数据的标准差越大,说明数据 波动越大。
极差,方差与标准差.
极差、方差与标准差
15
甲:7 乙:9
8 5
7 7
9 8
5 7
4 6
9 8
10 6
7 7
4 7
极差:
甲的环数极差=10-4=6 乙的环数极差=9-5=4.
它们在一定程度上表明了样本数据的分散程度,与平均 数一起,可以给我们许多关于样本数据的信息.显然,极 差对极端值非常敏感,注意到这一点,我们可以得到一种 “去掉一个最高分,去掉一个最低分”的统计策略.
8000 1
5000 2
4000 2000 1000 800 4 6 12 8
700 20
600 5
500 2
(1)分别计算该公司员工月工资的平均数、中位数和众数。 (2)公司经理会选取上面哪个来代表该公司员工的月工资情 况,税务官呢?工会领导呢? 分析:1.根据平均数、中位数的计算公式,可以算出平均数 为:1373元,中位数为:800元,众数为:700元
16
方差与标准差:
2 2 2
方差:
s
2
(x
=
1
- x
)
+
(x
2
- x
)
+ L +
(x
n
- x
)
n
2
2
2
标准差:
(x
s =
1
- x
)
+
(x
2
- x
)
+ L +
(x
n
- x
)
n
注:(1)方差变形式 (2)极差,方差和标准差用来反映离散程度 (3)若一组数据全部相等则离散度为0
甲:7 乙:9
8 5
7 7
2.不同身份的人代表不同阶层人的利益,对公司领导平均数 好,对税务官中位数比较好,对工会领导众数即使他的选择
如果你应聘该公司,你怎样看待公司员工的收入情况?
二、三种数字特征的优缺点
1、众数体现了样本数据的最大集中 点,但它对其它数据信息的忽视使得无 法客观地反映总体特征. 2
、中位数是样本数据的等分线, 它不受少数极端值的影响,这在某 些情况下是优点,但它对极端值的 不敏感有时也会成为缺点。
如例1
:有两位射击运动员在一次射击测试中 各射靶10次,每次命中的环数如下:
甲:7 乙:9 8 5 7 7 9 8 5 7 4 6 9 8 10 7 4 6 7 7
如果你是教练,你应当如何对这次射击 作出评价? x 甲 7, x 乙 7 两人射击 的平均成绩是一样的.那么两 个人的水平就没有什么差异吗?
22
2、为了判断甲、乙两名同学本学期几 次数学考试成绩哪个比较稳定,通常需 要知道这两个人的( ) A 平均数 B 众数 C 极差 D 标准差
23
3、对一组数据 a , a , , a ,如果将他 们改为 a 1 m , a 2 m , , a n m , 其中 m ,则下面的结论正确的是( ) A平均数变了,方差不变, B平均数不变,方差变了, C平均数、方差都不变, D 平均数、方差都变了。
甲:7 乙:9
频率 0.3 0.2
0.1 4 5
8 5
7 7
9 8
5 7
4 6
9 8
频率
10 6
7 7
4 7
0.4 0.3 0.2 0.1 6 (甲) 7 8 9 10
环数 4 5 6 7 (乙) 8 9 10
环数
直观上看,还是有差异的.如:甲成绩比较分散, 乙成绩相对集中(如上图所示). 因此,我们还需要从另外的角度来考察这两组数据.
甲/mm 40.0 39.8 40.1 40.2 39.9 40.0 40.2 39.8 40.2 39.8
乙/mm
40.3 40.2 40.1 40 39.9 39.8 39.7 39.6
40.0
40.0
39.9
40.0 39.9 40.1 40.1
40.1
40.0 39.9
你能选择适当的数分别表示这两组数据吗?
9 8
5 7
4 6
9 8
10 6
7 7
4 7
s 甲 = 2, s 乙 =
6 5
标准差越大离散程度越大,数据较分散,稳 定性就越差; 标准差越小离散程度越小,数据较集中在平 均数周围,稳定性就越好.
18
例2 甲乙两台机床同时生产直径为40mm的零件,为 了检验产品的质量,从两台机床生产的产品中个抽 取10件进行测量,结果如下:
注:中位数可能在所给数据中也可能不在所给数据中 (3)众数:就是一组数据中出现次数最多的数.
(4)极差:就是一组数据中最大数与最小数之间 的差.
其中平均数、加权平均数、中位数或众数反映集 中趋势
甲的中位数:18 22 问题1 在上一节中,从甲乙两个城市随机抽取的 众数:10 18 30 16台自动售货机的销售额可以用茎叶图表示如下 极差:53 甲的平均数:22.8 乙的中位数:27 31 方差:210.9 甲 乙 众数:23 34 乙的平均数:28.6 1°甲乙两组数据的中位数众数 极差:38 865 0 方差:115.2 极差分别是多少?
x x1 x 2 x n n
特别地,如果上面n个数据中不同数据x1,x2,…,xn的个 数分别为k1,k2,…,kn,那么它们的平均数为
x
x1 k 1 x 2 k 2 x n k n k1 k 2 k n
(2)中位数:就是一组数据按照从小到大或从大到小的 顺序进行排列时,处于中间位置的数. 奇数个数时,中位数有1个 偶数个数时,中位数有2个