数学习作A_一维数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析
4-1 一维数据分析
一、算术平均数
数据x 1,x 2,……,x n 的算术平均数是μ=
12n
x x x n
++
+。

二、加权平均数
设有k 个数值x 1,x 2,……,x k ,其对应的权数分别为w 1,w 2,……,w k ,则加权平均
数为W =
11
k
i
i
i k
i
i x w w
⨯∑
∑==()。

三、几何平均数
数据x 1,x 2,……,x n 都是正数,则几何平均数G 为 G =

1
12n
n x x x ⨯⨯⨯()。

四、中位数
设有一群由小到大排列的数据x 1,x 2,……,x n , (1) 若n 是奇数,则中位数恰为位于正中间的数。

即Me =12
n x +。

(2) 若n 是偶数,则中位数定义为位于中间两个数的算术平均数。

即Me =1
21
22n n x x +(+)。

五、众数
众数定义为一群数据中,出现次数最多的数值。

六、变异数与标准差
设一组数据x 1,x 2,……,x n 之算术平均数为μ,则:
(1) 变异数σ2=1n 2
1n i i x μ∑=(-)=1n 221
n i i x μ-∑=。

(2) 标准差σ
七、平移与伸缩对σ与μ的影响
设原始资料x 1,x 2,……,x n 。

令y i =ax i +b ,i =1,2,……,n 。

则: (1) μy =a μx +b 。

(2) σy =|a |σx 。

八、数据的标准化
(1) 已知数据x 1,x 2,……,x n ,则将此数据减去算术平均数μ,再除以标准差σ,得到
z 1,z 2,……,z n i i x μz σ⎛
⎫ ⎪⎝
⎭-其中=,此称为原数据的标准化数据。

(2) 标准化数据的性质:
标准化数据的算术平均数为0,标准差为1。

基础题
1. 已知数值2,3,9,1,7,7,4,6,4,7,试求这些数值的
(1)算术平均数。

(2)中位数。

(3)众数。

(4)变异数。

(5)标准差。

(10分)
解 (1)算术平均数μ=2391774647
10
+++++++++=5
(2)(3)将这10个数值由小到大排列:1,2,3,4,4,6,7,7,7,9
中位数是第5与第6个数值的平均,故中位数Me =46
2
+=5
因为7是出现最多次的数(出现3次),故众数为7 (4)(5)变异数为
σ2=22222222222535951575754565457510
(-)+(-)+(-)+(-)+(-)+(-)+(-)+(-)+(-)+(-)
=6
故标准差σ
2.
(1)分)
解 (1)算术平均数μ=0017233541
16
⨯⨯⨯⨯⨯++++=2(人)
(2)因有16个家庭,排序后第8个位置的数值是2,第9个位置的数值是2
故中位数Me =22
2
+=2(人)
(3)因为出现最多次的子女数为1,共出现7次,所以众数为1(人)
(4)(5)变异数为σ2
=22222
00271232253214216
⨯⨯⨯⨯(-)+(-)+(-)+(-)+(-)

1616
=1 故标准差σ=1(人)
3. 科技院校日间部四年制申请入学招生的成绩计算方法如下:以申请生之学科能力测验原级分,依各科目采计权重计算其加权平均级分,经转换成百分制后,即为该申请生之成绩。

解 小芬的成绩=加权平均级分×100
15
=11121121301411312201⨯⨯⨯⨯⨯++++++++×10015
=80
小芬加权后的成绩为 80 分
4. (1)某地区统计其三年来人口的成长率分别为60%、20%、-10%,则此地区这三年人口
的平均成长率为何?(4分)
(2)已知A 都市房价在某年年初为每坪10000元,当年年底每坪增加至12000元,次年年底每坪增加至15000元,又隔年年底每坪增加至17280元,试问这三年来,房价每年的平均成长率为何?(4分)
解 (1)假设平均成长率为 r ,则有
(1+r )3=(1+60%)(1+20%)(1-10%)
整理可得r 1=0.2=20%
即这三年的平均成长率为20%
(2)假设这三年来每年的平均成长率为 r ,则可得 10000(1+r )3=17280
整理可得r 1=0.2=20%
即这三年的房价平均成长率为20%
5. 在100个数据中,有64个1,其余为0,试求: (1)算术平均数。

(4分) (2)标准差。

(4分)
解 (1)μ=
164036
100
⨯⨯+=0.64
(2)σ
=2
0.64-()
=10.64(-)
=0.48
6. 甲、乙、丙、丁四位同学参加推荐甄选学科能力测验,五科的成绩如下表所示。

设σ1、σ2、σ3、σ4分别代表甲、乙、丙、丁四位同学五科成绩的标准差。

请仔细观察下表中数据,判断σ1、σ2、σ3、σ4
解 i i 科成绩为z i ,丁的各科成绩为w i ,则可发现 y i =x i -10,z i =0.8x i ,w i =1.2x i -20
设σ1、σ2、σ3、σ4分别代表甲、乙、丙、丁四位同学五科成绩的标准差 则由数据的伸缩与平移可得
σ2=σ1,σ
3=0.8σ1,σ4=1.2σ1(且σ1>0) 故σ4>σ1=σ2>σ3
7. 国外某一男子篮球队来台访问,阵容整齐,七位选手身高分别为6呎4吋、5呎8吋、6呎2吋、5呎10吋、5呎6吋、6呎、6呎6吋。

(1)我们习惯以公分来表示,试问这群选手的平均身高及标准差为何(以公分为单位)?(1呎=12吋,1吋=2.54公分)(4分)
(2)若将上述资料经过z i =ax i +b 转换后,其中a >0,得到的新数据的平均数是0,标准差是1,试求a ,b 之值。

(4分)
解 (1)将选手身高整理成以吋为单位,可得原数据x i 分别为
76吋、68吋、74吋、70吋、66吋、72吋、78吋
则μx =76687470667278
++++++=72
σx =4
将原数据x i 乘上2.54,可得新数据y i (y i =2.54x i ),即 μy =2.54μx =2.54×72=182.88,σy =2.54σx =10.16
故平均身高为182.88(公分)及标准差为10.16(公分) (2)因标准化数据的平均数是0,标准差是1
故令z i =i x x x μ
σ-,此时z i 的平均数是0,标准差是1
故得a =1x σ=14,b =-x x μσ=-72
4
=-18
8. 假设有n 个数据x 1,x 2,……,x n ,若将每个数据乘上-3再加10,形成一组新数据y 1,y 2,……,y n ,即y i =-3x i +10(i =1,2,……,n ),已知新数据的算术平均数为-140、中位数为-110、标准差为9 ,试求原数据的算术平均数、中位数及标准差。

(9分)
解 由数据的伸缩与平移可得
μy =-3μx +10 ⇨ μx =103y μ--=14010
3
---=50
Me (y )=-3Me (x )+10 ⇨ Me (x )=103Me y ()--=11010
3
---=40
σy =|-3|σx ⇨ σx =3y σ=9
3
=3
故原数据的算术平均数为50、中位数为40及标准差为3
9. 某次考试将全班分成甲、乙两组进行测验,甲组学生15人,其平均成绩70分,标准差8分;乙组学生25人,其平均成绩62分,标准差4分。

试问全班40位学生的平均成绩是多少?标准差是多少?(8分)
解 合并后的平均成绩为15702562
40
⨯⨯+=65(分)
甲组的标准差为8
,得=8 ⇨15
21i i x ∑==74460 乙组的标准差为4
,得=4 ⇨25
21
i i y ∑==96500
=7(分)
10. 某班数学模拟考试的成绩,平均为8级分,标准差为2.5级分;而数学期中考试的平均为
64分,标准差为6分。

小璇的模拟考与期中考成绩分别为7级分与60分。

试问小璇这两次考试的标准化后之分数分别是多少?(8分) 解 将成绩标准化后
模拟考试:782.5-=-25,期中考试:60646-=-2
3
进阶题
11.一组数据x1,x2,……,x25,经根式函数y=
转换后,得到新数据之平均数μy=24
及标准差σy=7,试求原数据x i之算术平均数。

(8分)解依题意
σy
7

25
1
i
i
x


=72+242=252
故μx=
25
1
25
i
i
x

==25
12.有一组数据,取自某社团9位成员在学测中的数学级分,数据如下(不完全依大小排列):
6,8,10,11,11,12,14,x和y,已知这些数据的算术平均数和中位数都是10,且x 小于y,则x,y分别为多少?(8分)
解因算术平均数为10
故681011111214
9
x y
++++++++
=10,得x+y=18
因9个数据的中位数为由小到大或由大到小的第5个数字
将已知的数据由小到大排列得6、8、10、11、11、12、14
而由大到小的第5个数字就是10
所以加入x,y两数后,后5个数的次序须不变才会使得中位数为10 因此得x<y≤ 10,又x+y=18,故得x=8,y=10。

相关文档
最新文档