数据分析初步讲义及习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析初步
1、平均数
平均数:把一组数据的总和除以这组数据的个数所得的商。平均数反映一
组数据的平均水平,平均数分为算术平均数和加权平均数。
一般的,有n 个数,,,,321n x x x x ∙∙∙我们把叫做这n 个数的算术平均数简称平均数,记做-
x (读作“x 拔”)
(定义法)
当所给一组数据中有重复多次出现的数据,常选用加权平均数公式。
且f 1+f 2+……+f k =n (加权法),其中
k f f f f ∙∙∙321,,表示各相同数据的个数,称为权,“权”越大,对平均数的影响就越大,加权平均数的分母恰好为各权的和。
当给出的一组数据,都在某一常数a 上下波动时,一般选用简化平均数公式
,其中a 是取接近于这组数据平均数中比较“整”的数;•
2、众数与中位数
平均数、众数、中位数都是用来描述数据集中趋势的量。平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,
当一组数据中有个数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适。中位数与数据排列有关,个别数据的波动对中位数没影响; 当一组数据中不少数据多次重复出现时,可用众数来描述。
众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据
的众数
)
(1
321n x x x x n +∙∙∙+++
中位数:将一组数据按大小顺序排列,把处在最中间的一个数(或两个数
的平均数)叫做这组数据的中位数.
3、方差与标准差
用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏
离平均值的情况,这个结果叫方差,计算公式是 s 2=[(x 1-)2+(x 2-)2+…
+(x n -)2];
一般的,一组数据的方差的算术平方根
S=])x -(x +…+)x -(x +)x -[(x n
12_
n 2
_22_1称为这组数据的标准差。
方差和标准差都是反映一组数据的波动大小的一个量,其值越大,波动越大,也越不稳定或不整齐。或者说,离散程度小就越稳定,离散程度大就不稳定。
数据分析练习题 一.选择
1.已知1x ,2x ,3x ,…,15x 的平均数为a ,16x ,17x ,…,40x 的平均数为b ,则1x ,2x ,
3x ,…,15x ,16x ,17x ,…,40x 的平均数为( )
A .
1()2a b + B .1()4a b +
C .1()40a b +
D .1
(35)8a b +
2.已知一组正数1x ,2x ,3x ,
,7x 的方差2
2
22212371(63)
7
S x x x x =
++++-则关于数据13x +,23x +,33x +,,73x +的说法:(1)方差为2
S ;(2)
平均数为3;(3)平均数为6;(4)方差为2
9S ,其中正确的说法是( )
A. (1)与(2)
B. (1)与(3)
C. (2)与(3)
D. (3)与(4) 3..在一化学实验中,因仪器和观察的误差,使得三次实验所得实验数据分别为a 1,a 2,a 3.我们规定该实验的“最佳实验数据”a 是这样一个数值:a 与各数据a 1,a 2,a 3差的平方和M 最小.依此规定,则a =( )
A. 123a a a ++
B.
C.
D. 1
233a a a ++ 4.甲从一个鱼摊上买了三条鱼,平均每条a 元,又从另一个鱼摊上买了两条鱼,平均每条b
A D
C
B 系是()
A .a >b
B .a <b
C .a =b
D .a 和b 的大小无关 5.. 某同学参加了5科考试,平均成绩是77分,他想在下一科考试后使6科考试的平均成绩
为80分,那么他第6科考试要得的分数应为( ) A .88分 B .91分 C .95分 D .98分 6、下列语句中,不是命题的是………………………………………………( )
A.若两角之和为90º,则这两个角互补
B. 相等的角是对顶角
C. 同角的余角相等
D. 作线段的垂直平分线 7、在下列图形中,即是轴对称图形,又是中心对称图形的是( )
8、一组数据共40个,分为6组,第1组到第4组的频数分别为10,5,7,6,第5组的频率为0.1,则第6组的频数为………………………………………( ) A.10 B.8 C.6 D.4
9、如图,在等腰梯形ABCD 中,AD ∥BC ,AD =5,AB =6,BC =8,且AB ∥DE ,则△DEC 周长为( )
A .15
B .12
C .3
D .19
10、如图,四边形ABCD 是由四个边长为1的正六边形所围住, 则四边形ABCD 的面积是( ) A .
2
3 B .
4
3 C .1
D .2
二填空
1.某样本方差的计算公式是2
22
21281(2)(2)(2)8
S x x x ⎡⎤=
-+-++-⎣⎦,则它的样本容量
2. 已知数据1a ,
2a ,…,n a 的平均数为x ,方差为2
S ,则数据123a +,223a +,…,
23n a +的
方差为 .
3. 若1a ,2a ,…,30a ,方差为0.31,那么1a ,2a ,…,30a , x 这31
三解答题
A
B
C
D
第5题图E (第9题)