第五讲 直方图与回归直线
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五讲 用样本估计总体及线性相关关系
一.要点精讲
1.用样本的数字特征估计总体的数字特征
(1)众数、中位数
在一组数据中出现次数最多的数据叫做这组数据的众数;
将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;
(2)平均数与方差
如果这n 个数据是n x x x ,,.........,21,那么∑==
n
i i
x n
x 1
1
叫做这n 个数据平均数;
如果这n 个数据是n x x x ,,.........,21,那么)(1
1
2
∑=-=
n
i i
x x n
S 叫做这n 个数据方差;
同时=s )
(1
1
∑=-n
i i
x x n
叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图
样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数据(或数据组)的频率的
分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表;
(5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×
组距
频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。 总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。 3.线性回归
回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线
的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y
+=ˆ。其中2
1
211
2
1
)
()
)((x
n x
y
x n y x
x x
y y x x
b n i i
n
i i i
n
i i
n
i i i
--=
---=
∑∑∑∑====,x b y a -=。我们称这个方程为y 对x 的回归直线方程。
二.典例解析
题型1:数字特征
例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.
题型2:数字特征的应用
例3.(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)
品种第1年第2年第3年第4年第5年
甲9.8 9.9 10.1 10 10.2
乙9.4 10.3 10.8 9.7 9.8
其中产量比较稳定的小麦品种是。
例3.(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.4 8.4 9.4 9.9 9.6 9.4 9.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
(A)9.4, 0.484 (B)9.4, 0.016 (C)9.5, 0.04 (D)9.5, 0.016
题型3:频率分布直方图与条形图
例4.(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
(A)20 (B)30 (C)40 (D )50
例5.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:cm )
分组 [140,145) [145,150) [150,155) [155,160) [160,165) [165,170) [170,175) [175,180) 合计 人数
1
2
5
9
13
6
3
1
40
(1)列出频率分布表; (2)画出频率分布直方图;
(3)估计数据落在[150,170]范围内的概率。 (1)根据题意可列出频率分布表:
分 值 频 数
频 率
[140,145] [145,150] [150,155] [155,160] [160,165] [165,170] [170,175] [175,180]
合 计
40
1.00
(2)频率分布直方图如下:
题型4:茎叶图
例6.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。
1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:
鲁斯马利斯
0 8
1 3 4 6
5 2 2 3
6 8
5 4 3 3 9
9 7 6 6 1 1 4
9 4 4 5
0 6 1
题型5:线性回归方程
例7.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s) 5 10 15 20
深度y( m) 6 10 10 13
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。
题型6:创新题
例8.某班学生在一次数学考试中成绩分布如下表:
分数段[0,80)[80,90)[90,100)
人数 2 5 6
分数段[100,110)[110,120 [120,130)
)
人数8 12 6
分数段[130,140)[140,150)
人数 4 2
那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).