用样本的数字特征估计总体的数字特征(导学案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2.2.2用样本的数字特征估计总体的数字特征
学习目标:
(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。 (2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如
平均数、标准差),并做出合理的解释。
(3)会用样本的基本数字特征估计总体的基本数字特征。 (4)形成对数据处理过程进行初步评价的意识。 学习重点与难点
1.重点:用样本平均数和标准差估计总体的平均数与标准差。 2.难点:能应用相关知识解决简单的实际问题。
一、新课探究
1.众数、中位数、平均数的概念。
①众数: 。 ②中位数: 。(当数据个数为奇数时,中位数是按从小到大的顺序排列中间的那个数.当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的两个数的平均数).
③平均数:n x x x x x n
++++= (321)
求下列各组数据的众数、中位数、平均数
(1)1 ,2,3,3,3,4,6,7,7,8,8,8 (2)1 ,2,3,3,3,4,6,7,8,9,9
2.如何从频率分布直方图中估计众数、中位数、平均数呢?
①众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 ②中位数就是频率分布直方图面积的一半所对应的值 ③平均数则是每组频率的中间值乘频数再相加
3.标准差、方差的概念。
(1)样本方差描述了一组数据围绕平均数波动的大小.一般用2s 表示。 一般地,设样本的数据为123,,,
n x x x x ,样本的平均数为x ,则定义
2s = ,
(2)2
S 算术平方根,,即为样本标准差。
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
二、典型例题
1.如图所示是一样本的频率分布直方图,则由图形中的数
])()()[(1
22221x x x x x x n
s n ++++-=
据,可以估计众数与中位数,平均数分别是多少?
2在某中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是。0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图;
(2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)
3某市统计局就某地居民的月收入调查了10 000人,并根据所得数据画出样本的频率分布直方图如图所示.(每个分组包括左端点,不包括右端点,如第一组表示
[1 000,1 500))
(1)求居民收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位
数;
4:从甲、乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
5某次运动会甲、乙两名射击运动员成绩如下:
甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8;
乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1;
(1)用茎叶图表示甲,乙两个成绩;
(2)分别计算两个样本的平均数和标准差s,并根据计算结果估计哪位运动员的成绩比较稳定.
6某工厂甲、乙两个车间分别制作一种零件,在自动包装传送带上每隔10分钟抽取一件产
品,测其质量,分别记录抽查的数据如下: 甲:102,101,99,98,103,98,99 乙:105,102,97,92,96,101,107. (1)这种抽样方法是什么抽样?
(2)估计甲、乙两个车间产品质量的平均值与方差,并分析哪个车间的产品质量较稳定; 7若一组数据12,,
n x x x 的平均数为4,方差为2,则1262,62,,62n x x x --- 的平均
数为 ,标准差为 .
8.在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A.92 ,2 B.92,2.8 C.93 ,2 D.93 , 2.
9.甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图,则甲班、乙班的最高成绩各是 ,从图中看 班的平均成绩较高。 甲 乙 6 4 8 5 7
9 4 1 6 2 5 9 8 7 5 4 2 1 7 2 5 7 8 9 7 4 4 8 1 4 4 7 9
6
9
2.3 变量间的相关关系
【目标展示】
1、会画散点图,利用散点图判断两变量的线性相关关系;
2、了解最小二乘法的思想;
3、会求回归直线方程。
知识点1、变量之间的相关关系
1、变量与变量之间的关系常见的有两类:一类是确定性关系,如函数关系;另一类是不确定性关系,即当自变量的取值一定,因变量取值带有一定的随机性,这样的两个变量之间的关系称为____________。 知识点
2、散点图
2、将样本中的几个数据点描在平面直角坐标系中所得的图形叫做 ;
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ,点散布在从左上角到右下角的区域内,两个变量相关关系为_ . 知识点3、两个变量的线性相关
3.如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有 关系,这条直线叫做_ ,回归直线对应的方程叫回归直线方程,它的方程简称 。 通过求_____________________________Q =
的最小值,即使得样本数据的点到回归直线的距
离的平方和最小的求回归直线的方法叫做 ,
设回归方程为a x b y +=,则有1122211
()()()________________
n n
i i i i i i n n i i i i x x y y x y nx y b x x x nx a ====⎧
---⎪⎪==⎨--⎪⎪
=⎩∑∑∑∑ ,