2018年高考数学总复习 统计与统计案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节 统计与统计案例
考纲解读
1. 理解随机抽样的必要性和重要性。
2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。
4. 理解样本数据标准差的意义和作用,会计算数据标准差。
5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。 (1)独立性检验
了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。 (2)回归分析
了解回归分析的基本思想、方法及其简单应用。 命题趋势探究
1. 本节内容是高考必考内容,以选择题、填空题为主。
2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。(1)(2)有结合趋势,考题难度中下。
3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。 知识点精讲 一、抽样方法
三种抽样方式的对比,如表13-7所示。
(1)样本平均值:1
1n
i i x x n ==∑。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:()2
21
1n
i i s x x n ==-∑。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读 (1)频率分布直方图的绘制
①由频率分布表求出每组频数n i ;
②求出每组频率i
i n P N
=
(n 为样本容量); ③列出样本频率分布表; ④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。 公式:aX b ax b +=+,s 2
(aX +b )=a 2s 2
(X )。 四、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。 对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+的求法为
()()()1
122211n n
i i i i i i n n
i i
i i x x y y x y nx y b x x x nx a y bx
====⎧
---⎪
⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 其中,11n i i x x n ==∑,1
1n
i i y y n ==∑,(x ,y )称为样本点的中心。
步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关。
五、独立性
独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。
步骤为列出2⨯2列联表(如表13-8所示),求出()()()()()
22
n ad bc K a b c d a c b d -=++++,并判断:
表
若K 2
1212
若10.828≥K 2
>6.635,有99%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;
若6.635≥K 2
>3.841,有95%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;
若K 2
≤3.841,没有把握称A 与B 相关。 题型归纳及思路提示 题型181 抽样方式 思路提示
根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简
单随机抽样或系统抽样。当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。
例13.16(2012天津理9)
某地区有小学150所,中学75所,大学25所。现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取 所学校,中学中抽取 所学校。
解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取150
3018250
⨯=(所),
从中学中抽取75
309250
⨯=(所)。
变式1 (2012山东理4)
采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C 。则抽到的人中,做问卷B 的人数为( )。
A. 7
B. 9
C. 10
D. 15
变式2 某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为( )。
表13-9
一年级 二年级 三年级
女生 373
x y 男生 377 370
z 变式3 某企业三月中旬生产A ,B ,C 三种产品其3000件,根据分层抽样的结果,企业统计员制作了统计表格,如表13-10所示,由于不小心,表格中的A ,C 产品的有的有关数据被污染看不清楚,统计员记得A 产品样本容量比C 产品的样本容量多10,由此可得C 产品数量为_______。
表13-10
产品类型
A B C 产品数量(件) 1300 产品样本数量(件) 130
题型182 样本分析——用样本估计总体 思路提示
对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。在进行样本分析时,应从统计图表中获取数据。体现在以下
几个方面:(1)在频率分布直方图中,长方形面积=组距⨯频率
组距
=频率,即随机变量的概率;(2)
对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。
例13.17(2013广东理17)
某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。
1792015
3013-16
图
(1)根据茎叶图计算样本均值;