高中数学 统计 专题总结及典例练习

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高中数学《统计》学考复习
一、课标要求:
1.理解简单随机抽样的概念,会用简单随机抽样(抽签法、随机数表法)从总体中抽取样本;理解系统抽样,会用系统抽样从总体中抽取样本;理解分层抽样的概念,会用分层抽样从总体中抽取样本。

2.了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布。

3.了解当总体中的个体取不同值较多,甚至无限时,可用频率分布表或频率分布直方图去估计总体分布,并会用这两种方式估计总体分布。

4. 能根据实际问题的需要合理地选取样本,从样本数据中提取最基本的数字特征,并做出合理的解释;会用样本的基本数字特征去估计总体的基本数字特征。

5. 了解相关关系、回归分析、散点图等概念,会求回归直线方程。

二、重点知识:
1.
2
以是各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.3.频率分布将随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的密度曲线.总体密度曲线较为直观地表达了它们之间的关系,基于频率分布与相应的总体分布的关系,由于通常我们不知道一个总体的分布,因此我们往往从总体中抽取一个样本,用样本的频率分布估计相应的总体分布.
4.频率直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图.
5.用数字估计总体特征
●根据样本频率分布直方图,分别估计总体的众数、中位数和平均数
1)众数:最高矩形下端中点的横坐标
2)中位数:直方图面积平分线与横轴交点的横坐标
3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和
●分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示
样本数据的分布情况.
A.用茎叶图表示数据的分布情况是一种好方法,茎叶图具有优点:
(1)保留了原始数据,没有损失样本信息;
(2)数据可以随时记录、添加或修改.
B. 茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.
C.画出一组样本数据的茎叶图的步骤:
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
●样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极
端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况。

.标准差的平方s2称为方差
(1)有时用方差代替标准差测量样本数据的离散度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
(2)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.
6.相关关系
研究两个变量间的相关关系是学习本节的目的。

对于相关关系我们可以从下三个方面加以认识:⑴相关关系与函数关系不同。

函数关系中的两个变量间是一种确定性关系。

例如正方形面积S 与边长x 之间的关系2x S =就是函数关系。

即对于边长x 的每一个确定的值,都有面积S 的惟一确定的值与之对应。

相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。

例如人的身高与年龄;商品的销售额与广告费等等都是相关关系。

⑵函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。

例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系。

然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些。

⑶函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。

例如正方形面积S 与其边长x 间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性。

而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。

相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况。

因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度。

7.回归分析
本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型——一元线性回归分析。

对于线性回归分析,我们要注意以下几个方面:
⑴回归分析是对具有相关关系的两个变量进行统计分析的方法。

两个变量具有相关关系是回归分析的前提。

⑵散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

⑶求回归直线方程a bx y +=^ ( 2121
x n x
y
x n y x b n i i n i i i
--=∑∑==, x b y a -=) 首先应注意到,只有在散点图大至呈线
性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。

8.相关系数(阅读材料)
有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方程。

显然这种情形下求得的回归直线方程没有实际意义。

那么,在什么情况下求得的回归直线方程才能对相应的一组观测数据具有代表意义?课本中不加证明地给出了相关系数的公式。

相关系数公式的作用在于,我们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状粗浅地得出数据之间的线性相关程度。

三、重点方法技巧:
1、某企业共有3200名职工,其中中,青,老年职工的比例为5:3:2,从所有的职工中抽取一个样本容量为400人的样本,应采用哪种抽样更合理?中,青,老年职工各抽取多少人?
解:采取分层抽样,由样本容量400,其比例5:3:2,
所以应抽取中年职工为400×5/10=200人 青年职工为400×3/10=120人 老年职工80人
2、会根据频率直方图估计总体的平均数,中位数,众数:
1)众数:最高矩形下端的中点的横坐标
2)中位数:直方图面积的平分线与轴的交点的横坐标
3)平均数:每个矩形的面积与其底边的矩形中点横坐标的乘积的和
四、典型例题讲解:
例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取
容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.
解:(1)(简单随机抽样)可采用抽签法,将160人从1到160编号,然后从中抽取20个签,与签号相同的20个人被选出.显然每个个体抽到的概率为
2011608
=. (2)(系统抽样法)将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号(18k ≤≤),其余组的8k n +(1,2,3,
19)n =也被抽到,显然每个个体抽到的概率为18.
(3)(分层抽样法)四类人员的人数比为3:4:1:2,又34206,2081010⨯=⨯=
12202,2041010⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18. 例2.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两种日光灯的使用时间如下表
所示,问:哪一种质量相对好一些?
解:甲的平均使用寿命为: x 甲=101214032130321202211012100⨯+⨯+⨯+⨯+⨯ =2121(h ), 甲的平均使用寿命为 :
x 乙=101214022130521201211012100⨯+⨯+⨯+⨯+⨯=2121(h ),
甲的方差为:2甲S =222222121131391910+⨯+⨯+⨯+=129(h 2),
乙的方差为:2乙S =22222211111159219110⨯+⨯+⨯+⨯+⨯=109(h 2), ∵甲x =乙x ,且2甲S >2乙S ,∴乙的质量好一些.
例3.
(1 (2)画出频率分布直方图;
(3)估计元件寿命在100h ~400h 以内的概率;
(4)估计电子元件寿命在400h 以上的概率;
分析 由于样本的取得具有代表性,因此,可以利用样本的期望近似地估计总体的期望。



(2)频率分布直方图如右图:
(3)从频率分布表可知,寿命在100h ~400h 的元件出现的概率为0.65;
(4)由频率分布表可知,寿命在400h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h 以上的概率为0.35。

五、针对性训练题:
1、下列两个变量之间的 关系不是函数关系的是( )
(A )正方体的棱长与体积 (B )角的弧度数与它的正弦值
(C )单产为常数时,土地面积与总产量(D )日照时间与水稻的亩产量
2、欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额现采用如下方法:从某本
50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是( )
()A 简单随机抽样 ()B 系统抽样 ()C 分层抽样 ()D 其它方式的抽样
3、一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为了解职工身体情况,要从中抽取一个
容量为20的样本,如用分层抽样,则管理人员应抽到( )个
()A 3 ()B 12 ()C 5 ()D 10
4、某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )
()A 0.6小时 ()B 0.9小时 ()C 1.0小时 ()D 1.5小时
5、在抽查某产品的尺寸过程中,将其尺寸分成若干组,[,]a b 是其中一组,抽查出
的个体数在该组上的频率为m ,该组上的直方图的高为h ,则||a b -( )
()A hm ()B h m ()C m h
()D 与,m h 无关 6、某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程
x y 82.136.77^-=则以下说法中正确的是( ) A .产量每增加1000件单位成本平均下降1.82元 B .产量每减少1000件单位成本上升1.82元
C .产量每增加1000件单位成本上升1.82元
D .产量每减少1000件单位成本下降1.82元
7、一个样本数据从小到大的顺序排列为13,14,19,x, 23,27,28,31,中位数为22,则x 为( )
(A) 21 (B) 22 (C) 20 (D) 23
8、一组数据x 1 , x 2, x 3 ------ x n 的平均数为10,方差为2,则数据7x 1-2, 7x 2-2, 7x 3-2, -----7x n -2的平均数是________ 方差是________
9.已知样本方差由10
2211(5)10i i s x ==-∑,求得,则1210x x x +++=____________.
10. 已知一个样本1,3,4,a, 7,它的平均数是4,则这个样本的标准差是_________.
11、某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =__________.
12、7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10小
组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .
13、为了比较甲、乙两位划艇运动员的成绩,在相同的条件下对他们进行了6次测验,测得他们的平均速度(/m s )
分别如下:甲:2.7 3.8 3.0 3.7 3.5 3.1
乙:2.9 3.9 3.8 3.4 3.6 2.8
试根据以上数据,判断他们谁更优秀.
0.人数时间(小时) 215 0 1. 1. 2.10 0 5 5 2 8 0
14、某赛季甲乙两名运动员每场比赛得分的原始记录如下:
甲运动员:13,51,23,8,26,38,16,33,14,28,39.
乙运动员:49,24,12,31,50,31,44,36,15,37,25,36,25,36,39.(1)用茎叶图表示两名运动员的得分
(2)根据茎叶图分析哪名运动员的发挥比较稳定?。

相关文档
最新文档