统计章节知识点及题型整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计章节知识点及题型整理
知识梳理:
1、简单随机抽样
设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。
(1) 抽签法
制签:先将总体中的所有个体编号(号码可以从1到N ),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;
抽签:抽签时,每次从中抽出1个号签,连续抽取n 次; 成样:对应号签就得到一个容量为n 的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。 (2) 随机数表法
编号:对总体进行编号,保证位数一致;
数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左,向上,向下等等。在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n 的样本。
结论:①用简单随机抽样,从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为 ;在整个抽样过程中各个个体被抽到的概率为 ;
②基于此,简单随机抽样体现了抽样的客观性与公平性;
③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。 2、系统抽样
当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
系统抽样的步骤可概括为:
(1) 将总体中的个体编号。采用随机的方式将总体中的个体编号;
(2) 将整个的编号进行分段。为将整个的编号进行分段,要确定分段的间隔k ,当
n
N
是整数时,n k N =
;当n
N 不是整数时,通过从总体中剔除一些个体使剩下的个体数N '能被n 整除,这时n k N
=';
(3) 确定起始的个体编号。在第1段用简单随机抽样确定起始的个体编号l ;
(4) 抽取样本。按照先确定的规则(常将l 加上间隔k )抽取样本:(),,2,,1l l k l k l n k +++-L 。 3、分层抽样
当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后 进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。 结论: (1) 分层抽样是等概率抽样,它也是公平的。用分层抽样从个体数为N 的总体中抽取一个容量
为n 的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于 ;
(2) 分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因
此利用它获取样本更具有代表性,在实践的应用更为广泛。
4、频率分布表、频率分布直方图、频率折线图和茎叶图
样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率。所有数据(或数据组)的
频率分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:具体作法如下:
(1) (2) (3) (4)
(注:频率分布直方图中小长方形的面积=组距×
频率
组距
=频率) 折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。反映总体频率分布的表格称为频率分布表。 5、平均数、中位数、众数
n 个数据123,,,,n x x x x L 的平均数记为 。
将一组数据按从小到大的顺序依次排列,当数据有奇数个时, ;当数据有偶数个时, 。
出现次数最多的数叫 。由定义知一组数据的众数可能有有一个,也可能有两个或多个。如果一组数据每一个数据出现的次数一样多,则认为这一组数据没有众数。 6、方差、标准差
这组数据的方差记为;
方差的算数平方根称为这组数据的标准差,记为
基础训练
1.对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N 的值为( ) A 、100 B 、120 C 、150 D 、200 2.(2011年高考福建卷,文4)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名。现用分层抽样方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A 、6
B 、8
C 、10
D 、12
3.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 。
4.(2011年高考江苏卷,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的平均值为 ,方差为 。
5.(2010福建)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
例题精讲
题型一:简单随机抽样
例1:今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本。问:(1)总体中的某一个个体a 在第一次抽取时被抽到的概率是多少?(2)个体a 不是在第1次被抽到,而是在第2次被抽到的概率是多少?(3)在整个抽样过程中,个体a 被抽到的概率是多少?
变式训练:今用简单随机抽样从含有4个个体的总体中抽取一个容量为2的样本。问:(1)总体中的某一个个体a在第一次抽取时被抽到的概率是多少?(2)个体a不是在第1次被抽到,而是在第2次被抽到的概率是多少?(3)在整个抽样过程中,个体a被抽到的概率是多少?
题型二:系统抽样、分层抽样
例题2:某校有1200人,为了调查某种情况,打算抽取一个容量为12的样本,问此样本若采用系统抽样的方法如何获得?
变式训练:某校有1200人,其中高一有600人,高二有400人,高三有200人,为了调查某种情况,打算抽取一个容量为12的样本,问此样本若采用分层抽样的方法如何获得?
题型三:频率与频率分布直方图
(1)列出频率分布表;(2)画出频率分布直方图;(3)估计元件寿命在100~400 h以内的在总体中占的比例;(4)估计电子元件寿命在400 h以上的在总体中占的比例.
(1500 h以内的在总体中占的比例;(4)估计电子元件寿命在300 h以上的在总体中占的比例.
题型四:用样本的数字特征估计总体的数字特征
例题4:为了选拔一名同学参加全市中学生射击竞赛,某校对甲、乙两名同学的射击水平进行了测试,两人在相同的条件下各射靶10次,统计结果如下: