随机抽样(精品)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分别有30种、10种、35种、25种不同的品牌.
现采用分层抽样的方法从中抽取一个容量为
n的样本进行三聚氰胺安全检测,若抽取的
婴幼儿奶粉的品牌数是7,则n=20 .
由
7 35
30
10
n
35
25,解得n=20.
• 重点突破:频率分布直方图 • 例为2 了解高一学生的体能情况,某校抽取
部分学生进行一分钟跳绳次数测试,将所得 数据整理后,画出频率分布直方图(如图所 示),图中从左到右各小长方形面积之比为 2∶4∶17∶15∶9∶3,第二小组频数为12.
• (6)理解古典概型及其概率计算公式;会用列 举法计算一些随机事件所含的基本事件数及 事件发生的概率
• (7)了解随机数的意义,能运用模拟方法估计 概率;了解几何概型的意义.
• 概率与统计是高中数学主干知识,考查题 型广泛,形式多样,多为容易题和中档题. 选择题、填空题主要考查互斥事件、古典 概型、几何概型等概率的求解,考查抽样 方法的特点以及有关数据的计算、茎叶图 与频率分布直方图的识图与计算;解答题 中主要以频率分布表及频率分布直方图为 问题情境,考查统计方法简单的应用,突 出考查或然与必然思想、数据处理能力和 应用意识.
• (3)会作两个有关联变量数据的散点图,会 利用散点图认识变量间的相关关系;了解最 小二乘法的思想,能根据给出的线性回归方 程系数公式建立线性回归方程.
• (4)了解独立检验(只要求2×2列联表)、回归 分析的基本思想、方法,并能应用这些方法 解决一些实际问题.
• (5)了解随机事件发生的不确定性和频率的稳 定性,了解概率的意义,了解频率与概率的 区别;了解两个互斥事件的概率加法公式.
• 6.样本方差与标准差:
• 设样本数据x1,x2,…,xn的平均数为,称
•s2
1 n·[( x1
x )2
( x2Βιβλιοθήκη x )2( xn
x和)2 ]
•s ( x1 x)2 ( x2 x)2 ( xn 为x样)2 本方
n
差与标准差.
• 重点突破:随机抽样
• 别分例防层1 疫抽站样对抽学取生.某进学行校身学体生健共康有调16查00,名按,性抽
• (2)系统抽样:当总体中的个体比较多时, 首先把总体分成均衡的几个部分,然后按 照预先定出的规则,从每一部分中抽取一 些个体,得到所需要的样本,这种抽样方 法叫做系统抽样.
• (3)分层抽样:一般地,在抽样时,将总体 分成互不交叉的层,然后按照一定的比例, 从各层独立地取出一定数量的个体,将各 层取出的个体合在一起作为样本,这种抽 样方法叫做分层抽样.
• (1)理解随机抽样的必要性和重要性;会用 简单随机抽样方法从总体中抽取样本;了 解分层抽样和系统抽样方法.
• (2)了解分布的意义和作用,会列频率分布 表,会画频率分布直方图、频率折线图、茎 叶图,理解它们各自的特点;理解样本数据 标准差的意义和作用,会计算数据标准差; 能从样本数据中提取基本的数字特征(如平 均数、标准差),并作出合理的解释;会用 样本的频率分布估计总体分布,会用样本的 基本数字特征估计总体的基本数字特征,理 解用样本估计总体的思想;会用随机抽样的 基本方法和样本估计总体的思想,解决一些 简单的实际问题.
率.
•
(Ⅰ)由于频率分布直方图以面积的大
小反映了数据落在各个小组内的频率大小,
因此第二小组的频率为
4
0.08,
2 4 17 15 9 3
• 又因为第二小组频率=
第二小组频数 样本容量
,
• 所以样本容量=
第二小组频数
12
150.
第二小组频率 0.08
• (Ⅱ)由图可估计该校高一学生的达标率 约为
取一个容量为200的样本.已知样本中女生比男
生少10人,则该校的女生人数应是人
.
•
由抽取的200人中,女生比男76生0 少10
人,可求得女生所抽取的人数.结合分层抽样
法的定义,进而求得该校的女生人数.
•
设抽取男生为x人,抽取女生为y人,
则x+y=200,且x-y=10,故y=95,该校的女
生人数应是为 95 1600 76解0.题的关键
17 15 9 3 100% 88%,
•2故 4第二17小 1组5 的9频 3率是0.08,样本容量是 150,高一学生达标率是88%.
•
解本题的关键是准确掌握“频
率、频数及样本容量(数据个数总和)之
间的关系”.
•
变式练习某2校高三文科分为四个班.高三数
学调研测试后,随机地在各班抽取部分学生进
• 2.样本估计总体 • 通常我们对总体作出的估计一般分成两种:
一种是用样本的频率分布估计总体分布,另
一种是用样本的数字特征(如平均数、标准 差等)估计总体的数字特征. • 3.频率分布直方图 • 在频率分布直方图中,纵轴表示频率/组距, 每个小长方形的面积表示相应各组的频率,
各小长方形的面积的总和等于1.
x
75,
1500 1200 10001500
• 5.对某校400名学生的体重(单位:kg)进行 统计,得到如图所示的频率分布直方图, 则学生体重在60kg以上的人数为100.
体重在60kg以上的频率为 (0.040+ 0.010)×5=0.25,
所以体重在60kg以上的学生人数为0.25 ×400=100,填100.
85)2+(87-855)2]=1.6,选C.
• 易错点:样本方差公式.
• 4.某中学高一、高二、高三三个年级的学生
数分别为1500人,1200人,1000人.现采用
按年级分层抽样的方法抽取部分学生参加社
区活动.已知在高一年级抽取了75人,则这
次活动共抽取了
人.
•
设共1抽85取了x人,则有
•
解得x=185,填185.
变式练习甲3、乙两位学生参加数学竞赛培
训,在活动期间,他们参加的5次测试成绩
记录如下:
行测试成绩统计,各班被抽取的学生人数恰
好成等差数列,人数最少的班被抽取了22人.
抽取出来的所有学生的测试成绩统计结果的
频率分布条形图如图所示,其中120~130
(包括120分但不包括130分)的频率为0.05,
此分数段的人数为5人.
• (Ⅰ)问各班被抽取的学生人数各为多少人? • (Ⅱ)在抽取的所有学生中,任取一名学生,求
• (2)中位数:如果将一组数据按从小到大的顺 序依次排列,当数据有奇数个时,处在最中 间的一个数;当数据有偶数个时,处在最中 间两个数的平均数,是这组数据的中位数.
• (3)众数:出现次数最多的数.若有两个或几个 数据出现得最多,且出现的次数一样,这些 数据都是这组数据的众数;若一组数据中, 每个数据出现的次数一样多,则认为这组数 据没有众数.
• 问:(Ⅰ)第二小组的频率是多少?样本容量是 多少?
• (Ⅱ)若次数在110以上(含110次)为达标,试 估计该校全体高一学生的达标率是多少?
•
小长方形面积比已给,而各小长方
形面积之和为1,故可求得各小长方形的面
积,即频率;由第二小组频数为12,可求得
样本容量.解答本题可先求得第二小组的频率,
然后根据频数求得样本容量,从而求得达标
资额与大多数人的工资额差别较大,这样导
致平均数与中位数偏差较大,所以平均数不 能反映这个公司员工的工资水平.
•
由于平均数受极端值影响较大,故有
时平均数不一定能客观地反映总体情况.本题
易误认为职工工资的平均水平能代表多个员
工工资的基本水平.应深刻理解平均数、众数、
中位数的特点,结合实际情况灵活运用.
•
易错点:频率分布直方图的识图及频 率的计算.
• 1.常用的抽样方法 • (1)简单随机抽样:一般地,设一个总体含有
N个个体,从中逐个不放回地抽取n个个体作 为样本(n≤N),如果每次抽取时总体内的各
个个体被抽到的机会相等,就把这种抽样方 法叫做简单随机抽样.
• 最常用的简单随机抽样方法有两种:抽签法 和随机数表法.
• 4.茎叶图当数据是两位有效数字时,用中 间的数字表示十位数,即第一个有效数字, 两边的数字表示个位数,即第二个有效数 字,它的中间部分像植物的茎,两边部分 像植物茎上长出来的叶子,因此通常把这 样的图叫做茎叶图.
• 5.平均数、中位数和众数 • (1)平均数:一组数据的总和除以数据的
个数所得的商就是平均数.
• 预计2011年高考在本章的选择、填空题考 查重点是古典概型、几何概型等概率的求 解,解答题以实际问题作背景设计试题, 以频率分布表及频率分布直方图为问题情 境,通过识图、读表,对数据进行处理, 同时结合古典概型的概率及样本数据的平 均数与标准差,考查数据处理能力及运用 概率知识解决实际问题的能力.
• 1.有20位同学,编号为1~20号,现在从中 抽取4人的作文卷进行调查,用系统抽样 方法确定所抽的编号为( )
• A.5,10,15,20 B.2 6,A10,14
• C.2,4,6,8 D.5,8,11,14
•
将20分成4个组,每组5个号,间隔
等距离为5,选A.
• 2.甲、乙两位同学参加由学校举办的篮球比 赛,它们都参加了全部的7场比赛,平均得 分均为16分,标准差分别为5.09和3.72,则
200
在于分层抽样法的理解.
•
解分层抽样法问题时,必须保证每
个个体等可能入样,所有层中每个个体被
抽到的可能性相同.切记,每层样本数量与
每层个体数量的比与这层个体数量与总体
容量的比相等.
变式练习1 某大型超市销售的乳类商品 有四种:纯奶、酸奶、婴幼儿奶粉、成人奶
粉,且纯奶、酸奶、婴幼儿奶粉、成人奶粉
写出中位数和众数,然后根据平均数、中位
数、众数的特征解决第(3)问.
•
(Ⅰ)平均数为 x
5500 5000 2 3500 3000 5 2500 3 2000 20 1500 33
6900 2091(元),
• 中位数33是1500元,众数是1500元.
• (Ⅱ)新平均数为 x
个最
高分和一个最低分后,所剩数据的平均数和
方差分别为( C )
A.84,4 84
B.84,1 6
C.85,1 6
D.85,4
•
由茎叶图可知,去掉一个最高分和一
个最低分后,所剩数据为84,84,86,84,87,
• 所以平均数为 84 84 86 84 87 85, • 方差s2= [(184-85)2+(84-85)2+5(86-85)2+(84-
30000 20000 2 3500 3000 5 2500 3 2000 20 1500 33
108500 3288(元),
• 中位数是331500元,众数是1500元.
• (Ⅲ)在这个问题中,中位数或众数均能反映该 公司员工的工资水平.因为公司中少数人的工
分数不小于90分的概率为
0.35+0.25+0.1+0.05=0.75.
重点突破:用样本的数字特征估计总 体的数学特征
例3 某公司的33名职工的月工资(以元 为单位)如下:
董 事 副 董 董事 总 经
管 理 职员
职务 长 事长
理
经理 员
人数 1
1
2
1
5
3 20
工资 5500 5000 3500 3000 2500 2000 1500
• (Ⅰ)求该公司职工月工资的平均数、中位数、
众数;
• (Ⅱ)假设董事长的工资从5500元提升到30000
元,副董事长的工资从5000元提升到20000元,
那么新的平均数、中位数、众数又是什
么?(精确到元)
• (Ⅲ)你认为哪个统计量更能反映这个公司员工
的工资水平?结合此问题谈一谈你的看法.
•
解答本题先用公式求出平均数,再
甲、乙两同学在这次篮球比赛活动中,发挥 得更稳定的是( )
• A.甲 B
B.乙
• C.甲、乙相同
D.不能确定
•
平均数相同,看谁的标准差小,标准
差小的就稳定,选B.
• 3.如图是2010年元旦晚
会举办的挑战主持人 大赛上,七位评委为 某选手打出的分数的
79 84 4 6 4 7
茎叶统计图,去掉一 9 3
分数不小于90分的概率.
(Ⅰ)由频率分布条形图知,抽取的 学生总数为 5 =100人.
0.05
因为各班被抽取的学生人数成等差数列,
设其公差为d, 由22+(22+d)+(22+2d)+(22+3d)=100,得
4×22+6d=100,解得d=2. 所以各班被抽取的学生人数分别是22人,
24人,26人,28人. (Ⅱ)在抽取的学生中,任取一名学生,则