第九章 第一节 随机抽样1
高考数学总复习(一轮)(人教A)教学课件第九章 统计、成对数据的统计分析第1节 随机抽样、统计图表
解析:(2)最先读到的4袋牛奶的编号是614,593,379,242,向右读得
到203,722,104,再下一个数是887,887大于850,故舍去,再下一个
数是088.
考点二
分层随机抽样
角度一
条形图和
直观描述不同类别或分组数据的
直方图
折线图
频数和频率
描述数据随时间的变化趋势
4.频率分布直方图的制作步骤
(1)求极差:极差为一组数据中 最大值
与最小值的差.
(2)决定组距与组数:当样本量不超过100时,常分成 5~12
组,
一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列,即分组、 频数累计、频数、 频率 .
A.0.61
B.0.675
)
C.0.74
D.0.8
√
解析:(2)由分层抽样可得高三(1)班抽取的人数 n1=
×10=6,
+
高三(2)班抽取的人数 n2=
于是总的样本平均数 =
×10=4,
+
×+×.
=1.2,
所以总的样本方差
2
2
2
s = ×[1+(1-1.2) ]+ ×[0.35+(1.5-1.2) ]=0.8.故选 D.
容量为20的一个样本,则每个个体被抽到的概率为(
A.
B.
C取到的概率是
.故选D.
=
9.1.1 简单随机抽样(课件)2022-2023学年高一数学同步备课(人教A版2019 必修第二册
A、从无数个个体中抽取50个个体作为样本; B、某车间工人加工一种零件100个,为了解这100个零件的直 径,从中不放回地依次抽取5个进行测量; C、从100名运动员中挑选10名优秀的运动员参赛; D、一彩民选号,从装有36个大小、形状都相同的号签的盒子 中不放回地逐个抽出7个号签.
注:若生成的随机数有重复,则需剔除重复的编号并重新新产生 随机数,直到产生的不同编号个数等于样本所需要的人数.
随机数法的特点:方便快捷,取到相同编号时要剔除. 随机数法一般适用于总体容量较大,但样本量不大的情形.
1.3简单随机抽样的方法——②随机数法
产生随机数的方法: 1.用随机试验产生随机数: 准备10个大小、质地一样的小球,小球上分别写上数字0,1,2 ,…,9, 把它们放入一个不透明的袋中. 从袋中有放回摸取3次 , 每次摸前充分 搅拌 , 并把第一、二、三次摸到的数字分别作为百、十、个位数,这 样就生成了一个三位随机数 . 若这个三位数在1~712范围内,就代表 对应编号的学生被抽中,否则舍弃编号. 注:这样产生的随机数可能会有重复.
2.总体均值和样本均值
上面我们通过简单随机抽样得到部分学生的平均身高,并把样本 平均身高作为树人中学高一年级所有学生平均身高的估计值.
概念
总体均值(总体平均数)
样本均值(样本平均数)
条件 总体中有N个个体,它们的变量 从总体中抽取一个容量为n的样本,
【问题1】树人中学高一年级有712名学生,通过简单随机抽样的方 法调查高一年级学生的平均身高. 1.编号:先给712名学生编号,例如1~712进行编号; 2.获取样本号码:用随机数工具产生1~712范围内的整数随机数, 把产生的随机数作为抽中的编号,使与编号对应的学生进入样本; 3.按所得号码抽取样本:重复上述过程,直到抽足样本所需要的人数.
9.1.1简单随机抽样高中数学人教版必修2
B. 从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
容量较小,合适用抽签法
C. 从甲乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
甲乙两厂生产的产品有明显区分
D. 从某厂生产的3000件产品中抽取10件进行质量检验
抽取量虽然不大,但总容量太大
题型③ ——随机数法的应用
现有一批节能灯600个,准备从中抽取一个容量为6的样本进行质
取样:把选定的号码对应的n个个体作为样本
3
两种常用的简单随机抽样方法
抽签法和随机数法异同点
相同点:都是简单随机抽样,并且要求被抽
取样本总体的个体数有限
不同点:
①在总体容量较小的情况下,抽签法相对于随机数法来说更简单;
②抽签法适用于总体中的个体数相对较少的情况,而随机数法更
适用于总体中的个体数较多的情况,这样
到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样,如果抽取是
不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,
我们把这样的抽样方法叫做不放回简单抽样.放回简单随机抽样和不放回简单随
机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
与放回简单随机抽样比较,不放回简单随机抽样的效率更高,因此,实践中人
③不做特殊说明时,它是一种不放回抽样;
④它是一种等可能抽样.
简单随机抽样的定义:从N个体中逐个抽取n个作为样本,如果抽取
是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概
率都相等,我们把这样的抽样方法叫做不放回简单抽样.所以题中的
①②③④均正确.
2
简单随机抽样
对简单随机抽样“等可能性”的理解
第9章 统 计
2025版高考数学总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体提能训练
第1讲 随机抽样 用样本估计总体A 组基础巩固一、单选题1.(2024·陕西汉中模拟)某射击运动员连续射击5次,命环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( B )A .7.6B .7.8C .8D .8.2[解析] 由题意可知该组数据为6,7,8,9,9,∴平均数x =6+7+8+9+95=7.8.故选B.2.(2023·陕西西安联考)某社区有1 500名老年居民、2 100名中青年居民和1 800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n 的样本,若中青年居民比老年居民多抽取20人,则n =( C )A .120B .150C .180D .210[解析] 由题可知⎝ ⎛⎭⎪⎫2 1001 500+2 100+1 800- 1 5001 500+2 100+1 800×n =20,解得n =180.故选C.3.(2023·湖南部分学校联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 32 21 12 34 29 78 64 56 07 82 82 42 07 44 38 15 51 00 13 42 99 66 02 79 54 若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( D )A .07B .12C .39D .44 [解析] 依次抽取的样本编号为12,06,01,16,19,10,12,07,44,39,38.剔除重复号码12,故选D.4.(2024·江苏南京六校联合调研)已知样本数据3x 1+1,3x 2+1,3x 3+1,3x 4+1,3x 5+1,3x 6+1的平均数为16,方差为9,则另一组数据x 1,x 2,x 3,x 4,x 5,x 6,12的方差为( C )A.467B .477C .487D .7[解析] 设数据x 1,x 2,x 3,x 4,x 5,x 6的平均数为x ,方差为s 2,由3x +1=16,9s2=9,得x =16∑i =16x i =5,s 2=16∑i =16 (x i -5)2=1,则x 1,x 2,x 3,x 4,x 5,x 6,12的平均数为5×6+127=6,方差为∑i =16x i -62+12-627=∑i =16x i -5-12+367=∑i =16x i -52-2∑i =16x i -5+1×6+367=∑i =16x i -52-2∑i =16x i +1027=6s 2-2×6x +1027=487.故选C.5.(2022·全国高考甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则( B )A .讲座前问卷答题的正确率的中位数小于70%B .讲座后问卷答题的正确率的平均数大于85%C .讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D .讲座后问卷答题的正确率的极差大于讲座前正确率的极差[解析] 讲座前中位数为70%+75%2>70%,所以A 错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B 对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C 错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D 错.故选B.6.(2024·四川南充高级中学月考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( D )A.100,10 B.100,20C.200,10 D.200,20[解析]依题意可得样本容量为(3 500+2 000+4 500)×2%=200,其中高中生抽取2 000×2%=40人,因为样本中高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20人;故选D.7.(2024·江苏基地校大联考改编)如图为甲、乙两人在同一星期内每日步数的折线统计图,则下列结论错误的是( C )A.这一星期内甲的日步数的中位数为11 600B.这一星期内甲的日步数的极差大于乙的日步数的极差C.这一星期内乙的日步数的方差大于甲的日步数的方差D.这一星期内乙的日步数的下四分位数是7 030[解析]甲的步数从小到大排列为:2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600.故A正确;这一星期内甲的日步数的极差16 800-2 435=14 365,这一星期内乙的日步数的极差14 200-5 340=8 860,这一星期内甲的日步数的极差大于乙的日步数的极差,故B正确;由图知甲的波动程度大,故方差大故C错误;乙的步数从小到大排列为:5 340,7 030,10 060,11 600,12 300,12 970,14 200,7×25%=1.75,故这一星期内乙的日步数为25%分位数是7 030,故D正确.故选C.8.(2023·江西赣州模拟)某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则下列结论错误的是( D )A .频率分布直方图中a 的值为0.07B .这100名学生中体重低于60 kg 的人数为70C .据此可以估计该校学生体重的第78百分位数约为62D .据此可以估计该校学生体重的平均数约为56.25[解析] 因为5×(0.01+0.02+0.04+0.06+a )=1,解得a =0.07,所以A 正确;体重低于60 kg 的频率为5×(0.01+0.06+0.07)=0.7,所以人数为0.7×100=70,所以B 正确;因为5×(0.01+0.06+0.07)=0.7,5×(0.01+0.06+0.07+0.04)=0.9,所以体重的第78百分位数位于[60,65)之间,设体重的第78百分位数为x ,则(0.01+0.07+0.06)×5+(x -60)×0.04=0.78,解得x =62,所以C 正确;体重的平均数约为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,所以D 错误.故选D.二、多选题9.(2024·安徽安庆、池州、铜陵部分学校联考)甲乙两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙9578768677则A .甲乙两人射击成绩的平均数相同 B .甲乙两人射击成绩的中位数相同 C .甲命中环数的极差大于乙命中环数的极差 D .甲比乙射击成绩更稳定[解析] 可求甲乙平均数为x 1=x 2=7,中位数均为7,故A ,B 正确;甲的极差为6,乙的极差为4,故C 正确;甲的方差为:17×(1+4+4+9+4+9+9)=407,乙的方差为:17×(4+4+1+1+1+1)=127,故D 错误.10.(2024·湖北宜荆荆恩联考、广东深圳宝安区调研)下列说法正确的有( AC )A .从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是0.25B .已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5C .数据26,11,14,31,15,17,19,23的50%分位数是18D .若样本数据x 1,x 2,…,x n 的标准差为4,则数据2x 1+1,2x 2+1,…,2x n +1的标准差为16[解析] 从40个个体中随机抽取一个容量为10的样本,则每个个体被抽到的概率都是1040=0.25,故A 正确;已知一组数据1,2,m,6,7的平均数为4,则m =4×5-(1+2+6+7)=4,这组数据的方差为15×[(1-4)2+(2-4)2+(4-4)2+(6-4)2+(7-4)2]=265,故B 错误;这组数据从小到大排列为:11,14,15,17,19,23,26,31,共8个,故其50%分位数为第4个数17和第5个数19的平均数,为18,故C 正确;若样本数据x 1,x 2,…,x n 的标准差为4,则方差为16,故数据2x 1+1,2x 2+1,…,2x n +1的方差为16×22=64,标准差为8,故D 错误.故选AC.11.(2024·江西南昌摸底)“未来之星”少儿才艺大赛,选手通过自我介绍和才艺表演,展示仪表形象、表达能力、风度气质等自身的整体形象,评委现场打分.若九位评委对某选手打分分别是x 1,x 2,…,x 9,记这组数据的平均分、中位数、标准差、极差分别为x ,z ,s ,j ,去掉这组数据的一个最高分和一个最低分后,其平均分、中位数、标准差、极差分别为x ′,z ′,s ′,j ′,则下列判断中一定正确的是( BCD )A.x =x ′ B .z =z ′ C .s ≥s ′D .j ≥j ′[解析] 根据平均数的性质可知x =x ′不一定成立,例如九个数一个90,其他都是80,显然该等式不成立,因此A 不正确;根据中位数的定义可知这九个数据从小到大排列,中间的一个数据是中位数,去掉最高和最低不影响中间的数据,所以B 正确;根据标准差的意义可知去掉最高和最低分,数据有可能会更集中,所以选项C 正确;因为去掉最高和最低分,极差有可能减小,所以选项D 正确,故选BCD.12.(2024·江西新余一中开学考)下列命题是真命题的有( BD )A .分层抽样调查后的样本中甲、乙、丙三种个体的比例为3∶1∶2,如果抽取的甲个体数为9,则样本容量为30B .某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间[114.5,124.5]内的频率为0.4C .甲、乙两队队员体重的平均数分别为60,68,人数之比为1∶3,则甲、乙两队全部队员体重的平均数为67D .一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5[解析] 根据样本的抽样比等于各层的抽样比,样本容量为9÷33+1+2=18,故选项A 错误;样本数据落在区间[114.5,124.5]内的有120,122,116,120共4个,所以样本数据落在区间[114.5,124.5]内的频率为410=0.4,故选项B 正确;甲、乙两队的人数之比为1∶3,则甲队队员在所有队员中所占权重为11+3=14,乙队队员在所有队员中所占权重为31+3=34,则甲、乙两队全部队员体重的平均数为x =14×60+34×68=66,故选项C 错误;将该组数据从小到大排列为:1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数是第9个数,该数为5,故选项D 正确.13.(2024·陕西西安、河北保定部分学校联考)某公司统计了2023年1月至6月的月销售额(单位:万元),并与2022年比较,得到同比增长率数据,绘制了如图所示的统计图,则下列说法正确的是( ACD )注:同比增长率=(今年月销售额-去年同期月销售额)÷去年同期月销售额×100%. A .2023年1月至6月的月销售额的极差为8B .2023年1月至6月的月销售额的第60百分位数为8C .2023年1月至6月的月销售额的中位数为9.5D .2022年5月的月销售额为10万元[解析] 2023年1月至6月的月销售额的极差为8,故A 正确;因为6×60%=3.6,所以2023年1月至6月的月销售额的第60百分位数为11,故B 错误;2023年1月至6月的月销售额的中位数为9.5,故C 正确;设2022年5月的月销售额为x 万元,则11-xx×100%=10%,解得x =10,故D 正确.故选ACD.三、填空题14.(2023·辽宁沈阳东北育才学校模拟)已知一组样本数据x 1,x 2,x 3…x 10,且x 21+x 22+x 23+…+x 210=185,平均数x =4,则该组数据的方差s 2= 2.5 .[解析] 由题意知x 1+x 2+x 3…+x 10=4×10=40,又s 2=x 1-42+x 2-42+x 3-42+…+x 10-4210=x 21+x 22+x 23+…+x 210-8x 1+x 2+x 3…+x 10+16×1010=185-8×40+16×1010=18.5-32+16=2.5.15.(2024·浙江名校联盟高考研究卷改编)从树人小学二年级学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图如图,则下列结论正确的是 ①② (填上所有正确结论的序号)①a =0.030②估计树人小学这100名二年级学生的平均身高为124.5 cm ③估计树人小学这100名二年级学生身高的中位数为122.5 cm ④估计树人小学这100名二年级学生身高的众数为120 cm[解析] a =0.1-(0.005+0.01+0.02+0.035)=0.03.①正确.平均身高:105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm),②正确.由(x -120)×0.03=0.1得x ≈123.3(cm),③错.身高的众数为115 cm.④错.故填①②.B 组能力提升1.(2024·山西大同质检)一组数据按从小到大的顺序排列为1,3,5,6,m,10,12,13,若该组数据的中位数是极差的58,则该组数据的第60百分位数是( C )A .7.5B .8C .9D .9.5[解析] 由题意得6+m 2=58×(13-1),∴m =9.故选C.2.(多选题)(2024·安徽皖东智校协作联盟联考)某学校共有学生2 000人,其中高一800人,高二高三各600人,学校为了了解学生在寒假期间每天的读书时间,按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生,高二学生,高三学生每天读书时间的平均数分别为x 1=2.7,x 2=3.1,x 3=3.3,每天读书时间的方差分别为s 21=1,s 22=2,s 23=3,则下列正确的是( ACD )A.从高二年级抽取30人B.被抽取的学生中,高二年级每天的总读书时间比高一年级多15小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计全体学生每天的读书时间的方差为s2=1.966[解析]根据分层抽样,分别从高一学生,高二学生,高三学生中抽取40人,30人,30人,故A正确;抽取的高二年级每天的总读书时间为x2×30=93,抽取的高一年级每天的总读书时间为x1×40=108,高二年级每天的总读书时间比高一年级少15小时,故B错误;被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(小时),故C正确;被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(3.3-3)2]=1.966,∴估计全体学生每天的读书时间的方差为s2=1.966,故D正确.故选ACD.3.(多选题)(2023高考新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( BD )A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差[解析]x2,x3,x4,x5的平均数不一定等于x1,x2,…,x6的平均数,A错误;x2,x3,x4,x5的中位数等于x3+x42,x1,x2,…,x6的中位数等于x3+x42,B正确;设样本数据x1,x2,…,x6为0,1,2,8,9,10,可知x1,x2,…,x6的平均数是5,x2,x3,x4,x5的平均数是5,x1,x2,…,x6的方差s21=16×[(0-5)2+(1-5)2+(2-5)2+(8-5)2+(9-5)2+(10-5)2]=503,x2,x3,x4,x5的方差s22=14×[(1-5)2+(2-5)2+(8-5)2+(9-5)2]=252,s21>s22,∴s1>s2,C错误;x6>x5,x2>x1,∴x6-x1>x5-x2,D正确.故选BD.4.(2023·陕西渭南模拟)2022年2月28日,国家统计局发布了我国2021年国民经济和社会发展统计公报,在以习近平同志为核心的党中央坚强领导下,实现了“十四五”良好开局.2021年,全国居民人均可支配收入和消费支出均较上一年有所增长,结合如下统计图表,下列说法中正确的是( B )A .2017~2021年全国居民人均可支配收入逐年递减B .2021年全国居民人均消费支出24 100元C .2020年全国居民人均可支配收入较前一年下降D .2021年全国居民人均消费支出构成中食品烟酒和居住占比超过60%[解析] 根据条形图可知,2017~2021年全国居民人均可支配收入逐年递增,A 错误.根据扇形图可知,2021年全国居民人均消费支出为:5 641+1 419+7 178+569+2 115+2 599+3 156+1 423=24 100元,B 正确.根据条形图可知,2020年全国居民人均可支配收入较前一年上升,C 错误.2021年全国居民人均消费支出构成中食品烟酒和居住占比:7 178+5 64124 100×100%≈53.2%<60%,D 错误.故选B.5.(2023·全国乙卷)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2,…,10).试验结果如下: 试验序号i 1 2 3 4 5 6 7 8 9 10 伸缩率x i 545 533 551 522 575 544 541 568 596 548 伸缩率y i536527543530560533522550576536记z i =x i -y i (i =1,2,…,10),记z 1,z 2,…,z 10的样本平均数为z ,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) [解析](1)x=545+533+551+522+575+544+541+568+596+54810=552.3,y=536+527+543+530+560+533+522+550+576+53610=541.3,z=x-y=552.3-541.3=11,z i=x i-y i的值分别为:9,6,8,-8,15,11,19,18,20,12,∴s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知:z=11,2s210=2 6.1=24.4,故有z≥2s210,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.。
9.1.1简单随机抽样第1课时课件(人教版)
学习目标
新课讲授
课堂总结
1.正确理解总体、个体、样本、普查、抽样调查的概念
2.理解简单随机抽样的概念,掌握抽签法和随机数法的 一般步骤
学习目标
新课讲授
课堂总结
知识点1:统计的相关概念及抽样的必要性
在现实生活中,我们经常会接触到各种统计数据.
统计学是通过收集数据和分析数据来认识未知现象的一门科学. 为解决问题奠定基础
说明:如果生成的随机数有重复,即同一编号多次被抽到,可以剔除重 复的编号并重新产生随机数,直到产生不同的编号个数等于样本数.
学习目标
新课讲授
课堂总结
随机数的产生
1.用随机实验生成随机数
准备10个大小质地一样的小球,小球上分别写上数字0,1,2,…9,放 在不透明的盒子中, 当编号是三位的时候,有放回抽取3次,抽前充分搅拌,第一、二、三 次号作摸到数字分别作为百、十、个位数.
如果抽取是放回的,叫做放回简单随机抽样; 如果抽取是不放回的,称为不放回简单随机抽样. 效率更高
通过简单随机抽样获得的样本称为简单随机样本. 如没特殊说明,本章所称简单随机抽样指不放回简单随机抽样.
学习目标
新课讲授
课堂总结
例1 下面的抽样方法是简单随机抽样吗?为什么? (1)从无数个个体中抽取20个个体作为样本;× 总体的个数不是有限的 (2)从50台冰箱中一次性抽取5台冰箱进行质量检查;× 不是逐个抽取 (3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮 球赛; × 不是等可能抽样 (4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无 放回地抽出6个号签. √
问题:一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高 一年级学生的平均身高,以便设定可调节课桌椅的标准高度.已知树人中学高一 年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均 身高,应该怎样抽取样本?
《统计学》第9章 抽样与抽样分布
二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi
−
x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1
9.1.1简单随机抽样方法
本章知识结构框图如下: 实际问题
总体 普 查
总体数据
简单随机抽样、分层随机抽样
总体数据的特征 总体的取值规律
总体的百分位数
估计 估计
样本数据的特征 样本的取值规律
样本的百分位数
样本
总体的平均数、中位数 估计 样本的平均数、中位数
众数 总体的标准差、方差 估计 样本的标准差、方差
极差
极差
决策与建议
样本观测数据
二、本章学习任务与指导 三个任务的完成,就生成了一个统计问题完整解决的基本思路:首先要根据实际需求, 用适当的方法获取样本数据,选择适当的统计图表对样本数据进行整理和描述,在此 基础上用各种统计方法对样本数据进行分析,从样本数据中提取需要的信息,推断总 体的情况,进而解决相应的实际问题,获得结论,为人们制定决策提出建议
总体 ____调__查__对__象___的全体叫作总体
个体 组成总体的每一个_调__查__对__象__成为个体
抽样调查 根据一定目的,从总体中抽取_一__部__分___个__体__进行调查,并以此为依据对 总体的情况作出估计和推断的调查方法,成为抽样调查
样本 从总体中抽取的那部分___个__体___成为样本
二、本章学习任务与指导 从本章知识结构图中可以看出,本章有三大学习任务:面对实际问题的解决,为人们 的决策提供什么样的建议,始终是我们学习本章的第一任务,也是我们学好本章的目标 驱动任务,也就是教材9.3节内容 那么,要完成这一任务,需要我们用样本的数据特征及其分布的规律性来估计、推断 出总体的数据特征及其分布的规律,例如,总体的取值规律、百分数、集中趋势、离 散程度等等,这是学习本章的第二任务也就是教材9.2节内容 要完成第二大任务,即“用样本估计总体”,就需要我们抽取“好”的或“高质量”的 样本,这就存在一个如何抽取样本的问题,即抽样方法问题,这是学习本章的第三任务。 也就是教材9.1节内容
9.1.1 简单随机抽样课件ppt
知识点拨
知识点一、全面调查、抽样调查及抽样方法
1.全面调查和抽样调查
调查方式 全面调查
对每一个调查对象都进行调
定义
查的方法,称为全面调查,又称
普查
抽样调查
根据一定目的,从总体中抽取一
部分个体进行调查,并以此为依
据对总体的情况作出估计和推
断的调查方法,称为抽样调查
调查方式 全面调查
2023
人教版普通高中教科书·数学
第九章
9.1.1 简单随机抽样
必修
第二册
内
容
索
引
01
课前篇 自主预习
02
课堂篇 探究学习
课标阐释
1.了解全面调查与抽样调查的异同.(数
学抽象)
2.理解抽样调查的目的和基本要求.(数
学抽象)
3.掌握简单随机抽样中的抽签法、随
机数法的一般步骤.(逻辑推理)
4.了解总体均值、样本均值的定义和
提示为了使每个号签被抽取的可能性相等,保证抽样的公平性.
微练习
判断下列说法是否正确,正确的在后面的括号内画“√”,错误的画“×”.
(1)抽签法和随机数法都是不放回抽样.( √ )
(2)抽签法抽签时,先抽签的人占便宜.( × )
(3)生成随机数的方式多种多样,可以用随机试验生成随机数,也可用计算
器、数学软件、统计软件生成随机数.( √ )
解 第一步,将36个居民小区进行编号,分别为01,02,03,…,36.
第二步,将36个号码分别写在相同的纸片上,揉成团,子里,充分搅匀,依次抽取7个号签,并记
录上面的号码.
第四步,与这7个号码对应的居民小区就是要抽取的样本.
角度2 随机数法的应用
随机抽样_1-课件
0
=
2 2
0 0
0 0
0 4
•
2
1 00
0
=
2
1 00
4
8.(2004年福建省高考卷)一个总体中有100个 个体,随机编号为0,1,2,…,99,依编号顺序平均 分成10个小组,组号分别为1,2,3,…,10.现用系 统抽样方法抽取一个容量为10的样本,规定如 果在第1组随机抽取的号码为m,那么在第k组抽 取的号码个位数字与mm×+kk的个位数字相同.若
•
10、阅读一切好书如同和过去最杰出 的人谈 话。2021/3/62021/3/62021/3/63/6/2021 9:53:14 AM
•
11、越是没有本领的就越加自命不凡 。2021/3/62021/3/62021/3/6M ar-216- Mar-21
•
12、越是无能的人,越喜欢挑剔别人 的错儿 。2021/3/62021/3/62021/3/6Saturday, March 06, 2021
A.99 B、99.5 C.100 D、100.5
6.从编号为1~50的50枚最新研制的某种型号的 导弹中随机抽取5枚来进行发射实验,若采用每 部分选取的号码间隔一样的系统抽样方法,则 所选取5枚导弹的编号可能是(B ) A.5,10,15,20,25 B.3,13,23,33,43 C.1, 2, 3, 4, 5 D.2, 4, 6, 16 32
将总体均分成 几部分,按事先
在起始部分抽 样时采用简单
确定的规则在 随机抽样
各部分抽取
适用范围 总体中的个
体数较少
总体中的个 体数较多
分层 抽样
将总体分成 几层,分层进 行抽取
各层抽样时采 用简单随机抽 样或系统抽样
9.1随机抽样课件(人教版)
关于“抽样方法”
抽
随机抽样
样
方
法
分层抽样
定义 特征 方法 注意
关于“随机抽样”
定义 设···.如果···,且···,就称···.
随
特征 有限性、逐个性、不回性、等率性
机
抽
抽签法—编号、标签、搅拌、抽取
样
方法 随机数表法—编号、选数、取号、抽取
随机抽样时,“每次抽取一个个体
注意
时,任一个体被抽取的概率相等” 和“在整个抽样过程中个体被抽取
的概率”不是一回事.适用总体中个
体数较少的抽样.
例题
某班有60名学生,要从中随机抽取10人参 加某项活动,如何采用简单随机抽样的方法抽 取样本?写出抽样过程.
简单随机抽样一般采用两种方法:抽签法 和随机数表法.
解法1:(抽签法)将60名学生编号为01, 02,…,60,并做好大小、形状相同的号签,分别 写上这60个数,将这些号签放在一起,进行均匀搅 拌,接着连续不放回地抽取10个号签,这10个号签 对应的人为所选.
某大学共有全日制学生15000人,其中专 科生3788人、本科生9874人、研究生1338 人,现为了调查学生上网查找资料的情况, 欲从中抽取225人,为了使样本具有代表性, 问如何抽样才合适?57、148、20
我们把这批灯泡中每个灯泡的使用期限的全体看 成是总体。
其中每一个灯泡的使用期限就是个体;
被抽取进行检查的80个灯泡的每个灯泡的使用 期限的集体,就叫做总体的一个样本。
注意:总体中或样本中的个体是我们“需要 考虑的对象”,而不是需要考虑的对象的载体 本身.例如,某市决定对本市居民的年龄散布情 况进行调查,准备按适当的方式抽取一个容量 为5000的样本.该问题中,需要考虑的对象显然 是居民的年龄,而非居民,那么总体中的每一 个个体就是指一个居民的“年龄”而非一个 “居民”,总体就是“由该市所有居民的年龄 构成的集合”而不是“所有居民的集合”,抽 取的样本就是“5000个居民的年龄”而非 “5000个居民”.
【高中数学】简单随机抽样(第1课时)(课件) 高一数学同步备课系列(人教A版2019必修第二册)
问题2 放回简单随机抽样和不放回简单随机抽样哪个效率高? 不放回简单随机抽样的效率更高. 因此实践中人们更多采用不放回简单随机抽样. 除非特殊说明,本章所
称的简单随机抽样指不放回简单随机抽样. 问题3 简单随机抽样有哪些特点?
1. 总体的个体数有限,样本数n小于等于样本总体的个数N ;
2. 样本的抽取是逐个进行的,每次只抽取一个个体;
问题1 放回摸球有什么不足吗?你还有其他的方法吗? 在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是每次
摸到同一个小球,而被重复的小球只能提供同一个小球颜色信息. 这样的 抽样结果误差较大.
我们可以采用不放回摸球,即从袋中随机摸出一个球后不再放回袋中 ,每次摸球都在余下的球中随机摸取,这样就可以避免同一个小球被重 复摸中.
由于不同调查对象的指标值往往不同,它是一个变化的量,所以常把指
标称为变量.像人口普查,这样对每一个调查对象都进行调查的方法称为全面 调查,又称普查.在一个调查中,我们把调查对象的全体称为总体,组成总体 的每一个调查对象称为个体,为了强调调查目的,也可以把调查对象的某些 指标的全体作为总体,每一个调查对象的相应指标作为个体.
(2) 总体是这个地区全体居民结核病的发病情况;个体是这个地区每一位居民结核 病的发病情况;适合用抽样调查.
(3) 总体是这批所有炮弹的杀伤半径;个体是这批炮弹中每一发炮弹的杀伤半径; 适合用抽样调查.
(4) 总体是这个水库里的所有鱼;个体是这个水库里的每一条鱼;适合用抽样调查.
2. 如图,由均匀材质制成的一个正20面体(每个面都是正三角形),将20个 面平分成10组,第1组标上0,第2组标上1,‧‧‧,第10组标上9. (1) 投掷正20面体,若把朝上一面的数字作为投掷结果,则出现0, 1, 2, ‧‧‧ , 9是等可能的吗? (2) 三个正20面体分别涂上红、黄、蓝三种颜色,分别代表百位、十位、 个位,同时投掷可以产生一个三位数(百位为0的也看作三位数),它是 000~999范围内的随机数吗?
新人教A版高中数学必修2第九章统计的第一节第一课时—简单随机抽样-经典教学设计
(3)通过调查历城二中高一学生的平均身高来估计济南市高一学生的平均身高,请你写出此次调查的总体,个体样本和样本容量。
通过熟悉的生活情境引入普查、抽样调查的适用范围,回顾总体、样本、个体、样本容量的概念。
通过提问,从学生熟悉的具体问题入手,迅速吸引学生的注意力,体会到了抽样调查的必要性。
2.简单随机抽样的特点:
总体有限,逐个抽取,等概率抽样。
3.简单随机抽样的方法:
抽签法和随机数法
学生回顾本节课所学知识点。
小结本节课知识点,加深对知识点的记忆理解。总结提炼,理清脉络,有利于帮助学生建构知识体系,起到画龙点睛的作用。
6.课后作业
1.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道.选用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
此处设计遵循由特殊到一般的认知规律,让学生在观察中归纳,在具体问题中进行总结,自然而然地形成简单随机抽样的概念,培养数学抽象的学科核心素养,最终实现突破难点的目的。
2.实践探究,形成概念
请小组在全班范围内交流,教师在学生回答基础上完善补充,得到下列结论:
(1)一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(1≤n<N)个个体作为样本,每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样。如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单抽样。
必修2数学第九章统计知识点
必修2数学第九章统计知识点一、随机抽样。
1. 简单随机抽样。
- 定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
- 常用方法:抽签法和随机数法。
- 抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
- 随机数法:利用随机数表、随机数生成器或统计软件来产生随机数,根据随机数抽取样本。
2. 系统抽样。
- 定义:将总体分成均衡的若干部分,然后按照预先规定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样。
- 步骤:- 先将总体的N个个体编号。
- 确定分段间隔k,对编号进行分段,当(N)/(n)(n是样本容量)是整数时,取k = (N)/(n);当(N)/(n)不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数N'能被n整除,这时k=(N')/(n)。
- 在第1段用简单随机抽样确定第一个个体编号l(l≤ k)。
- 按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l + k),再加k得到第3个个体编号(l+2k),依次类推,直到获取整个样本。
3. 分层抽样。
- 定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样。
- 步骤:- 根据已有的信息,将总体分成互不相交的层。
- 计算各层中个体的个数与总体个数的比。
- 按各层个体数占总体数的比确定各层应抽取的样本容量。
- 在每一层中进行简单随机抽样或系统抽样,获取相应的样本个体,合在一起得到分层抽样的样本。
- 特点:使样本具有较强的代表性,而且在各层抽样时,可灵活选用不同的抽样方法。
二、用样本估计总体。
1 9.1 随机抽样ppt课件
PPT图表:./tubiao/
PPT下载:./xiazai/
PPT教程: ./powerpoint/
机抽样. 资料下载:./ziliao/
个人简历:./j ia nli/
试卷下载:./shiti/
教案下载:./j ia oa n/
手抄报:./shouchaobao/
P P T课件:./ke j ia n/
科学课件:./kejian/kexue/ 物理课件:./kejian/wuli/
化学课件:./kejian/huaxue/ 生物课件:./kejian/shengwu/
地理课件:./ke j ia n/dili/
历史课件:./ke j ia n/lishi/
P173-P187
的内容,思考以下问题:
1.全面调查、抽样调查、总体、个体、样本、样本量、样本数据
法叫做放回简单随机抽样.
栏目 导引
第九章 统 计
(2)不放回简单随机抽样
如果抽取是不__放__回__的__,且每次抽取时总体内未进入样本的各个个体 被抽到的概率_都__相__等___,我们把这样的抽样方法叫做不放回简单随
P P T模板:./m oba n/
PPT素材:./sucai/
P P T背景:./be ij ing/
9.1 随机抽样
PPT教学课件
第九章 统 计
考点
学习目标
核心素养
抽样调查
理解全面调查、抽样调查、总体、个 数学抽象
体、样本、样本量、样本数据等概念
理解简单随机抽样的概念,掌握简单 数学抽象、
简单随机抽样 随机抽 逻辑推理
样的两种方法:抽签法和随机数法
理解分层随机抽样的概念,并会解决 数学抽象、
高考数学人教版(理科)一轮复习课件:第9章第1讲随机抽样课后作业2
2.(2018·河北衡水模拟)在高三某次数学测试中,40 名学生的成绩如图 所示.若将成绩由低到高编为 1~40 号,再用系统抽样的方法从中抽取 8 人, 则其中成绩在区间[123,134]上的学生人数为________.
答案 3
答案
解析 根据题中茎叶图,成绩在区间[123,134]上的数据有 15 个, 所以用系统抽样的方法从所有的 40 人中抽取 8 人, 成绩在区间[123,134]上的学生人数为 8×4105=3.
解析
8.某商场有四类食品,食品类别和种数见下表:
植物油 动物性食品
类别 粮食类
类
类
果蔬类
种类 40
10
30
20
现从中抽取一个容量为 20 的样本进行食品安全检测,若采用分层抽样
方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为________.
答案 6
答案
解析 因为总体的个数为 40+10+30+20=100,所以根据分层抽样的 定义可知,抽取的植物油类食品种数为11000×20=2,抽取的果蔬类食品种数 为12000×20=4,所以抽取的植物油类与果蔬类食品种数之和为 2+4=6.
∴从初中生中抽取的男生人数是:50×15200000=12.
解析
6.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为 3∶5∶7, 现用分层抽样的方法抽取容量为 n 的样本,其中甲种产品有 18 件,则样本 容量 n=________.
答案 90
答案
解析 依题意得3+35+7×n=18,解得 n=90,即样本容量为 90.
A.样本容量为 70 B.样本中三居室住户共抽取了 25 户 C.根据样本可估计对四居室满意的住 户有 70 户 D.样本中对三居室满意的有 15 户数量及样本容量,再根据分层抽样及题 图 2 确定样本中三居室户数及满意人数.
人教版数学必修第二册9.1.1简单随机抽样课件
• 放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.
(2)简单随机抽样的特点
①总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便
于通过样本对总体进行分析.
②逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与样本量也无关
√
2.下列调查:
①每隔5年进行人口普查; 普查
②报社等进行舆论调查;抽样调查
③灯泡使用寿命的调查;抽样调查
④对入学报名者的学历检查;普查
无法相互区分.
题型二 抽签法和随机数法
[例2 (2)某家具厂要为育才小学一年级新生制作新课桌椅,他们要事先了解全
体一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知育才小
学一年级有165名学生,如果通过简单随机抽样的方法调查一年级学生的平
均身高,需抽取16人,需怎样抽取?
①先给165名学生编号,如编号为1~165;
⑤从20台电视机中抽出3台进行质量检查. 抽样调查
其中属于抽样调查的是( B )
A.①②③
B.②③⑤
C.②③④
D.①③⑤
3.一个总体中含有100个个体,以简单随机抽样方法从该总体
中抽取一个容量为5的简单随机样本,则指定的某个个体被抽到
1
的可能性为________.
20
简单随机抽样
每个个体被抽到的概率都相等
个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签
(新教材)2020-2021学年高中人教A版数学必修第二册课件:9.1.1 简单随机抽样
(2)简单随机抽样的定义 一般地,设一个总体含有N(N为正整数)个个体,从中_逐__个__抽__取__n(1≤n<N)个个体 作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的_概__率__都__ _相__等__,我们把这样的抽样方法叫做_放__回__简__单__随__机__抽__样__;如果抽取是不放回的,且 每次抽取时总体内未进入样本的各个个体被抽到的_概__率__都__相__等__,我们把这样的 抽样方法叫做_不__放__回__简__单__随__机__抽__样__.放回简单随机抽样和不放回简单随机抽样 统称为简单随机抽样.
【类题通法】 简单随机抽样必须具备下列特点 (1)被抽取样本的总体中的个体数N是有限的. (2)抽取的样本是从总体中逐个抽取的. (3)简单随机抽样是一种等可能的抽样. 如果三个特征有一个不满足,就不是简单随机抽样.
【定向训练】
下列几个抽样中,简单随机抽样的个数是 ( )
①从无数个个体中抽取50个个体作为样本;
(3)抽样的必要性 第一,要考查的总体中个体数往往_很__多__,而且在时刻变化,逐一调查不可能.第二, 考查往往具有_破__坏__性__,所以逐一调查也不可取.这就需要抽查一部分,以此来估 计_总__体__. (4)简单随机抽样的两种常用方法:_抽__签__法__和_随__机__数__法__.
核心互动探究
【概念生成】 简单随机抽样 (1)抽样涉及的基本概念(以某地区高一学生身高为例) 为了了解某地区高一学生身高的情况,我们找到了该地区高一8 000名学生的体 检表,从中随机抽取了150张,表中有体重、身高、血压、肺活量等15类数据,那 么总体是指_该__地__区__高__一__8__0_0_0_名__学__生__的__身__高__数__据__,个体是指_该__地__区__高__一__某__个__学__生__ _的__身__高__,样本是指_被__抽__到__的__1_5_0_个__学__生__的__身__高__,样本量是_1_5_0_.
第九章 统计(知识点梳理及例题解析)
第九章统计9.1 随机抽样1. 全面调查与抽样调查( 1 )对每一个调查对象都进行调查的方法,称为全面调查,又称普查W .( 2 )在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W .( 3 )根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W .( 4 )把从总体中抽取的那部分个体称为样本W .( 5 )样本中包含的个体数称为样本量W .( 6 )调查样本获得的变量值称为样本的观测数据,简称样本数据 .2. 简单随机抽样( 1 )有放回简单随机抽样一般地,设一个总体含有 N ( N 为正整数)个个体,从中逐个抽取 n (1 ≤ n < N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样 .( 2 )不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样 .( 3 )简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样 .( 4 )简单随机样本通过简单随机抽样获得的样本称为简单随机样本 .( 5 )简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法 .■名师点拨( 1 )从总体中,逐个不放回地随机抽取 n 个个体作为样本,一次性批量随机抽取 n 个个体作为样本,两种方法是等价的 .( 2 )简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性 .3. 总体平均数与样本平均数( 1 )总体平均数① 一般地,总体中有 N 个个体,它们的变量值分别为 Y 1 , Y 2 ,… , Y N ,则称== Y i 为总体均值,又称总体平均数 .② 如果总体的 N 个变量值中,不同的值共有 k (k ≤ N )个,不妨记为 Y 1 , Y2 ,… , Y k ,其中 Y i 出现的频数 f i ( i = 1 , 2 ,… , k ),则总体均值还可以写成加权平均数的形式= f i Y i W .( 2 )样本平均数如果从总体中抽取一个容量为 n 的样本,它们的变量值分别为 y 1 , y 2 ,… , yn ,则称== y i 为样本均值,又称样本平均数 . 在简单随机抽样中,我们常用样本平均数去估计总体平均数 .4. 分层随机抽样( 1 )分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W .( 2 )比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配 .5. 分层随机抽样中的总体平均数与样本平均数( 1 )在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别为 M 和 N ,抽取的样本量分别为 m 和 n . 我们用 X 1 , X 2 ,… , X M 表示第 1 层各个个体的变量值,用 x 1 , x 2 ,… , x m 表示第 1 层样本的各个个体的变量值;用 Y 1 , Y 2 ,… , Y N 表示第 2 层各个个体的变量值,用 y 1 , y 2 ,… ,y n 表示第 2 层样本的各个个体的变量值,则:① 第 1 层的总体平均数和样本平均数分别为== X i ,== x i .② 第 2 层的总体平均数和样本平均数分别为==Y i ,== y i .③ 总体平均数和样本平均数分别为=,=W .( 2 )由于用第 1 层的样本平均数可以估计第 1 层的总体平均数,用第 2 层的样本平均数可以估计第 2 层的总体平均数 . 因此我们可以用=+估计总体平均数 .( 3 )在比例分配的分层随机抽样中,==,可得+=+= . 因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数 .6. 获取数据的途径获取数据的基本途径有:( 1 )通过调查获取数据;( 2 )通过试验获取数据;( 3 )通过观察获取数据;( 4 )通过查询获取数据典型应用 1总体、样本等概念辨析题为了调查参加运动会的 1 000 名运动员的平均年龄,从中抽取了 100 名运动员进行调查,下面说法正确的是()A.1 000 名运动员是总体B. 每个运动员是个体C. 抽取的 100 名运动员是样本D. 样本量是 100【解析】根据调查的目的可知,总体是这 1 000 名运动员的年龄,个体是每个运动员的年龄,样本是抽取的 100 名运动员的年龄,样本量为 100. 故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位 .典型应用 2简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?( 1 )从无数个个体中抽取 50 个个体作为样本;( 2 )仓库中有 1 万支奥运火炬,从中一次抽取 100 支火炬进行质量检查;( 3 )某连队从 200 名党员官兵中,挑选出 50 名最优秀的官兵赶赴灾区开展救灾工作 .【解】( 1 )不是简单随机抽样 . 因为简单随机抽样要求被抽取的样本总体的个数是有限的 . ( 2 )不是简单随机抽样 . 虽然“ 一次性抽取” 和“ 逐个抽取” 不影响个体被抽到的可能性,但简单随机抽样要求的是“ 逐个抽取” . ( 3 )不是简单随机抽样 . 因为这 50 名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“ 等可能抽样” 的要求 .要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点 .典型应用 3抽签法及随机数法的应用某班有 50 名学生,要从中随机地抽出 6 人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程 .【解】( 1 )利用抽签法步骤如下:第一步:将这 50 名学生编号,编号为 01 , 02 , 03 ,… , 50.第二步:将 50 个号码分别写在纸条上,并揉成团,制成号签 .第三步:将得到的号签放在一个不透明的容器中,搅拌均匀 .第四步:从容器中逐一抽取 6 个号签,并记录上面的号码 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 2 )利用随机数法步骤如下:第一步:将这 50 名学生编号,编号为 1 , 2 , 3 ,… , 50.第二步:用随机数工具产生 1 ~ 50 范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本 .第三步:重复第二步的过程,直到抽足样本所需人数 .对应上面 6 个号码的学生就是参加该项活动的学生 .( 1 )利用抽签法抽取样本时应注意以下问题:① 编号时,如果已有编号(如学号、标号等)可不必重新编号 . (例如该题中 50 名同学,可以直接利用学号)② 号签要求大小、形状完全相同 .③ 号签要搅拌均匀 .④ 抽取号签时要逐一、不放回抽取 .( 2 )利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数 .典型应用 4分层随机抽样中的有关计算( 1 )某单位共有老、中、青年职工 430 人,其中有青年职工 160 人,中年职工人数是老年职工人数的 2 倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工 32 人,则该样本中的老年职工的人数为W .( 2 )某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“ 泥塑” 与“ 剪纸” 两个社团,已知报名参加这两个社团的学生共有800 人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c剪纸x y z其中 x ∶ y ∶ z = 5 ∶ 3 ∶ 2 ,且“ 泥塑” 社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满意程度,从中抽取一个 50 人的样本进行调查,则从高二年级“ 剪纸” 社团的学生中应抽取人 .【解析】( 1 )设该单位老年职工人数为 x ,由题意得 3 x = 430 - 160 ,解得 x = 90. 则样本中的老年职工人数为 90 × = 18.( 2 )法一:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以“ 剪纸” 社团的人数为 800 × = 320 ;因为“ 剪纸” 社团中高二年级人数比例为==,所以“ 剪纸” 社团中高二年级人数为 320 × = 96.由题意知,抽样比为=,所以从高二年级“ 剪纸” 社团中抽取的人数为 96 × = 6.法二:因为“ 泥塑” 社团的人数占总人数的,故“ 剪纸” 社团的人数占总人数的,所以抽取的 50 人的样本中,“ 剪纸” 社团中的人数为 50 × = 20.又“ 剪纸” 社团中高二年级人数比例为==,所以从高二年级“ 剪纸” 社团中抽取的人数为 20 × = 6.【答案】( 1 ) 18 ( 2 ) 6分层随机抽样中有关计算的方法( 1 )抽样比== .( 2 )总体中某两层的个体数之比=样本中这两层抽取的个体数之比 .对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解 .典型应用 5样本平均数的求法( 1 )甲在本次飞镖游戏中的成绩为 8 , 6 , 7 , 7 , 8 , 10 , 9 , 8 ,7 , 8. 求甲在本次游戏中的平均成绩 .( 2 )在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为 10 的样本,并算得样本的平均数为 5 ;乙同学抽取了一个容量为 8 的样本,并算得样本的平均数为 6. 已知甲、乙两同学抽取的样本合在一起组成一个容量为 18 的样本,求合在一起后的样本均值 .【解】( 1 )甲在本次游戏中的平均成绩为= 7.8. ( 2 )合在一起后的样本均值为== .在分层随机抽样中,如果第一层的样本量为 m ,平均值为 x ;第二层的样本量为n ,平均值为 y ,则样本的平均值为 .9 . 2 用样本估计总体1 .频率分布表、频率分布直方图的制作步骤及意义2 .百分位数(1) 定义:一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p % 的数据小于或等于这个值,且至少有 ( 100 - p ) % 的数据大于或等于这个值.(2) 计算步骤:计算一组 n 个数据的第 p 百分位数的步骤:第 1 步,按从小到大排列原始数据.第 2 步,计算 i = n × p % .第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j ,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第 ( i + 1) 项数据的平均数.典型应用 1频率分布表、频率分布直方图、频率分布折线图的绘制角度一频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取 44 名高二男生,实测体重数据( 单位: kg ) 如下:57 , 61 , 57 , 57 , 58 , 57 , 61 , 54 , 68 , 51 , 49 , 64 , 50 , 48 ,65 , 52 , 56 , 46 , 54 , 49 , 51 , 47 , 55 , 55 , 54 , 42 , 51 , 56 ,55 , 51 , 54 , 51 , 60 , 62 , 43 , 55 , 56 , 61 , 52 , 69 , 64 , 46 ,54 , 48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以 4 为组距,列表如下:分组频率累计频数频率[41.5 , 45.5 ) 2 0.045 5[45.5 , 49.5 ) 7 0.159 1[49.5 , 53.5 ) 8 0.18 1 8[53.5 , 57.5 ) 16 0.363 6[57.5 , 61.5 ) 5 0.113 6[61.5 , 65.5 ) 4 0.090 9[65.5 , 69.5 ) 2 0.045 5频率分布直方图和频率分布折线图如图所示.(1) 在列频率分布表时,极差、组距、组数有如下关系:① 若为整数,则=组数;② 若不为整数,则的整数部分+ 1 =组数.(2) 组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过 100 ,按照数据的多少常分为 5 ~ 12 组,一般样本量越大,所分组数越多.角度二频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图 ( 如图所示 ) ,图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3 ,第二小组的频数为 12.(1) 第二小组的频率是多少?样本量是多少?(2) 若次数在 110 以上 ( 含 110 次 ) 为达标,则该校全体高一年级学生的达标率是多少?(3) 样本中不达标的学生人数是多少?(4) 第三组的频数是多少?【解】 (1) 频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为= 0.08.又因为第二小组的频率=,所以样本容量=== 150.(2) 由直方图可估计该校高一年级学生的达标率为 × 100% = 88 %.(3) 由 (1)(2) 知达标率为 88 % ,样本量为 150 ,不达标的学生频率为 1 - 0.88= 0.12.所以样本中不达标的学生人数为 150 × 0.12 = 18( 人 ) .(4) 第三小组的频率为= 0.34.又因为样本量为 150 ,所以第三组的频数为 150 × 0.34 = 51.频率分布直方图的应用中的计算问题(1) 小长方形的面积=组距 × =频率;(2) 各小长方形的面积之和等于 1 ;(3) =频率,此关系式的变形为=样本量,样本量 × 频率=频数.典型应用 2条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“ 百家讲坛” 的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查 ( 每人只选一项内容 ) ,整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1) 求抽取的学生数;(2) 若该校有 3 000 名学生,估计喜欢收听易中天《品三国》的学生人数;(3) 估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】 (1) 从统计图上可以看出,喜欢收听于丹析《庄子》的男生有 20 人,女生有 10 人;喜欢收听《故宫博物院》的男生有 30 人,女生有 15 人;喜欢收听于丹析《论语》的男生有 30 人,女生有 38 人;喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人;喜欢收听刘心武评《红楼梦》的男生有 6 人,女生有 45 人.所以抽取的学生数为 20 + 10 + 30 + 15 + 30 + 38 + 64 + 42 + 6 + 45 =300( 人 ) .(2) 喜欢收听易中天《品三国》的男生有 64 人,女生有 42 人,共有 106 人,占所抽取总人数的比例为,由于该校有 3 000 名学生,因此可以估计喜欢收听易中天《品三国》的学生有× 3 000 = 1 060( 人 ) .(3) 该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为× 100% = 15 %.(1) 绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2) 在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.典型应用 3折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1) 护士每隔几小时给小明测量一次体温?( 2) 近三天来,小明的最高体温、最低体温分别是多少?(3) 从体温看,小明的病情是在恶化还是在好转?(4) 如果连续 36 小时体温不超过 37.2 摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】 (1) 根据横轴表示的意义,可知护士每隔 6 小时给小明测量一次体温.(2) 从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是 39.5 摄氏度,最低体温是 36.8 摄氏度.(3) 从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9 月 8 日 18 时小明的体温是 37 摄氏度.其后的体温未超过 37.2 摄氏度,自 9 月 8 日 18 时起计算,连续 36 小时后对应的时间为 9 月 10 日凌晨 6 时.因此小明最快可以在 9 月 10 凌晨 6 时出院.(1) 绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2) 在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.典型应用 4扇形统计图下图是 A , B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1) 从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2) 已知 A 学校收到的剪纸作品比 B 学校的多 20 件,收到的书法作品比 B 学校的少 100 件,请问这两所学校收到艺术作品的总数分别是多少件?【解】 (1) 不能.因为两所学校收到艺术作品的总数不知道.(2) 设 A 学校收到艺术作品的总数为 x 件, B 学校收到艺术作品的总数为 y 件,则解得即 A 学校收到艺术作品的总数为 500 件,B 学校收到艺术作品的总数为 600 件.(1) 绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2) 扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.典型应用 5百分位数的计算现有甲、乙两组数据如下表所示.序号1 2 3 4 5 6 7 8 9 11112131415161718192甲组1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 11121313乙组0 0 0 0 1 1 2 3 4 5 6 6 7 7 11414141415试求甲、乙两组数的 25 % 分位数与 75 % 分位数.【解】因为数据个数为 20 ,而且 20 × 25 % = 5 , 20 × 75% = 15.因此,甲组数的 25 % 分位数为== 2.5 ;甲组数的 75 % 分位数为== 9.5.乙组数的 25 % 分位数为== 1 ,乙组的 75 % 分位数为== 12.求百分位数时,一定要将数据按照从小到大的顺序排列.9 . 3 统计案例公司员工的肥胖情况调查分析1 .平均数和中位数的特点(1) 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.(2) 中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变.(3) 与中位数相比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.2 .中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的 ( 图(1)) ,那么平均数和中位数应该大体上差不多;如果直方图在右边“ 拖尾” ( 图(2)) ,那么平均数大于中位数;如果直方图在左边“ 拖尾” ( 图 (3)) ,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“ 长尾巴” 那边.3 .众数的特点众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.■名师点拨一般地,对数值型数据 ( 如用水量、身高、收入、产量等 ) 集中趋势的描述,可以用平均数、中位数;而对分类型数据 ( 如校服规格、性别、产品质量等级等 ) 集中趋势的描述,可以用众数.4 .总体方差与总体标准差如果总体中所有个体的变量值分别为 Y 1 , Y 2 ,… , Y N ,总体平均数为,则称 S 2 = __ ( Y i - ) 2 为总体方差, S =为总体标准差.与总体均值类似,总体方差也可以写成加权的形式.如果总体的 N 个变量值中,不同的值共有k ( k ≤ N ) 个,不妨记为 Y 1 , Y 2 ,… , Y k ,其中 Y i 出现的频数为 f i ( i = 1 , 2 ,… , k ) ,则总体方差为 S 2 = f i ( Y i - ) 2 .5 .样本方差与样本标准差如果一个样本中个体的变量值分别为 y 1 , y 2 ,… y n ,样本平均数为,则称 s 2 = ( y i - ) 2 为样本方差, s =为样本标准差.■名师点拨(1) 若 x 1 , x 2 , x 3 ,… , x n 的平均数为,方差为 s 2 那么 ax 1 + b ,ax 2 + b , ax 3 + b ,… , ax n + b 的平均数为′ = a + b ;方差s ′ 2 =a 2 s 2 .(2) 标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.典型应用 1众数、中位数、平均数的计算及应用某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资 ( 元 )22 000 2 500 2 200 2 000 1 000 29 700人数 1 6 5 10 1 23合计22 000 15 000 11 000 20 000 1 000 69 000(1) 指出这个表格中的众数、中位数、平均数;(2) 这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?【解】 (1) 由表格可知,众数为 2 000 元.把 23 个数据按从小到大 ( 或从大到小 ) 的顺序排列,排在中间的数应是第 12 个数,其值为 2 200 ,故中位数为 2 200 元.平均数为 (22 000 + 15 000 + 11 000 + 20 000 + 1 000)÷23 = 69 000÷23 = 3 000( 元 ) .(2) 虽然平均数为 3 000 元 / 月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.(1) 如果样本平均数大于样本中位数,说明数据中存在较大的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策.(2) 众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心.典型应用 2利用频率分布直方图求众数、中位数、平均数从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:(1) 这 50 名学生成绩的众数与中位数;(2) 这 50 名学生的平均成绩.【解】 (1) 由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为 75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.因为 0.004 × 10 + 0.006 × 10 + 0.02 × 10= 0.04 + 0.06 + 0.2 = 0.3 ,所以前三个小矩形面积的和为 0.3. 而第四个小矩形面积为 0.03 × 10 = 0.3 , 0.3 +0.3 > 0.5 ,所以中位数应位于第四个小矩形内.设其底边为 x ,高为 0.03 ,所以令 0.03 x = 0.2 ,得x ≈ 6.7 ,故中位数应约为 70 + 6.7 = 76.7.(2) 样本平均值应是频率分布直方图的“ 重心” ,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为 45 × (0.004 × 10) + 55 × (0.006 × 10) + 65 × (0.02 × 10) + 75 × (0.03 × 10) + 85 × (0.024 × 10) + 95 × (0.016 × 10) = 76.2.频率分布直方图的数字特征(1) 众数:众数一般用频率分布表中频率最高的一组的组中值来显示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标;(2) 中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3) 平均数:平均数在频率分布表中等于组中值与对应频率之积的和.典型应用 3标准差、方差的计算及应用甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,从中抽取 6件测量数据为:甲: 99 100 98 100 100 103乙: 99 100 102 99 100 100(1) 分别计算两组数据的平均数及方差;(2) 根据计算说明哪台机床加工零件的质量更稳定.【解】 (1) 甲= × (99 + 100 + 98 + 100 + 100 + 103) = 100 ,乙= × (99 + 100 + 102 + 99 + 100 + 100) = 100 ,s = × [(99 - 100) 2 + (100 - 100) 2 + (98 - 100) 2 + (100 - 100) 2 +(100 - 100) 2 + (103 - 100) 2 ] =,s = × [(99 - 100) 2 + (100 - 100) 2 + (102 - 100) 2 + (99 - 100) 2 +(100 - 100) 2 + (100 - 100) 2 ] = 1.(2) 由 (1) 知甲=乙,比较它们的方差,因为 s > s ,故乙机床加工零件的质量更稳定.用样本的标准差、方差估计总体的方法(1) 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差 ( 方差 ) 分析稳定情况.(2) 标准差、方差的取值范围是 [0 ,+∞ ) .(3) 因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 一 节
抓 基 础 明 考 向
随 机 抽 样
提 能 力
教 你 一 招
我 来 演 练
[备考方向要明了] 考 什 么 1.理解随机抽样的必要性和重要性. 2.会利用简单随机抽样方法从总体中抽取样本,了解分层
抽样和系统抽样的方法.
返回
怎 么 考
返回
40 解:设共有x名,则 x ×150=6. ∴x=1 000名. ∴该校四个专业学生共有1 000名.
返回
[巧练模拟]—————(课堂突破保分题,分分必保!)
5.(2012· 东北三校联考)某工厂生产甲、乙、丙三种型 号的产品,产品数量之比为3∶5∶7,现用分层抽 样的方法抽出容量为n的样本,其中甲种产品有18 件,则样本容量n=________.
6 x 设高二年级抽取x人,则有30=40,解得x=8.
[答案] B
返回
[例4] (2011· 山东高考)某高校甲、乙、丙、丁四个专
业分别有150、150、400、300名学生.为了解学生的 就业倾向,用分层抽样的方法从该校这四个专业共抽 取40名学生进行调查,应在丙专业抽取的学生人数为 ________.
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等 D.与第几次抽样无关,与抽取几个样本有关
返回
解析:由随机抽样的特点知某个体被抽到的可能性与 第几次抽样无关,每一次抽到的可能性相等.
答案:C
返回
[冲关锦囊] 1.一个抽样试验能否用抽签法,关键看两点:一是抽签 是否方便; 二是号签是否易搅匀,一般地当总体容 量和样本容量都较小时可用抽签法. 2.用简单随机抽样法抽出的个体带有随机性,个体间无
返回
三、分层抽样 1.分层抽样的概念 在抽样时,将总体 分成互不交叉的层,然后 按照一定 的比例 ,从各层独立地抽取一定数量的个体,将各层
取出的个体合在一起作为样本,这种抽样方法是一种
分层抽样. 2.当总体是由 差异明显的几个部分 组成时,往往选用分 层抽样的方法. 3.分层抽样时,每个个体被抽到的机会是 均等 的. 返回
3.(2012· 中山模拟)为了检查某超市货架上的饮料是否 含有塑化剂,要从编号依次为1到50的塑料瓶装饮 料中抽取5瓶进行检验,用每部分选取的号码间隔 一样的系统抽样方法确定所选取的5瓶饮料的编号
可能是
( ) B.2,4,8,16,32 D.7,17,27,37,47 返回
A.5,10,15,20,25 C.1,2,3,4,5
返回
随机数法 第一步:将24名学生编号,编号为01,02,03,…,24; 第二步:在随机数表中任选一数开始,按某一确定方向 读数;
第三步:凡不在01~24中的数或已读过的数,都跳过去
不作记录,依次记录下得数; 第四步:找出号码与记录的数相同的学生组成服务小组.
返回
[巧练模拟]——————(课堂突破保分题,分分必保!)
100 解析:50×1 000=5.
答案:5
返回
5.为了了解参加一次知识竞赛的1 252名学生的成绩, 决定采用系统抽样的方法抽取一个容量为50的样本, 那么总体中应随机剔除的个体数目是________. 解析:由系统抽样特点知剔除2个.
答案: 2
返回
类别 简单 随机
共同点
各自特点
相互联系 适用范围 总体中的 个体数较
2.一ቤተ መጻሕፍቲ ባይዱ班级有5个小组,每一个小组有10名学生,随机
编号为1~10号,为了了解他们的学习情况,要求抽 取每组的2号学生留下来进行问卷调查,这里运用的 方法是 A.分层抽样法 C.随机数法 B.抽签法 D.系统抽样法 ( )
解析:由系统抽样方法的特点可知选D. 答案: D
返回
3.某校有老师200人,男学生1 200人,女学生1 000人, 现用分层抽样的方法从所有师生中抽取一个容量为
固定间距.
返回
[精析考题] [例2] (2010· 湖北高考)将参加夏令营的600名学生编号 为:001,002,…,600.采用系统抽样方法抽取一个容量 为50的样本,且随机抽得的号码为003.这600名学生分 住在三个营区,从001到300在第Ⅰ营区,从301到495在 第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的
返回
1.(教材习题改编)为确保食品安全,质检部门检查一箱 装有1 000件包装食品的质量,抽查总量的2%.在这个 问题中下列说法正确的是 A.总体是指这箱1 000件包装食品 ( )
B.个体是一件包装食品
C.样本是按2%抽取的20件包装食品 D.样本容量为20 解析:由从总体中抽取样本的意义知D是正确的. 答案: D 返回
各层抽样时 总体由差
采用简单随 异明显的 机抽样或系 几部分组 统抽样 成
进行抽取
返回
返回
[精析考题] [例1] 伦敦大学为服务2012伦敦奥运会从报名的24名学 生中选6人组成外宾接待服务人员.请用抽签法和随机 数表法设计抽样方案.
返回
[自主解答] 抽签法 第一步:将24名学生编号,编号为1,2,3,…,24; 第二步:将24个号码分别写在24张外形完全相同的纸条上, 并揉成团,制成号签; 第三步:将24个号签放入一个不透明的盒子中,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 第五步:所得号码对应的学生,就是服务小组的成员.
1.从高考题看,分层抽样和系统抽样的应用是考查的
重点. 2.从考查形式上看选择题和填空题出现较多,有时和其 他知识点相结合出现在解答题中,题目多为中档题.
返回
返回
一、简单随机抽样 1.简单随机抽样的概念
设一个总体含有N个个体,从中逐个 不放回 地抽取n
个个体作为样本 (n≤N) ,如果每次抽取时总体内的 各个个体被抽到的机会 都相等 ,就把这种抽样方法 叫做简单随机抽样. 2.最常用的简单随机抽样方法有两种—— 抽签 法
n的样本,已知从女学生中抽取的人数为80人,则n
为 A.16 C.192 B.96 D.112 ( )
n 解析:1 000×2 400=80,∴n=192.
答案: C
返回
4.要从其中有50个红球的1 000个形状相同的球中,采 用按颜色分层抽样的方法抽取100个进行分析,则应 抽取红球的个数为________.
返回
[精析考题] [例3] (2011· 福建高考)某校选修乒乓球课程的学生中, 高一年级有30名,高二年级有40名.现用分层抽样的方 法在这70名学生中抽取一个样本,已知在高一年级的学
生中抽取了6名, 则在高二年级的学生中应抽取的人数
为 A.6 C.10 B.8 D.12 返回 ( )
[自主解答]
效果的调查,问应在第三批次中抽取教职工多少名?
(3)已知y≥96,z≥96,求第三批次中女教职工比男教职工 多的概率. 返回
[步步满分] x (1)由900=0.16, 解得x=144.(3分) (2)第三批次的人数为y+z=900-(196+204+144+156)=200, m 54 设应在第三批次中抽取m名,则200=900, 解得m=12. ∴应在第三批次中抽取12名教职工.(6分)
1.(2012· 济宁模拟)下面的抽样方法是简单随机抽样的是 ( )
A.在某年明信片销售活动中,规定每100万张为一个 开奖组,通过随机抽取的方式确定号码的后四位 为2 709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,
每隔30分钟抽一包产品,称其重量是否合格
返回
C.某学校分别从行政人员、教师、后勤人员中抽取2
50号,若在第三组中抽得号码为12的学生,则在第
八组中抽得号码为________的学生.
返回
解析:易知组距为5,因为在第三组中抽得号码为12, 所以在第八组中抽得号码为12+(8-3)×5=37.
答案: 37
返回
[冲关锦囊] (1)当总体容量较大,样本容量也较大时,可用系统抽
样法.
(2)在利用系统抽样时,经常遇到总体容量不能被样本容 量整除的情况,这时可以先从总体中随机地剔除几个 个体,使得总体中剩余的个体数能被样本容量整除.
返回
[自主解答]
应在丙专业抽取的学生人数是
400 ×40=16. 150+150+400+300
[答案] 16
返回
例4条件变为“某高校有甲、乙、丙、丁四个专业,为了
解学生的就业倾向,用分层抽样的方法从该校这四个专 业共抽取40名学生进行调查.若从甲专业的150名学生中 抽取6人,则该校四个专业学生共有多少名.”
解析:利用系统抽样,把编号分为5段,每段10个,每 段抽取一个,号码间隔为10.
答案: D
返回
4.(2011· 皖南八校第二次联考)某班级有50名学生,现 要采取系统抽样的方法在这50名学生中抽出10名学 生,将这50名学生随机编号1~50号,并分组,第 一组1~5号,第二组6~10号,……,第十组46~
抽样过 从总体中逐个抽
程中每 取 个个体 被抽取 的机会 将总体均匀分成 在起始部
抽样
少
总体中的 个体数较 多 返回
系统
抽样
几部分,按事先 分抽样时
确定的规则在各 采用简单 部分抽取 随机抽样
均等
类别
共同点
各自特点 将总体分成 几层,分层
相互联系
适用范围
抽样过程中
分层 每个个 抽样 体被抽取的 机会均等
18 解析:由 n = 3 ⇒n=90. 3+5+7
答案:90
返回
6.(2012· 南京模拟)一个社会调查机构就某地居民的月 收入调查了10 000人,并根据所得数据画了样本的 频率分布直方图(如下图所示).为了分析居民的收入