2015届高三数学(文)第一轮总复习课件 第66讲 抽样方法与总体分布的估计

合集下载

《高中数学抽样方法》课件

《高中数学抽样方法》课件

05
抽样调查的实施步骤与注意事项
实施步骤
明确调查目的
首先需要明确调查的目的和目标,确定调查 的范围和对象。
制定调查计划
根据调查目的制定详细的调查计划,包括调查 方法、调查内容、调查时间等。
选择合适的抽样方法
根据实际情况选择合适的抽样方法,如简单随机 抽样、分层抽样等。
实施调查
按照调查计划进行调查,收集数据。
分层随机抽样
定义
先将总体分成若干层次或类别,然后从各层次或 类别中随机抽取一定数量的样本。
特点
能够提高样本的代表性,减小抽样误差。
适用范围
总体存在明显的层次或类别。
整群随机抽样
定义
先将总体分成若干群或组,然后从各群或组中随机抽取一定数量 的样本。
特点
便于组织,节省经费。
适用范围
总体群或组特征明显,且群或组间差异不大。
总结词
针对性、准确性、可靠性
详细描述
该案例通过抽样调查的方法,对某品牌手机的市场占有率进行调查,旨在了解该品牌手机在市场中的销售情况和 竞争力。在抽样过程中,确保了样本的针对性和准确性,同时也注重了样本的可靠性,以确保调查结果的可信度 和说服力。
案例三:某高校大学生消费情况的抽样调查
总结词
客观性、科学性、可行性
详细描述
该案例通过抽样调查的方法,对某高校大学生的消费情况进行调查,旨在了解大学生的消费习惯和消 费水平。在抽样过程中,确保了样本的客观性和科学性,同时也注重了样本的可行性,以方便调查的 实施和数据的收集。
THANKS
感谢观看
样本容量的影响因素
01
02
03
04
总体规模
总体规模越大,需要的样 本容量也越大,以保持相 同的置信水平和误差范围 。

高考数学一轮复习 10.1 抽样方法与总体估计课件 文 新人教A版

高考数学一轮复习 10.1 抽样方法与总体估计课件 文 新人教A版

n
N;
(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,
由于它充分利用了已知信息,因此利用它获取的样本更具有 代表性,在实践中应用更为广泛. 二、总体分布的估计 1.用样本的频率分布估计总体分布 (1)样本的频率分布直方图 作频率分布直方图的步骤:
因为频率分布直方图中横轴表示“组距”,纵轴表示“频率/ 组距”,所以“小长方形的面积=组距×频率/组距=频率”,各 小长方形的面积之和等于1.
号码后,其中依次出现的号码可以看成是依次从总体中抽取 的各个个体的号码.
用简单随机抽样,从含有N个个体的总体中抽取一个容量为n
1
的样本时,每次抽取一个个体时任一个体被抽到的概率为 N ;
在整个抽样过程中各个个体被抽到的概率为
n
N.
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几
个部分,然后按照预先定出的规则,从每一部分抽取1个个体, 得到所需要的样本,这种抽样叫做系统抽样.
的中位数;当数据有偶数个时,处在中间的两个数的平均数就 是这组数据的中位数.因此中位数不一定是样本数据中的数. 在频率分布直方图中中位数左右两侧直方图的面积应该相 等,由此在图中我们可以估计其近似值.
(3)众数:在样本数据中出现次数最多的数叫做这组数据的众 数.若一组样本数据中有两个或几个数据出现的最多且次数 一样,这些数据都是这组数据的众数;若一组数据中每个数据 出现的一样多,则认为这组数据没有众数.
③在样本数据较少时,用茎叶图表示数据的效果较好,但当样 本数据较多时,茎叶图就显得不太方便了.
2.用样本的数字特征估计总体的数字特征
(1)平均数:一组数据的总和除以数据的个数所得的商就是平 均数,它是频率分布直方图的“重心”.

2015届高三数学第一轮复习课件:10.1抽样方法与总体估计

2015届高三数学第一轮复习课件:10.1抽样方法与总体估计

-x )2]__,反映了样本数据的离散程度.
1.某社区有 500 户家庭,其中高收入家庭 125 户,中
第七页,编辑于星期五:八点 五十分。
等收入家庭 280 户,低收入家庭 95 户,为了调查社会 购买力的某项指标,要从中抽取一个容量为 100 户的样本, 记作①.某学校高三年级有 12 名足球运动员,要从中选出 3 人调查学习负担情况,记作②.那么完成上述两项调查应采 用的抽样方法是( ).
(1)求图中 a 的值;
(2)根据频率分布直方图,估计这 100 名学生语文成绩 的平均分.
利用频率分布直方图估计平均数,即频率分布直方 图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(1)由题意得 2×10a+0.04×10+0.03×10+0.02 ×10=1,解得 a=0.005.
(2)估计平均分是 0.05×55+0.4×65+0.3×75+0.2
B
2.茎叶图的应用、数字特征
(2012 年湖南卷)
如图是某学校一名篮球运动员在五场比赛
第十三页,编辑于星期五:八点 五十分。
的茎叶图,则该运动员在这五场比赛中得分的方差为 ________.
(注:方差 s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2], 其中-x 为 x1,x2,…,xn 的平均数)
1
1
1
1
A.2
B.3
C.4
D.6
1
1
面积之比为4,故数量之比为4.
第十页,编辑于星期五:八点 五十分。
C 4.某学校举行的运动会上,七位评委为某体操项目打 出的分数的茎叶统计图如图所示,去掉一个最高分和一个最 低分后,所剩数据的平均数和方差分别为________.

高考文科数学总复习(第1轮)浙江专版课件第63讲 抽样方法与总体分布的估计

高考文科数学总复习(第1轮)浙江专版课件第63讲 抽样方法与总体分布的估计

要点指南:①简单随机抽样;②分层抽样; ③系统抽样;④抽签法;⑤随机数表法; ⑥差异明显的几部分组成;⑦频率分布直方 图;⑧连接频率分布直方图中各小长方形上 1 边的中点;⑨最多;⑩中间位置;⑪ ( x1 n 1 x2 xn );⑫ [( x1 x) 2 ( x2 x) 2 n 2 1 2 1 2 2 2 ( xn x) ];⑬ [( x1 x2 xn ) nx ];⑭ n n x x ) nx ];⑮ [( x1 ax b;⑯ a2s2
通过对样本的分析和研究更准确的反映总体 的情况,常用的抽样方法有① ____________ 、 ② ____________ 、③ ______________ .
2 简单随机抽样是指一个总体的个数为N (较
小的有限数),通过逐个抽取一个样本,且每 次抽取时每个个体被抽取的概率相等.简单随 机抽样的两种常用方法为④ _______ 和⑤ ___ _________ .
3 ⑧ _______________________ ,就得到频
率分布折线图,随着样本容量的增加,折线 图会越来越近于一条光滑曲线,称之为总体 密度曲线.
4 茎叶图也能用来表示数据,茎是中间的一
列数,叶是从茎旁边上长出来的数,当样本 数据较少时,用茎叶图表示数据的效果更好.
3.样本的数字特征估计总体的数字特征
【解析】由题设,个体有明显差异,因此应选择 分层抽样, 但抽样比例若是 36∶163, 不能得到整数值, 而先剔除 1 名老年人后按比例 36∶162,即 2∶9,能 从, 其中位数为 22,则 x 的值为( )
A.1 C.0
B.2 D.3
20+x+23 【解析】 由于样本数据为偶数, 所以 22= , 2 求解 x=1,故选 A.

2015届高三(文)一轮同步训练:第12单元《概率与统计、统计案例》(含答案)

2015届高三(文)一轮同步训练:第12单元《概率与统计、统计案例》(含答案)

第十二单元 概率与统计、统计案例 第64讲 随机事件的概率1.下列事件中,随机事件的个数为( ) ①物体在重力的作用下会自由下落;②方程x 2+2x +3=0有两个不相等的实根;③某传呼台某天的某一时段内收到传呼要求10次; ④下周日会下雨. A .1 B .2 C .3 D .42.分别写有数字1,2,3,4的4张卡片,从这4张卡片中随机抽取2张,则取出的2张卡片上的数字之和为奇数的概率是( )A.14B.13C.12D.233.在正四面体的6条棱中随机抽取2条,则其2条棱互相垂直的概率为( ) A.34 B.23 C.15 D.134.从一篮子鸡蛋中任取1个,如果其重量小于30克的概率为0.3,重量在[30,40]克的概率为0.5,那么重量不小于30克的概率为( )A .0.3B .0.5C .0.8D .0.75.从个位数与十位数之和为奇数的两位数中任取一个,其个位数为0的概率是( ) A.49 B.13 C.29 D.196.某射手的一次射击中,射中10环、9环、8环的概率分别为0.2、0.3、0.1,则此射手在一次射击中不超过8环的概率为________.7.中国乒乓球队中的甲、乙两名队员参加奥运会乒乓球女子单打比赛,甲夺得冠军的概率为37,乙夺得冠军的概率为14,那么中国队夺得女子乒乓球单打冠军的概率为 .8.一个袋中装有四个形状、大小完全相同的球,球的编号分别为1,2,3,4. (1)从袋中随机取出两个球,求取出的两球中编号奇偶性相同的概率;(2)先从袋中随机取一个球,该球的编号为m ,将球放回袋中,然后再从袋中随机取一个球,该球编号为n ,求n <m +2的概率.9.某商场有奖销售中,购满100元商品得1张奖券,多购多得,1000张奖券为一个开奖单位,设特等奖1个,一等奖10个,二等奖50个.设1张奖券中特等奖、一等奖、二等奖的事件分别为A、B、C,求:(1)P(A),P(B),P(C);(2)1张奖券的中奖概率;(3)1张奖券不中特等奖且不中一等奖的概率.第65讲 古典概型与几何概型1.如图,矩形长为6,宽为4,在矩形内随机地撒300颗黄豆,数得落在椭圆外的黄豆数为96颗,以此实验数据为依据可以估计出椭圆的面积约为( )A .7.68B .8.68C .16.32D .17.32 2.从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是( )A.12B.13C.14D.163.已知Ω={(x ,y )|x +y ≤6,x ≥0,y ≥0},A ={(x ,y )|x ≤4,y ≥0,x -2y ≥0},若向区域Ω内随机投一点P ,则点P 落在区域A 内的概率为( )A.19B.29C.13D.494.在面积为S 的△ABC 的边AB 上任取一点P ,则△PBC 的面积大于S4的概率是( )A.14B.12C.34D.235.从三男三女6名学生中任选2名(每名同学被选中的概率均相等),则2名都是女同学的概率等于________.6.连掷骰子两次(骰子六个面上分别标以数字1,2,3,4,5,6)得到的点数分别记为a 和b ,则使直线3x -4y =0与圆(x -a )2+(y -b )2=4相切的概率为________.7.在棱长为2的正方体ABCD -A 1B 1C 1D 1中,点O 为底面ABCD 的中心,在正方体ABCD -A 1B 1C 1D 1内随机取一点P ,则点P 到点O 的距离大于1的概率为________. 8.从含有两件正品和一件次品的3件产品中每次任取一件. (1)每次取出后不放回,连续取两次; (2)每次取出后放回,连续取两次.试分别求取出的两件产品中恰有一件次品的概率.9.已知关于x 的一元二次函数f (x )=ax 2-4bx +1.(1)设集合P ={1,2,3}和Q ={-1,1,2,3,4},分别从集合P 和Q 中随机取一个数作为a 和b ,求函数y =f (x )在区间[1,+∞)上是增函数的概率.(2)设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0x >0y >0内的随机点,记A ={y =f (x )有两个零点,其中一个大于1,另一个小于1},求事件A 发生的概率.第66讲抽样方法与总体分布的估计1.总体编号为01,02,…19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()C.02 D.012.某工厂生产滚珠,从某批产品中随机抽取8粒,量得直径分别为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,则估计该厂生产的滚珠直径的平均数为()A.14.8 mm B.14.9 mmC.15.0 mm D.15.1 mm3.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩介于350分到650分之间的10000名学生成绩,并根据这10000名学生的总成绩画了样本的频率分布直方图(如图),则总成绩在[400,500)内共有()A.5000人B.4500人C.3250人D.2500人4.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数5.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10C.12 D.136.样本总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=6,则在第7组中抽取的号码是________.7.抽样统计甲,乙两位射击运动员的5次训练成绩(单位:环),结果如下:8.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW·h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在[39.5,43.5)内的居民所占百分比约是多少?(2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.41.60.5 1.80.6 2.1 1.1 2.5 1.2 2.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?第67讲变量的相关性、回归分析、独立性检验1.读自然科学史,有些物理学家也是数学家,如伟大的牛顿,说明数学成绩与物理成绩存在什么关系()A.正相关B.负相关C.无相关D.不确定2.下列结论正确的是()①函数关系是一种确定性关系②相关关系是一种非确定性关系③回归分析是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④3.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算发现K2的观测值k=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是()A.90%C.97.5% D.99.5%4.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)=0.7x+0.35,那么表中t的值为()A.3 B.3.15C.3.5 D.4.55.某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:为了判断据,得到k=50×(13×20-10×7)2≈4.844,因为k>3.841,所以判定主修统计专业与性别有关系,那么23×27×20×30这种判断出错的可能性为________.6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的线性回归直线方程:y=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元.7.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有________%的把握认为该学校15至K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .8.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有统计数据(x i ,y i )(i =1,2,3,4,5).由资料知y 对x 呈线性相关,并且统计的五组数据得平均值分别为x -=4,y -=5.4,若用五组数据得到的线性回归方程y =bx +a 去估计,使用8年的维修费用比使用7年的维修费用多1.1万元.(1)求回归直线方程;(2)估计使用年限为10年时,维修费用是多少?9.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:(1) (2)在上述抽取的6人中选2人,求恰有1名女生的概率;(3)为了研究喜欢打篮球是否与性别有关,计算出K 2≈8.333,你有多大的把握认为是否喜欢打篮球与性别有关?第十二单元 概率与统计、统计案例 第64讲 随机事件的概率1.B ①是必然事件,②是不可能事件,③④是随机事件.2.D 从写有数字1,2,3,4的4张卡片中随机抽取2张,有12,13,14,23,24,34共6种,取出的2张卡片上的数字之和为奇数的取法有12,14,23,34共4种,取出的2张卡片上的数字之和为奇数的概率是46=23.3.C 总的取法有15种,由正四面体的性质可知,对棱垂直,故互相垂直的有3种,所求概率为15,选C.4.D 由互斥事件概率加法公式知:重量在(40,+∞)的概率为1-0.3-0.5=0.2,又因为0.5+0.2=0.7,所以重量不小于30克的概率为0.7.5.D 两位数共有90个,其中个位数与十位数之和为奇数的两位数有45个,个位数为0的有5个,所以概率为545=19.6.0.5 依题意知,此射手在一次射击中不超过8环的概率为1-(0.2+0.3)=0.5. 7.1928中国队夺得女子乒乓球单打冠军包括两种情况:一是甲队员夺得单打冠军,二是乙队员夺得单打冠军,故P =37+14=1928.8.解析:(1)设“两球编号都是奇数”为事件A ,“两球编号都是偶数”为事件B ,则A 、B 为互斥事件.从袋中随机取两个球,其一切可能结果组成的基本事件有(1,2),(1,3),(1,4),(2,3),(2,4),(3,4),共6个.事件A 所含基本事件有(1,3),共1个,事件B 所含的基本事件有(2,4),共1个,故所求事件的概率P =P (A +B )=P (A )+P (B )=16+16=13.(2)依题设,一切可能结果(m ,n )有(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2), (3,3),(3,4),(4,1) (4,2),(4,3),(4,4),共16个.又满足条件n ≥ m +2 的事件为(1,3) (1,4) (2,4),共3个,所以满足条件n ≥ m +2 的事件的概率为P 1=316,故满足条件n <m +2 的事件的概率为P ′=1-P 1=1-316=1316.9.解析:(1)P (A )=11000,P (B )=101000=1100,P (C )=501000=120.故事件A ,B ,C 的概率分别为11000,1100,120.(2)1张奖券中奖包含中特等奖、一等奖、二等奖.设“1张奖券中奖”这个事件为M ,则M =A ∪B ∪C .因为A 、B 、C 两两互斥,所以P (M )=P (A ∪B ∪C )=P (A )+P (B )+P (C ) =1+10+501000=611000.故1张奖券的中奖概率为611000.(3)设“1张奖券不中特等奖且不中一等奖”为事件N ,则事件N 与“1张奖券中特等奖或中一等奖”为对立事件,所以P (N )=1-P (A ∪B )=1-(11000+1100)=9891000.故1张奖券不中特等奖且不中一等奖的概率为9891000.第65讲 古典概型与几何概型 1.C2.B 从1,2,3,4中任取2个不同的数,有(1,2),(1,3),(1,4),(2,3),(2,4),(3,4)共6种,取出的2个数之差的绝对值为2的有(1,3),(2,4)共2种,所以概率为13.3.B Ω表示的区域的面积为12×6×6=18,A 表示的区域的面积为12×4×2=4,故P=29,选B. 4.C 5.15由树形图可知,从6名学生中任选2名有15种选法,从3名女同学中任选2名有3种选法,所以2名都是女同学的概率等于15.6.118连掷骰子两次总的试验结果有36种,要使直线3x -4y =0与圆(x -a )2+(y -b )2=4相切,则|3a -4b |5=2,即满足|3a -4b |=10,符合题意的(a ,b )有(6,2),(2,4)2个,由古典概型概率计算公式可得所求概率为118.7.1-π12点P 到点O 的距离大于1的点位于以O 为球心,以1为半径的半球外.记点P 到点O 的距离大于1为事件A ,则P (A )=23-12×4π3×1323=1-π12. 8.解析:(1)用a 1,a 2和b 1表示两件正品和一件次品,则不放回地抽取两次,其一切可能的结果为:(a 1,a 2),(a 1,b 1),(a 2,a 1),(a 2,b 1),(b 1,a 1),(b 1,a 2),即基本事件的总数n =6.其中小括号内左边的字母表示第一次取出的产品,右边的字母表示第二次取出的产品,用A 表示“取出的两件产品中,恰好有一件次品”这一事件,则A 所含的结果为(a 1,b 1),(a 2,b 1),(b 1,a 1),(b 1,a 2),事件A 包含的事件总数m =4.故P (A )=46=23.(2)若为有放回的抽取,其基本事件包含的结果为:(a 1,a 1),(a 1,a 2),(a 1,b 1),(a 2,a 1),(a 2,a 2),(a 2,b 1),(b 1,a 1),(b 1,a 2),(b 1,b 1),即基本事件的总数n =9.用B 表示“恰有一件产品为次品”这一事件,则B 包含的结果为(a 1,b 1),(a 2,b 1),(b 1,a 1),(b 1,a 2),事件B 包含的事件总数m =4.故P (B )=49.9.解析:(1)因为函数f (x )=ax 2-4bx +1的图象的对称轴为x =2ba.要使函数f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数,当且仅当a >0且2ba≤1,即2b ≤a .若a =1,则b =-1;若a =2,则b =-1,1;若a =3,则b =-1,1. 记B ={函数y =f (x )在区间[1,+∞)上是增函数}, 则事件B 包含基本事件的个数是1+2+2=5,所以P (B )=515=13.(2)依条件可知试验的全部结果所构成的区域为Ω={(a ,b )|⎩⎪⎨⎪⎧ a +b -8≤0a >0b >0},其面积S Ω=12×8×8=32, 事件A 构成的区域为A ={(a ,b )|⎩⎪⎨⎪⎧ a +b -8≤0a >0b >0f (1)<0}={(a ,b )|⎩⎪⎨⎪⎧ a +b -8≤0a >0b >0a -4b +1<0}.由⎩⎪⎨⎪⎧a +b -8=0a -4b +1=0,得交点坐标为(315,95). 所以S A =12×(8-14)×315=96140, 所以事件A 发生的概率为P (A )=S A S Ω=9611280. 第66讲 抽样方法与总体分布的估计1.D 从第5列和第6列选出的两位数依次为65,72,08,02,63,14,07,02,43,69,97,28,01,98,但编号必须不大于20的且不和前面重复的只能是08,02,14,07,01,选D.2.B 平均数x -=18(14.7+14.6+15.1+15.0+14.8+15.1+15.0+14.9)=14.9(mm). 3.B 由频率分布直方图可求得a =0.005,故[400,500)对应的频率为(0.005+0.004)×50=0.45,相应的人数为4500人.4.C 对A 选项,分层抽样要求男女生总人数之比=男女生抽样人数之比,所以A 选项错.对B 选项,系统抽样要求先对个体进行编号再抽样,所以B 选项错.对C 选项,男生方差为8,女生方差为6.所以C 选项正确.对D 选项,该班男生成绩的平均数不一定小于该班女生成绩的平均数.所以D 选项错.故选C.5.D 从甲、乙、丙三个车间依次抽取a ,b ,c 个样本,则120∶80∶60=a ∶b ∶3⇒a =6,b =4,n =a +b +c =13.选D.6.63 因为m =6,k =7,所以m +k =13,它的个位为3,依题意第7组的号码为60,61,62,…,69.所以第7组抽取的号码应为63.7.2 根据平均数公式,运动员甲的平均数;x -甲=15(87+91+90+89+93)=90, 运动员乙的平均数:x -乙=15(89+90+91+88+92)=90, 根据方差公式,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2, 因为s 2甲>s 2乙,所以成绩较稳定的运动员为乙,他的训练成绩的方差为2.8.解析:(1)设直方图从左到右前3个小矩形的面积分别为P ,2P ,3P .由直方图可知,最后两个小矩形的面积之和为(0.0875+0.0375)×2=0.25.因为直方图中各小矩形的面积之和为1,所以P +2P +3P =0.75,即P =0.125.所以3P +0.0875×2=0.55.由此估计,该乡镇居民月均用电量在[39.5,43.5)内的居民所占百分比约是55%.(2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125,设样本数据的中位数为39.5+x .因为正中间一个矩形的面积为3P =0.375,所以x ∶2=0.125∶0.375,即x =23≈0.67. 从而39.5+x ≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW·h).9.解析:(1)设A 药观测数据的平均数为x -,B 药观测数据的平均数为y -,由观测结果可知,x -=2.3,y -=1.6,由以上计算结果可知x ->y -,因此可看出A 药的效果好.(2)从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,因此可看出A 药的效果好. 第67讲 变量的相关性、回归分析、独立性检验1.A 2.C3.C 因为k =6.023>5.024.4.A 由线性回归直线过样本点的中心(x -,y -),x -=4.5,得y -=3.5,即2.5+t +4+4.54=3.5,解得t =3.5.5% 因为k >3.841,所以P (K 2≥3.841)=0.05.故这种判断出错的可能性为5%.6.0.245 x 变为x +1,y =0.245(x +1)+0.321=0.245x +0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.7.97.5 K 2=20(4×12-3×1)25×7×13×15≈5.934>5.024, 所以可以有97.5%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.8.解析:(1)因为线性回归方程y =bx +a 经过定点(x -,y -),将x -=4,y -=5.4代入回归方程得5.4=4b +a ,又8b +a -(7b +a )=1.1,解得b =1.1,a =1.所以线性回归方程是y =1.1x +1.(2)将x =10代入线性回归方程得y =12(万元).所以线性回归方程为y =1.1x +1;估计使用年限为10年时,维修费用是12万元.9.解析:(1)在喜欢打篮球的学生中抽6人,则抽取比例为630=15. 所以男生应该抽取20×15=4人. (2)在上述抽取的6名学生中,女生有2人,男生有4人.女生2人记为A ,B ;男生4人记为c ,d ,e ,f ,则从6名学生中任取2名的所有情况为:(A ,B )、(A ,c )、(A ,d )、(A ,e )、(A ,f )、(B ,c )、(B ,d )、(B ,e )、(B ,f )、(c ,d )、(c ,e )、(c ,f )、(d ,e )、(d ,f )、(e ,f )共15种情况,其中恰有1名女生的情况有:(A ,c )、(A ,d )、(A ,e )、(A ,f )、(B ,c )、(B ,d )、(B ,e )、(B ,f ),共8种情况,故在上述抽取的6人中选2人,恰有1名女生的概率为P =815. (3)因为K 2≈8.333,且P (K 2≥7.879)=0.005=0.5%,那么,我们有99.5%的把握认为是否喜欢打篮球是与性别有关系的.。

2015高考数学(文)一轮总复习课件:9.1 抽样方法

2015高考数学(文)一轮总复习课件:9.1 抽样方法

随机数表法: 第一步, 将 60 名学生编号, 编号为 00, 01, 02, …, 59.(7 分) 第二步,在随机数表中任选一数开始,按某一确 定方向依次读取两位数.(8 分) 第三步,凡不在 00~59 中的两位数或已读过的 两位数,都跳过去不作记录,依次记录下得数,直到 样本的 10 个号码全部取出.(11 分) 第四步,找出号码与记录的数对应的学生组成志 愿小组.(12 分)
抽样方法中重点掌握分层抽样与系统抽样,抓住 系统抽样的等距性和分层抽样的等比例的特征.但也 要注意简单随机抽样的特征. 频率分布直方图应注意其中的频数、 频率、 组距、 小矩形面积等各个量之间的关系;茎叶图要能从图中 还原数据及读图获得数据的分布特征. 样本数据数字特征的计算公式要熟记,相关的变 形公式和运算技巧也应该熟悉,并且能够准确进行计 算. 回归直线方程部分要理解方程建立的方法和应 用, 而统计案例部分要熟练掌握 2×2 列联表检验两个 变量独立性检验的方法,对于一些计算公式不要求记 忆,但应能够熟练应用.
规范解答:由于总体容量和样本容量都较大,所以可 用系统抽样. 抽样步骤如下: 第一步,将 10 002 辆电动自行车用随机方式编 号.(2 分) 第二步, 从总体中剔除 2 辆(剔除方法可用随机数 法), 将剩下的 10 000 辆电动自行车重新编号(分别为 1,2,…,10 000)并分成 100 段.(6 分) 第三步,在第一段 1,2,…,100 这 100 个编号 中 用 简 单 随 机 抽 样 抽 出 一 个 号 码作 为 起 始 号 码 k(1≤k≤100,k∈N+). 第四步,把起始号码依次加间隔 100,可获得样 本的编号 k+100l(l=0,1,2,3,…,99).(12 分)
5、(2012·天津高考)某地区有小学 150 所,中学 75 所,大学 25 所.现采用分层抽样的方法从这些学校 中抽取 30 所学校对学生进行视力调査,应从小学中 抽取 18 所学校,中学中抽取 9 所学校.

抽样方法与总体分布的估计

抽样方法与总体分布的估计

抽样比= 样个本体=容总量量.
各层样本容量 各层个体数量

(1)(2017河北石家庄二中三模,3)某校为了解1 000名高一新生的身体状
况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~
1 000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽
样抽取的号码为 ( C )

y
∴z y=21y2, ,z=18,
2 6(z 6),
若用分层抽样的方法抽取12个观测点的数据,则容城应抽取的数据个数
为12× =142,故选C.
6 12 18
方法 2 频率分布直方图的应用
用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: (1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是相 应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1.
A.16 B.17 C.18 D.19
(2)(2017山东淄博二模,6)为了调研雄安新区的空气质量状况,某课题组 对雄县、容城、安新3县的空气质量进行了调查,按地域特点在三县内 设置空气质量观测点,已知三县内观测点的个数分别为6,y,z,依次构成 等差数列,且6,y,z+6成等比数列,若用分层抽样的方法抽取12个观测点 的数据,则容城应抽取的数据个数为 ( C ) A.8 B.6 C.4 D.2
6.样本的数字特征
(1)众数、中位数、平均数
数字特征 样本数据
频率分布直方图
众数
出现⑤ 次数最多 的数据
取最高的小矩形底边中点的横坐标
中位数

版高考数学一轮总复习11.4抽样方法与总体分布的估计课件

版高考数学一轮总复习11.4抽样方法与总体分布的估计课件

件时,估计该工厂获利2 000×8.1=16 200(元).
因为从A,B生产线共随机抽取的200件产品中,A生产线生产的一等级产
品有20件,B生产线生产的一等级产品有35件,由样本频率估计总体概率,
得该工厂生产的产品为一等级产品的概率为 20 35 = 11 ,当产品产量为
200 40
2 000件时,估计该工厂一等级产品获利2 000× 11×10=5 500(元).
考法二 样本的数字特征及其应用 1.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它 们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意 义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述 波动大小. 2.有关平均数、方差的一些结论 1)若x1,x2,…,xn的平均数为 x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m x +a. 2)设数据x1,x2,…,xn的方差为s2,则 ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2.
解析 (1)从A生产线随机抽取的100件产品获利的平均数为 x1= 1 ×(10×20+8
100
×60+6×20)=8(元),方差为
= s12
×1[(10-8)2×20+(8-8)2×60+(6-8)2×20]=
100
1.6;
从B生产线随机抽取的100件产品获利的平均数为 x2= 1 ×(10×35+8×40+
A.2.25吨 B.2.24吨 C.2.06吨 D.2.04吨
×0.5=0.0 4.同理,月均用水量在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]的频率分 别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0. 02)=2××a,解得a=0.30,设中位数为x吨.因为前5组的频率之和为0.04+0. 08+0.15+0.21+0.25=0.73>0.5,前4组的频率之和为0.04+0.08+0.15+0.21=0. 48<0.5,所以2≤x×(x-2)=0.5-0.48,解得x=2.04. 答案 D

高三数学高考第一轮复习课件:概率与统计

高三数学高考第一轮复习课件:概率与统计

第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 双基固化
第69讲 │ 能力提升 能力提升
3.本部分内容主要包括随机变量的概念及其分布列,离 散型随机变量的均值和方差,正态分布.从近几年的高考观 察,这部分内容有加强命题的趋势.注意以实际情景为主, 建立合适的分布列,通过均值和方差解决实际问题.
第十一单元 │ 使用建议
使用建议
1.复习中要注意 (1)全面复习,加强基础,注重应用. (2)本单元主要的数学思使用想建有议:化归思想,比较分类思想, 极限思想和模型化思维方法.学习时应注意发散思维和逆向 思维,通过分类分步把复杂问题分解,恰当地应用集合观点、 整体思想,从全集、补集等入手,使问题简化.
第68讲│ 编读互动
第68讲 │ 知识要点 知识要点
第68讲 │ 知识要点
第68讲 │ 知识要点
第68讲 │ 双基固化 双基固化
第68讲 │68讲 │ 双基固化
第68讲 │ 双基固化
第68讲 │ 双基固化
第68讲 │ 双基固化
第68讲 │ 双基固化
第67讲 │ 双基固化
第67讲 │ 能力提升 能力提升
第67讲 │ 能力提升
第67讲 │ 能力提升
第67讲 │ 能力提升
第67讲 │ 能力提升
第67讲 │ 规律总结 规律总结
第67讲 │ 规律总结
第68讲 │ 离散型随机变量的期望与方差

高三数学第一轮复习讲义抽样方法总体分布的估计

高三数学第一轮复习讲义抽样方法总体分布的估计

城东蜊市阳光实验学校第76课时课题:抽样方法、总体分布的估计高三数学第一轮复习讲义〔76〕一.复习目的:抽样方法、总体分布的估计1.会用简单随机抽样法、系统抽样法、分层抽样法等常用方法从总体中抽取样本; 2.理解统计的根本思想,会用样本频率估计总体分布. 二.知识要点:1.〔1〕统计的根本思想是. 〔2〕平均数的概念. 〔3〕方差公式为. 2.常用的抽样方法是. 三.课前预习:1.某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后效劳等情况,记这项调查为②.那么完成①、②这两项调查宜采用的抽样方法依次是〔B 〕 ()A 分层抽样法,系统抽样法 ()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法()D 简单随机抽样法,分层抽样法2.样本方差由102211(5)10i i s x ==-∑,求得,那么1210x x x +++=50.3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n =,其标准差为y s ,那么以下关系正确的选项是〔B 〕()A 35y x s s =+()B 3y x s s =()C y x s =()D 5y x s =+4.某校为了理解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间是是的数据,结果用右侧的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间是是为〔B 〕()A 0.6小时()B 0.9小时 ()C 1.0小时()D 小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,那么x ,a ,b 之间的关系为4060100a bx +=.6.某校有教师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;从女学生中抽取的人数为80人,那么n=112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假设在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字一样,假设6m =,那么在第7组中抽取的号码是63.8.在样本的频率分布直方图中,一一共有11个小长方形,假设中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,那么中间一组的频数为32. 四.例题分析:例1.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都一样.解:〔1〕〔简单随机抽样〕可采用抽签法,将160人从1到160编号,然后从中抽取20个签,与签号一0.5 时间是是(小0 1.02.0样的20个人被选出.显然每个个体抽到的概率为2011608=. 〔2〕〔系统抽样法〕将160人从1到160编号,,按编号顺序分成20组,每组8人,先在第一组中用抽签法抽出k 号〔18k ≤≤〕,其余组的8k n +(1,2,3,19)n =也被抽到,显然每个个体抽到的概率为18. 〔3〕〔分层抽样法〕四类人员的人数比为3:4:1:2,又34206,2081010⨯=⨯= 12202,2041010⨯=⨯=,所以从中高级教师、一般教师、管理人员、行政人员中分别抽取6人、8人、2人、4人,每个个体抽到的概率为18.例2.质检部门对甲、乙两种日光灯的使用时间是是进展了破坏性试验,10次试验得到的两种日光灯的使用时间是是如下表所示,问:哪一种质量相对好一些?甲x =乙x ∵甲x 例3.下表给出了某120名12岁男生的身高统计分组与频数〔单位:cm 〕.〔1〕列出样本的频率分布表〔含累积频率〕; 〔2〕画出频率分布直方图;〔3〕根据累积频率分布,估计小于134的数据约占多少百分比.甲 乙解:〔1〕样本的频率分布表与累积频率表如下:122126130134138142146150154158身高〔cm〕五.课后作业:班级学号姓名1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤人员24人,为理解职工身体情况,要从中抽取一个容量为20的样本,如用分层抽样,那么管理人员应抽到多少个〔〕2.欲对某商场作一简要审计,通过检查发票及销售记录的2%来快速估计每月的销售总额.现采用如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…发票上的销售额组成一个调查样本.这种抽取样本的方法是〔〕()A 简单随机抽样()B 系统抽样()C 分层抽样()D 其它方式的抽样3.在抽查某产品的尺寸过程中,将其尺寸分成假设干组,[,]a b 是其中一组,抽查出的个体数在该组上的频率为m ,该组上的直方图的高为h ,那么||a b -等于〔〕()A hm ()B h m ()C mh()D 与,m h 无关 4.一个总体的个数为n ,用简单随机抽样的方法,抽取一个容量为2的样本,个体a 第一次未被抽到,个体a 第一次未被抽到第二次被抽到,以及整个过程中个体a 被抽到的概率分别是.5.某工厂消费A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n =.6.有一组数据:)(,,,,321321n n x x x x x x x x ≤≤≤≤ ,它们的算术平均值为10,假设去掉其中最大的n x ,余下数据的算术平均值为9;假设去掉其中最小的1x ,余下数据的算术平均值为11,那么1x 关于n 的表达式为;n x 关于n 的表达式为.7.为了比较甲、乙两位划艇运发动的成绩,在一样的条件下对他们进展了6次测验,测得他们的平均速度〔/m s 〕分别如下:甲:3.0 乙:试根据以上数据,判断他们谁更优秀.8.有一个容量为100的样本,数据的分组及各组的频数如下:〔1〕列出样本的频率分布表;〔2〕画出频率分布直方图;〔3〕估计数据小于30的概率.9.100名学生分四个兴趣小组参加物理、化学、数学、计算机竞赛辅导,人数别是30、27、23、20.〔1〕列出学生参加兴趣小组的频率分布表;〔2〕画出表示频率分布的条形图.。

高考数学真题 抽样方法与总体分布的估计

高考数学真题 抽样方法与总体分布的估计

11.4抽样方法与总体分布的估计考点一随机抽样1.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在[139,151]上的有4组,所以抽取4人,故选B.2.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师 1 800青年教师 1 600合计 4 300A.90B.100C.180D.300答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1600∶900=16∶9,可以得到样本中的老年教师的人数为916×320=180,故选C.3.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703 500=n3 500+1 500,解之得n=100.4.(2014湖南文,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案D在简单随机抽样、系统抽样和分层抽样中,每个个体被抽中的概率均为nN,所以p1=p2=p3,故选D. 评析随机抽样的要求是每个个体被抽中的概率相等,与具体的方法无关.5.(2014广东文,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C由系统抽样的定义知,分段间隔为1 00040=25.故答案为C.6.(2013课标Ⅰ理,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.评析本题考查了分层抽样,准确理解分层抽样的意义是解题关键.7.(2013江西理,4,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01答案D由题意知依次选取的编号为08,02,14,07,01,…(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.8.(2013陕西理,4,5分)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11B.12C.13D.14答案B因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.9.(2018课标Ⅲ文,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 . 答案 分层抽样解析 本题考查抽样方法.因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样.10.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为 . 答案 25解析 男生人数为900-400=500.设应抽取男生x 人,则由45900=x500得x=25.即应抽取男生25人. 11.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取 名学生. 答案 60 解析420×300=60(名). 12.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取 所学校,中学中抽取 所学校. 答案 18;9解析 应从小学中抽取150150+75+25×30=18(所).应从中学中抽取75150+75+25×30=9(所).评析 本题考查分层抽样及数据处理能力.13.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是 . 答案 12解析 男女运动员人数比例为5698-56=43, 分层抽样中男女人数比例不变,则女运动员人数为 28×37=12.故应抽取女运动员人数是12.评析本题考查分层抽样方法.考查学生运算求解能力.考点二用样本估计总体1.(2017课标Ⅲ理,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.()根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A本题考查统计,数据分析.观察2014年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.2.(2017山东文,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x=3.故选A.3.(2016山东理,3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.4.(2016课标Ⅲ理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月.故选D.5.(2015课标Ⅱ理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D 不正确.6.(2020课标Ⅲ文,3,5分)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A.0.01B.0.1C.1D.10答案 C 由已知条件可知样本数据x 1,x 2,…,x n 的平均数x =x 1+x 2+…+x nn,方差s 12=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=0.01,则数据10x 1,10x 2,…,10x n 的平均数为10x 1+10x 2+…+10x nn=10x .所以这组数据的方差s 22=1n [(10x 1-10x )2+(10x 2-10x )2+…+(10x n -10x )2]=100n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=100s 12=100×0.01=1,故选C.7.(2015安徽理,6,5分)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8B.15C.16D.32答案 C 设样本数据x 1,x 2,…,x 10的标准差为s,则s=8,可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s=16. 8.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A.x ,s 2+1002B.x +100,s 2+1002C.x ,s 2D.x +100,s 2答案 D 设增加工资后10位员工下月工资均值为x ',方差为s'2,则x '=110[(x 1+100)+(x 2+100)+…+(x 10+100)]=110(x 1+x 2+…+x 10)+100=x +100;方差s'2=110[(x 1+100-x ')2+(x 2+100-x ')2+…+(x 10+100-x ')2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2.故选D. 9.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2= . 答案165解析 记星期一到星期五收到的信件数分别为x 1,x 2,x 3,x 4,x 5,则x =x 1+x 2+x 3+x 4+x 55=10+6+8+5+65=7.∴s 2=15[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2+(x 5-x )2]=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165. 评析 本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属中等难度题.10.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .8 9 9 90 1 1答案 90解析 本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.方法总结 要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数的概念进行计算.11.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a= ;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 .答案(1)3(2)6 000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.12.(2014江苏,文6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm.答案24解析60×(0.015+0.025)×10=24(株).13.(2019课标Ⅱ文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:√74≈8.602.解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21. 产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100∑i=15n i (y i-y )2=1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结 利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.14.(2018课标Ⅰ文,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) 频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).易错警示利用频率分布直方图求众数、中位数与平均数时,应注意区分这三者,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.15.(2016北京文,17,13分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解析(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.(3分)所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.(5分)依题意,w至少定为3.(6分)(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[2,4](4,6](6,8](8,10](10,12](12,17](17,22](22,27]频率0.10.150.20.250.150.050.050.05(10分) 根据题意,该市居民该月的人均水费估计为:4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).(13分)思路分析第(1)问,需要计算该市居民月用水量在各区间上的频率,根据样本的频率分布直方图即可获解.第(2)问,由月用水量的频率分布直方图和w=3可计算居民该月用水费用的数据的分组与频率分布表,由此可估计该市居民该月的人均水费.评析本题考查了频率分布直方图及用样本估计总体,属中档题.16.(2015课标Ⅱ理,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地区4 683 5 136 46 4 26 2 4 5 5 6 8 8 6 4 37 3 3 4 6 9 9 28 6 5 18 3 2 1 7 5 5 29 1 3通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A2表示事件:“A 地区用户的满意度等级为非常满意”; C B1表示事件:“B 地区用户的满意度等级为不满意”; C B2表示事件:“B 地区用户的满意度等级为满意”, 则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2) =P(C B1C A1)+P(C B2C A2) =P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48. 17.(2015课标Ⅱ文,18,12分)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.B 地区用户满意度评分的频数分布表满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.18.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×2525+15+10+5=5(户).19.(2014课标Ⅰ文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.20.(2014课标Ⅱ文,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门49797665332110 98877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.评析本题考查利用茎叶图进行中位数,概率的相关计算,考查用样本的数字特征估计总体的数字特征,运用统计与概率的知识与方法解决实际问题的能力,考查数据处理能力及应用意识.21.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9[16,18)2 合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9. 故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a=频率组距=0.172=0.085. 课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b=频率组距=0.252=0.125. (3)样本中的100名学生该周课外阅读时间的平均数在第4组.22.(2013课标Ⅰ文,18,12分)为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析 (1)设A 药观测数据的平均数为x ,B 药观测数据的平均数为y ,由观测结果可得x =120×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, y =120×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得x >y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎2,3上,而B 药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A 药的疗效更好.评析 本题考查数据的平均数和茎叶图,考查数据的分析处理能力和应用意识.23.(2013安徽文,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1、x2,估计x1-x2的值.解析(1)设甲校高三年级学生总人数为n.由题意知,30n=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=5 6.(2)设甲、乙两校样本平均数分别为x'1、x'2,根据样本茎叶图可知,30(x'1-x'2)=30x'1-30x'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15. 因此x'1-x'2=0.5.故x1-x2的估计值为0.5分.评析本题考查随机抽样与茎叶图等统计学的基本知识,考查学生用样本估计总体的思想以及数据分析处理能力.24.(2020课标Ⅰ文,17,12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数40 20 20 20乙分厂产品等级的频数分布表等级 A B C D频数28 17 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解析(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40100=0.4;。

高考数学一轮复习学案抽样方法、总体分布的估计

高考数学一轮复习学案抽样方法、总体分布的估计

12.3 抽样方法、总体分布的估计一、知识梳理(一)抽样1.简单随机抽样:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时任一个体被抽到的概率为N1;在整个抽样过程中各个个体被抽到的概率为Nn; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 简单抽样常用方法:(1)抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N ),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多时优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.(2)随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k 当Nn(N为总体中的个体的个数,n 为样本容量)是整数时,k=N n ;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N '能被n 整除,这时k=N n'.③在第一段用简单随机抽样确定起始的个体编号l ④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l +k,第3个编号l +2k ,这样继续下去,直到获取整个样本)①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. ③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样(二)总体分布1.总体:在数理统计中,通常把被研究的对象的全体叫做总体.2.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.3.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.4.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.0.5 时间(小时) 0 1.0 1.5 2.0二、基础训练1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是CA.310C 3B.89103⨯⨯C.103 D.101 2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为BA.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一个年级有12个班,每个班有50名同学,随机编号为1~50号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是DA.分层抽样法B.抽签法C.随机数表法D.系统抽样法4.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100 解析:这个问题我们研究的是运动员的年龄情况.因此应选D. 答案:D5.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为A.640B.320C.240D.160解析:∵n40=0.125,∴n =320.故选B.答案:B6.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是___________.解析:要研究的总体里各部分情况差异较大,因此用分层抽样. 答案:分层抽样那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).解析:由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18.分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47三、例题剖析【例1】 (2004年湖南,5)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法剖析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B. 答案:B评述:采用什么样的抽样方法要依据研究的总体中的个体情况来定.【例2】 (2004年福建,15)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 小组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽取的号码是___________.剖析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.∵m =6,k =7,m +k =13,∴在第7小组中抽取的号码是63. 答案:63评述:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.【例3】 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.剖析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21.∴a 1=1,q =4.∴后三组频数最高的一组的频数为16.答案:16评述:此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.剖析:通过本题可掌握总体分布估计的各种方法和步骤.(2)频率分布直方图如下:(h ) 1.0.0.0.0.(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.评述:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.【例5】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.【例6】一个容量为100的样本,数据的分组和各组的一些相关信息如下:(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒〒 四、同步练习 g3.1099 抽样方法、总体分布的估计1.某公司甲、乙、丙、丁四个地区分别有150 个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是 ( B )()A 分层抽样法,系统抽样法()B 分层抽样法,简单随机抽样法 ()C 系统抽样法,分层抽样法 ()D 简单随机抽样法,分层抽样法2.已知样本方差由102211(5)10i i s x ==-∑,求得,则1210x x x +++= 50 . 3.设有n 个样本12,,,n x x x ,其标准差为x s ,另有n 个样本12,,,n y y y ,且35k k y x =+(1,2,,)k n = ,其标准差为y s ,则下列关系正确的是 ( B )()A 35y x s s =+ ()B 3y x s s =()C y x s = ()D 5y x s =+时间(小时)4.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右侧的条形图表示. 根据条形图可得这50名学生这一天平均每人的课外阅读时间为 ( B ) ()A 0.6小时 ()B 0.9小时()C 1.0小时 ()D 1.5小时5.x 是12100,,x x x 的平均数,a 是1240,,x x x 的平均数,b 是4142100,,x x x 的平均数,则x ,a ,b 之间的关系为4060100a bx +=.6.某校有老师200人,男学生1200人,女学生1000人.现用分层抽样的方法从所有师生中抽取一个容量为n 的样本;已知从女学生中抽取的人数为80人,则n =112.7.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小 组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 63 .8.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积之和的14,且样本容量为160,则中间一组的频数为 32 . 9.某中学有员工160人,其中中高级教师48人,一般教师64人,管理人员16人,行政人员32人,从中抽取容量为20的一个样本.以此例说明,无论使用三种常用的抽样方法中的哪一种方法,总体中的每个个体抽到的概率都相同.10. 现有30个零件,需从中抽取10个进行检查,问如何采用简单随机抽样得到一个容量为10的样本?11.质检部门对甲、乙两种日光灯的使用时间进行了破坏性试验,10次试验得到的两 种日光灯的使用时间如下表所示,问:哪一种质量相对好一些?(2)画出频率分布直方图;(3)根据累积频率分布,估计小于134的数据约占多少百分比.13.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件。

2015届高三数学一轮课件:10.4 随机抽样、用样本估计总体

2015届高三数学一轮课件:10.4 随机抽样、用样本估计总体

频率
,数据落在各小组内的频率用各
组距
小长方形的面积表示,各小长方形的面积总和等于 1.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折
线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率
分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体分布的
密度曲线,它能够更加精细地反映出总体在各个范围内取值的百分比.
抽取了 6 名,则在高二年级的学生中应抽取的人数为(
A.6
B.8
C.10
D.12
)
答案:B
解析:分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽
取的学生数为
基础梳理
30
n,则
40
=
6
,得
n
n=8.
自我检测
第十页,编辑于星期五:八点 三十六分。
第4讲 随机抽样、用样本估计总体
自我检测
1
2
号为 1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.
抽到的 32 人中,编号落入区间[1,450]的人做问卷 A,编号落入区间[451,750]
的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为(
)
A.7
B.9
C.10
D.15
答案:C
解析:由题意可得,抽样间隔为 30,区间[451,750]恰好为 10 个完整的组,所以
它们各自的特点.
4.理解样本数据标准差的意义和作用,会计算
数据标准差.
5.能从样本数据中提取基本的数字特征(如平
均数、标准差),并给出合理的解释.
6.会用样本的频率分布估计总体分布,会用样
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

14
学Hale Waihona Puke 导航文数(1)求分数在[70,80)内的频率,并补全这个频率分布 直方图; (2)统计方法中,同一组数据常用该组区间的中点值作 为代表,据此估计本次考试中的平均分.
15
学海导航
文数
解析: 利用各小长方形的面积和等于 1 求[70,80)内的 频率. (1)设分数在[70,80)内的频率为 x,根据频率分布直方 图,有 (0.010+0.015×2+ 0.025 + 0.005)×10+ x= 1 ,可 得 x=0.3,所以频率分布直方图如图所示.
20
学海导航
文数

抽样方法及实际应用
【例 2】某市电视台在因特网上征集电视节目的现场参
与观众,报名的共有 12000 人,分别来自 4 个城区,其中东 城区 2400 人, 西城区 4600 人, 南城区 3800 人, 北城区 1200 人,从中抽取 60 人参加现场节目,应当如何抽取?
21
学海导航
9
学海导航
文数
解析:因为甲组数据的中位数为 15,由茎叶图可得 x=5, 9+15+10+y+18+24 因乙组数据的平均数为 16.8 ,则 = 5 16.8,解得 y=8,故选 C.
10
学海导航
文数
5.若数据 x1,x2,x3,„,xn 的平均数为 10,方差为 8.5 ,则数据 3x1+5,3x2 +5,3x3+5,„,3xn+5 的平均数 为 ,方差为 .
2
+(72-75)2+(90-75)2]=49, 所以标准差 s=7.
19
学海导航
文数
(2)从前 5 位同学中随机选取 2 位同学,共有 10 种结 果,恰有一位同学的成绩在 (68,75)中有 (70,76), (76,72), 4 (76,70),(76,72)共 4 种结果,故所求概率为 P= =0.4. 10
文数
解析:因为 60∶12000=1∶200, 2400 4600 所以 =12, =23, 200 200 3800 1200 =19, =6. 200 200 故从东城区中抽取 12 人,从西城区中抽取 23 人,从南城区 中抽取 19 人,从北城区中抽取 6 人.
22
学海导航
文数
【拓展演练2】 一个总体分为A,B两层,用分层抽样的 方法从总体中抽取一个容量为10的样本.已知B层中每个个 1 体被抽到的概率都为12,则总体中的个体数为 .
学海导航
文数
第66讲
抽样方法与总体分布的估计
1
学海导航
文数
2
学海导航
文数
1.现要从已编号(1~50)的 50 枚最新研制的某型号导弹 中随机抽取 5 枚进行发射试验,则采取系统抽样的方法确定 选取的 5 枚导弹的编号可能是( D ) A.5,10,15,20,25 C.2,4,8,16,32 B.1,2,3,4,5 D.3,13,23,33,43
16
学海导航
文数
(2) 平均分为: - x = 45×0.1 + 55×0.15 + 65×0.15 + 75×0.3+85×0.25+95×0.05=71(分).
17
学海导航
文数
【拓展演练1】在某次测验中,有6位同学的平均成绩 为75分.用xn表示编号为n(n=1,2,„,6)的同学所得成 绩,且前5位同学的成绩如下:
23
学海导航
文数
1 解析:分层抽样是等概率抽样,故总体的个体数为10÷12 =120.
24
学海导航
文数

直方图、茎叶图的应用
11
学海导航
文数
解析: 由已知, 3x1+5,3x2+5, „, 3xn+5 的平均数为 3×10 +5=35,方差为 32×8.5=76.5.
12
学海导航
文数
13
学海导航
文数

用样本估计总体
【例1】某校从参加高一年级期中考试的学生中随机抽
出60名学生,将其物理成绩(均为整数)分成六段[40,50), [50,60),„,[90,100]后得到如图所示的频率分布直方图, 观察图形的信息,回答下列问题:
3
学海导航
文数
解析:由题设,共分 5 个系统,每个系统 10 个个体,第 1 个系统的号码是 1,2,3,4,5,6,7,8,9,10.若在其中抽取的号码为 n0, 则第 k 个系统应抽的号码是(k-1)×10+n0, 其中 1≤k≤5. 由此可知应选 D.
4
学海导航
文数
2.为了解某地区的中小学生视力情况,拟从该地区的 中小学生中抽取部分学生进行调查,事先已了解到该地区 小学、初中、高中三个学段学生的视力情况有较大差异, 而男女生视力情况差异不大,在下面的抽样方法中,最合 理的抽样方法是( C ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样
(1)求第6位同学的成绩x6,以及这6位同学成绩的标准 差s; (2)从前5位同学中,随机地选2位同学,求恰有1位同 学成绩在区间(68,75)中的概率.
18
学海导航
文数
解析:(1)因为这 6 位同学的平均成绩为 75 分, 1 所以 (70+76+72+70+72+x6)=75, 6 所以 x6=90, 即第 6 位同学的成绩为 90 分, 这 6 位同学成绩的方差为 1 s = ×[(70 - 75)2 + (76 - 75)2 + (72 - 75)2 + (70 - 75)2 6
7
学海导航
文数
解析:由题图可知,车速大于或等于 70 km/h 的汽车的频 率为 0.02×10 = 0.2 ,则将被处罚的汽车大约有 200×0.2 = 40(辆).
8
学海导航
文数
4.右边茎叶图记录了甲、乙两组各五名学生在一次英 语听力测试中的成绩(单位:分).已知甲组数据的中位数 为15,乙组数据的平均数为16.8,则x,y的值分别为 ( C ) A.2,5 B.5,5 C.5,8 D.8,8
5
学海导航
文数
解析:因该地区小学、初中、高中三个学段学生的视力情 况有较大差异,故最合理的抽样方法是按学段分层抽样,故选 C.
6
学海导航
文数
3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车 视为“超速”,并将受到处罚,如图是某路段的一个检测点 对200辆汽车的车速进行检测所得结果的频率分布直方图,则 从图中可以看出被处罚的汽车大约有( B ) A.30辆 B.40辆 C.60辆 D.80辆
相关文档
最新文档