人教版高中数学必修二《第九章 统计》单元导学案及答案
高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)
高中数学:第二册第九章:变量间的相关关系一、基础知识梳理1.变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.3.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数.经数学上的推导,,a b 的值由下列公式给出:1122211()()()nni i i ii i nni i i i x x y y x y nx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+.上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x与y 的相关系数()()niix x y y r --=∑,即ni ix y nx yr -=∑,通常用r 来衡量x 与y 之间的线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.习题参考答案: 1.随机性2.(1)正相关 (2)负相关3.(1)一条直线 线性相关关系 (2)最小二乘法二、重点知识梳理b 的公式或混淆b 的位置1.回归方程的求解(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)画出散点图;(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.【解析】(1)画出散点图如图所示:(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得552114,5,112.3,90i ii i i x y x yx ======∑∑,由公式可得2112.3545 1.23,5 1.ˆ2340.089054ˆba y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.2.回归直线的理解及其应用在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就A .增加0.9个单位B .减少0.9个单位C .增加1个单位D .减少1个单位【答案】B【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:(1)求y 关于x 的线性回归方程y bx a =+;(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?参考公式:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.弄错回归方程中a ,b 的位置【例4】某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=,1(7865716461)67.85y =⨯++++=, 518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174ii x==++++=∑,所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x y x ybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65yx =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=, 1(7865716461)67.85y =⨯++++=,518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174i i x ==++++=∑, 所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x yxybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5yx =+.三、习题强化训练1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④C .③④⑤D .②④⑤3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力D .人的年龄与体重5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2D .y ^=-1.5x -26.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^A .不能小于0B .不能大于0C .不能等于0D .只能小于014.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,线性回归方程ˆy=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.16.某工厂对某种产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所示:年份中的x 0 1 2 3 4 人口总数y5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧=bx +a ; (3)据此估计2019年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)参考公式:线性回归方程为y bx a =+,其中()()()1122211n ni i i i i i n n i i i i x x y y x y nxy b x x x nx====---==--∑∑∑∑.习题参考答案:6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】310.【答案】④14.【答案】83%15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。
2020-2021学年新教材高中数学 第9章 统计章末综合提升学案(含解析)新人教A版必修第二册
9.3 统计案例公司员工的肥胖情况调查分析(略)[巩固层·知识整合][提升层·题型探究]随机抽样方法的应用【例1】某县共有5个乡镇,人口3万人,其人口比例为3∶ 2∶ 5∶ 2∶ 3,从3万人中抽取一个容量为300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.[解] 因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用比例分配分层随机抽样的方法.具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本量的比例求得各乡镇应抽取的人数分别为60人、40人、100人、40人、60人.(3)按照各层抽取的人数随机抽取各乡镇应抽取的样本.(4)将300人合到一起,即得到一个样本.[跟进训练]1.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层随机抽样的方法从全体师生中抽取一个容量为n的样本,若女学生一共抽取了80人,则n的值为( ) A.193 B.192C.191 D.190B[1 000×n200+1 200+1 000=80,求得n=192.]频率分布直方图及应用【例2】某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:[107,109),3株;[109,111), 9株;[111,113),13株;[113,115),16株;[115,117),26株;[117,119),20株;[119,121),7株;[121,123),4株;[123,125],2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在[109,121)范围内的可能性是百分之几?[解]分组频数频率累积频率[107,109)30.030.03[109,111)90.090.12[111,113)130.130.25[113,115)160.160.41[115,117)260.260.67[117,119)200.200.87[119,121)70.070.94[121,123)40.040.98[123,125]20.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在[109,121)范围内的频率为:0.94-0.03=0.91,即数据落在[109,121)范围内的可能性是91%.在本例中由得到的频率分布直方图估计树苗的高度(cm)的平均数.[解] 由频率分布直方图可得树苗的高度(cm)的平均数的估计值为0.03×108+0.09×110+0.13×112+0.16×114+0.26×116+0.20×118+0.07×120+0.04×122+0.02×124=115.46(cm)用样本估计总体分布的方法1用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.2借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.数据的集中趋势和离散程度的估计【例3】甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82 81 79 78 95 88 93 84;乙:92 95 80 75 83 80 90 85.(1)求甲成绩的80%分位数;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.[解] (1)把甲的成绩按照从小到大的顺序排列可得:78 79 81 82 84 88 93 95因为一共有8个数据,所以8×80%=6.4,不是整数,所以甲成绩的80%分位数是第7个数据93.(2)x -甲=18(78+79+81+82+84+88+93+95)=85,x -乙=18(75+80+80+83+85+90+92+95)=85.s 2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,∵x 甲=x 乙,s 2甲<s 2乙,∴甲的成绩较稳定,派甲参赛比较合适.用样本的数字特征估计总体的方法为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用x -表示;标准差是反映样本数据离散程度大小的最常用统计量,其计算公式是s =1n[x 1-x-2+x 2-x-2+…+x n -x-2].[跟进训练]2.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )分数 54321人数20 10 30 30 10A .3B .2105C .3D .85B [∵x -=100+40+90+60+10100=3,∴s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]=1100(20×22+10×12+30×12+10×22)=160100=85⇒s =2105.] [培优层·素养升华]【典例】为了保护学生视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须更换前使用的天数如下:天数[150,180)[180,210)[210,240)[240,270)[270,300)[300,330)[330,360)[360,390] 灯管数111182025167 2(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换比较合适?[解] (1)各组组中值分别为165,195,225,255,285,315,345,375,由此可算得平均数约为165×1%+195×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天).故估计这种日光灯的平均使用寿命约为268天.(2)方差为1100×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2+25×(285-268)2+16×(315-268)2+7×(345-268)2+2×(375-268)2]=2 128.60.故标准差为 2 128.60≈46.故标准差约为46,268-46=222(天),268+46=314(天),所以这100只日光灯的使用寿命大部分落在222~314天之间,故可在第222天到第314天内统一更换较合适.平均数和标准差是工业生产中监测产品质量的重要指标,当样本的平均数或标准差超过了规定界限时,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题,本题主要考查了数据分析的核心素养.[素养提升练]从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数62638228(1)根据上表作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?[解] (1)产品质量指标的频率分布直方图如图.(2)质量指标值的样本平均数为80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(80-100)2×0.06+(90-100)2×0.26+(100-100)2×0.38+(110-100)2×0.22+(120-100)2×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。
(新教材)人教A版高中数学必修第二册学案 统计导学案含配套练习及答案
9.1随机抽样考点学习目标核心素养抽样调查理解全面调查、抽样调查、总体、个体、样本、样本量、样本数据等概念数学抽象简单随机抽样理解简单随机抽样的概念,掌握简单随机抽样的两种方法:抽签法和随机数法数学抽象、逻辑推理分层随机抽样理解分层随机抽样的概念,并会解决相关问题数学抽象、逻辑推理问题导学预习教材P173-P187的内容,思考以下问题:1.全面调查、抽样调查、总体、个体、样本、样本量、样本数据的概念是什么?2.什么叫简单随机抽样?3.最常用的简单随机抽样方法有哪两种?4.抽签法是如何操作的?5.随机数法是如何操作的?6.什么叫分层随机抽样?7.分层随机抽样适用于什么情况?8.分层随机抽样时,每个个体被抽到的机会是相等的吗?9.获取数据的途径有哪些?1.全面调查与抽样调查(1)对每一个调查对象都进行调查的方法,称为全面调查,又称普查W.(2)在一个调查中,我们把调查对象的全体称为总体,组成总体的每一个调查对象称为个体W.(3)根据一定的目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查W.(4)把从总体中抽取的那部分个体称为样本W. (5)样本中包含的个体数称为样本量W.(6)调查样本获得的变量值称为样本的观测数据,简称样本数据. 2.简单随机抽样(1)有放回简单随机抽样一般地,设一个总体含有N (N 为正整数)个个体,从中逐个抽取n (1≤n <N )个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.(2)不放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.(3)简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样. (4)简单随机样本通过简单随机抽样获得的样本称为简单随机样本. (5)简单随机抽样的常用方法实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.■名师点拨 (1)从总体中,逐个不放回地随机抽取n 个个体作为样本,一次性批量随机抽取n 个个体作为样本,两种方法是等价的.(2)简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样的公平性.3.总体平均数与样本平均数 (1)总体平均数①一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称Y -=Y 1+Y 2+…+Y N N =1N ∑Ni =1Y i为总体均值,又称总体平均数.②如果总体的N 个变量值中,不同的值共有k (k ≤N )个,不妨记为Y 1,Y 2,…,Y k ,其中Y i 出现的频数f i (i =1,2,…,k ),则总体均值还可以写成加权平均数的形式Y -=1N ∑ki =1f i Yi W.(2)样本平均数如果从总体中抽取一个容量为n 的样本,它们的变量值分别为y 1,y 2,…,y n ,则称y -=y 1+y 2+…+y n n =1n ∑ni =1y i 为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数y -去估计总体平均数Y -.4.分层随机抽样 (1)分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层W.(2)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.5.分层随机抽样中的总体平均数与样本平均数(1)在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M 和N ,抽取的样本量分别为m 和n .我们用X 1,X 2,…,X M 表示第1层各个个体的变量值,用x 1,x 2,…,x m 表示第1层样本的各个个体的变量值;用Y 1,Y 2,…,Y N 表示第2层各个个体的变量值,用y 1,y 2,…,y n 表示第2层样本的各个个体的变量值,则:①第1层的总体平均数和样本平均数分别为X -=X 1+X 2+…+X M M =1M ∑Mi =1X i ,x -=x 1+x 2+…+x m m =1m ∑mi =1x i.②第2层的总体平均数和样本平均数分别为Y -Y 1+Y 2+…+Y N N 1N ∑Ni =1Y i,y -=y 1+y 2+…+y n n =1n ∑ni =1y i.③总体平均数和样本平均数分别为W -=∑Mi =1X i +∑Ni =1Y i M +N ,w -=∑mi =1x i +∑ni =1yim +nW.(2)由于用第1层的样本平均数x -可以估计第1层的总体平均数X -,用第2层的样本平均数y -可以估计第2层的总体平均数Y -.因此我们可以用M ×x -+N ×y -M +N =M M +N x -+N M +N y-估计总体平均数W -.(3)在比例分配的分层随机抽样中,m M =n N =m +n M +N ,可得M M +N x -+N M +N y -=m m +n x -+n m +n y -=w -.因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数w -估计总体平均数W -.6.获取数据的途径获取数据的基本途径有:(1)通过调查获取数据;(2)通过试验获取数据;(3)通过观察获取数据;(4)通过查询获取数据判断(正确的打“√”,错误的打“×”) (1)高考考生的身体检查,是抽样调查.( )(2)某养鱼专业户要了解鱼塘中鱼的平均质量,是抽样调查.( ) (3)在简单随机抽样中,一次可以抽取多个个体.( ) (4)抽签法和随机数法都是简单随机抽样.( )(5)无论是抽签法还是随机数法,每一个个体被抽到的机会都是均等的.( ) (6)在分层随机抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.( )答案:(1)× (2)√ (3)× (4)√ (5)√ (6)× 抽签法中确保样本代表性的关键是( ) A.制签 B.搅拌均匀 C.逐一抽取D.抽取不放回解析:选B.逐一抽取、抽取不放回是简单随机抽样的特点,但不是确保代表性的关键,一次抽取与有放回抽取(个体被重复取出可不算再放回)也不影响样本的代表性,制签也一样.为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( ) A.每层等可能抽取 B.每层抽取的个体数相等C.每层抽取的个体数可以不一样多,但必须满足抽取n i =n ·N iN (i =1,2,…,k )个个体(其中i 是层的序号,k 是总层数,n 为抽取的样本容量,N i 是第i 层中的个体数,N 是总体容量)D.只要抽取的样本容量一定,每层抽取的个体数没有限制解析:选C.分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样. A 中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A 不正确; B 中,由于每层的个体数不一定相等,每层抽取同样多的个体数,显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B 也不正确;C 中,对于第i 层的每个个体,它被抽到的可能性与层数i 无关,即对于每个个体来说,被抽取为样本的可能性是相同的,故C 正确;D 显然不正确.从一批零件中抽取10个,测得它们的长度(单位:cm )如下: 22.36 22.35 22.33 22.35 22.37 22.34 22.3822.36 22.32 22.35由此估计这批零件的平均长度. 在此统计活动中:(1)总体为 ; (2)个体为 ; (3)样本为 ; (4)样本量为 W.答案:(1)这批零件的长度 (2)每个零件的长度 (3)抽取的10个零件的长度 (4)10一个班共有54人,其中男同学、女同学之比为5∶4,若抽取9人参加教改调查会,则每个男同学被抽取的可能性为 ,每个女同学被抽取的可能性为 W.解析:男、女每人被抽取的可能性是相同的,因为男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16 16总体、样本等概念辨析题为了调查参加运动会的1 000名运动员的平均年龄,从中抽取了100名运动员进行调查,下面说法正确的是( )A.1 000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本量是100【解析】 根据调查的目的可知,总体是这1 000名运动员的年龄,个体是每个运动员的年龄,样本是抽取的100名运动员的年龄,样本量为100.故答案为D.【答案】 D此类题目要正确理解总体与个体的概念,要弄明白概念的实质,并注意样本与样本容量的不同,其中样本量为数目,无单位.为了了解全年级240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是()A.总体是240B.个体是每一个学生C.样本容量是40名学生D.样本量为40解析:选D.本题调查的对象是“学生的身高”这一项指标,故A、B不正确.而样本量是数量,故C不正确.由此可见,研究此类问题首先要弄清楚所要调查的对象是什么.简单随机抽样的概念下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)仓库中有1万支奥运火炬,从中一次抽取100支火炬进行质量检查;(3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作.【解】(1)不是简单随机抽样.因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.(3)不是简单随机抽样.因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.要判断所给的抽样方法是否为简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点.下面的抽样方法是简单随机抽样吗?为什么?(1)某工厂的质检员从一袋30个螺母中一次性取出5个进行质量检测;(2)某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品;(3)某班级有4个小组,每组共有12个同学.班主任指定每组坐在第一张桌子的8位同学为班干部;(4)中国福利彩票30选7,得到7个彩票中奖号码.解:简单随机抽样要求:被抽取的样本的总体个数确定且较少,抽取样本时要求逐个抽取,每个个体被抽取的可能性一样.所以(1)不是,因为是一次性抽取不是逐个抽取;(2)不是,被抽取的样本的总体个数不确定;(3)不是,班主任的指定不能保证班级里的每一个学生被抽取的可能性一样;(4)是,它属于简单随机抽样中的随机数法.抽签法及随机数法的应用某班有50名学生,要从中随机地抽出6人参加一项活动,请分别写出利用抽签法和随机数法抽取该样本的过程.【解】(1)利用抽签法步骤如下:第一步:将这50名学生编号,编号为01,02,03, (50)第二步:将50个号码分别写在纸条上,并揉成团,制成号签.第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.第四步:从容器中逐一抽取6个号签,并记录上面的号码.对应上面6个号码的学生就是参加该项活动的学生.(2)利用随机数法步骤如下:第一步:将这50名学生编号,编号为1,2,3, (50)第二步:用随机数工具产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本.第三步:重复第二步的过程,直到抽足样本所需人数.对应上面6个号码的学生就是参加该项活动的学生.(1)利用抽签法抽取样本时应注意以下问题:①编号时,如果已有编号(如学号、标号等)可不必重新编号.(例如该题中50名同学,可以直接利用学号)②号签要求大小、形状完全相同.③号签要搅拌均匀.④抽取号签时要逐一、不放回抽取.(2)利用随机数法抽取样本时应注意的问题:如果生成的随机数有重复,即同一编号被多次抽到,应剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需的人数.从20架钢琴中抽取5架进行质量检查,请选用合适的方法确定这5架钢琴.解:第一步,将20架钢琴编号,号码是0,1, (19)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,所得号码对应的5架钢琴就是要抽取的对象.分层随机抽样中的有关计算(1)某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工的人数为 W.(2)某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:高一年级高二年级高三年级泥塑 a b c 剪纸xyz其中x ∶y ∶z =5∶3∶2,且“泥塑”社团的人数占两个社团总人数的35,为了了解学生对两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取 人.【解析】 (1)设该单位老年职工人数为x ,由题意得3x =430-160,解得x =90.则样本中的老年职工人数为90×32160=18. (2)法一:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以“剪纸”社团的人数为800×25=320;因为“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以“剪纸”社团中高二年级人数为320×310=96.由题意知,抽样比为50800=116,所以从高二年级“剪纸”社团中抽取的人数为96×116=6.法二:因为“泥塑”社团的人数占总人数的35,故“剪纸”社团的人数占总人数的25,所以抽取的50人的样本中,“剪纸”社团中的人数为50×25=20.又“剪纸”社团中高二年级人数比例为y x +y +z =32+3+5=310,所以从高二年级“剪纸”社团中抽取的人数为20×310=6.【答案】 (1)18 (2)6分层随机抽样中有关计算的方法(1)抽样比=该层样本量n 总样本量N =该层抽取的个体数该层的个体数.(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.对于分层抽样中求某层个体数,或某层要抽取的样本个体数,都可以通过上面两个等量关系求解.1.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层随机抽样的方法抽取12个城市,则应抽取的中型城市数为( )A.3B.4C.5D.6解析:选 B.根据分层随机抽样的特点可知,抽样比为1248=14,则应抽取的中型城市数为16×14=4.2.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层随机抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工 人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10样本平均数的求法(1)甲在本次飞镖游戏中的成绩为8,6,7,7,8,10,9,8,7,8.求甲在本次游戏中的平均成绩.(2)在了解全校学生每年平均阅读多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值.【解】 (1)甲在本次游戏中的平均成绩为6+3×7+4×8+9+1010=7.8.(2)合在一起后的样本均值为10×5+8×610+8=50+4818=499.在分层随机抽样中,如果第一层的样本量为m ,平均值为x ;第二层的样本量为n ,平均值为y ,则样本的平均值为mx +nym +n.某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位:h ),数据如下.甲 6 6.5 7 7.5 8 乙 6 7 8 9 10 11 12 丙34.567.5910.51213.5(1(2)估计这个学校高一的学生中,一周的锻炼时间超过10个小时的百分比; (3)估计这个学校高一年级学生一周的平均锻炼时间.解:(1)由题干中的表格可知,按分层随机抽样的方法从甲、乙、丙3个班中分别抽取5个,7个,8个学生.故三个班学生人数之比为5∶7∶8.(2)由题意知,抽取的20个学生中,一周的锻炼时间超过10小时的有5人,故一周的锻炼时间超过10个小时的百分比为520=25%.(3)从甲班抽取的5名学生的总时间为6+6.5+7+7.5+8=35. 从乙班抽取的7名学生的总时间为6+7+8+9+10+11+12=63.从丙班抽取的8名学生的总时间为3+4.5+6+7.5+9+10.5+12+13.5=66. 则35+63+665+7+8=16420=8.2. 即这个学校高一年级学生一周的平均锻炼时间为8.2小时.1.在简单随机抽样中,每一个个体被抽中的可能性( ) A.与第几次抽样有关,第一次抽中的可能性要大些 B.与第几次抽样无关,每次抽中的可能性都相等 C.与第几次抽样有关,最后一次抽中的可能性要大些 D.每个个体被抽中的可能性无法确定解析:选B.在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关. 2.若对某校1 200名学生的耐力做调查,抽取其中120名学生,测试他们1 500米跑的成绩,得出相应的数值,在这项调查中,样本是指( )A.120名学生B.1 200名学生C.120名学生的成绩D.1 200名学生的成绩解析:选C.本题抽取的是120名学生的成绩,因此每个学生的成绩是个体,这120名学生的成绩构成一个样本.3.(2019·广西钦州市期末考试)某中学共有1 000名学生,其中高一年级350人,该校为了了解本校学生视力情况,用分层随机抽样的方法从该校学生中抽出一个容量为100的样本进行调查,则应从高一年级抽取的人数为( )A.20B.25C.30D.35解析:选D.高一年级抽取的人数为3501 000×100=35.故选D.4.在调查某中学的学生身高时,利用分层抽样的方法抽取男生20人,女生15人,得到了男生身高的平均值为170,女生身高的平均值为165.试估计该中学所有学生的平均身高是多少?解:20×170+15×16520+15=5 87535=16767.即该中学所有学生的平均身高为16767.[A 基础达标]1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析,在这个问题中,5 000名居民的阅读时间的全体是( )A.总体B.个体C.样本量D.从总体中抽取的一个样本解析:选A.根据题意,结合总体、样本、个体、样本量的定义可知,5 000名居民的阅读时间的全体是总体.2.下列调查的样本合理的是( )①在校内发出一千张印有全校各班级的选票,要求被调查学生在其中一个班级旁画“√”,以了解最受欢迎的教师是谁;②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任情况;③到老年公寓进行调查,了解全市老年人的健康状况;④为了了解全班同学每天的睡眠时间,在每个小组中各随机抽取3名学生进行调查. A.①② B.②④ C.①④D.③④解析:选B.①中样本不具有代表性、有效性,在班级前画“√”与了解最受欢迎的老师没有关系;③中样本缺乏代表性;而②④是合理的样本.3.从一群玩游戏的小孩中随机抽出k 人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m 人,发现其中有n 个小孩曾分过苹果,估计参加游戏的小孩的人数为( )A.knm B.k +m -n C.km nD.不能估计解析:选C.设参加游戏的小孩有x 人,则k x =n m ,x =kmn.4.(2019·河北省枣强中学期末考试)某中学高二年级共有学生2 400人,为了解他们的身体状况,用分层随机抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生为( )A.1 260人B.1 230人C.1 200人D.1 140人解析:选D.设女生总人数为x 人,由分层随机抽样的方法,可得抽取女生人数为80-42=38(人),所以802 400=38x,解得x =1 140.故选D.5.(2019·河北省石家庄市期末考试)某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中取一个容量为36的样本,则老年人、中年人、青年人依次抽取的人数是( )A.7,11,19B.7,12,17C.6,13,17D.6,12,18解析:选D.由题意,老年人27人,中年人54人,青年人81人的比例为1∶2∶3,所以抽取人数:老年人:16×36=6,中年人:26×36=12,青年人:36×36=18.故选D.6.为了考察某地6月份最高气温的情况,随机抽取了5天,所得数据约为29,29,31,30,31,则该地6月份最高气温的平均值约为 W.解析:29+29+31×2+305=30.答案:307.(2019·四川省遂宁市期末考试)已知某地区中小学生人数如图所示,用分层随机抽样的方法抽取200名学生进行调查,则抽取的高中生人数为 W.解析:用分层随机抽样的方法抽取200名学生进行调查,则抽取的高中生人数为200× 2 0003 500+2 000+4 500=40.答案:408.(2019·福建省三明市期末质量检测)某校为了解学生的身体素质情况,采用按年级分层随机抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k ∶5∶4,抽取的样本中高一学生为120人,则k 的值为 W.解析:由题意可得,120300=k k +5+4,解得k =6.答案:69.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.解:第一步:先确定艺人:(1)将30名内地艺人从1到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透明的箱子中摇匀,从中抽出10个号签,则相应编号的艺人参加演出.(2)运用相同的办法分别从10名台湾艺人中抽取4人,从18名香港艺人中抽取6人.第二步:确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1到20这20个数字,代表演出的顺序,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出顺序,再汇总即可.10.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各岗位中的人数情况如下表所示:管理 技术开发 营销 生产 合计 老年 40 40 40 80 200 中年 80 120 160 240 600 青年 40 160 280 720 1 200 合计1603204801 0402 000(1(2)若要开一个有25人参与的讨论单位发展与薪金调整方案的座谈会,则应怎样抽选出席人?解:(1)用分层随机抽样法,并按老年职工4人,中年职工12人,青年职工24人抽取. (2)用分层随机抽样法,并按管理岗位2人,技术开发岗位4人,营销岗位6人,生产岗位13人抽取.[B 能力提升]11.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A.4B.5C.6D.7解析:选C.四类食品的种数比为4∶1∶3∶2,则抽取的植物油类的种数为20×110=2,抽取的果蔬类的种数为20×210=4,二者之和为6种,故选C. 12.(2019·湖南省张家界市期末)我国古代数学算经十书之一的《九章算术》中有一“衰分”问题“今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣 人”.解析:今有北乡八千七百五十人,西乡七千二百五十人,南乡八千三百五十人,凡三乡,发役四百八十七人,则西乡遣487×7 2508 750+7 250+8 350=145(人).答案:14513.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作为样本.若用分层随机抽样法,则应从40岁以下年龄段的职工中抽取 名.解析:由题意知,40岁以下年龄段的职工人数为200×50%=100.若用分层随机抽样法,则应从40岁以下年龄段的职工中抽取40200×100=20(名).答案:2014.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.。
新教材2023版高中数学第九章统计获取数据的途径学案新人教A版必修第二册
9.1.2 分层随机抽样9.1.3 获取数据的途径课程标准1.理解分层随机抽样的概念;掌握各层样本量比例分配的方法.2.了解获取数据的一些基本途径.新知初探·课前预习——突出基础性教材要点要点一分层随机抽样一般地,按______________变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行________,再把所有子总体中抽取的样本合在一起作为________,这样的抽样方法称为分层随机抽样.(1)每一个子总体称为________,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为________.(2)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为x̅,y̅,两层的总体平均数分别为X̅,Y̅,总体平均数为W̅,样本平均数为w̅.则w̅=__________x̅+__________y̅.W̅=__________X̅+__________Y̅.(3)在比例分配的分层随机抽样中,可以直接用样本平均数w̅估计总体平均数W̅.要点二获取数据的途径获取数据的基本途径有__________________、________________、____________、______________等.批注应用分层随机抽样的前提条件:(1)总体可以分层,层与层之间有明显区别,而层内个体间差异较小.(2)每层中所抽取的个体差异可按各层个体在总体中所占的比例抽取.(3)分层随机抽样要求对总体的情况有一定的了解,明确分层的界限和数目.夯实双基1.判断正误(正确的画“√”,错误的画“×”)(1)简单随机抽样和分层随机抽样都是等可能抽样.( )(2)分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.( )(3)在分层随机抽样时,每层可以不等可能抽样.( )(4)通过网络查询的数据是真实的数据.( )2.“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据 D.通过查询获得数据3.某企业生产A,B,C三种型号电子产品,产品数量之比为3∶5∶7,现用分层随机抽样的方法抽出容量为n的样本,其中B型产品30件,则样本容量n=( ) A.100 B.120C.150 D.904.某地有15 000亩农田,其中山地、平原、洼地分别为9 800亩、1 200亩、4 000亩,在实施乡村振兴战略中,要对这个地方的农作物产量进行调查,应当采用的抽样方法是________.题型探究·课堂解透——强化创新性题型 1对分层随机抽样概念的理解例1 (多选)某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出200人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法正确的是( )A.采用分层随机抽样比简单随机抽样更合理B.若按专业类型进行分层随机抽样,则理学专业和工学专业应抽取60人和40人C.若按专业类型进行分层随机抽样,则张三被抽到的可能性比李四大D.该问题中的样本容量为200题后师说分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.巩固训练1 下列问题中,最适合用分层随机抽样抽取样本的是( )A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C.从1 000名工人中,抽取100名调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量题型 2分层随机抽样的应用例2 (1)[2022·山东青岛高一期末]一支野外科学考察队有男队员56人,女队员42人,按性别进行分层,用分层随机抽样的方法从全体队员中抽出一个容量为28的样本,如果样本按比例分配,那么下面说法正确的为( )A.男队员应抽取12人B.男队员应抽取16人C.女队员应抽取6人D.女队员应抽取14人(2)一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?题后师说分层随机抽样的一般步骤巩固训练2 (1)[2022·河北保定高一期末]某社区卫生室为了了解该社区居民的身体健康状况,对该社区2 000名男性居民和1 600名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容量为180的样本,则应从女性居民中抽取的人数为( )A.60 B.80C.90 D.100(2)[2022·湖南永州高一期末]在中国共产主义青年团建团100周年之际,某高中学校计划选派60名团员参加“文明劝导”志愿活动,高一、高二、高三年级的团员人数分别为100,200,300,若按分层抽样的方法选派,则高一年级需要选派的人数为________.题型 3获取数据的途径例3 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?题后师说在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法和策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得到统计推断.巩固训练3 为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的最好途径是( )A .通过调查获取数据B .通过试验获取数据C .通过观察获取数据D .通过查询获得数据9.1.2 分层随机抽样9.1.3 获取数据的途径新知初探·课前预习[教材要点]要点一一个或多个 简单随机抽样 总样本 (1)层 比例分配 (2)m m +nnm +nMM +NNM +N要点二通过调查获取数据 通过试验获取数据 通过观察获取数据 通过查询获得数据[夯实双基]1.答案:(1)√ (2)√ (3)× (4)×2.解析:“中国天眼”主要是通过观察获取数据.故选C. 答案:C3.解析:由分层抽样可知,53+5+7=30n ,解得n =90.故选D.答案:D4.解析:由于田地分为:山地、平原、洼地,不同的田地农作物产量会有较大的不同,所以应该采用分层抽样.答案:分层抽样题型探究·课堂解透例1 解析:对于选项A ,采用分层随机抽样更合理,故A 正确; 对于选项B ,理学专业应抽取的人数为200×30100=60,工学专业应抽取的人数为200×20100=40,故B 正确;对于选项C ,张三与李四被抽到的可能性一样大,故C 错误; 对于选项D ,该问题中的样本容量为200,故D 正确.故选ABD. 答案:ABD巩固训练1 解析:A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和D 中总体个体无明显差异且个数较多,不适合用分层随机抽样;B 中总体个体差异明显,适合用分层随机抽样.故选B.答案:B例2 解析:(1)抽样比为2856+42=27,故男队员应抽取56×27=16(人),女队员应抽取42×27=12(人),故选B.(2)用分层随机抽样来抽取样本,步骤如下:①分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.②确定每层抽取个体的个数.抽样比为100500=15, 则在不到35岁的职工中抽取125×15=25(人);在35岁至49岁的职工中抽取280×15=56(人); 在50岁及50岁以上的职工中抽取95×15=19(人). ③在各层分别按随机数法抽取样本. ④汇总每层抽样,组成样本. 答案:(1)B (2)见解析巩固训练2 解析:(1)应从女性居民中抽取的人数为180× 1 6002 000+1 600=80,故选B. (2)依题意可知高一年级需要选派的人数为100100+200+300×60=10(人).答案:(1)B (2)10例3 解析:一个城市交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.巩固训练3 解析:因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.故选D.答案:D。
人教A版高中同步学案数学必修第二册精品课件 第九章 统计 9.1.1 简单随机抽样
08 02 73
79 54
57 60 86 32 44
43 28
解第一步,先将40件零件编号,可以编为00,01,02,…,38,39.
第二步,在随机数表中任选一个数作为开始,例如从随机数表中的第8行第9
列的数5开始.
第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于
59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到
第九章
9.1.1 简单随机抽样
课标要求
1.了解全面调查与抽样调查的异同.
2.理解抽样调查的目的和基本要求.
3.掌握简单随机抽样中的抽签法、随机数法的一般步骤.
4.了解总体均值、样本均值的定义和求解公式.
内
容
索
引
01
基础落实•必备知识全过关
02
重难探究•能力素养全提升
03
学以致用•随堂检测全达标
基础落实•必备知识全过关
19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,
将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取
(2)调查我市中学生的身体素质适宜采用抽样调查的方式.( √ )
2.抽样调查的优点有哪些?
提示 抽样调查由于只抽取一部分个体进行调查,因此具有花费少、效率高
的特点.在总体的调查中,如果经费、时间等方面受限,或者调查具有破坏
性,那么抽样调查是比较合适的调查方法.
知识点2 简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中 逐个
过关自诊
1.判断正误.(正确的画√,错误的画×)
(1)由于样本的选取是随机的,因此样本平均数也是具有随机性.( √ )
高中数学必修二第九章统计知识点汇总(带答案)
高中数学必修二第九章统计知识点汇总单选题1、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是()A.1200名学生是总体B.每个学生是个体C.样本容量是100D.抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.2、根据2021年《第七次全国人口普查公报》,就我国2020年每十万人中拥有的各类受教育程度的人口情况,绘制了如图所示的扇形统计图,则()A.每十万人中拥有高中(含中专)文化程度的人数最少B.每十万人中拥有大专及以上文化程度的人数少于2万C.每十万人中拥有小学文化程度的人数最多D.每十万人中拥有初中和高中(含中专)文化程度的人数占比不到50%答案:B分析:根据扇形图的比例数据,结合各选项的描述直接判断正误即可.A:每十万人中其他文化程度的人数最少,占比为10%,错误;B:每十万人中拥有大专及以上文化程度的人数为10×15%=1.5万,正确.C:每十万人中拥有初中文化程度的人数最多,占比为35%,错误;D:每十万人中拥有初中和高中(含中专)文化程度的人数占比为50%,错误.故选:B.3、某单位有男职工56人,女职工42人,按性别分层,用分层随机抽样的方法从全体职工中抽出一个样本,如果样本按比例分配,男职工抽取的人数为16人,则女职工抽取的人数为()A.12B.20C.24D.28答案:A分析:根据题意,结合分层抽样的计算方法,即可求解.根据题意,设抽取的样本人数为n,=16,所以n=28,因此女职工抽取的人数为28−16=12(人).因男职工抽取的人数为56n56+42故选:A.4、下表是某校校级联欢晚会比赛中12个班级的得分情况,则得分的30百分位数是()答案:D分析:根据百分位数的定义求解即可.12×30%=3.6,把12个班级的得分按照从小到大排序为7,7,8,9,9,10,10,10,11,13,13,14,可得30百分位数是第4个得分数,即9.故选:D5、每年的3月15日是“国际消费者权益日”,某地市场监管局在当天对某市场的20家肉制品店、100家粮食加工品店和15家乳制品店进行抽检,要用分层抽样的方法从中抽检27家,则粮食加工品店需要被抽检()A.20家B.10家C.15家D.25家答案:A分析:确定抽样比,即可得到结果.=20(家).解:根据分层抽样原理知,粮食加工品店需要被抽检27×10020+100+15故选:A.6、下列调查方式合适的是().A.为了了解一批头盔的抗压能力,采用普查的方式B.为了了解一批玉米种子的发芽率,采用普查的方式C.为了了解一条河流的水质,采用抽查的方式D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽查的方式答案:C分析:根据抽查和普查的特点,对每个选项进行逐一分析,即可判断和选择.对于选项A,采用普查的方式测试头盔的抗压能力,成本较高,不适合,故A错误;对于选项B,采用普查的方式测试玉米种子的发芽率,较为繁琐且工作量较大,不适合,故B错误;对于选项C,采用抽查的方式了解河流的水质,适合,故C正确;对于选项D,为了了解5个人每周体育锻炼的时间,适合采用普查的方式,故D错误.故选:C.7、2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为()A.40B.39C.38D.37答案:C分析:利用中位数左右两边的小矩形的面积都等于0.5即可求解.年龄位于[18,24)的频率为0.013×6=0.078,年龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30,36)的频率为0.034×6=0.204,年龄位于[36,42)的频率为0.040×6=0.240,因为0.078+0.138+0.204=0.42<0.5,而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以中位数位于[36,42),设中位数为x,则0.078+0.138+0.204+(x−36)×0.04=0.5,解得:x=38,故选:C.8、从某班50名学生中抽取6名学生进行视力状况的统计分析,下列说法正确的是()A.50名学生是总体B.每个被调查的学生是个体C.抽取的6名学生的视力是一个样本D.抽取的6名学生的视力是样本容量答案:C分析:根据总体、样本、个体、样本容量的概念判断.从某班50名学生中抽取6名学生进行视力状况的统计分析,则50个学生的视力状况是总体,抽取的6名学生的视力是一个样本,每个被调查的学生的视力状况是个体,样本容量是6,结合所给的选项,只有C正确.故选:C.多选题9、小陈为学校动漫社制作了宣传片,邀请全班同学进行观看并给出评分(0-10分).由于小陈不太好意思直接询问同学意见,因此他制作了包含如下两个问题的调查问卷:①你的学号是否为奇数;②你对视频的评分是否在5分以上(含5分).每位同学完成问卷后不需要填写答案,只需要填写回答“是”的个数.最后经统计,有40%的同学回答了两个“是”,则下列说法正确的有().A.全班约有60%的同学对视频的评分在5分以上B.全班约有80%的同学对视频的评分在5分以上C.记全班同学评分的均值为x̅,则可估计x̅在4到9分之间D.记全班同学评分的均值为x̅,则可估计x̅在3到8分之间答案:BC分析:由有40%的同学回答了两个“是”可推出对视频的评分是在5分以上同学的比例,再由此确定平均分的估计值.全班约有一半的同学学号为奇数,由于学号是否为奇数与对视频的评分无关,因此40%的同学回答了两个“是”意味着约有80%的同学对视频的评分在5分以上,A选项错误,B选项正确;由此可以估计x̅满足0×0.2+5×0.8≤x̅<5×0.2+10×0.8,即4≤x̅<9,x̅大致在4分到9分之间,C选项正确,D选项错误.故选:BC.10、成立时间少于10年.估值超过10亿美元且未上市的企业,称为独角兽企业.2021年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2021年中国新经济独角兽企业TOP200的行业分布图,中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业数量共同占比达到69%.下列说法正确的是()A.随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B.这12个行业TOP200榜单中独角兽企业数量的中位数是17C.中国新经济独角兽企业TOP200榜单中,京、沪、粤三地的企业超过130家D.2021年中国新经济独角兽企业TOP200榜单中汽车交通、企业服务、文化娱乐的企业数量共同占比超过40%答案:ABC分析:结合图表对选项进行分析,由此确定正确选项.A选项,由图可知,汽车交通行业独角兽企业TOP200榜单中数量最多,是由A选项正确.=17,B选项正确.B选项,数据为8,8,12,13,16,17,17,18,18,19,25,29,中位数为17+172C选项,200×69%=138>130,所以C选项正确.×100%=36.5%<40%,D选项错误.D选项,汽车交通、企业服务、文化娱乐占比29+25+19200故选:ABC11、甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表,某同学根据表中数据分析得出的结论正确的是()B.甲班的成绩波动比乙班的成绩波动大C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)D .甲班成绩的众数小于乙班成绩的众数 答案:ABC解析:根据图表直接计算平均数、方差和众数与甲、乙两班学生每分钟输入汉字数≥150个的人数分析即可.甲、乙两班学生成绩的平均数都是35,故两班成绩的平均数相同,A 正确;s 甲2=191>110=s 乙2,甲班成绩不如乙班稳定,即甲班的成绩波动较大,B 正确.甲、乙两班人数相同,但甲班的中位数为149,乙班的中位数为151,从而易知乙班不少于150个的人数要多于甲班,C 正确;由题表看不出两班学生成绩的众数,D 错误. 故选:ABC小提示:本题主要考查了根据平均数、方差和众数分析实际意义的问题,属于基础题型. 填空题12、一个容量为100的样本,其数据的分组与各组的频数如下表:答案:0.52分析:根据图表,样本数据落在[10,40)上的频数为13+24+15=52,根据频率公式即可得解. 样本数据落在[10,40)上的频数为13+24+15=52. 则样本数据落在[10,40)上的频率为52100=0.52.所以答案是:0.5213、某市A 、B 、C 三个区共有高中学生20000人,其中A 区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A 区应抽取__________________. 答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A 区的人数,得到A 区要抽取的人数.解:由题意知A 区在样本中的比例为700020000×600=210.∴A区应抽取的人数是700020000所以答案是:210.14、下表是13~17岁未成年人的身高的主要百分位数(单位:cm).______女性同龄人.答案:13.5万分析:根据身高163cm的百分位数计算.=13.5(万).小丽身高为164cm,身高163cm的百分位数是75,18×75100所以答案是:13.5万.解答题15、从甲、乙两人中选选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲78686591074乙9578768677(1)分别计算甲、乙两人射击命中环数的平均数:(2)选派谁去参赛更好?请说明理由.答案:(1)甲乙的平均数均为7;(2)选派乙,理由见解析.分析:(1)应用平均数的求法求甲乙平均数;(2)由(1)知甲乙平均数相同,求出甲乙的方差并比较大小,即可确定选派方法.=7,(1)由题设,甲的平均数为x̅1=7+8+6+8+6+5+9+10+7+410=7.乙的平均数为x̅2=9+5+7+8+7+6+8+6+7+710(2)甲的方差为s12=110∑(x i−x̅1)210i=1=0+1+1+1+1+4+4+9+0+910=3,乙的方差为s22=110∑(x i−x̅2)210i=1=4+4+0+1+0+1+1+1+0+010=1.2.由(1)知:x̅1=x̅2,而s12>s22,所以选派乙去参赛更好.。
人教A版高中同步学案数学必修第二册精品课件 第九章 统计 本章 总结提升 (3)
由甲、乙平均数相等,乙的方差较小,知选乙参加比赛比较合适.
规律方法
样本的数字特征可分为两大类:一类是反映样本数据集中趋势
的,包括平均数、众数、中位数;另一类是反映样本数据离散程度的,包括
样本方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题,还
要研究方差.方差描述了数据相对平均数的离散程度,在平均数相同的情况
方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶6∶4.
已知高一年级共抽取了200人,则高三年级抽取的人数为
.
答案 (1)分层随机抽样,简单随机抽样
(2)400
解析 (1)由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层
随机抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差
人数
5
8
区间界限 [142,146) [146,150)
人数
20
11
[130,134)
10
[150,154)
6
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计身高低于134 cm的人数占总人数的百分比.
[134,138)
22
[154,158]
5
[138,142)
33
解 (1)样本的频率分布表:
异,所以完成②宜采用简单随机抽样.
(2)由条件有+6+4
4
×1
2+6+4
200=400.
=
200
,解得
1 200
k=2,所以高三年级抽取的人数为
专题二
用样本的频率分布估计总体分布
【例2】 如下表所示给出了某校500名12岁男孩中用随机抽样得出的120
人教版高中数学必修第二册9.1 9.1.2 分层随机抽样
上一页
返回导航
下一页
第九章 统计
25
进行分层随机抽样的相关计算时,常用的到 3 个关系
样本量n (1)总体的个数N
该层抽取的个体数 = 该层的个体数
.
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:
w =m+m n x+m+n n y=MM+N x+M+N N y.
能抽样,要求( )
A.每层等可能抽样
B.每层可以不等可能抽样
√C.所有层按同一抽样比等可能抽样
D.所有层抽取的个体数量相同
上一页
返回导航
下一页
第九章 统计
13
【解析】 保证每个个体等可能地被抽取是两种基本抽样方法的共同特 征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等 可能抽样.
上一页
上一页
返回导航
下一页
第九章 统计
7
2.简单随机抽样和分层随机抽样有何异同? 提示:区别:简单随机抽样是从总体中逐个抽取样本;分层随机抽样首 先将总体分成几层,然后在各层中按比例分配抽取样本. 联系:①抽样过程中每个个体被抽到的可能性相等; ②每次抽出个体后不再将它放回,即不放回抽样.
上一页
返回导航
上一页
返回导航
下一页
第九章 统计
4
(2)比例分配 在分层随机抽样中,如果每层样本量都与层的大小_成__比__例___,那么称这 种样本量的分配方式为比例分配.
上一页
返回导航
下一页
第九章 统计
5
2.样本平均数的计算公式 在分层随机抽样中,如果层数分为 2 层,第 1 层和第 2 层包含的个体数分别 为 M 和 N,抽取的样本量分别为 m 和 n,样本平均数分别为 x ,y ,总体
第九章统计全章教案-2020-2021学年高一下学期数学人教A版(2019)必修第二册
第九章统计全章教案整理9.1.1简单随机抽样一、教学目标1.正确理解总体、个体、样本、普查、抽样调查的概念.2.理解简单随机抽样的概念.3.体会用样本平均数、样本中的比例去估计总体平均数、总体中的比例.二、教学重难点1、教学重点1.普查与抽样调查的意义.2.总体与样本的意义.3.简单随机抽样及其应用.4.数据的平均数的概念及意义.2、教学难点1.简单随机抽样的应用2.平均数的意义.三、教学过程1、新课导入在现实生活中,我们经常会接触到各种统计数据,例如,人口总量、经济增长率、就业情况、物价指数、产品的合格率、商品的销售额、农作物的产量、人均水资源、居民人均年收入、电视台节目的收视率、学生的平均身高等.要正确阅读并理解这些数据,需要具备一些统计学的知识.在初中我们简单的学习过统计与概率,对于具体的统计情况,应如何收集数据?如何从所收集的数据中提取信息来认识未知现象?这种认识一定正确吗?应该如何正确解释统计的结果,是我们接下来要学习的.2、探索新知一、相关概念1.普查:像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.2.总体:调查对象的全体称为总体.3.个体:组成总体的每一个调查对象称为个体.也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.4.抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.(抽样调查只抽取一部分个体进行调查,因此具有花费少、效率高的特点.)5.样本:从总体中抽取的那部分个体称为样本.6.样本量:样本中包含的个体数称为样本量.7.样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据.8.普查和抽样调查的对比9.简单随机抽样:设一个总体含有N(N为正整数)个个体,从中逐个抽取(1)≤<个n n N个体作为样本,如果抽取是放回的,且每次抽取总体内的各个个体被抽样的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本简称简单随机样本.简单随机抽样的特点:(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析.(2)逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算.(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性.二、抽签法一般地,抽签法就是把总体总的N个个体编号,把号码写在号签上,将号签放在一个不透明容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的操作步骤:第一步,编号:将N个个体编号(号码可以从1到N,也可以使用已有的号码).第二步,写签:将N个号码写到大小、形状相同的号签上.第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取n次,并记录其编号.第四步,定样:从总体中找出与号签上的号码对应的个体,组成样本.抽签法的注意事项:(1)对个体编号时,也可以利用已有的编号.例如,从全班学生中抽取样本时,可以利用学生的学号、座位号等.(2)制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.(3)抽取样本前总体要“搅拌均匀”,目的是让每个号签被抽到的机会相等.抽签法的优缺点优点:简单易行缺点:仅适用于个体数较少的总体.当总体容量非常大时,该方法费时费力又不方便.况且,如果号签搅拌得不均匀,还可能导致抽样不公平.三、随机数法为了克服把大量的号签搅拌均匀的困难,也为了节约制作号签和搅拌均匀的成本、时间,需要寻找代替抽签的方法.在用抽签法产生简单随机样本的过程中,第三四步的本质是等概率地在容器中抽取号签,这个步骤完全等价于产生整数值随机数.得到随机数的方法:(1)用随机试验生成随机数.(2)用信息技术生成随机数.(3)用R 统计软件生成随机数. 四、样本量的选择抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好.样本量大的会好于样本量小的.尤其是样本量不大时,增加样板量可以较好地提高估计的效果.但是在实际抽样中,样本量的增大会导致调查的人力、费用、时间等成本的增加.五、总体平均数与样本平均数1.总体平均数:一般地,总体中有N 个个体,它们的变量值分别为12,,,N Y Y Y ,则称1211NNi i Y Y Y Y Y NN=+++==∑为总体均值,又称总体平均数2.加权平均数:如果总体的N 个变量值中,不同的值共有()k k N ≤个,不妨记为12,,,k Y Y Y ,其中i Y 出现的频数(1,2,,)i f i k =,则总体均值还可以写成加权平均数的形式11ki i i Y f Y N==∑3.样本平均数:如果从总体中抽取一个容量为n 的样本,它们的变量值分别为12,,,n y y y ,则称1211nni i y y y y y nn =+++==∑为样本均值,又称样本平均数.4.样本平均数的特性:样本平均数也具有随机性.5.总体平均数的特性:总体平均数是一个确定的数.大部分样本平均数离总体平均数不远,在总体平均数附近波动.一般来说,样本容量越大,估计效果越好,即估计值与真实值差别越小.六、某类个体在总体中的占比用样本平均数y 估计总体平均数Y ,用样本中的比例p 估计总体中的比例P .计算样本中某类个体在样本中所占的比例的方法:拿某类个体的个数除以样本量即可. 可用样本中某类个体的比例估计总体中该类个体的比例. 3、课堂练习1.下列哪种工作不能使用抽样方法进行( )A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况答案:D2.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的是( )A.1000名学生是总体B.每个学生是个体C.每名学生的成绩是所抽取的一个样本D.样本的容量是100答案:D3.对于简单随机抽样,下列说法中正确的是()①它要求被抽取样本的总体的个体数有限;②它是从总体中逐个进行抽取的;③它是一种不放回抽样;④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④答案:D4.为了提高学生对毒品危害性的认识,某市相关部门每个月都要对学生进行“禁毒知识应知应会”测评,为了激发学生的积极性,某校对达到一定成绩的学生授予”禁毒小卫士”的荣誉称号,为了确定一个适当的奖励目标,该校随机选取了七年级20名学生在5月份测评的成绩,数据如下:收集数据:90 91 89 96 90 98 90 97 91 9899 97 91 88 90 97 95 90 95 88可以推测该市学生测评成绩的平均数( )A.一定为90B.约为90C.约为93D.一定为93答案:C4、小结作业小结:1.本节课我们主要学习了哪些内容?2.普查的抽样调查3.简单随机抽样及两种方法4.总体平均数和样本平均数的计算5.某类个体在总体中的占比作业:9.1.2分层随机抽样一、教学目标1.理解分层抽样的概念与特征,巩固简单随机抽样、系统抽样两种抽样方法;2.掌握简单随机抽样与分层抽样的区别与联系;3.通过对分层随机抽样的学习,培养学生数据分析、数学运算、数学建模等数学素养.二、教学重难点1.正确理解分层抽样的定义,灵活应用分层抽样抽取样本;2.恰当的选择两种抽样方法解决现实生活中的抽样问题.三、教学过程:(1)创设情景某校高一、高二和高三年级分别有学生1000,800,700名,为了了解全校学生的视力情况,从中抽取容量为100的样本,怎样抽取较为合理?(2)新知探究问题1:能否用简单随机抽样或系统抽样进行抽样,为什么?学生回答,教师点拨指出由于不同年级的学生视力状况有一定的差异,用简单随机抽样或系统抽样进行抽样不能准确反映客观实际,在抽样时不仅要使每个个体被抽到的机会相等,还要注意总体中个体的层次性。
高中数学必修二《第九章 统计》复习教案及练习
《第九章统计》复习教案9.1 随机抽样9.1.1 简单随机抽样【基础知识拓展】1.抽签法的优缺点与操作步骤(1)优点:简单易行.当总体的个数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性.(2)缺点:仅适用于个体数较少的总体.当总体容量非常大时,费时费力又不方便,况且,如果号签搅拌的不均匀,可能导致抽样不公平.(3)用抽签法从容量为N的总体中抽取一个容量为n的样本的步骤:①编号:给总体中的所有个体编号(号码可以从1到N);②制作号签:将1~N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);③均匀搅拌:将号签放在一个不透明的容器里,搅拌均匀;④抽取号码:每次从容器中不放回地抽取一个号签,连续抽取n次;⑤构成样本:从总体中将与抽到的号签上的号码一致的个体抽取,就构成了一个容量为n的样本.2.随机数表法的优缺点及操作步骤(1)优点:简单易行.它很好地解决了当总体中的个体数较多时抽签法制签难的问题.(2)缺点:当总体中的个体数很多,需要的样本量也较大时,用随机数表法抽取样本仍不方便.(3)随机数表法抽取样本的步骤:①编号:对总体的个体进行编号(每个号码位数一致);②选定初始值:在随机数表中任选一个数作为开始;③选号:从选定的数开始按一定的方向读下去,得到的号码若不在编号中,则跳过,若在编号中,则取出,如果得到的号码前面已经取出,也跳过,如此继续下去,直到取满为止;④确定样本:根据选定的号码抽取样本.3.抽签法与随机数法的区别抽签法适用于总体中个体数较少,样本量也较小的抽样,随机数法适用于总体中个体数较多,但样本量较小的抽样.4.用样本估计总体,主要基于以下两点:一是在很多情况下总体的个数往往很多,甚至无限,不能一一加以考察;二是有些从总体中抽取个体的试验常有破坏性,因而抽取的个体不允许太多。
【跟踪训练】1.判一判(正确的打“√”,错误的打“×”)(1)简单随机抽样就是随便抽取样本.( )(2)使用抽签法抽签时,后抽签的人占优势.( )(3)利用计算器生成随机数时,按一次“=”键可生成一个随机数.( )答案(1)×(2)×(3)√2.做一做(1)下列调查:①每隔5年进行一次人口普查;②报社等进行舆论调查;③灯泡使用寿命的调查;④对入学报名者的学历检查;⑤从20台电视机中抽出3台进行质量检查,其中属于抽样调查的是( )A.①②③B.②③⑤C.②③④D.①③⑤(2)下列抽样试验中,适合用抽签法的有( )A.从某厂生产的3000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3000件产品中抽取10件进行质量检验答案(1)B (2)B【核心素养形成】题型一简单随机抽样的判断例1 下列5个抽样中,简单随机抽样的个数是( )①从无数个个体中抽取50个个体作为样本;②仓库中有1万支火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.A.0 B.1C.2 D.3[解析] 根据简单随机抽样的特点逐个判断.①不是简单随机抽样,因为简单随机抽样要求被抽取样本的总体中的个体数是有限的;②不是简单随机抽样,虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”;③不是简单随机抽样,因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求;④是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.综上,只有④是简单随机抽样.[答案] B【解题技巧】简单随机抽样必须具备的特点(1)被抽取样本的总体中的个体数是有限的.(2)抽取的样本是从总体中逐个抽取的.(3)简单随机抽样是一种等可能的抽样.如果三个特征有一个不满足,就不是简单随机抽样.【跟踪训练】判断下面的抽样方法是否为简单随机抽样,并说明理由.(1)某班45名同学,指定个子最矮的5名同学参加学校组织的某项活动;(2)从20个零件中一次性抽出3个进行质量检查.解(1)不是简单随机抽样.因为指定个子最矮的5名同学,是在45名同学中特指的,不存在随机性,不是等可能抽样.(2)不是简单随机抽样.因为一次性抽取3个不是逐个抽取,不符合简单随机抽样的特征.题型二用抽签法抽取样本例2 (1)上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,然后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.(2)在社区公益活动中,某单位共有50名志愿者参与了报名,现要从中随机抽出6人参加一项活动,请用抽签法进行抽样,并写出过程.[解析] (1)①满足抽签法的特征,是抽签法;②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.(2)第一步,将50名志愿者编号,号码依次为1,2,3, (50)第二步,将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签;第三步,将所有号签放入一个不透明的箱子中,搅拌均匀;第四步,一次取出1个号签,连取6次(不放回抽取),并记录其编号;第五步,将对应编号的志愿者选出即可.[答案] (1)①(2)见解析【解题技巧】抽签法的五个步骤【跟踪训练】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在相同的纸条上,揉成团,制成号签.第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,所得号码对应的5架钢琴就是要进行质量检查的对象.题型三用随机数法抽取样本例3 (1)要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号:________.(下面抽取了随机数表第1行至第8行)(2)现有一批零件,其编号为600,601,602,…,999.利用原有的编号从中抽取一个容量为10的样本进行质量检查,若用信息技术生成随机数法,怎样设计方案?[解析] (1)从随机数表第3行第6列的数2开始向右读,第一个小于850的数字是227,第二个数字是665,第三个数字是650,第四个数字是267,符合题意.(2)用计算器生成随机数,第一步,进入计算器的计算模式,调出生成随机数的函数并设置参数;第二步,按“=”键生成一个符合条件的随机数,继续重复按“=”键,生成多个随机数,如果生成的随机数重复,则跳过去不读,直到产生10个没有重复的随机数为止;第三步,以上10个号码对应的10个零件就是要抽取的对象.(答案不唯一) [答案] (1)227,665,650,267 (2)见解析【解题技巧】利用随机数表法抽样时应注意的问题(1)编号要求位数相同,若不相同需先调整到一致后再进行抽样,如当总体中有100个个体时,为了操作简便可以选择从00开始编号,那么所有个体的号码都用两位数字表示即可,从00~99号.如果选择从001开始编号那么所有个体的号码都必须用三位数字表示,即从001~100.很明显每次读两个数字要比读三个数字节省时间.(2)第一个数字的抽取是随机的.(3)当随机数选定,开始读数时,读数的方向可左、可右、可上、可下,但应是事先定好的.(4)读数不在总体编号内的和已取出的不算,依次下去,直至得到容量为n 的样本.【跟踪训练】(1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )A.08 B.07C.02 D.01(2)某合资企业有3000名职工,要从中随机抽出200人去参观学习.请用信息技术生成随机数法进行抽取,并写出过程.答案(1)D (2)见解析解析(1)从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数依次为02,14,07,01,故第5个数为01.故选D.(2)第一步,将3000名职工依次编号为1,2,3, (3000)第二步,用电子表格软件生成随机数,在电子表格软件的任一单元格中,输入“=RANDBETWEEN(1,3000)”,则生成一个1~3000范围内的整数随机数;第三步,利用电子表格软件的自动填充功能得到200个没有重复的随机数;第四步,这200个号码对应的200名职工就是要抽取的职工.题型四用样本均值估计总体均值例4 某灯泡厂为测量一批灯泡的使用寿命,从中随机抽查了20只灯泡,它们的使用寿命变量值(单位:h)如下所示:624 847 1205 698 1845 2457 618 1325 1908 24262018 2248 2465 2576 987 737 1628 1998 2543 2007则由这些样本观测数据,估计这批灯泡的平均使用寿命是多少?[解] 抽出的20只灯泡的使用寿命组成一个样本,可以用样本的平均使用寿命来估计这批灯泡的平均使用寿命.根据题中数据,可得样本的均值为1658 h.因此,可以估计这批灯泡的平均使用寿命大约是1658 h.【解题技巧】(1)计算数据的加权平均数,需理解组中值的意义和数据“权数”的意义.(2)用样本的平均数估计总体的平均数,体现了重要的统计思想.【跟踪训练】为了解一批轮胎的性能,汽车制造厂从这批轮胎中随机抽取了8个进行测试,每个轮胎行驶的最远里程数(单位:1000 km)为:96,112,97,108,100,103,86,98.则估计这批轮胎行驶的最远里程数的平均数为( )A.100 B.99C.98 D.97答案 A解析用样本平均数估计总体平均数,得这批轮胎行驶的最远里程数的平均数约为96+112+97+108+100+103+86+98=100.8【课堂达训练】1.为了检查一批光盘的质量,从中抽取了500张进行检测,则这个问题中样本量是( )A.500张光盘B.500C.500张光盘的质量D.这批光盘答案 B解析样本中包含的个体数称为样本量,故这个问题中样本量是500.故选B.2.下列抽样方法是简单随机抽样的是( )A.从100个学生家长中一次性随机抽取10人做家访B.从38本教辅参考资料中选取内容讲解较好的3本作为教学参考C.从自然数集中一次性抽取20个进行奇偶性分析D.某参会人员从最后一排20个座位中随机选择一个坐下答案 D解析A不是简单随机抽样,因为是“一次性”抽取;B不是简单随机抽样,因为每个个体被抽到的概率不相等;C不是简单随机抽样,因为是“一次性”抽取,且“总体容量无限”.D是简单随机抽样.3.从52名学生中选取5名学生参加“希望杯”全国数学邀请赛,若采用简单随机抽样抽取,则每人入选的可能性( )A.都相等,且为152B.都相等,且为110C.都相等,且为552D.都不相等答案 C解析对于简单随机抽样,在抽样过程中每一个个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为n,总体的个体数为N,则用简单随机抽样时,每一个个体被抽到的可能性都是nN,体现了这种抽样方法的客观性和公平性.因此每人入选的可能性都相等,且为5 52.4.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为( ) A.36% B.72% C.90% D.25%答案 C解析3640×100%=90%.5.为了调查某班学生每天完成家庭作业所需的时间,在该班随机抽查了8名学生,他们每天完成家庭作业所需时间(单位:分钟)分别为60,55,75,55,55,43,65,40.(1)求这组样本观测数据的平均数;(2)估计该班学生每天完成家庭作业的平均时间,按照学校要求,学生每天完成家庭作业所需的平均时间不能超过60分钟,该班学生每天完成家庭作业的平均时间是否符合学校的要求?解(1)这组样本观测数据的平均数为18×(60+55+75+55+55+43+65+40)=56.(2)由样本平均数,估计该班学生每天完成家庭作业的平均时间为56分钟.∵56<60,∴该班学生每天完成家庭作业的平均时间符合学校的要求.9.1.2 分层随机抽样9.1.3 获取数据的途径【基础知识拓展】1.分层随机抽样的特点由于层与层之间有明显的区别,而层内个体间的差异不明显,在抽取样本时,一般在每层抽样时随机抽样,以保证公平、公正,在实际操作时,应先计算抽样比k=样本量总体个数,然后再计算每层需要抽取的个数:抽样比×该层个体数目=样本量总体个数×该层个体数目.2.分层随机抽样的适用条件分层随机抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层随机抽样的方法.【跟踪训练】1.判一判(正确的打“√”,错误的打“×”)(1)在分层随机抽样中,每层被抽到的个体数是一样的.( )(2)分层随机抽样中每个个体被抽到的可能性不一样.( )(3)样本平均数一定大于总体平均数.( )答案(1)×(2)×(3)×2.做一做(1)为调查某班学生的平均身高,从50名学生中抽取5名,因为男生的身高和女生的身高有显著不同,所以获取样本时宜采用________抽样.(2)一个班共有54人,其中男女人数比为5∶4,若抽取9人参加教改调查会,则应抽取男同学________人.(3)已知数据x1,x2,x3,x4的平均数为2,则数据3x1,3x2,3x3,3x4的平均数是________.答案(1)分层随机(2)5 (3)6【核心素养形成】题型一分层随机抽样的概念例1 (1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )A.抽签法B.简单随机抽样法C.分层随机抽样法D.随机数法(2)分层随机抽样又称类型随机抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,若分层随机抽样要保证每个个体等可能抽样,必须进行( )A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取个体数量相同[解析] (1)总体由差异明显的三部分构成,应选用分层随机抽样法.(2)保证每个个体等可能的被抽取是简单随机抽样和比例分配的分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.[答案] (1)C (2)C【解题技巧】使用分层随机抽样的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)比例分配的分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,使每层样本数量与每层个体数量的比等于抽样比.【跟踪训练】下列问题中,最适合用分层随机抽样方法抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量D.从50个零件中抽取5个做质量检验答案 C解析A的个体没有呈现出较大差异,不适合用分层随机抽样法;B的总体容量较小,用简单随机抽样法比较方便;C总体容量较大,且各类田地的产量差别很大,宜采用分层随机抽样方法;D与B类似.题型二分层随机抽样的应用例2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?[解] 用比例分配的分层随机抽样来抽取样本,步骤如下:(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.(2)确定每层抽取个体的个数.抽样比为100500=15,则在不到35岁的职工中抽取125×15=25(人);在35岁至49岁的职工中抽取280×15=56(人);在50岁及50岁以上的职工中抽取95×15=19(人).(3)在各层分别按随机数法抽取样本.(4)汇总每层抽样,组成样本.【解题技巧】利用比例分配的分层随机抽样抽取样本的操作步骤【跟踪训练】某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱243545673926107260人进行更为详细的调查,应怎样进行抽样?解采用比例分配的分层随机抽样的方法,抽样比为6012000=1200.“很喜爱”的有2435人,应抽取2435×1200≈12(人);“喜爱”的有4567人,应抽取4567×1200≈23(人);“一般”的有3926人,应抽取3926×1200≈20(人);“不喜爱”的有1072人,应抽取1072×1200≈5(人).因此,采用分层随机抽样的方法在“很喜爱”“喜爱”“一般”“不喜爱”的人中应分别抽取12人、23人、20人、5人.题型三分层随机抽样的综合应用例3 某校高一年级有24个班,共1000名学生,他们参加了一次数学测试.学校统计了所有学生的成绩,得到下列统计图.(1)求该校高一年级学生本次测试成绩的平均数.(2)假设要抽取300名学生,按照比例分配的分层随机抽样的方法,应抽取男生多少名?女生多少名?[解] (1)由题意并结合扇形统计图,可知男生共有1000×60%=600(名),女生共有1000×40%=400(名).由成绩的平均数条形图可得,该校高一年级学生本次测试成绩的平均数x-=(80×600+82.5×400)÷1000=81(分).(2)抽取300名学生,采用比例分配的分层随机抽样的方法,则男生应抽取600×3001000=180(名),女生应抽取400×3001000=120(名).【解题技巧】(1)解决统计问题要做好数据的处理和数据的分析.(2)条形统计图能清楚地表示出每个项目的数据,扇形统计图直接反映部分在总体的百分比大小.有4万个不小于70的两位数,从中随机抽取了3000个数,统计如下表:数据x 70<x<7980<x<8990<x<99个数8001300900平均数78.18591.9A.92.16 B.85.23C.84.73 D.77.97答案 B解析这3000个数的平均数为:78.1×800+85×1300+91.9×900=85.23,3000于是用样本的平均数去估计总体的平均数,则这4万个数的平均数约为85.23.题型四获取数据的途径例4 简单设计一份问卷,调查学生对高一各学科的态度.[解] 请按自己的感受把下面这些学科的序号填在空格里.①语文②数学③外语④物理⑤化学⑥生物⑦历史⑧地理⑨政治⑩体育⑪艺术(音乐、美术) ⑫技术我喜欢的学科我感觉压力最大的学科我不喜欢的学科我觉得有用的学科我觉得内容多的学科我觉得内容少的学科【解题技巧】调查问卷中问题设计的要求(1)问卷中的问题必须设计详细,以便被调查者顺利回答.(2)把比较容易的,不涉及个人的问题排在比较靠前的位置,较难的、涉及个人的问题放在后面.【跟踪训练】为调查小区平均每户居民的月用水量,下面是三名同学设计的方案:学生甲:我把这个用水量调查表放在互联网上,只要登陆网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;学生乙:我给我们居民小区的每一个住户发一张用水调查表,只要一两天就可以统计出小区平均每户居民的月用水量;学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给这些住户打电话,问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量.请问:这三位同学设计的方案中哪一个较合理?你有何建议?解学生甲的方法得到的样本只能够反映上网居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能很准确地获得平均每户居民的月用水量.学生乙的方法实际上是普查,花费的人力、物力更多一些,但是如果统计过程不出错,就可以准确地得到平均每户居民的月用水量.学生丙的方法是一种随机抽样的方法,所在小区的每户居民都装有电话的情况下,建议用随机抽样方法获得数据,用学生丙的方法,既节省人力、物力,又可以得到比较精确的结果.【课堂达标训练】1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )A.简单随机抽样B.抽签法C.随机数法D.分层随机抽样答案 D解析 从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样,且样本量的分配方式为比例分配.2.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样和比例分配的分层随机抽样两种不同方法抽取样本时,总体中每个个体被抽中的概率分别为P 1,P 2,则( )A .P 1>P 2B .P 1<P 2C .P 1=P 2D .无法确定答案 C解析 简单随机抽样和比例分配的分层随机抽样都是等可能抽样,每个个体被抽中的概率均为nN.3.甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用比例分配的分层随机抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )A .30人,30人,30人B .30人,45人,15人C .20人,30人,10人D .30人,50人,10人 答案 B解析 先求抽样比n N =903600+5400+1800=1120,再各层按抽样比分别抽取,则甲校抽取3600×1120=30(人),乙校抽取5400×1120=45(人),丙校抽取1800×1120=15(人),故选B.4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用比例分配的分层随机抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案 60解析 根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.5.某校500名学生中,O 型血有200人,A 型血有125人,B 型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽取一个容量为20的样本.按照比例分配的分层随机抽样方法抽取样本,各种血型的人分别抽多少?解用比例分配的分层随机抽样方法抽样.∵20500=125,∴200×125=8,125×125=5,50×125=2.故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人.9.2 用样本估计总体9.2.1 总体取值规律的估计【基础知识拓展】1.频率分布直方图能够直观、形象地反映样本的分布规律,可以大致估计出总体的分布,但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.在频率分布直方图中,由于长方形的面积S=组距×频率组距=频率,所以各个小长方形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据在各个小组的频率的大小,各个小长方形的面积总和等于1.2.一般地,样本量越大,这种估计就越精确.总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图).提醒:直方图的纵轴(小长方形的高)一般是频率除以组距的商,横轴一般是数据的大小,小长方形的面积表示频率.【跟踪训练】1.判一判(正确的打“√”,错误的打“×”)(1)频率分布直方图的纵轴表示频率.( )(2)数据落在各小组内的频率用各小组频数样本量来表示.( )(3)频率分布直方图把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.( )答案(1)×(2)√(3)√。
高中数学必修二第九章统计知识点梳理(带答案)
高中数学必修二第九章统计知识点梳理单选题1、某大学工程学院共有本科生1200人、硕士生400人、博士生200人,要用分层抽样的方法从中抽取一个容量为180的样本,则应抽取博士生的人数为()A.20B.25C.40D.50答案:A分析:直接利用分层抽样,即可计算.因为学院共有本科生1200人、硕士生400人、博士生200人,所以应抽取博士生的人数为200×180=20.1200+400+200故选:A2、总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从如下随机数表的第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为()第1行78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98第2行32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.27B.26C.25D.19答案:D分析:根据随机数表法的步骤即可求得答案.由题意,取出的数有23,20,80(超出范围,故舍去),26,24,26(重复,故舍去),25,25(重复,故舍去),36(超出范围,故舍去),99(超出范围,故舍去),72(超出范围,故舍去),80(超出范围,故舍去),19.故选:D.3、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s=4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B.4、国内生产总值(GDP)指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果.下图是我国2014~2018年连续5年的GDP及增速图,则下列结论错误的是()A.连续5年中我国GDP保持6%以上的增长B.2014~2018年我国GDP增速整体呈现下降趋势C.2018年GDP为这5年最高,GDP增速为这5年最低D.2018年GDP相对2014年GDP增长了一倍以上分析:根据表中的数据,依次分析各选项即可得答案.解:根据表中数据,对于A选项,2018年国民生产总值增长率最低,为6.6%左右,故连续5年中我国GDP保持6%以上的增长,正确;对于B选项,根据增长率折线图可知,2014~2018年我国GDP增速整体呈现下降趋势,故正确;对于C选项,2018年GDP为90万亿,为5年最高,GDP增速为6.6%左右,为5年最低,故正确;对于D选项,由表中数据,2014年GDP为64万亿左右,2018年GDP为90万亿左右,故没有增长一倍以上,故错误.故选:D5、期末考试后,高二某班50名学生物理成绩的平均分为85,方差为8.2,则下列四个数中不可能是该班物理成绩的是()A.60B.78C.85D.100答案:A分析:利用方差的定义、计算公式进行判断.根据题意,平均数x̅=85,方差s2=150∑(x i−85)250i=1=8.2,所以∑(x i−85)250i=1=8.2×50=410,若存在x=60,则(60−85)2=625>410,则方差必然大于8.2,不符合题意,所以60不可能是所有成绩中的一个数据.又(78−85)2=49<410,(85−85)2=0<410,(100−85)2=225<410.故B,C,D错误.故选:A.6、下列调查中,适合普查的是()A.一批手机电池的使用寿命B.中国公民保护环境的意识C.你所在学校的男女同学的人数D.了解全国人民对建设高铁的意见答案:C分析:根据抽样调查和普查的特点即可判断.由题调查一批手机电池的使用寿命,中国公民保护环境的意识,了解全国人民对建设高铁的意见适合用抽样调查,调查所在学校的男女同学的人数适合普查.7、为了庆祝中国共产党成立100周年,某学校组织了一次“学党史、强信念、跟党走”主题竞赛活动.活动要求把该学校教师按年龄分为35岁以下,35−45岁,45岁及其以上三个大组.用分层抽样的方法从三个大组中抽,则该学校共有教师取一个容量为10的样本,组成答题团队,已知35−45岁组中每位教师被抽到的概率为124()人A.120B.180C.240D.无法确定答案:C分析:根据抽样过程中每个个体被抽到的概率都相等可得答案.因为在抽样过程中,每位教师被抽到的概率都相等,=240人.所以该学校共有教师10÷124故选:C.8、北京舞蹈学院为了解大一舞蹈专业新生的体重情况,对报到的1000名舞蹈专业生的数据(单位:kg)进行统计,得到如图所示的体重频率分布直方图,则体重在60kg以上的人数为()A.100B.150C.200D.250答案:D分析:根据频率分布直方图求出体重在60kg以上的小矩形的面积,即为概率,根据总人数即可求解.0.040×5+0.010×5=0.25,1000×0.25=250,故选:D.多选题9、如图是国家统计局发布的2020年12月至2021年12月的全国居民消费价格涨跌幅,其中同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%.则下列说法正确的是()A.2020年12月至2021年12月全国居民消费价格环比的极差为1.5%B.2020年12月至2021年12月全国居民消费价格同比的中位数为0.9%C.这13个月中,2021年6月全国居民消费价格最低D.2021年比2020年全国居民消费平均价格增长大于1.0%答案:AB分析:计算出2020年12月至2021年12月全国居民消费价格环比的极差,可判断A选项;利用中位数的定义可判断B选项;根据涨幅可判断C选项;利用平均数公式可判断D选项.2020年12月至2021年12月全国居民消费价格环比的最大值为1.0%,最小值为−0.5%,所以其极差为1.5%,A项正确;2020年12月至2021年12月全国居民消费价格同比(单位:%)从小到大依次为−0.3、−0.2、0.2、0.4、0.7、0.8、0.9、1.0、1.1、1.3、1.5、1.5、2.3,其中位数为0.9%,B项正确;从环比来看,假设2020年全国居民消费平均价格为1,经计算可得2020年12月全国居民消费平均价格,C 项错误;2021年比2020年全国居民消费价格平均增长为1 12(−0.3−0.2+0.4+0.9+1.3+1.1+1.0+0.8+0.7+1.5+2.3+1.5)=1112<1.0,D项错误.故选:AB.10、在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是()A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案:ABC分析:读懂题目提供的直方图,根据图中的数据逐项分析即可.对于A,由频率分布直方图可得,成绩在[70,80)内的面积最大,因此考生人数最多,故A正确;对于B,由频率分布直方图可得,成绩在[40,60)内的频率为10×(0.01+0.015)=0.25,因此不及格的人数为4000×0.25=1000,故B正确;对于C,由频率分布直方图可得,平均分约为:45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;对于D,因为成绩在[40,70)内的频率为10×(0.01+0.015+0.02)=0.45,在[70,80)内的频率为0.3,所以中位数为70+10×0.5−0.45≈71.67,0.3故D错误;故选:ABC.11、记考试成绩Z的均值为μ,方差为σ2,若Z满足0.66<P(μ−σ<Z<μ+σ)<0.70,则认为考试试卷设置合理.在某次考试后,从20000名考生中随机抽取1000名考生的成绩进行统计,得到成绩的均值为63.5,方差为169,将数据分成7组,得到如图所示的频率分布直方图.用样本估计总体,则()A.本次考试成绩不低于80分的考生约为5000人B.a=0.03C.本次考试成绩的中位数约为70D.本次考试试卷设置合理答案:BC分析:利用频率分布直方图可得a及中位数,计算出不低于80分的考生的频率后可求相应的人数,从而可判断ABC的正误,再结合频率分布直方图求出P(50.5<Z<76.5)可判断D的正误.由频率分布直方图可得(a+0.02+0.015×2+0.01+0.005×2)×10=1,故a=0.03,故B正确.不低于80分的考生的频率为(0.015+0.005)×2=0.04,故本次考试成绩不低于80分的考生约为0.04×20000=800人,故A错.由频率分布直方图可得前4组的频率和为0.5,故中位数约为70,故C正确.由频率分布直方图可得:P(50.5<Z<76.5)=0.15+0.2+0.3−120×0.15−3.510×0.3=0.47,故本次考试试卷设置不合理,故D错误.故选:BC.填空题12、中国农历的“二十四节气”已正式被联合国教科文组织列入人类非物质文化遗产,也被誉为“中国的第五大发明”,“二十四节气歌”是为便于记忆我国古时历法中二十四节气而编成的小诗歌.某小学三年级共有学生500名,随机抽查100名学生并提问“二十四节气歌”,只能说出其中两句的有45人,能说出其中三句及以上的有32人,据此估计该校三年级的500名学生中,对“二十四节气歌”只能说出一句或一句也说不出的人数约为______.答案:115分析:首先计算只能说出一句或一句也说不出的学生所占的比例,再根据总体人数,即可计算求值.由题意,样本中只能说出一句或一句也说不出的学生有100−45−32=23(人),故只能说出一句或一句也说不出的学生所占的比例为23100,故可估计该校三年级的500名学生中,只能说出一句或一句也说不出的人数约为500×23100=115.所以答案是:11513、某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为________秒.答案:16.5分析:设成绩的70百分位数为x,再估计成绩的70百分位数的区间通过计算即可.设成绩的70百分位数为x,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5.所以答案是:16.5.14、北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.答案:9分析:根据成分层抽样的比例可得答案.20 :15:10=4:3:2,由于“冰墩墩”抽取了4只,所以“雪容融”抽取了3只,北京2022年冬奥会会徽抽取了2个,所以n=4+3+2=9.所以答案是:9.解答题15、某校对学生成绩进行统计(折合百分制,得分为整数),考虑该次竞赛的成绩分布,将样本分成5组,绘成频率分布直方图(如图),图中从左到右依次为第一组到第五组,各小组的小长方形的高的比为1:3:6:4:2,第五组的频数为12.(1)该样本的容量是多少?(2)成绩落在哪一组中的人数最多?并求该小组的频率;(3)该样本的第75百分位数在第几组中?答案:(1)96;(2)第三组,38;(3)第四组.分析:(1)根据给定条件,求出第五小组的频率即可计算作答.(2)确定频率分布直方图中面积最大的小矩形,再求出频率作答.(3)求出各小组频数,由第75百分位数的意义求解作答.(1)在频率分布直方图中,各小组的小长方形的高的比为1:3:6:4:2,则第五组的频率为216,而第五组的频数为12,所以样本的容量n=12216=96.(2)由频率分布直方图知,[70.5,80.5)分段内的人数最多,该小组为第三组,该小组的频率为616=38.(3)第一、二、三、四、五组的频数分别为6,18,36,24,12,该样本的第75百分位数位于第72名,72名位于第四组.。
高中数学:必修第二册第九章-统计教学教案:随机抽样(习题含答案)
高中数学:第二册第九章:随机抽样教案一、基础知识梳理1.抽样的必要性在实际中要全面了解总体的情况,往往难以做到,一般也不可能或没有必要对每个个体逐一进行研究.因为:①一些总体中包含的个体数通常是大量的甚至是无限的.如不可能对所有的灯泡进行试验,记录每一个灯泡的使用寿命;②一些总体具有破坏性.如不可能对所有的炮弹进行试射;③一些调查具有破坏性.如不可能对地里所有的种子是否发芽都挖出来检验;④全面调查(普查)往往要浪费大量的人力、物力和财力.所以常通过从总体中抽取一部分个体,根据对这一部分个体的观察研究结果,再去推断和估计总体情况,即用样本估计总体一一这是统计学的一个基本思想.2.相关概念回顾(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机抽样(1)概念),如果每一般地,设一个总体含有N个个体,从中逐个___________地抽取n个个体作为样本(n N次抽取时总体内的各个个体被抽到的机会都___________,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法(抓阄法):一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法简单易行,当总体中的个体数___________时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体有均等的机会被抽中,从而能够保证样本的代表性.②随机数法:随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.随机数表法简单易行,不论总体容量是多少都可以使用,它很好地解决了用抽签法当总体容量较多时制签难的问题.但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便. 注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.(3)简单随机抽样的特征:①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析 ②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平性.4.系统抽样(1)概念在抽样中当总体个体数___________时,可将总体分成___________的若干部分,然后按照预先制定的规则,从每一部分抽取___________个体,得到所需的样本,这种抽样方法叫做系统抽样.(2)步骤一般地,假设要从容量为N 的总体中抽取容量为n 的样本,可以按下列步骤进行系统抽样:①先将总体的N 个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. ②确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取N k n=. ③在第1段用简单随机抽样的方法确定第一个个体编号()l l k ≤.④按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号(2)l k +,依次进行下去,直到获取整个样本.注意:若N n不是整数,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.另外,系统抽样适用于总体容量较大,且个体之间无明显差异的情况.5.分层抽样一般地,在抽样时,将总体分成___________,然后按照___________,从各层独立地抽取一定数量的个体,将___________取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的.6.三种抽样方法的区别和联系三种抽样方法的特点及其适用范围如下表:习题参考答案:3.(1)不放回相等(2)①不多4.(1)较多均衡一个5.互不交叉的层一定的比例各层二、重点知识梳理一、简单随机抽样要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:有限性、逐一性、不放回性、等可能性.(1)总体是数值指标的全体,例如,要考察某班男生的身高,则总体为该班全部男生的身高数据,而不是该班的男生.(2)个体是总体的一个元素,因此构成总体的每一个数值指标都为个体.(3)样本是总体的一部分,因此样本中所含个体的数量不能超过总体的数量,样本中个体的来源为总体中的个体.1.抽签法(1)对于抽签法,注意:①号签的大小、形状要完全相同.②抽签前需将号签搅拌均匀.(2)抽签法的优点:抽签法简单易行,当总体中的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时,每个个体有均等的机会被抽到,从而能够保证样本的代表性(3)抽签法的缺点:①当总体中的个体数较多时,制作号签的成本就会增加,使得抽签的成本增加;②)号签很多时,把它们搅拌均匀就比较困难,很难保证每个个体人选样本的等可能性,从而产生坏样本(即代表性差的样本)的可能性增加.2.随机数表法(1)对于随机数表法,注意:①抽样过程中选定的初始数和读数的方向是任意的.②若用题中所给的编号,但编号位数不统一时,可在位数少的数前添加“0”来调整.③读数时应结合编号特点进行读取,如:编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.(2)随机数表的形成随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的(随机数表不是唯一的,只要符合各个位置出现各个数字的可能性相同的要求,就可以构成随机数表.常用的方法是通过随机数生成器,例如使用计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表,通常根据实际需要和方便使用的原则,将几个数组合在一起,如5个数一组,然后通过随机数表抽取样本)(3)随机数表法的步骤①编号.将N个个体编号,这里所谓的编号,实际上是编数字号码.例如:将100个个体编号成00,01,02,...,99,而不是编号成0,1,2, (99)此外,将起始号码选为00,而不是01,这样可使100个个体都可用两位数字号码表表示,便于运用随机数表取数.②选定初始值(数).为了保证所选数字的随机性,在查看随机数表前就指出开始数字的横、纵位置.③选号.从选定的数字开始按照一定的方向读下去,得到的号码若不在编号中或已被选用,则跳过,直到选满n个为止.④确定样本.按步骤③选出的号码从总体中找出与其对应的个体,组成样本.(4)随机数表法的优缺点优点:简单易行,不论总体容量是多少都可以使用,它很好地解决了用抽签法当总体容量较大时制签难的问题.缺点:当总体容量很大,需要的样本容量也很大时,利用随机数表法抽取样本仍不方便.【例1】某单位举办一场活动,共有50名志愿者参与了报名,现要从中随机抽出6人参加一项活动,请用抽签法进行抽样,并写出过程.【答案】答案详见解析.【解析】抽样过程:第一步,将50名志愿者编号,号码为1,2,3, (50)第二步,将号码分别写在号签上;第三步,将所有号签放入一个不透明的箱子中,充分搅匀;第四步,依次不放回地抽取6次,并记录其编号,对应编号的志愿者参加活动。
人教版高中数学必修第二册9
上一页
返回导航
下一页
第九章 统计
6
1.判断正误(正确的打“√”,错误的打“×”) (1)平均数不一定是原数据中的数.( √ ) (2)一个样本的众数、平均数和中位数都是唯一的.( × )
上一页
返回导航
下一页
第九章 统计
7
2.一组样本数据为:19,23,12,14,14,17,10,12,18,14,27, 则这组数据的众数和中位数分别为( )
对样本中的极端值更加敏感 对平均数的影响越大
上一页
返回导航
下一页
第九章 统计
5
1.中位数一定是样本数据中的一个数吗? 提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于 中间位置的数是中位数;如果有偶数个数据,则中间两个数据的平均数 是中位数. 2.一组数据的众数一定唯一吗? 提示:不一定,数据的众数可能有一个,也可能有多个.
第九章 统计
9.2.3 总体集中趋势的估计
数学
第九章 统计
1
01
预习案 自主学习
02
探究案 讲练互动
03
自测案 当堂达标
04
应用案 巩固提升
上一页
返回导航
下一页
第九章 统计
2
学习指导
核心素养
1.结合实例,能用样本估计总体的 1.数学抽象:辨析众数、中位数、
集中趋势参数(平均数、中位数、 平均数的含义.
下一页
第九章 统计
10
平均数、众数、中位数的计算方法 平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数 据按从小到大或从大到小的顺序排列,再根据各自的定义计算. [提醒] 如果样本平均数远大于样本中位数,说明数据中存在较大的极 端值.
高中数学 第九章 统计本章总结学案(含解析)新人教A版必修第二册-新人教A版高一必修第二册数学学案
第九章 统计本章总结专题一 抽样方法及其应用[例1] 一汽车厂生产甲、乙、丙三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车甲 轿车乙 轿车丙 舒适型 100 150 z 标准型300450600辆,则z 的值为( )A .300B .400C .450D .600[分析] 由题意,利用分层随机抽样的定义和方法,求出z 的值. [解析] 由题意知,抽样比为10100+300=140,则50100+300+150+450+z +600=140,解得z=400.[答案] B两种抽样方法的适用原则(1)看总体是否由差异明显的几个层次组成.若是,则选用分层随机抽样;否则,采用简单随机抽样.(2)看总体容量和样本量的大小.当总体容量较小时,采用抽签法;当总体容量较大时,采用随机数法.[变式训练1]某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是分层随机抽样法、简单随机抽样法.解析:由于甲、乙、丙、丁四个地区有明显差异,所以在完成①时,需用分层随机抽样法.在丙地区中有20个特大型销售点,没有显著差异,所以完成②宜采用简单随机抽样.专题二总体取值规律的估计[例2]如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)(1)列出样本的频率分布表(精确到0.01);(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.[分析] (1)根据频数计算出频率.分“分组 ”“频数”“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134 cm 的频率. [解] (1)样本的频率分布表如下:(2)画出频率分布直方图,如下图所示:(3)因为样本中身高低于134 cm 的人数的频率为5+8+10120=23120≈0.19,所以估计身高低于134 cm的人数约占总人数的19%.1.已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.2.已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.[变式训练2](1)样本量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是(A)A.32,0.4B.8,0.1C.32,0.1 D.8,0.4(2)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5].样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数是11,则样本中平均气温不低于25.5 ℃的城市个数为9.解析:(1)落在[6,10)内的频率为0.08×4=0.32,100×0.32=32,∴a=32,落在[2,10)内的频率为(0.02+0.08)×4=0.4,∴b=0.4.(2)设样本量为n,则n×(0.10+0.12)×1=11,所以n=50,故所求的城市数为50×0.18=9.专题三总体集中趋势与离散程度的估计[例3]从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标[75,85)[85,95)[95,105)[105,115)[115,125) 值分组频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?[分析] 1.利用频率分布直方图中的数据计算平均数、方差.2.利用样本估计总体.[解](1)由数据可作出如下频率分布直方图:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.1.众数是最高的矩形的底边的中点的横坐标.2.中位数左右两侧直方图的面积相等.3.平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.4.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.[变式训练3]甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:(2)请从四个不同的角度对这次测试进行分析:①结合平均数和方差,分析偏离程度;②结合平均数和中位数,分析谁的成绩好些;③结合平均数和命中9环以上的次数,看谁的成绩好些;④结合折线图上两人射击命中环数及走势,分析谁更有潜力.解:(2)s2甲=110[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=1.2,s2乙=110[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=5.4.①甲、乙的平均数相同,均为7,但s2甲<s2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均数相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多.③甲、乙的平均数相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.。
2021年新教材高中数学第9章统计 学案新人教A版必修第二册
第九章统计9.1随机抽样9.1.1简单随机抽样[目标] 1.理解简单随机抽样的概念;2.掌握常见的两种简单随机抽样的方法;3.能合理地从实际问题的总体中抽取样本.[重点] 掌握用简单随机抽样方法(抽签法和随机数法)从总体中抽取样本的方法和步骤.[难点] 运用简单随机抽样方法解决实际问题.要点整合夯基础知识点一简单随机抽样的概念[填一填]一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.[答一答]1.现有甲、乙两位同学对同一个总体用简单随机抽样的方法抽样,那么他们抽取的样本一定一样吗?提示:这两位同学抽出来的样本不一定一样.因为对于一次简单随机抽样来说,抽出来的样本是确定的,而这两位同学分别抽取时,各个个体是否入样带有随机性,且个体间无固定间距.2.利用简单随机抽样,从一个含有N个个体的总体中逐个不放回地抽取n个个体作为样本(n≤N),每个个体入样的可能性是多少?提示:简单随机抽样每一次抽取时总体中的各个个体有相同的可能性被抽到,均为nN. 3.根据简单随机抽样的定义,简单随机抽样有哪些特征?提示:简单随机抽样的特征是:总体个数有限、逐个抽取、等可能.知识点二 简单随机抽样的方法[填一填]1.抽签法一般地,抽签法就是把总体中的N 个个体编号,把号码写在号签上,将号签放在一个不透明的容器中,搅拌均匀后,从中不放回地逐个抽取号签,连续抽取n 次,就得到一个容量为n 的样本.2.随机数法利用随机数表、随机数骰子或计算机产生的随机数进行抽样.[答一答]4.抽取一个号签,记录其编号后放入容器中,再次抽取记录,连续n 次后得到号签上的号码对应的个体,这些个体组成样本,这种抽样方法是抽签法吗?提示:不是.因为抽签法是逐个不放回抽取,目的是保证抽取的号签不会重复,而这里是将号签记录编号后又放回容器中,所以该抽样方法不是抽签法.5.抽签法的一般步骤是什么?提示:(1)将总体中个体编号1~N .(2)将所有编号1~N 写在形状、大小相同的号签上.(3)将号签放在一个不透明的容器中,搅拌均匀.(4)从容器中不放回地逐个抽取号签,并记录其编号,连续抽取n 次.(5)从总体中将与抽取到的号签的编号相一致的个体取出.6.抽签法与随机数法有哪些相同点与不同点?提示:相同点:①抽签法和随机数法都是简单随机抽样的方法,并且要求被抽取样本的总体的个数有限;②抽签法和随机数法都是从总体中逐个地进行抽取,都是不放回抽样.不同点:①抽签法相对于随机数法简单;②随机数法更适用于总体中的个体数较多的情况,而抽签法适用于总体中的个体数相对较少的情况,所以当总体中的个体数较多时,应当选用随机数法,这样可以节约制作号签的成本.知识点三 总体平均数和加权平均数[填一填]1.一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称Y =Y 1+Y 2+…+Y N N =1N i =1N Y i 为总体均值,又称总体平均数. 2.一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的一组数据的平均数为x 1f 1+x 2f 2+…+x n f n f 1+f 2+…+f n.这个平均数叫做加权平均数,其中f 1, f 2,…, f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即f i (i =1,2,…,k )越大,表明x i 的个数越多,“权”就越大.[答一答]7.算术平均数与加权平均数有什么区别?提示:一组数据的算术平均数与加权平均数概念是不一样的,简单的说,如果一组数据是:70,90,那么,它的算术平均数=(70+90)÷2=80,而加权平均数则取决于各个数据的权(或权重).当70的权重是40%, 90的权重是60%时,加权平均数=70×40%+90×60%=82;当70的权重是70%, 90的权重是30%时,加权平均数=70×70%+90×30%=76;当70的权重是50%, 90的权重是50%时,加权平均数=70×50%+90×50%=80.由此可见,一组数据的算术平均数只有一个,当数据组中的每个数据确定后,算术平均数也确定了.而一组数据的加权平均数可能有多个,它是根据各个数据的权重不同而发生变化的,当各个数据的权重一样时,加权平均数等于算术平均数.当各个数据的权重不同时,加权平均数不一定等于算术平均数.典例讲练破题型类型一简单随机抽样的概念[例1](1)关于简单随机抽样,下列说法正确的是()①它要求被抽取样本的总体的个数有限;②它是从总体中逐个地进行抽取;③它包括不放回抽样;④它是一种等可能性抽样,每次从总体中抽取一个个体时,不仅各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②B.③④C.①②③D.①②③④(2)下面的抽样方法是简单随机抽样的是________.①从无数张高考试卷中抽取50张试卷作为样本;②从80台笔记本电脑中一次性抽取6台电脑进行质量检查;③一福彩彩民买30选7彩票时,从装有30个大小、形状都相同的乒乓球的盒子(不透明)中逐个无放回地摸出7个有标号的乒乓球,作为购买彩票的号码;④用抽签法从10件产品中选取3件进行质量检验.[分析]根据简单随机抽样的概念及特征去判断.[解析](1)由随机抽样的特征可知①②③④正确,故选D.(2)①中样本总体数目不确定,不是简单随机抽样;②中样本不是从总体中逐个抽取,不是简单随机抽样;③④符合简单随机抽样的特点,是简单随机抽样.[答案](1)D(2)③④判断一个抽样是否是简单随机抽样,一定要看它是否满足简单随机抽样的特点,这是判断的唯一标准.(1)简单随机抽样的总体个数有限;(2)简单随机抽样的样本是从总体中逐个抽取;(3)简单随机抽样包括放回和不放回两种抽样;(4)简单随机抽样的每个个体入样机会均等.[变式训练1]下面的抽样方法是简单随机抽样吗?为什么?(1)从无数个个体中抽取50个个体作为样本;(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样操作过程中,从中任取一种玩具检验后再放回;(3)国家跳水队挑出最优秀的10名跳水队员,备战2016年里约热内卢奥运会;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.解:(1)不是简单随机抽样,因为简单随机抽样要求被抽取的样本总体的个数是有限的.(2)是简单随机抽样,因为简单随机抽样包括放回地抽取样本.(3)不是简单随机抽样,因为这10名跳水队员是挑选出来的最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.类型二简单随机抽样的应用命题视角1:抽签法的应用[例2]某班40名同学,随机抽取10名同学参加某项活动,请写出采用抽签法抽取的过程.[分析]根据抽签法的一般步骤来写.[解]第一步,对这40个学生进行编号,编号分别为1,2, (40)第二步,将号码写在形状、大小相同的号签上.第三步,将号签放在一个不透明的箱中,并搅拌均匀.第四步,从箱中不放回地逐个抽取号签,连续抽取10次.第五步,将与号签上的号码对应的同学选出即得样本.一个抽样能否用抽签法,关键看两点:一是制签是否方便,二是号签是否容易被搅匀.在适用此法时,一定要注意“放入不透明容器,并充分搅匀”.[变式训练2]要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.解:应使用抽签法,步骤如下:①将30辆汽车编号,号码是1,2,3, (30)②将1~30这30个编号写在大小、形状都相同的号签上;③将写好的号签放入一个不透明的容器中,并搅拌均匀;④从容器中不放回地逐个抽取号签,连续抽取3次,并记录上面的编号;⑤所得号码对应的3辆汽车就是要抽取的对象.命题视角2:随机数表法的应用[例3]某学校高二年级有500名学生,考试后为详细分析教学中存在的问题,计划抽取一个容量为20的样本,使用随机数法进行抽取,要取三位数,写出抽取过程.(写出具体方法即可)[分析]已知N=500,n=20,用随机数表法抽样时编号001,002,…,500,抽取20个编号(都是三位数),对应的学生组成样本.[解]第一步:给500名学生编号:001,002,003, (500)第二步:从随机数表的第13行第7列(任意选取的)开始向右连续读取数字,以3个数为一组,碰到右边线时向下错一行由左向右继续读取.在读取时,遇到大于500或重复前数时,将它舍弃,再继续向下取,直到取满20个小于或等于500的数为止,说明20个样本号码已取满;第三步:以上这20个号码所对应的20名学生就是要抽取的对象.1.在利用随机数表法抽样的过程中应注意:(1)编号要求位数相同;(2)第一个数字的抽取是随机的;(3)读数的方向是任意的,且要事先定好.2.随机数表法的特点:优点:简单易行.它很好地解决了当总体中的个体数较多时用抽签法制签难的问题.缺点:当总体中的个体数很多,需要的样本量也很大时,用随机数表法抽取样本容易重号.[变式训练3]总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为(D)7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481A .08B .07C .02D .01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为01.类型三 总体平均数和加权平均数[例4] 某班进行个人投篮比赛,受污损的下表记录了在规定时间内投入n 个球的人数分布情况,同时,已知进球3个或3个以上的人平均每人投进3.5个球,进球4个或4个以下的人平均每人投进2.5个球,问投进3个球和4个球的各有多少人?[分析] 根据加权平均数的定义进行列式计算即可.[解] 设投进3个球的人数为a ,投进4个球的人数为b ,根据已知有3×a +4×b +5×2a +b +2=3.5, 0×1+1×2+2×7+3×a +4×b 1+2+7+a +b=2.5, 即⎩⎪⎨⎪⎧ 0.5a -0.5b =3,0.5a +1.5b =9,解得⎩⎪⎨⎪⎧a =9,b =3. 故进3个球的有9人,进4个球的有3人.这类题目通常属简单题,一般解题模式是:(1)根据题干条件结合公式列出方程;(2)解方程或方程组.[变式训练4] 小林在八年级第一学期的数学书面测验成绩分别为:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分,如果按照平时、期中、期末的权重分别为10%、30%、60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?解:x (平时单元测试平均成绩)=84+76+923=84(分). 所以总平均成绩为84×10%+82×30%+90×60%10%+30%+60%=87(分).所以小林该学期数学书面测验的总平均成绩应为87分.课堂达标练经典1.为了了解一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( C )A .总体B .个体C .总体的一个样本D .样本量 解析:200个零件的长度从总体中抽出的个体所组成的集合,是总体的一个样本,故选C.2.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( A )A.110,110B.310,15C.15,310D.310,310解析:根据简单随机抽样的定义知选A.3.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有④⑤⑥.①2 000名运动员是总体;②每个运动员是个体;③所抽取的20名运动员是一个样本;④样本量为20;⑤这个抽样方法可采用随机数表法抽样;⑥每个运动员被抽到的机会相等.解析:①2 000名运动员不是总体,2 000名运动员的年龄才是总体;②每个运动员的年龄是个体;③20名运动员的年龄是一个样本.4.天津某大学为了支持东亚运动会,从报名的60名大三学生中选10人组成志愿小组,请用抽签法和随机数法设计抽样方案.解:抽签法:第一步:将60名大学生编号,编号为1,2,3, (60)第二步:将60个号码分别写在60张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将60个号签放入一个不透明的盒子中,充分搅匀;第四步:从盒子中不放回地逐个抽取10个号签,并记录上面的编号;第五步:所得号码对应的学生,就是志愿小组的成员.随机数法:第一步:将60名学生编号,编号为01,02,03, (60)第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~60中的数或已读过的数,都跳过去不作记录,依次记录下10个得数;第四步:找出号码与记录的数相同的学生组成志愿小组.——本课须掌握的三大问题1.简单随机抽样是一种简单、基本的抽样方法,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为nN,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.9.1.2 分层随机抽样9.1.3获取数据的途径[目标] 1.理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本;2.记住分层随机抽样的特点和步骤;3.利用分层随机抽样的方法解决实际问题;4.了解获取数据的途径,并学会简单应用.[重点] 用分层随机抽样抽取样本.[难点] 抽样方法的联系与区别以及抽样方法的选择.要点整合夯基础知识点一分层随机抽样的概念[填一填]1.定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.2.适用范围当总体是由差异明显的几个部分组成时,往往采用分层随机抽样.3.比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.[答一答]1.分层随机抽样适合于什么样的总体?分层随机抽样有什么特点?提示:当总体是由差异明显的几部分组成时,用分层随机抽样.分层随机抽样仍具有逐个抽取、等可能性等特点.2.分层随机抽样有什么优点?提示:分层随机抽样使样本具有较强的代表性,而且在每个层中进行抽样时,又可灵活地采用简单随机抽样或其他抽样方法.知识点二分层随机抽样的步骤[填一填]1.根据已掌握的信息,将总体分成若干部分.2.根据总体中的个体数N和样本量n计算出抽样比k=nN.3.根据抽样比k计算出各层中应抽取的个体数:nN·N i(其中N i为第i层所包含的个体总数).4.按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.[答一答]3.分层随机抽样公平吗?提示:公平.因为分层随机抽样中,每个个体被抽到的可能性是相同的,与层数、分层无关.4.某全日制大学共有学生5 600人,其中专科生有1 300人,本科生有3 000人,研究生有1 300人,现采用分层随机抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本量为280,则应在专科生、本科生与研究生这三类学生中分别抽取65人,150人,65人.提示:抽样比是2805 600=120,则应在专科生、本科生与研究生这三类学生中分别抽取1300×120=65(人),3 000×120=150(人),1 300×120=65(人).典例讲练破题型类型一分层随机抽样的概念[例1](1) 下列问题中,最适合用分层随机抽样抽取样本的是()A.从10名同学中抽取3人参加座谈会B.一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况C.从1 000名工人中,抽取100名调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行() A.每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同[分析]当总体由差异明显的几部分组成时,该样本的抽取适合用分层随机抽样,结合题中的四个选项及分层随机抽样的特点可对(1)(2)作出判断.[解析](1)A中总体个体无明显差异且个数较少,不适合用分层随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.(2)保证每个个体等可能地被抽取是简单随机抽样和分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.[答案](1)B(2)C1.使用分层随机抽样的前提:,分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.[变式训练1]某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(C)A.抽签法B.随机数法C.分层随机抽样法D.任何抽样法都可以解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.类型二分层随机抽样的设计[例2]某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.[分析]观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→成样[解]因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较妥.∵20100=15,∴105=2,705=14,205=4.∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.因副处级以上干部与工人数都较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.分层随机抽样的特点(1)适用于总体由差异明显的几部分组成的情况.(2)更充分体现和反映了总体的情况.(3)等可能抽样,每个个体被抽到的可能性都相等.[变式训练2]某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的数量为(B)A.15,15,16B.6,30,10C.10,13,23D.12,16,18解析:三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆).课堂达标练经典1.下列实验中最适合用分层随机抽样法抽样的是( D ) A .从一箱3 000个零件中抽取5个入样 B .从一箱3 000个零件中抽取600个入样 C .从一箱30个零件中抽取5个入样D .从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个入样 解析:D 中总体有明显差异,故用分层随机抽样.2.当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题.已知甲、乙、丙三个社区现分别有低收入家庭360户,270户,180户,若第一批经济适用房中有90套住房用于解决这三个社区中90户低收入家庭的住房问题,先采用分层随机抽样的方法决定各社区户数,则应从甲社区中抽取低收入家庭的户数为( A )A .40B .30C .20D .36解析:抽样比为90360+270+180=19,则应从甲社区中抽取低收入家庭的户数为360×19=40,故选A.3.一批灯泡400只,其中20 W 、40 W 、60 W 的数目之比是431,现用分层随机抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为( A )A .20,15,5B .4,3,1C .16,12,4D .8,6,2解析:三种灯泡依次抽取的个数为40×48=20,40×38=15,40×18=5.故选A.4.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层随机抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是( D )A .12,24,15,9B .9,12,12,7C .8,15,12,5D .8,16,10,6解析:抽样比例为40800=120,故各层中依次抽取的人数为160×120=8(人),320×120=16(人),200×120=10(人),120×120=6(人).故选D.5.一家电脑生产厂家在某城市三个经销本厂产品的大商场调查,产品的销量占这三个大商场同类产品销量的40%.由此在广告中宣传,他们的产品在国内同类产品的销售量占40%.请你根据所学的统计知识,判断该宣传中的数据是否可靠:不可靠,理由是第一,所取样本量太小;第二,样本抽取缺乏代表性和广泛性.解析:这是一道判断说理型题,它要求借助于统计知识,作出科学的判断,同时运用统计原理给予准确的解释.因此,该电脑生产厂家凭借挑选某城市经销本产品情况,断然说他们的产品在国内同类产品的销量占40%,宣传中的数据是不可靠的,其理由有二:第一,所取样本量太小;第二,样本抽取缺乏代表性和广泛性.——本课须掌握的三大问题1.用分层随机抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的机会相等.2.分层随机抽样是建立在简单随机抽样基础上的,由于它充分利用了已知信息,考虑了保持样本结构与总体结构的一致性,因此它获得的样本更具代表性,在实用中更为广泛.3.简单随机抽样是基础,分层随机抽样是补充和发展,二者相辅相成,对立统一.9.2 用样本估计总体9.2.1总体取值规律的估计[目标] 1.学会用频率分布直方图表示样本数据;2.能通过频率分布直方图对数据做出总体统计.[重点] 频率分布直方图的画法.[难点] 频率分布直方图对数据总体的估计.要点整合夯基础知识点频率分布直方图[填一填]1.频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.。
人教A版高中同步学案数学必修第二册精品课件 第9章 统计 学习单元2 9.2.1~9.2.2 (2)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
4.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重
情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计
该校2 000名高中男生中体重不小于70.5 kg的人数为( B )
A.300
B.360
C.420
解 因为20×70%=14,所以第70百分位数为第14个数和第15个数的平均数,
因为该样本数据的第 70 百分位数是
+172
171,所以
=171,解得
2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x=170.
9.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率
平稳
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
解析 在选项A中,年接待游客量逐年增加,故A正确;在选项B中,月接待游客
量8月份后开始减少,并不是逐月增加,故B错误;在选项C中,各年的月接待
游客量高峰期大致在7,8月,故C正确;在选项D中,各年1月至6月的月接待游
客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.85-0.6
35+
×5≈39.
0.9-0.6
B级
关键能力提升练
10.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的
长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,
其频率分布直方图如图所示,估计棉花纤维的长度的样本数据的第80百分
2021_2022学年新教材高中数学第9章统计9.1.3获取数据的途径学案含解析新人教A版必修第二册
9.1.3 获取数据的途径学习任务核心素养1.知道获取数据的途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(重点)2.了解数据的随机性.(重点)1.通过对获取数据的途径的学习,培养数据分析的素养.2.在获取数据的过程中,培养数学建模的核心素养.“大数据”是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性.这些数据可能得自社交网络、电子商务网站、顾客来访记录和许多其他来源.问题:凭你的经验,日常有哪些获取数据的方法和途径呢?获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量获取数据的基本途径适用类型注意问题通过观察获取数据自然现象要通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数必须根据问题背景知识“清洗”数据,去据有所存储伪存真(2)要了解一种新型灯管的寿命,能通过观察获取数据吗?[提示](1)属于通过查询获取数据的途径.(2)不能,应该通过试验获取数据.1.思考辨析(正确的画“√”,错误的画“×”)(1)要了解一批节能灯的使用寿命,可以采用普查的方式.( )(2)农科院获取小麦新品种的产量可以通过查询获取数据.( )(3)普查获取的资料更加全面、系统,抽样调查更方便、快捷.( )[答案](1)×(2)×(3)√2.下面问题可以用普查的方式进行调查的是( )A.检验一批钢材的抗拉强度B.检验海水中微生物的含量C.调查某小组10名成员的业余爱好D.检验一批汽车的使用寿命C[A不能用普查的方式调查,因为这种试验具有破坏性;B用普查的方式无法完成;C 可以用普查的方式进行调查;D该试验具有破坏性,且需要耗费大量的时间,在实际生产中无法实现.]3.小明从网上查询得到某贫困地区10户居民家庭年收入(单位:万元)如下所示:编号 1 2 3 4 5 6 7 8 9 10年收入________.[由于编号为5的数据为4.6,明显高于其他数据,所以这个数据是不准确的.]类型1 获取数据途径的选择【例1】(1)下列哪些数据一般是通过试验获取的( )A.1988年济南市的降雨量B.2019年新生儿人口数量C.某学校高一年级同学的数学测试成绩D.某种特效中成药的配方(2)“中国天眼”为500米口径球面射电望远镜(Five-hu n dred-meter Aperture Spherical Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据(1)D(2)C[(1)某种特效中成药的配方的数据只能通过试验获得.(2)“中国天眼”主要是通过观察获取数据.]选择获取数据的途径的依据选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.[跟进训练]1.要得到某乡镇的贫困人口数据,应采取的方法是( )A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据A[某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据.] 类型2 获取数据途径的方法的设计【例2】为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?[解](1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.[跟进训练]2.一些期刊杂志社经常会请一些曾经高考落榜而在某方面的事业上取得成就的著名专家、学者,谈他们对高考落榜的看法,这些名人所讲的都是大同小异,不外乎“我也有过落榜的沮丧,但从长远看,它有益于我的人生”“我是因祸得福,落榜使我走了另一条成功之路”等.小明据此得出一条结论:“上大学不如高考落榜”,他的结论正确吗?[解] 小明的结论是错误的,在众多的高考落榜生中,走出另外一条成功之路的是少数,小明通过研究一些期刊杂志社报道过的一些成功人士就得出结论是片面的,因为他的抽样不具有代表性.1.下列调查方式中,可用“普查”方式的是( )A.调查某品牌电视机的市场占有率B.调查某电视连续剧在全国的收视率C.调查某校七年级一班的男女同学的比例D.调查某型号炮弹的射程[答案]C2.粮食安全是每一个国家必须高度关注的问题,在现有条件下,降雨量对粮食生产的影响是非常巨大的,某次降雨之后该地气象台播报说本次降雨量是该地有气象记录以来最大的一次,气象台获取这些数据的途径是( )A.通过调查获取数据B.通过试验获取数据C.通过观察获取数据D.通过查询获得数据C[该地的气象记录和本次的降雨量数据都是通过观察获取的.]3.为了了解我国电视机的销售情况,小张在某网站上下载了下图:(1)小张获取数据的途径是什么?(2)由图可知,电视机的销售总量在2012年达到最大值,你认为电视机销售总量出现下滑的主要原因是什么?[解] (1)小张获取数据的途径是通过查询获得数据.(2)结合我国的经济发展水平可知,从2012年开始,电视机销售总量出现下滑的主要原因是市场的饱和.回顾本节知识,自我完成以下问题:(1)获取数据的基本途径有哪些?(2)各种途径分别适用何种类型?需要注意哪些问题?。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人教版高中数学必修二《第九章统计》单元导学案《9.1.1简单的随机抽样》导学案【学习目标】1.体会随机抽样的必要性和重要性2.理解随机抽样的目的和基本要求;3.掌握简单随机抽样中的抽签法、随机数法的一般步骤【自主学习】知识点1 统计的基本概念1.总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.2.个体:构成总体的每一个元素作为个体.3.样本:从总体中抽出若干个个体所组成的集合叫样本.4.样本容量:样本中个体的数目叫样本容量.知识点2 简单随机抽样1.一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的四个特点(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点3 抽签法和随机数法1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.3.利用随机数法抽取个体时的注意事项(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. (2)定方向:读数的方向(向左、向右、向上或向下都可以).(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.知识点4 总体平均数和加权平均数1.一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称∑==++=Ni iN YN N Y Y Y Y 1211 为总体均值,又称总体平均数.2.一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的一组数据的平均数为x 1f 1+x 2f 2+…+x n f nf 1+f 2+…+f n.这个平均数叫做加权平均数,其中f 1, f 2,…, f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即f i (i =1,2,…,k )越大,表明x i 的个数越多,“权”就越大.【合作探究】探究一 简单随机抽样的判断【例1】下面的抽样是简单随机抽样吗?为什么?(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,连续拿出四件;(2)某学校从300名学生中一次性抽取20名学生调查睡眠情况.解 (1)不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点. (2)不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.反思与感悟 当抽样具有:(1)总体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每个个体被抽到的机会等可能时,为简单随机抽样,否则不是简单随机抽样.【练习1】下面的抽样方法是简单随机抽样的是( )A .盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里B .某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,称其重量是否合格C .某校分别从行政人员、教师、后勤人员中抽取2人,14人,4人了解对他们学校机构改革的意见D .从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)答案 D解析 依据简单随机抽样的特点知,只有D 符合.探究二 简单随机抽样等可能性应用【例2】一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.答案310 18解析 因为简单随机抽样过程中每个个体被抽到的可能性均为n N ,所以第一个空填310.因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为110,第二次抽取时,剩余9个小球,每个小球被抽到的可能性为19,第三次抽取时,剩余8个小球,每个小球被抽到的可能性为18.反思与感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的概率相同,在整个抽样过程中各个个体被抽到的机会也都相等.【练习2】从总体容量为N 的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N 的值为( )A .120B .200C .150D .100答案 A解析 因为从含有N 个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为1N,在整个抽样过程中每个个体被抽到的可能性为30N ,所以30N=0.25,从而有N =120.故选A.探究三 抽签法的应用【例3】某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解 方案如下:第一步,将18名志愿者编号,号码为01,02,03,…,18. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放到一个不透明的盒子中,充分搅匀. 第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员.反思与感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.【练习3】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴. 解 第一步,将20架钢琴编号,号码是01,02,…,20. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀. 第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号. 第五步,与所得号码对应的5架钢琴就是要进行质量检查的对象.探究四 随机数法的应用【例4】假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001, (799)第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7). 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.【练习4】总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )A .答案D解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为01.探究五 总体平均数和加权平均数【例5】小林在八年级第一学期的数学书面测验成绩分别为:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分,如果按照平时、期中、期末的权重分别为10%、30%、60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?解:x (平时单元测试平均成绩)=84+76+923=84(分).所以总平均成绩为84×10%+82×30%+90×60%10%+30%+60%=87(分).所以小林该学期数学书面测验的总平均成绩应为87分【练习5】2. “一世”又叫“一代”.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也”,清代·段玉裁《说文解字注》:“三十年为一世,按父子相继曰世”.而当代中国学者测算“一代”平均为25年.另根据国际一家研究机构的研究报告显示,全球家族企业的平均寿命其实只有26年,约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代甚至更久远(为了研究方便,超过四代的可忽略不计).根据该研究机构的研究报告,可以估计该机构所认为的“一代”大约为()A. 23年B. 22年C. 21年D. 20年答案:B【分析】设“一代”为x年,根据约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代,列出频率分布表,然后根据平均寿命其实只有26年,利用平均数的求法求解.【详解】设“一代”为x年,由题意得:企业寿命的频率分布表为:又因为全球家族企业的平均寿命其实只有26年,所以家族企业的平均寿命为:0.540.50.28 1.50.14 2.50.04 3.526⨯+⨯+⨯+⨯=,x x x xx≈,解得22故选:B《9.1.2分层随机抽样 9.1.3获取数据的途径》导学案【学习目标】1.理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本2.记住分层随机抽样的特点和步骤3.利用分层随机抽样的方法解决实际问题4.了解获取数据的途径,并学会简单应用【自主学习】知识点1 分层随机抽样的概念 (1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)适用范围当总体是由差异明显的几个部分组成时,往往采用分层随机抽样. (3)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.知识点2 分层随机抽样的步骤(1)根据已掌握的信息,将总体分成若干部分.(2)根据总体中的个体数N 和样本量n 计算出抽样比k =nN.(3)根据抽样比k 计算出各层中应抽取的个体数:n N·N i (其中N i 为第i 层所包含的个体总数).(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n 的样本.【合作探究】探究一 分层随机抽样的概念【例1-1】(1) 下列问题中,最适合用分层随机抽样抽取样本的是( ) A .从10名同学中抽取3人参加座谈会B .一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】(1)B (2)C[分析] 当总体由差异明显的几部分组成时,该样本的抽取适合用分层随机抽样,结合题中的四个选项及分层随机抽样的特点可对(1)(2)作出判断.[解析] (1)A中总体个体无明显差异且个数较少,不适合用分层随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.(2)保证每个个体等可能地被抽取是简单随机抽样和分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.归纳总结:1.使用分层随机抽样的前提:,分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【练习1】某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.分层随机抽样法D.任何抽样法都可以【答案】 C解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.探究二分层随机抽样的设计【例2】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.[分析] 观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→成样[解] 因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较妥. ∵20100=15,∴105=2,705=14,205=4. ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人. 因副处级以上干部与工人数都较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.归纳总结:分层随机抽样的特点1适用于总体由差异明显的几部分组成的情况.2更充分体现和反映了总体的情况.3等可能抽样,每个个体被抽到的可能性都相等.【练习2】某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的数量为( )A .15,15,16B .6,30,10C .10,13,23D .12,16,18 【答案】 B解析:三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆). 探究三 获取数据的途径【例3】为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )A .通过调查获取数据B .通过试验获取数据C .通过观察获取数据D .通过查询获得数据【答案】D [因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.]归纳总结:【练习3】下列调查方案中,抽样方法合适、样本具有代表性的是( )A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查【答案】B[A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.]《9.2.1总体取值规律的估计》导学案【学习目标】1.学会用频率分布直方图表示样本数据2.能通过频率分布直方图对数据做出总体统计【自主学习】知识点1 频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.知识点2 频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.【合作探究】探究一 频率分布概念的理【答案】【例1】例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 【答案】 D【答案】析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.归纳总结:由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.【练习1】一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 【答案】 D【答案】析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.探究二 频率分布直方图的绘制【例2】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?【答案】(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.归纳总结:频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.【练习2】如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.【答案】(1)样本频率分布表如下:(2)(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.探究三频率分布直方图的应用【例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).【答案】 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.归纳总结:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【练习3】某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )A.45 B.50 C.55 D.60【答案】 B【答案】析结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为150.30=50,故选B.《9.2.2总体百分位数的估计》导学案【学习目标】1.理解百分位数的概念2.掌握计算百分位数的方法【自主学习】知识点1 百分位数(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.知识点2 如何计算百分位数下面的步骤来说明如何计算第p百分位数.第1步:以递增顺序排列原始数据(即从小到大排列).第2步:计算 i =np %.第3步:①若 i 不是整数,将 i 向上取整.大于i 的比邻整数即为第p 百分位数的位置;②若i 是整数,则第p 百分位数是第i 项与第(i +1)项数据的平均值.【合作探究】探究一 百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g) 如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0. (1)分别求出这组数据的第25,75,95百分位数. (2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4, 则第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g, 第95百分位数是9.9 g ,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.【练习1】以下数据为参加数学竞赛决赛的15人的成绩: 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位数是( ) A .90 B .90.5 C .91 D .91.5答案B [把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.]探究二 百分位数的综合应用【例2】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y (单位:元)关于月用电量x (单位:千瓦时)的函数解析式. (2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a ,b 的值.(3)根据(2)中求得的数据计算用电量的75%分位数.[解] (1)当0≤x ≤200时,y =0.5x ;当200<x ≤400时,y =0.5×200+0.8×(x -200)=0.8x -60; 当x >400时,y =0.5×200+0.8×200+1.0×(x -400)=x -140. 所以y 与x 之间的函数解析式为 y =⎩⎪⎨⎪⎧0.5x ,0≤x ≤200,0.8x -60,200<x ≤400,x -140,x >400.(2)由(1)可知,当y =260时,x =400,即用电量不超过400千瓦时的占80%, 结合频率分布直方图可知⎩⎪⎨⎪⎧0.001×100+2×100b +0.003×100=0.8,100a +0.000 5×100=0.2,解得a =0.001 5,b =0.002 0. (3)设75%分位数为m ,。