2015-2016学年人教B版高中数学课件 必修3:第二章 统计 2.1《用样本的频率分布估计总体分布》(2课时)
高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3
2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3
解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
人教版新课标B版高中数学所有目录和知识点
选修4-1 几何证明选修4-4 坐标系与参数方程选修4-5 不等式选讲每章节主要内容:必修1 集合1.如何区分φ、{φ}、0、{();}?2.集合的运算有哪些常用性质与结论?3.对应、映射、函数有何关系?必修1 函数4.求函数解析式有哪些常用方法?5.判断函数单调性有哪些常用方法?6.函数的单调性有哪些应用?7.判断函数奇偶性要注意什么?判断函数奇偶性常用的方法有哪些?8.函数的奇偶性有哪些性质?9.函数一定存在反函数么?什么样的函数存在反函数?10.如何求二次函数在区间上的最值?11.函数的零点是函数的图像与x轴的交点吗?它与方程的根有何关系?12.分数指数幂与根式有何关系?13.指数式ab=N与对数式logoN中,a,6,N三者之间有何关系?14.指数函数、对数函数有哪些常见问题?必修2 直线和圆的方程20.直线的倾斜角和斜率有何关系?21.直线方程的五种形式有哪些限制条件?22.两直线平行、垂直的等价条件是什么?23.什么是直线系?常见的直线系有哪些?有何应用?24.平面解析几何中常用的对称公式有哪些?25.求圆的方程常用的方法有哪些?26.直线与圆有几种位置关系?如何判断?27.圆与圆有几种位置关系?如何判定?28.会写出过两圆交点的圆系方程吗?它有何应用?必修3 算法29.算法有哪些特征?它的描述方法有哪些?30.画程序框图有什么规则?31.算法有几种基本的逻辑结构?共同点是什么?如何用框图表示?32.基本的算法语句有哪几种?如何使用?必修3 统计——抽样33.简单随机抽样有什么特点?它有哪些具体的方法?34.系统抽样有什么特点?当总体容量不能被样本容量整除时怎么办?35.分层抽样、简单随机抽样、系统抽样有什么共同点和不同点?必修3 统计——样本分布36.样本频率分布直方图与总体密度曲线有何关系?37.什么是众数、中位数、平均数?这些数字特征在反映总体时有哪些优缺点?38.方差和标准差在反映总体时有什么意义?必修3 概率39.频率和概率有何关系?40.互斥事件与对立事件有何关系?如何判断互斥事件与对立事件?15.幂函数的图像有哪几种形式?有哪些性质?必修2 立体几何16.如何证明线线、线面、面面之间的平行和垂直?17.四面体中有哪些常见的数量关系和位置关系?18.立体几何中分割与补形有哪些常见技巧?19.经度、纬度分别指的是什么角?如何求两点间的球面距离?必修2 直线和圆的方程20.直线的倾斜角和斜率有何关系?21.直线方程的五种形式有哪些限制条件?22.两直线平行、垂直的等价条件是什么?23.什么是直线系?常见的直线系有哪些?有何应用?24.平面解析几何中常用的对称公式有哪些?25.求圆的方程常用的方法有哪些?26.直线与圆有几种位置关系?如何判断?27.圆与圆有几种位置关系?如何判定?28.会写出过两圆交点的圆系方程吗?它有何应用?必修3 算法29.算法有哪些特征?它的描述方法有哪些?30.画程序框图有什么规则?31.算法有几种基本的逻辑结构?共同点是什么?如何用框图表示?32.基本的算法语句有哪几种?如何使用?必修3统计——抽样33.简单随机抽样有什么特点?它有哪些具体的方法?34.系统抽样有什么特点?当总体容量不能被样本容量整除时怎么办?35.分层抽样、简单随机抽样、系统抽样有什么共同点和不同点?必修3统计——样本分布36.样本频率分布直方图与总体密度曲线有何关系?37.什么是众数、中位数、平均数?这些数字特征在反映总体时有哪些优缺点?38.方差和标准差在反映总体时有什么意义?必修3 概率39.频率和概率有何关系?40.互斥事件与对立事件有何关系?如何判断互斥事件与对立事件?……必修4 三角函数必修4 平面向量必修5 解三角形必修5 数列必修5 不等式选修2-1(选修1-1)简单逻辑选修2-1(选修1-1)圆锥曲线选修2-1 空间向量、角度及距离选修2-2 导数、微积分定理选修2-2(选修1-2)推理与证明复数选修2-3 排列组合、二项式定理、数据分布选修4-1 几何证明选修4-4 坐标系与参数方程选修4-5 不等式选讲。
高中数学人教新课标B版必修3--《2.2.1用样本的频率分布估计总体的分布》课件4
1
解1:总睡眠时间约为 6.25×5+6.75×17 +7.25×33+7.75×37+8.25×6+8.75×2 =739(h)
故平均睡眠时间约为7.39h 解2:求各组中值与对应频率之积的和, 6.25×0.05+6.75×0.17+7.25×0.33+7.75× 37+8.25×0.06+8.75×0.02 =7.39(h)
解:估计该单位职工的平均年收入为 12500×10%+17500×15%+22500×20%+ 27500×25%+32500×15%+37500×10%+ 45000×5%=26125(元) 答:估计该单位人均年收入约为26125元.
练习题: 1.若M个数的平均数是x,N个数的平均数
Mx Ny
(2)中位数不受少数几个极端数据的影 响,容易计算,它仅利用了数据中排在中 间的数据的信息。当样本数据质量比较差, 即存在一些错误数据时,应该用抗极端数 据强的中位数表示数据的中心值。
(3)平均数受样本中的每一个数据的影 响,“越离群”的数据,对平均数的影响 也越大,与众数和中位数相比,平均数代 表了数据更多的信息,当样本数据质量比 较差时,使用平均数描述数据的中心位置 可能与实际情况产生较大的误差。
2.2.2 用样本的数字特征估计 总体的数字特征(一)
一、众数、中位数、平均数
(1)众数:在样本数据中,频率散布最 大值所对应的样本数据或出现次数最多的 那个数据。
(2)中位数:样本数据中,累计频率为 0.5时所对应的样本数据或将数据按大小 排列,位于最中间的数据(如果数据的个 数为偶数,就取当中两个数据的平均数作 为中位数)。
人教版高二数学必修3(B版)电子课本课件【全册】
1.2.1 赋值、输入和输出语
1.2.3 循环语句
本章小结
附录1 解三元一次方程组的算法、框图和程序
第二章 统计
2.1.2 系统抽样
2.2 用样本估计总体
2.2.1 用样本的频率分布
2.3 变量的相关性
2.3.1 变量间的相关关系
本章小结
附录 随机数表
3.1 事件与概率
3.1.1 随机现象
3.1.3 频率与概率
3.2 古典概型
3.2.1 古典概型
3.3 随机数的含义与应用
Байду номын сангаас
3.3.1 几何概型
3.4 概率的应用
第一章 算法初步
人教版高二数学必修3(B版)电子课 本课件【全册】
1.1 算法与程序框图 1.1.1 算法的概念
人教版高二数学必修3(B版)电子课 本课件【全册】
人教版高二数学必修3(B版)电子 课本课件【全册】目录
0002页 0042页 0098页 0152页 0198页 0200页 0202页 0236页 0290页 0340页 0431页 0433页 0478页 0522页 0568页 0620页 0662页
第一章 算法初步
1.1.2 程序框图
1.2 基本算法语句
高中数学人教新课标B版必修3--《2.2.2用样本的数字特征估计总体的数字特征》课件3
x 4.91
问题3: 如何从频率散布直方图中估
计平均数,为什么?
21:32
答案:91.5,91.5
计中位数,为什么?
21:32
2 中位数:左边和右边的直方图面积相等
前三个矩形的面积和=0.41
后四个小矩形的面积和=0.48
0.25
0.15
0.13 0.10
0.06 0.22
0.09 0.11
4.91
分总析结::在在样本频数率据散中布,直有5方0%图的中个体,小把于频或率等散于中布位直数方,图也划有5分0%左的个右体两大
0.25
0.15
0.13 0.10
0.06 0.22
0.09 0.11
21:32
18
从锻炼时间样本数据可知,该样本的众数是3.5, 中位数是4.75,平均数是4.825。这与我们从样本频率 散布直方图得出的结论有偏差,你能解释一下原因吗?
因频率散布直方图本身得不出原始的数据内容, 所以由频率散布直方图得到的众数、中位数平 均值的估计往往与样本的实际中位数值不一致.
分析:众数为200,中位数为220,
平均数为300。
因平均数为300,由表格中所列 出的数据可见,只有经理在平均数以 上,其余的人都在平均数以下,故用 平均数不能客观真实地反应该工厂的 工资水平。
二、归纳提升: 众数、中位数、平均数的特点
特征数 众数 中位数 平均数
作用
局限性
众数体现了样本数据 的最大集中点
2015-2016学年高一数学教学课件3.2.1第3课时《换底公式与自然对数》(新人教B版必修1)
• 1.换底公式
•.
logaN
• 一般地,logbN=lo_g_ab________,其中b>0,
b≠1,N>0,a>0,a≠1,这个公式称为对数
的换底公式.
• 2.自____为底的对数叫做自然对数, logeN通常记作________.
• 6.若logab·log3a=4,求b的值.
[解析] ∵logab·log3a=llggba·llgg3a=4, ∴lgb=4lg3=lg34,∴b=34=81.
课堂典例讲练
应用换底公式求值
计算:lg12-lg58+lg12.5-log89·log278.
• [分析] 观察题目中对数的底数不同,可利用 换底公式化成同一底数,再进行计算.
A.aabb+ +31
B.aabb++13
C.abb++31
D.aabb- +31
• [答案] A
[解析] ∵log23=llgg32=a,log37=llgg73=b, ∴ab=llgg32·llgg73=llgg27. ∴lg7=ablg2. ∴log1456=llgg5164=llgg77++3llgg22 =aabb+ +31llgg22=aabb+ +31.
∵xy=1 或 4, ∴log 2xy=log 21=0 或 log 2xy=log 24=4.
• [辨析] 误解中忽视了对数的真数大于0这一 条件.
[正解] ∵lgx+lgy=2lg(x-2y),∴xy=(x-2y)2,即 x2- 5xy+4y2=0.
∴(x-y)(x-4y)=0,解得 x=y 或 x=4y. ∵x>0,y>0,x-2y>0,∴x=y 应舍去. ∴xy=4,∴log 2xy=log 24=4.
(2)∵4a=5b=m,∴a=log4m,b=log5m, 又1a+2b=1,∴log14m+log25m=1, 即 logm4+2logm5=1,∴logm100=1,∴m=100.
数学:2.1.1《简单随机抽样》课件(3)(新人教B版必修3)
阅读第44~ 页内容 页内容, 阅读第 ~48页内容,回答下列问题 :
(1)什么是简单随机抽样? )什么是简单随机抽样? (2)简单随机抽样有几种? )简单随机抽样有几种? (3)简单随机抽样的特点是什么? )简单随机抽样的特点是什么?
答(ቤተ መጻሕፍቲ ባይዱ)简单随机抽样 )
随机数表法设计方案的步骤
第一步:将总体中的所有个体编号( 第一步:将总体中的所有个体编号(每个号码位数 一致); 一致); 第二步:在随机数表中任选一个数作为开始; 第二步:在随机数表中任选一个数作为开始; 第三步:从选定的数开始按一定的方向读下去, 第三步:从选定的数开始按一定的方向读下去,得 到的数码若不在编号中,则跳过;若在编号中, 到的数码若不在编号中,则跳过;若在编号中,则 取出。得到的数码若在前面已经取出,则跳过。 取出。得到的数码若在前面已经取出,则跳过。如 此进行下去,直到取满为止; 此进行下去,直到取满为止; 第四步:根据选定的号码抽取样本。 第四步:根据选定的号码抽取样本。
一般地,用抽签法从容量为 的总体中抽取一个 一般地,用抽签法从容量为N的总体中抽取一个 容量为n的样本的步骤为 的样本的步骤为: 容量为 的样本的步骤为: 第一步:给总体中的所有个体编号( 第一步:给总体中的所有个体编号(号码可以从 1到N; 到 ; 第二步: 个号码写在形状、 第二步:将1~N这N个号码写在形状、大小相同的 这 个号码写在形状 号签上; 号签上; 第三步:将号签放到一个不透明的容器中, 第三步:将号签放到一个不透明的容器中,搅拌 均匀; 均匀; 第四步:从容器中每次抽取一个号签, 第四步:从容器中每次抽取一个号签,并记录其编 连续抽取n次 号,连续抽取 次; 第五步: 第五步:从总体中将与抽到的编号一致的个体取出
人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测
人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
数学:2.1.1《简单随机抽样》课件(1)(新人教B版必修3)
2、随机数表法 步骤: 步骤: 制定随机数表; 一般会给出) 10.制定随机数表;(一般会给出) 20. 给总体中各个个体编号 ; ( 起始号码选 00 , 而 给总体中各个个体编号; 起始号码选00 00, 不选01 可使100个个体都可用2位数表示) 01, 100个个体都可用 不选01,可使100个个体都可用2位数表示) 选定开始的数字; 随机) 30.选定开始的数字;(随机) 获取样本号码。 按顺序列出,以免重复) 40.获取样本号码。(按顺序列出,以免重复)
n 的样本, 为n的样本,那么每一个个体被抽到的概率都等于 N
说明:简单随机抽样一个最大的特点: 说明:简单随机抽样一个最大的特点:它是一种等概率 抽样,这就体现了抽样的客观性和公平性, 抽样,这就体现了抽样的客观性和公平性,而且这种方 法比较简单,因此在生活中有广泛的应用。 法比较简单,因此在生活中有广泛的应用。
总体:所要考察对象的全体。 总体:所要考察对象的全体。问:“为了了解我市初一年 级 11000 名 学 生 的 身 高 情 况 ……” 这 一 问 题 中 的 总 体 是 11000名学生 名学生” “11000名学生”吗? 个体:总体中的每一个考察对象。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做这个总体的一个样本。 样本:从总体中抽取的一部分个体叫做这个总体的一个样本。 样本容量:样本中个体的数目。 样本容量:样本中个体的数目。问:对于一个确定的总体, 对于一个确定的总体, 其样本唯一确定吗? 其样本唯一确定吗? ——统计的基本思想方法: 统计的基本思想方法: 统计的基本思想方法 用样本估计总体,即通常不直接去研究总体, 用样本估计总体,即通常不直接去研究总体,而是 通过从总体中抽取一个样本, 通过从总体中抽取一个样本,根据样本的情况去估计总 体的相应情况。 体的相应情况。
人教版高中数学B版必修一《第二章 等式与不等式——一元二次方程的解集及其根与系数的关系》课件
一
二
课前篇 自主预习
2.填空
方程 ax2+bx+c=a
x+2������������
2+4������������-������2(a≠0),
4������
(1)当 Δ=b2-4ac>0 时,方程的解集为
-������+
������2-4������������ 2������
,
-������-
������2-4������������ 2������
么可得 x=± ������或 mx+n=± ������,从而通过降次转化为一元一次方程. (2)配方法: 用配方法解一元二次方程的一般步骤是: ①化二次项系数为1:用二次项系数去除方程两边,将方程化为 x2+px+q=0的形式; ②移项:把常数项移至方程右边,将方程化为x2+px=-q的形式; ③配方:方程两边同时加上“一次项系数一半的平方”,使方程左边成 为含有未知数的完全平方形式,右边是一个常数,把方程化为 (x+m)2=n(n≥0)的形式; ④用直接开平方法解变形后的方程.
=
4������������ 4������.
(2)原方程等价于(x-2)(x+1)=0,
∴方程的两根为 x1=2,x2=-1.
x1+x2=1,x1x2=-2.
课前篇 自主预习
-8-
-9-
课堂篇 探究学习
探究一
探究二
思维辨析 当堂检测
反思感悟 一元二次方程的常见解法 (1)开平方法:如果方程能化成 x2=p 或(mx+n)2=p(p≥0)的形式,那
x1+x2= 2������ + 2������
数学:2.2.1《用样本的频率分布估计总体分布》课件(新人教B版必修3)
2.2.1 用样本的频率分布估计总 体分布
探究: 我国是世界上严重缺水的 国家之一,城市 缺水问题较为突出。某市政府为了节约用 水,计划在 本市试行居民生活用水定额管 理,即确定一个居民月用水量标准a,用水 量不超过a的按平价收费,超过 a的按议价 收费。如果希望大部分居民的 日常生活不 受影响,那么标准a定为多少比较合理? 你认为,为了较为合理地确定出这个标准, 需要做什么工作?
茎是指中间的一列 数,表示得分的十位 甲 数
茎叶图
叶就是从茎的旁边 生长出来的数,表示得 分的个位数。 乙
8
0 1
4 6 3
3 6 8
2 5
5 4
2
3
3 8 9
1 6 1 6 7 9
4 9
4 1
5
0
茎叶图不仅能够保留原始数据,而且能够 展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的 成绩更好;从叶在茎上的分布情况来看,乙运 动员的得分更集中于峰值附近,说明乙运动员 的发挥更稳定。
0.50 0.40 0.30 0.20 0.10
0.5
1 1.5 2 2.5 3
3.5 4
月均用水量 /t 4.5
频率分布直方图如下:
频率
组距
直方图有那些 优点和缺点?
0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5
0.5
1 1.5 2 2.5 3
3.5 4
频率/组距 0.50 0.40 0.30 0.20
2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
高中数学人教B版必修3 2.1 教学设计 《数据收集》(人教)
《数据收集》
教材介绍了收集数据的3种方法,重点介绍了设计调查问卷.
值得注意的是:数据的收集是学生学习的好材料,教师可以设计一些问题让学生完成,例如:怎样可以得到你所在班级同学的身高数据,怎样可以得到我国历次人口普查的数据,等等,让学生思考数据收集常用的方法.教师及时地总结并完善.
对于设计调查问卷,教师要给学生强调设计题目注意事项: (1) 设计的题目要具体,有针对性,使受调查者能够容易作答; (2) 语言简单、准确,含义清楚,避免出现歧义或意思含混的句子;(3) 题目不能出现引导受调查者答题倾向的语句.
【知识与能力目标】
1.能通过试验、查阅资料、设计调查问卷的方法收集数据;
2.引导学生根据实际问题的需要合理选择不同的方法,合理收集数据;
3.通过收集数据,增强学生的社会实践能力。
【过程与方法能力目标】
通过对现实生活中实际问题分析数据收集,感知应用数学知识解决实际问题的方法。
【情感态度价值观目标】
通过对统计学知识的研究,培养学生辩证唯物主义世界观与价值观。
【教学重点】
通过试验、查阅资料、设计调查问卷的方法收集数据。
【教学难点】
设计调查问卷。
多媒体课件
一、新课导入
提出问题:中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率,下面是三名同学为电视台设计的调查方案:
同学A:把《春节联欢晚会收视率调查表》放在互联网上,统计反馈意见.
同学B:给居民小区的每家住户发是否在除夕当晚看中央电视台的春节联欢晚会的调查。
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
人教B版必修3 2.1.2 系统抽样 课件(29张)
多少时不需要剔除个体( )
A.3
B.4
C.5
D.6
解析:选 B ∵524=4×131,∴抽样间隔为 4 时,不需要
剔除个体.
4.某中学采用系统抽样方法,从该校高一年级全体 800 名
学生中抽取 50 名学生做牙齿健康检查.现将 800 名学生从 1 到
800 进行编号.已知 33~48 这 16 个数中抽到的数是 39,则在第
6.将参加夏令营的 600 名学生编号:001,002,…,600,采
用系统抽样的方法抽取一个容量为 50 的样本,且随机抽得的号
码为 003,这 600 名学生分住在三个营区,从 001 到 300 住第一
营区,从 301 到 495 住第二营区,从 496 到 600 住第三营区,这
三个营区被抽中的人数依次为( )
的数目为(720-480)÷20=12.
课后拔高提能练
一、选择题
1.从学号为 0~50 的高一某班 50 选中的 5 名学生的
学号可能是( )
A.1,2,3,4,5
B.2,4,6,8,10
C.3,13,23,33,43 解析:选 C
D.都相等,且为410
解析:选 C 因为在系统抽样中,若所给的总体个数不能被
样本容量整除,则应先剔除几个个体,本题先剔除 16 人,然后
再分组,在剔除过程中,每个个体被剔除的机会相等,所以,每
个个体被抽到的机会都相等,均为2
50016=1
25 008.
3.总体容量为 524,若采用系统抽样法抽样,当抽样间隔为
1 小组 1~16 中随机抽到的数是( )
A.5
B.7
C.11
D.13
解析:选 B 间隔数 k=85000=16,即每 16 人抽取一个人.由
高中人教版必修2数学课件第二章2.1.2精选ppt课件
() A.2 对
B.3 对
C.6 对
D.12 对
解析:选 C.如图所示,在长方体 AC1 中,与对角线 AC1 成异面 直线位置关系的是:A1D1、BC、BB1、DD1、A1B1、DC,所以 组成 6 对异面直线.
3.如图,点 G、H、M、N 分别是三棱柱的顶点或所在棱的中 点,则表示直线 GH,MN 是异面直线的图形是________.
(1)判断两直线平行仍是立体几何中的一个重要组成部分,除了 平面几何中常用的判断方法以外,公理 4 也是判断两直线平行的 重要依据. (2)证明角相等,利用空间等角定理是常用的思考方法;另外也 可以通过证明两个三角形全等或相似来证明两角相等.在应用等 角定理时,应注意说明这两个角同为锐角、直角或钝角.
(2)异面直线所成的角 两条异面直线所成的角是由两条相交直线所成的角扩充而成的, 由平移原理可知,当两条异面直线在空间的位置确定后,它们所 成的角的大小也就随之确定了.
1.分别在两个平面内的两条直线间的位置关系是( )
A.异面
B.平行
C.相交
D.以上均有可能
答案:D
2.长方体的一条体对角线与长方体的棱所组成的异面直线有
章 点、直线、面之间的位置关系
2.1.2 空间中直线与直线之间的位置关系
第二章 点、直线、平面之间的位置关系
1.会判断空间两直线的位置关系. 2.理解两异面直线的 定义,会求两异面直线所成的角. 3.能用公理 4 解决一些简单的相关问题.
1.空间直线的位置关系 (1)异面直线 ①定义:把不同在_任__何__一__个__平面内的两条直线叫做异面直线. ②画法:(通常用平面衬托)
A.6 C.5 答案:B
B.4 D.8
3.若正方体 ABCD-A1B1C1D1 中∠BAE=25°.
高中数学 第二章 统计 2.1 随机抽样教材习题点拨 新人教B版必修3-新人教B版高中必修3数学试题
高中数学第二章统计 2.1 随机抽样教材习题点拨新人教B版必修3练习A1.什么是简单随机抽样?解:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.在一般“调查”时,为什么要进行抽样调查?解:做一般“调查”最好是对每一个个体逐一进行“调查”,但这样做有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.3.如果想了解你所在班上同学喜欢听数学课的比例,计划抽取8名同学做调查.请你用抽签法抽取一个样本.解:(1)将班内60名同学的学号1,2,…,60分别写在相同的60X纸片上.(2)将60X纸片放在一个容器里均匀搅拌之后,就可以抽样.(3)抽出一X纸片,记下上面的,然后均匀搅拌,继续抽取第2X纸片,记下这个,重复这个过程,直到取得8个时终止.(4)于是,和这8个对应的同学就构成了一个简单随机样本.练习B1.某居民区有730户居民,居委会计划从中抽取25户调查其家庭收入状况,你能帮助居委会抽出一个简单随机样本吗?解:随机数表法:(用教材第87页的随机数表)(1)将730户居民编号为001,002, (730)(2)给出的随机数表是5个数一组,使用各个5位数组的后3位,从各个数组中任选一个后3位小于或等于730的数作为起始,如从第2行的第6组开始,取出572作为25户中的第1个代号;(3)继续向右读,每组后3位符合要求的数取出,前面已经取出的跳过,到行末转下一行从左向右继续读,得数据:572,483,459,073,242,372,048,088,600,636,171,247,303,422,421,183,546,385,120,042 ,320,500,219,225,059.编号为以上所选的25个的居户被选中.2.使用计算器或计算机制作一X1 000个一位数的随机数表,并检查0~9这10个数在表中出现的可能性是否相同?解:相同.练习A1.什么是系统抽样?系统抽样有什么优点?解:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.系统抽样的优点:它很好地解决了当总体容量和样本容量都较大时,用简单随机抽样不方便的问题.2.从编号为1~900的总体中用系统抽样的办法抽取一个容量为9的样本.解:按编号顺序分成9组,每组100个号,先在第一组用简单随机抽样方式抽出k(1≤k≤100)号,其余的k+100n(n=1,2,…,8)也被抽到,即可得所需样本.练习B1.某批产品共有1 563件,产品按出厂顺序编号,为从1~1 563.检测员要从中抽取15件产品作检测,请你给出一个系统抽样方案.解:S1 将产品的调整为0001,0002,0003, (1563)S2 从总体中剔除3件产品(剔除方法可用随机数表法),将剩下的1 560件产品重新编号(分别为0001,0002,…,1560),并分成15段;S3 在第一段0001,0002,...,0104,这104个编号中用简单随机抽样抽出一个(如0003)作为起始,则各段对应编号分别为0003,0107,0211, (1459)S4 将编号为0003,0107,0211,…,1459的个体抽出,即得到一个容量为15的样本.2.要考察某商场2003年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案.并说说你的抽样方案的优点和不足.解:S1 用随机数表法从365天中随机剔除1天;S2 将其余的364天编号,为001,002,003,…,364,并将依次分为52段;S3 在第一段001,002,…,007这7个中用抽签法选取一个,如002;S4 将为002,009,016,…,359的日期找出,组成样本.该抽样方案的优点是:抽取的样本能代表总体;缺点是:所抽取的日期与日常用的日期相比规律性差,不便于该方案的操作.练习A1.某校高一学生共500名,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%.为了考查学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本.解:由题意知喜欢数学的学生有150人,不喜欢数学的有200人,介于两者之间的有150人.三个层次的学生人数之比为3∶4∶3.所以应抽喜欢数学的学生15人,不喜欢数学的学生20人,介于两者之间的学生15人.用随机数表法抽样分别从对应的部分抽取相应的人数即可.2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了调查员工的身体健康状况,从中抽取100名员工,用分层抽样应当怎样抽取?解:S1 确定抽样比100500=15,所以不到35岁的应抽取125÷5=25(人),35~49岁的应抽取280÷5=56(人),50岁以上的应抽取95÷5=19(人);S2 用简单随机抽样法或系统抽样法分别抽取不到35岁的25人,35~49岁的56人;50岁以上的19人.这些人便组成了我们要抽取的样本.3.某大学就餐中心为了了解新生的饮食习惯,以分层抽样的方式从1 500名新生中抽取200名进行调查,新生中的南方学生有500名,北方学生有800名,西部地区的学生有200名,应如何抽取?解:由题意知南方学生有500名,北方学生有800名,西部地区的学生有200名.样本容量与总体容量的比为200∶1 500=2∶15.所以应抽取南方学生约67名,北方学生约106名,西部地区的学生约27名.用分层抽样法分别从对应的部分抽取相应的人数即可.练习B某市电视台在因特网上征集电视节目的现场参与观众,报名的共有12 000人,分别来自4个城区,其中东城区2 400人,西城区4 605人,南城区3 795人,北城区1 200人.用分层抽样的方式从中抽取60人参加现场节目,应当如何抽取?解:从12 000人中抽取60人,抽取比例为12 000∶60=200∶1,所以应在东城区抽取 2 400÷200=12(人),在西城区抽取 4 605÷200≈23(人),在南城区抽取 3 795÷200≈19(人),在北城区抽取1 200÷200=6(人).用系统抽样法分别从对应的部分抽取相应的数即可.练习A1.想一想怎样可以得到你所在班级同学的身高数据.解:设计调查问卷请每位同学填写自己的身高,然后汇总即可.2.你还能想到哪些可以得到数据资料的途径?解:如:教材或教材提供的数据;课堂数据(它们是在教室中收集的,主要与班上的学生有关,而不问结论是否对于更大的群体也成立).练习B为了了解中学生如何度过课余时间,请你设计一份关于中学生课余活动的调查问卷,实际调查后写出调查分析报告.解:提示:在设计调查问卷时,设计的题目意思要明确,覆盖面要广,不要有答题倾向即可.习题2-1A1.为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里的总体、个体、样本、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?解:统计的总体是指该地10 000名高一学生的体重;个体是指这10 000名学生中每一名学生的体重;样本是指这10 000名学生中抽出的200名学生的体重;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取机会均等的前提下从总体中抽取部分个体,进行抽样调查.2.要从编号为1~100的100道选择题中随机抽取20道题组成一份考卷,请你用抽签法给出考题的编号.解:(1)编号1~100;(2)制作大小相同的号签,并写上;(3)放入一个大容器,均匀搅拌;(4)依次抽取20个签(注意每次都要均匀搅拌),具有这20个编号的题组成一份考卷.3.某商店有590件货物,要从中选出50件货物做质量检查,请你用随机数表法给出一个抽样方案.解:(1)将590件货物编号为001,002, (590)(2)给出的随机数表是5个数一组,使用各个5位数组的中间3位,从各个数组中任选中间3位小于或等于590的数作为起始,如从第3行的第4列数037开始,取出037作为590件货物中的第1个代号;(3)继续向右读,将每组中间3位符合要求的数取出,已取出重复的跳过,到行末转下一行从左向右继续读,得数据:037,104,460,463,317,290,030,042,142,237,318,154,038,212,404,132,…,编号为以上所选的50个的货物被选中,即得到一个容量为50的样本.4.故宫博物院某天接待游客10 000人(假设把他们编号为0~9 999),如果要从这些游客中随机选出10名幸运游客,请你用系统抽样的方式给出幸运游客的编号.解:按编号顺序分成10组,每组1 000个号,先在第1组用简单随机抽样方式取出k(0≤k≤999)号,其余的k+1 000n(n=1,2,…,9)也被抽到,即可得到所需样本.5.一支田径队中有男运动员56人,女运动员42人,用分层抽样的方式从全队中抽取28名运动员.解:从男运动员中抽16人,女运动员中抽12人.6.某市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家.为了了解商店的销售情况,要从中抽取21家商店进行调查,请你用分层抽样的方式进行抽取.解:大型商店、中型商店、小型商店分别抽取2家、4家、15家.习题2-1B1.某公园为了考察每天游览的人数,从一年中要抽取30天进行统计,请你分别用随机数表法、系统抽样法、分层抽样法给出样本,并根据样本比较这3种抽样方式.解:方法1:随机数表法S1 将一年的365天编号为001,002, (365)S2 在教材第一节提供的随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选第1行第6个数“5”,向右读;S3 从数“5”开始,向右读,每次读取3位,凡不在001~365中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到30个符合要求的;S4 以上对应的日期就是抽取的对象.方法2:系统抽样法S1 将365天用随机方式编号;S2 从总体中剔除5天(剔除方法可用随机数表法),将剩下的360天重新编号(分别为001,…,360),并分成30段;S3 在第一段001,…,012这12个编号中用简单随机抽样抽出一个(如003)作为起始;S4 将编号为003,015,027,…,351的日期抽出,组成样本.方法3:分层抽样法S1 将一年分为春、夏、秋、冬四个层次;S2 在每个层次中用随机数表法抽取8天;S3 4×8=32,再用抽签法剔除2天,剩下的30天组成样本.点拨:3种抽样方法的共同点是每个个体被抽到的可能性均相等.2.随着互联网络的发展与普及,网络调查方式的使用越来越多.你能比较一下传统的调查方式与网络调查方式的优劣吗?解:网络调查省时、省力,但有时也不具备代表性.如调查农业方面的问题,应该调查农民,但农民上网的人数很少;传统调查方式虽费时、费力,但针对性强.。
高中数学人教B版必修3 2.1 素材 《简单随机抽样》随机数表法(人教)
用随机数表法抽取样本的优缺点:
优点:简单易行。 它很好地解决了用抽 签法时,当总体中的个体数较多时制签难 的问题。 缺点:当总体中的个体数很多,需要的样 本容量也很大时,用随机数表法抽取样本 仍不方便。
用随机数表法抽取样本的步骤:
S1 将总体中的所有个体编号(每个号码 位数一致); S2 在随机数表中任选一个数作为开始; S3 从选定的数开始按一定的方向读下去, 得到的号码若不在编号中,则跳过;若在 编号中,则取出。得到的号码若在前面已 经取出,也跳过,如此进行下去,直到取 满为止; S现方式做保护处理对用户上传分享的文档内容本身不做任何修改或编辑并不能对任何下载内容负责
四、随机数表法
随机数表由数字0,1,2,3,……,9 这10个数字组成,并且每个数字在表中各 个位置上出现的机会一样。通过随机数生 成器,例如计算器或计算机的应用程序生 成随机数的功能,可以生成一张随机数表.
(3) 继续向右读,由于987>850,跳过这 组数不取,继续向右读,得到415作为第 2个代号。数组的前3位数不大于850且不 与前面取出的数重复,就把它取出,否 则跳过不取,取到一行末尾时转到下一 行从左到右继续读,如此下去,直到得 到在001~850之间的50个读数或其它有规则的读数方法。
通过随机数表,根据实际需要和方便使 用的原则,将几个数组合成一组,然后抽 取样本。
例如要考察某种品牌的850颗种子的发 芽率,从中抽取50颗种子进行实验。用 随机数表抽取的步骤如下:
(1) 对850颗种子进行编号:可以编为001, 002,……,850.
(2) 给出的随机数表是5个数一组,使用 各个5位数组的前3位,从各组数中任选 一个前3位小于或等于850的数作为起始 号码,例如从第1行第7组开始,取出530 作为抽取的第1个代号;
人教版高中数学必修3课件第二章标准差
(3)样本中共有五个个体,其值分别为 a,0,1,2,3,若该样 本的平均值为 1,则样本方差为___2_____.
解析 由题意知15×(a+0+1+2+3)=1,解得 a=-1. 所以样本方差为 s2=15×[(-1-1)2+(0-1)2+(1-1)2 +(2-1)2+(3-1)2]=2.
课堂互动探究
解 (1)根据题中所给数据,可得甲的平均数为
x 甲=110×(8+9+7+9+7+6+10+10+8+6)=8,
乙的平均数为 x 乙=110×(10+9+8+6+8+7+9+7+8
+8)=8,
甲的标准差为
s
甲
=
110×[8-82+9-82+…+6-82]= 2,
乙的标准差为
s
乙
=
110×[10-82+9-82+…+8-82]= 530,
=6,ຫໍສະໝຸດ 则标准差为
51×[2-62+4-62+6-62+8-62+10-62] =
2 2.
3.甲、乙、丙、丁四人参加某运动会射击项目选拔赛, 四人的平均成绩和方差如下表所示:
若要从这四人中选择一人去参加该运动会射击项目比 赛,最佳人选是___丙_____.(填“甲”“乙”“丙”“丁” 中的一个)
拓展提升 由图形分析标准差、方差的大小
从四个图形可以直观看出第一组数据没有波动性,第 二、三组数据的波动性都比较小,而第四组数据的波动性相 对较大,利用标准差的意义可以直观得到答案.
【跟踪训练 3】 甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
高中数学人教B版必修3 2.1 素材 《系统抽样》例题(人教)
新郑二中分校 高一数学组
例2. 某单位在岗职工共 624人 , 为了调查工人用于 上班途中的时间 , 决定抽取 10 % 的工人进行调 查 . 如何采用系统抽样方法完成这一抽样 ? 分析 : 因为 624 的 10 % 约为 62 , 624 不能被 62 整除 , 为了保证 “ 等距 ” 分段 , 应先剔 除 4 人 . 解: 第一步 将 624 名职工用随机方式进行编号 ;
第二步 从总体中剔除 4 人 ( 剔除方法可用随机 数表法 ) ,将剩下的 620 名职工重新编号 ( 分别为 000 , 001 ,002 , · · · , 619 ) , 并分为 62 段 ;
第三步 在第一段 000 , 001 , 002 始号码 l ; 第四步 将编号为 l , l + 10 , l + 20 , ···, l + 610 的个体抽出,组成样本 .
练习1 . 为了了解参加一次知识竞赛的 1252 名学生的成绩 , 决定采用系统抽样的方法 抽取一个容量为 50 的样本 , 那么总体中 应随机剔除个体的数目是 ( A ) A. 2 B. 3 C. 4 D. 5
练习2 .
要从1003 名学生中选取一个容量为 20 的样本, 试叙述系统抽样的步骤 . 将 1003 名学生用随机方式编号为 解 : 第一步 0000 , 0001 , 0002 , ···, 1002 ; 第二步 从总体中剔除 3 个个体 ( 剔除方法 可用随机数表法) ; 第三步 将剩下的 1000 名学生重新编号 ( 分别 为000 , 001 , 002 , ···, 999 号 ) , 并平均 分成 20 段 ; 第四步 在第一段 000 , 001 , 002 , ···, 049 这 50 个编号中随机地抽取一个号码 ( 可用 抽签法或随机数表法 )l ,则编号为l + 50 ,l + 100 , l + 150 , ···, l + 950 的个体就可组成抽取的 样本 .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
探究: 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得 到的图的形状也会不同。不同的形状给人以不同的印象,这种印 象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图 ,然后谈谈你对图的印象。
频率分布折线图
频率/组 距
0.50
0.40 0.30 0.20 0.10 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5
频率/组距 (4 400h以上的电子元件 2)由频率分布表可知,寿命在 3 )画出频率分布直方图; )由频率分布表可以看出,寿命在 100h-400h的电子 出现的频率为: 0.25+0.15=0.35 ,所以我们估计 元件出现的频率为 0.65,所以我们估计电子元件 电子元件寿命在 400h 以上的概率为 寿命在100h-400h 的概率为 0.65; 0.35;
1、重复出现的数据要重复记录,不能遗漏;特别是 “叶”部分; 2、所有的信息都可以从这个茎叶图中得到; 3、茎叶图便于记录和表示;
4、不足的是其分析只是粗略的,对差异不大的两组数 据不易分析;表示三位数以上的数据时不够方便;
你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改.
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
实例
例1、对某电子元件进行寿命追踪调查,情况如下:
寿命 个数
100~200 200~300 300~400 400~500 500~600
甲运动员得分:13,51,23,8,26,38,16,33,14,
28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,来自37,25,36,39.
甲 8 4 6 3 3 6 8 3 8 9 0 1 2 3 4 5 2 5 1 4 0 乙 5 4 6 1 6 9
7 9
1
注:
20
30
80
40
30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h~400h以内的频率; (4)估计电子元件寿命在400h以上的频率;
(1)列出频率分布表;
寿命 100~200 200~300 300~400 400~500 500~600 合计 频数 20 30 80 40 30 200 频率 0.10 0.15 0.40 0.20 0.15 1 累积频率 0.10 0.25 0.65 0.85 1
一般地,画出一组样本数据的茎叶图的步骤如何?
第一步:将每个数据分为“茎” (高位)和“叶” (低位)两部分;
第二步:将最小的茎和最大的茎之间的数按大小次序排成一列, 写在左(右)侧;
第三步:将各个数据的叶按大小次序写在茎右(左)侧 .
对于样本数据:31,25,20,8,15,10,43, 27,31,35,用 茎叶图如何表示?
0
100 200 300 400 500 600 寿命( h)
为了调查某厂工人生产某种产品的能力,随机抽查了 20 位 工人某天生产该产品的数量.产品数量的分组区间为 45,55 , 55,65 , 65,75 , 频率/组距
75,85 , 85,95 ,由此得到频率分
布直方图如图 3,则这 20 名工人 中一天生产该产品数量在
Thank you!
2.2 用样本估计总体
2.2.1 频率分布折线图与茎叶图
(第2课时)
本课主要学习频率分布折线图与茎叶图的相关内容, 具体包括频率分布折线图、总体密度分布曲线以及茎叶图 的概念及画法。 本课开始简单回顾了上一节所学的频数分布直方图的 制作步骤。接着以两个组距不同的频率分布直方图对比作 为课前导入,提出问题让学生回答。这里便引入频率分布 折线图和总体密度曲线的概念,紧着通过例题和习题进行 巩固。 第二部分介绍茎叶图的概念及绘制方法,并用案例 详细解释,并指出了茎叶图的优点和适用范围。
月平均用水量/t
连接频率直方图中各小长方形上端中点的折线,叫 频率分布折线图
当样本容量无限增大,分组的组距无限缩小,那 么频率分布折线图就会无限接近一条光滑曲线 ——总体密度曲线.
频率
组距
总体在区间(a , b)内取值的频率
S
a b
产品 尺寸 (mm)
总体密度曲线
总体密度曲线反映了总体在各个范围内取值的
1. 掌握茎叶图的意义与画法,并能在实际问题中用茎叶图进行
数据统计。
2.通过实例体会频率分布直方图、频率分布折线图、茎叶图的各自 特征,从而恰当地选择上述方法分析样本的分布,准确的作出 总体估计。
1.求极差
2.决定组距与组数
频率分布直方图 应用 步骤 3.将数据分组 4.列频率分布表 5.画频率分布直方图
55,75 的人数是
.
0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005 0
45 55 65 75 85 95 图3
产品数量
茎叶图
频率分布表、频率分布直方图和折线图的主要作用是表示样 本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的 分布情况.
茎
叶
0 8 1 0 5 2 0 5 7 3 1 1 5 4 3
实例1
某篮球运动员在某赛季各场比赛的得分情况如下:12, 15,24,25,31,31,36,36,37,39,44,49,50 茎叶图: 1 2 3 4 5 25 45 116679 49
0
茎:十 位数字
叶:表示 个位数字
实例2
某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:
思考:
对任意一组样本数据,是否都适合用 茎叶图表示?为什么? 不适合样本容量很大或茎、叶不分明的样本数据.
1.用样本的频率分布估计总体分布,当总体中的个体数 取值很少时,可用茎叶图估计总体分布;当总体中的个 体数取值较多时,可将样本数据适当分组,用频率分布 表或频率分布直方图估计总体分布. 2.总体密度曲线可看成是函数的图象,对一些特殊的密度 曲线,其函数解析式是可求的. 3.茎叶图中数据的茎和叶的划分,可根据样本数据的特 点灵活决定.