用样本估计总体(频率分布直方图、平均数、方差等)
新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体
新高考数学一轮复习考点知识专题讲解与练习考点知识总结57 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差、百分位数),并做出合理的解释4.会计算分层随机抽样的样本均值与样本方差5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.一组数据90,92,99,97,96,x的众数是92,则这组数据的中位数是() A.94 B.95 C.96 D.97答案A解析数据90,92,99,97,96,x的众数是92,则x=92,所以这组数据为90,92,92,96,97,99,则这组数据的中位数是12×(92+96)=94.故选A.2.如图所示是根据某市3月1日至10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2 B.0C.1 D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.3.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积和的14,且样本量为80,则中间一组的频数为() A.0.25 B.0.5 C.20 D.16答案D解析设中间一组的频数为x,依题意有x80=14⎝⎛⎭⎪⎫1-x80,解得x=16.4.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是()A.1.78小时B.2.24小时C.3.56小时D.4.32小时答案C解析该地“上班族”每天在工作之余使用手机上网的平均时间是(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56小时.5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均分数方差甲20x-2甲乙30x-3乙其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案C解析由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30×[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.6.2022年4月24日下午,随着最后1例新冠肺炎重症患者治愈,武汉重症病例实现了清零,抗疫工作取得了阶段性重大胜利.某方舱医院从出院的新冠肺炎患者中随机抽取100人,将这些患者的治疗时间(都在[5,30]天内)进行统计,制作出频率分布直方图如图所示,则估计该院新冠肺炎患者治疗时间的中位数是()A.16 B.17C.18 D.19答案B解析设这100名新冠肺炎患者治疗时间的中位数是x,∵(0.01+0.05)×5=0.3<0.5,(0.01+0.05+0.1)×5=0.8>0.5,∴x∈[15,20),0.3+(x-15)×0.1=0.5,解得x=17,则该院新冠肺炎患者治疗时间的中位数是17.故选B.7.(多选)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案ABC解析根据众数、平均数、中位数的概念得5年后,每人的年龄相应增加5,而标准差不变,所以这七人年龄的众数变为40;平均数变为49;中位数变为60;标准差不变,为19.故选ABC.8.(多选)为了解运动健身减肥的效果,某健身房调查了20名肥胖者,测量了他们的体重(单位:千克).健身之前他们的体重情况如三维饼图1所示,经过半年的健身后,他们的体重情况如三维饼图2所示.对比健身前后,关于这20名肥胖者,下列结论正确的是()A.他们健身后,体重在区间[90,100)内的人数不变B.他们健身后,体重在区间[100,110)内的人数减少了2个C.他们健身后,体重在区间[110,120)内的肥胖者体重都有减轻D.他们健身后,这20名肥胖者的体重的中位数位于区间[90,100)答案ACD解析题图1中体重在区间[90,100),[100,110),[110,120)内的人数分别为8,10,2;题图2中体重在区间[80,90),[90,100),[100,110)内的人数分别为6,8,6.故选ACD.二、高考小题9.(2022·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C不正确;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.10.(多选)(2022·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,x n的离散程度的是()A.样本x1,x2,…,x n的标准差B.样本x1,x2,…,x n的中位数C.样本x1,x2,…,x n的极差D.样本x1,x2,…,x n的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.11.(多选)(2022·新高考Ⅰ卷)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则() A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析由题可知x-=x1+x2+…+x nn ,y-=y1+y2+…+y nn=x1+x2+…+x nn+c=x-+c ,因为c ≠0,所以x -≠y -,A 错误;若样本数据x 1,x 2,…,x n 的中位数为x k ,因为y i =x i +c ,c ≠0,所以样本数据y 1,y 2,…,y n 的中位数为y k =x k +c ≠x k ,B 错误;设s x 表示样本数据x 1,x 2,…,x n 的标准差,s y 表示样本数据y 1,y 2,…,y n 的标准差,则样本数据y 1,y 2,…,y n 的标准差s y =1n (y 1-y -)2+(y 2-y -)2+…+(y n -y -)2=1n[(x 1+c )-(x -+c )]2+[(x 2+c )-(x -+c )]2+…+[(x n +c )-(x -+c )]2=1n (x 1-x -)2+(x 2-x -)2+…+(x n -x -)2=s x ,所以C 正确;设样本数据x 1,x 2,…,x n 中最大的为x n ,最小的为x 1,因为y i =x i +c ,所以样本数据y 1,y 2,…,y n 中最大的为y n ,最小的为y 1,极差为y n -y 1=(x n +c )-(x 1+c )=x n -x 1,所以D 正确.故选CD.12.(2022·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40 C.64 D .80答案 D解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.13.(2022·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑4i =1p i =1,则下面四种情形中,对应样本的标准差最大的一组是( ) A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.2答案 B解析 对于A ,该组数据的平均数为x -A =(1+4)×0.1+(2+3)×0.4=2.5,方差为s 2A =(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B ,该组数据的平均数为x -B =(1+4)×0.4+(2+3)×0.1=2.5,方差为s 2B =(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;对于C ,该组数据的平均数为x -C=(1+4)×0.2+(2+3)×0.3=2.5,方差为s 2C =(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D ,该组数据的平均数为x -D =(1+4)×0.3+(2+3)×0.2=2.5,方差为s 2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B 项这一组样本数据的标准差最大.故选B.14.(2022·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.15.(2022·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 平均正点率x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.16.(2022·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案 53解析 这组数据的平均数为8,故其方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.三、模拟小题17.(2022·河北张家口第三次模拟)某中学春季运动会上,12位参加跳高半决赛同学的成绩各不相同,按成绩从高到低取前6位进入决赛,如果小明知道了自己的成绩后,则他可根据其他11位同学成绩的哪个数据判断自己能否进入决赛( )A.中位数B.平均数C.极差D.方差答案A解析12位同学参赛,按成绩从高到低取前6位进入决赛,正好一半,因此可根据中位数判断小明是否能进入决赛.故选A.18.(多选)(2022·广东省花都区高三上学期调研)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有()A.中位数为3,众数为3B.平均数为3,众数为4C.平均数为3,中位数为3D.平均数为2,方差为2.4答案BD解析对于A,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,所以A不能判断;对于B,若平均数为3,且出现点数为6,则其余4个数的和为9,而众数为4,故其余4个数的和至少为10,所以B可以判断;对于C,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C不能判断;对于D,若平均数为2,且出现点数6,则方差s2>12=3.2>2.4,所以当平均数5×(6-2)为2,方差为2.4时,一定不会出现点数6.故选BD.19.(多选)(2022·安徽蚌埠高三模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,x-甲=4+5+6+7+85=6,x-乙=3×5+6+95=6,A正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D错误.20.(多选)(2022·广东肇庆第二次统一检测)某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则关于这100件产品,下列说法中正确的是()A.b=0.25B.长度落在区间[93,94)内的个数为35C.长度的众数一定落在区间[93,94)内D.长度的中位数一定落在区间[93,94)内答案ABD解析对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,故A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,故B正确;对于C,这100件产品长度的众数不一定落在区间[93,94)内,故C错误;对于D,由(0.1×2+0.25)×1=0.45<0.5,(0.1×2+0.25+0.35)×1=0.8>0.5,知这100件产品长度的中位数一定落在区间[93,94)内,故D正确.故选ABD.21.(多选)(2022·湖南师大附中高三第二次月考)甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层随机抽样方法从两所学校一共抽取了110名学生的数学成绩,考生成绩都分布在[70,150]内,并作出了如下频数分布统计表,规定考试成绩在[120,150]内为优秀,则下列说法正确的有()分组[70,80)[80,90)[90,100)[100,110)AB.估计甲校优秀率为25%,乙校优秀率为40% C.估计甲校和乙校众数均为120D.估计乙校的数学平均成绩比甲校高答案ABD解析对于A,甲校抽取110×12002200=60人,乙校抽取110×10002200=50人,故x=10,y=7,故A正确;对于B,估计甲校优秀率为1560=25%,乙校优秀率为2050=40%,故B正确;对于C,甲校众数的估计值为105,115,乙校众数的估计值为115,125,故C 错误;对于D,甲校平均成绩为109.5,乙校平均成绩为114.6,故D正确.22.(多选)(2022·湖南六校联考)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至13日中的某一天到达该市,并停留2天,下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为8 13C.此人在该市停留期间只有1天空气重度污染的概率为2 13D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大答案AD解析114×(86+25+57+143+220+160+40+217+160+121+158+86+79+37)=113.5,故A正确;在6月1日至13日这13天中,1日,2日,3日,7日,12日,13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率为613,故B不正确;6月1日至14日连续两天包含的样本点有13个,此人在该市停留期间只有1天空气重度污染的样本点是{4,5},{5,6},{7,8},{8,9},共4个,所以此人在该市停留期间只有1天空气重度污染的概率是413,故C不正确;由空气质量指数趋势图可以看出,从3月5日开始连续三天的空气质量指数方差最大,故D正确.故选AD.23.(2022·山东潍坊高三质检)为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为124,男员工的平均体重为70 kg ,标准差为4,女员工的平均体重为50 kg ,标准差为6.若样本中有20名男员工,则女员工的人数为________.答案 30解析 设男员工的权重为ω男,由题意可知样本的平均数x -=ω男x -男+(1-ω男)x -女=70ω-男+50(1-ω男)=20ω男+50,样本的方差s 2=ω男[s 2男+(x -男-x -)2]+(1-ω男)[s 2女+(x -女-x -)2],即ω男[42+(70-20ω男-50)2]+(1-ω男)[62+(50-20ω男-50)2]=124,解得ω男=0.4,因为样本中有20名男员工,所以样本中女员工的人数为200.4×(1-0.4)=30.一、高考大题1.(2022·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 新设备10.110.410.110.010.1旧设备 9.8 10.0 10.1 10.2 9.7 新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22.(1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x-≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)由表中的数据可得:x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3, s 21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s 22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.(2)由(1)中的数据可得y --x -=10.3-10=0.3,2s 21+s 2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y --x ->2s 21+s 2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.2.(2022·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解(1)由表中数据可知,甲厂加工出来的一件产品为A级品的概率的估计值为40100=0.4,乙厂加工出来的一件产品为A级品的概率的估计值为28=0.28.100(2)甲分厂加工100件产品的总利润为40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1500元,所以甲分厂加工100件产品的平均利润为15元/件.乙分厂加工100件产品的总利润为28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1000元,所以乙分厂加工100件产品的平均利润为10元/件.故厂家应选择甲分厂承接加工业务.3.(2022·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2022·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解 (1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x-2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).二、模拟大题5.(2022·河南郑州一模)河阴石榴是河南省荥阳市的特产,距今已有2100多年的历史,河阴石榴籽粒大,色紫红,甜味浓,被誉为“中州名果”.河阴石榴按照果径大小可以分为四类:标准果、优质果、精品果、礼品果.某超市老板从采购的一批河阴石榴中随机抽取100 kg,根据石榴的等级分类标准得到的数据如下表所示:(1)求a(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:方案1:不分类卖出,单价为20元/kg;方案2:分类卖出,分类后的水果售价如下表所示:=0.2.解(1)a=100-10-30-40=20,礼品果所占比例是20100(2)理由一:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,因为x -=20.6>20,所以从超市老板的销售利润角度考虑,采用方案2比较好.理由二:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,虽然x -=20.6>20,但20.6-20=0.6,差额不太大,从超市老板后期对石榴分类的人力资源和时间成本角度考虑,采用方案1比较好.6.(2022·湖南师大附中第一次大练习)某学校团委组织了“文明出行,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(单位:分)整理后,得到如图所示的频率分布直方图(其中分组区间为[40,50),[50,60),…,[90,100]).(1)求成绩在[70,80)的频率,并补全此频率分布直方图;(2)求这次考试平均分的估计值(同一组中的数据以这组数据所在区间中点的值作代表);(3)若从成绩在[40,50)和[90,100]的学生中任选两人,求他们的成绩在同一分组区间的概率.解 (1)成绩在[70,80)的频率为1-(0.005+0.015+0.020+0.030+0.005)×10=0.25.补全频率分布直方图如下:(2)依题意可得,平均分x-=(45×0.005+55×0.015+65×0.020+75×0.025+85×0.030+95×0.005)×10=72.5.故这次考试平均分的估计值为72.5.(3)成绩在[40,50)和[90,100]的人数分别是3和3,所以从成绩在[40,50)和[90,100]内的学生中任选两人,将[40,50)分数段的3人编号为A1,A2,A3,将[90,100]分数段的3人编号为B1,B2,B3,从中任取两人,则样本空间Ω={(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)},共有15个样本点,这15个样本点发生的可能性是相等的.其中,在同一分数段内的事件所含样本点有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),共6个,故所求概率P=615=25.7.(2022·河北省衡水市第一中学高三上学期第一次调研)“2022年全国城市节约用水宣传周”已于5月9日至15日举行.成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样、内容丰富的活动.进一步增强全民保护水资源,防治水污染,节约用水的意识.为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95), [95,100],得到如图所示的频率分布直方图.(1)求a的值,并估计这300名业主评分的中位数;(2)若先用比例分配的分层随机抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的这5名业主中任意选取2人做进一步访谈,求这2人中至少有1人的评分在[95,100]的频率.解(1)∵第三组的频率为1-(0.020+0.025+0.030+0.035+0.050)×5=0.200,=0.040.∴a=0.2005又第一组的频率为0.025×5=0.125,第二组的频率为0.035×5=0.175,第三组的频率为0.200,∴前三组的频率之和为0.125+0.175+0.200=0.500,∴这300名业主评分的中位数为85.(2)由频率分布直方图,知评分在[90,95)的人数与评分在[95,100]的人数的比值为3∶2,∴采用比例分配的分层随机抽样法抽取5人,评分在[90,95)的有3人,评分在[95,100]的有2人.不妨设评分在[90,95)的3人分别为A1,A2,A3,评分在[95,100]的2人分别为B1,B2,则从5人中任选2人的所有可能情况有{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种.其中选取的2人中至少有1人的评分在[95,100]的情况有{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共7种.故这2人中至少有1人的评分在[95,100]的概率为P=710.。
高一数学用样本估计总体试题答案及解析
高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。
221用样本的频率分布估计总体分布1
(3)估计该片经济林中底部周长小于100cm的树木 约占多 少,周长不小于120cm的树木约占多少。
解: (1)从表中可以看出: 这组数据的最大值为135,最小值为80, 故极差为55, 可将其分为11组,组距为5。
从第1组[80,85)开始, 将各组的频数、频率和 频率/组距 填入表中
分组
频数
[80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125)
[125,130)
[130,135) 合计
频率
频数/组距
1
0.01 0.002
2
0.02 0.004
4
0.04 0.008
14
0.40 0.30 0.20 0.10
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表
三级品 13
0.43
次品
4
0.13
(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
2.有一个容量为50的样本,数据的分组及其 频数如下所示, 请将其制成频率直方图.
频率分布表如下:
分组 [25,30) [30,35) [35,40) [40,45)
[45,50) [50,55) [55,60]
高中数学必修二 (教案)用样本估计总体
用样本估计总体【第一课时】【教学目标】1.会画一组数据的频率分布表、频率分布直方图.2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.3.掌握求n个数据的第p百分位数的方法.【教学重难点】1.频率分布表、频率分布直方图.2.用样本估计总体.3.总体百分位数的估计.【教学过程】一、问题导入预习教材内容,思考以下问题:1.绘制频率分布表和频率分布直方图有哪些步骤?2.频率分布直方图有哪些特征?3.如何求n个数据的第p百分位数?二、基础知识1.频率分布表、频率分布直方图的制作步骤及意义2.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.三、合作探究1.频率分布表、频率分布直方图、频率分布折线图的绘制角度一:频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以4频率累计频率分布直方图和频率分布折线图如图所示.(1)在列频率分布表时,极差、组距、组数有如下关系: ①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.角度二:频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? (3)样本中不达标的学生人数是多少? (4)第三组的频数是多少?【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12. 所以样本中不达标的学生人数为150×0.12=18(人).(4)第三小组的频率为172+4+17+15+9+3=0.34.又因为样本量为150,所以第三组的频数为150×0.34=51.频率分布直方图的应用中的计算问题 (1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)频数样本量=频率,此关系式的变形为频数频率=样本量,样本量×频率=频数.2.条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题: (1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比. 【解】(1)从统计图上可以看出,喜欢收听于丹析《庄子》的男生有20人,女生有10人; 喜欢收听《故宫博物院》的男生有30人,女生有15人; 喜欢收听于丹析《论语》的男生有30人,女生有38人; 喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106 300,由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3 000=1 060(人).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45300×100%=15%.(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.3.折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1)护士每隔几小时给小明测量一次体温?(2)近三天来,小明的最高体温、最低体温分别是多少?(3)从体温看,小明的病情是在恶化还是在好转?(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.4.扇形统计图下图是A ,B 两所学校艺术节期间收到的各类艺术作品的情况的统计图: (1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?【解】(1)不能.因为两所学校收到艺术作品的总数不知道.(2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则⎩⎨⎧10%x -5%y =20,50%y -40%x =100,解得⎩⎨⎧x =500,y =600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.5.百分位数的计算试求甲、乙两组数的25%分位数与75%分位数.【解】因为数据个数为20,而且20×25%=5,20×75%=15.因此,甲组数的25%分位数为x5+x62=2+32=2.5;甲组数的75%分位数为x15+x162=9+102=9.5.乙组数的25%分位数为x5+x62=1+12=1,乙组的75%分位数为x15+x162=10+142=12.求百分位数时,一定要将数据按照从小到大的顺序排列.【课堂检测】1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为()A.0.1B.0.2C.0.3 D.0.4解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.3.观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.【第二课时】 【教学目标】1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.【教学重难点】会用样本的基本数字特征来估计总体的基本数字特征.【教学过程】一、基础知识1.众数、中位数、平均数 众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.2.方差、标准差标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x .二、合作探究1.众数、中位数、平均数的计算(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为()A.85,85,85B.87,85,86C.87,85,85D.87,85,90(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为() A.2,5B.5,5C.5,8D.8,8答案(1)C(2)C解析(1)平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85.(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为9+15+10+y+18+245=16.8,所以y=8,所以x,y的值分别为5,8.【教师小结】平均数、众数、中位数的计算方法:平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.2.标准差、方差的计算及应用甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解(1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.【教师小结】(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.三、课堂总结1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.【课堂检测】1.某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A .19B .20C .21.5D .23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B .2.下列关于平均数、中位数、众数的说法中正确的一个是( )A .中位数可以准确地反映出总体的情况B .平均数可以准确地反映出总体的情况C .众数可以准确地反映出总体的情况D .平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况答案 D3.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得的数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差答案 D4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84, a 2=80+4+4+6+4+75=85,故选B . 5.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.答案 16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.。
高考数学第一轮知识点总复习 第二节 用样本估计总体
平.因为公司中少数人的月工资额与大多数人的月工资额差别较大,
这样导致了平均数与中位数的偏差较大,所以平均数不能客观真实
地反映这个公司员工的工资水平.
题型四 综合问题
【例4】(12分)某种瓶装溶液,因为装瓶机的不稳定性,所以很可能每 瓶装的容量都不是标准的容量.我们随机抽出了20瓶,测得它们的容量 (单位:百毫升)如下: 12.1 11.9 12.2 12.2 12.0 12.1 12.9 12.1 12.3 12.5 11.7 12.4 12.3 11.8 11.3 12.1 11.4 11.6 11.2 12.2
1
(2)频率分布直方图如图:
(3)电子元件寿命在100 h~400 h以内的频数为130,则频率 为 13=00.65. 200
(4)寿命在400 h以上的电子元件的频数为70,则频率 为 =700.35. 200
学后反思利用样本的频率分布可近似地估计总体的分布.从本例可 以看出,要比较准确地反映出总体70 分布的情况,必须准确地作出
[140,15 0)
人数
4
8
x
5
3
生产能 力分组 人数
表2:
[110, 120)
6
[120,130) [130,14 0)
y
36
[140,15 0)
18
(1)先确定x、y,再完成下列频率分布直方图,就生产能力而言, A类工人中个体间的差异程度与B类工人中个体间的差异程度哪 个更小?(不用计算,可通过观察直方图直接回答结论)
比;所有组距的频率之和为1;每一组距的频率是频率分布直方图中该
组距所对应的矩形的面积.
解
(1)M=0.102
=50,m=50-(1+4+20+15+8)=2n,N =m1,
必修三2.2.用样本估计总体(教案)
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
高考(理)总复习资料:第9章 第2讲 用样本估计总体
• ①甲同学成绩的中位数大于乙同学成绩的中 位数;
• ②甲同学的平均分比乙同学高; • ③甲同学的平均分比乙同学低; • ④甲同学成绩的方差小于乙同学成绩的方
差. • 上解析面:说甲法的中正位确数的81,是乙_的__中_位__数_8_7..5,故①错, x 甲= 81•,答x 案乙=:85③,故④②错,③对,由茎叶图知甲成绩比较稳定,
D. x 甲> x 乙,m甲<m乙
• [审题视点] 仔细观察茎叶图.中位数为一列
数中最中间的那个,当数有偶数个时,中位
数[解为析]中甲间数两据个集中数于的前平半段均,数而.乙数es据集中于后半段,
所以
x
甲<
x
乙;m甲=
18+22 2
=20,m乙=
27+31 2
=29,所以m甲
<m乙,所以选B.
• [答案] B
• [答案] C
32
1.平均数和方差都是重要的数字特征,是对总体一种简 明的阐述.平均数、中位数、众数描述总体的集中趋势,方 差和标准差描述波动大小.
2. 平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为 x ,方差为s2,则数据 mx1+a,mx2+a,…,mxn+a的平均数为m x +a,方差为 m2s2.
33
• [变式探究] [2013·西安质检]某校甲、乙两 个班级各有5名编号为1,2,3,4,5的学生进行投 篮练习,每人投10次,投中的次数如下表:
学生 1号 2号 3号 4号 5号
甲班 6
7
7
8
7
乙班 6
7
6
7
9
34
则以上两组数据的方差中较小的一个为s2,则s2=( )
用样本估计总体(频率分布直方图、平均数、方差等)
s2
1 10
4 (2 5)2
2 (5 5)2
4 (8 5)2
7.2
3.(2015 江苏苏州市高三上调考)如图是小王
所做的六套数学附加题得分(满分 40)的茎叶
图,则其平均得分为 .
JSY33
第 3 题图
【考点】茎叶图.
【答案】 31.
【分析】 根据茎叶图的数据,得;
数据的平均分为
x = 18 28 30 32 38 40 =31. 6
55、在公路发展的早期,它们的趋势还能顺从地貌,即沿河流或森林的边缘发展。可 如今,公路已无所不在,狼、熊等原本可以自由游荡的动物种群被分割得七零八落。 与大型动物的种群相比,较小动物的种群在数量上具有更大的波动性,更容易发生杂 居现象。这段话主要讲述的是 。 A.公路发展的趋势 B.公路对动物的影响 C.动物生存状态的变化 D.不同动物的不同命运
56、从3月下旬到10月上旬,太阳在地球上直射位置的移动规律是: A.赤道→南回归线→赤道 B.赤道→北回归线→赤道 C.南回归线→赤道→北回归线
D.人权是个人权利和集体人权的统一
67、在觅食过程中,成百上千只蚂蚁在蚁穴和食物所在处之间来来往往,最终都能够 在相对最短时间内得到食物,却从来不会有拥堵现象出现。德国科学家赫尔冰发现, 避免道路拥堵是基于蚂蚁之间的交流。在一条路有可能出现拥堵时,返回的蚂蚁就向 迎面过来的同伴发出信息素,让它选择另一条路。他认为,人类可以采取相同方法减 少车辆拥塞现象。
这段文字的主旨是 。
A.城市发展面临危机 B.城市是人类文明的中心所在 C.城市的演进伴随着各种问题 D.城市要健康发展必须积极有效地应对各种挑战
69、1983年,沃伦和马歇尔发现人的胃内有幽螺菌(HP),并分离培养成功,为常见的 胃病病因和诊治作出了划时代的贡献。世界上约1/3人口感染HP,我国感染率较高, 儿童占50%以上,成人占70%以上。HP主要通过口口传播,也可经中介物如餐具、牙 具或患者排泄物污染他人的手或食物从而导致感染。防止儿童感染HP,在防止青少年 胃病,促进儿童健康成长和社会公共卫生等方面都有重大意义。
9.2用样本估计总体
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
学科核心素养下高中数学教学设计——以“用样本估计总体”为例
学科核心素养下高中数学教学设计———以“用样本估计总体”为例文|傅焕铭一、教材分析我们收集的原始数据往往多而杂,需要对原始数据进行分析、处理,找到数据背后蕴藏的信息。
对总体统计特征的刻画包括两个层面:一是总体统计特征的全面刻画,即刻画出总体中所有个体的取值规律,这个规律可以用总体的频率分布表和频率分布直方图描述或近似描述;二是总体部分统计特征的刻画,如平均数、众数、方差、标准差等数字特征。
二、教学目标(一)核心素养学生初步习得科学处理数据的能力。
(二)教学目标(1)学生用频率分布直方图估计样本的众数、中位数、平均数等数据特征。
(2)学生能自行独立计算样本数据的标准差、方差,并知道分别刻画统计的什么特征。
(3)学生会用样本的频率分布估计总体分布,会用样本特征估计总体特征,理解用样本估计总体的思想,并能利用所学知识解决生活中的一些现实问题。
三、教学重难点教学重点:学生能从频率分布直方图上估计出样本数据特征。
教学难点:学生理解总体分布的概念,形成统计思维。
四、教学过程师:同学们,前面我们已经研究过通过抽样调查来研究数据的方法,了解了提高样本代表性的一些具体方法,收集数据后,我们要从中找到数据背后包含的信息,方可达到用样本估计总体的目的。
今天我们就一起研究“用样本估计总体”。
(一)课前导学师:同学们,根据自学任务,思考下列问题并完成检测。
任务1:样本数字特征有哪些?如何求?这些特征在频率分布直方图上如何估计?任务2:样本数字特征是如何反映样本数据的集中趋势和离散程度的?(设计意图:通过出示自学任务,引导学生自学,相机进行自学效果检测。
学生根据自学情况,检测新知中还有哪些内容没有理解和掌握,从而有针对性地学习本节内容,实现高效学习。
同时也旨在培养学生良好的学习习惯,指导学生学会学习数学的方法。
)(二)课堂设计探究一:样本的数字特征11.探究:众数、中位数、平均数的概念。
师:请同学们根据概念解释,完成概念名词的填空,并揣摩这些概念的含义。
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
222用样本的数字特征估计总体的数字特征(2)方差标准差讲解
性质归纳:kan b的平均数和方差:
已知a1,a2,,an的平均数是3,方差是2. 则a1 b,a2 b,,an b的平均数是3 b, 方差是2. ka1,ka2,,kan的平均数是3k,方差是2k 2.
标准差是样本平均数的一种平均距离,一般用s表示.
所谓“平均距离”,其含义可作如下理解:
假设样本数据是x1,x2,...xn ,x 表示这组数据的平均数,xi到 x
的距离是
-
xi - x (i = 1,2,… ,n).
, :
-
于是
样本数据x1,
x2,
x
到
n
x
的“平均距离”是
x1 x x2 x xn x
2.2.2用样本的数字特征估计总体 的数字特征(2) 方差、标准差
学习目标 1.明确标准差、方差等数字特征的意义,深刻 体会它们所反映的样本特征。 2.会用样本的数字特征估计总体的的数字特征, 初步体会样本的数字特征的随机性
复习回顾
一.什么是一组数据的众数、中位数及平均数?
众数:一组数据中出现次数最多的数据。
[解析] (1)甲组成绩的众数为 90 分,乙组成绩的众数为
70 分,从成绩的众数比较看,甲组成绩好些.
(2)s
2
甲
=
1 2+5+10+13+14+6
×[2×(50
-
80)2
+
5×(60
- 80)2 + 10×(70 - 80)2 + 13×(80 - 80)2 + 14×(90 - 80)2 +
A.众数 B.平均数
用样本估计总体教案(绝对经典)
§11.2 统计图表、数据的数字特征、用样本估计总体会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).1.统计数据(1)众数、中位数、平均数、极差、众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.(可以没有或者多个). 中位数:将一组数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数).平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).(2)方差、标准差 方差()()()[]2222121x x x x x x nS n -++-+-=标准差S =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 2.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图、频率分布直方图等.(1)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. (2)在频率分布直方图中:①纵轴表示频率组距,②每小长方形的面积表示该组数据的频率或比例, ③各小长方形的面积之和等于1.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.4.利用频率分布直方图估计样本的数字特征(1)众数:最高那组的组中值.(2)平均数:每个小长方形的面积与每个组中值的乘积之和. (3)中位数:等分面积那条线的横坐标. [难点正本 疑点清源] 1.作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.1.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.72.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.答案 6003.如上图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)答案 6.84.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从上图中可以看出被处罚的汽车大约有的辆数为________. 答案 40题型一 频率分布直方图的绘制与应用例1 (1)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图; (2)据此估计本次考试中的平均分和中位数(保留整数).思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图. 解 (1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).中位数为73 探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.(2)从某小学随机抽取l00名同学,将他们的身高(单位:厘米)数据绘制成频率分布图(如上图).若要从身高在[120,130),[130,140),[l40,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[120,130)的学生中选取的人数应为 .答案:15题型二 茎叶图的应用例2 (1)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图所示,若甲、乙两人的平均成绩分别用x 甲、x 乙表示,则下列结论正确的是( )A 、x x <甲乙;乙比甲成绩稳定B 、x x >甲乙;乙比甲成绩稳定C 、x x <甲乙;甲比乙成绩稳定D 、x x >甲乙;甲比乙成绩稳定答案及解析:D(2)某学校从高二甲、乙两个班中各选6名同掌参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如上图,其中甲班学生成绩的中位数数是81,乙班学生成绩的平均分为81,则成绩更稳定的班级为______.答案及解析:乙。
高教版中职数学(基础模块)下册《用样本估计总体》教案
【课题】10.4 用样本估计总体【教学目标】知识目标:(1)理解用样本的频率分布估计总体.(2)理解用样本均值、方差和标准差估计总体的均值、方差和标准差.能力目标:(1)会作出样本的频率分布表及频率分布直方图,并且用样本的频率分布估计总体;(2)会计算样本均值、方差和标准差,并估计总体的均值、方差和标准差;(3)通过相关问题的解决,培养学生的计算工具使用技能、数据处理技能.情感目标:(1)尝试应用计算软件或计算器进行概率与统计的计算,感受计算工具带来的便捷.(2)关注生活中的数学模型,体会数学知识的应用.(3)经历合作学习的过程,尝试探究与讨论,树立团队合作意识.【教学重点】计算样本均值、样本方差及样本标准差.【教学难点】列频率分布表,绘频率分布直方图.【教学设计】均值、方差和标准差是用来反映随机变量的统计规律的某些层面的数字指标即数字特征.用样本的数字特征去估计总体的数字特征是统计的重要思想方法.在教学中要向学生指出为什么要从总体中抽取样本.通过例题的教学,让学生体会用样本估计总体的思想.在教学中应向学生指出用样本估计总体的具体方法是:通过随机抽样,计算样本频率;利用样本频率估计总体概率.样本的容量越大,对总体的估计也就越精确.在制作一组数据的频率分布表时,决定组距与组数是关键,在一般情况下,数据越多,分组的组数也就越多.频率分布表和频率分布直方图是频率分布的两种不同的表示形式,前者准确,后者直观,两者放在一起,使我们对一组数据的频率分布情况了解得更清晰.均值反映了样本和总体的平均水平,方差和标准差则反映了样本和总体的波动大小程度.方差和标准差在比较两组数据波动大小时,这两个量是等价的.标准差的优点是其度量单位与原数据的度量单位一致,有时比较方便.例2从选拔射击选手出发,巩固了均值的概念,使学生容易掌握均值的计算方法和明白均值的实际意义.特别应向学生强调说明均值的作用.【教学备品】教学课件.【课时安排】2课时.(90分钟)【教学过程】过 程行为 行为 意图 间分 组 频 数 累 计 频 数 340.5~343.5 ┬ 2 343.5~346.5 正 正 10 346.5~349.5 正 5 349.5~352.5 正  ̄ 6 352.5~355.5 ┬ 2 355.5~358.5 正 5 合 计303010*动脑思考 探索新知【新知识】各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率. 计算上面频数分布表中各组的频率,得到频率分布表如表10-8所示.表10-8根据频率分布表,可以画出频率分布直方图(如图10-4).图10-4频率分布直方图的横轴表示数据分组情况,以组距为单位;纵轴表示频率与组距之比.因此,某一组距的频率数值上等于对应矩形的面积.【想一想】各小矩形的面积之和应该等于1.为什么呢?【新知识】分 组 频 数 频 率340.5~343.5 2 0.067343.5~346.5 10 0.333346.5~349.5 5 0.167 349.5~352.5 6 0.2 352.5~355.5 2 0.067 355.5~358.5 5 0.166 合 计 30 1.000 讲解 说明引领 分析 观察 理解带领 学生 分析过 程行为 行为 意图 间图10-4显示,日产量为344~346件的天数最多,其频率等于该矩形的面积,即31333.03111.0≈=⨯. 根据样本的数据,可以推测,去年的生产这种零件情况:去年约有31的天数日产量为344~346件. 频率分布直方图可以直观地反映样本数据的分布情况.由此可以推断和估计总体中某事件发生的概率.样本选择得恰当,这种估计是比较可信的.如上所述,用样本的频率分布估计总体的步骤为:(1) 选择恰当的抽样方法得到样本数据;(2) 计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表;(3) 绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率. 【软件链接】 利用与教材配套的软件(也可以使用其他软件),可以方便的绘制样本数据的频率分布直方图,如图10-5所示.图10−5仔细分析 关键 语句记忆25*运用知识 强化练习叫做这个样本的均值,样本均值反映出样本的平均水平.(6377.73)+-+-(86班的考试成绩比B班的波动小,因此过程行为行为意图间图10-6(2)如图10-7所示,求样本均值时,在数据空白单元格(如C6)内输入“样本均值”,在“样本均值”右侧空单元格(如D6)内输入“=A VERAGE(A1:A10)”,按回车键;求样本方差时,在数据空白单元格(如C7)内输入“样本方差”,在“样本方差”右侧空单元格(如D7)内输入“=V AR(A1:A10)”,按回车键;求样本标准差时,在数据空白单元格(如C8)内输入“样本标准差”,在“样本标准差”右侧空单元格(如D8)内输入“=SQRT (D7)”,按回车键.图10-7 讲解说明动手操作80*运用知识强化练习从一块小麦地里随机抽取10株小麦,测得各株高为(单位:cm):提问思考及时了解【教师教学后记】。
202新数学复习第九章统计统计案例9.2用样本估计总体学案含解析
第二节用样本估计总体课标要求考情分析1。
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本1。
本节是用样本估计总体,是统计学的基础,以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.2.本节在高考题中主要是以选择题和填空题为主,属于中低档题目。
方法和样本估计总体的思想解决一些简单的实际问题。
知识点一用样本的频率分布估计总体分布1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.知识点二用样本的数字特征估计总体的数字特征1.众数、中位数、平均数平均数如果有n个数据x1,x2,…,x n,那么这n个数的平均数错误!=错误!平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差和方差(1)标准差是样本数据到平均数的一种平均距离.(2)标准差:s=错误!。
用样本估计总体
基础知识
题型分类
思想方法
练出高分
由直方图可知众数为:100
中位数:设x为中位数,则有:
0.00610 0.02610 0.038x 95 0.5 得x 99.74
基础知识
题型分类
思想方法
练出高分
基础知识
度剖析
作茎叶图时, 将高位(十位与百位) 作为茎,低位 (个位)作为叶,逐 个统计;根据茎叶图分析两组数 据的特点,可以得出结论.
基础知识
题型分类
思想方法
练出高分
题型分类·深度剖析
题型二 茎叶图的应用
解析 探究提高 思维启迪 【例 2】 某良种培育基地正在培育一种小麦 新品种 A.将其与原有的一个优良品种 B 进 行对照试验.两种小麦各种植了 25 亩,所 解 (1)如下图 得亩产数据(单位:千克)如下: 品种 A: 357,359,367,368,375,388,392,399,400,405,41 2,414,415,421,423,423,427,430,430,434,443, 445,445,451,454 品种 B: 363,371,374,383,385,386,391,392,394,394,39 (2) 由于每个品种的数据都只有 25 个,样本不大,画茎叶图很方 5,397,397,400,401,401,403,406,407,410,412, 便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比 415,416,422,430 (1)作出数据的茎叶图; 较,没有任何信息损失,而且还可以随时记录新的数据. (2)用茎叶图处理现有的数据,有什么优点? (3) 通过观察茎叶图可以看出:①品种 A 的亩产平均数(或均值) (3)通过观察茎叶图,对品种 A 与 B 的亩产 比品种 B 高; ②品种 A 的亩产标准差(或方差)比品种 B 大, 故品 量及其稳定性进行比较,写出统计结论.
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考点 2 用样本估计总体(频率分布直方图、平均数、方差等)1. (15泰州一模)若数据2,x,2,2的方差为0,则x=.【考点】极差、方差与标准差.【答案】 2【分析】因为数据2, x, 2, 2 的方差为0,由其平均数为6 x,得到412 6 x26 x0,解得 x=2.32x4442.江苏高考压轴)样本容量为10 的一组数据,它们的平均数是5,频率如图所示,则( 15这组数据的方差等于.第 2 题图 cqn17【答案】 7.2【分析】 2 出现10 0.44次,5出现 100.2 2 次,8出现10 0.4 4 次,所以s214(25)22(55)24(85)27.2103.(2015江苏苏州市高三上调考)如图是小王所做的六套数学附加题得分(满分40)的茎叶图,则其平均得分为.JSY33第 3题图【考点】茎叶图.【答案】 31.【分析】根据茎叶图的数据,得;数据的平均分为182830323840x ==31 .6故答案为: 31.4.2015 届高三 10 月调研 )某校为了解2015 届高三同学寒假期间学习情况,( 淮安都梁中学抽查了 100 名同学,统计他们每天平均学习时间,绘成频率分布直方图(如图).则这 100名同学中学习时间在6~ 8 小时内的同学为人.zl085第 4题图【考点】频率分布直方图;用样本的频率分布估计总体分布.【答案】 30【分析】∵这100 名同学中学习时间在6~ 8 小时外的频率为(0.04+0.12+0.14+0.05 )×2=0.7∴这 100 名同学中学习时间在6~ 8 小时内为10.7=0.3∴这 100 名同学中学习时间在6~ 8 小时内的同学为100×0.3=30.5.(徐州市2014 届高考信息卷)甲、乙两个学习小组各有10 名学生,他们在一次数学测验中成绩的茎叶图如图所示,则在这次测验中成绩较好的是【考点】茎叶图.组.第5题图zl060【答案】甲【分析】甲的平均分为63747981838486868890,x甲1081.458646774757676798082;x乙1073.1x甲x乙,且甲的成绩多集中在80 分上,乙的成绩多集中在70 分上,∴甲组的成绩较好些;故答案为:甲.6.(南通市2015届高三第三次调研)为了解学生课外阅读的情况,随机统计了n 名学生的课外阅读时间,所得数据都在50,150中,其频率分布直方图如图所示.已知在[50,75) 中的频数为100,则 n 的值为.zl071第6题图【考点】考查简单统计知识,直方图,频率.【答案】1000【分析】由频率分布直方图得在[50,75) 之间的频率与组距比值为0.004,由题这区间的频数为 100,组距为1001000 . 25,则n0.004257. (2015高考冲刺压轴卷江苏试卷一)某校的一次英语听力测试中用以下茎叶图记录了甲、乙两组各 5 名学生的听力成绩(单位:分 ).第7 题图 FGQ26已知甲组数据的众数为15,乙组数据的中位数为17,则 x、 y 的值分别为 ________.【考点】茎叶图 .【答案】 5,7【分析】根据茎叶图知,甲组数据是9,15, 10+x, 21, 27;∵它的众数为 15,∴ x=5 ;同理,根据茎叶图知乙组数据是9, 13,10+y, 18, 27,∵它的中位数为 17,∴ y=7.故 x、 y 的值分别为:5, 7.8. (15南京师大附中高三上学期12 月月考数学试卷)对某种花卉的开放花期追踪调查,调查情况如表:花期 (天)11~ 1314~ 1617~1920~ 22个数20403010则这种卉的平均花期为________天.【考点】众数、中位数、平均数.【答案】 16【分析】由表格知,花期平均为12 天的有20 个,花期平均为 15 天的有 40 个,花期平均为 18 天的有 30 个,花期平均为 21 天的有 10 个,∴这种花卉的评价花期是122015401830211010016 .9. (15南京市湖滨中学高三上学期10 月学情检测数学试卷)如图,是某班一次竞赛成绩的频数分布直方图,利用组中值可估计其的平均分为.Abc2第9题图【考点】频率分布直方图.【答案】 62【分析】由频数分布直方图得,总人数是2+4+6+8+10=30 人,利用组中值可估计其的平均分为:210430650107089030=62.10. (15宿迁市沭阳县银河学校高三上学期开学试卷)如果数据x1, x2, x3,⋯, x n的方差是 a,若数据 3 x1﹣ 2,3 x2﹣ 2,3 x3﹣ 2,⋯, 3 x n﹣ 2 的方差为9,则 a=.【考点】极差、方差与标准差.【答案】 1【分析】根据题意,设数据x1, x2,⋯, x n的平均数设为x ,∴方差 s2=1[ ( x1x)2+ (x2x)2+⋯+ ( x n x)2]=a;n∴数据 3 x1﹣2, 3 x2﹣ 2,⋯, 3 x n﹣ 2 的平均数为 3 x﹣2,方差 S2=1[ (3x23x 2) 2 +(3x223x2)2+⋯+ (3xn2 3x 2)2]n11=9·[ ( x1x)2+ ( x2x)2+⋯+ ( x n x)2]=9 a=9;n∴a=1.11.(2015 ·扬州中学模拟 )如图是某小组在一次测验中的数学成绩的茎叶图,则平均成绩是 ________.JSY147 第 11 题图【答案】 78【分析】该小组的平均成绩是61697377848696778.12.(2015 南·京、盐城模拟 )某地区教育主管部门为了对该地区模拟考试成绩进行分析,随机抽取了 150 分到 450 分之间的 1 000 名学生的成绩,并根据这 1 000名学生的成绩画出样本的频率分布直方图 (如图 ),则成绩在 [300,350)内的学生共有 ________人.JSY148 第12题图【答案】 300【分析】由频率分布直方图可得成绩在[300,350)的频率是1-(0.001+ 0.001+0.004+0.005+0.003) ×50=1- 0.7= 0.3,所以成绩在 [300,350)的学生人数是0.3 ×1 000=300.13.(2015 无·锡模拟 )甲、乙两个学习小组各有 10 名同学,他们在一次数学测验中成绩的茎叶图 (如图 ),则他们在这次测验中成绩较好的是 ________组.JSY149 第 13 题图【答案】甲【分析】依题意,注意到将甲、乙两组的10 名同学的成绩均由小到大排列,可看出甲组的 10 名同学的成绩均不低于相应位置乙组的10 名同学的成绩,因此他们在这次测验中成绩较好的是甲组.14.在样本频率分布直方图中,共有 11 个小长方形,若中间一个小长方形的面积等于其他10 个小长方形面积和的1,且样本容量为160,则中间一组的频4数为 ________.【答案】 32【分析】由频率分布直方图的性质,可设中间一组的频率为x,则x+4x= 1,∴x=0.2,故中间一组的频数为 160×0.2=32.15.如图是依据某城市年龄在 20 岁到 45 岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45] 的上网人数呈现递减的等差数列分布,则年龄在 [35,40)的网民出现的频率为 ________.JSY150 第 15 题图【答案】0.2【分析】由频率分布直方图可知,年龄在[20,25)的频率为0.01 ×5=0.05,[25,30)的频率为 0.07 ×5= 0.35,又年龄在 [30,35),[35,40),[40,45] 的上网人数的频率成递减的等差数列分布,所以年龄在 [35,40)的网民出现的频率为 0.2.16.(2015 苏·、锡、常、镇四市调研 )样本容量为 100 的频率分布直方图如图所示,由此估计样本数据落在 [6,10] 内的频数为 ________.JSY151 第 16 题图【答案】 32【分析】由直方图可得样本数据落在 [6,10] 内的频率是 0.08 ×4=0.32,又样本容量是 100,所以频数为 0.32 ×100=32.17. (2015 启·东中学模拟 )某学校为了解该校600 名男生的百米成绩 (单位: s),随机选择了 50 名学生进行调查,如图是这 50 名学生百米成绩的频率分布直方图.根据样本的频率分布,估计这 600 名学生中成绩在 [13,15]( 单位: s)内的人数大约是 ________.JSY152 第 17 题图【答案】 120【分析】依题意,可估计这 600 名学生中成绩在 [13,15]( 单位: s)内的人数大约是 600×(0.02+0.18)=120.18.某校开展“爱我海西、爱我家乡”摄影比赛, 9 位评委为参赛作品 A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字 (茎叶图中的 x)无法看清,若记分员计算无误,则数字 x 应该是 ________.JSY153第18题图【答案】 1【分析】当 x≥4 时,8989929392919464091 ,∴x<4,77则 898992939291 x9091 ,∴x=1.719. (2015 扬·州检测 )某校从高一年级学生中随机抽取100 名学生,将他们期中考试的数学成绩 ( 均为整数 )分成六段: [40,50),[50,60),⋯,[90,100]后得到频率分布直方图 (如图所示 ),则分数在 [70,80)内的人数是 ________.JSY154 第 19 题图【答案】 30【分析】这些学生中分数在[70,80) 内的人数是100×[1 - (0.005+ 0.010+0.015 ×2+0.025) ×10]=30.。