高三数学第一轮复习-第五十七课时总体分布的估计与总体特征数的估计
第57讲(理)
第10页
高考总复习( 高考总复习(文、理)
考点陪练 1.已知随机变量 ξ 服从正态分布 N(3,σ2),则 P(ξ<3)=( A. 1 5 B. 1 4 )
1 C. 3
1 D. 2
解析:由正态分布图象知,µ=3 为该图象的对称轴,P(ξ<3) 1 =P(ξ>3)= . 2
解题准备:简单的随机抽样、系统抽样、分层抽样的共同特点是 每个个体被抽到的可能性相等.这是我们所研究的所有抽样的最大特征 . 【典例1】 某批零件共160个,其中一级品有48个,二级品64个
,三级品32个,等外品16个.从中抽取一个容量为20的样本,请说明分 别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被 抽到的概率均相同.
答案:D
第11页
高考总复习( 高考总复习(文、理)
2.设两个正态分布N(µ1,σ12)(σ1>0)和N(µ2,σ22)(σ2>0)的密度函数 图象如图所示,则有( )
A.µ1<µ2,σ1<σ2 C.µ1>µ2,σ1<σ2
第12页
B.µ1<µ2,σ1>σ2 D.µ1>µ2,σ1>σ2
高考总复习( 高考总复习(文、理)
解析:∵µ是平均数,σ12是方差,µ是密度函数图象的对称轴的位 置,因此图象越瘦高,数据越集中,σ2越小. 答案:A
第13页
高考总复习( 高考总复习(文、理)
3.系统抽样又称为等距抽样,为从 N=nk 个个体中抽取 n 个 N 个体为样本, 先确定抽样间隔, 即抽样距 k= , 从第一段的 1,2, …, n k 个号码中随机抽取一个入样号码 i0,则 i0,i 0+k,…,i 0+(n- 1)k 号码均入样构成样本,所以每个个体的入样概率( A.是相等的 C.与 i0 有关 B.是不相等的 D.与编号有关 )
新高考数学一轮复习考点知识专题讲解与练习 57 用样本估计总体
新高考数学一轮复习考点知识专题讲解与练习考点知识总结57 用样本估计总体高考概览高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度考纲研读1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点2.理解样本数据标准差的意义和作用,会计算数据的标准差3.能从样本数据中提取基本的数字特征(如平均数、标准差、百分位数),并做出合理的解释4.会计算分层随机抽样的样本均值与样本方差5.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想6.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题一、基础小题1.一组数据90,92,99,97,96,x的众数是92,则这组数据的中位数是() A.94 B.95 C.96 D.97答案A解析数据90,92,99,97,96,x的众数是92,则x=92,所以这组数据为90,92,92,96,97,99,则这组数据的中位数是12×(92+96)=94.故选A.2.如图所示是根据某市3月1日至10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2 B.0C.1 D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.3.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积和的14,且样本量为80,则中间一组的频数为() A.0.25 B.0.5 C.20 D.16答案D解析设中间一组的频数为x,依题意有x80=14⎝⎛⎭⎪⎫1-x80,解得x=16.4.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是()A.1.78小时B.2.24小时C.3.56小时D.4.32小时答案C解析该地“上班族”每天在工作之余使用手机上网的平均时间是(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56小时.5.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均分数方差甲20x-2甲乙30x-3乙其中x-甲=x-乙,则两个班数学成绩的方差为()A.3 B.2C.2.6 D.2.5答案C解析由题意可知两个班的数学成绩平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30×[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.6.2022年4月24日下午,随着最后1例新冠肺炎重症患者治愈,武汉重症病例实现了清零,抗疫工作取得了阶段性重大胜利.某方舱医院从出院的新冠肺炎患者中随机抽取100人,将这些患者的治疗时间(都在[5,30]天内)进行统计,制作出频率分布直方图如图所示,则估计该院新冠肺炎患者治疗时间的中位数是()A.16 B.17C.18 D.19答案B解析设这100名新冠肺炎患者治疗时间的中位数是x,∵(0.01+0.05)×5=0.3<0.5,(0.01+0.05+0.1)×5=0.8>0.5,∴x∈[15,20),0.3+(x-15)×0.1=0.5,解得x=17,则该院新冠肺炎患者治疗时间的中位数是17.故选B.7.(多选)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案ABC解析根据众数、平均数、中位数的概念得5年后,每人的年龄相应增加5,而标准差不变,所以这七人年龄的众数变为40;平均数变为49;中位数变为60;标准差不变,为19.故选ABC.8.(多选)为了解运动健身减肥的效果,某健身房调查了20名肥胖者,测量了他们的体重(单位:千克).健身之前他们的体重情况如三维饼图1所示,经过半年的健身后,他们的体重情况如三维饼图2所示.对比健身前后,关于这20名肥胖者,下列结论正确的是()A.他们健身后,体重在区间[90,100)内的人数不变B.他们健身后,体重在区间[100,110)内的人数减少了2个C.他们健身后,体重在区间[110,120)内的肥胖者体重都有减轻D.他们健身后,这20名肥胖者的体重的中位数位于区间[90,100)答案ACD解析题图1中体重在区间[90,100),[100,110),[110,120)内的人数分别为8,10,2;题图2中体重在区间[80,90),[90,100),[100,110)内的人数分别为6,8,6.故选ACD.二、高考小题9.(2022·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C不正确;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.10.(多选)(2022·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,x n的离散程度的是()A.样本x1,x2,…,x n的标准差B.样本x1,x2,…,x n的中位数C.样本x1,x2,…,x n的极差D.样本x1,x2,…,x n的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.11.(多选)(2022·新高考Ⅰ卷)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则() A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析由题可知x-=x1+x2+…+x nn ,y-=y1+y2+…+y nn=x1+x2+…+x nn+c=x-+c ,因为c ≠0,所以x -≠y -,A 错误;若样本数据x 1,x 2,…,x n 的中位数为x k ,因为y i =x i +c ,c ≠0,所以样本数据y 1,y 2,…,y n 的中位数为y k =x k +c ≠x k ,B 错误;设s x 表示样本数据x 1,x 2,…,x n 的标准差,s y 表示样本数据y 1,y 2,…,y n 的标准差,则样本数据y 1,y 2,…,y n 的标准差s y =1n (y 1-y -)2+(y 2-y -)2+…+(y n -y -)2=1n[(x 1+c )-(x -+c )]2+[(x 2+c )-(x -+c )]2+…+[(x n +c )-(x -+c )]2=1n (x 1-x -)2+(x 2-x -)2+…+(x n -x -)2=s x ,所以C 正确;设样本数据x 1,x 2,…,x n 中最大的为x n ,最小的为x 1,因为y i =x i +c ,所以样本数据y 1,y 2,…,y n 中最大的为y n ,最小的为y 1,极差为y n -y 1=(x n +c )-(x 1+c )=x n -x 1,所以D 正确.故选CD.12.(2022·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A .20B .40 C.64 D .80答案 D解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.13.(2022·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑4i =1p i =1,则下面四种情形中,对应样本的标准差最大的一组是( ) A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.2答案 B解析 对于A ,该组数据的平均数为x -A =(1+4)×0.1+(2+3)×0.4=2.5,方差为s 2A =(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B ,该组数据的平均数为x -B =(1+4)×0.4+(2+3)×0.1=2.5,方差为s 2B =(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;对于C ,该组数据的平均数为x -C=(1+4)×0.2+(2+3)×0.3=2.5,方差为s 2C =(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D ,该组数据的平均数为x -D =(1+4)×0.3+(2+3)×0.2=2.5,方差为s 2D =(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B 项这一组样本数据的标准差最大.故选B.14.(2022·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.15.(2022·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 平均正点率x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.16.(2022·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案 53解析 这组数据的平均数为8,故其方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.三、模拟小题17.(2022·河北张家口第三次模拟)某中学春季运动会上,12位参加跳高半决赛同学的成绩各不相同,按成绩从高到低取前6位进入决赛,如果小明知道了自己的成绩后,则他可根据其他11位同学成绩的哪个数据判断自己能否进入决赛( )A.中位数B.平均数C.极差D.方差答案A解析12位同学参赛,按成绩从高到低取前6位进入决赛,正好一半,因此可根据中位数判断小明是否能进入决赛.故选A.18.(多选)(2022·广东省花都区高三上学期调研)四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的有()A.中位数为3,众数为3B.平均数为3,众数为4C.平均数为3,中位数为3D.平均数为2,方差为2.4答案BD解析对于A,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,众数为3,所以A不能判断;对于B,若平均数为3,且出现点数为6,则其余4个数的和为9,而众数为4,故其余4个数的和至少为10,所以B可以判断;对于C,当掷骰子出现的结果为1,1,3,4,6时,满足平均数为3,中位数为3,可以出现点6,所以C不能判断;对于D,若平均数为2,且出现点数6,则方差s2>12=3.2>2.4,所以当平均数5×(6-2)为2,方差为2.4时,一定不会出现点数6.故选BD.19.(多选)(2022·安徽蚌埠高三模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差大于乙的成绩的极差答案AC解析由题图可得,x-甲=4+5+6+7+85=6,x-乙=3×5+6+95=6,A正确;甲的成绩的中位数为6,乙的成绩的中位数为5,B错误;甲的成绩的第80百分位数为7+82=7.5,乙的成绩的第80百分位数为6+92=7.5,所以二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D错误.20.(多选)(2022·广东肇庆第二次统一检测)某大学生暑假到工厂参加生产劳动,生产了100件产品,质检人员测量其长度(单位:厘米),将所得数据分成6组:[90,91),[91,92),[92,93),[93,94),[94,95),[95,96],得到如图所示的频率分布直方图,则关于这100件产品,下列说法中正确的是()A.b=0.25B.长度落在区间[93,94)内的个数为35C.长度的众数一定落在区间[93,94)内D.长度的中位数一定落在区间[93,94)内答案ABD解析对于A,由频率和为1,得(0.35+b+0.15+0.1×2+0.05)×1=1,解得b=0.25,故A正确;对于B,长度落在区间[93,94)内的个数为100×0.35=35,故B正确;对于C,这100件产品长度的众数不一定落在区间[93,94)内,故C错误;对于D,由(0.1×2+0.25)×1=0.45<0.5,(0.1×2+0.25+0.35)×1=0.8>0.5,知这100件产品长度的中位数一定落在区间[93,94)内,故D正确.故选ABD.21.(多选)(2022·湖南师大附中高三第二次月考)甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层随机抽样方法从两所学校一共抽取了110名学生的数学成绩,考生成绩都分布在[70,150]内,并作出了如下频数分布统计表,规定考试成绩在[120,150]内为优秀,则下列说法正确的有()分组[70,80)[80,90)[90,100)[100,110)AB.估计甲校优秀率为25%,乙校优秀率为40% C.估计甲校和乙校众数均为120D.估计乙校的数学平均成绩比甲校高答案ABD解析对于A,甲校抽取110×12002200=60人,乙校抽取110×10002200=50人,故x=10,y=7,故A正确;对于B,估计甲校优秀率为1560=25%,乙校优秀率为2050=40%,故B正确;对于C,甲校众数的估计值为105,115,乙校众数的估计值为115,125,故C 错误;对于D,甲校平均成绩为109.5,乙校平均成绩为114.6,故D正确.22.(多选)(2022·湖南六校联考)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至13日中的某一天到达该市,并停留2天,下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为8 13C.此人在该市停留期间只有1天空气重度污染的概率为2 13D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大答案AD解析114×(86+25+57+143+220+160+40+217+160+121+158+86+79+37)=113.5,故A正确;在6月1日至13日这13天中,1日,2日,3日,7日,12日,13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率为613,故B不正确;6月1日至14日连续两天包含的样本点有13个,此人在该市停留期间只有1天空气重度污染的样本点是{4,5},{5,6},{7,8},{8,9},共4个,所以此人在该市停留期间只有1天空气重度污染的概率是413,故C不正确;由空气质量指数趋势图可以看出,从3月5日开始连续三天的空气质量指数方差最大,故D正确.故选AD.23.(2022·山东潍坊高三质检)为了调查公司员工的健康状况,用分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为124,男员工的平均体重为70 kg ,标准差为4,女员工的平均体重为50 kg ,标准差为6.若样本中有20名男员工,则女员工的人数为________.答案 30解析 设男员工的权重为ω男,由题意可知样本的平均数x -=ω男x -男+(1-ω男)x -女=70ω-男+50(1-ω男)=20ω男+50,样本的方差s 2=ω男[s 2男+(x -男-x -)2]+(1-ω男)[s 2女+(x -女-x -)2],即ω男[42+(70-20ω男-50)2]+(1-ω男)[62+(50-20ω男-50)2]=124,解得ω男=0.4,因为样本中有20名男员工,所以样本中女员工的人数为200.4×(1-0.4)=30.一、高考大题1.(2022·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 新设备10.110.410.110.010.1旧设备 9.8 10.0 10.1 10.2 9.7 新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22.(1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x-≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)由表中的数据可得:x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3, s 21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s 22=110×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.(2)由(1)中的数据可得y --x -=10.3-10=0.3,2s 21+s 2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y --x ->2s 21+s 2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.2.(2022·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解(1)由表中数据可知,甲厂加工出来的一件产品为A级品的概率的估计值为40100=0.4,乙厂加工出来的一件产品为A级品的概率的估计值为28=0.28.100(2)甲分厂加工100件产品的总利润为40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1500元,所以甲分厂加工100件产品的平均利润为15元/件.乙分厂加工100件产品的总利润为28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1000元,所以乙分厂加工100件产品的平均利润为10元/件.故厂家应选择甲分厂承接加工业务.3.(2022·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2022·全国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解 (1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x -1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x-2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计该家庭使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).二、模拟大题5.(2022·河南郑州一模)河阴石榴是河南省荥阳市的特产,距今已有2100多年的历史,河阴石榴籽粒大,色紫红,甜味浓,被誉为“中州名果”.河阴石榴按照果径大小可以分为四类:标准果、优质果、精品果、礼品果.某超市老板从采购的一批河阴石榴中随机抽取100 kg,根据石榴的等级分类标准得到的数据如下表所示:(1)求a(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:方案1:不分类卖出,单价为20元/kg;方案2:分类卖出,分类后的水果售价如下表所示:=0.2.解(1)a=100-10-30-40=20,礼品果所占比例是20100(2)理由一:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,因为x -=20.6>20,所以从超市老板的销售利润角度考虑,采用方案2比较好.理由二:设方案2的石榴售价的平均数为x -,x -=16×110+18×310+22×410+24×210=20.6,虽然x -=20.6>20,但20.6-20=0.6,差额不太大,从超市老板后期对石榴分类的人力资源和时间成本角度考虑,采用方案1比较好.6.(2022·湖南师大附中第一次大练习)某学校团委组织了“文明出行,爱我中华”的知识竞赛,从参加考试的学生中抽出60名学生,将其成绩(单位:分)整理后,得到如图所示的频率分布直方图(其中分组区间为[40,50),[50,60),…,[90,100]).(1)求成绩在[70,80)的频率,并补全此频率分布直方图;(2)求这次考试平均分的估计值(同一组中的数据以这组数据所在区间中点的值作代表);(3)若从成绩在[40,50)和[90,100]的学生中任选两人,求他们的成绩在同一分组区间的概率.解 (1)成绩在[70,80)的频率为1-(0.005+0.015+0.020+0.030+0.005)×10=0.25.补全频率分布直方图如下:(2)依题意可得,平均分x-=(45×0.005+55×0.015+65×0.020+75×0.025+85×0.030+95×0.005)×10=72.5.故这次考试平均分的估计值为72.5.(3)成绩在[40,50)和[90,100]的人数分别是3和3,所以从成绩在[40,50)和[90,100]内的学生中任选两人,将[40,50)分数段的3人编号为A1,A2,A3,将[90,100]分数段的3人编号为B1,B2,B3,从中任取两人,则样本空间Ω={(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,B3),(A2,A3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)},共有15个样本点,这15个样本点发生的可能性是相等的.其中,在同一分数段内的事件所含样本点有(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),共6个,故所求概率P=615=25.7.(2022·河北省衡水市第一中学高三上学期第一次调研)“2022年全国城市节约用水宣传周”已于5月9日至15日举行.成都市围绕“贯彻新发展理念,建设节水型城市”这一主题,开展了形式多样、内容丰富的活动.进一步增强全民保护水资源,防治水污染,节约用水的意识.为了解活动开展成效,某街道办事处工作人员赴一小区调查住户的节约用水情况,随机抽取了300名业主进行节约用水调查评分,将得到的分数分成6组:[70,75),[75,80),[80,85),[85,90),[90,95), [95,100],得到如图所示的频率分布直方图.(1)求a的值,并估计这300名业主评分的中位数;(2)若先用比例分配的分层随机抽样的方法从评分在[90,95)和[95,100]的业主中抽取5人,然后再从抽出的这5名业主中任意选取2人做进一步访谈,求这2人中至少有1人的评分在[95,100]的频率.解(1)∵第三组的频率为1-(0.020+0.025+0.030+0.035+0.050)×5=0.200,=0.040.∴a=0.2005又第一组的频率为0.025×5=0.125,第二组的频率为0.035×5=0.175,第三组的频率为0.200,∴前三组的频率之和为0.125+0.175+0.200=0.500,∴这300名业主评分的中位数为85.(2)由频率分布直方图,知评分在[90,95)的人数与评分在[95,100]的人数的比值为3∶2,∴采用比例分配的分层随机抽样法抽取5人,评分在[90,95)的有3人,评分在[95,100]的有2人.不妨设评分在[90,95)的3人分别为A1,A2,A3,评分在[95,100]的2人分别为B1,B2,则从5人中任选2人的所有可能情况有{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10种.其中选取的2人中至少有1人的评分在[95,100]的情况有{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共7种.故这2人中至少有1人的评分在[95,100]的概率为P=710.。
高三数学人教版总体分布的估计知识点归纳总结知识点总结
高三数学人教版总体分布的估计知识点归纳总结知识点总结总体分布的估计是统计学中常用的手法,为此整理了总体分布的估计知识点,请大家查看。
样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。
一般地,样本容量越大,这种估计就越精确。
总体估计要掌握:(1)表(频率分布表);(2)图(频率分布直方图)。
提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率
其中,样本指是指从全部的调查对象提取出来进行调查的个体
个体指总体中的每一个考察的对象,
总体指考察的对象的全体,
样本容量指样本中个体的数目。
例如,为了调查全国人口的寿命,抽查了十一个省市的2500名城镇居民,这个问题中2500名城镇居民的寿命的全体是样本。
2500是样本容量。
某个人的寿命是个体。
全国人口寿命是总体。
总体分布的估计知识点的全部内容就是这些,更多精彩内容请持续关注。
总体分布的估计与总体特征数的估计[高考数学总复习][高中数学课时训]
数 1. 20 频率 0.25 频数 .答 52.(2008·山东理) 山东 鉴2007 成 1997 至2006 数 . 数 数 数 数 , 数 数 数 . 得 1997 至2006 数 数 . 答 303.63. 成若干 [a b ) 频率 m , 频率 高 h |a -b |= . 答hm4.(2008·山东文 9) 取100 成绩 如 这100 成绩 准差 .答5102 5. 高 学 100 龄 17.5岁~18岁 重(kg ) 得 频率 如 :得这100 学 重 [56.5 64.5) 学 数 . 答 40例1 学 间 5月1日至30日 学们数按5 频率 (如 ) 高 2∶3∶4∶6∶4∶1 第 频数 12 答 问题:基础自(1) ? (2) 数 ? ?(3) 第 第 10 、2 问这 率高? (1) 题 第 频率 1464324+++++=51第 频数 12 数 5112=60.(2) 频率 第 数 60×1464326+++++=18( ).(3)第 率1810=95 第 数 60×1464321+++++=3( )第 率 32=96第 率高.例2 追踪调 如 :(1) 频率 ; (2) 频率 ;(3) 100 h ~400 h 率; (4) 400 h 率. (1) 频率 如 :(2)频率 (3) 频率 100 h ~400 h 频率 0.65 们 100 h ~400 h 率 0.65.(4) 频率 400 h 频率 0.20+0.15=0.35 们 400 h 率 0.35.例3 A B 这 取 8 里 数(单 :1 000 km ) A 96 112, 97, 108, 100, 103, 86, 98 B 108 101 94 105 96 93 97 106 (1) 算A B 里 数 数; (2) 算A B 里 差、 准差; (3) 数 稳定? (1)A 里 数 : 898861031001089711296+++++++=100,数 :298100+ =99; B 里 数 :810697939610594101108+++++++=100,数 :297101+=99.(2)A 里 差 :112-86=26准差 : s =821430831242222222+++++++=2221≈7.43; B 里 差 :108-93=15 准差 :s = 86374561822222222+++++++=2118≈5.43.(3) 于A B 里 数相 而B 里 差 准差 B 稳定.例4(14 ) 、 间 自 隔30 min 取 称 重数 如 : :102 101 99 98 103 98 99; :110 115908575115110.(1)这 ? (2) 这 数 ;(3) 数 间 稳定. (1) 间隔 间相 . 2(2) 如 :5(3) 间: 值: 1x =71(102+101+99+98+103+98+99)=100 7 差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9间:值:2x =71(110+115+90+85+75+115+110)=100 11 差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4. 13 ∵1x =2x s 12<s 22, 间 稳定.141. 学 取 学 学 得数 理 频率 如 频率 0.1 0.3 0.4 第 频数 5.(1) 第 频率;(2) 这 学 数 ?(3) 这 学 数 数 第 ? (1)第 频率=1-(0.1+0.3+0.4)=0.2. (2) 这 学 数 n ,n =第 频率第 频数=5÷0.1=50( ).(3) 0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10 第 、第 、第 、第 频数5、15、20、10 学 数 数 第 .2. 高 学 取50 学 数学 成绩 频数如 :(单 : ) [40 50) 2;[50 60) 3;[60 70) 10;[70 80) 15; [80 90) 12;[90 100] 8. (1) 频率 ; (2) 频率 ;(3) 成绩 [60 90) 学 例; (4) 成绩 85 学 例. (1)频率 如 :(2)频率 如 .(3)成绩 [60 90) 学 例 学 成绩 [60 90) 频率 (0.20+0.30+0.24)×100%=74%. (4)成绩 85 学 例 学 成绩 足85 频率. 相 频率 b . 808560.0--b =809060.084.0-- b =0.72. 成绩 85 学 72%.3. 、 相 10 环数; :8 8 6 8 6 5 9 10 7 4 :9 5 7 8 7 6 8 6 8 7 (1) 算 们环数 准差; (2) 稳定. (1)x =101(8+8+6+8+6+5+9+10+7+4)=7.1, x =101(9+5+7+8+7+6+8+6+8+7)=7.1, 2s =101[(8-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(5-7.1)2+(9-7.1)2+(10-7.1)2+(7-7.1)2+(4-7.1)2]=3.09,s≈1.76.1 2s=10[(9-7.1)2+(5-7.1)2+(7-7.1)2+(8-7.1)2+(7-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(7-7.1)2]=1.29s≈1.14.(2)∵x=x s<s稳定.4.(2008·海南、宁夏理 16) 、 25度(单 :mm) 结果如 ::271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323325 325 328 331 334 337 352:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327329 331 333 336 337 343 356数 如 : 、 度结论:①;②.答 ① 度 于 度( : 度于 度).② 度度 散.( : 度度 集 (稳定). 度 散 度度 散 度 ). 度 数 307 mm 度 数 318 mm. 度基称 而 集 间( 值附近). 度值(352) 称匀.、填空题1. 于频率 .① 高 取 数频率② 高频率高 数 值高频率 值答 ①②2. 、 打5 环数如: :68998; :107779. 这 成绩稳定.答3.学 调 50 学 得 们 自 间 数 结果 如 :得这50 学 这 间 h.答 0.94.50学成绩 于1319 间 结果按如 成 :第 成绩 于 于13于14;第 成绩 于 于14于15;……第 成绩 于 于18于 于19. 按 得 频率.成绩 于17 学 数 数 x,成绩 于 于15于17学数 y 频率 析 xy .答 0.9,355.(2009·启东质检)高 学 100 高 学 得 频率 如 于 数 频数成 数频数成 差数 频率a 4.6 5.0 间 学数b,a,b的值 .答 0.27786. 、 学5 成绩 如 若 、 成绩x、x x x稳定.答 <7.(2008· 海理 9) 值2337a b12,13.7,18.3,20,数10.5.若 差 a、b的 值 .答 10.5、10.58.份3题 题1 得3210 学 例 30%,40%,20%,10%,若 30 学.答 1.9、 答题9. 学 学 成绩(得 数) 理 成 如 频率 . 第 、第 、第 、第 频率 0.30 0.15 0.10 0.05 第 频数 40.(1) 第 频率 这 频率 ; (2) 这 学 数 ?(3)这 学 成绩 数 第 ?( 理 )(1) 频率 1.00 第 、 、 、 频率 0.30 0.15 0.10 0.05. 第 频率 :1.00-(0.30+0.15+0.10+0.05)=0.40. 59.5~69.5 第 高=频率=1040.0=0.04. 如 .(2) 学 数 x . ∵第 频数 40 频率 0.40x40=0.40 得x =100( ). 学 数 100 .(3) 0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,第 、第 、第 、第 、第 频数 30 40 15 10 5 学 成绩 数 第 .10. 高 学 取 学 数 得数 理 频率 (如 ) 2∶4∶17∶15∶9∶3 第 频数 12.(1)第 频率 ? ?(2)若 数 110 (含110 ) 学 高 学 率 ? (3) 这 学 数 数 ? 理 . (1) 于频率 数 频率 第 频率 : 391517424+++++=0.08.频率= 第 频数 =第 频率第 频数=08.012=150.(2) 学 高 学 率 39151742391517++++++++×100%=88%.(3) 得 频数 6,12,51,45,27,9, 频数 69 频数 114 数 数 第 . 11. 格:(1) 成 频率 ; (2) 格 频率 ;(3) 数 [10.95 11.35) 率 ?(1)频率 :0.03 0.09 0.13 0.16 0.26 0.20 0.07 0.04 0.02 1.00. (2)频率 如 (3)数 [10.9511.35) 频率0.13+0.16+0.26+0.20=0.75.12. 、 得 如 :得 :12152425313136363739444950;得 :813141623262833383959.(1) 成绩 ;(2) 算 数 数 差 成绩 稳定 ;(3) 成绩 定 好 什么?(1) 如: 稳定 得 好.(2)x=332s≈127.23x=272s≈199.09x>x, 2s<2s好 稳定.(3) 定 好 、 得定定准 .。
高一数学总体分布估计与总体特征数的估计苏教版
高一数学总体分布估计与总体特征数的估计苏教版【本讲教育信息】一. 教学内容:总体分布估计与总体特征数的估计[教学目标]1、通过实例的分析,体会分布的意义和作用。
在表示样本数据的过程中,学会列频率分布表,画频率直方图、频率折线图和茎叶图2、理解数据标准差的意义和作用,学会计算数据的标准差3、在解决统计的问题中,进一步体会用样本估计总体的思想,学会计算数据的标准差4、掌握利用已有的数据对一般的分布作出估计一、总体分布估计1、频率分布表或频率分布条形图历史上有人通过做抛掷硬币的大量重复试验,得到了如下试验结果:试验结果频数频率正面向上(0)36124 0.5011反面向上(1)35964 0.4989说明:(1)频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚。
(2)①各长条的宽度要相同;②相邻长条之间的间隔要适当。
频率分布表——当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布。
我们把反映总体频率分布的表格称为频率分布表。
全距:我们将取值区间的长度称为全距。
分成区间的长度称为组距。
编制频率分布表的步骤(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表。
2、频率分布直方图与折线图画频率分布直方图的步骤:(1)计算最大值与最小值的差(知道这组数据的变动X围)(2)决定组距与组数(将数据分组)组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。
组距:指每个小组的两个端点的距离。
(4)决定分点。
(5)列出频率分布表。
(6)画出频率分布直方图。
画频率分布直方图应注意的问题:(1)频率分布直方图的横轴和纵轴与前面学的直角坐标系中的横轴和纵轴有所不同,两轴的单位长度可以不同;两轴的交点也不一定是坐标为(0,0)的点。
(2)各个小长方形的面积等于相应各组的频率;各小长方形的面积的和等于1。
【全程复习方略】高中数学 9.2总体分布的估计、总体特征数的估计配套课件 苏教版
登记频数,计算频率,列出频率分布表.
(2)频率分布直方图的制作步骤
第一步,先制作频率分布表,然后作直角பைடு நூலகம்标系.
第二步,把横轴分成若干段,每一线段对应一个组的组距,然后 以此线段为底作一矩形,它的高等于该组的 频率 ,这样得
组距
出一系列的矩形. 第三步,每个矩形的面积恰好是该组的频率,这些矩形就构成 了频率分布直方图.
个数
[100, 200) 20 [200, 300) 30 [300, 400) 80 [400, 500) 40 [500, 600] 30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在[100,400) h以内的概率;
(4)估计电子元件寿命在400 h以上的概率.
【解题指南】本题分组及频数统计已完成,只需列表画图即可, 解答(3)(4)可用频率代替概率.
画出茎叶图并分析两个班学生的数学学习情况.
【解题指南】分析所给数据,以十位数为茎,个位数为叶,作 出茎叶图,然后分析学习情况. 【规范解答】
【规范解答】(1)频率分布表如下: 寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600] 合计 频数 20 30 80 40 30 200 频率 0.10 0.15 0.40 0.20 0.15 1
(2)频率分布直方图如下:
频率 组距
0.0040 0.0035 0.0030 0.0025 0.0020 0.0015 0.0010 0.0005
频率分布直方图的绘制与应用 【方法点睛】画频率分布直方图应注意的问题 (1)在频率分布直方图中纵坐标表示 频率=组距×
频率 . 组距 频率 ,各小矩形的面积即 组距
高三第一轮复习总体分布、总体特征数的估计
总体分布、总体特征数的估计【提纲挈领】(请阅读下面文字,并在关键词下面记着重号)一:本讲主要讲解分布的意义和作用,体会用样本估计总体的思想。
二:总体特征数:1.数据方差和标准差的意义和作用,会计算数据的方差和标准差.2.数据的中位数,众数,平均数的意义和作用,会计算数据的中位数,众数,平均数。
3.了解用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.利用已有的数据对一般的分布进行估计。
主干知识归纳1.用样本的数字特征估计总体的数字特征(1)众数、中位数在一组数据中出现次数 最多 的数据叫做这组数据的众数; 将一组数据按照从大到小(或从小到大)排列,处在 中间位置 上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数.2.平均数与方差 如果这n 个数据是x 1,x 2,…,x n ,那么,叫做这n 个数据的平均数; 如果这n 个数据是x 1,x 2,…,x n ,那么 ,叫做这n 个数据的方差;同时 ,叫做这n 个数据的标准差.方法规律小结1.用样本的数字特征估计总体的数字特征,要理解以下概念: 即众数,中位数,平均数,标准差.(1)平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。
(2)样本的方差和标准差反映数据的离散或波动的情况。
(3)中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。
众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。
【指点迷津】【类型一】总体特征数的定义及常规计算【例1】数据70,71,72,73的标准差是______________。
【解析】:根据标准差公式可得标准差为1.12. 答案:1.12.【例2】用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确 【解析】:样本容量越大,当然越能反映总体的某个性质,因此答案为C. 答案:C.【例3】在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( )A .9.4,0.484B .9.4,0.016C .9.5,0.04D .9.5,0.016 【解析】:根据平均值和方差公式可得平均值和方差分别为9.5,0.016. 答案:D .【类型二】总体特征数及其应用。
高考数学一轮复习 第11章 概率与统计11.5总体分布的估计、总体特征数的估计教学案 苏教版
11.5 总体分布的估计、总体特征数的估计考纲要求1.了解分布的意义和作用,能根据频率分布表画出频率分布直方图、频率折线图、茎叶图,体会它们的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差(不要求记忆公式). 3.能从样本数据中提取基本的数字特征(如平均数,标准差),并作出合理的解释. 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.1.编制频率分布表的步骤(1)求全距,决定组距和组数,组距=________.(2)分组,通常对组内数值所在区间取________区间,最后一组取________. (3)登记频数,计算频率,列出频率分布表. 2.作频率分布直方图的方法(1)先制作频率分布表,然后作直角坐标系; (2)把横轴分成若干段,每一线段对应一个组的______,然后以此线段为底作一______,它的高等于该组的________,这样得出一系列的______.(3)每个矩形的面积恰好是该组的______,这些矩形就构成了频率分布直方图. 3.画茎叶图的步骤(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;(3)将各个数据的叶按大小次序写在其茎右(左)侧.茎叶图中数据的茎和叶的划分,可以根据数据的特点灵活地选取.4.众数、中位数、平均数(1)在一组数据中,出现次数______的数据叫做这组数据的众数. (2)将一组数据按大小依次排列,把处在______位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)如果有n 个数x 1,x 2,…,x n ,那么x =__________________,叫做这n 个数的平均数.5.标准差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n∑i =1nx i -x 2,标准差的平方s 2叫做方差,s 2=1n ∑i =1n(x i -x )2,其中x i 是第i 个数,n 是样本容量,x 是平均数.1.(2012江苏苏州期末)为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图.据此估计该校上学期200名教师中,使用多媒体进行教学次数在[15,30]内的人数为__________.2.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为__________.3.(2012江苏南通一调)一组数据9.8,9.9,10, a,10.2的平均数为10,则该组数据的方差为__________.4.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是__________.5.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,__________班的平均成绩较高.1.现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与用样本的频率分布来近似地代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.2.给定一个样本,如何确定中位数?提示:把样本数据按从小到大(或从大到小)的顺序排列,其最中间的数(或最中间两个数的平均数)即为该样本的中位数.一、频率分布直方图【例1】为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)(2)估计数据落在(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.方法提炼频率分布表和频率分布直方图是统计中的重要内容,高考中多利用频率分布直方图进行相关统计和概率计算,正确处理有关信息及数据是解决本题的关键.请做针对训练2二、茎叶图【例2】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果X=8,求乙组同学植树棵数的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.(注:方差s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中x为x1,x2,…,x n的平均数)方法提炼1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.请做针对训练1三、用样本数字特征估计总体的数字特征【例3】甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中算得的结果,对两人的训练成绩作出评价.方法提炼平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定.请做针对训练3从近三年的高考试题统计分析可以看出,本节重点考查频率分布直方图、平均数、方差的计算;借助概率考查学生分析问题、解决问题的能力和识图能力,主要以填空题的形式出现,难度较小.1.右面茎叶图表示的甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为__________.2.(2012江苏无锡五校联考)某市高三数学抽样考试中,对90分及其以上的成绩情况进行统计,其频率分布直方图如下图所示,若(130,140]分数段的人数为90人,则(90,100]分数段的人数为__________.3试问谁参考答案基础梳理自测 知识梳理1.(1)全距组数(2)左闭右开 闭区间2.(2)组距 矩形 频率组距矩形 (3)频率4. (1)最多 (2)中间 (3)x 1+x 2+…+x n n基础自测1.100 解析:在茎叶图中,使用多媒体进行教学次数在[15,30]内的人数有10人,从而估计该校上学期用多媒体进行教学的人数为200×1020=100.2.36 解析:由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10)内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36.3.0.02 解析:由题意得a =10.1,从而方差s 2=15×(0.22+0.12+02+0.12+0.22)=0.02.4.64 解析:甲比赛得分的中位数为28,乙比赛得分的中位数为36,所以甲、乙两人比赛得分的中位数之和为28+36=64.5.乙考点探究突破【例1】解:(1)根据频率分布直方图可知,频率=组距×频率组距,故可得下表:(2)0.30+0.15+0.02=所以数据落在[1.15,1.30]中的概率约为0.47. (3)120×1006=2 000,所以水库中鱼的总条数约为2 000条.【例2】解:(1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为x =8+8+9+104=354.方差为s 2=14×⎣⎢⎡⎝⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎦⎥⎤⎝ ⎛⎭⎪⎫10-3542=1116.(2)记甲组四名同学为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9, 11,11;乙组四名同学为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),用C 表示:“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.【例3】 解:(1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分, 乙:13分,14分,12分,12分,14分,x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.演练巩固提升 针对训练 1.45 解析:记其中被污损的数字为x .依题意得甲的五次综合测评的平均成绩是15(80×2+90×3+8+9+2+1+0)=90,乙的五次综合测评的平均成绩是15(80×3+90×2+3+3+7+x +9)=15(442+x ).令90>15(442+x ),由此解得x <8,即x 的可能取值是0~7,因此甲的平均成绩超过乙的平均成绩的概率为810=45.2.810 解析:根据直方图,组距为10,在(130,140]内的频率组距=0.005,所以频率为0.05.因为此区间上的频数为90,所以这次抽考的总人数为1 800人.因为(90,100]内的频率组距=0.045,所以频率为0.45.设该区间的人数为x ,则由x1 800=0.45,得x =810,即(90,100]分数段的人数为810.3.解:x 甲=110×(4+7+…+8)=7.1,x 乙=110×(7+8+…+9)=7.1,s 2甲=110×[(4-7.1)2+(7-7.1)2+…+(8-7.1)2]=3.09, s 2乙=110×[(7-7.1)2+(8-7.1)2+…+(9-7.1)2]=1.29. 因为s 2甲>s 2乙,所以乙10次射靶比甲10次射靶情况稳定.。
高三数学第一轮复习第五十七课时总体分布的估计与总体特征数的估计
第57课时总体分布的估计与总体特征数的估计【考点概述】了解分布的意义和作用,会列频率分布表,会画频率分布直方图、条形图、折线图、茎叶图,理解它们各自的特点. 【重点难点】会用样本频率分布去估计总体分布,正确地编制频率分布表并能绘制频率直方图、条形图、茎叶图,体会它们的意义和作用;用样本数据的方差和标准差估计总体的方差与标准差,理解样本数据的方差与标准差的意义和作用,解决一些简单的实际问题. 【知识要点】1.编制频率分布表的步骤(1)求全距,决定组距和组数,组距= ;(2)分组,通常对组内数值所在区间取 区间,最后一组取 ; (3)登记频数,计算频率,列出频率分布表. 2.作频率分布直方图的方法(1)先制作频率分布表,然后作直角坐标系;(2)把横轴分成若干段,每一线段对应一个组的 ,然后以此线段为底作一 ,它的高等于该组的 ,这样得到一系列的 . (3)每个矩形的面积恰好是该组的 ,这些矩形就构成了频率分布直方图. 3.平均数、标准差和方差设一组样本数据n x x x ,,21,其平均数为x ,则x = ,称2s = 为这个样本的方差,它的算数平方根∑=-=ni i x x n s 12)(1为 . 【基础训练】1.估计本次考试的及格率是 ;2.在抽查产品尺寸的过程中,将其尺寸分成若干组,(a,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则b a -等于 ;3.则参加奥运会的最佳人选应为 ;4.在总体中抽取一个样本,为了便于统计,将样本中的每一个数据乘以100后进行分析,得出新样本平均数为3,则估计总体的平均数为 ;5.右图是2008年“隆力奇”杯第13届CCTV 青年歌手电视大奖赛上某一位选手的部分得分的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的方差为 .7 98 4 4 4 6 7 9 1 3 6 【例题精选】例1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4。
高三数学第一轮复习--抽样方法与总体分布的估计
1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100
名运动员的年龄,就这个问题来说,下列说法正确的是( D )
2.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一个
容量为3的样本,则某特定个体入样的概率是(C )
A. 3
B. 3
C. 3
D. 1
C
3 10
10 9 8
10
10
系统抽样、分层抽样这三种方法中较合适的抽样方法是___________
0.18 0.47 分别是______________、_______(精确到0.01). 总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的
结果叫随机事件,所有这些事件的概率分布规律称为总体分布.
1.了解简单随机抽样、分层抽样及系统抽样的意义,会 用它们对简单实际问题进行抽样. 2.会用样本频率分布估计总体分布. 3.会用样本估计总体平均值和方差.
在本章的复习中,要理解几种抽样方法的区别与联 系.应充分注意一些重要概念的实际意义,理解概率统 计中处理问题的基本思想方法,掌握所学的概率统计 知识的实际应用.
2
5
6
简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率
分数段 [100,110) 相等,就称这样的抽样为简单随机抽样.
[110,120 )
[110,120
)[120,130)
频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的
(2)样本数据落在范围
5.某班学生在一次数学考试中成绩分布如下表: 某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第57课时总体分布的估计与总体特征数的估计
【考点概述】
了解分布的意义和作用,会列频率分布表,会画频率分布直方图、条形图、折线图、茎叶图,理解它们各自的特点. 【重点难点】
会用样本频率分布去估计总体分布,正确地编制频率分布表并能绘制频率直方图、条形图、茎叶图,体会它们的意义和作用;用样本数据的方差和标准差估计总体的方差与标准差,理解样本数据的方差与标准差的意义和作用,解决一些简单的实际问题. 【知识要点】
1.编制频率分布表的步骤
(1)求全距,决定组距和组数,组距= ;
(2)分组,通常对组内数值所在区间取 区间,最后一组取 ; (3)登记频数,计算频率,列出频率分布表. 2.作频率分布直方图的方法
(1)先制作频率分布表,然后作直角坐标系;
(2)把横轴分成若干段,每一线段对应一个组的 ,然后以此线段为底作
一 ,它的高等于该组的 ,这样得到一系列的 . (3)每个矩形的面积恰好是该组的 ,这些矩形就构成了频率分布直方图. 3.平均数、标准差和方差
设一组样本数据n x x x ,,21,其平均数为x ,则x = ,称2
s = 为
这个样本的方差,它的算数平方根∑=-=n
i i x x n s 1
2)(1为 . 【基础训练】
1.
估计本次考试的及格率是 ;
2.在抽查产品尺寸的过程中,将其尺寸分成若干组,(a,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则b a -等于 ;
3.
则参加奥运会的最佳人选应为 ;
4.在总体中抽取一个样本,为了便于统计,将样本中的每一个数据乘以100后进行分析,得出新样本平均数为3,则估计总体的平均数为 ;
5.右图是2008年“隆力奇”杯第13届CCTV 青年歌手电视大奖赛上某一位选手的部分得分的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的方差为 .
7 9
8 4 4 4 6 7 9 1 3 6 【例题精选】
例1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的
数据整理后画出频率分布直方图(如图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4。
第一小组的频数是5。
(1)求第四组的频率和参加这次测试的学生人数;
(2)在这次测试中,学生跳绳次数的中位数落在第几小组内?
(3)参加这次测试跳神次数在100
是多少?
例(1)求该公司职工月工资的平均数、中位数、众数;(精确到1元) (2)你认为哪个统计量更能反映这个公司员工的工资水平?
例3.从甲、乙两种玉米苗中各抽10株,分别测得它们株高如下(单位:cm )
甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40 问:(1)哪种玉米苗长得高?(2)哪种玉米的苗长得整齐?
例4.为了研究某高校大学新生的视力情况,随机抽查了该校100名学生的视力情况,得到
频率分布直方图,如图,已知前四组的频数从左到右依次是等比数列}{n a 的前四项,后六组的频数从左到右依次是等差}{n b 数列的前六项。
(1)求等比数列}{n a 的通项公式;(2)求等差数列}{n b 的通项公式;
(3)若规定视力低于5.0的学生属于近视学生,试估计该校新生的近视率μ的大小。
【巩固训练】
1.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本数据在
]30,(-∞上的频率为
2.在样本方差的计算公式])20()20()20[(10
1
21022212-++-+-=
x x x s 中,数字10和20分别表示样本的 和
3.一组数据中每个数据都减去80构成一组新数据,这组新数据的平均数是1.2,方差是
4.4,则原来这组数的平均数和方差分别是
4.从某地区
该地区生活不能自理的老人中男性比女性约多 人
产品数量的分组区间为[45,55],[55,65],[65,75],[75,85],[85,95],由此得到频率分
9.这组数据估计哪一种水稻品种的产量比较稳定。