北师大版高中数学(必修3)第一章《统计》

合集下载

北师大版高中数学必修3《一章 统计 7 相关性 相关性》优质课教案_1

北师大版高中数学必修3《一章 统计  7 相关性  相关性》优质课教案_1

变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。

为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。

(1)根据上表中的数据,制成散点图。

你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系。

(3)如果一个学生的身高是188cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下。

从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的。

那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)二点确定一条直线。

同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同。

同学3:多取几组点对,确定几条直线方程。

再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距。

同学4:我从左端点开始,取两条直线,如下图。

再取这两条直线的“中间位置”作一条直线。

同学5:我先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多。

1015202530150155160165170175180185190195同学6:我先将所有的点分成两部分,一部分是身高在170 cm 以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线。

北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)

北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)

一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。

最新北师大版高中数学必修三第一章统计 估计总体的分布

最新北师大版高中数学必修三第一章统计 估计总体的分布

§5 用样本估计总体 5.1 估计总体的分布学习 目标1.理解什么是频率分布表、频率分布直方图、频率折线图.(数学抽象)2.会列频率分布表,会画频率分布直方图和频率折线图,能根据频率分布直方图解决问题.(数据分析、直观想象)3.了解用样本估计总体的意义.(数学抽象)导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:(2)频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.频率分布表、频率分布直方图与频率折线图各有什么优缺点?提示:①频率分布表:优点:频率分布表在数量表示上比较确切;缺点:不够直观、形象,分析数据分布的总体趋势不太方便;②频率分布直方图:优点:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式;缺点:从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了;③频率折线图:优点是它反映了数据的变化趋势.缺点:由图本身得不到原始的数据信息.1.辨析记忆(对的打“√”,错的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()提示:(1)×.纵坐标指的是频率与组距的比值.(2) ×.频率分布直方图的宽度表示组距.(3)×.各小矩形的面积之和一定为1.(4) √.为了方便看图,一般习惯把频率折线图画成与横轴相连,所以横轴上左右两端点没有实际的意义.2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________. 【解析】第五组的频数为0.2×40=8.所以第六组的频数为40-5-6-7-10-8=4.频率为440=0.1.答案:40.13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有________.【解析】因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).答案:60辆4.(教材例题改编)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n=________.【解析】由题意得50n=0.25,所以n=200.答案:200类型一频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解. 2.极差=180-151=29,组距为3,可分为10组.【解析】1.选B.根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.2.(1)①求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.②确定组距与组数:取3为组距,则极差组距 =293 =923 ,故可将样本数据分成10组.③第一组起点定为150.5,组距为3,这样分出10组:[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5]. ④列频率分布表174.5~177.510.025177.5~180.510.025(2)画频率分布直方图如图所示:绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91% B.92% C.95% D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为4145×100%≈91%.2.某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756 565656565656555555555454 54545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图. 【解析】①计算极差:61-48=13(千克); ②决定组距与组数,取组距为2,因为132 =612 ,所以共分7组;③决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.④列出频率分布表如下:分组(Δx i ) 频数(n i ) 频率(f i ) 47.5~49.5 2 0.05 49.5~51.5 5 0.125 51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计401.00⑤作出频率分布直方图如下:3.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107~109,3株;109~111,9株;111~113,13株;113~115,16株;115~117,26株;117~119,20株;119~121,7株;121~123,4株;123~125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109~121范围内的可能性是百分之几.【解析】(1)频率分布表如下:分组频数频率累积频率107~10930.030.03109~11190.090.12111~113130.130.25113~115160.160.41115~117260.260.67117~119200.200.87119~12170.070.94121~12340.040.98123~12520.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109~121范围内的频率为:0.94-0.03=0.91,即数据落在109~121范围内的可能性是91%.类型二频率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图; (3)估计成绩在60~90分的学生比例.【思路导引】画频率分布直方图和折线图⇒制作好频率分布表⇒纵坐标表示频率与组距的比值.【解析】(1)样本的频率分布表如下:成绩分组(Δx i ) 频数(n i ) 频率(f i ) f i Δx i 40~50 2 0.04 0.004 50~60 3 0.06 0.006 60~70 10 0.2 0.02 70~80 15 0.3 0.03 80~90 12 0.24 0.024 90~10080.160.016(2)频率分布直方图及频率折线图如图所示:(3)成绩在60~90的频率为1-0.04-0.06-0.16=0.74, 所以可估计成绩在60~90分的学生比例为74%.本例条件不变,估计成绩在50~80分的学生的比例.【解析】成绩在50~60分的学生的频数为3,在60~70的学生的频数为10,在70~80分的学生的频数为15,所以成绩在50~80分的学生的频数为28,占总体的2850 =1425 .频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)[13,14)[14,15)[15,16)[16,17) 频数7112623起始月薪(百元)[17,18)[18,19)[19,20)[20,21]频数1584 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【解析】(1)样本的频率分布表为起始月薪(百元)频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06总计100 1.00(2)频率分布直方图和频率折线图如图.(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.【解析】(1)由(x+0.012 5+0.006 5+0.003×2)×20=1,解得x=0.025.(2)上学所需时间不少于40分钟的学生的频率为:(0.006 5+0.003×2)×20=0.25,估计学校1 000名新生中有1 000×0.25=250名学生可以申请住宿.答:估计学校1 000名新生中有250名学生可以申请住宿.类型三用样本分布估计总体分布【典例】1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p 得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解析】1.选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A 正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B 正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C 不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D 正确.2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此,第二小组的频率为:42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量, 所以样本容量=第二小组频数第二小组频率=120.08 =150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.【解析】(1)由题意可知:(0.050+0.100+0.150+0.125+x )×2=1,解得:x =0.075.(2)设样本中身高小于100厘米的频率为p 1,所以,p 1=(0.050+0.100)×2=0.30,而p 1=36N ,所以N =36p 1=360.30 =120. (3)样本中身高大于或等于98厘米并且小于104厘米的频率为p 2=(0.100+0.150+0.125)×2=0.75,所以身高大于或等于98厘米并且小于104厘米的学生数n =p 2N =120×0.75=90.。

最新北师大版高中数学必修三全册精品教案

最新北师大版高中数学必修三全册精品教案

北师大版高中数学必修3第一章《统计》全部教案第一课时§1.1随机选取数字一、教学目标1、知识与技能:(1)使学生认识统计活动所要研究的问题,如何分析数据资料;(2)明确为什么要随机选取数字,随机选取数字的困难性,精心设计调查方案的重要性.2、情感、态度与价值观:让学生体会学习统计,参与统计活动的使用价值,提高学生参与意识以及理论与实际相结合的能力.二、教学重点、难点与关键1、重点、难点:随机选取数字把握的困难性及其原因;2、关键:通过对具体是;事例的分析来说明对随机选取数字的困难性.三、教学方法:讨论探究法四、教学过程(一)创设情景,引入新课在日常生活中常遇到如下一些问题(1)学校国庆节期间要举行一次大型的文艺汇演,限于演出场所的原因,每个班只有3张票,如何进行分配呢?(2)某工厂要检验一批产品质量,决定从这批产品中任意抽取10个进行检验,以判断产品的质量如何?(3)为了评选本年度先进学生代表,学校对候选人进行量化,让全体学生去评选你是如何看待和参与呢?你认为人为因素的干扰大吗?真正作到公平、公正难度大吗?上面一些生活中的事例看似简单,但要真正作到“随机”,“任意”都困难很大,为什么呢,本节课将通过具体事例认真地研究这个问题.(二)统计活动及其对选取数据的分析例:北京市某中学通过对343名学生做了下面一项统计活动,调查的过程如下(1)调查者事先做好问卷;(2)给每个被调查者发放问卷,并进行回收;(3)对所有的调查数据进行汇总.数据 1 2 3 4 5 6 7 8 9 10统计结果:正正正正▔正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正ˉ 正正正人数 21 24 29 25 45 45 54 35 46 19根据上面的数据回答下面问题:(1)计算出选择各个数的百分比(用四舍五入方法保留到百分数的整数位).(2)用下面的统计图表示上面的数据时,你觉得哪种统计图最合适?说明理由.(3)请你分析这些数据的集中趋势与离散程度.(4)从上面的数据能否看出,选哪些数的人少些,由此你能得到什么结论?解:(1)计算出选择各个数的百分比(要求学生用计数器算出后汇总)数字 1 2 3 4 5 6 7 8 9 10人数/人 21 24 29 25 45 45 54 35 46 19百分比/% 6 7 8 7 13 13 16 10 14 6(2)数据汇总后呈现往往用统计图.统计图有三种形式:条形统计图,折线统计图,扇形统计图,它们各有特点(让学生交流后汇总)本题所所关心的问题是选择各个数的人占总人数的百分比情况,因此选择扇形统计图比较合适,它能够比较清楚地表示百分比的情况.(3)分析数据的集中趋势,离散程度往往以平均数,众数,方差,中位数等方面进行分析(请大家回顾一下平均数,众数,方差,中位数有关概念,并用计数器计算)平均数 .众数为.方差为(4)从扇形统计图上可以看出,选1,2,3,4,10的人比较少,选其它数字的人较多.而随机选取这些数的理想状态,应当是选择到每个数的人数基本相当,且方差很小.由此,我们可以看出,由于个人偏好,人很难达到随机地选择数.(三)如何做到随机性从上面的分析可以看出,对随机性把握困难较大,主要原因是在选择处理时往往受到各种各样的主观因素的干扰,如何避免出现干扰,做到随机性就成为统计活动中必须注意解决的问题. (1)对统计方案进行仔细地设计,避免一些外界因素干扰,要确定调查对象,调查方案与策略,精心设计调查问卷.做好统计的前期工作,收集数据方法.(2)对采集到的数据要进行分析(汇总与呈现)做出统计判断.(四)、课堂小结1、统计活动中,要做到随机性,困难很大.主要原因是主观因素的干扰.2、要做到随机性必须仔细地设计调查方案及做好统计的前期工作.3、采集到的数据要进行汇总、呈现与分析.往往用条形统计图,折线统计图,扇形统计图呈现;分析数据往往用平均数,众数,方差,中位数分析,方差越小,统计准确性越高.(五)、练习:P6练习题(六)、作业: P7 2五、教后反思:第二课时§1.2从普查到抽样一、教学目标:1.了解普查的意义.2.结合具体的实际问题情境,理解随机抽样的必要性和重要性.二、重难点:结合具体的实际问题情境,理解随机抽样的必要性和重要性.三、教学方法:阅读材料、思考与交流四、教学过程(一)、普查1、【问题提出】 P7通过我国第五次人口普查的有关数据,让学生体会到统计对政府决策的重要作用――统计数据可以提供大量的信息,为国家的宏观决策提供有关的支持.教科书通过对人口普查的有关新闻报道,让学生体会人口普查的规模是何等的宏大与艰辛.教科书提出了三个有代表性的问题.第一个问题主要是针对人口普查的作用,人口普查可以了解一个国家人口全面情况,比如,人口总数、男女性别比、受教育状况、增长趋势等.人口普查是对国家的政府决策实行情况的一个检验,比如,国家计划生育政策,经济发展战略,国家“普及九年义务教育”政策,人民群众的生活水平等.第二个问题是针对普查本身存在的问题提出的,以加深学生对于普查的理解.学生可能有一个误解,普查就是100%的准确,其实不然,即使是最周全的调查方案,在实际执行时都会产生一个误差.教科书通过这个问题,目的是让学生理解在人口普查中出现漏登是正常情况,调查方案的设计是尽可能让这个误差降低到最小.同时,也要让学生理解人口普查的工作,即使出现漏登现象,人口普查的数据对国家的宏观决策依然具有重要的作用.第三个问题是针对人口普查工作的艰辛而提出的,让学生体会人口普查数据得来不易,要尊重人口普查人员的劳动,对人口普查工作要大力支持.2、【阅读材料】 P4“阅读材料”是课堂阅读,目的是让学生了解普查工作的特点和重要性,以及我国目前主要的一些普查工作.进而,总结出普查的主要不足之处,这是从一个方面说明了抽样调查的必要性.普查是指一个国家或一个地区专门组织的一次性大规模的全面调查,目的是为了详细地了解某项重要的国情、国力.普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.(二)、抽样调查【例1和其后的“思考交流”】 P8~9紧接着,教科书通过例1和“思考交流”的两个问题,让学生了解普查有时候难以实现.这主要有两个方面的原因,其一,被调查对象的量大;其二,普查对被调查对象本身具有一定的破坏性.这从另一个方面说明了抽样调查的必要性.然后,教科书通过抽象概括总结出抽样调查的两个主要优点.【例2和其后的“思考交流”】 P9~10主要是讨论在抽样调查时,什么样的样本才具有代表性.在抽样时,如果抽样不当,那么调查的结果可能会出现与实际情况不符,甚至是错误的结果,导致对决策的误导.在抽样调查时,一定要保证随机性原则,尽可能地避免人为因素的干扰;并且要保证每个个体以一定的概率被抽取到;同时,还要注意到要尽可能地控制抽样调查中的误差.由于检验对象的量很大,或检验对检验对象具有破坏性时,通常情况下,所以采用普查的方法有时是行不通的.通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点:(1)迅速、及时;(2)节约人力、物力和财力.例1为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里统计的总体、个体、样本、总体容量、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?解:统计的总体是指该地10 000名学生的体重;个体是指这10 000名学生中每一名学生的体重;样本指这10 000名学生中抽出的200名学生的体重;总体容量为10 000;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.例2为了制定某市高一、高二、高三三个年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:A.测量少年体校中180名男子篮球、排球队员的身高;B.查阅有关外地180名男生身高的统计资料;C.在本市的市区和郊县各任选一所完全中学,两所初级中学,在这六所学校有关年级的小班中,用抽签的方法分别选出10名男生,然后测量他们的身高.为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?解:选C方案.理由:方案C采取了随机抽样的方法,随机样本比较具有代表性、普遍性,可以被用来估计总体.例3中央电视台希望在春节联欢晚会播出后一周内获得当年春节联欢晚会的收视率.下面三名同学为电视台设计的调查方案.甲同学:我把这张《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快统计收视率了.乙同学:我给我们居民小区的每一份住户发一个是否在除夕那天晚上看过中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.丙同学:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.请问:上述三名同学设计的调查方案能够获得比较准确的收视率吗?为什么?解:综上所述,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.(三)、课堂小结:1、普查是一项非常艰巨的工作,它要对所有的对象进行调查.当普查的对象很少时,普查无疑是一项非常好的调查方式.普查主要有两个特点:(1)所取得的资料更加全面、系统;(2)主要调查在特定时段的社会经济现象总体的数量.2、通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此调查对象的某项指标做出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.抽样调查的优点:抽样调查与普查相比,有很多优点,最突出的有两点:(1)迅速、及时;(2)节约人力、物力和财力.(四)、作业:P10练习题;P10【习题1―2】五、教后反思:第三课时§1.3抽样方法(一)——简单随机抽样一、教学目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本.3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性.二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本.三、教学方法:观察、思考、交流、讨论、概括.四、教学过程(一)创设情景,揭示课题假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.(为什么?)那么,应当怎样获取样本呢?(二)、探究新知1、简单随机抽样的概念:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本.【小结】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的.(2)简单随机样本数n小于等于样本总体的个数N.(3)简单随机样本是从总体中逐个抽取的.(4)简单随机抽样是一种不放回的抽样.(5)简单随机抽样的每个个体入样的可能性均为n/N.思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本.(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.2、、抽签法和随机数法(1)、抽签法的定义:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n 的样本.【小结】抽签法的一般步骤:(1)将总体的个体编号.(2)连续抽签获取样本号码.思考?你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?(2)、随机数法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法.怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 7884 42 17 53 31 57 24 55 06 88 77 04 74 47 6763 01 63 78 59 16 95 55 67 19 98 10 50 71 7533 21 12 34 29 78 64 56 07 82 52 42 07 44 3857 60 86 32 44 09 47 27 96 54 49 17 46 09 6287 35 20 96 43 84 26 34 91 6421 76 33 50 25 83 92 12 06 7612 86 73 58 07 44 39 52 38 7915 51 00 13 42 99 66 02 79 5490 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本.【小结】随机数表法的步骤:(1)将总体的个体编号.(2)在随机数表中选择开始数字.(3)读数获取样本号码.(三)、例题精析例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.例2:某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法.解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.(四)、课堂练习P13练习题(五)、课堂小结 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开业,避免在解题中出现错误.(六)、作业布置:1、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240 B、个体是每一个学生C、样本是40名学生D、样本容量是402、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A、总体B、个体是每一个学生C、总体的一个样本D、样本容量3、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 .4、从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是 .五、教后反思:第四课时§1.3抽样方法(二)——系统抽样一、教学目标1、知识与技能:(1)正确理解系统抽样的概念;(2)掌握系统抽样的一般步骤;(3)正确理解系统抽样与简单随机抽样的关系;2、过程与方法:通过对实际问题的探究,归纳应用数学知识解决实际问题的方法,理解分类讨论的数学方法,3、情感态度与价值观:通过数学活动,感受数学对实际生活的需要,体会现实世界和数学知识的联系.二、重点与难点:正确理解系统抽样的概念,能够灵活应用系统抽样的方法解决统计问题.三、教学方法:观察、思考、交流、讨论、概括.四、教学过程(一)、创设情境某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(二)、探究新知1、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.【小结】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N 较大时,采用系统抽样.(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k =[n N].(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.思考?(1)你能举几个系统抽样的例子吗?(2)下列抽样中不是系统抽样的是 ( )A 、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B 工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C 、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D 、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 点拨:(2)c 不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样.2、系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N 个个编号.(2)将整体按编号进行分段,确定分段间隔k(k ∈N,L ≤k).(3)在第一段用简单随机抽样确定起始个体的编号L (L ∈N,L ≤k ).(4)按照一定的规则抽取样本,通常是将起始编号L 加上间隔k 得到第2个个体编号L+K ,再加上K 得到第3个个体编号L+2K ,这样继续下去,直到获取整个样本.【小结】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.(三)、例题精析例1、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.[分析]按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k ≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.例2、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是A .5,10,15,20,25B 、3,13,23,33,43C .1,2,3,4,5D 、2,4,6,16,32[分析]用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求,故选B. (四)、课堂练习P49 练习1. 2. 3(五)、课堂小结:1、在抽样过程中,当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤为:(1)采用随机的方法将总体中个体编号;(2)将整体编号进行分段,确定分段间隔k(k ∈N);(3)在第一段内采用简单随机抽样的方法确定起始个体编号L ;(4)按照事先预定的规则抽取样本.2、在确定分段间隔k 时应注意:分段间隔k 为整数,当n N不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k. (六)、作业:1、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( )A .99B 、99,5C .100D 、100,52、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )A .1,2,3,4,5B 、5,16,27,38,49C .2, 4, 6, 8, 10D 、4,13,22,31,403、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( )A .8 B.8,3 C .8.5 D.94、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法.。

必修3(北师大版)第一章 《统计》测试题

必修3(北师大版)第一章 《统计》测试题

必修三 统计测试题一、选择题(每题只有一个正确答案,每小题5分,共12小题,60分)1.在2008年奥运会开幕之际,某网站想要调查北京市家庭的收入情况,在该问题中,总体是( B )A.北京市B.北京市的所有家庭的收入C.北京市的所有人口D.北京市的工薪阶层 1.解析 :所要研究对象的全体称为统计总体,简称总体,要调查某城市的所有家庭的收入,研究对象就是所有家庭的收入. 答案:B.2.某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,现抽取30人进行分层抽样,则各职称人数分别为( B )A .5,10,15B .3,9,18C .3,10,17D .5,9,163. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( C )A .nN B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为( D )A .5,10,15,20,25B .5,15,20,35,40C .5,11,17,23,29D .10,20,30,40,505.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( C )A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则改样本的中位数、众数、极差分别是 ( A )( )A .46,45,56B .46,45,53C .47,45,56D .45,47,537.据报道,2012年7月2日,正阳县一女子在考驾照的路上不小心撞倒行人.对此,某网站对责任的界定进行了一个调查,结果如下:根据此调查结论,则“认为驾校和学员共同负责”者的频率为( )A.18B.14C.12D.137.解析:参与的人数为8000人, “认为驾校和学员共同负责”的频率为4000180002=.答案:C.8 .小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为(C)( )A .30%B .10%C .3%D .不能确定9 .在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是(D )A .众数B .平均数C .中位数D .标准差A.9%B.18%C.27%D.82% 10.解析:优秀的学生共9人,该班总人数为50人,故优秀率为918%50=. 答案:B.11.容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40)的频率为( B )A .0.35B .0.45C .0.55D .0.6512.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年时间里,该地区这种病的新发病总人数约为( B )A.1167B.11676C.20987D.209812.解析:由上表可得: yˆ=94.7x -186623,当x 分别取2000,2001,2002,2003时,得估计值分别为:2777, 2871.7, 2966.4, 3061.1,则总人数约为2777+2871.7+2966.4+3061.1≈ 11676 答案:B. 二、填空题(每题5分,共4小题,满分20分)13 .一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_6_____人.14.由正整数组成的一组数据1x 、2x 、3x 、4x ,其平均数和中位数都是2,且标准差等于1,则这组数据为_1;1;3;3;________.(从小到大排列)15.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,个体 a 前两次未被抽到,第三次被抽到的概率为_101____________________解析 : 不论先后,被抽取的概率都是11016.则样本在区间[20,50)[60,70)⋃ 上的频率为__________________16.解析:首先可以求出20245423x =-----=,在区间[20,50)[60,70)⋃的样本个数为3+4+5+2=14,故频率为140.720=. 答案:0.7.三、解答题(共6小题,满分70分) 17.(本题满分10分)某学校对甲、乙两班的学习成绩进行抽样分析,各抽5 门功课,得到其平均分数分别如下: 甲:60,80,70,90,70 乙:80,60,70,80,75问:甲、乙两个班哪班平均成绩好?哪班的各门功课发展较平衡?17.解:甲班的各门平均成绩为:11(6080709070)745x =++++=乙班的各门平均成绩为:21(8060708075)735x =++++=甲班成绩的方差为:22222211(1464164)1045s =++++= 乙班成绩的方差为: 22222221(713372)565s =++++=由12x x >,2212S S >可知甲的平均成绩较好,乙的各门功课发展较平衡 18.(本题满分12分)有1个容量为100的样本,数据的分组及各组的频率如下:[12.5,15.5)频数 6; [15.5,18.5)频数16; [18.5,21.5) 频数18; [21.5,24.5)频数 22; [24.5,27.5)频数20; [27.5,30.5) 频数10; [30.5,33.5)频数 8.(1).列出样本的频率分布表(含累积频率); (2).画出频率分布直方图. 18.解:(1).样本的频率分布表如下:(2)频率分布直方图如图10—519.(本题满分12分)某学校选拔学生会主席,在5名参选者中选出1名,规定获胜者的条件如下: (1)在竞选中得票最多;(2)得票总数不低于总票数的一半.如果在计票中周小玉的数据不小心丢失,试根据统计数据回答下列问题:(1)请问:如果周小玉获胜,那么周小玉的得票数x 至少是多少?(2)如果赵琦获胜,求周小玉得票数x 的取值范围.19.解:(1).根据条件,如果周小玉获胜,则周小玉的得票数不低于总票数的一半,且票数最高:则必有:130010030602xx≥++++且300x>,解之得:490x ≥.即周小玉的得票数至少为490票;(2).根据条件,如果赵琦获胜,则赵琦的得票数不低于总票数的一半,且得票数最多,则必有:300130010030602300x x ⎧≥⎪++++⎨⎪>⎩,解之得110x ≤ 即周小玉的得票数取值范围是:0110x ≤≤,x N ∈. 20.(本题满分12分)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛分数的众数、中位数和平均数; (3)估计这次环保知识竞赛的及格率(60分及以上为及格)解析:(1)频率为:0.025100.25⨯=,频数:600.2515⨯=(2)众数在样本数据的频率分布直方图中就是最高矩形的中点横坐标5.7425.795.69=+;估计众数是75或74;对于中位数,由于样本中的个体有一半小于或等于中位数,因此在排列分布直方图中中位数左边和右边的直方图面积应该相等,由此估计样本中的中位数的大小。

北师大版高中数学必修三第一章《统计》测试题(答案解析)

北师大版高中数学必修三第一章《统计》测试题(答案解析)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。

高中数学必修3第一章(统计)测试题(北师大版).doc

高中数学必修3第一章(统计)测试题(北师大版).doc

高中数学必修3第一章(统计)检测题班级姓名得分一、选择题:(本题共10小题,每小题3分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( ).A.简单随机抽样B.系统抽样C.分层抽样D.先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( ).A.a>b>c B.b>c>a C.c>a>b D.c>b>a3.下列说法错误的是( ).A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大4.下列说法中,正确的是( ).A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数5.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A.甲班10名学生的成绩比乙班10名学生的成绩整齐B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度6.下列说法正确的是( ).A.根据样本估计总体,其误差与所选择的样本容量无关B.方差和标准差具有相同的单位C.从总体中可以抽取不同的几个样本D.如果容量相同的两个样本的方差满足S12<S22,那么推得总体也满足S12<S22是错的7.右图是根据《湖南统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()29 1 1 5 8 (A)304.6(B)303.63 0 2 63 1 0 24 7 (C)302.6 (D)301.68.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。

[推荐学习]高中数学北师大版必修3习题:第一章统计1.5.2

[推荐学习]高中数学北师大版必修3习题:第一章统计1.5.2

5.2估计总体的数字特征课时过关·能力提升1.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:g)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是() A.150.2 g B.149.8 gC.149.4 gD.147.8 g解析:x=150+152+153+149+148+146+151+150+152+14710=149.8(g).答案:B2.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:s1,s2,s3()A.s3>s1>s2B.s2>s1>s3C.s1>s2>s3D.s2>s3>s1解析:甲、乙、丙的平均成绩均为8.5.s1=√120[5(7-8.5)2+5(8-8.5)2+5(9-8.5)2+5(10-8.5)2]=√2520,同理s2=√2920,S3=√2120,所以s2>s1>s3.故选B.答案:B3.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,S A>S BB.x A<x B,S A>S BC.x A>x B,S A<S BD.x A<x B,S A<S B解析:由题图易得x A<x B,又A波动性大,B波动性小,所以s A>s B.答案:B4.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.若日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中优秀工人的人数为.解析:因为样本均值为17+19+20+21+25+306=1326=22.所以样本中优秀工人占的比例为26=13,而12×13=4,故推断该车间12名工人中有4名优秀工人.答案:45.若10个数据的平均数是3,标准差是2,则方差是;这10个数据的平方和是.解析:设这10个数分别为x1,x2, (x10)则x1+x2+…+x10=30.又标准差为2,则方差为s2=4,则x12+x22+⋯+x102=4×10−9×10+6×30=130.答案:41306.样本数为9的一组数据,它们的平均数是5,频率条形图如图所示,则其标准差等于.(保留根号)解析:由条形图知2与8的个数相等,且多于5的个数,于是这9个数分别为2,2,2,2,5,8,8,8,8.∵x=5,∴s2=19[(2−5)2+(2−5)2+(2−5)2+(2−5)2+(5−5)2+(8−5)2+(8−5)2 +(8−5)2+(8−5)2]=19×8×9=8.∴s=2√2.答案:2√27.已知甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中环数如下表:则两人射击成绩水平更为稳定的是.解析:因为x甲=8,x乙=8,而s甲2=1.2,s乙2=1.6,s甲2<s乙2,所以甲稳定性较强.答案:甲8.某中学举行了一次演讲比赛,分段统计参赛同学的成绩,结果如下表(分数均为整数,满分为100分).请根据表中提供的信息,(1)参加这次演讲比赛的同学共有多少人?(2)已知成绩在91~100分的同学为优秀者,则优秀率为多少?(3)所有参赛同学的平均得分M(分)在什么范围内?(4)将下图中的成绩频率分布直方图补充完整.解:(1)参加这次比赛的同学共有2+8+6+4=20(人).(2)分数在91~100分的人数为4,故优秀率为420=20%.(3)总分数段最小值及最大值分别除以人数,得120×(61×2+71×8+81×6+91×4)=77,120×(70×2+80×8+90×6+100×4)=86,故平均得分M的取值范围是77<M<86.(4)根据第三组的人数得其频率为620=0.3,f iΔx i=0.310=0.03,则频率分布直方图如下:9.为了了解汽车在某一路段上的速度,交警对这段路上连续驶过的50辆汽车的速度(单位:km/h)进行了统计,得到的数据如下表所示:(1)(2)试估计在这段路上,汽车行驶速度的标准差.(提示利用组中值估计)解:(1)用各速度区间的组中值作为汽车在这一区间行驶的平均速度,各区间速度的平均值分别为45,55,65,75,85,95,105.故样本的平均数为x=150(45×1+55×4+65×10+75×15+85×12+95×6+105×2)=76.8(km/h).即这一路段汽车行驶的平均速度约为76.8 km/h.(2)由上面各小区间的平均数和样本的平均数,可求得这一段路上汽车行驶的方差s 2=150[1×(45−76.8)2+4×(55−76.8)2+10×(65−76.8)2+⋯+6×(95-76.8)2+2×(105-76.8)2]=174.76(km 2/h 2),从而,标准差s ≈13.2(km/h).故在这段路上,汽车行驶速度的标准差约为13.2 km/h .10.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)中的结果,对两人的训练成绩作出评价. 解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x 甲=10+13+12+14+165=13(分), x 乙=13+14+12+12+145=13(分),s 甲2=15[(10−13)2+(13−13)2+(12−13)2+(14−13)2+(16−13)2]=4(分2), s 乙2=15[(13−13)2+(14−13)2+(12−13)2+(12−13)2+(14−13)2]=0.8(分2). (2)由s 甲2>s 乙2可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.11.在一次科技知识竞赛中,两组学生成绩如下表:中成绩谁优谁次,并说明理由.解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较,甲组的成绩好一些.(2)s 甲2=12+5+10+13+14+6[2×(50−80)2+5×(60−80)2+10×(70−80)2+13×(80−80)2+14×(90−80)2+6×(100−80)2]=172(分2).s 乙2=150(4×900+4×400+16×100+2×0+12×100+12×400)=256(分2). 因为s 甲2<s 乙2,所以甲组的成绩比乙组的成绩好.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度来看甲组的成绩总体较好.(4)从成绩统计表来看,甲组的成绩高于90分的人数为14+6=20,乙组的成绩高于90分的人数为12+12=24.所以乙组成绩集中在高分段的人数多,同时乙组得满分的人数比甲组得满分的人数多6,从这一角度来看,乙组的成绩较好.。

高中数学 第一章 统计 14 数据的数字特征教案1 北师大版必修3 教案

高中数学 第一章 统计 14 数据的数字特征教案1 北师大版必修3 教案

一、教材分析1、教学内容北师大版普通高中课程标准试验教科书数学必修3第1章《4.数据的数字特征》教学设计.2、内容分析《普通高中数学课程标准》中要求数学学习应倡导教师在学习中起主导作用,而学生是学习的主体,自主探索,动手实践,合作交流,阅读自学等学习数学的方式。

提高学生的数学思维能力是数学教育的基本目标之一,本节课将使学生经历数学知识产生的过程性体验,发展学生的数学思维。

《课标》提倡利用信息技术来呈现以往数学学习中难以呈现的课程内容,在教学评价中要求体现评价的多元化。

《课标》中对本节教学内容的要求是:1通过实例理解样本数据标准差的意义和作用,学会计算数据的标准差。

2、能根据实际问题的需求合理地选取样本,从样本数据中提取基本数字特征(如平均数、标准差),并作出合理的解释。

教材通过3个实例的分析,在初中统计学习的基础上理解平均数、众数、中位数、极差、方差、标准差,对数据的刻画特点,例1目的在于使学生理解不同的人根据需要会选择不同的统计量来说明数据,例2要求学生根据茎叶图的分布特征来估计两组数据数字特征的大小、例3是对标准差计算的复习.动手实践部分意义在于使学生体会一次完整收集数据、整理数据、分析数据、得到统计结论的完整统计活动。

二、学情分析1、基础知识:学生在初中已经学习了平均数、众数、中位数、极差、方差和标准差这几个数字特征,并且会给出一组数据,计算其这几个统计量。

2、学习能力和态度:在基础知识学习的基础上,本节学生要理解各个数字特征的特点,同时理解标准差对数据刻画的优势,并且更进一步理解各数字特征对数据刻画的意义。

三、教学目标1、知识与技能理解不同数字特征的意义和作用,并能根据问题的需要选择适当的数字特征来表达数据的信息。

2、过程与方法通过实例,能结合具体情境理解数据标准差的意义和作用,培养学生解决问题的能力,提高学生的运算能力。

3、情感、态度与价值观通过探求反映数据波动情况的统计量,培养学生开放性思维,培养学生的动手操作能力和实践能力。

(常考题)北师大版高中数学必修三第一章《统计》检测卷(有答案解析)(4)

(常考题)北师大版高中数学必修三第一章《统计》检测卷(有答案解析)(4)

一、选择题1.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,82.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元4.从两个班级各随机抽取5名学生测量身高(单位:cm ),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高x 甲,x 乙及方差2s 甲,2s 乙的关系为( )A .x 甲>x 乙,2s 甲>2s 乙B .x 甲>x 乙,2s 甲<2s 乙C .x 甲<x 乙,2s 甲<2s 乙D .x 甲<x 乙,2s 甲>2s 乙5.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2B .-0.7C .-0.2D .0.77. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50 B .70和67C .75和50D .75和679.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.510.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为( ).7806 6572 0802 6314 2947 1821 98003204 9234 4935 3623 4869 6938 7481A .02B .14C .18D .2911.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s12.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .91二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.上海市普通高中学业水平等级考成绩共分为五等十一级,各等级换算成分数如表所示: 等级A + AB + BB -C + CC -D + DE 分数 7067646158555249464340上海某高中2018届高三()1班选考物理学业水平等级考的学生中,有5人取得A +成绩,其他人的成绩至少是B级及以上,平均分是64分,这个班级选考物理学业水平等级考的.人数至少为______人16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:^y=0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。

(常考题)北师大版高中数学必修三第一章《统计》检测卷(含答案解析)(2)

(常考题)北师大版高中数学必修三第一章《统计》检测卷(含答案解析)(2)

一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .3.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和674.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④5.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A.15.5 B.15.6 C.15.7 D.166.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.157.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是()A.31号B.32号C.33号D.34号8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1609.已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.10.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A .40B .45C .48D .5011.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.14.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.15.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.16.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.17.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x3 4 5 6y23.5 55.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某食品厂为了检测某批袋装食品的质量,从该批食品中抽取了一个容量为100的样本,测量它们的质量(单位:克).根据数据分为[)92,94,[)94,96,[)96,98,[)99,100,[)100,102,[)102,104,[]104,106七组,其频率分布直方图如图所示.(1)根据频率分布直方图,估计这批袋装食品质量的中位数.(保留一位小数) (2)记产品质量在[)98,102内为优等品,每袋可获利5元;产品质量在[)92,94内为不合格品,每袋亏损2元;其余的为合格品,每袋可获利3元.若该批食品共有10000袋,以样本的频率代替总体在各组的频率,求该批袋装食品的总利润.22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出关于的线性回归方程ˆˆˆy bx a =+;(2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从 左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.24.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推) 年份x 1 2 3 4 5 6 7 8 9 人数y23545781010(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.25.新能源汽车的春天来了!2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程y bt a=+,并预测2018年5月份当地该品牌新能源汽车的销量;(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到如下一份频数表:将频率视为概率,现用随机抽样方法从该地区拟购买新能源汽车的所有消费者中随机抽取3人,记被抽取3人中对补贴金额的心理预期值不低于3万元的人数为ξ,求ξ的分布列及数学期望()Eξ.参考公式及数据:①回归方程y bx a=+,其中()()()1122211ˆn ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,a y bx=-,②5118.8i iit y ==∑.26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x与销售单价y之间的关系,经统计得到如下数据:等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.3.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.4.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FPOP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FPOP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.5.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05频数为:367.57.54.51.5,,,,,则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错6.C解析:C【详解】抽取比例为1501 30000200=,1400020200∴⨯=,抽取数量为20,故选C.7.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.8.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.14.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.15.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a ∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.16.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.17.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.18.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为解析:45【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴=所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n=-+-+⋅⋅⋅+-. 19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)99.6;(2)35600元. 【分析】(1)根据频率分布直方图中的中位数在长方形面积为0.5的地方取得得解. (2)求出批食品中优等品、不合格品、合格品的袋数得总利润. 【详解】(1)因为(0.020.040.12)20.360.5,0.360.0920.540.5++⨯=<+⨯=>, 所以样本质量的中位数在[98,100)内.设样本质量的中位数为m ,则980.0920.360.52m -⨯⨯+=, 解得99.6m ≈,故这批袋装食品质量的中位数为99.6.(2)由题意可得,这批食品中优等品有10000(0.090.10)23800⨯+⨯=袋, 这批食品中不合格品有100000.022400⨯⨯=袋, 这批食品中合格品有1000038004005800--=袋.故该批袋装食品的总利润为3800558003400235600⨯+⨯-⨯=元. 【点睛】频率分布直方图中的中位数求法在长方形面积为0.5的地方取得是解题关键,属于基础题. 22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii i i x y x yb x x==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题.23.(1)0.08,150;(2)88%;(3)第四小组,理由见解析 【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间. 试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 考点:频率分布直方图 24.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,b a ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y ==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力. 25.(1)约为2万辆;(2)见解析 【分析】(1)利用最小二乘法求y 得关于t 的线性回归方程为0.3208ˆ.0yt =+,再令6t =得到2018年5月份当地该品牌新能源汽车的销量.(2)先分析得到ξ~33,5B ⎛⎫ ⎪⎝⎭,再根据二项分布求ξ的分布列及数学期望()E ξ. 【详解】 (1)易知1234535t ++++==,0.50.61 1.4 1.71.045y ++++==,522222211234555ii t ==++++=∑,218.853 1.040.32555ˆ3b -⨯⨯==-⨯,1.040.320ˆ3.08a=-⨯= 则y 关于t 的线性回归方程为0.3208ˆ.0yt =+, 当6t =时,ˆ 2.00y=,即2018年5月份当地该品牌新能源汽车的销量约为2万辆. (2)根据给定的频数表可知,任意抽取1名拟购买新能源汽车的消费者,对补贴金额的心理预期值不低于3万元的概率为12032005=,由题意可知ξ~33,5B ⎛⎫⎪⎝⎭,ξ的所有可能取值为0,1,2,3ξ的分布列为:()0303328055125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()12133236155125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ ()21233254255125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()30333227355125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭所以()5E ξ= 【点睛】(1)本题主要考查回归方程的求法,考查二项分布,意在考查学生对这些知识的掌握水平和分析推理能力.(2) 如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生K 次的概率是()(1)kkn kn n P k C p p ξ-==-,(0,1,2,3,...k n =).正好是二项式[(1)]n p p -+的展开式的第1k +项.所以记作ξ~(,)B n p ,读作ξ服从二项分布,其中,n p 为参数.26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程;。

高中数学 第1章 统计 §2 2.2 分层抽样与系统抽样(教师用书)教案 北师大版必修3-北师大版高

高中数学 第1章 统计 §2 2.2 分层抽样与系统抽样(教师用书)教案 北师大版必修3-北师大版高

2.2 分层抽样与系统抽样 学 习 目 标核 心 素 养,准确把握分层抽样、系统抽样的概念.(重点)2.会用分层抽样、系统抽样解决实际问题.(难点)3.了解各种抽样方法的适用X 围,能根据具体情况选择恰当的抽样方法.(难点) 、系统抽样的概念,培养数学抽象素养.2.通过运用分层抽样、系统抽样解决实际问题,提升数据分析素养.一、分层抽样1.分层抽样的概念将总体按其属性特征分成假设干类型(有时称为层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法通常叫作分层抽样,有时也称为类型抽样.2.对分层抽样的公平性的理解在分层抽样的过程中,每个个体被抽到的概率是相同的,与分层的情况无关.如果总体的个体数是N ,共分k 层,n 为样本容量,N i (i =1,2,3,…,k )是第i 层中的个体数,那么第i 层中所要抽取的个体数n i =n ×N i N ,而每一个个体被抽取的可能性是n i N i =n N,与层数无关,所以对所有个体而言,其被抽到的概率是相同的,也就是说分层抽样是公平的.二、系统抽样的概念将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法叫系统抽样,有时也叫等距抽样或机械抽样.思考:系统抽样一般适用于具有怎样特征的样本?[提示]系统抽样的实质是“分组〞抽样,适用于总体中的个体数较大的情况.1.以下问题中,最适合用分层抽样抽取样本的是( )A .从10名同学中抽取3人参加座谈会B .某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量B [A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和D 中总体个体无明显差异且个数较多,不适合用分层抽样;B 中总体中的个体差异明显,适合用分层抽样.]2.为了解1 200名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为40的样本,考虑采用系统抽样,那么分段间隔k 为( )A .10B .20C .30D .40C [分段间隔k =1 20040=30.] 3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )A .30人,30人,30人B .30人,45人,15人C .20人,30人,10人D .30人,50人,10人B [先求抽样比n N =903 600+5 400+1 800=1120,再各层按抽样比分别抽取,甲校抽取 3 600×1120=30(人),乙校抽取5 400×1120=45(人),丙校抽取1 800×1120=15(人),应选B.] 4.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,那么应从一年级本科生中抽取________名学生.60[根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.]分层抽样用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?[解]因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理. 因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:青年职工400×310=120(人); 中年职工400×510=200(人); 老年职工400×210=80(人). 由样本容量为400,总体容量为3 200可知,抽样比是4003 200=18,所以每人被抽到的可能性相同,均为18.1.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占的比例抽取.2.用分层抽样抽取样本时,需照顾到各层中的个体,所以每层抽取的比例应等于样本容量在总体中的比例.3.在分层抽样中,确定抽样比k 是抽样的关键.一般地,抽样比k =n N(N 为总体容量,n 为样本容量),按抽样比k 在各层中抽取个体,就能确保抽样的公平性.4.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.[跟进训练]1.,按地域把48个城市分成大型、中型、小型三组,,那么应抽取的中型城市数为 ( )A .3B .4C .5D .6(2)我国古代数学名著《数书九章》有“米谷粒分〞题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,那么这批米内夹谷约为( )A .134石B .169石C .338石D .1 365石(1)B (2)B [(1)根据分层抽样的特点可知,抽样比例为1248=14,那么应抽取的中型城市数为16×14=4.(2)设1 534石米内夹谷x 石,那么由题意知x 1 534=28254,解得x ≈.]系统抽样【例2】 某单位共有在岗职工624人,为了调查职工上班时从离开家到来到单位的平均用时,决定抽取10%的工人进行调查,如何采用系统抽样完成这一抽样?[解]第一步:由题意知,应抽取在岗职工62人作为样本,即分成62组,由于62462的商是10,余数是4,所以每组有10人,还剩4人.这时,抽样距是10;第二步:用随机数法从这些职工中抽取4人并剔除,不进行调查;第三步:将余下的在岗职工620人进行编号,编号分别为000,001,002,…,619; 第四步:在第一组000,001,002,…,009这10个编号中,随机选定一个起始编号,每间隔10抽取一个编号,共抽62个编号,这样就抽取了容量为62的一个样本.1.解决此题时,对总体、个体先进行编号,然后依据样本容量确定分段数及每段间隔长度,再利用简单随机抽样法在第1段中抽取一个作为起始,并依次加间隔长度即可获取样本.2.系统抽样又称等距抽样,当给出总体数和样本容量后,应先确定组数和组距(注意一般组数等于样本容量/组距),在第一组抽取起始后,只需依次加间隔长度即可得到样本.[跟进训练]2.(1)某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了( )A .抽签法B .随机数法C .系统抽样法D .放回抽样法 (2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,那么分段的间隔k =________.(1)C (2)40[(1)此抽样方法将座位分成40组,每组46个个体,会后留下座号为20的相当于第一组抽20号,以后各组抽取20+46n ,n =1,2,3,…,符合系统抽样特点.(2)根据样本容量为30,将1 200名学生分为30段,每段人数即间隔k =1 20030=40.]三种抽样方法的综合应用[探究问题]1.简单随机抽样是不放回抽样吗?提示:是不放回抽样.2.分层抽样时为什么要将总体分成互不重叠的层?提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理、更具代表性,故将总体分成互不重叠的层,而后独立地抽取一定数量的个体.3.系统抽样的第二步中,当Nn不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?提示:剔除一些个体可以用简单随机抽样的方法抽取,不影响系统抽样的公平性.【例3】①某学校为了了解高一学生的情况,从每班抽2人进行座谈;②一次数学竞赛中,某班有10人的成绩在110分以上,10人的成绩在100~110分,30人的成绩在90~100分,12人的成绩低于90分,现在从中抽取12人了解有关情况;③运动会服务人员为参加400 m决赛的6名同学安排跑道.就这三件事,合适的抽样方法分别为________、________、________.系统抽样分层抽样简单随机抽样[系统抽样适合总体中个体数量比较大的情况.分层抽样适合总体由差异明显的几部分组成的情况.总体中个体数比较少的时候,选用简单随机抽样.]三种抽样方法的比较类别共同点各自特点相互联系适用X围简单随机抽样(1)抽样过程中每个个体被抽取的概率相等;(2)均属于不放从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规那么在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层 抽样 回抽样将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成[跟进训练] 3.某社区有700户家庭,其中高收入家庭有225户,中收入家庭有400户,低收入家庭有75户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某中学高二年级有12名篮球运动员,要从中选出3人调查投篮命中率情况,记作②;从某厂生产的802辆轿车中抽取40辆测试某项性能,记作③.为完成上述三项抽样,那么应采取的抽样方法是( )A .①简单随机抽样,②系统抽样,③分层抽样B .①分层抽样,②简单随机抽样,③系统抽样C .①简单随机抽样,②分层抽样.③系统抽样D .①分层抽样,②系统抽样,③简单随机抽样B [对于①.总体由差异明显的高收入家庭、中收入家庭和低收入家庭三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样;对于③,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样.]1.对于分层抽样中的比值问题,常利用以下关系式解:(1)样本容量n 总体容量N =各层抽取的样本数该层的容量; (2)总体中各层容量之比=对应层抽取的样本数之比.2.选择抽样方法的规律:(1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法.(2)当总体容量较大,样本容量较小时,可采用随机数法.(3)当总体容量较大,样本容量也较大时,可采用系统抽样法.(4)当总体是由差异明显的几部分组成时,可采用分层抽样法.1.思考辨析(1)分层抽样中每层抽样的可能性是不相等的.()(2)分层抽样时,样本是在各层中分别抽取.()(3)分层抽样时,如果总体个数不能被样本容量整除,那么应先剔除部分个体.()(4)系统抽样的分段段数与所抽取的样本容量的关系是相等.()(5)系统抽样时每个个体被抽到的机会不同.()(6)系统抽样时,如果总体个数不能被样本容量整除,那么应先剔除部分个体.()[解析](1)×,每个个体被抽到的可能性相同.(2)√,由分层抽样的概念知正确.(3)√,由于考虑到实际意义,需剔除部分个体.(4)√,系统抽样时,分段的段数由所抽样本容量确定.(5)×,无论是系统抽样还是分层抽样,每个个体被抽到的机会都相等.(6)√,系统抽样时为了保证间隔k为整数,应先剔除一部分个体.[答案](1)×(2)√(3)√(4)√(5)×(6)√2.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样C[由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.应选C.]3.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况.用分层抽样的方法从该学生中抽取一个容量为n的样本.高中学生抽取70人,那么n的值为________.100[由题意,得703 500=n3 500+1 500,解得n=100.]4.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,假设编号为28的产品在样本中,那么该样本中产品的最大编号为________.76[根据系统抽样的定义可得,样本中产品的编号间隔为16,再根据编号为28的产品在样本中,可得样本中产品的编号为12,28,44,60,76,故该样本中产品的最大编号为76.]。

高中数学 第一章 统计 1.2.1 简单随机抽样课时作业(含解析)北师大版必修3-北师大版高一必修3

高中数学 第一章 统计 1.2.1 简单随机抽样课时作业(含解析)北师大版必修3-北师大版高一必修3

课时作业2 简单随机抽样时间:45分钟满分:100分——基础巩固类——一、选择题(每小题5分,共40分)1.关于简单随机抽样,下列说法中不正确的是(B)A.当总体中个体数不多时,可以采用简单随机抽样B.采用简单随机抽样不会产生任何代表性差的样本C.利用随机数表抽取样本时,读数的方向可以向右,也可以向左、向下、向上等D.抽签法抽取样本对每个个体来说都是公平的解析:简单随机抽样可能产生代表性差的样本.故选B.2.抽签法中确保样本具有代表性的关键是(B)A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析:要确保样本具有代表性,用抽签法时,最重要的是要使总体“搅拌均匀”,使每个个体被抽到的可能性相等.使用抽签法制作号签后一定要搅拌均匀.3.下列说法正确的是(B)A.抽签法中可一次抽取两个个体B.随机数法中每次只取一个个体C.简单随机抽样是放回抽样D.抽签法中将号签放入箱子中,可以不搅拌直接抽取4.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为(D)A.150B.200C.100D.120解析:N=3025%=120.5.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本;③选定开始的数字.这些步骤的先后顺序应为( B )A .①②③B .①③②C .③②①D .③①②解析:用随机数表法抽样应先将个体编号,然后从随机数表中选取开始的数字读数,得到符合条件的样本,对应样本的个体为所得的样本.6.在简单随机抽样中,某一个个体被抽到的可能是( C )A .与第n 次抽样有关,第一次被抽中的可能性大些B .与第n 次抽样有关,最后一次被抽中的可能性较大C .与第n 次抽样无关,每次被抽中的可能性相等D .与第n 次抽样无关,每次都是等可能被抽取,但各次被抽取的可能性不一样解析:在总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等.7.对于简单随机抽样,下列说法中正确的命题有( D )①它要求被抽取样本的总体的个数是有限的,以便对其中每个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,每个个体被抽取的概率相等,而且在整个抽样过程中,每个个体被抽取的概率也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④解析:命题①②③④都正确.8.某校高一共有10个班,编号为1~10,现用抽签法从中抽取3个班进行调查,每次抽取一个,共抽3次,设高一(5)班第一次被抽到的可能性为a ,第二次被抽到的可能性为b ,则( D )A .a =310,b =29B .a =110,b =19C .a =310,b =310D .a =110,b =110解析:由简单随机抽样的定义,知每个个体在每次抽取中都有相同的可能性被抽到,故高一(5)班在每次抽取中被抽到的可能性都是110. 二、填空题(每小题5分,共15分)9.为了了解某班学生的身高情况,决定从50名同学中选取10名进行测量(已编号为00~49),利用随机数法进行抽取,得到如下3组编号,你认为正确的是②.(填序号)①26,94,29,27,43,99,55,19,81,06;②20,26,31,40,24,36,19,34,03,48;③04,00,45,32,44,22,04,11,08,49.解析:获取的样本应跳过不在样本编号内的,并应去掉重复.10.用随机数法从100名学生(男生25人)中抽选20人进行评教,某男学生被抽到的可能性是0.2.解析:因为样本容量为20,总体容量为100,所以总体中每一个个体被抽到的可能性都为20100=0.2. 11.用简单随机抽样的方法从含有6个个体的总体中,抽取一个容量为2的样本,某一个个体a “第一次被抽到的概率”,“第二次被抽到的概率”,“在整个抽样过程中被抽到的概率”分别是16,16,13. 解析:从6个个体中抽1个个体,每个个体被抽到的概率均为16,与抽取的次数无关,第二次被抽到的概率仍为16.但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a 被抽到的概率为13. 三、解答题(共25分,解答应写出必要的文字说明、证明过程或演算步骤)12.(12分)某老现在课堂上对全班同学进行了两次模拟抽样,第一次采用抽签法,第二次采用随机数法.在这两次抽样中,小明第一次被抽到了,第二次没有被抽到,那么用这两种方法抽样时,小明被抽到的可能性一样吗?解:虽然都是简单随机抽样,但是每次抽出的结果可能会不相同,被抽到的可能性不是看最终结果,而是看在抽样前被抽到的可能性是不是相同,这主要取决于抽样是不是随机的,只要没有人为因素的干扰,在两次抽样中,小明被抽到的可能性都是一样的.13.(13分)现要从20名学生中抽取5名进行问卷调查,写出抽取样本的过程.解:简单随机抽样分两种:抽签法和随机数法.本题可采用抽签法进行抽取.(1)先将20名学生进行编号,从1编到20;(2)把写在形状、大小均相同的号签上;(3)将号签放在某个箱子中进行充分搅拌,力求均匀,然后依次从箱子中抽取5个号签,按这5个号签上的抽取对应的学生,即得样本.——能力提升类——14.(5分)从一群玩游戏的小孩中随机抽出k 人,一人分一个桃子后,让他们返回继续玩游戏,一会儿后,再从中任意抽出m 人,发现其中有n 个小孩曾分过桃子,估计一共有小孩子km n个. 解析:估计一共有小孩x 人,则有k x =n m, ∴x =km n. 15.(15分)公共汽车管理部门要考察一下其所管辖的30辆公共汽车的卫生状况,现决定从中抽取10辆进行检查.如果以抽签法做实验,请叙述具体的做法;如果该管理部门管辖的是70辆车,利用随机数法抽取一个简单随机样本,样本容量为30.解:(1)抽签法的步骤:第一步 编号.给所管辖的30辆车编号;第二步 定签.可以用各种不同的签,最简单的可以用纸条,将30辆车的编号写在纸条上;第三步 抽取.将纸条混合均匀,依次随机地抽取10个;第四步 调查.调查抽出的纸条所对应的车辆.(2)随机数法的步骤:第一步编号.将70辆车编上号:00,01,02, (69)第二步选数.由于总体是一个两位数的编号,所以从随机数表中随机选取一个位置开始,向某一方向依次选取两位数字,大于69的舍去,重复的舍去,直到取满30个数为止;第三步调查.调查抽出的数所对应的车辆.。

北师大版必修3高中数学第1章统计44.1平均数中位数众数极差方差4.2标准差

北师大版必修3高中数学第1章统计44.1平均数中位数众数极差方差4.2标准差

(2)方差的求法: 标准差的平方 s2 叫作方差. s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] 其中,xn 是样本数据,n 是样本容量, x 是样本均值. (3)方差的简化计算公式:
s2=1n[(x21+x22+…+x2n)-n x 2] =1n(x21+x22+…+xn2)- x 2.
数为 1,则样本方差为( )
6
6
A. 5
B.5
C. 2
D.2
D [∵样本的平均数为 1,即51×(a+0+1+2+3)=1,∴a=-1,
∴样本方差 s2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2] =2.]
3.一次选拔运动员的测试中,测得 7 名选手中的身高(单位:cm)
(2)确定众数的关键是统计各数据出现的频数,频数最大的数据 就是众数.当一组数据中有不少数据多次重复出现时,众数往往更能 反映数据的集中趋势.
(3)平均数与每一个样本数据都有关,受个别极端数据(比其他数 据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极 端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数 去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计 总体.
第一章 统计
§4 数据的数字特征
4.1 平均数、中位数、众数、极差、方差
4.2 标准差
学习目标
核心素养
1.通过求一组数据的平均数、中 1.会求一组数据的平均数、中位
位数、众数、极差、方差、标 数、众数、极差、方差、标准差.(重
准差,培养数学运算素养. 点)
2.通过方差、标准差在实际问 2.方差、标准差在实际问题中的
1.已知一组数据为 20,30,40,50,50,60,70,80,其中平均数,中位 数和众数的大小关系是( )
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方 便记录两组的数据,两个以上的数据虽然能够记录,但是没有表 示两个记录那么直观,清晰。
3. 制作茎叶图的方法:将所有两位数的十位数 字作为“茎”,个位数字作为叶,茎相同者 共用一个茎,茎按从小到大 的顺序从上向下 列出,共茎的叶一般按从大到小(或从小到 大)的顺序同行列出。 注意:相同的得分要重复记录,不能遗漏。
必修3复习-统计
统计知识点: 1、抽样方法。 (1)简单随机抽样(2)系统抽样(3)分层抽样 2、样本分布估计总体分布 (1)频率分布表 (2)直方图 (3)折线图 (4)散点图 (5)茎叶图 3、样本特征数估计总体特征数 (1)平均数(2)方差 (3)众数 (4)中位数 4、线性回归方程。
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1Βιβλιοθήκη (2)其频率分布直方图如下
频率/组距 0.07 0.06 0.05 0.04 0.03 0.02
0.01
o
122
126
130
134
138
142
146
150
154
158
身高(cm)
(3)由样本频率分布表可知身高小于134cm 的男孩 出现的频率为0.04+0.07+0.08=0.19, 所以我们估计身高小于134cm的人数占总人数的19%.
把横轴分成若干段,每一线段对应一个
组的组距,然后以此线段为底作一矩形, 它的高等于该组的频率/组距,这样得出 一系列的矩形,每个矩形的面积恰好是 该组上的频率,这些矩形就构成了频率 分布直方图。
例1:下表给出了某校500名12岁男孩中用随机抽样 得出的120人的身高(单位cm)
区间界限 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) 人数 5 8 10 22 33 20 区间界限 [146,150) [150,154) [154,158) 人数 11 6 5
(2)系统抽样 (3)分层抽样
1、抽签法步骤 (1)先将总体中的所有个体(共有N个) 编号(号码可从1到N) (2)把号码写在形状、大小相同的号 签上,号签可用小球、卡片、纸条等制 作 (3)将这些号签放在同一个箱子里, 进行均匀搅拌 (4)抽签时,每次从中抽出一个号签, 连续抽取n次 (5)抽出样本
(1)找全距 (2)分组 (3)找频数,计算频率,列表

样本的频率分布表
样本的频率分布直方图
作样本频率分布直方图的步骤:
(1)求极差; (2)决定组距与组数; (组数=极差/组距) (3)将数据分组;
(4)列频率分布表(分组,频数,频率);
(5)画频率分布直方图。
作频率分布直方图的方法:
分层抽样步骤: 1.将总体按一定标准分层; 2.计算各层的个体数与总体的个体数 的比; 3.按比例确定各层应抽取的样本数目 4.在每一层进行抽样 (可用简单随 机抽样或系统抽样)
类别
抽样方式
使用范围
共同点
相互联系
简单随机抽样
从总体中逐个抽取 总体中个体数较少 抽样过程中 时 每个个体被 抽取的可能 性相同 分段 按规则抽取 总体中个体数较多 时 在第一段中采 用简单随机抽 样
茎叶图
1.茎叶图的概念:当数据是两位有效数字时,用中间的数
字表示十位数,即第一个有效数字,两边的数字表示个位数,即 第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎 上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例 子)
2.茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数 据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶 图中的数据可以随时记录,随时添加,方便记录与表示。
(1)列出样本频率分布表﹔
(2)一画出频率分布直方图; (3)估计身高小于134cm的人数占总人数的百分比.。 分析:根据样本频率分布表、频率分布直方图的一 般步骤解题。
解:(1)样本频率分布表如下: 分组 频数 [122,126) 5 [126,130) 8 [130,134) 10 [134,138) 22 [138,142) 33 [142,146) 20 [146,150) 11 [150,154) 6 [154,158) 5 合计 120

总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做 这个总体的一个样本。
样本容量:样本中个体的数目。
1.统计的的基本思想是:
用样本的某个量去估计总体的 某个量
抽取样本
要求:总体中每个个体 被抽取的机会相等
(1)简单随机抽样
课堂热身
1.在一次有奖明信片的100 000个有机会中奖的号码(编
号 00000—99999)中,邮政部门按照随机抽取的方式确 定后两位是 23 的作为中奖号码,这是运用了 ________ 系统 抽样方法.
(1)分析样本的分布情况 样本的频率分布表 样本的频率分布直方图 样本的茎叶图
频率分布:是指一个样本数据在各个小范围内所占比 例的大小。一般用频率分布直方图反映样本的频率分 布。
频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的 总体趋势。 (2)从频率分布直方图得不出原始的数据内容,把 数据表示成直方图后,原有的具体数据信息就被抹 掉了。
系统抽样
分层抽样
分层 按各层比例抽取
总体中个体差异明 显时
各层中抽样时 采用前两种方 式
分析样本,估计总体
(1)分析样本的分布 情况
(2)分析样本的特征 数
公式
样本数据: 1
x ,x2, ,xn
平均数:
x1 x 2 x n x n
2 2 2
( x1 x ) ( xn x ) 标准差: s s n
2、随机数表法步骤
(1)将总体中的个体编号(编号时位数要 一样); (2)选定开始的数字; (3)按照一定的规则读取号码; (4)取出样本
系统抽样步骤:
1.编号,随机剔除多余个体,重新编号
2.分段
(段数等于样本容量)
间隔长度 k=N/n 3.抽取第一个个体编号为i 4.依预定的规则抽取余下的 个体编 号为i+k, i+2k, …
相关文档
最新文档