高考数学统计及统计案例
高考数学复习统计与统计案例概率节变量间的相关关系与统计案例文新人教A版PPT课件
解析 易求-x=9,-y=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.
答案 C
3.两个变量y与x的回归模型中,分别选择了4个不同模型,它 们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析 在两个变量y与x的回归模型中,它们的相关指数R2越
最新考纲 1.会作两个有关联变量的数据的散点图,会利用 散点图认识变量间的相关关系;2.了解最小二乘法的思想, 能根据给出的线性回归方程系数公式建立线性回归方程(线性 回归方程系数公式不要求记忆);3.了解独立性检验(只要求 2×2列联表)的基本思想、方法及其简单应用;4.了解回归分 析的基本思想、方法及其简单应用.
到
的区
域,两个变量的这种相关关系称为一负条相直关线.
(3)如果散点图中点的分布从整体上看大致在
2.线性回归方程
(1)最小二乘法:使得样本数据的点到回归直线的 距离的平方最和小的方法叫做最
小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,
yn),其回归方程为
知识
1.相关关系与回归分析 梳 理 回归分析是对具有相关关系的两个变量进行统计分析的一种
常用方法;判断相散关点性图的常用统计图是:
;统左计下量角有相关右系上数角与相关指数.
(1)在散点图中,点散布在从
到
的区
域,对于两个变量的这左种上相角关关系右,下我角们将它称为正相关.
(2)在散点图中,点散布在从
≈4.844.
则
认
为
高考数学试题汇编统计、统计案例
第五节 统计、统计案例高考试题考点一 抽样的方法1.(2013年新课标全国卷Ⅰ,理3)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) (A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样 (D)系统抽样解析:由于小学、初中、高中三个学段学生的视力情况差异较大,而男女视力情况差异不大,因此可以按学段分层抽样.故选C. 答案:C2.(2013年安徽卷,理5)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) (A)这种抽样方法是一种分层抽样 (B)这种抽样方法是一种系统抽样(C)这五名男生成绩的方差大于这五名女生成绩的方差 (D)该班男生成绩的平均数小于该班女生成绩的平均数解析:本题采用简单随机抽样方法抽取样本,故选项A 、B 错误.因为5名男生成绩和5名女生成绩的平均数,与该班男生成绩的平均数与女生成绩的平均数不一定存在准确的对应关系,所以选项D 的说法不一定成立.对于C 项,男生成绩的平均数1x =90,女生成绩的平均数2x =91,故5名男生成绩的方差21s =15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,5名女生成绩的方差22s =15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6,故选C. 答案:C3.(2013年江西卷,理4)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )(A)08 (B)07 (C)02(D)01解析:从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01. 答案:D考点二 统计图表1.(2013年福建卷,理4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )(A)588 (B)480(C)450 (D)120解析:由题频率分布直方图得,该模块测试成绩不少于60分的学生人数为600×(0.030+0.025+0.015+0.010)×10=480.故选B.答案:B2.(2012年陕西卷,理6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )(A) x甲<x乙,m甲>m乙 (B) x甲<x乙,m甲<m乙(C) x甲>x乙,m甲>m乙 (D) x甲>x乙,m甲<m乙解析:把数据从茎叶图中整理出来,甲的数据为:5,6,8,10,10,14,18,18,22,25,27,30,30,38,41,43;乙的数据为:10,12,18,20,22,23,23,27,31,32,34,34,38,42,43,48,所以x甲=116(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)=34516,x乙=116(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)=45716,显然x甲<x乙.又∵m甲=18222+=20,m乙=27312+=29,所以m甲<m乙.答案:B3.(2013年新课标全国卷Ⅱ,理19)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的数学期望.解:(1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000,当X∈[130,150]时,T=500×130=65000,所以T=80039000,100130, 65000,130150.X XX-⎧⎨⎩≤<≤≤(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点三样本的数字特征1.(2013年重庆卷,理4)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )(A)2,5 (B)5,5(C)5,8 (D)8,8解析:由甲组数据的中位数为15,得x=5.由乙组数据的平均数为16.8,得9+30+5+y+8+24=16.8×5,即76+y=84,解得y=8.故选C.答案:C2.(2012年安徽卷,理5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差解析:甲射击比赛中靶4,5,6,7,8环各1次,则甲成绩的中位数为6环,平均数为6环,极差为4环,方差为2平方环;乙射击比赛中靶5环3次,6环1次,9环1次,则乙成绩的中位数为5环,平均数为6环,极差为4环,方差为2.4平方环.所以甲成绩的方差比乙成绩的方差小.故选C.答案:C3.(2012年江西卷,理9)样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为y(x≠y).若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数z=αx+(1-α)y,其中0<α<12,则n,m的大小关系为( )(A)n<m (B)n>m(C)n=m (D)不能确定解析:依题意得x1+x2+…+x n=n x,y1+y2+…+y m=m y,x1+x2+…+x n+y1+y2+…+y m=(m+n)z=(m+n)αx+(m+n)(1-α) y,所以n x+m y=(m+n)αx+(m+n)(1-α)y,所以()()(),1, n m n am m n a ⎧=+⎪⎨=+-⎪⎩于是有n-m=(m+n)[α-(1-α)]=(m+n)(2α-1).因为0<α<1 2 ,所以2α-1<0.又m+n>0,所以n-m<0.即n<m.故选A.答案:A4.(2011年江苏卷,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= .解析:由于这5个数的平均数x=15×(10+6+8+5+6)=7,因此该组数据的方差s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.2考点四变量的相关性1.(2012年湖南卷,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为ˆy=0.85x-85.71,则下列结论中不正确的是( )(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg(D)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:根据线性回归方程相关知识可知选项A、B、C是正确的.而由回归方程得到的是预报变量的可能取值的平均值,不是预报变量的精确值,故选D.答案:D2.(2011年陕西卷,理9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图所示),以下结论中正确的是( )(A)x和y的相关系数为直线l的斜率(B)x和y的相关系数在0到1之间(C)当n为偶数时,分布在l两侧的样本点的个数一定相同(D)直线l过点(x,y)解析:相关系数是表示两个变量是否具有线性相关关系的量,可正可负也可为0,它的绝对值越接近1两变量相关性越强.因此A、B错,线性回归直线两侧样本点个数不一定相同,故C错.回归直线恒过样本中心(x,y).选项D正确.答案:D3.(2011年江西卷,理6)变量X和Y对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )(A)r2<r1<0 (B)0<r2<r1(C)r2<0<r1(D)r2=r1解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.所以有r2<0<r1.故选C.答案:C4.(2011年山东卷,理7)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程ˆy=b x+ˆa中的b为9.4,据此模型预报广告费用为6万元时销售额为( )(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:线性回归直线过定点(x,y),y=492639544+++=42, x=3.5,代入ˆa=y-ˆb x得ˆa=42-9.4×3.5=9.1,所以ˆy=6×9.4+9.1=65.5(万元).答案:B5.(2011年辽宁卷,理14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:ˆy=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元. 解析:由回归直线方程可知,x每增加1,ˆy增加0.254,从而家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2546.(2011年广东卷,理13)某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.解析:儿子和父亲的身高可列表如下:(单位:cm)父亲身高x173170176儿子身高y170176182设回归直线方程为ˆy=ˆa+ˆb x,由表中数据可求得x=173, y=176,∴ˆb=()()()31321i iiiix x y yx x==---∑∑=()223633⨯+-=1,ˆa=y-ˆb x=3,故回归直线方程为ˆy=x+3.当x=182时, ˆy=182+3=185.故预测他孙子的身高为185 cm.答案:185考点五独立性检验(2012年辽宁卷,理19)电视传媒公司为了解某地区某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女1055总计(2)将上述调查得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中“体育迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).附:χ2=()211221221n n n n nn n n n-++.P(χ2≥k)0.050.01 k 3.841 6.635解:(1)由频率分布直方图可知在抽取的100人中,“体育迷”有25人,从而2×2列联表补充如下:非体育迷体育迷总计男301545女451055总计7525100将2×2列联表中的数据代入公式计算,得χ2=()2 1003010451575254555⨯-⨯⨯⨯⨯=10033≈3.030.因为3.030<3.841,所以没有足够的把握认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B(3, 14),从而X 的分布列为: X 0123P27642764964164所以E(X)=np=3×14=34,D(X)=np(1-p)=3×14×34=916. 模拟试题考点一 抽样方法1.(2013北京市丰台区期末)某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是 .解析:高三的人数为400, 所以在高三抽取的人数为45900×400=20. 答案:202.(2013青岛一中调研)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.解析:因为12=5×2+2,即第三组抽出的是第二个同学, 所以每一组都相应抽出第二个同学. 所以第8组中抽出的号码为5×7+2=37号. 答案:37考点二 统计图表1.(2013云南师大附中检测)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲乙两名运动员这项测试成绩的平均数,s 1,s 2分别表示甲乙两名运动员这项测试成绩的标准差,则有( )(A)1x >2x ,s 1<s 2 (B)1x =2x ,s 1=s 2 (C)1x =2x ,s 1<s 2(D)1x =2x ,s 1>s 2解析:由样本中数据可知1x =15, 2x =15, 由茎叶图得s 1<s 2, 所以选C. 答案:C2.(2013贵州省六校联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为 .解析:19(68+72+73+78×2+81+89×2+92)=7209=80.答案:803.(2013北京市西城区期末)为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70],得到如图所示的频率分布直方图.现采用分层抽样的方法,从第3,4,5组中随机抽取6名学生做初检.(1)求每组抽取的学生人数;(2)若从6名学生中再次随机抽取2名学生进行复检,求这2名学生不在同一组的概率.解:(1)由频率分布直方图知,第3,4,5组的学生人数之比为3∶2∶1.所以,每组抽取的人数分别为:第3组:36×6=3;第4组:26×6=2;第5组:16×6=1.所以从第3,4,5组应依次抽取3名学生,2名学生,1名学生.(2)记“从6名学生中抽取2名学生不在同一组”为事件A,则P(A)=11111131213226C C C C C CC+⋅+⋅=1115.考点三样本的数字特征1.(2012西安五校模拟)已知一组正数x1,x2,x3,x4的方差s2=14(22221234x x x x+++-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为( ) (A)2 (B)3 (C)4 (D)6解析:设x1,x2,x3,x4的平均值为x,则s2=14[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2]=14(22221234x x x x+++-42x),∴42x=16,∴x =2,∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4. 答案:C2.(2013昆明一中检测)某学校想要调查全校同学是否知道迄今为止获得过诺贝尔物理奖的6位华人的姓名,为此出了一份考卷.该卷共有6个单选题,每题答对得20分,答错、不答得零分,满分120分.阅卷完毕后,校方公布每题答对率如下:则此次调查全体同学的平均分数是 分.解析:假设全校人数有x 人,则每道试题答对人数及总分分别为所以六个题的总分为66x,所以平均分为66xx=66. 答案:66考点四 线性回归方程1.(2013青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如下表:显然所减分数y 与模拟考试次数x 之间有较好的线性相关关系,则其线性回归方程为( )(A)y=0.7x+5.25 (B)y=-0.6x+5.25 (C)y=-0.7x+6.25(D)y=-0.7x+5.25解析:由题意可知,所减分数y 与模拟考试次数x之间为负相关,所以排除A. 考试次数的平均数为x =14(1+2+3+4)=2.5, 所减分数的平均数为y =14(4.5+4+3+2.5)=3.5, 即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,故选D. 答案:D2.(2012湘潭三模)某种产品的广告支出x 与销售额y(单位:百万元)之间有如下的对应关系:(1)假定x 与y 之间具有线性相关关系,求回归方程;(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?参考公式: ˆb=1221ni ii nii x ynx y xnx==--∑∑,ˆa=y -ˆb x . 解:(1)∵x =15×(2+4+5+6+8)=5, y =15×(30+40+60+50+70)=50,521ii x=∑=22+42+52+62+82=145,51i ii x y=∑=2×30+4×40+5×60+6×50+8×70=1380,∴ˆb=51522155i ii ii x yx y xx==--∑∑=21380555014555-⨯⨯-⨯=6.5,ˆa=y -ˆb x =50-6.5×5=17.5. ∴回归方程为ˆy=6.5x+17.5. (2)由回归方程得ˆy ≥60,即6.5x+17.5≥60, 解得x ≥8513≈6.54. 故广告支出应该不少于6.54百万元.考点五 独立检验1.(2012枣庄模拟)下面是2×2列联表:则表中a,b 的值分别为( )(A)94,72 (B)52,50 (C)52,74 (D)74,52 解析:∵a+21=73,∴a=52, 又a+22=b,∴b=74. 答案:C2.(2012汕头期末)下列命题中假命题是( )(A)对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越大(B)用相关指数R 2来刻画回归的效果时,R 2的值越大,说明模型拟合的效果越好(C)两个随机变量的相关性越强,相关系数的绝对值越接近1 (D)等高条形图可以展示2×2列联表数据的频率特征解析:K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.答案:A综合检测1.(2011汕头期末)下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:如果根据上表提供的数据求出y 关于x 的线性回归方程为y =0.7x+0.35,那么表中t 的值为( )(A)3 (B)3.15 (C)3.5(D)4.5解析:由y=0.7x+0.35得2.54 4.54t+++=0.7×34564++++0.35,即114t+=3.5,解得t=3.答案:A2.(2011佛山联考)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为30的样本,已知B层中每个个体被抽到的概率都是112,则总体中的个体数为.解析:因为分层抽样为等可能抽样,故每个个体被抽到的可能性都是相等的.设总体中的个体数为n,则30n=112,∴n=360.答案:3603.(2012广州期末)在一次调研中,随机调查了某社区若干居民的年龄,将调查数据绘制成如图所示的扇形和条形统计图,则a-b= .(60以上含60)解析:设共调查了x名居民的年龄,由x·46%=230,得x=500,于是得a=100500×100%=20%,b=1-(20%+46%+22%)=12%.故a-b=8%.答案:8%。
高中数学 统计题型
以下是一些高中数学统计题型的示例:
1. 调查统计:假设你进行了一项关于学生喜欢的体育项目的调查。
根据收集到的数据,制作一个条形图或饼图来展示各个体育项目的受欢迎程度。
2. 抽样调查:你想了解高中生每周花在手机上的时间。
从你的班级中随机选择一部分学生,让他们记录每天使用手机的时间。
然后计算平均值、中位数和众数,并讨论结果的意义。
3. 数据分析:给定一组数据,例如学生的考试成绩。
计算平均值、中位数、众数和标准差,并用这些数据来描述学生的整体表现。
4. 概率分析:某次抛硬币实验中,连续抛掷了10次硬币,结果正面朝上的次数为7次。
计算正面朝上的概率,并讨论这个结果是否合理。
5. 相关性分析:根据一组数据,比如学生的身高和体重,计算相关系数来衡量两个变量之间的关联程度,并解释结果的含义。
以上是高中数学中统计题型的一些示例。
通过这些题目,学生可以学习统计学的基本概念、数据分析和概率计算等技巧。
教师可以根据具体的教材和教学目标来设计更多的统计题目,以帮助学生掌握统计学
的基础知识和解题方法。
高中数学高考数学学习资料:专题6 第3讲 统计、统计案例
[解]
(1)当 X=8 时, 由茎叶图可知, 乙组同学的植树棵数是: 8,8,9,10,
8+8+9+10 35 - 所以(8- )2+(8- )2+(9- )2+ 4 4 4 4 (10- 35 2 11 ) ]= . 4 16
知考情
第 3
讲 统计 、 统计 研考题
析考向
案例 战考场
高频考点 抽样方法
考情解读 多考查分层抽样
考查方式 选择题
用样本估计 样本频率分布图与茎叶图及样本数据 选择题、解 总体 回归分析 是命题热点,多与概率统计相结合 重点考查回归分析应用
zxxk
答题 选择题、填 空题 选择题
独立性检验 主要考查独立性检验的意义
[联知识
串点成面]
抽样方法主要有简单随机抽样、系统抽样、分层抽 样三种,这三种抽样方法各自适用不同特点的总体,但 无论哪种抽样方法,每一个个体被抽到的概率都是相等
的,都等于样本容量和总体容量的比值.zxxk
[做考题
查漏补缺]
(2011· 山东高考)某高校甲、乙、丙、丁四个专业分 别有150、150、400、300名学生.为了解学生的就业倾向, 用分层抽样的方法从该校这四个专业共抽取40名学生进行 调查,应在丙专业抽取的学生人数为________.zxxk
(2)当 X=9 时,由茎叶图可知,甲组同学的植树棵数是:9,9,11,11;乙 组同学的植树棵数是: 9,8,9,10.分别从甲、 乙两组中随机选取一名同学, 共有 4×4=16 种可能的结果,这两名同学植树总棵数 Y 的可能取值为 17,18,19,20,21.事件“Y=17”等价于“甲组选出的同学植树 9 棵, 乙组 选出的同学植树 8 棵”,所以该事件有 2 种可能的结果,因此 2 1 P(Y=17)= = . 16 8 1 1 同理可得 P(Y=18)= ;P(Y=19)= ; 4 4 1 1 P(Y=20)= ;P(Y=21)= . 4 8
高考数学二轮复习专题突破—统计与统计案例(含解析)
高考数学二轮复习专题突破—统计与统计案例1.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:√74≈8.602.2.(2021·江西赣州二模改编)遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:(1)请利用所给数据求不“礼让行人”驾驶员人数y 与月份x 之间的经验回归方程y ^=b ^x+a ^,并预测该路口2021年10月不“礼让行人”驾驶员的大约人数(四舍五入);(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:依据小概率值α=0.10的独立性检验,分析“礼让行人”行为是否与驾龄有关.参考公式:b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx2=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2.χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.3.(2021·河北石家庄二模改编)某地区在2020年底全面建成小康社会,随着实施乡村振兴战略规划,该地区农村居民的收入逐渐增加,可支配消费支出也逐年增加.该地区统计了2016~2020年农村居民人均消费支出情况,对有关数据处理后,制作如图1的折线图[其中变量y (单位:万元)表示该地区农村居民人均年消费支出,年份用变量t 表示,其取值依次为1,2,3,…].(1)由图1可知,变量y与t具有很强的线性相关关系,求y关于t的经验回归方程,并预测2021年该地区农村居民人均消费支出;2016~2020年该地区农村居民人均消费支出图1(2)在国际上,常用恩格尔系数(其含义是指食品类支出总额占个人消费支出总额的比重)来衡量一个国家和地区人民生活水平的状况.根据联合国粮农组织的标准:恩格尔系数在40%~50%为小康,30%~40%为富裕.已知2020年该地区农村居民平均消费支出构成如图2所示,预测2021年该地区农村居民食品类支出比2020年增长3%,从恩格尔系数判断2021年底该地区农村居民生活水平能否达到富裕生活标准.2020年该地区农村居民人均消费支出构成图2参考公式:经验回归方程y ^=b ^x+a ^中斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2,a ^=y −b ^x .4.(2021·山东潍坊一模)在对人体的脂肪含量和年龄之间的关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据(x i ,y i )(i=1,2,…,20,25<x i <65),其中x i 表示年龄,y i 表示脂肪含量,并计算得到∑i=120x i 2=48 280,∑i=120y i 2=15 480,∑i=120x i y i =27 220,x =48,y =27,√22≈4.7.(1)请用样本相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x的经验回归方程y ^=a ^+b ^x (a ^,b ^的计算结果保留两位小数);(2)科学健身能降低人体脂肪含量,下表是甲、乙两款健身器材的使用年限(整年)统计表:某健身机构准备购进其中一款健身器材,以使用年限的频率估计概率,请根据以上数据估计,该机构选择购买哪一款健身器材,才能使用更长久?参考公式:样本相关系数r=∑i=1n(x i -x)(y i -y)√∑i=1n (x i -x)2√∑i=1n(y i -y)2=∑i=1nx i y i -nx y√∑i=1nx i 2-nx 2√∑i=1ny i 2-ny 2;对于一组具有线性相关关系的数据(x i ,y i )(i=1,2,…,n ),其经验回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1n(x i -x)(y i -y)∑i=1n(x i -x)2,a ^=y −b ^x .答案及解析1.解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s 2=1100[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, s=√0.029 6=0.02×√74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. 2.解 (1)由表中数据易知:x =1+2+3+44=52,y =125+105+100+904=105,则b ^=∑i=14x i y i -4x y∑i=14x i 2-4x2=995−1 05030−25=-11,a ^=y −b ^ x =105-(-11)×52=132.5,故所求经验回归方程为y ^=-11x+132.5.令x=10,则y ^=-11×10+132.5=22.5≈23(人),预测该路口10月份不“礼让行人”的驾驶员大约人数为23. (2)零假设为H 0:“礼让行人”行为与驾龄无关.由表中数据可得χ2=50×(10×12−20×8)218×32×30×20≈0.23<2.706=x 0.10,依据小概率值α=0.10的独立性检验,没有充分证据推断H 0不成立,可以认为H 0成立,即认为“礼让行人”行为与驾龄无关.3.解 (1)由已知数据可求t =1+2+3+4+55=3, y =1.01+1.10+1.21+1.33+1.405=1.21,∑i=15t i 2=12+22+32+42+52=55,∑i=15t i y i =1×1.01+2×1.10+3×1.21+4×1.33+5×1.40=19.16,b ^=19.16−5×3×1.2155−5×32=1.0110=0.101,a ^=1.21-0.101×3=0.907,所求经验回归方程为y ^=0.101t+0.907. 当t=6时,y ^=0.101×6+0.907=1.513(万元),故2021年该地区农村居民人均消费支出约为1.513万元.(2)已知2021年该地区农村居民平均消费支出1.513万元,由图2可知,2020年该地区农村居民食品类支出为4 451元,则预测2021年该地区食品类支出为4 451×(1+3%)=4 584.53元,恩格尔系数=4 584.5315 130×100%≈30.3%∈(30%,40%),所以,2021年底该地区农村居民生活水平能达到富裕生活标准.4.解 (1)x 2=2 304,y2=729,∑i=120x i y i -20x y =1 300,∑i=120x i 2-20x 2=2 200,∑i=1ny i 2-20y 2=900,r=∑i=120x i y i -20x y√∑i=120x i 2-20x 2√∑i=1ny i 2-20y2≈0.92,因为y 与x 的样本相关系数接近1,所以y 与x 之间具有较强的线性相关关系,可用线性回归模型进行拟合.由题可得,b ^=∑i=120(x i -x)(y i -y)∑i=120(x i -x)2=∑i=120x i y i -20x y∑i=120x i 2-20x2=1322≈0.591,a ^=y −b ^ x =27-0.591×48≈-1.37,所以y ^=0.59x-1.37.(2)以频率估计概率,设甲款健身器材使用年限为X (单位:年).E (X )=5×0.1+6×0.4+7×0.3+8×0.2=6.6. 设乙款健身器材使用年限为Y (单位:年).E (Y )=5×0.3+6×0.4+7×0.2+8×0.1=6.1.因为E (X )>E (Y ),所以该健身机构购买甲款健身器材更划算.。
高三数学一轮精品复习学案:第十章 统计、统计案例
高三数学一轮精品复习学案:第十章统计、统计案例【知识特点】1.统计中所学的内容是数理统计中最基本的问题,通过这些内容主要来介绍相关的统计思想和方法,了解一些有关统计学的基本知识,并能够应用几个基本概念、基本公式来处理实际生活中的一些基本问题。
2.统计案例为新课标中新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法。
增加了统计和统计案例后,使得高中数学的整个体系更加完善了,有利于开阔数学视野,丰富数学思想和方法。
【重点关注】1.从对新课标高考试题的分析可以发现,主要考查抽样方法、各种统计图表、样本数字特征等。
对这部分的考查主要以选择题和填空题的形式出现。
2.统计案例中的独立性检验和回归分析也会逐步在高考题中出现,难度不会太大,多数情况下是考查两种统计分析方法的简单知识,以选择题和填空题为主。
【地位与作用】《全国新课程标准高考数学考试大纲》中对考生能力要求明确界定为空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识等六个方面,其中数据处理能力是首次提出的一个能力要求,这定义为:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究问题有用的信息,并作出判断。
数据处理能力主要依据统计(高考考试大纲对知识点要求如下表所示)或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题,对统计的要求已提升到能力的高度。
统计的思想方法广泛应用于自然科学和社会科学的研究中,统计的语言不仅是数学的语言,也是各学科经常引用的大众语言,统计知识是作为一个新时期公民所比备的知识。
统计学就是应用科学的方法收集、整理、分析、描述所要研究的数据资料,然后根据所得到的结果,进行推断或决策的一门实用性很强的科学。
统计这部分内容,在高中数学新课程中,主要分布在必修3第二章(约16课时)与选修2—3第三章(约9课时)。
相对于高中学生的认知水平和生活经历还相对不是很高,所以它只能属于非重点内容,所出的相关题目一般来说都相对比较简单。
统计与统计案例35752
第七页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
(3)平均数 样本数据的平均数-x =1n(x1+x2+…+xn). (4)方差与标准差 方差 s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2]. 标准差 s= 1n[x1--x 2+x2--x 2+…+xn--x 2].
所以平均每周上网时间少于 4 小时的学生所占比例为 P+ 3P=0.4,即人数为 0.4×100=40.
第二十一页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
(2)由题意可知,利用分层抽样的方法抽取上网时间在 0~ 2 小时内的学生 1 名(记为 A),抽取上网时间在 2~4 小时内的 学生 3 名(分别记为 B1,B2,B3),从这 4 名学生中随机抽取 2 名学生有(A,B1),(A,B2),(A,B3),(B1,B2),(B2,B3),(B1, B3),共 6 种结果,
第二十六页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
4.方差越大,数据的波动程度越大,越不稳定. 5.准确理解给出图表及已知条件中数据的含义是解决统 计问题的关键.
第二十七页,共二十八页。
专题七 第一讲
内容(nèiróng)总结
走向(zǒuxiàng)高考·数学。[答案] B
第二十页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] (1)设频率分布直方图中从左到右前 3 个小矩形的 面积分别为 P,3P,5P.
由频率分布直方图可知,最后 2 个小矩形的面积之和为 (0.015+0.035)×2=0.1.
高考数学复习第10章概率统计和统计案例第4讲用样本估计总体文市赛课公开课一等奖省名师优质课获奖
(必修 3 P70 内文改编)已知甲、乙两组数据 如茎叶图所示,若它们的中位数相同,平均
数也相同,则图中的 m+n=( )
A.7
B.8
C.9
D.10
10/64
解析:选 C.根据茎叶图,可得甲组数据的中位数为20+2 22=
21,根据甲、乙两组数据的中位数相等,得乙组数据的中位
数 为 21 = 20 + n , 解 得 n = 1 . 又 甲 组 数 据 的 平 均 数 为
30/64
【对点通关】 (必修 3 P82B 组 T1 改编)某良种培育基地正在培育一小麦新品 种 A,将其与原有的一个优良品种 B 进行对照试验,两种小 麦各种植了 25 亩,所得亩产数据(单位:千克)如下. 品种 A: 357,359,367,368,375,388,392,399,400,405,412, 414,415,421,423,423,427,430,430,434,443,445, 445,451,454
第十章 概率、统计与统计案例
第 4 讲 用样本估计总体
1/64
1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定__组__距__与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.
2/64
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端 的_中__点___,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数 增加,组距__减__小__,相应的频率折线图会越来越接近于一条 光滑曲线,统计中称这条光滑曲线为__总__体__密__度__曲__线__. 3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指 __中__间__的一列数,叶是从茎的旁边生长出来的数.
高考数学:专题六 第三讲 统计、统计案例课件
特点和实施步骤,其次要熟练掌握系统抽样中被抽个体号码的确定 方法及分层抽样中各层人数的计算方法.
题型与方法
第三讲
变式训练 1 (2011· 湖北)某市有大型超市 200 家、中型超市 400 家、 小型超市 1 400 家,为掌握各类超市的营业情况,现按分层抽样方法
本 讲 栏 目 开 关
抽取一个容量为 100 的样本,应抽取中型超市________家.
考点与考题
第三讲
5.(2012· 湖南)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm) 具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,„,n),用
本 讲 栏 目 开 关
最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不 . 正确的是 .. A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg ( )
18 3
本 讲 栏 目 开 关
31.5,35.5
1235.5,39.5
39.5,43.5
根据样本的频率分布估计,大于或等于 31.5 的数据约占 2 1 1 2 A. B. C. D. 11 3 2 3
解析
( B )
由条件可知,落在大于或等于 31.5 的数据有 12+7+3= 22 1 22(个),故所求概率约为66=3.
^
^
考点与考题
第三讲
4.(2011· 四川)有一个容量为 66 的样本, 数据的分组及各组的频数如下:
11.5,15.5 27.5,31.5
高中数学《统计与统计案例》课件
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础
高考数学一轮复习第9章统计与统计案例第2讲课后作业理含解析0419170.doc
第9章 统计与统计案例 第2讲A 组 基础关1.(2018·榆林模拟)一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,60)内的数据个数为( )A .14B .15C .16D .17答案 B解析 由频数分布表可知,样本中数据在[20,40)上的频率为4+530=0.3,又因为样本数据在[20,60)上的频率为0.8,所以样本在[40,60)内的频率为0.8-0.3=0.5,数据个数为30×0.5=15.2.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是( )A .甲B .乙C .丙D .丁答案 C解析 丙平均成绩高,方差s 2小(稳定),故最佳人选是丙.3.(2018·牡丹江模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )A.117 B.118 C.118.5 D.119.5 答案 B解析由茎叶图可知,此学生该门功课考试分数的极差为98-56=42,中位数是12×(76+76)=76,极差与中位数之和为42+76=118.4.(2019·钦州模拟)某仪器厂从新生产的一批零件中随机抽取40个检测,如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96],则样本的中位数在( )A.第三组 B.第四组 C.第五组 D.第六组答案 B解析由图可得,前四组的频率为(0.0375+0.0625+0.075+0.1)×2=0.55,则其频数为40×0.55=22,且第四组的频数为40×0.1×2=8,故中位数落在第四组,所以B正确.5.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以5为组距将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )答案 A解析 解法一:由茎叶图知,各组频数统计如表:此表对应的频率分布直方图为选项A .故选A .解法二:选项C ,D 组距为10与题意不符,舍去,又由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率/组距也分别相等,比较A 、B 两个选项知A 正确.故选A .6.如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x -A 和x-B ,样本标准差分别为s A 和s B ,则( )A.x -A >x -B ,s A >s BB.x -A <x -B ,s A >s BC.x -A >x -B ,s A <s BD.x -A <x -B ,s A <s B答案 B 解析 由图可知A 组的6个数为 2.5,10,5,7.5,2.5,10,B 组的6个数为15,10,12.5,10,12.5,10,所以x -A =2.5+10+5+7.5+2.5+106=37.56, x -B =15+10+12.5+10+12.5+106=706. 显然x -A <x -B .又由图形可知,B 组的数据分布比A 均匀,变化幅度不大,故B 组数据比较稳定,方差较小,从而标准差较小,所以s A >s B ,故选B .7.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )A .0.04B .0.06C .0.2D .0.3答案 C解析 由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35),[35,40),[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,45]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.2.8.(2019·长沙模拟)空气质量指数(Air Quality Index ,简称AQI )是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI 大于100的天数为________.(该年为365天)答案 146解析 该样本中AQI 大于100的频数为4,频率为25,以此估计此地全年AQI 大于100的频率为25,故此地该年AQI 大于100的天数约为365×25=146. 9.某班有50名学生,一次数学测试平均成绩是92,如果学员为1号到30号学生的平均成绩为90,则学号为31号到50号学生的平均成绩为________.答案 95解析 设学号为31号到50号学生的平均成绩为x .由题意得50×92=30×90+20x ,解得x =95.10.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案 (1)0.0044 (2)70解析 (1)由频率分布直方图知[200,250)小组的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x =0.2250=0.0044. (2)∵数据落在[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,∴所求户数为100×0.7=70.B 组 能力关1.(2018·西宁一模)某校高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在[90,100]内的人数分别为( )A .20,2B .24,4C .25,2D .25,4答案 C解析 由频率分布直方图可知,组距为10,[50,60)的频率为0.008×10=0.08,由茎叶图可知[50,60)的人数为2,设参加本次考试的总人数为N ,则N =20.08=25,根据频率分布直方图可知[90,100]内的人数与[50,60)的人数一样,都是2.故选C .2.一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为( )A .-11B .3C .9D .17答案 C解析 设这个数是x ,则平均数为25+x 7,众数是2.若x≤2,则中位数为2,此时x =-11;若2<x<4,则中位数为x ,此时2x =25+x 7+2,解得x =3;若x≥4,则中位数为4,则2×4=25+x 7+2,解得x =17,∴x 的所有可能值分别为-11,3,17,和为9.故选C. 3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为________.答案 1009解析 由频率分布直方图可得第一组的频率是0.08,第二组的频率是0.32,第三组的频率是0.36,则中位数在第三组内,估计样本数据的中位数为10+0.10.36×4=1009. 4.(2018·郑州模拟)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值.(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.解 (1)根据题意可知:x 甲=15×(7+8+10+12+10+m)=10,x 乙=15×(9+n +10+11+12)=10,所以m =3,n =8.(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,因为x 甲=x 乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组更稳定一些.C 组 素养关共享单车的出现方便了人们的出行,深受我市居民的喜爱.为调查某校大学生对共享单车的使用情况,从该校8000名学生中按年级用分层抽样的方式随机抽取了100名同学进行调查,得到这100名同学每周使用共享单车的时间(单位:小时)如下表:(1)已知该校大一学生有2400人,求抽取的100名学生中大一学生的人数;(2)作出这些数据的频率分布直方图;(3)估计该校大学生每周使用共享单车的平均时间t (同一组中的数据用该组区间的中点值作代表).解 (1)设抽取的100名学生中大一学生有x 人,则x 2400=1008000,解得x =30. 所以抽取的100名学生中大一学生有30人.(2)频率分布直方图如图所示.(3)由题意可得t=1×0.050×2+3×0.200×2+5×0.125×2+7×0.100×2+9×0.025×2=4.4(小时).所以该校大学生每周使用共享单车的平均时间大约为4.4小时.精美句子1、善思则能“从无字句处读书”。
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
高考数学考点二十《统计与统计案例》课件
100
200
则 K2=2001×00(×6100×0×601-004×0×10400)2=8>6.635,
所以有 99%以上的把握认为是否持乐观态度与国内外差异有关.
四、解答题 13.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设 备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 10 件产品,得到各件产品该项指标数据如下:
考点二十 统计与统计案例
一、选择题(在每小题给出的四个选项中,只有一项符合题目要求) 1.(2021·河北张家口第三次模拟)某中学春季运动会上,12 位参加跳高 半决赛同学的成绩各不相同,按成绩从高到低取前 6 位进入决赛,如果小明 知道了自己的成绩后,则他可根据其他 11 位同学成绩的哪个数据判断自己 能否进入决赛( )
A.r2<r4<0<r3<r1 C.r4<r2<0<r3<r1
B.r4<r2<0<r1<r3 D.r2<r4<0<r1<r3
答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1) 与图(2)中的样本点集中分布在一条直线附近,则 r2<r4<0<r3<r1.故选 A.
5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如
下列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由
K2
=
n(ad-bc)2 (a+b)(c+d)(a+c)(b+d)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§10.2统计及统计案例考纲解读分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.五年高考考点一 抽样方法1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90B.100C.180D.300答案 C2.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6答案 B3.(2015四川,3,5分)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案 C4.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案 D5.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A6.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案187.(2014山东,16,12分)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.解析(1)因为样本容量与总体中的个体数的比是=,所以样本中包含三个地区的个体数量分别是:50×=1,150×=3,100×=2,所以A,B,C三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A,B,C三个地区的样品分别为:A;B1,B2,B3;C1,C2,则抽取的这2件商品构成的所有基本事件为:{A,B1},{A,B2},{A,B3},{A,C1},{A,C2},{B1,B2},{B1,B3},{B1,C1},{B1,C2},{B2,B3},{B2,C1},{B2,C2},{B3,C1},{B3,C2},{C1,C2},共15个. 每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的.记事件D:“抽取的这2件商品来自相同地区”,则事件D包含的基本事件有{B1,B2},{B1,B3},{B2,B3},{C1,C2},共4个.所以P(D)=,即这2件商品来自相同地区的概率为.教师用书专用(8—15)8.(2014重庆,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案 A9.(2014广东,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案 C10.(2013江西,5,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08B.07C.02D.01答案 D11.(2013湖南,3,5分)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9B.10C.12D.13答案 D12.(2015福建,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.答案2513.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.答案 1 80014.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.答案6015.(2013陕西,19,12分)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次.根据年龄将大众评委分为五组,各组的人数如下:(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B组抽取了6人,请将其余各组抽取的人数填入下表;(2)在(1)中,若A,B两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.解析(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:(2)记从A组抽到的3个评委为a1,a2,a3,其中a1,a2支持1号歌手;从B组抽到的6个评委为b1,b2,b3,b4,b5,b6,其中b1,b2支持1号歌手.从{a1,a2,a3}和{b1,b2,b3,b4,b5,b6}中各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a1b1,a1b2,a2b1,a2b2,共4种,故所求概率P==.考点二统计图表1.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A2.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案 D3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D4.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.167答案 C5.(2014山东,8,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18答案 C6.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.B地区用户满意度评分的频数分布表(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大,说明理由.解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.7.(2015安徽,17,12分)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.解析(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有50×0.004×10=2(人),记为B1,B2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=.教师用书专用(8—13)8.(2013山东,10,5分)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A. B. C.36 D.答案 B9.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图.数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.60答案 B10.(2013重庆,6,5分)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()1892122793003A.0.2B.0.4C.0.5D.0.6答案 B11.(2013四川,7,5分)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()答案 A12.(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1 035美元为低收入国家;人均GDP为1 035~ 4 085美元为中等偏下收入国家;人均GDP为4 085~ 12 616美元为中等偏上收入国家;人均GDP不低于12 616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:(1)判断该城市人均GDP是否达到中等偏上收入国家标准;(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.解析(1)设该城市人口总数为a,则该城市人均GDP为(8 000×0.25a+4000×0.30a+6000×0.15a+3000×0.10a+10000×0.20a)=6 400.因为6 400∈[4 085,12 616),所以该城市人均GDP达到了中等偏上收入国家标准.(2)“从5个行政区中随机抽取2个”的所有的基本事件是{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},{C,D},{C,E},{D,E},共10个.设事件“抽到的2个行政区人均GDP都达到中等偏上收入国家标准”为M,则事件M包含的基本事件是{A,C},{A,E},{C,E},共3个,所以所求概率为P(M)=.13.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.解析(1)据题中直方图知组距=10,由(2a+3a+6a+7a+2a)×10=1,解得a==0.005.(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.成绩落在[60,70)中的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率为P=.考点三样本的数字特征1.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B2.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案 A3.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.14.(2016课标全国Ⅰ,19,12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解析(1)当x≤19时,y=3 800;当x>19时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为y=-(x∈N).(4分)(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为(3 800×70+4300×20+4 800×10)=4 000(元).(7分)若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为4 500元,因此这100台机器在购买易损零件上所需费用的平均数为(4 000×90+4500×10)=4 050(元).(10分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解析(1)由频率分布直方图可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.(2014课标Ⅰ,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定? 解析(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.教师用书专用(7—17)7.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:0 8 91 2 5 82 0 03 3 83 1 2则这组数据的中位数是()A.19B.20C.21.5D.23答案 B8.(2014陕西,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.,s2+1002B.+100,s2+1002C.,s2D.+100,s2答案 D9.(2015广东,12,5分)已知样本数据x1,x2,…,x n的均值=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为.答案1110.(2013湖北,12,5分)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则(1)平均命中环数为;(2)命中环数的标准差为.答案(1)7(2)211.(2013辽宁,16,5分)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.答案1012.(2015广东,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×=5(户).13.(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.14.(2014广东,17,13分)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解析(1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.(2)这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数=(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,故方差s2=[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=×(121+12+3+0+4+12+100)=12.6.15.(2014湖南,17,12分)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.解析(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为甲==;方差甲=×--=.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为乙==;方差乙=×--=.因为甲>乙,甲<乙,所以甲组的研发水平优于乙组.(2)记E={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7个,故事件E发生的频率为.将频率视为概率,即得所求概率为P(E)=.16.(2013北京,16,13分)如图是某市3月1日至14日的空气质量指数趋势图.空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染.某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(1)求此人到达当日空气质量优良的概率;(2)求此人在该市停留期间只有1天空气重度污染的概率;(3)由图判断从哪天开始连续三天的空气质量指数方差最大.(结论不要求证明)解析(1)在3月1日至3月13日这13天中,1日、2日、3日、7日、12日、13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是.(2)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”.所以此人在该市停留期间只有1天空气重度污染的概率为.(3)从3月5日开始连续三天的空气质量指数方差最大.17.(2013安徽,17,12分)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为、,估计-的值.解析(1)设甲校高三年级学生总人数为n.由题意知,=0.05,即n=600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-=.(2)设甲、乙两校样本平均数分别为'1、'2,根据样本茎叶图可知,30('1-'2)=30'1-30'2=(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92=2+49-53-77+2+92=15.因此'1-'2=0.5.故-的估计值为0.5分.考点四变量间的相关性1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案 C2.(2014湖北,6,5分)根据如下样本数据得到的回归方程为=bx+a,则()A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>0答案 A3.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得=x i=9.97,s=-=-≈0.212,-≈18.439,(x i-)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(x i,y i)(i=1,2,…,n)的相关系数--.r=--≈0.09.解析(1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数为r=----=-≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.(ii)剔除离群值,即第13个数据,剩下数据的平均数为×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.=16×0.2122+16×9.972≈1 591.134,。