高考导数练习题+统计与统计案例+函数专题
高考数学试题汇编统计、统计案例
![高考数学试题汇编统计、统计案例](https://img.taocdn.com/s3/m/490f65c67f1922791688e836.png)
第五节 统计、统计案例高考试题考点一 抽样的方法1.(2013年新课标全国卷Ⅰ,理3)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) (A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样 (D)系统抽样解析:由于小学、初中、高中三个学段学生的视力情况差异较大,而男女视力情况差异不大,因此可以按学段分层抽样.故选C. 答案:C2.(2013年安徽卷,理5)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) (A)这种抽样方法是一种分层抽样 (B)这种抽样方法是一种系统抽样(C)这五名男生成绩的方差大于这五名女生成绩的方差 (D)该班男生成绩的平均数小于该班女生成绩的平均数解析:本题采用简单随机抽样方法抽取样本,故选项A 、B 错误.因为5名男生成绩和5名女生成绩的平均数,与该班男生成绩的平均数与女生成绩的平均数不一定存在准确的对应关系,所以选项D 的说法不一定成立.对于C 项,男生成绩的平均数1x =90,女生成绩的平均数2x =91,故5名男生成绩的方差21s =15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,5名女生成绩的方差22s =15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6,故选C. 答案:C3.(2013年江西卷,理4)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )(A)08 (B)07 (C)02(D)01解析:从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01. 答案:D考点二 统计图表1.(2013年福建卷,理4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )(A)588 (B)480(C)450 (D)120解析:由题频率分布直方图得,该模块测试成绩不少于60分的学生人数为600×(0.030+0.025+0.015+0.010)×10=480.故选B.答案:B2.(2012年陕西卷,理6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )(A) x甲<x乙,m甲>m乙 (B) x甲<x乙,m甲<m乙(C) x甲>x乙,m甲>m乙 (D) x甲>x乙,m甲<m乙解析:把数据从茎叶图中整理出来,甲的数据为:5,6,8,10,10,14,18,18,22,25,27,30,30,38,41,43;乙的数据为:10,12,18,20,22,23,23,27,31,32,34,34,38,42,43,48,所以x甲=116(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)=34516,x乙=116(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)=45716,显然x甲<x乙.又∵m甲=18222+=20,m乙=27312+=29,所以m甲<m乙.答案:B3.(2013年新课标全国卷Ⅱ,理19)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的数学期望.解:(1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000,当X∈[130,150]时,T=500×130=65000,所以T=80039000,100130, 65000,130150.X XX-⎧⎨⎩≤<≤≤(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点三样本的数字特征1.(2013年重庆卷,理4)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )(A)2,5 (B)5,5(C)5,8 (D)8,8解析:由甲组数据的中位数为15,得x=5.由乙组数据的平均数为16.8,得9+30+5+y+8+24=16.8×5,即76+y=84,解得y=8.故选C.答案:C2.(2012年安徽卷,理5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差解析:甲射击比赛中靶4,5,6,7,8环各1次,则甲成绩的中位数为6环,平均数为6环,极差为4环,方差为2平方环;乙射击比赛中靶5环3次,6环1次,9环1次,则乙成绩的中位数为5环,平均数为6环,极差为4环,方差为2.4平方环.所以甲成绩的方差比乙成绩的方差小.故选C.答案:C3.(2012年江西卷,理9)样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为y(x≠y).若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数z=αx+(1-α)y,其中0<α<12,则n,m的大小关系为( )(A)n<m (B)n>m(C)n=m (D)不能确定解析:依题意得x1+x2+…+x n=n x,y1+y2+…+y m=m y,x1+x2+…+x n+y1+y2+…+y m=(m+n)z=(m+n)αx+(m+n)(1-α) y,所以n x+m y=(m+n)αx+(m+n)(1-α)y,所以()()(),1, n m n am m n a ⎧=+⎪⎨=+-⎪⎩于是有n-m=(m+n)[α-(1-α)]=(m+n)(2α-1).因为0<α<1 2 ,所以2α-1<0.又m+n>0,所以n-m<0.即n<m.故选A.答案:A4.(2011年江苏卷,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= .解析:由于这5个数的平均数x=15×(10+6+8+5+6)=7,因此该组数据的方差s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.2考点四变量的相关性1.(2012年湖南卷,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为ˆy=0.85x-85.71,则下列结论中不正确的是( )(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg(D)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:根据线性回归方程相关知识可知选项A、B、C是正确的.而由回归方程得到的是预报变量的可能取值的平均值,不是预报变量的精确值,故选D.答案:D2.(2011年陕西卷,理9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图所示),以下结论中正确的是( )(A)x和y的相关系数为直线l的斜率(B)x和y的相关系数在0到1之间(C)当n为偶数时,分布在l两侧的样本点的个数一定相同(D)直线l过点(x,y)解析:相关系数是表示两个变量是否具有线性相关关系的量,可正可负也可为0,它的绝对值越接近1两变量相关性越强.因此A、B错,线性回归直线两侧样本点个数不一定相同,故C错.回归直线恒过样本中心(x,y).选项D正确.答案:D3.(2011年江西卷,理6)变量X和Y对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )(A)r2<r1<0 (B)0<r2<r1(C)r2<0<r1(D)r2=r1解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.所以有r2<0<r1.故选C.答案:C4.(2011年山东卷,理7)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程ˆy=b x+ˆa中的b为9.4,据此模型预报广告费用为6万元时销售额为( )(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:线性回归直线过定点(x,y),y=492639544+++=42, x=3.5,代入ˆa=y-ˆb x得ˆa=42-9.4×3.5=9.1,所以ˆy=6×9.4+9.1=65.5(万元).答案:B5.(2011年辽宁卷,理14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:ˆy=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元. 解析:由回归直线方程可知,x每增加1,ˆy增加0.254,从而家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2546.(2011年广东卷,理13)某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.解析:儿子和父亲的身高可列表如下:(单位:cm)父亲身高x173170176儿子身高y170176182设回归直线方程为ˆy=ˆa+ˆb x,由表中数据可求得x=173, y=176,∴ˆb=()()()31321i iiiix x y yx x==---∑∑=()223633⨯+-=1,ˆa=y-ˆb x=3,故回归直线方程为ˆy=x+3.当x=182时, ˆy=182+3=185.故预测他孙子的身高为185 cm.答案:185考点五独立性检验(2012年辽宁卷,理19)电视传媒公司为了解某地区某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女1055总计(2)将上述调查得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中“体育迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).附:χ2=()211221221n n n n nn n n n-++.P(χ2≥k)0.050.01 k 3.841 6.635解:(1)由频率分布直方图可知在抽取的100人中,“体育迷”有25人,从而2×2列联表补充如下:非体育迷体育迷总计男301545女451055总计7525100将2×2列联表中的数据代入公式计算,得χ2=()2 1003010451575254555⨯-⨯⨯⨯⨯=10033≈3.030.因为3.030<3.841,所以没有足够的把握认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B(3, 14),从而X 的分布列为: X 0123P27642764964164所以E(X)=np=3×14=34,D(X)=np(1-p)=3×14×34=916. 模拟试题考点一 抽样方法1.(2013北京市丰台区期末)某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是 .解析:高三的人数为400, 所以在高三抽取的人数为45900×400=20. 答案:202.(2013青岛一中调研)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.解析:因为12=5×2+2,即第三组抽出的是第二个同学, 所以每一组都相应抽出第二个同学. 所以第8组中抽出的号码为5×7+2=37号. 答案:37考点二 统计图表1.(2013云南师大附中检测)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲乙两名运动员这项测试成绩的平均数,s 1,s 2分别表示甲乙两名运动员这项测试成绩的标准差,则有( )(A)1x >2x ,s 1<s 2 (B)1x =2x ,s 1=s 2 (C)1x =2x ,s 1<s 2(D)1x =2x ,s 1>s 2解析:由样本中数据可知1x =15, 2x =15, 由茎叶图得s 1<s 2, 所以选C. 答案:C2.(2013贵州省六校联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为 .解析:19(68+72+73+78×2+81+89×2+92)=7209=80.答案:803.(2013北京市西城区期末)为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70],得到如图所示的频率分布直方图.现采用分层抽样的方法,从第3,4,5组中随机抽取6名学生做初检.(1)求每组抽取的学生人数;(2)若从6名学生中再次随机抽取2名学生进行复检,求这2名学生不在同一组的概率.解:(1)由频率分布直方图知,第3,4,5组的学生人数之比为3∶2∶1.所以,每组抽取的人数分别为:第3组:36×6=3;第4组:26×6=2;第5组:16×6=1.所以从第3,4,5组应依次抽取3名学生,2名学生,1名学生.(2)记“从6名学生中抽取2名学生不在同一组”为事件A,则P(A)=11111131213226C C C C C CC+⋅+⋅=1115.考点三样本的数字特征1.(2012西安五校模拟)已知一组正数x1,x2,x3,x4的方差s2=14(22221234x x x x+++-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为( ) (A)2 (B)3 (C)4 (D)6解析:设x1,x2,x3,x4的平均值为x,则s2=14[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2]=14(22221234x x x x+++-42x),∴42x=16,∴x =2,∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4. 答案:C2.(2013昆明一中检测)某学校想要调查全校同学是否知道迄今为止获得过诺贝尔物理奖的6位华人的姓名,为此出了一份考卷.该卷共有6个单选题,每题答对得20分,答错、不答得零分,满分120分.阅卷完毕后,校方公布每题答对率如下:则此次调查全体同学的平均分数是 分.解析:假设全校人数有x 人,则每道试题答对人数及总分分别为所以六个题的总分为66x,所以平均分为66xx=66. 答案:66考点四 线性回归方程1.(2013青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如下表:显然所减分数y 与模拟考试次数x 之间有较好的线性相关关系,则其线性回归方程为( )(A)y=0.7x+5.25 (B)y=-0.6x+5.25 (C)y=-0.7x+6.25(D)y=-0.7x+5.25解析:由题意可知,所减分数y 与模拟考试次数x之间为负相关,所以排除A. 考试次数的平均数为x =14(1+2+3+4)=2.5, 所减分数的平均数为y =14(4.5+4+3+2.5)=3.5, 即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,故选D. 答案:D2.(2012湘潭三模)某种产品的广告支出x 与销售额y(单位:百万元)之间有如下的对应关系:(1)假定x 与y 之间具有线性相关关系,求回归方程;(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?参考公式: ˆb=1221ni ii nii x ynx y xnx==--∑∑,ˆa=y -ˆb x . 解:(1)∵x =15×(2+4+5+6+8)=5, y =15×(30+40+60+50+70)=50,521ii x=∑=22+42+52+62+82=145,51i ii x y=∑=2×30+4×40+5×60+6×50+8×70=1380,∴ˆb=51522155i ii ii x yx y xx==--∑∑=21380555014555-⨯⨯-⨯=6.5,ˆa=y -ˆb x =50-6.5×5=17.5. ∴回归方程为ˆy=6.5x+17.5. (2)由回归方程得ˆy ≥60,即6.5x+17.5≥60, 解得x ≥8513≈6.54. 故广告支出应该不少于6.54百万元.考点五 独立检验1.(2012枣庄模拟)下面是2×2列联表:则表中a,b 的值分别为( )(A)94,72 (B)52,50 (C)52,74 (D)74,52 解析:∵a+21=73,∴a=52, 又a+22=b,∴b=74. 答案:C2.(2012汕头期末)下列命题中假命题是( )(A)对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越大(B)用相关指数R 2来刻画回归的效果时,R 2的值越大,说明模型拟合的效果越好(C)两个随机变量的相关性越强,相关系数的绝对值越接近1 (D)等高条形图可以展示2×2列联表数据的频率特征解析:K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.答案:A综合检测1.(2011汕头期末)下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:如果根据上表提供的数据求出y 关于x 的线性回归方程为y =0.7x+0.35,那么表中t 的值为( )(A)3 (B)3.15 (C)3.5(D)4.5解析:由y=0.7x+0.35得2.54 4.54t+++=0.7×34564++++0.35,即114t+=3.5,解得t=3.答案:A2.(2011佛山联考)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为30的样本,已知B层中每个个体被抽到的概率都是112,则总体中的个体数为.解析:因为分层抽样为等可能抽样,故每个个体被抽到的可能性都是相等的.设总体中的个体数为n,则30n=112,∴n=360.答案:3603.(2012广州期末)在一次调研中,随机调查了某社区若干居民的年龄,将调查数据绘制成如图所示的扇形和条形统计图,则a-b= .(60以上含60)解析:设共调查了x名居民的年龄,由x·46%=230,得x=500,于是得a=100500×100%=20%,b=1-(20%+46%+22%)=12%.故a-b=8%.答案:8%。
专题03 导数与统计案例-2017-2018学年下学期期末复习备考高二数学(文)备考热点难点突破练 Word版含解析
![专题03 导数与统计案例-2017-2018学年下学期期末复习备考高二数学(文)备考热点难点突破练 Word版含解析](https://img.taocdn.com/s3/m/56d3abfa9b89680203d8256d.png)
专题03 导数与统计案例本专题热点可分3部分,一是导数的几何意义及运算,多以客观题形式考查,难度中等或中等以下,二是导数的应用,客观题、解答题都有考查重点是利用导数研究函数的性质或证明不等式,可以是基础题,也可以是难题,三是统计案例,重点是线性回归分析与独立性检验,难度中等或中等以上.一、热点难点突破例1. 【2018年新课标I卷】设函数.若为奇函数,则曲线在点处的切线方程为A. B. C. D.【答案】D例2. 若函数的图象不经过第三象限,则实数的取值范围是()A. B. C. D.【答案】D【解析】由题得:令,故得函数在单调递增,在单调递减,故要想使函数图像不经过第三象限,故只需故选D.例 3. 已知函数的零点为,,且,那么下列关系一定不成立的是()A. B. C. D.【答案】D【解析】由题可得:定义域为:,令当x>0时>0恒成立,故f(x)在单调递增,又函数的零点为,故为唯一零点,再由,且,可得两种情况:,故A、B正确,或故C正确.例4.【辽宁省葫芦岛市2018年普通高中高三第二次模拟】下列说法:①线性回归方程必过;②命题“”的否定是“”③相关系数越小,表明两个变量相关性越弱;④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是__________.(把你认为正确的结论都写在横线上)本题可参考独立性检验临界值表:【答案】①④例5.【四川省广元市高2018届高三第二次高考适应性统考】某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程,现发现表中有一个数据看不清,请你推断出该数据的值为__________.加工时间【答案】68 【解析】,代入回归直线方程得,解得.例6. 对于函数()y f x =,若其定义域内存在两个不同的实数12,x x , 使得()1i i x f x = ()1,2i =成立,则称函数()f x 具有性质P ,若函数()xe f x a=具有性质P ,则实数a 的取值范围是__________.【答案】1,0e ⎛⎫- ⎪⎝⎭.【解析】若函数()xe f x a =具有性质P ,则()1xf x = 有两个不等实数根代入得()1xe xf x x a=⋅= 即x a x e =⋅在R 上有个两个不等实数根 令()xg x xe =则()()'1xxxg x xe e e x =+=+,令()'0g x =得1x =- ,所以列出函数及其导数的表格如下所示:根据表格,画出如下图所示的函数图像由图像可知, x a x e =⋅在R 上有个两个不等实数根即y a = 与()g x 的图像有两个不同交点,由极小值()11g e-=- 可知 当有两个交点时, a 的取值范围为1,0e ⎛⎫- ⎪⎝⎭.例7. 已知,.(1)证明: ;(2)若时,恒成立,求实数的取值范围.【解析】 (1)设,则,故在上单调递减,在上单调递增.从而.而当时,.(2)设,则,.要求在上恒成立必须有.即.以下证明:当时. 只要证,只要证在上恒成立.令,则对恒成立,又,所以.从而不等式得证.8.【2018年全国卷Ⅲ】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:超过不超过(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:,【解析】(1)第二种生产方式的效率更高.理由如下:(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知.列联表如下:超过不超过(3)由于,所以有99%的把握认为两种生产方式的效率有差异. 9.【2018年全国普通高等学校招生统一考试(全国卷II)】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. 以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 二、方法总结1.导数的几何意义是切点处切线的斜率,应用时主要体现在以下几个方面: (1)已知切点A (x 0,f (x 0))求斜率k ,即求该点处的导数值:k =f ′(x 0). (2)已知斜率k ,求切点A (x 1,f (x 1)),即解方程f ′(x 1)=k .(3)若求过点P (x 0,y 0)的切线方程,可设切点为(x 1,y 1),由⎩⎪⎨⎪⎧y 1=f x 1,y 0-y 1=f x 1x 0-x 1求解即可.(4)函数图象在每一点处的切线斜率的变化情况反映函数图象在相应点处的变化情况,由切线的倾斜程度可以判断出函数图象升降的快慢. 2.确定函数单调区间的步骤 (1)确定函数f (x )的定义域; (2)求f ′(x );(3)解不等式f ′(x )>0,解集在定义域内的部分为单调递增区间; (4)解不等式f ′(x )<0,解集在定义域内的部分为单调递减区间.3.研究含参数的函数的单调性,要依据参数对不等式解集的影响进行分类讨论.划分函数的单调区间时,要在函数定义域内讨论,还要确定导数为0的点和函数的间断点.个别导数为0的点不影响所在区间的单调性,如f (x )=x 3,f ′(x )=3x 2≥0(f ′(x )=0在x =0时取到),f (x )在R 上是增函数. 4.根据函数单调性求参数的一般思路(1)利用集合间的包含关系处理:y =f (x )在(a ,b )上单调,则区间(a ,b )是相应单调区间的子集. (2)f (x )为增函数的充要条件是对任意的x ∈(a ,b )都有f ′(x )≥0且在(a ,b )内的任一非空子区间上f ′(x )不恒为零,应注意此时式子中的等号不能省略,否则漏解. (3)函数在某个区间存在单调区间可转化为不等式有解问题. 5.求函数f (x )极值的步骤 ①确定函数的定义域; ②求导数f ′(x );③解方程f ′(x )=0,求出函数定义域内的所有根;④列表检验f ′(x )在f ′(x )=0的根x 0左右两侧值的符号,如果左正右负,那么f (x )在x 0处取极大值,如果左负右正,那么f (x )在x 0处取极小值.6若函数y =f (x )在区间(a ,b )内有极值,那么y =f (x )在(a ,b )内绝不是单调函数,即在某区间上单调函数没有极值.7.求函数f (x )在[a ,b ]上的最大值和最小值的步骤 (1)求函数在(a ,b )内的极值;(2)求函数在区间端点的函数值f (a ),f (b );(3)将函数f (x )的极值与f (a ),f (b )比较,其中最大的一个为最大值,最小的一个为最小值.求一个函数在闭区间上的最值和在无穷区间(或开区间)上的最值时,方法是不同的.求函数在无穷区间(或开区间)上的最值,不仅要研究其极值情况,还要研究其单调性,并通过单调性和极值情况,画出函数的大致图象,然后借助图象观察得到函数的最值. 8.利用导数证明不等式的方法证明f (x )<g (x ),x ∈(a ,b ),可以构造函数F (x )=f (x )-g (x ),如果F ′(x )<0,则F (x )在(a ,b )上是减函数,同时若F (a )≤0,由减函数的定义可知,x ∈(a ,b )时,有F (x )<0,即证明了f (x )<g (x ). 9.利用导数解决不等式的恒成立问题的策略①首先要构造函数,利用导数研究函数的单调性,求出最值,进而得出相应的含参不等式,从而求出参数的取值范围.②也可分离变量,构造函数,直接把问题转化为函数的最值问题. 10.利用导数研究方程的根(函数的零点)的策略研究方程的根或曲线的交点个数问题,可构造函数,转化为研究函数的零点个数问题.可利用导数研究函数的极值、最值、单调性、变化趋势等,从而画出函数的大致图象,然后根据图象判断函数的零点个数. 11.判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r >0时,正相关;r <0时,负相关.(3)线性回归方程中:b ^>0时,正相关;b ^<0时,负相关. 12.线性回归分析问题的类型及解题方法 (1)求线性回归方程①利用公式,求出回归系数b ^,a ^.②待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b ^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强. 13.(1)比较几个分类变量有关联的可能性大小的方法①通过计算K 2的大小判断:K 2越大,两变量有关联的可能性越大.②通过计算|ad -bc |的大小判断:|ad -bc |越大,两变量有关联的可能性越大. (2)独立性检验的一般步骤 ①根据样本数据制成2×2列联表. ②根据公式K 2=n ad -bc 2a +ba +cb +dc +d计算K 2的观测值k .③比较k与临界值的大小关系,作统计推断.三、精选精练1.【安徽省示范高中培优联盟2017-2018学年高二下学期春季联赛】某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若线性相关,线性回归方程为,估计该制药厂6月份生产甲胶囊产量为()A. 万盒B. 万盒C. 万盒D. 万盒【答案】C【解析】由题意,根据表格中的数据可知:,即样本中心为,代入回归直线,解得,即令,解得万盒,故选C.2.【2017-2018学年山东省济宁市第一中学高二下学期期中】若函数,则不等式的解集为()A. B. C. D.【答案】C3.【2018陕西省咸阳市5月模拟】已知是函数的导函数,且对任意的实数都有(是自然对数的底数),,则()A. B. C. D.【答案】D4.【安徽省江南十校2018届高三二模】的导函数满足:当时,,则()A. B.C. D.【答案】C【解析】令,则,因为当时,,所以当时,即函数在上单调递减,则,即,即.5.【山东省潍坊市2018届高三第三次高考模拟】已知函数,r若由两个极值点,记过点,的直线的斜率为,若,则实数的取值范围为()A. B. C. D.【答案】A【解析】当时,函数的导数为,由函数由两个极值点得,又为奇函数,不妨设,则有,所以可得,由直线的斜率公式可得,又,所以,得所以在上单调递增,又由,由,得,所以,故选A.6.【峨眉山市第七教育发展联盟2018届高考适应性考试】已知函数()()22f x aln x x =+-,在区间(0,1)内任取两个实数,p q ,且p q >,若不等式()()112f p f q p q+-+>-恒成立,则实数的取值范围是( )A. ()12,+∞B. [)12,+∞C. ()24,+∞D. [)24,+∞ 【答案】D【解析】由已知p q >可得()()()112f p f q p q +-+>-()()1122f p f q p q +>++- ()()1212f p p f q q +->+- ()()122122f p p f q q +-->+-- ()()()()121121f p p f q q +-+>+-+令()()2g x f x x =- ,则有()()11g p g q +>+ 因为(),0,1p q ∈ 所以()()11,2,11,2p q +∈+∈ 又因为p q >所以()()2g x f x x =-在()1,2上为单调递增函数()()''22202ag x f x x x =-=--≥+在()1,2上恒成立 即()()222a x x ≥++ 恒成立, 令()()()222h x x x =++231222x ⎛⎫=+- ⎪⎝⎭()h x 在()1,2上为单调递增函数,所以()()max 224h x h ==所以24a ≥ ,即a 的取值范围为[)24,+∞ 所以选D7.【江西省南昌市2018届高三第三次理科数学模拟】下列有关统计知识的四个命题正确的是( ) A. 衡量两变量之间线性相关关系的相关系数越接近,说明两变量间线性关系越密切 B. 在回归分析中,可以用卡方来刻画回归的效果,越大,模型的拟合效果越差 C. 线性回归方程对应的直线至少经过其样本数据点中的一个点D. 线性回归方程中,变量每增加一个单位时,变量平均增加个单位【答案】A【解析】A. 衡量两变量之间线性相关关系的相关系数越接近,说明两变量间线性关系越密切,正确; B. 在回归分析中,可以用卡方来刻画回归的效果,越大,模型的拟合效果越差,错误对分类变量与的随机变量的观测值来说, 越大,“与有关系”可信程度越大; 故B 错误; C. 线性回归方程对应的直线至少经过其样本数据点中的一个点,错误,回归直线可能不经过其样本数据点中的任何一个点; D. 线性回归方程中,变量每增加一个单位时,变量平均增加个单位,错误,由回归方程可知变量每增加一个单位时,变量平均增加个单位.故选A.8.【山东省济宁市第一中学2017-2018学年高二下学期期中】若函数的值域为,则实数的取值范围是__________. 【答案】9.【山东省济宁市第一中学2017-2018学年高二下学期期中】若方程恰有一个实数解,则实数的取值集合为__________.【答案】【解析】令令,有定义域可得f(x)在递减,递增,如图:,故只有一解得:得,故答案为10.已知函数.(1)当时,求曲线在点处的切线方程;(2)若,,求的取值范围.【解析】(1)当时,,所以,所以切线的斜率.又因为,所以切线方程为,整理得.(2)因为函数的定义域是,即为,可化为.设,依题意,.,令,易知它在上是减函数,又因为,所以当时,,,所以在上是增函数;当时,,,所以在上是减函数.所以在处取得极大值,也是最大值,所以,所以.所以的取值范围是.11.已知函数.(1)求函数的单调区间;(2)设,求函数在区间上的最大值.【解析】(1),由,解得;由,解得.所以函数的单调递减区间为,单调递增区间为.(2)由(1)可知:①当时,,在上是增函数,所以此时;②当时,,在处取得极大值,也是它的最大值,所以此时;③当时,在上是减函数,所以此时.综上,函数在区间上的最大值;当时,为;当时,为;当时,为.12.【安徽亳州市涡阳一中2018届高三最后一卷】已知.(1)若,函数在其定义域内是增函数,求的取值范围; (2)当,时,证明:函数只有一个零点;(3)若的图像与轴交于,两点,中点为,求证:.【解析】(1)依题意:∵ 在上递增, ∴对恒成立即对恒成立, ∴ 只需∵,∴, 当且仅当时取“=”,∴,∴ 的取值范围为 (2)当,时,,其定义域是,∴ ,∵ ,∴时,;当时,∴ 函数在区间上单调递增,在区间上单调递减∴ 当时,函数取得最大值,其值为当时,,即∴ 函数只有一个零点(3)由已知得两式相减,得,由及,得令,,∵,∴ 在上递减, ∴∵,∴13.【陕西省咸阳市2018年高考5月信息专递】已知函数(Ⅰ)当时,求函数在点处的切线方程;(Ⅱ)当时,求证:对任意的恒成立. 【解析】(Ⅰ)由得,切点为,斜率为, 所求切线方程为:,即;(Ⅱ)证明:当时,欲证:,注意到,只要即可,令,则知在上递增,有,所以可知在上递增,于是有综上,当时,对任意的恒成立.14.【四省2018届高三第三次大联考】设函数. (1)当时,求的单调区间;(2)若对任意恒成立,求实数的取值范围;(3)当时,试比较与的大小,并说明理由.(2),由(1)可知在区间上单调递增,则,即在区间上单调递增,且,①当时,,在区间上单调递增,∴满足条件;②当时,设,则,∴在区间上单调递增,且,,∴使得,∴当时,,单调递减,即时,,不满足题意.综合上述,实数的取值范围为.(3)由(2)可知,取,当时,,即,当时,,∴, 又∵,∴当时,;当时,;当时,,.15.【峨眉山市第七教育发展联盟2018届高考适应性考试】已知函数()()2x xf x e sinx ax a e =-+-,其中2.71828...a R e ∈=,为自然对数的底数.(1)当0a =时,讨论函数()f x 的单调性; (2)当112a ≤≤时,求证:对任意的[)()0,,0x f x ∈+∞<. 【解析】(1) ()()0,xa f x e sinx e ==-()()'04f x ex sinx cosx e ex x e π⎤⎛⎫=+-=+-< ⎪⎥⎝⎭⎦;∴()f x 在(),-∞+∞上单调递减 (2)要证()220xesinx ax a e -+-<对[)0,x ∈+∞恒成立即证; 220sinx ax a e -+-<对[)0,x ∈+∞恒成立 令()()22g a x a sinx e =-+-,即证当1,12a ⎡⎤∈⎢⎥⎣⎦时, ()()220g a x a sinx e =-+-<恒成立即证; ()()()221110122{ 1202g sinx x e g sinx x e ⎛⎫=-+-< ⎪⎝⎭=-+-<成立∵sin 1x e +< ∴①式成立 现证明②式成立:令()()22,'2h x sinx x e h x cosx x =-+-=-设在[)00,x ∃+∞,使得()00'2,0h x cosx x --=,则006x π<<()h x 在()00,x 単调递增, 在[)0,x +∞単调递減∴()()220000cos 2sin 24x h x max h x sinx x e x e ==-+-=-+-, =200sin 7sin 44x x x e ++- ∵006x π<<,∴01sin 0,2x ⎛⎫∈ ⎪⎝⎭∴200sin 737sin 04416x x x e e ++-<-< 综上所述.在[)0,x ∈+∞, ()0f x <恒成立.16.【四川省绵阳市南山中学2017-2018学年高二下学期期中】已知(1)求曲线在点出的切线方程;(2)设函数,若不等式对恒成立,求实数的取值范围.【解析】(1)由题知:,则, ∴曲线在点处切线的斜率为所以,切线方程为,即.(2)由题知:,即,令,则,令解得,∴在单增;单减, 又∵有唯一零点所以,可作出函数的示意图,要满足对恒成立,只需解得.即实数的取值范围是法二:令,则,令,则,令,则,∴在单增,单减;,故对恒成立.∴在单减,又∵对恒成立,令得∴,无论在有无零点,∴在上的最小值只可能为或,要恒成立,∴且,∴.即实数的取值范围是17. 【山西省运城市康杰中学2018届高三高考模拟(一)】某高三理科班共有60名同学参加某次考试,从中随机挑选出5名同学,他们的数学成绩与物理成绩如下表:数学成绩物理成绩数据表明与之间有较强的线性关系.(I)求关于的线性回归方程;(II)该班一名同学的数学成绩为110分,利用(I)中的回归方程,估计该同学的物理成绩;(III)本次考试中,规定数学成绩达到125分为优秀,物理成绩达到100分为优秀. 若该班数学优秀率与物理优秀率分别为50%和60%,且除去抽走的5名同学外,剩下的同学中数学优秀但物理不优秀的同学共有5人,在答卷页上填写下面2×2列联表,判断能否在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关?参考数据:回归直线的系数,,【解析】(II)将代入上述方程,得.(III)由题意可知,该班数学优秀人数及物理优秀人数分别为30,36.抽出的5人中,数学优秀但物理不优秀的共1人,故全班数学优秀但物理不优秀的人共6人.于是可以得到列联表为:于是,因此在犯错误概率不超过0.01的前提下,可以认为数学优秀与物理优秀有关.。
(完整版)高三复习高中数学统计案例习题(有详细答案)
![(完整版)高三复习高中数学统计案例习题(有详细答案)](https://img.taocdn.com/s3/m/740b0dec0b1c59eef8c7b4b3.png)
2015年高三复习高中数学统计案例习题(有详细答案)一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.363.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,324.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.80005.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.2006.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.287.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.6710.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.12011.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.4512.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.6013.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.1815.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.19.下表是某单位在2013年1﹣5月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 5用水量y 4.5 4 3 2.5 1.8(Ⅰ)若由线性回归方程得到的预测数据与实际检验数据的误差不超过0.05,视为“预测可靠”,通过公式得,那么由该单位前4个月的数据中所得到的线性回归方程预测5月份的用水量是否可靠?说明理由;(Ⅱ)从这5个月中任取2个月的用水量,求所取2个月的用水量之和小于7(单位:百吨)的概率.参考公式:回归直线方程是:,.20.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分为150分),将成绩按如下方式分成六组,第一组[90,100)、第二组[100,110)…,第六组[140,150],如图为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.(Ⅰ)求第四和第五组频率,并补全频率分布直方图;(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面2×2列联表(即填写空格处的数据),并判断是否有99%的把握认为“进入决赛的同学成为种子选手与专家培训有关”.[120,140)[140,150]合计参加培训8 8未参加培训合计 4附:K2=P(K2≥k0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001K0 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82821.为了了解某中学高二女生的身高情况,该校对高二女生的身高进行了一次随机抽样测量,所得数据整理后列出了频率分布表如下:(单位:cm)(1)表中m、n、M、N所表示的数分别是多少?(2)绘制频率分布直方图;(3)估计该校女生身高小于162.5cm的百分比.22.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求x值;(2)(理科)从成绩不低于80分的学生中随机的选取2人,该2人中成绩在90以上(含90分)的人数记为ξ,求ξ的概率分布列及数学期望Eξ.(文)从从成绩不低于80分的学生中随机的选取3人,该3人中至少有2人成绩在90以上(含90分)的概率.23.某网站针对2014年中国好声音歌手A,B,C三人进行网上投票,结果如下观众年龄支持A 支持B 支持C20岁以下200 400 80020岁以上(含20岁)100 100 400(1)在所有参与该活动的人中,用分层抽样的方法抽取n人,其中有6人支持A,求n的值.(2)在支持C的人中,用分层抽样的方法抽取6人作为一个总体,从这6人中任意选取2人,求恰有1人在20岁以下的概率.24.某校100名学生期中考试数学成绩的频率分布直方图如图,其中成绩分组区间如下:组号第一组第二组第三组第四组第五组分组[50,60)[60,70)[70,80)[80,90)[90,100](Ⅰ)求图中a的值;(Ⅱ)根据频率分布直方图,估计这100名学生期中考试数学成绩的平均分;(Ⅲ)现用分层抽样的方法从第3、4、5组中随机抽取6名学生,将该样本看成一个总体,从中随机抽取2名,求其中恰有1人的分数不低于90分的概率?25.从某实验中,得到一组样本容量为60的数据,分组情况如下:(Ⅰ)求出表中m,a的值;分组5~15 15~25 25~35 35~45频数 6 2l m频率 a 0.05(Ⅱ)估计这组数据的平均数.26.某校高三文科分为四个班.高三数学调研测试后,随机地在各班抽取部分学生进行测试成绩统计,各班被抽取的学生人数恰好成等差数列,人数最少的班被抽取了22人.抽取出来的所有学生的测试成绩统计结果的频率分布条形图如图所示,其中120~130(包括120分但不包括130分)的频率为0.05,此分数段的人数为5人.(1)问各班被抽取的学生人数各为多少人?(2)求平均成绩;(3)在抽取的所有学生中,任取一名学生,求分数不小于90分的概率.27.在参加世界杯足球赛的32支球队中,随机抽取20名队员,调查其年龄为25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.(1)填写下面的频率分布表(2)并画出频率分布直方图.(3)据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?分组频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计28.如图是调查某地某公司1000名员工的月收入后制作的直方图.(1)求该公司员工的月平均收入及员工月收入的中位数;(2)在收入为1000至1500元和收入为3500至4000元的员工中用分层抽样的方法抽取一个容量15的样本,员工甲、乙的月收入分别为1200元、3800元,求甲乙同时被抽到的概率.29.某市为了解全市居民日常用水量的分布情况,现采用抽样调查的方式,获得了n位居民某年的月均用水量(单位:t),样本统计结果如图表:(Ⅰ)分别求出x,n,y的值;(Ⅱ)若从样本中月均用水量在[5,6]内的5位居民a,b,c,d,e中任选2人作进一步的调查研究,求居民a被选中的概率.分组频数频率[0,1)25 y[1,2)0.19[2,3)50 x[3,4)0.23[4,5)0.18[5,6] 530.为了分析某次考试数学成绩情况,用简单随机抽样从某班中抽取25名学生的成绩(百分制)作为样本,得到频率分布表如下:分数[50,60)[60,70)[70,80)[80,90)[90,100]频数2 3 9 a 1频率0.08 0.12 0.36 b 0.04(Ⅰ)求样本频率分布表中a,b的值,并根据上述频率分布表,在下表中作出样本频率分布直方图;(Ⅱ)计算这25名学生的平均数及方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)从成绩在[50,70)的学生中任选2人,求至少有1人的成绩在[60,70)中的概率.参考答案与试题解析一.选择题(共15小题)1.(2014•四川模拟)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单的随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样考点:分层抽样方法.专题:阅读型.分析:若总体由差异明显的几部分组成时,经常采用分层抽样的方法进行抽样解答:解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理.故选C.点评:本小题考查抽样方法,主要考查抽样方法,属基本题.2.(2014•湖北模拟)某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福广东的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次被抽取的总户数为()A.20 B.24 C.30 D.36考点:分层抽样方法.专题:计算题.分析:根据社区里的高收入家庭户和高收入家庭户要抽取的户数,得到每个个体被抽到的概率,用求到的概率乘以低收入家庭户的户数,得到结果.解答:解:∵区现有480个住户,高收入家庭120户,抽取了6户∴每个个体被抽到的概率是∴该社区本次被抽取的总户数为=24,故选B.点评:本题考查分层抽样方法,这种题目类型是高考题目中一定会出现的题目,运算量不大,是一个必得分题目.3.(2014•湖南一模)从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,8,16,32考点:系统抽样方法.专题:计算题.分析:由系统抽样的特点知,将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,这时间隔一般为总体的个数除以样本容量.从所给的四个选项中可以看出间隔相等且组距为10的一组数据是由系统抽样得到的.解答:解:从50枚某型导弹中随机抽取5枚,采用系统抽样间隔应为=10,只有B答案中导弹的编号间隔为10,故选B.点评:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本.4.(2014•锦州一模)为了研究一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出的样本频率分布直方图如图,那么在这片树木中底部周长大于100cm的株树大约中()A.3000 B.6000 C.7000 D.8000考点:频率分布直方图.专题:概率与统计.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的面积等于这一组的频率.底部周长小于100cm的矩形的面积求和乘以样本容量即可.解答:解:由图可知:底部周长小于100cm段的频率为(0.01+0.02)×10=0.3,则底部周长大于100cm的段的频率为1﹣0.3=0.7那么在这片树木中底部周长大于100cm的株树大约10000×0.7=7000人.故选C.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.5.(2014•许昌二模)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100 B.120 C.150 D.200考点:频率分布直方图.专题:概率与统计.分析:根据直方图中的各个矩形的面积代表了频率,各个矩形面积之和为1,求出小长方形面积最大的一组的频率,再根据频数=频率×样本容量,求出频数即可.解答:解:∵直方图中的各个矩形的面积代表了频率,这5个小方形的面积由小到大构成等差数列{a n},a2=2a1,∴d=a1,a3=3a1,a4=4a1,a5=5a1根据各个矩形面积之和为1,则a1+a2+a3+a4+a5=15a1=1∴a1=,小长方形面积最大的一组的频率为a5=5×=根据频率=可求出频数=300×=100故选:A.点评:本题考查了频率、频数的应用问题,各小组频数之和等于样本容量,各小组频率之和等于1.6.(2014•云南模拟)已知一组数据如图所示,则这组数据的中位数是()A.27.5 B.28.5 C.27 D.28考点:众数、中位数、平均数.专题:概率与统计.分析:利用中位数的定义即可得出.解答:解:这组数据为16,17,19,22,25,27,28,30,30,32,36,40的中位数是=27.5.故选:A.点评:本题考查了中位数的定义及其计算方法,属于基础题.7.(2014•青浦区三模)已知图1、图2分别表示A、B两城市某月1日至6日当天最低气温的数据折线图(其中横轴n表示日期,纵轴x表示气温),记A、B两城市这6天的最低气温平均数分别为和,标准差分别为s A和s B,则它们的大小关系是()A.>,sA>s B B.>,sA<s BC.<,sA<s BD.<,sA>s B考点:众数、中位数、平均数.专题:概率与统计.分析:本题可以由折线图上的数据做出两个城市的平均气温和方差,也可以根据两个折线图的高低和变化的趋势即波动的大小,得到结果.解答:解:由折线图可知A市的平均气温是,B市的平均气温是=11.7,由折线图也可以看出B市的气温较高,可以看出B市的气温的变化不大,方差较小;故选D.点评:本题考查了折线图以及平均数和方差的求法;求两组数据的平均值和方差是研究数据常做的两件事,平均值反映数据的平均水平,而方差反映数据的波动大小,从两个方面可以准确的把握数据的情况.8.(2014•天门模拟)如图是根据变量x,y的观测数据(x i,y i)(i=1,2,…10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是()A.①②B.①④C.②③D.③④考点:散点图.专题:计算题.分析:通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.解答:解:由题图③可知,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,由题图④可知,u随v的增大而增大,各点整体呈上升趋势,u与v正相关.故选D.点评:本题考查散点图,是通过读图来解决问题,考查读图能力,粗略的反应两个变量之间的关系,是不是线性相关,是正相关还是负相关.9.(2014•邯郸二模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程,利用下表中数据推断a的值为()零件数x(个)10 20 30 40 50加工时间y(min)62 a 75 81 89A.68.2 B.68 C.69 D.67考点:线性回归方程.专题:计算题;概率与统计.分析:由题意,将20代入可得68.2,故可能值为68.解答:解:由题意,y=0.68×20+54.6=68.2,又由表可知加工时间y(min)都是以整数记,故a可能为68,故选B.点评:本题考查了线性回归方程的应用及数学问题与实际问题的转化,属于基础题.10.(2013•福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480 C.450 D.120考点:频率分布直方图.专题:图表型.分析:根据频率分布直方图,成绩不低于60分的频率,然后根据频数=频率×总数可求出所求.解答:解:根据频率分布直方图,成绩不低于60(分)的频率为1﹣10×(0.005+0.015)=0.8.由于该校高一年级共有学生600人,利用样本估计总体的思想,可估计该校高一年级模块测试成绩不低于60(分)的人数为600×0.8=480人.故选B.点评:本小题主要考查频率、频数、统计和概率等知识,考查数形结合、化归与转化的数学思想方法,以及运算求解能力.11.(2013•陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45考点:频率分布直方图.分析:在频率分布表中,频数的和等于样本容量,频率的和等于1,小矩形的面积等于这一组的频率,则所以面积和为1,建立等量关系即可求得长度在[25,30)内的频率即得.解答:解:设长度在[25,30)内的频率为a,根据频率分布直方图得:a+5×0.02+5×0.06+5×0.03=1⇒a=0.45.则根据频率分布直方图估计从该批产品中随机抽取一件,则其为二等品的概率为0.45.故选D.点评:本小题主要考查样本的频率分布直方图的知识和分析问题以及解决问题的能力.统计初步在近两年高考中每年都以小题的形式出现,基本上是低起点题.12.(2013•辽宁)某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60考点:频率分布直方图.专题:概率与统计.分析:由已知中的频率分布直方图,我们可以求出成绩低于60分的频率,结合已知中的低于60分的人数是15人,结合频数=频率×总体容量,即可得到总体容量.解答:解:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,则该班的学生人数是=50.故选B.点评:本题考查的知识点是频率分布直方图,结合已知中的频率分布直方图,结合频率=矩形的高×组距,求出满足条件的事件发生的频率是解答本题的关键.13.(2012•成都一模)某小区有125户高收入家庭、280户中等收入家庭、95户低收人家庭.现采用分层抽样的方法从中抽取100户,对这些家庭社会购买力的某项指标进行调查,则中等收入家庭中应抽选出的户数为()A.70 户B.17 户C.56 户D.25 户考点:分层抽样方法.专题:概率与统计.分析:由分层抽样的计算方法:中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得出答案.解答:解:由已知可得中等收入家庭中应抽选出的户数==56.故选C.点评:本题考查了分层抽样,掌握分层抽样的计算方法是解决问题的关键.14.(2012•泸州一模)某校高三680名学生(其中男生360名、女生320名)在学术报告厅听了应考心理讲座,为了解有关情况,学校用分层抽样的方法抽取了一个样本,已知该样本中的女生人数为16名,那么该样本中的男生人数为()A.15 B.16 C.17 D.18考点:分层抽样方法.专题:计算题.分析:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,由此解得x 的值.解答:解:设该样本中的男生人数为x,则由分层抽样的定义和方法可得=,解得x=18,故选D.点评:本题主要考查分层抽样的定义和方法,利用了总体中各层的个体数之比等于样本中对应各层的样本数之比,属于基础题.15.(2012•绵阳二模)要从60人中抽取6人进行身体健康检查,现釆用分层抽样方法进行抽取,若这60人中老年人和中年人分别是40人,20人,则老年人中被抽取到参加健康检查的人数是()A.2人B.3人C.4人D.5人考点:分层抽样方法.专题:计算题.分析:先求出每个个体被抽到的概率,用该层的个体数乘以每个个体被抽到的概率,就等于该层应抽取的个体数.解答:解:每个个体被抽到的概率等于=,老年人中被抽取到参加健康检查的人数是40×=4,故选C.点评:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.二.解答题(共15小题)16.为了了解学生的身体发育情况,某校对年满16周岁的60名男生的身高进行测量,其结果如下:身高(m)1.57 1.59 1.60 1.62 1.63 1.64 1.65 1.66 1.68人数 2 1 4 2 3 4 2 7 6身高(m)1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77人数8 7 4 3 2 1 2 1 1(1)根据上表,估计这所学校,年满16周岁的男生中,身高不低于1.65m且不高于1.71m的约占多少?不低于1.63m 的约占多少?(2)将测量数据分布6组,画出样本频率分布直方图;(3)根据图形说出该校年满16周岁的男生在哪一范围内的人数所占的比例最大?如果年满16周岁的男生有360人,那么在这个范围的人数估计约有多少人?考点:频率分布直方图;频率分布表.专题:概率与统计.分析:(1)根据上表求出身高不低于1.65m且不高于1.71m的频率与不低于1.63m的频率;(2)将测量数据分组,求频数与频率,列出频率分布表,画出频率分布直方图;(3)根据图形得出正确的结论以及估计结果.解答:解:(1)根据上表得,身高不低于1.65m且不高于1.71m的频率是=≈0.567,∴约占总体的56.7%;不低于1.63m的频率是1﹣=1﹣0.15=0.85,约占总体的85%;(2)将测量数据分布6组,∴=0.033,∴组距是0.04,计算频数与频率,列出频率分布表,如下;分组频数频率156.5﹣160.5 7 0.11160.5﹣164.5 9 0.15164.5﹣168.5 15 0.25168.5﹣172.5 22 0.37172.5﹣176.5 6 0.10176.5﹣180.5 1 0.02合计60 1.00画出样本频率分布直方图,如图所示;(3)根据图形知,该校年满16周岁的男生在168.5﹣172.5内的人数所占的比例最大,如果年满16周岁的男生有360人,那么在这个范围的人数估计约为360×0.37=133人.点评:本题考查了频率分布直方图的应用问题,也考查了列表和画图的能力,解题时应根据图中数据进行有关的计算,是基础题.17.改革开放以来,我国高等教育事业有了突飞猛进的发展,有人记录了某村2001到2005年五年间每年考入大学的人数,为了方便计算,2001年编号为1,2002年编号为2,…,2005年编号为5,数据如下:年份(x) 1 2 3 4 5人数(y) 3 5 8 11 13求y关于x的回归方程=x+所表示的直线必经的点.考点:回归分析的初步应用.专题:计算题;概率与统计.分析:求平均值,回归直线必过样本点的中心.解答:解:==3,==8,故回归方程=x+所表示的直线必经过点(3,8).点评:本题考查了回归分析,回归直线必过样本点的中心,同时考查了平均数的求法,属于基础题.18.甲、乙两位同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取4次,绘制成茎叶图如图:甲乙9 7 78 1 2 8 535(Ⅰ)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.考点:茎叶图;众数、中位数、平均数;极差、方差与标准差.专题:概率与统计.分析:(I)由茎叶图知甲乙两同学的成绩分别为:甲:82 81 79 88 乙:85 77 83 85.利用“列举法”及其古典概型的概率计算公式即可得出.(II)分别计算出甲乙的平均成绩及其方差即可得出.。
高中数学:统计与统计案例练习
![高中数学:统计与统计案例练习](https://img.taocdn.com/s3/m/4e5cd3d232d4b14e852458fb770bf78a65293a85.png)
高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。
高考数学二轮总复习专题训练十六 统计、统计案例 理
![高考数学二轮总复习专题训练十六 统计、统计案例 理](https://img.taocdn.com/s3/m/692bfda7dd3383c4bb4cd256.png)
高考专题训练十六 统计、统计案例班级_______ 姓名_______ 时间:45分钟 分值:75分 总得分________一、选择题:本大题共6小题,每小题5分,共30分.在每小题给出的四个选项中,选出符合题目要求的一项填在答题卡上.1.(2011·湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:K 2=n a +b c +d a +c b +d 算得,K 2=110×40×30-20×20260×50×60×50=7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析:∵K 2=7.8>6.635,而P (K 2≥6.635)=0.010,∴有99%以上的把握认为“爱好该运动与性别有关”.答案:C2.(2011·江西)变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1解析:作出x ,y 对应散点图可知y 与x 正相关, ∴r 1>0.作出U ,V 对应散点图可知U 与V 负相关, ∴r 2<0.∴r 2<0<r 1. 答案:C3.(2011·安徽“江南十校”联考)已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+,x 4+2的平均数为( )A .2B .3C .4D .6解析:∵s 2=14(x 21+x 22+x 23+x 24-16)=14[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2],∴2x (x 1+x 2+x 3+x 4)-4x 2=16,∴8x 2-4x 2=16,x =2,即x 1+x 2+x 3+x 4=8,∴x 1+2+x 2+2+x 3+2+x 4+24=4.故选C.答案:C4.(2011·邹城一中模拟)在2011年12月12日那天,济宁市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:y ^=-3.2x +a ,则a =( )A .24B .35.6C .40.5D .40解析:可解得样本中心为(10,8),代入回归方程可得a =40. 答案:D5.(2011·哈师大附中、东北师大附中、辽宁省实验中学高三第一次联合模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( ) A .0 B .1 C .2 D .3本题可以参考独立性检验临界值表:映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确.故选B.答案:B6.甲、乙两名运动员的5次测试成绩如下图所示设s 1,s 2分别表示甲、乙两名运动员测试成绩的标准差,x 1,x 2分别表示甲、乙两名运动员测试成绩的平均数,则有( )A.x 1=x 2,s 1<s 2B.x 1=x 2,s 1>s 2C.x 1>x 2,s 1>s 2D.x 1=x 2,s 1=s 2解析:x 1=15(17+15+22+28+28)=22,x 2=15(16+18+23+26+27)=22,s 21=15(25+49+0+36+36)=29.2,s 22=15(36+16+1+9+25)=17.4,故选B.答案:B二、填空题:本大题共4小题,每小题5分,共20分,把答案填在题中横线上. 7.(2011·天津)一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:由题意知,这支田径队共有84人,从中抽取21人,抽样比为2184=14.所以从男运动员中应抽取14×48=12人.答案:128.(2011·广东)某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别为173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.解析:记从爷爷起向下各代依次为1,2,3,4,5用变量x 表示,其中5代表孙子. 各代人身高为变量x ,则有计算知x =2.5,y =175.25b ^=∑4i =1x i -x y i -y ∑4i =1x i -x 2=278+218+38+81894+14+14+94=3.3,a ^=y -b ^x =175.25-3.3×2.5=167∴回归方程为y ^=3.3x +167当x =5时,y =3.3×5+167=183.5. 答案:183.59.(2011·济宁市高三模拟)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:附:K 2=n ad -bc 2a +bc +d a +c b +d答案:99.5%10.(2011·南京市高三第一次模拟考试)某校为了解高三男生的身体状况,检测了全部480名高三男生的体重(单位:kg),所得数据都在区间[50,75]中,其频率分布直方图如图所示.若图中从左到右的前3个小组的频率之比为1:2:3,则体重小于60 kg 的高三男生人数为________.解析:依题意得,后两个小组的频率之和等于(0.0125+0.0375)×5=0.25,因此前三个小组的频率之和等于1-0.25=0.75,前两个小组的频率之和等于1+21+2+3×34=38,所以体重小于60 kg 的高三男生人数为480×38=180.答案:180三、解答题:本大题共2小题,共25分.解答应写出文字说明、证明过程或演算步骤. 11.(12分)(2011·北京) 以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y 的分布列和数学期望.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n为平均数)解:(1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10.所以平均数为x =8+8+9+104=354方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542=1116. (2)当X =9时,由茎叶图可知,甲组同学的植树棵数是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10,分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14;P (Y =19)=14;P (Y =20)=14;P (Y =21)=18.所以随机变量Y 的分布列为:E (Y )=17×P (Y +21×P (Y =21)=17×18+18×14+19×14+20×14+21×18=19.12.(13分)2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位:人).表1只羊进行了检测,并将有关数据整理为不完整的2×2列联表(表2).表2参考公式:①K 2=a +b c +d a +c b +d ;②χ2=11221221n 1++n 2++n +1+n +2.(1)求研究小组的总人数;(2)写出表2中A 、B 、C 、D 、E 的值,并判断有多大的把握认为羊受到高度辐射与身体不健康有关;(3)若从研究团队的心理专家和核专家中随机选2人撰写研究报告,求其中恰有1人为心理专家的概率.解:(1)依题意,726=48y =24x ,解得y =4,x =2.研究团队的总人数为2+4+6=12(人).(2)根据列联表特点得A =20,B =50,C =80,D =30,E =110. 可求得K 2=110×30×10-50×20250×60×80×30≈7.486>6.635.由临界值表知,有99%的把握认为羊受到高度辐射与身体不健康有关.(3)设研究小组中心理专家为a 1、a 2,核专家为b 1、b 2、b 3、b 4,从中随机选2人,不同的选取结果有:a 1a 2、a 1b 1、a 1b 2、a 1b 3、a 1b 4、a 2b 1、a 2b 2、a 2b 3、a 2b 4、b 1b 2、b 1b 3、b 2b 3、b 1b 4、b 2b 4、b 3b 4,共15种.其中恰好有1人来自心理专家的结果有:a 1b 1、a 1b 2、a 1b 3、a 1b 4、a 2b 1、a 2b 2、a 2b 3、a 2b 4共8种.所以恰好有1人来自心理专家的概率为P =815.。
高中数学【统计与统计案例】专题练习
![高中数学【统计与统计案例】专题练习](https://img.taocdn.com/s3/m/fe6344f89f3143323968011ca300a6c30c22f171.png)
高中数学【统计与统计案例】专题练习1.(多选)下列统计量中,能度量样本x 1,x 2,…,x n 的离散程度的是( ) A.样本x 1,x 2,…,x n 的标准差 B.样本x 1,x 2,…,x n 的中位数 C.样本x 1,x 2,…,x n 的极差 D.样本x 1,x 2,…,x n 的平均数 答案 AC解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.2.某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下: 旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x -和y -,样本方差分别记为s 21和s 22. (1)求x -,y -,s 21,s 22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y --x -≥2s 21+s 2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解 (1)x -=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y -=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s 21=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s 22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04. (2)由(1)知,y --x -=0.3; 2s 21+s 2210=20.036+0.0410=20.007 6.又(y --x -)2=0.09>(20.007 6)2=0.030 4,则y --x ->2s 21+s 2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.3.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i =1x i =60,∑20i =1y i =1 200,∑20i =1(x i -x -)2=80,∑20i =1(y i-y -)2=9 000,∑20i =1(x i -x -)(y i -y -)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =∑ni =1 (x i -x -)(y i -y -)∑n i =1(x i -x -)2∑n i =1 (y i -y -)2,2≈1.414.解 (1)由已知得样本平均数y -=120∑20i =1y i =60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(x i ,y i )(i =1,2,…,20)的相关系数r =∑20i =1 (x i -x -)(y i -y -)∑20i =1(x i -x -)2∑20i =1(y i -y -)2=80080×9 000=223≈0.94.(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.1.抽样方法抽样方法包括简单随机抽样、分层随机抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的五个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数. (3)平均数:样本数据的算术平均数,即x -=1n (x 1+x 2+…+x n ).(4)第p 百分位数:将一组数据(共n 个)按从小到大排列,计算i =n ×p %,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.(5)方差与标准差.s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],s =1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.频率分布直方图的两个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^=b ^x +a ^经过样本点的中心(x -,y -),若x 取某一个值代入回归直线方程y ^=b ^x +a ^中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:X Y 合计 y 1 y 2 x 1 a b a +b x 2 c d c +d 合计a +cb +dn则χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 用样本估计总体考向1 数字特征与统计图表的应用【例1】 (1)空气质量指数分为六级,指数越大说明污染的情况越严重,对人体危害越大,其中指数范围[0,50],[51,100],[101,150],[151,200],[201,300]分别对应“优”“良”“轻度污染”“中度污染”“重度污染”五个等级.如图是某市连续14天的空气质量指数趋势图,下列说法不正确的是( )A.这14天中有4天空气质量为“良”B.这14天中空气质量指数的中位数是103C.从2日到5日空气质量越来越差D.连续三天中空气质量指数方差最小的是9日到11日(2)2020年我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层随机抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为()A.2 750,200B.2 750,110C.1 120,110D.1 120,200答案(1)B(2)C解析(1)在这14天中,1日、3日、12日、13日的空气质量为良,共4天,故A正确.14天中空气质量指数的中位数为86+1212=103.5,故B错误.从2日到5日,空气质量指数越来越高,故空气质量越来越差,C正确.观察题图可得,9日至11日空气质量指数偏差最小,因此方差最小,D正确.综上知,说法不正确的是B.(2)学生总数为15 500+5 000+7 500=28 000(人),由于抽取4%的学生进行调查,则抽取的样本容量为28 000×4%=1 120.故高中生应抽取的人数为5 000×4%=200,而抽取的高中生中参与“家务劳动”的比率为0.55,故抽取的高中生中参与“家务劳动”的人数为200×0.55=110.探究提高 1.解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.2.进行分层随机抽样的相关计算时,常用到的两个关系:(1)样本容量n总体的个数N=该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.【训练1】(1)以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5(2)(多选) 2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是()A.这2 000头生猪体重的众数为160 kgB.这2 000头生猪中体重不低于200 kg的有80头C.这2 000头生猪体重的中位数落在区间[140,160)内D.这2 000头生猪体重的平均数为152.8 kg答案(1)B(2)BCD解析(1)把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.(2)由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,A错误;这2 000头生猪中体重不低于200 kg的有0.002×20×2 000=80(头),B正确;因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,C正确;这2 000头生猪体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),D正确.考向2用样本的频率分布估计总体分布【例2】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(多选)为了更好地支持中小型企业的发展,某市决定对部分企业的税收进行适当的减免,现调查了当地100家中小型企业年收入(单位:万元)情况,并根据所得数据画出了如图所示的频率分布直方图,则下列结论正确的是()A.样本在区间[500,700]内的频数为18B.如果规定年收入在300万元以内的企业才能享受减免税收政策,估计有30%的当地中小型企业能享受到减免税收政策C.样本的中位数大于350万元D.可估计当地中小型企业年收入的平均数超过400万元(同一组中的数据用该组区间的中点值作代表)答案ABC解析依题意,(0.001+0.002+0.002 6×2+a+0.000 4)×100=1,所以a=0.001 4.对于A,样本在[500,700]内的频率为(0.001 4+0.000 4)×100=0.18,故频数为0.18×100=18,故A正确.对于B,年收入在300万元以内的频率为(0.001+0.002)×100=0.3,故B正确. 对于C,设样本的中位数为x,易知中位数位于[300,400]内,则0.3+(x-300)×0.002 6=0.5,解得x≈376.9,376.9>350,故C正确.因为样本的平均数为150×0.1+250×0.2+350×0.26+450×0.26+550×0.14+650×0.04=376<400,所以估计当地中小型企业年收入的平均数小于400万元,故D 错误. 热点二 回归分析【例3】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据进行了初步处理,得到如图所示散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.65636.8289.8 1.61 469108.8表中w i =x i ,w -=18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个更适宜作为年销售量y 关于年宣传费x 的回归方程?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑ni =1(u i -u -)(v i -v -)∑n i =1(u i -u -)2,α^=v --β^u -.解 (1)由散点图可以判断,y =c +d x 更适宜作为年销售量y 关于年宣传费x 的回归方程.(2)易知w =x ,则y ^=d ^w +c ^.由题意得d ^=∑8i =1(w i -w -)(y i -y -)∑8i =1(w i -w -)2=108.81.6=68,所以c ^=y --d ^w -=563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w , 所以y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值为y ^=100.6+6849=576.6,年利润z 的预报值为z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12,所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解b ^,a ^的计算公式并准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 2.相关系数(1)当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. (2)当|r |>0.75时,认为两个变量具有较强的线性相关关系.【训练3】 (多选)我国5G 技术研发试验在2016~2018年进行,分为5G 关键技术试验、5G 技术方案验证和5G 系统验证三个阶段.2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升.某手机商城统计了2021年5个月5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为y ^=45x +5,则下列说法正确的是( ) A.a =142 B.y 与x 正相关C.y 与x 的相关系数为负数D.2021年7月该手机商城的5G 手机销量约为365部 答案 AB解析 x -=1+2+3+4+55=3,y -=50+96+a +185+2275=558+a 5,因为点(x -,y -)在回归直线上,所以558+a5=45×3+5,解得a =142,所以选项A 正确;从表格数据看,y 随x 的增大而增大,所以y 与x 正相关,所以选项B 正确;因为y 与x 正相关,所以y 与x 的相关系数为正数,所以选项C 错误;2021年7月对应的月份编号x =7,当x =7时,y ^=45×7+5=320,所以2021年7月该手机商城的5G 手机销量约为320部,所以选项D 错误.故选AB.热点三 独立性检验【例4】 为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位:μg/m 3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,依据小概率值α=0.01的χ2独立性检验,能否认为该市一天空气中PM2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO 2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO 2浓度不超过150的概率的估计值为64100=0.64. (2)根据抽查数据,可得2×2列联表:(3)零假设为H 0:该市一天空气中PM2.5浓度与SO 2浓度无关.根据(2)的列联表得χ2=100×(64×10-16×10)280×20×74×26≈7.484>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为该市一天空气中PM2.5浓度与SO 2浓度有关,此推断犯错误的概率不超过0.01. 探究提高 1.独立性检验的一般步骤 (1)根据样本数据列成2×2列联表; (2)根据公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),计算χ2的值;(3)查表比较χ2与临界值的大小关系,作统计判断.2.χ2的值越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练4】 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)依据小概率值α=0.01的χ2独立性检验,能否认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α 0.050 0.010 0.001 x α3.8416.63510.828解 (1)根据2×2列联表知:甲机床生产的产品中一级品的频率为150200=75%, 乙机床生产的产品中一级品的频率为120200=60%.(2)零假设为H 0:甲机床的产品质量与乙机床的产品质量没有差异.由2×2列联表,得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635=x 0.01.根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异,此推断犯错误的概率不超过0.01.一、选择题1.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A.0.01 B.0.1 C.1 D.10答案 C解析 10x 1,10x 2,…,10x n 的方差为102×0.01=1.2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170答案 C解析 ∵x -=110∑10i =1x i =110×225=22.5,y -=110∑10i =1y i=160, ∴a ^=y --b ^x -=160-4×22.5=70, ∴回归直线方程为y ^=4x +70. 因此估计其身高y ^=4×24+70=166.3.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A.10B.18C.20D.36答案 B解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以零件的个数为0.225×80=18.4.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个答案 D解析由雷达图易知A,C正确;七月的平均最高气温超过20 ℃,平均最低气温约为12 ℃,一月的平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月的平均温差大,B正确;由雷达图知平均最高气温超过20 ℃的月份有3个月,D错误.5.(多选) 5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图,某单位结合近年数据,对今后几年的5G经济产出作出预测.由上图提供的信息可知()A.运营商的经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.设备制造商在各年的总经济产出中一直处于领先地位D.信息服务商与运营商的经济产出的差距有逐步拉大的趋势 答案 ABD解析 对于A ,由图知,运营商的经济产出逐年增加,故A 正确;对于B ,由图知,设备制造商的经济产出在2020~2023年间增长较快,后几年增长逐渐趋于平缓,故B 正确;对于C ,由图可知,设备制造商在各年的总经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C 错误;对于D ,由图知,在2020~2025年间信息服务商与运营商的经济产出的差距不大,后几年中信息服务商的经济产出增长速度明显高于运营商的经济产出增长速度,两者间的差距有逐步拉大的趋势,故D 正确.综上所述,选ABD.6.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2<2B.x -=4,s 2>2 C.x ->4,s 2<2 D.x ->4,s 2>2答案 A解析 ∵某7个数的平均数为4,∴这7个数的和为4×7=28.∵加入一个新数据4,∴x -=28+48=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74<2,故选A.二、填空题 7.给出如下列联表非 30 50 80 合计5060110根据独立性检验,__________在犯错误的概率不超过0.01的前提下认为“高血压与患心脏病有关”(填“能”或“不能”). 答案 能解析 零假设为H 0:高血压与患心脏病无关. 由列联表中的数据可得 χ2=110×(20×50-10×30)230×80×50×60≈7.486>6.635=x 0.01,根据小概率值α=0.01的χ2独立性检验,我们推断H 0不成立,即认为高血压与患心脏病有关,此推断犯错误的概率不超过0.01,即能在犯错误的概率不超过0.01的前提下,认为高血压与患心脏病有关.8.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,测试成绩(单位:分)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x -,则m e ,m 0与x -的大小关系是________.答案 m 0<m e <x -解析 由图可知,30名学生的得分情况依次为得3分的有2人,得4分的有3人,得5分的有10人,得6分的有6人,得7分的有3人,得8分的有2人,得9分的有2人,得10分的有2人.中位数为第15、16个数(分别为5、6)的平均数,即m e =5.5.5出现的次数最多,故m 0=5,x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x -.9.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:①股票甲在这一年中波动相对较小,表现的更加稳定;②购买股票乙风险高但可能获得高回报;③股票甲的走势相对平稳,股票乙的收盘价格波动较大;④两只股票在全年都处于上升趋势.其中正确的结论是________(填序号).答案 ①②③解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故①正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故②正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故③正确;通过折线图可得乙在6月到8月明显是下降趋势,故④错误. 三、解答题10.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:性别对该商场的服务 合计满意不满意(1)分别估计男、女顾客对该商场服务满意的概率;(2)依据小概率值α=0.05的χ2独立性检验,能否认为男、女顾客对该商场服务的评价有差异?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)零假设为H 0:男、女顾客对该商场服务的评价没有差异. 由列联表中的数据,得 χ2=100×(40×20-30×10)250×50×70×30≈4.762>3.841=x 0.05.根据小概率值α=0.05的χ2独立性检验,我们推 断H 0不成立,即认为男、女顾客对商场服务的评价有差异,此推断犯错误的概率不大于0.05.11.某互联网公司为了确定下季度的前期广告投入计划,收集了近6个月广告投入量x (单位:万元)和收益y (单位:万元)的数据如表:他们分别用两种模型①y =bx +a ,②y =a e bx 进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.x -y -∑6i =1x i y i∑6i =1x 2i7301 464.24 364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由; (2)残差绝对值大于2的数据被认为是异常数据,需要剔除. (ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程; (ⅱ)若广告投入量x =18,则该模型收益的预报值是多少?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为:b ^=∑n i =1(x i -x -)(y i -y -)∑n i =1(x i -x -)2=∑ni =1x i y i -nx -·y -∑n i =1x 2i -n ·x -2,a ^=y --b ^x -. 解 (1)由于模型①残差波动小,应该选择模型①. (2)(ⅰ)剔除异常数据,即3月份的数据, 剩下数据的平均数为x -=15×(7×6-6)=7.2,y -=15×(30×6-31.8)=29.64,∑5i =1x i y i -5x -·y -=206.4,∑5i =1x 2i -5·x -2=68.8. ∴b ^=206.468.8=3,a ^=y --b ^x -=29.64-3×7.2=8.04.∴所选模型的回归方程为y ^=3x +8.04. (ⅱ)若广告投入量x =18,则该模型收益的预报值是3×18+8.04=62.04(万元).12.(多选)2020年7月国家统计局发布了我国2020年上半年国内经济数据,图1为国内三大产业生产总值的比重,图2为第三产业中各行业生产总值的比重.以下关于我国2020年上半年经济数据的说法正确的是()A.在第三产业中,“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平B.若“租赁和商务服务业”生产总值为15 000亿元,则“房地产业”生产总值为32 500亿元C.若“金融业”的生产总值为42 000亿元,则第三产业生产总值为262 500亿元D.若“金融业”的生产总值为42 000亿元,则第一产业生产总值为45 000亿元答案ABC解析对于选项A,在第三产业中,“批发和零售业”与“金融业”的生产总值之和占比为16%+16%=32%,“其他服务业”的生产总值占比为32%,所以“批发和零售业”与“金融业”的生产总值之和同“其他服务业”的生产总值基本持平,故选项A正确.对于选项B,若“租赁和商务服务业”生产总值为15 000亿元,在第三产业中,因为“租赁和商务服务业”生产总值占比为6%,所以第三产业生产总值为15 000=250 000(亿元),又“房地产业”生产总值占比为13%,所以“房地产6%业”生产总值为13%×250 000=32 500(亿元),故选项B正确.对于选项C ,在第三产业中,若“金融业”的生产总值为42 000亿元,因为“金融业”生产总值占比为16%,所以第三产业生产总值为42 00016%=262 500(亿元),故选项C 正确.对于选项D ,第三产业生产总值在三大产业中占比为57%,第一产业生产总值在三大产业中占比为6%,由C 选项知第三产业生产总值为262 500亿元,所以第一产业生产总值为262 50057%×6%≈27 632(亿元),所以选项D 错误.13.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m ,中位数为n ,则m -n =________.答案 360解析 第一块小矩形的面积S 1=0.3,第二块小矩形的面积S 2=0.4,故n =2 000+0.5-0.30.000 2=3 000;又第四、五块小矩形的面积均为S =0.06,故a =12 000[1-(0.3+0.4+0.06×2)]=0.000 09,所以m =1 000×0.3+3 000×0.4+5 000×0.18+(7 000+9 000)×0.06=3 360,故m -n =360.14.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y (单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7 销售量y (万件)y 1y 2y 3y 4y 5y 6y 7但其中数据污损不清,经查证∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y -)2=0.55.。
新高考数学复习专题-专题二十 统计与统计案例(原卷版)
![新高考数学复习专题-专题二十 统计与统计案例(原卷版)](https://img.taocdn.com/s3/m/8221da056d85ec3a87c24028915f804d2b168748.png)
专题二十 统计与统计案例一、单选题1.(2021·河南高二月考(文))有下列四个命题:( ) ①在回归分析中,残差的平方和越小,模型的拟合效果越好;②在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适; ③若数据1x ,2x ,…,n x 的平均数为1,则12x ,22x ,…2n x 的平均数为2; ④对分类变量x 与y 的随机变量2K 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握越大.其中真命题的个数为( ) A .1B .2C .3D .42.(2021·全国高二课时练习)若由一个22⨯列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.20()P K k ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.828A .95%B .97.5%C .99%D .99.9%第II 卷(非选择题)请点击修改第II 卷的文字说明二、解答题3.(2021·广东汕头市·高三一模)为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础.在产业扶贫政策的大力支持下,某玩具厂对原有的生产线进行技术升级,为了更好地对比升级前和升级后的效果,其中甲生产线继续使用旧的生产模式,乙生产线采用新的生产模式.质检部门随机抽检了甲、乙两条生产线的各100件玩具,在抽取的200件玩具中,根据检测结果将它们分为“A ”、“B ”、“C ”三个等级,,A B 等级都是合格品,C 等级是次品,统计结果如表所示:等级ABC频数 100 75 25(表二)合格品 次品 合计 甲 80 乙 5 合计在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由厂家自行销毁.(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99.5%的把握认为产品的合格率与技术升级有关?(2)每件玩具的生产成本为20元,,A B 等级产品的出厂单价分别为m 元、40元.若甲生产线抽检的玩具中有35件为A 等级,用样本的频率估计概率,若进行技术升级后,平均生产一件玩具比技术升级前多盈利12元,则A 等级产品的出产单价为多少元?附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.05 0.025 0.010 0.005 0.0010k3.841 5.024 6.635 7.879 10.8284.(2021·河南高二月考(文))某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下22⨯列联表:积极参加班级工作不太主动参加班级工作总计 学习积极性高 18725 学习积极性一般ab25 总计cd50如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是1225. (1)求a ,b ,c ,d 的值.(2)试运用独立性检验的思想方法分析:能否有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.10 0.05 0.025 0.010 0.005 0.0010k2.7063.841 5.024 6.635 7.879 10.8285.(2021·内蒙古包头市·高三一模(文))某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表: 土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)911142620并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民 140 60 女性村民40(1)求相关系数r 的大小(精确到0.01),并判断管理时间y 与土地使用面积x 的线性相关程度;(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥0.100 0.050 0.025 0.010 0.0010k2.7063.841 5.024 6.635 10.82848522.02≈.6.(2021·聊城市·山东聊城一中高三一模)已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:综合评价成绩(单位:分) [40,50)[50,60)[60,70)[70,80)[80,90)[90,100)频数 510151055赞成人数4812431(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成 不赞成 合计(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:P()20Kk ≥0.10 0.050.010 0.005 k 02.7063.8416.6357.8797.(2021·全国高三月考(理))某购物网站统计了,A B 两款手机在2020年7月至11月的总销售量y (单位:百部),得到以下数据: 月份x 7 8 9 10 11 销售量y100120110120200(Ⅰ)已知销售量y 与月份x 满足线性相关关系,求出y 关于x 的线性回归方程,ˆˆˆybx a =+,并预测12月的手机销售量; (Ⅱ)网站数据分析人员发现:,A B 两款手机11月的销售量与顾客性别有关.请填写下面的22⨯列联表,并判断能否有超过99.5%的把握认为“,A B 两款手机11月的销售量与顾客性别有关”?男性顾客女性顾客合计A 款销售量90B 款销售量50合计90参考公式:()()()121niii ni i x x y y b x x ==--=-∑∑,ˆˆay bx =-, ()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:()20P K k ≥ 0.010 0.005 0.0010k6.6357.879 10.8288.(2021·湖北高三月考)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y (单位:cm)与一定范围内的温度x (单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用y a x =+dy c x=+建立y 关于x 的回归方程,令s x =,1t x=得到如下数据: xyst10.15109.943.040.16113ni ii s y s y =-⋅∑ 13113i ii t yt y =-⋅∑1322113ik ss =-∑1322113ii tt =-∑1322113ii yy =-∑13.94 -2.1 11.67 0.21 21.22且(i s ,i y )与(i t ,i y )(i =1,2,3,…,13)的相关系数分别为1r ,2r ,且2r =﹣0.9953. (1)用相关系数说明哪种模型建立y 与x 的回归方程更合适; (2)根据(1)的结果及表中数据,建立y 关于x 的回归方程;(3)已知蕲艾的利润z 与x 、y 的关系为1202z y x =-,当x 为何值时,z 的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,247.637415.7365,对于一组数据(i u ,i v )(i =1,2,3,…,n ),其回归直线方程v u αβ=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u vnu v unuβ==-⋅=-∑∑,v u αβ=-,相关系数222211ni i nniii i u vnu vr unu vnv==-⋅=-⋅-∑∑∑.9.(2021·辽宁高三期末(文))2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6—11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhoneXR 一款位列第三.最满意度机型TOP3 中国电信大于3500 2500-3499 1500-2499 1000-1499 1000元以下 第一名华为P30 ProvivoiQoo荣耀9X Vivo Z5x华为畅享9e第二名三星S10+荣耀20Pro红米K20ProOPPO A9红米7第三名iPhone XRVivo X27化为 麦芒8华为畅享9plus中兴BladeA7 (1)从上表中“华为(不含荣耀)”和“iPhoneXR ”的5个机型中任取2个,求这两个机型都是华为的概率;(2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意不满意城市 270 30 农村17030根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关?(附:()()()()()22n ad bc X a b c d a c b d -=++++;当2 3.841X >时,有95%的把握说事件A与B 有关;当2 6.635X >时,有99%的把握说事件A 与B 有关;当2 3.841X ≤时,认为事件A 与B 是无关的)10.(2021·全国高三其他模拟)在我国,大学生就业压力日益严峻,伴随着政府政策的引导与社会观念的转变,大学生的创业意识与就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:i t1 2 3 4 5i y2.4 2.7 4.1 6.4 7.9(1)依据表中给出的数据,是否可用线性回归模型拟合与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合)(2)该专营店为吸引顾客,特推出两种促销方案. 方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.(ⅰ)某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率(ⅱ)某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择方案一返回200元现金,还是选择方案二参加四次抽奖?说明理由.附:相关系数公式:()()()()()()1122221111nnii i ii i nnnniiiii i i i tt y y t yntyr tt yy tt yy ======---=----∑∑∑∑∑∑,参考数据:56.957.547≈,5185.2i i i t y ==∑,()52110i i t t =-=∑,()52122.78i i y y =-∑11.(2021·全国高三其他模拟)人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响,下图是根据国家统计局发布的《2020年上半年居民收入和消费支出情况》绘制的,是我国31个省(区、市)2020年上半年人均可支配收入x (单位:元)与人均消费支出y (单位:元)的散点图.(1)由散点图可以看出,可以用线性回归模型ˆˆybx a =+拟合人均消费支出y 与人均可支配收入x 的关系,请用相关系数加以说明; (2)建立y 关于x 的线性回归方程(精确到0.01);(3)根据(2)的结论,规定半年人均盈余(人均可支配收入-人均消费支出)不低于4620元的省(区、市)达到阶段小康的标准,则估计达到阶段小康标准的省(区、市)的半年人均可支配收入至少为多少元? 参考数据:xy()3121=-∑ii xx()()311=--∑ii i xx y y()3121=-∑ii xx()3121=-∑ii yy15500 9632 1412000000 683900000 38000 18400参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆˆay bx =-. 12.(2021·甘肃兰州市·高三其他模拟(文))某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度C x ︒时相对应产卵数个数为y 的8组数据,为了对数据进行分析,他们绘制了如下散点图:(1)根据散点图,甲、乙两位同学分别用y bx a =+和z dx c =+(其中ln z y =)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数2R 更接近1;(给出判断即可,不必说明理由)(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程: (方程表示为()y f x =的形式,数据计算结果保留两位小数) xyz81i ii x y =∑81i i i x z =∑821ii x=∑26 72 3.3 11871 757 5722(3)据测算,若只此种昆虫的产卵数超过4e ,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在25C ︒左右,试利用(2)中的回归方程预测近期当地是否会发生虫害.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u βα=+的斜率和截距的最小二乘估计分别为1221ˆˆˆ,nl i i ni i u v nuvv u unu βαβ==-==--∑∑. 13.(2021·全国高三月考(文))2020年11月24日我国使用长征五号运载火箭成功发射嫦娥五号月球探测器,12月17日嫦娥五号返回器携带月球样品在预定地区安全着陆,探月工程嫦娥五号任务取得圆满成功.某大学为此举行了与嫦娥系列探测工程有关的知识测试,测试满分为100分,该校某专业的100名大一学生参加了学校举行的测试,记录这100名学生的分数,将数据分成7组; [)[)[]30,40,40,50,,90,100⋯,并整理得到如下频率分布直方图:(1)估计这100名学生测试分数的中位数;(2)把分数不低于80分的称为优秀,已知这100名学生中男生有70人,其中测试优秀的男生有45人,填写下面列联表,并根据列联表判断是否有95%的把握认为测试优秀与性别有关: 男生 女生 优秀 不优秀附:20()P K k ≥0.050 0.010 0.0010k 3.841 6.635 10.828()()()()()22n ad bc K a b c d a c b d -=++++ (3)对于样本中分数在[)[]80,90,90,100的人数,学校准备按比例从这2组中抽取12人,在从这12人中随机抽取3人参与学校有关的宣传活动,记这3人分数不低于90分的学生数为,X 求X 的分布列.14.(2021·江西高三其他模拟(文))某疫苗进行安全性临床试验.该疫苗安全性的一个重要指标是:注射疫苗后人体血液中的高铁血红蛋白(MetHb )的含量(以下简称为“M 含量”)不超过1%,则为阴性,认为受试者出现血症.若一批受试者的M 含量平均数不超过0.65%,出现血症的被测试者的比例不超过5%,同时满足这两个条件则认为该疫苗在M 含量指标上是“安全的”;否则为“不安全”.现有男、女志愿者各200名接受了该疫苗注射.经数据整理,制得频率分布直方图如图.(注:在频率分布直方图中,同一组数据用该区间的中点值作代表.)(1)请说明该疫苗在M 含量指标上的安全性;(2)按照性别分层抽样,随机抽取50名志愿者进行M 含量的检测,其中女性志愿者被检测出阳性的恰好1人.请利用样本估计总体的思想,完成这400名志愿者的22⨯列联表,并判断是否有超过95%的把握认为,注射该疫苗后,高铁血红蛋白血症与性别有关?性别 阴性阳性男 女 合计阳性 阴性合计附:()()()()()22n ad bcKa b c d a c b d-=++++.()2P K k≥0.050 0.010 0.001 0k 3.841 6.635 10.82815.(2021·全国高三专题练习(文))在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:(Ⅰ)估算该市电动自行车骑乘人员的平均年龄;(Ⅱ)根据所给的数据,完成下面的列联表:是否佩戴头盔年龄是否[)20,40[]40,70(Ⅲ)根据(Ⅱ)中的列联表,判断是否有99%把握认为遵守佩戴安全头盔与年龄有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,()2P K k≥0.050 0.010 0.001k 3.841 6.635 10.82816.(2021·全国高三专题练习(文))针对偏远地区因交通不便、消息闭塞导致优质农产品藏在山中无人识的现象,各地区开始尝试将电商扶贫作为精准扶贫的重要措施.为了解电商扶贫的效果,某部门随机就100个贫困地区进行了调查,其当年的电商扶贫年度总投入(单位:万元)及当年人均可支配年收入(单位:元)的贫困地区数目的数据如下表:人均可支配年收入(元)电商扶贫年度总投入(万元)(5000,10000] (10000,15000] (15000,20000] (0,500] 5 3 2(500,1000] 3 21 6(1000,3000) 2 34 24(1)估计该年度内贫困地区人均可支配年收入过万的概率,并求本年度这100个贫困地区的人均可支配年收入的平均值的估计值(同一组数据用该组数据区间的中间值代表);(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.人均可支配年收入≤10000元人均可支配年收入>10000元电商扶贫年度总投入不超过1000万电商扶贫年度总投入超过1000万附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k ≥0.050 0.01 0.005 k3.8416.6357.87917.(2021·全国高三专题练习(文))为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异?(3)若男生身高低于165厘米为偏矮,不低于165厘米且低于175厘米为正常,不低于175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.0010k2.7063.8415.0246.6357.879 10.828参照公式:()()()()()22n ad bc k a b c d a c b d -=++++ 18.(2021·全国高三专题练习(文))某生物研究所研发了某种型号的新冠疫苗,为检验该种型号疫苗的效果,研究所将疫苗用在小白鼠身上进行科研实验,得到如下数据:未感染病毒感染病毒 总计未注射疫苗 a 60 m 注射疫苗 b30 n总计11090200从未注射疫苗的小白鼠中任取1只,取到“未感染病毒”的小白鼠的概率为5. (1)能否有99.9%的把握认为注射此疫苗有效?(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++. ()2P K k ≥0.05 0.025 0.010 0.005 0.001 k3.8415.0246.6357.87910.82819.(2021·全国高三专题练习(文))某研究部门为了研究气温变化与患流感人数多少之间的关系,在某地随机对50人进行了问卷调查得到如下列表:(附22()()()()()n ad bc K a b c d a c b d -=++++)高于22.5C ︒ 不高于22.5C ︒ 合计 患流感2025不患流感15合计50(1)对上述22⨯列联表进行填空,并判断是否有99%的把握认为患流感与温度有关,说明你的理由;(2)为了了解患流感与年龄的关系,已知某地患有流感的老年、中年、青年的人数分别为108人,72人,36人.按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少一人是中年人的概率.()2>0.10 0.05 0.025 0.01 P K kk 2.701 3.841 5.024 6.63520.(2021·山东德州市·高三一模)2021年春晚首次采用“云”传播,“云”互动形式,实现隔空连线心意相通,全球华人心连心“云团圆”,共享新春氛围,“云课堂”亦是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取200人对“云课堂”倡议的了解情况进行了问卷调查,记Y表示了解,N表示不了解,统计结果如下表所示:(表一)了解情况Y N人数140 60(表二)男女合计Y80N40合计(1)请根据所提供的数据,完成上面的22⨯列联表(表二),并判断是否有99%的把握认为对“云课堂”倡议的了解情况与性别有关系;(2)用样本估计总体,将频率视为概率,在男性市民和女性市民中各随机抽取4人,记“4名男性中恰有3人了解云课堂倡议”的概率为1P,“4名女性中恰有3人了解云课堂倡议”的概率为2P .试求出1P 与2P ,并比较1P 与2P 的大小. 附:临界值参考表的参考公式()20p K K ≥0.10 0.05 0.025 0.010 0.005 0.0010K 2.7063.841 5.024 6.635 7.879 10.828()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++) 21.(2021·吉林长春市·高三二模(理))随着互联网行业、传统行业和实体经济的融合不断加深,互联网对社会经济发展的推动效果日益显著,某大型超市计划在不同的线上销售平台开设网店,为确定开设网店的数量,该超市在对网络上相关店铺做了充分的调查后,得到下列信息,如图所示(其中x 表示开设网店数量,y 表示这x 个分店的年销售额总和),现已知55118850,2000i ii i i x yy ====∑∑,求解下列问题;(1)经判断,可利用线性回归模型拟合y 与x 的关系,求解y 关于x 的回归方程; (2)按照经验,超市每年在网上销售获得的总利润w (单位:万元)满足25140w y x =--,请根据(1)中的线性回归方程,估算该超市在网上开设多少分店时,才能使得总利润最大.参考公式;线性回归方程y bx a =+,其中515221,i ii ii x y nx ya y bxb xnx==-=-=-∑∑22.(2021·河南高三月考(文))2020年初,新冠病毒肆虐.疫情期间,停课不停教学,各学校以网课形式进行教学.教育局抽样对某所学校的高三1000名学生某一周每天学习时间以及考试进行了调查,得如下频数分布表 学习时间(分钟) [)7,7.5[)7.5,8[)8,8.5[)8.5,9[)9,9.5[]9.5,10人数160190200180150120从1000名学生中抽取50名学生,调查学习时间与成绩的关系,得如下二阶列联表学习时间9小时以上(含9小时)学习时间9小时以下合计总分600分以上(含600分) 7 3 10 总分600分以下 17 23 40 合计242650(1)求出第一星期这1000名学生学习时间的中位数;(2)为了解学生们的学习状况,一次考试结束,从全年级随机抽取50人根据学习时间的多少和成绩的是否优秀列成以下列联表计算说明:有没有90%的把握认为总分600分以上和学习时间超过9小时有关附公式及表如下:()()()()()22n ad bc K a b c d a c b d -=++++ ()20P K K ≥ 0.150.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82823.(2021·全国高三专题练习)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据()(),1,2,,20i i x y i =⋅⋅⋅,其中i x 和i y 分别表示第i 个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20180i i x ==∑,2014000i i y ==∑,()202180i i x x=-=∑,()20218000ii y y =-=∑,()()201700i ii x xy y =--=∑.(1)请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合; (2)求y 关于x 的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑,对于一组具有线性相关关系的数据()(),1,2,3,,i i x y i n =⋅⋅⋅,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-.24.(2021·全国高三专题练习(文))随着冬季的到来,是否应该自觉佩戴口罩成为了人们热议的一个话题.为了调查佩戴口罩的态度与性别是否具有相关性,研究人员作出相应调查,并统计数据如表所示: 认为冬季佩戴口罩十分必要 认为冬季佩戴口罩没有必要 男性 300 200 女性150150(1)判断是否有99.9%的把握认为佩戴口罩的态度与性别有关?(2)若按照分层抽样的方法从男性中随机抽取5人,再从这5人中随机抽取2人,求恰有1人认为冬季佩戴口罩十分必要的概率.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:()20P K k0.100 0.050 0.010 0.001k 2.706 3.841 6.635 10.82825.(2021·全国高三专题练习)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.(1)请补充完整22⨯列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?效果一般效果较好合计男20女1555合计(2)用(1)中列联表的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中线上教学“效果较好”的人数为X,求X的分布列和数学期望.附表及公式:()2P K k0.150.100.050.0250.010 0k 2.072 2.706 3.841 5.024 6.635其中()()()()()22n ad bcka b c d a c b d-=++++,n a b c d=+++.26.(2021·全国高三专题练习)近年来,我国的电子商务行业发展迅速,与此同时,相关管理部门建立了针对电商的商品和服务评价系统.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为35,对服务的好评率为710;其中对商品和服务均为好评的有80次(1)是否可以在犯错误概率不超过0.1的前提下,认为商品好评与服务好评有关?(2)若将频率视为概率,某人在该购物平台上进行的4次购物中,设对商品和服务全好评的次数为随机变量X:求对商品和服务全好评的次数X的分布列及其期望.()20P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.072 2.7063.841 5.024 6.635 7.879 10.82822()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)27.(2021·全国高三专题练习)某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组[)75,80,第二组[)80,85,,第五组[]95,100(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在[)85,90的人数为ξ,求ξ的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.临界值表:()20P K k ≥ 0.10 0.05 0.025 0.01 0.0050k2.7063.841 5.024 6.635 7.87928.(2021·全国高三专题练习)支付宝为人们的生活带来许多便利,为了了解支付宝在某市的使用情况,某公司随机抽取了100名支付宝用户进行调查,得到如下数据: 每周使用支付宝次数 1 2 3 4 5 6及以上 40岁及以下人数 3 3 4 8 7 30 40岁以上人数 4 5 6 6 4 20 合计7810141150(1)如果认为每周使用支付宝超过3次的用户“喜欢使用支付宝”,完成下面22⨯列联表,并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢使用支付宝”与年龄有关?不喜欢使用支付宝 喜欢使用支付宝 合计 40岁及以下人数 40岁以上人数 合计(2)每周使用支付宝6次及以上的用户称为“支付宝达人”,视频率为概率,在该市所有“支付宝达人”中,随机抽取3名用户.①求抽取的3名用户中,既有40岁及以下“支付宝达人”又有40岁以上“支付宝达人”的概率;②为了鼓励40岁以上用户使用支付宝,对抽出的40岁以上“支付宝达人”每人奖励500元,记奖励总金额为X (单位:元),求X 的数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k2.0722.7063.841 5.024 6.635 7.879 10.82829.(2021·全国高三专题练习)2019年4月,江苏省发布了高考综合改革实施方案,试行“312++”高考新模式.为调研新高考模式下,某校学生选择物理或历史与性别是否有。
江苏2018届高考数学总复习专题11.2统计与统计案例试题含解析
![江苏2018届高考数学总复习专题11.2统计与统计案例试题含解析](https://img.taocdn.com/s3/m/1a0fd71c580216fc700afdb0.png)
专题11.2 统计与统计案例【三年高考】1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取▲ 件.【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18.【考点】分层抽样【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6【解析】46587666x+++++==【考点定位】平均数4. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】【考点】 折线图【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】试题分析:由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.【考点】线性相关与线性回归方程的求法与应用.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】 试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B【考点】样本特征数【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平; 中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】【考点】茎叶图、样本的数字特征【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中︒,B 月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C︒.下面叙述不正确的是.点表示四月的平均最低气温约为5C︒以上②七月的平均温差比一月的平均温差大①各月的平均最低气温都在0C︒的月份有5个③三月和十一月的平均最高气温基本相同④平均气温高于20C【答案】④【解析】︒均在虚线框内,所以各月的平均最低气温都在0℃以上,①正确;由试题分析:由图可知0C图可在七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在5C ︒,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确. 考点:1、平均数;2、统计图.【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).【答案】1.76【解析】试题分析:将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.考点:中位数的概念.【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力. 10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.【答案】①16;②29C BA139142考点: 统计分析【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下 08 9 12 5 8 20 0 3 3 8 3 1 2则这组数据中的中位数是 .【答案】20【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .(高中部)(初中部)男男女女60%70%【答案】137 【解析】由图可知该校女教师的人数为11070%150(160%)7760137⨯+⨯-=+=.13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】169【解析】设这批米内夹谷的个数为x ,则由题意并结合简单随机抽样可知,282541534x =,即281534169254x =⨯≈. 14.【2015高考广东,文12】已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,所以样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为2125111x +=⨯+=,所以答案应填:11.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .【答案】乙;数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(I )估计顾客同时购买乙和丙的概率;(II )估计顾客在甲、乙、丙、丁中同时购买中商品的概率;(III )如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? (Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=,顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中x 的值是0.0075(2)月平均用电量的众数是2202402302+=,因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户,抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户【2018年高考命题预测】概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .【答案】155;156.8【解析】根据中位数的定义知中位数由200.005200.0150.0200.5m ⨯+⨯+⨯=,解得5m =,所以中位数为:1505155+=;平均数为:1200.0051400.0151600.0201800.0052000.0032200.002156.8⨯+⨯+⨯+⨯+⨯+⨯=,所以答案为:155;156.8.2.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户? 【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中的值是0.0075.(2)月平均用电量的众数是2202402302+=;因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224.【考点2】相关性、最小二乘估计与统计案例 【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关. 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用表达式[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为:∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a ).其中x =1n ∑i =1nx i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心.(3)相关系数①1()()nniii x x y y x yn x yr -------==∑∑r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. 4.独立性检验(1)设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1. 2×2列联表构造一个随机变量2()()()()()n ad bc K a b c d a c b d -=++++其中d c b a n +++=为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验. (3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;②当χ2>2.706时,有90%的把握判定变量A ,B 有关联; ③当χ2>3.841时,有95%的把握判定变量A ,B 有关联; ④当χ2>6.635时,有99%的把握判定变量A ,B 有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.3.正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键.回归直线方程y =bx +a 必过样本点中心(x ,y ).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算2K 值,2K 值越大,说明“两个变量有关系”的可能性越大. 【考点针对训练】1.已知x 、y 的取值如下表所示,若y 与x 线性相关,且yˆ=0.95x +,则=____________.【答案】6.2 【解析】244310=+++=x ,5.447.68.43.42.2=+++=y ,样本中心点,在回归直线上,所以代入aˆ295.05.4+⨯=,所以6.2ˆ=a 2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:22n(ad bc )K (a b )(c d )(a c )(b d )-=++++参照附表,在如下结论:A .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 中正确的是 . 【答案】C【解析】由表计算得:22100(45153010)==3.0355457525K ⨯-⨯⨯⨯⨯,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C .【两年模拟详解析】1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________. 【答案】 (或5.2)【解析】2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数x ,则x 的值为 .【答案】19.7 【解析】3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据12345,,,,x x x x x 的方差23s =,则样本数据123452,2,2,2,2x x x x x 的方差为 ▲ . 【答案】12【解析】由题意得方差为2224312s =⨯=4. 【2017年第三次全国大联考江苏卷】已知样本7,8,9,,x y 的平均数为,且60xy =,则此样本的方差为_____________. 【答案】2 【解析】因为78985x y++++=,所以16x y +=,而60xy =,所以610x y =⎧⎨=⎩或106x y =⎧⎨=⎩,从而样本的方差为22221[(1)01(2)2]25⨯-+++-+=.5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为9,11,10,8,12,则这组数据的标准差为_______. 【答案】2【解析】因为这组数据的平均数是10591110812=++++=x ,所以其方差25)109()1011()1010()108()1012(222222=-+-+-+-+-=s ,故所求这组数据的标准差2=s .6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在h km /9050-的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在h km /70以下的汽车有 辆.)【答案】75【解析】由频率分布直方图得,速度在h km /70以下的汽车所占频率为(0.020.03)100.5+⨯=,则速度在h km /70以下的汽车有1500.575⨯=辆7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.【答案】40【解析】(0.0550.0250.015)10040⨯+⨯+⨯⨯=.8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm 和195cm 之间,将测量结果按如下方式分成八组:第一组[)160155,、第二组[)165160,、……、第八组[]195190,. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm 以上(含180cm )的人数为 .【答案】144【解析】由图得,身高180cm 以上(含180cm )的频率为()150.0080.0160.0420.060.18-⨯++⨯+=,则人数为8000.18144⨯=9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 . 【答案】17【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 . 【答案】2【解析】由题意得12x =,因此方差为221(12201)25++++=11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h ~120km/h ,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.【答案】1700【解析】2000(0.0350.030.02)101700⨯++⨯=12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .【答案】【解析】950)002.0004.0(30=⨯+⨯13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出人.【答案】25⨯⨯=【解析】由题意得:0.00055001002514.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:则甲、乙两位选手中成绩最稳定的选手的方差是.【答案】0.02【一年原创真预测】1. 以下四个命题中:R的值判断模型的拟合效果, 2R越大,模型的拟合效果越①在回归分析中,可用相关指数2好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③若数据123,,n x x x x 的方差为1,则1232,2,22n x x x x 的方差为2;④对分类变量与y 的随机变量2k 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为 . 【答案】2【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.2.某单位为了了解某办公楼用电量y (度)与气温x (oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:得到的回归方程为a bx y+=ˆ,则a 0,b 0. 【答案】>,<【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题. 3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:。
高三数学统计和导数检测题(文)
![高三数学统计和导数检测题(文)](https://img.taocdn.com/s3/m/d00d167903768e9951e79b89680203d8ce2f6a5b.png)
统计和导数检测题(文)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1、一个容量为20的样本数据,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为()A.B.C. D.2、函数在x=1处的切线与直线y=2x平行,则a的值为()A.3 B.2C.1 D.03、在简单随机抽样中,某一个个体被抽到的可能性()A.与第n次抽样有关,第一次抽到的可能性最大B.与第n次抽样有关,第一次抽到的可能性最小C.与第n次抽样无关,每次抽到的可能性都相等D.与第n次抽样无关,与样本容量无关4、从10个篮球中任取一个,检验其质量,则抽样为()A.简单随机抽样B.分层抽样C.放回抽样D.非等可能性抽样5、某县有30个乡,其某某区有6个,丘陵地区有12个,平原地区有12个,现要从中抽出5个乡进行调查,则应在山区、丘陵地区、平原地区分别抽取()A.1个、2个、2个 B.2个、1个、2个C.2个、2个、1个 D.1个、1个、3个6、用样本频率分布估计分布,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确7、某人旅行100km,前60km路程的速度为10km/h,后40km路程速率为12km/h,则此人走完全程的平均速度约为()A.10km/h B.10.7km/hC.11.5km/h D.11km/h8、已知数据样本:4,2,1,0,-2,则该数据样本的标准差为()A.B.2C.4 D.9、如果数据x1,x2,…,x n的平均数为,方差为S2,则3x1+5,3x2+5,…,3x n+5的平均数和方差分别为()A.和S2 B.3+5和S2C.3+5和9S2 D.3+5和9S2+30S+2510、数据a,4,2,3,5的平均数是b,且a、b是方程x2-4x+3=0的两根,则这组数据的方差是()A.2 B.3C.4 D.511、某人从湖中打了一网鱼,共有m条,做上记号再放入湖中,数日后又打了一网鱼,共有n条,其中k条有记号,那么估计湖中有鱼()A.条 B.条C.条 D.条12、设f(x)=(x-1)(x-2)(x-3)…(x-100),则f′(1)=()A.-99! B.-100!C.100!D.0二、填空题(本大题共4小题,每小题4分,共16分,把答案填在题中横线上.)13、计划从居住于三条街道的20000人中抽取200人的一个样本,已知三条街道居住人数之比为2︰3︰5,现采用分层抽样的方法抽取,则应分别抽取__________人.14、已知f(x)=(x-1)2+2,g(x)=x2-1,则f[g(x)]的递增区间是_______________。
最新高三第一轮复习训练题数学-统计与导数 (含答案)
![最新高三第一轮复习训练题数学-统计与导数 (含答案)](https://img.taocdn.com/s3/m/045eff61b14e852459fb5747.png)
高三第一轮复习训练题 数学(十八) (统计与导数)一、选择题:本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的。
1.函数y=f(x)的图象在点P (1,f(1))处的切线方程为y=-2x+10,导函数为()f x ',则f(1)+(1)f '的值为 A. -2 B.2 C .6 D. 82.一点沿直线运动,如果由始点起经过t 秒后的距离为43215243s t t t =-+,那么速度为零的时刻是A .1秒末B .0秒C .4秒末D .0,1,4秒末3. f (x )与g (x )是定义在R 上的两个可导函数,若f (x )、g (x )满足f ′(x )=g ′(x ),则A .f (x )=g (x )B .f (x )+g (x )为常数函数C .f (x )=g (x )=0D .f (x )-g (x )为常数函数4.甲、乙两人下棋,甲获胜的概率为40%,甲不输的概率为90%,则甲、乙两人下成和棋的概率为 A .60% B .50% C .30%D .10%5. 某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽取容量为45人的样本,那么高一、高二、高三年级抽取的人数分别为 A.15,10,20 B.10,5,30 C.15,15,15 D.15,5,256.要从10名男生与5名女生中选出6名学生组成课外活动小组,如果按性别分层抽样,试问组成此课外活动小组的概率为 A.61525410C C C B.61535310C C C C.615615A C D.61525410C A A7. 已知)2(),1(3)(2f f x x x f ''+=则=A .-1B .0C .2D .48.若f (x )= x 3-ax 2+1,则在点(0, 1)处曲线 f (x )的切线有A 、0条B 、1条C 、2条D 、3条9.在样本的频率分布直方图中,共有n 个小长方形,若中间一个小长方形的面积等于另外n -1个小长方形面积和的14,且样本容量为160,则中间一组的频数为 A .32 B .33 C .34 D .3510.设函数f(x)在定义域内可导,y=f(x)的图象如图1所示,则导函数y=f '(x)可能为xyOxy OAxy OB xy OC yODx11. 在抽查某产品尺寸过程中,将其尺寸分成若干组,[a ,b ]是其中一组,已知该组的频率为m ,该组上的直方图的高为h ,则|a -b |等于A .mhB .hmC .mhD .m +h12.设f (x )=ax 3-6ax 2+b 在区间[-1,2]上的最大值为3,最小值为-29,且a >b ,则A .a =2,b =29B .a =2,b =3C .a =3,b =2D .a =-2,b =-29二、填空题:本大题共4小题;每小题4分,共16分,把答案填在题中的横线上。
2025新高考数学计算题型精练专题03 导数计算(解析版)
![2025新高考数学计算题型精练专题03 导数计算(解析版)](https://img.taocdn.com/s3/m/421ef7a68ad63186bceb19e8b8f67c1cfbd6ee6e.png)
2025新高考数学计算题型精练导数计算1.求下列函数的导数:(1)cos sin cos xy x x -=;(2)221e x y x +=.【答案】(1)()21sin cos x x --;(2)()222141exx ++【详解】(1)()()()()22sin sin cos cos sin cos 1sin cos sin cos x x x x x xy x x x x ---+'==---;(2)()()22221221221e 21e 41e xx x y x x x +++''=++=+.2.求下列函数的导数.(1)()()221f x x =-+;(2)()()ln 41f x x =-;(3)()322x f x +=;(4)()f x =;【答案】(1)84x -(2)441x -(3)3232ln2x +⨯【详解】(1)因为()()2221441f x x x x =-+=-+,所以()84f x x '=-.(2)因为()()ln 41f x x =-,所以()441f x x '=-.(3)因为()322x f x +=,所以()3232ln2x f x +'=⨯(4)因为()f x =,所以()f x '==3.求下列函数的导数:(1)32235y x x =-+;(2)241y x x =++;(3)2log y x =;(4)e n xy x =;(5)31sin x y x-=;(6)sin sin cos xy x x=+.【答案】(1)266x x -(2)()22241x x ----+(3)1ln 2x (4)()1e n xx n x -+(5)()2323sin 1cos sin x x x x x--(6)11sin 2x+【详解】(1)()()32223566y x x x x ''''=-+=-.(2)()()()22242411y x x x x ''--'=+=+++()22241x x --=--+.(3)()21log ln 2y x x ''==.(4)()()()11e e e e e n x n x n x n x n x y x x nx x x n x --'''=+=+=+.(5)()()()()33321sin 1sin 1sin sin x x x x x y x x '''---⎛⎫-'== ⎪⎝⎭()2323sin 1cos sin x x x x x --=.(6)()sin sin cos x y x x ''=+()()()()2sin sin cos sin sin cos sin cos x x x x x x x x ''+-+=+()()()2cos sin cos sin cos sin sin cos x x x x x x x x +--=+()2111sin 2sin cos x x x ==++.4.求下列函数的导数:(1)1)1y ⎫=+-⎪⎭;(2)3ln (0,1)x y x a a a =+>≠;(3)sin 2cos 222y x x x ππ⎛⎫⎛⎫=++ ⎪ ⎪⎝⎭⎝⎭(4)2ln(23)1x y x +=+.【答案】(1)11y x ⎫'=+⎪⎭;(2)3ln (0xy a a a x '=+>且1)a ≠;(3)1sin 42cos 42y x x x --'=;(4)y '()()222212(23)ln(23)(23)1x x x x x x +-++=++【详解】(1)1)11y ⎫==-=⎪⎭,11y x '⎛⎫'∴===+⎪⎭⎝.(2)()'33ln ln (0,1)xxy x aa a a a x=+=+>≠'.(3)11sin 2cos 2sin(4)sin 42222y x x x x x x x πππ⎛⎫⎛⎫=++=+=- ⎪ ⎪⎝⎭⎝⎭ ,111sin 44cos 4sin 42cos 4222x x x x x x y '∴=--⋅=--.(4)()()()2222[ln(23)]1ln(23)11x x x x y x ''++-++'=+()()222(23)12ln(23)231x x x x x x '+⋅+-++=+()()222212(23)ln(23)(23)1x x x x x x +-++=++.5.求下列函数的导数:(1)23cos =+y x x ;(2)()1ln =+y x x ;(3)sin cos 22x y xx =-;【答案】(1)6sin =-'y x x ;(2)1ln +='+x y x x ;(3)11cos 2y x '=-.【详解】(1)因为23cos =+y x x ,所以6sin =-'y x x ;(2)因为()1ln =+y x x ,所以1ln +='+x y x x;(3)因为1sin cos sin 222y x x x x x =-=-,所以11cos 2y x '=-;6.求下列函数的导数.(1)22y x x -=+;(2)2ln 1xy x =+【答案】(1)322y x x -=-';(2)()()22112ln 1x x xy x-+'=+【详解】(1)322y x x -=-';(2)()()()()()22222212ln ln 1ln 111x x xx x x x x y xx ⎛⎫+-'' ⎪+-+⎝⎭'==++()()()2222112ln 12ln 11x x x x x x x x x -+-+==++.7.求下列函数的导数:(1)2()(1sin )(1)f x x x =+-;(2)()31x xf x x =-+.【答案】(1)()2cos 12(1sin )x x x x --+;(2)213ln 3(1)x x -+.【详解】(1)22()(1sin )(1)(1sin )(1)f x x x x x '''=+-++-2cos (1)(1sin )(2)x x x x =-++-()2cos 12(1sin )x x x x =--+(2)()((3)1x xf x x '''=-+2()(1)(1)3ln 3(1)x x x x x x ''+-+=-+213ln 3(1)x x =-+.8.求下列函数的导数:(1)22log (3);y x x =(2)cos(21).x y x+=【答案】(1)22log (3).ln 2x y x x '=+(2)()22sin 21cos(21).x x x y x -+-+'=【详解】(1)[]2222()log (3)log (3)y x x x x '''=+2232log (3)3ln 2x x xx =+22log (3)ln 2xx x =+.(2)[]2cos(21)cos(21)x x x x y x''+-+'=()22sin 21cos(21)x x x x -+-+=.9.求下列函数的导数:(1)111x y x x+=+-;(2)ln(21)y x x =+.【答案】(1)22221(1)x x y x x +-'=-(2)2ln(21)21xy x x '=+++.【详解】(1)2222(1)(1)(1)121(1)(1)x x y x x x x --+⨯-'=-=---22221(1)x x x x +-=-;(2)12ln(21)2ln(21)2121xy x x x x x '=++⋅⋅=++++.10.求下列函数的导数:(1)()ln 21x y x+=;(2)()ln 25y x =-;(3)sin 2cos 222y x x x ππ⎛⎫⎛⎫=++ ⎪ ⎝⎭⎝⎭.【答案】(1)()()()2221ln 2121x x x y x x-++'=+(2)225y x '=-(3)1sin 42cos 42y x x x --'=【详解】(1)()()()()()2221ln21ln 21ln 21ln 2121x x x x x x x x x y x x x '+'⋅-+''+-+⎡⎤+⎡⎤⎣⎦+'===⎢⎥⎣⎦()()()()222ln 21221ln 212121xx x x x x x x x -+-+++==+.(2)令25u x =-,ln y u =,则()112ln 222525y u u u x x '''=⋅=⋅=⋅=--.(3)因为()11sin 2cos 2sin 4sin 42222y x x x x x x x πππ⎛⎫⎛⎫=++=+=- ⎪ ⎪⎝⎭⎝⎭,所以()11111sin 4sin 4sin 44cos 4sin 42cos 422222y x x x x x x x x x x''⎛⎫⎛⎫=-+-=--⋅=-- ⎪ ⎪⎝⎭⎝⎭'.11.求下列函数的导函数.(1)324ln 1y x x x =+-+;(2)24cos 2xy x -=+;(3)21e sin +=x y x .【答案】(1)21122x x x +-(2)()()2222sin 2cos 82x x x x x x ++-+(3)()212sin cos e x x x ++【详解】(1)'21122y x x x=+-;(2)()()()()()22'2222sin 224cos 2sin 2cos 822x x x x xx x x xy xx+--++-==++;(3)()'2121212e sin e cos 2sin cos e x x x y x x x x +++=+=+.12.求下列函数的导数.(1)(11y⎛=+ ⎝;(2)ln xy x=.【答案】(1)'y =,(2)'21ln x y x -=【详解】解:(1)因为(11221111y x x-⎛=+==- ⎝,所以31'22211111)22222x y x x x --+=--=-=-,(2)由ln x y x =,得'21ln x y x -=13.求下列函数的导数:(1)5log 2y x =;(2)8x y =;(3)cos 2y x =;(4)()432y x =.【答案】(1)1ln 5y x '=(2)8ln8x y '=(3)2sin 2y x '=-(4)1013323y x =【详解】(1)555log 2log 2log x x =+ 1ln 5y x '∴=(2)8ln8x y '=(3)令2,t x =则cos y t =()()()cos 2cos 2sin 22sin 2x t x y y t x t x t x''''''∴=⋅⇒=⋅=-⨯=-,故2sin 2y x '=-(4)()10444414313333334222233y x x y xx -'==⋅∴=⨯= 14.求下列函数的导数:(1)8y x =;(2)4x y =;(3)3log y x =;(4)sin(2y x π=+;(5)2e y =.【答案】(1)'78y x =;(2)'4ln 4x y =⋅;(3)'1ln 3y x =⋅;(4)'sin y x =-;(5)'0y =.【详解】(1)8y x =,'78y x =;(2)4x y =,'4ln 4x y =⋅;(3)3log y x =,'1ln 3y x =⋅;(4)sin()cos 2y x x π=+=,'sin y x =-;(5)2e y =,'0y =.15.求下列函数的导数.(1)12y x =;(2)41y x=;(3)3x y =;(4)ln y x =;(5)cos y x =.【答案】(1)1112y x '=(2)54y x'=-(3)3ln 3xy '=(4)1y x '=(5)sin y x '=-【详解】(1)()121112y x x ''==(2)()4545144y x x x x --'⎛⎫''===-=- ⎪⎝⎭(3)()ln 333x x y ''==(4)()1ln y x x''==(5)()cos sin y x x''==-16.求下列函数的导函数(1)4235+6y x x x =--;(2)21y x x=+;(3)2cos y x x =;(4)tan y x =【答案】(1)3465y x x =--';(2)321y x '=-;(3)22cos sin y x x x x -'=;(4)21cos y x'=【详解】(1)由4235+6y x x x =--,则3465y x x =--';(2)由21y x x =+,则321y x '=-;(3)由2cos y x x =,则22cos sin y x x x x -'=;(4)由sin tan cos x y x x ==,则2222cos sin 1cos cos x x y x x+'==.17.求下列函数的导函数.(1)()3224f x x x =-+;(2)()32113f x x x ax =-++(3)()cos ,(0,1)f x x x x =+∈;(4)2()3ln f x x x x =-+-(5)sin y x =;(6)11x y x +=-【答案】(1)2()68f x x x =-+(2)2()2f x x x a'=-+(3)()sin 1f x x '=-+(4)1()23f x x x'=--+(5)cos y x '=(6)22(1)y x '=--【详解】解:(1)由()3224f x x x =-+,则()'268f x x x =-+;(2)由()32113f x x x ax =-++,则()'22f x x x a =-+;(3)由()cos ,(0,1)f x x x x =+∈,则()1sin ,(0,1)f x x x =-∈;(4)由2()3ln f x x x x =-+-,则'1()23f x x x=-+-;(5)由sin y x =,则'cos y x =;(6)由11x y x +=-,则'''22(1)(1)(1)(1)2(1)(1)x x x x y x x +⨯--+⨯-==---.18.求下列函数的导数:(1)221()(31)y x x =-+;(2)cos x y e x =;【答案】(1)y ′=18x 2+4x -3;(2)y ′=ex (cos x -sin x ).【详解】(1)2222(21)(31)(21)(31)4(31)3(21)1843y x x x x x x x x x '''=-++-+=++-=+-,(2)()cos (cos )cos sin (cos sin )x x x x x y e x e x e x e x e x x '''=+=-=-.19.求下列函数在指定点处的导数.(1)()πf x x =,1x =;(2)()sin f x x =,π2x =.【答案】(1)π(2)0【详解】(1)解:因为()πf x x =,所以()1f x x ππ-'=,所以()1f π'=.(2)解:因为()sin f x x =,所以()cos f x x '=,所以cos 022f ππ⎛⎫'== ⎪⎝⎭.20.求下列函数的导数.(1)12y x =;(2)41y x=;(3)3x y =;(4)5log y x =.【答案】(1)1112y x '=(2)54y x '=-(3)3ln3xy '=(4)1=ln5y x '【详解】(1)12y x =,则1112y x '=(2)441y x x -==,则41544y x x --'-==-(3)3x y =,则3ln3x y '=(4)5log y x =,则1=ln 5y x '21.求下列函数的导数:(1)23cos =+y x x ;(2)()1ln =+y x x ;【答案】(1)6sin =-'y x x ;(2)1ln 1y x x'=++【详解】解:(1)因为23cos =+y x x所以()()23cos 6sin y x x x x '''=+=-,即6sin =-'y x x(2)因为()1ln =+y x x所以()()()()111ln 1ln ln 1ln 1y x x x x x x x x x '''=+++=++⋅=++,即1ln 1y x x'=++22.求下列函数的导数.(1)()()22331y x x =+-;(2)1sin 1cos xy x-=+.【答案】(1)21849y x x '=-+(2)21cos sin (1cos )'--+=+x x y x 【详解】(1)解:因为326293y x x x =-+-,所以21849y x x '=-+(2)()()2cos (1cos )1sin sin (1cos )x x x x y x -+---=+',21cos sin (1cos )x xx --+=+.23.求下列函数的导数.(1)()()ln sin f x x x x =+;(2)()()521exx f x +=.【答案】(1)()ln sin cos 1f x x x x x '=+++(2)()()()42192e xx x f x +-'=【详解】(1)()()()1ln sin ln sin ln sin cos f x x x x x x x x x x x x ⎛⎫'''=+++=+++ ⎪⎝⎭ln sin cos 1x x x x =+++.(2)()()()()()()454525e 212121e 102121e e x x x xx x x x x f x '++-++-+'==()()()()442110212192e ex xx x x x +--+-==.24.求下列函数的导数:(1)()2sin 2x f x x x=+(2)()()3e ln 24xf x x =+【答案】(1)()()()()222cos 2sin 222x x x x x f x x x +-+'=+(2)()()33e 3e ln 224xxf x x x =+++'【详解】(1)()2sin 2xf x x x=+,()()()()222cos 2sin 222x x x x x f x xx +-+'=+(2)()()3e ln 24xf x x =+,()()()3333e 3e ln 242242e 3e ln 24x xxxx f x x x x '=++++=++.25.求下列函数的导数:(1)()f x =(2)()cos 21x y x+=.【答案】(1)21x x +(2)()()22sin 21cos 21x x x x -+-+(2)求商的导数,[]2()()()()()()()f x f x g x f x g x g x g x '''⎡⎤-=⎢⎥⎣⎦,由复合函数的的导数得[]cos(21)sin(21)(21)2sin(21)x x x x ''+=-++=-+ .【详解】(1)因为()f x =所以()()122'211221x x x f x x -+⋅===+'.(2)()()()'2cos 21cos 21x x x x f x x ⎡⎤+-+⎣⎦''=()22sin 21cos(21)x x x x -+-+=.26.求下列函数的导函数.(1)()()22331y x x =+-;(2)233x y x +=+.【答案】(1)21849x x -+(2)()222633x x x--++【详解】(1)()()22331y x x =+- ,()()()()()()2222233123314313231849y x x x x x x x x x '''∴=+-++-=-++=-+;(2)233x x y +=+ ,()()()()()()()()()2222222222333332363333x x x x x x x x x xxxy ''∴++-+++-+--+=='=+++.27.求下列函数的导数:(1)32234y x x =--;(2)ln xy x=.【答案】(1)266x x -(2)21ln x x -【详解】(1)322(2)(3)(4)66y x x x x ''''=--=-(2)()2221ln ln ln ()1ln x xx x x x x x y x x x ⋅-''⋅-⋅-'===28.求下列函数的导数:(1)31x x y e-=(2)ln(52)y x =+(3)cos(21)x y x +=【答案】(1)3231e x x x y -+'+=(2)552y x '=+(3)22sin(21)cos(21)x x x y x +++'=-【详解】(1)∵31xx y e-=,则()()()()()()''333232221e 1e 31e 31e e e x xxxx xx x xx x x y ----++-++===',故3231e xx x y -+'+=.(2)设52u x =+,则ln ,52u y u u x ==+,则()()()()''''15ln 52552u y y u u x u x '==+=⨯=+,故552y x '=+.(3)∵cos(21)x y x+=,则[]()2222sin(21)cos(21)2sin(21)cos(cos(21)cos 2121)x x x x x x y x x x x x x x ''+⋅-+⋅⎡⎤⎣⎦'==-+-++++=-,故22sin(21)cos(21)x x x y x +++'=-.29.求下列函数的导数.(1)n 1l y x x =+;(2)sin cos 22x y x x =-;(3)cos ex xy =【答案】(1)211y x x '=-.(2)11cos 2y x '=-(3)sin cos e x x x y +'=-.【详解】(1)22111(ln )(y x x x x''=+=-;(2)由已知1sin 2y x x =-,所以11cos 2y x '=-;(3)22(cos )e cos (e )sin e cos e sin cos (e )e e x x x x x x xx x x x x xy ''--⋅-⋅+'===-.30.求下列函数的导数:(1)21y x x=+;(2)e sin x y x =;(3)()2ln 3=+y x x x .【答案】(1)312y x -=-'(2)()e sin cos x y x x '=+(3)y '=()223ln 33x x x x ++++【详解】(1)解:()331212--=+-⋅=-'y x x(2)解:()()()e sin e sin e sin e cos e sin cos x x x x x y x x x x x x '''=+=+=+(3)解:()()()22223()ln 3ln 3ln 33+'⎡⎤'=+++=++'⎣⎦+x y x x x x x x x x x .31.()2ln 3=+y x x x .【答案】y '=()223ln 33x x x x ++++【详解】()()22ln 3ln 3y x x x x x x '⎡⎤''=+++⎣⎦()()221ln 3233x x x x x x =++⋅⋅++()223ln 33x x x x +=+++.32.21y x x =+;【答案】312y x -=-'【详解】221y x x x x-=+=+,()2312y x x x --'''=+=-.33.求下列函数的导数(1)2(2)(31)y x x =-+;(2)2cos 2x y x=【答案】(1)2272411y x x '=--(2)y '222cos(2)2sin(2)(cos 2)x x x x x +=【详解】(1)因为2232(2)(31)(2)(961)912112y x x x x x x x x =-+=-++=---,所以()()()32291211272411y x x x x x ''''=--=--(2)222222()cos 2(cos 2)2cos 2(2sin 2)cos 2(cos 2)(cos 2)x x x x x x x x x y x x x '''⎛⎫---'=== ⎪⎝⎭222cos(2)2sin(2)(cos 2)x x x x x +=34.求下列函数的导数(1)()2112f x x x x=--;(2)()e ln sin x f x x x =++【答案】(1)()3221x x f x x -+'=;(2)()1e cos xf x x x '=++【详解】(1)解:因为()2112f x x x x =--,则()3222111x x f x x x x -+=-+='.(2)解:因为()e ln sin x f x x x =++,则()1e cos xf x x x'=++.35.求下列函数的导数.(1)ln(21)y x =+;(2)sin cos x y x=;(3)()2ln 1y x x =+;(4)1()23()()y x x x =+++.【答案】(1)221y x '=+;(2)21cos y x =';(3)()2222ln 11x x xy +++'=;(4)231211y x x =++'.【详解】(1)函数ln(21)y x =+,所以()12212121y x x x '=⋅+=++'.(2)函数sin cos x y x =,所以()()''22222sin cos sin cos cos sin 1cos cos cos x x x x x x y x x x -+=='=.(3)函数2)ln(1y x x =+,所以22222212ln(1(1)())ln 111x x x x x x y x '++⋅⋅+=++++'=.(4)依题意,32123()()()6116y x x x x x x ==++++++,所以231211y x x =++'.36.求下列函数的导函数.(1)()4ln =+f x x x ;(2)()sin cos =-x f x x x;(3)()21e xf x -=.【答案】(1)31()4f x x x '=+;(2)()2cos sin sin x x xf x x x'-=+;(3)21()2e x f x '-=.【详解】(1)31()4f x x x '=+;(2)()2cos sin sin x x xf x x x'-=+.(3)2121(21()e )e 2x x x x f --'==⋅-'.37.求下列函数的导数.(1)y =(2)()()()123y x x x =+++;(3)y =【答案】(1)52322332sin cos 2x x x x x x y ---=-+-+';(2)231211y x x =++';(3)()221y x '=-【详解】(1) 13523222sin sin x x x x y x x x x -++==++∴()()3322sin y x x x x --'⎛⎫'''=++ ⎪⎝⎭52322332sin cos 2x x x x x x ---=-+-+.(2) ()()2323236116y x x x xx x =+++=+++,∴231211y x x =++'.(3)21y x===-∴()()()222122111y x x x '-'⨯-⎛⎫=== ⎪-⎝⎭--.38.求下列函数的导数:(1)()()311y x x =--;(2)sin 3y x =;(3)21ex x y +=.【答案】(1)32431y x x =--';(2)3cos 3y x =';(3)221e xx x y -+'=-【详解】(1)()()()()()()''3332321111131431y x x x x x x x x x =--+--=-+--'=-;(2)令3u x =,则sin y u =,所以()()''3sin 3cos 3cos3y x u u x =⋅==';(3)()()()()()()''2222221e 1e 2e 1e 21e e e x xx xxx xxx x x x x y +-+-+-+=='=-.39.求下列函数的导数:(1)πsin tan 0,2y x x x ⎛⎫⎛⎫=+∈ ⎪ ⎪⎝⎭⎝⎭;(2)()2ln 35y x =+.【答案】(1)21πcos 0,cos 2y x x x ⎛⎫'=+∈ ⎪⎝⎭;(2)()2223563535x x y x x '+'==++【详解】(1)πsin tan 0,2y x x x ⎛⎫⎛⎫=+∈ ⎪ ⎪⎝⎭⎝⎭()()()22cos cos sin sin sin 1πsin cos cos ,0,cos cos 2cos x x x x x y x x x x x x x '⋅-⋅-⎛⎫⎛⎫''=+=+=+∈ ⎪ ⎪⎝⎭⎝⎭(2)()2ln 35y x =+()2223563535x xy x x '+'==++40.求下列函数的导数:(1)21y x x =+;(2)()2ln 3=+y x x x .【答案】(1)312y x -=-'(2)()223ln 33x x x x ++++【详解】(1)解:()331212--=+-⋅=-'y x x ;(2)()()()22223()ln 3ln 3ln 33+'⎡⎤'=+++=++'⎣⎦+x y x x x x x x x x x .41.求下列函数的导数.(1)()2ln 2xx f x x +=;(2)()()3ln 45f x x =+.【答案】(1)()312ln ln 222xx x x -+-;(2)1245x +【详解】(1)函数()2ln 2xx f x x +=的定义域为()0+∞,.所以()()()()()()22232ln 2ln 212ln ln 222xxxx x x x x x f x x x ''+-+-+-'==(2)函数()()()3ln 453ln 45f x x x =+=+的定义域为54⎛⎫-+∞ ⎪⎝⎭,.所以()()'345124545x f x x x +==++'42.求下列函数的导数:(1)()2321cos y x x x =++;(2)2y =(3)18sin ln y x x x =+-;(4)32cos 3log xy x x x =-;(5)33sin 3log xy x x =-;(6)e cos tan x y x x =+.【答案】(1)()2(62)cos 321sin x x x x x +-++;(2)132291122x x --+;(3)17118cos x x x+-;(4)()332ln 2cos 2sin 3log 3log e x x x x x ---;(5)()313ln 3sin 3cos 3log e x x x x x +-⋅;(6)21e cos e sin cos x xx x x-+.【详解】(1)()()()22321cos 321cos y x x x x x x '''=+++++⋅()2(62)cos 321sin x x x x x =+-++.(2)3122235y x x x -==+-+,所以1222213331311222912y x x x x --'=⨯⋅+-⋅=-+.(3)17118cos y x x x'=+-.(4)()()()()332cos 2cos 3log log x x y x x x x x x'⎡⎤''''=+-+⎢⎥⎣⎦()332ln 2cos 2sin 3log 3log e x x x x x =---.(5)()()13sin 3sin 3ln 3x xy x x x '''=+-⋅()313ln 3sin 3cos 3log e x x x x x=+-⋅.(6)sin e cos tan e cos cos x xxy x x x x=+=+,故()()()()2sin cos cos sin e cos e cos cos x x x x x xy x x x''-'''=+⋅+21=e cos e sin cos x x x x x-+.43.求下列函数的导数:(1)2e axbxy -+=;(2)2sin(13)y x =-;(3)y(4)y =(5)2lg sin 2x y x ⎡⎤⎛⎫=+ ⎪⎢⎥⎝⎭⎣⎦;(6)221cos e x x y ⎛⎫+= ⎪⎝⎭.【答案】(1)2(2)eax bxax b -+-+(2)6cos(13)x --(3)()()()231cos 2sin 22ln 213x x x x x --+⋅+⋅+(4)cos 2(1sin )x x +(5)22cos 122lg e 2sin 2x x x x x ⎛⎫+ ⎪⎛⎫⎝⎭+⋅⋅ ⎪⎛⎫⎝⎭+ ⎪⎝⎭(6)22(1)1sin 2e e x x x x ⎛⎫-+ ⎪⎝⎭【详解】(1)因为函数2e axbxy -+=可以看做函数e u y =和2u ax bx =-+的复合函数,根据复合函数求导公式可得,xu x y y u '''=⋅()()2e u ax bx ''=⋅-+()e 2u ax b =⨯-+2(2)e axbxax b -+=-+;(2)因为函数2sin(13)y x =-可以看做函数2sin y μ=和13u x =-的复合函数,根据复合函数求导公式可得,xu x y y u '''=⋅()()2sin 13x μ''=⋅-()2cos 3μ=⨯-6cos(13)x =--;(3)因为函数y =y =()cos 2xu x =+的复合函数,根据复合函数求导公式可得,xu x y y u '''=⋅,又因为函数()cos 2xu x =+可以看做函数cos t μ=和2x t x =+的复合函数,根据复合函数求导公式可得,xt x t μμ'''=⋅所以x u t xy y u t ''''=⋅⋅()()cos2xt x'''=⋅⋅+()()231sin2ln213xtμ-⎛⎫=⨯-⨯+⎪⎝⎭()()()231cos2sin22ln213x x xx x-⎡⎤=+-+⨯+⎣⎦()()()231cos2sin22ln213x x xx x-=-+⋅+⋅+;(4)函数y=()1ln1sin2y x=+因为函数()1ln1sin2y x=+可以看做函数1ln2yμ=和1sinu x=+的复合函数,根据复合函数求导公式可得,x u xy y u'''=⋅,所以x u xy y u'''=⋅()1ln1sin2xμ'⎛⎫'=⋅+⎪⎝⎭1cos2xμ⎛⎫=⨯⎪⎝⎭cos2(1sin)xx=+;(5)因为函数2lg sin2xy x⎡⎤⎛⎫=+⎪⎢⎥⎝⎭⎣⎦可以看做函数lgy u=和2sin2xu x⎛⎫=+⎪⎝⎭的复合函数,根据复合函数求导公式可得,x u xy y u'''=⋅,又因为函数2sin2xu x⎛⎫=+⎪⎝⎭可以看做函数sin tμ=和22xt x=+的复合函数,根据复合函数求导公式可得,x t xtμμ'''=⋅所以x u t xy y u t''''=⋅⋅()()2lg sin2xt xμ'⎛⎫''=⋅⋅+⎪⎝⎭()11cos2ln102t xμ⎛⎫⎛⎫=⨯⨯+⎪⎪⎝⎭⎝⎭22cos122lg e2sin2x xxx x⎛⎫+⎪⎛⎫⎝⎭=+⋅⋅⎪⎛⎫⎝⎭+⎪⎝⎭;(6)函数221cos e x x y ⎛⎫+= ⎪⎝⎭可化为211cos 2e 2x x y ⎛⎫++ ⎪⎝⎭=,因为函数2221cos e 2xx y ⎛⎫++ ⎪⎝⎭=可以看做函数1cos 2y μ+=和222e xx u +=的复合函数,根据复合函数求导公式可得,x u x y y u '''=⋅,所以xu x y y u '''=⋅21cos 222e xx μ''⎛⎫++⎛⎫= ⎪ ⎪⎝⎭⎝⎭()224e e 221sin 2e x x x x x μ⎡⎤-+⎢⎥=-⋅⎢⎥⎣⎦21242sin 2e x x x μ⎛⎫-+-=-⋅ ⎪⎝⎭22(1)1sin 2e e x x x x ⎛⎫-+= ⎪⎝⎭.44.求下列函数的导数.(1)()()1ln 2y x x =+;(2)21e x y x+=.【答案】(1)y '()1ln 21x x =++(2)212122e ex x x y x ++-='【详解】(1)()()()()()()()111ln 21ln 2ln 21ln 21y x x x x x x x x x'=+++=++⋅=++⎡⎤⎣'⎦'(2)()2121212122e e 2e e x x x x x x x y x x ++++'⋅-⋅-==''45.求下列函数的导数.(1)y =(2)()621e 1x y x -+=-【答案】(1)()241y x -'=-;(2)()()521e 182x y x x -+'=--【详解】(1)2211221x y x ++===-()()()()()22212212211x x x x x y x x '''+--+-+⎛⎫'== ⎪-⎝⎭-()()()()222122411x x x x --+-==--(2)()()()()666212121e 1e 1e 1x x x y x x x -+-+-+'''⎡⎤⎡⎤'=-=-+-⎣⎦⎣⎦()()()()6552121212e 1e 61e 182x x x x x x x -+-+-+=--+⋅-=--46.求下列函数的导数.(1)52234y x x =--;(2)e sin xy x=.【答案】(1)4106y x x '=-;(2)2e sin e cos sin x x x xy x-'=【详解】(1)()()()5252423423106y x x x x x x ''''-==--=-(2)()()2e sin sin e e sin sin x x xx x y x x '''-⎛⎫'== ⎪⎝⎭2e sin e cos sin x x x x x -47.求下列函数的导数:(1)2sin y x x =;(2)n 1l y x x=+;(3)tan y x x =⋅;(4)()()()123y x x x =+++;(5)()()22332y x x =+-;(6)cos e xxy =.【答案】(1)22sin cos y x x x x '=+(2)211y x x'=-(3)2tan cos x y x x '=+(4)231211y x x =++'(5)21889y x x '=-+(6)sin cos e xx xy +'=-【详解】(1)()()()2222sin sin sin 2sin cos y x x x x x x x x x x ''''==+=+;(2)()21111ln ln y x x x x x x''⎛⎫⎛⎫''=+=+=- ⎪ ⎪⎝⎭⎝⎭;(3)()()222sin cos sin tan tan tan tan tan cos cos x x x y x x x x x x x x x x x x '+⎛⎫'''=⋅=+=+⋅=+⋅ ⎪⎝⎭2tan cos x x x =+;(4)()()()()()()123123y x x x x x x '''=+++++++⎡⎤⎡⎤⎣⎦⎣⎦()()()()()()()()()123123123x x x x x x x x x '''=+++++++++++()()()()()()231312x x x x x x =++++++++231211x x =++.(5)()()()()()()2222233223324323231889y x x x x x x x x x '''=+-+++=-++=-+;(6)()2cos 1111sin cos cos cos sin cos e e e e e e e x x x x x x xx x x y x x x x ''+⎛⎫⎛⎫⎛⎫''==+=-⋅+⋅-⋅=- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭.。
专题3-10 导数与数列,导数与概率统计(解析版)2023年高考数学二轮专题全套热点题型
![专题3-10 导数与数列,导数与概率统计(解析版)2023年高考数学二轮专题全套热点题型](https://img.taocdn.com/s3/m/16d4afbecd22bcd126fff705cc17552707225e3e.png)
a=1.
于是
f′(x)=
1 x
-1=
1
x
x
,
当 x(0,1)时,f′(x)>0,f(x)为增函数,当 x(1,+∞)时,f′(x)<0,f(x)为减函数,
即 f(x)的单调递增区间为(0,1),单调递减区间为(1,+∞).
(2) 由(1)知 x1(0,+∞),f(x1)≤f(1)=0,即 f(x1)的最大值为 0, 由题意知:对∀x1(0,+∞),∃x2(-∞,0)使得 f(x1)≤g(x2)成立,只需 f(x)max≤g(x)max.
在区间 ea1,1 单调递减.
又 f ea1 f 1 0 ,与 f x0 恒成立相矛盾.
综上, 实数 a 的取值范围为1, .
(2)
由(1)知当 a 1 时, x 1 x ln x ≤ 0 0 x ≤1
即 ln x ≥ x 1 1 1
x
x
令 x 1 ,则 ln 1 ≥1 n
.............................................................22
题型一:利用放缩通项公式解决数列求和中的不等问题
【典例分析】
例题
1.(2022·全国·高三专题练习)已知正项数列an 满足
a0
0,
a2 n1
an2
2(n
1), n
N
.
(1)求证: an2 an1 ; an1 an
.
4.(2022·湖南张家界·高二期末)已知函数 f x ln x ax 1,其中 a R .
(1)当 a 1 时,求函数 f (x) 的单调区间;
(2)①若 f x 0 恒成立,求 a 的最小值;
高三数学复习专题三统计与案例
![高三数学复习专题三统计与案例](https://img.taocdn.com/s3/m/2d0deff74793daef5ef7ba0d4a7302768e996ffa.png)
专题三统计与案例学校:___________姓名:___________班级:___________考号:___________一、解答题1.某高校数学系为了控制大一学生上课使用手机,针对上课使用手机情况,进行量化比,若发现上课使用手机则扣除其对应的积分,根据调查发现每次被扣分数与本系一大学生每周上课使用手机人数的关系如下表所示:(1)试根据以上数据,建立y 关于x 的回归直线方程(结果保留一位小数);参考公式:线性回归方程y bx a =+中,1221,ni ii nii x ynxy b a y bx xnx==-==--∑∑.(2)根据上述回归直线方程分析:每次扣分为多少时(精确到整数分)该系大一新生被扣分的总数最大; (3)若学校规定,大一新生每学期(按20周上课计算)因为上课使用手机被扣分总数不超过1000分,则该系大一被定为控制手机合格,那么,每周上课使用手机至少扣多少分时(扣分不低于5分,精确到整数),31.6≈)2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该企业为了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+;②e x t y λ+=,其中,,,tαβλ均为常数,e 为自然对数的底数.令2i i u x =,ln (1,2,,10)i v y i ==,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好;(2)根据(1)的选择及表中数据,建立y 关于x 的回归方程(回归系数精确到0.01).附:相关系数()()niix x y y r --=∑线性回归直线方程y bx a =+,其中附:()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人)(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,求其中至少有1人是“天文爱好者”的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.4.COP15大会原定于2020年10月15-28日在昆明举办,受新冠肺炎疫情影响,延迟到今年10月11-24日在云南昆明举办,同期举行《生物安全议定书》、《遗传资源议定书》缔约方会议.为助力COP15的顺利举行,来自全省各单位各部门的青年志愿者们发扬无私奉献精神,用心用情服务,展示青春风采.会议结束后随机抽取了50名志愿者,统计了会议期间每个人14天的志愿服务总时长,得到如图的频率分布直方图:(1)求x的值,估计抽取的志愿者服务时长的中位数;20,40,80,100这两组样本中随机抽取6名志愿者,记录每个人的服务总时长得(2)用分层抽样的方法从[)[)到如图所示的茎叶图:①已知这6名志愿者服务时长的平均数为67,求m的值;80,100这组的概率.②若从这6名志愿者中随机抽取2人,求所抽取的2人恰好都是[)5.为了了解高二学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3;第二小组频数为12.(1)第二小组的频率是多少,样本容量是多少;(2)若次数在110以上(含110次)为达标,试估计该学校全体高二学生的达标率是多少;(3)在这次测试中,估计学生跳绳次数的众数和中位数、平均数各是多少.(结果均保留整数.)6.2021年10月16日,搭载“神州十三号”的火箭发射升空,这是一件让全国人民普遍关注的大事,因此每天有很多民众通过手机、电视等方式观看有关新闻.某机构将每天关注这件大事的时间在2小时以上的人称为“天文爱好者”,否则称为“非天文爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):(1)将上表中的数据填写完整,并判断能否在犯错误的概率不超过0.005的前提下认为“天文爱好者”或“非天文爱好者”与性别有关?(2)现从抽取的女性人群中,按“天文爱好者”和“非天文爱好者”这两种类型进行分层抽样抽取5人,然后再从这5人中随机选出3人,记其中“天文爱好者”的人数为X,求X的分布列和数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.7.某投资公司2012年至2021年每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型①:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-;模型②:由图中样本点的分布,可以认为样本点集中在由线:ln y b x a =+的附近,对投资金额x 做换元,令ln t x =,则y b t a =⋅+,且有101010102111122.00,230,569.00,50.92ii i i i i i i i ty t y t ========∑∑∑∑,(1)根据所给的统计量,求模型②中y 关于x 的回归方程;(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本()()1,1,2,,i t y i n =⋯的最小乘估计公式为()()()121ˆˆˆ,niii ni i t t y y bay bt t t ==--==--∑∑;参考数据:ln20.6931,ln5 1.6094≈≈.8.下图是立德学校高二育才班摸底考试数学成绩不低于90分的人数的频率分布直方图,为激励学生的学习热情,班级决定对数学成绩高于110分的同学进行奖励.(1)若图中成绩在[100,110)分数段的人数为12人,求此次考试应奖励的人数;(2)用统计学知识估计数学成绩在90分及以上学生的数学成绩的中位数和平均数.(结果保留整数)9.某城市在进行新冠疫情防控中,为了解居民对新冠疫情防控的满意程度,组织居民给活动打分(分数为40,100内﹒现将这些分整数,满分为100分),从中随机抽取一个容量为180的样本,发现所有数据均在[]数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示﹒观察图形,回答下列问题:60,70的频数;(1)算出第三组[)(2)请根据频率分布直方图,估计样本的众数、中位数和平均数﹒(每组数据以区间的中点值为代表) 10.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,实验数据经整理得到如下的折线图:由图可以看出,这种酶的活性指标值y 与温度x 具有较强的线性相关关系,请用相关系数加以说明.附:()()6185i ii x xy y =--=∑5.5= 2.65≈,样本相关系数()()niix x y y r --=∑11.新个体经济是中国经济社会数字化转型条件下出现的新生事物,指微商电商,网络直播、职业创作者等,下表是2021年1至4月份某市新增“微商电商”的统计数据:(1)请利用所给数据求新增微商电商个数y 与月份x 之间的线性回归方程ˆˆˆybx a =+,并预测该市2021年5月新增“微商电商”的个数(结果用四舍五入法保留整数);(2)一般认为当||0.9r ≥时,线性回归方程的拟合效果非常好;当0.75|0.9|r <≤时,线性回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.1122211()()ˆ()()n ni iiii i nniii i x y nxy x x y x bxn x x x ====---==--∑∑∑∑,()()nni iiix y nxyx x yy r---=∑∑ˆˆ17.0294ay bx =-≈18.1659≈19.2354≈.。
高考总复习理数(人教版)课时作业提升第12章算法初步统计统计案例第4节变量间的相关关系与统计案例
![高考总复习理数(人教版)课时作业提升第12章算法初步统计统计案例第4节变量间的相关关系与统计案例](https://img.taocdn.com/s3/m/fbfb1eb348649b6648d7c1c708a1284ac85005b0.png)
课时作业提升(七十三) 变量间的相关关系与统计案例(对应学生用书P 298) A 组 夯实基础1.已知x 与y 之间的一组数据:x 0 1 2 3 ym35.57已求得关于y 与x 的线性回归方程y ^=2.1x +0.85,则m 的值为( ) A .1 B .0.85 C .0.7D .0.5解析:选D 回归直线必过样本中心点(1.5,y -),故y -=4,m +3+5.5+7=16,得m =0.5.2.已知某车间加工零件的个数x 与所花费时间y (h)之间的线性回归方程为y ^=0.01x +0.5,则加工600个零件大约需要的时间为( )A .6.5 hB .5.5 hC .3.5 hD .0.3 h解析:选A 将600代入线性回归方程y ^=0.01x +0.5中得需要的时间为6.5 h. 3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg解析:选D A 中由于回归方程中的x 系数为正,所以具有正的线性相关关系,A 正确;B 由线性回归方程的推导可知回归方程必过样本点的中心(x -,y -),B 正确;C 中,身高增加1 cm ,则Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85(kg),C 正确.D 中,将170代入回归方程得y =58.79 kg ,这个值只能是一个推测的结果,和实际值允许有误差,D 错误.4.已知x ,y 的取值如下表:从所得散点图中分析可知:y 与x 线性相关,且y =0.95x +a ,则x =13时,y 等于( ) A .1.45 B .13.8 C .13D .12.8解析:选B 由题意,x -=16×(0+1+4+5+6+8)=4,y -=16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25,∵y 与x 线性相关,且y ^=0.95x +a ^,∴5.25=0.95×4+a ^,∴a ^=1.45,从而当x =13时,有y =13.8.故选B .5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.6.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4℃时,用电量的度数约为________.解析:x -=10,y -=40,回归方程过点(x -,y -),∴40=-2×10+a ^.∴a ^=60.∴y ^=-2x +60. 令x =-4,∴y ^=(-2)×(-4)+60=68. 答案:687.某高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:为了判断主修的数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.解析:∵K 2≈4.844>3.841,∴有95%的把握认为主修统计专业与性别有关系,即作出“主修统计专业与性别有关系”的判断,出错的可能性不超过5%.答案:5%8.考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________cm.解析:根据回归方程y ^=1.197x -3.660,将x =50代入,得y =56.19,则肱骨长度的估计值为56.19 cm.答案:56.199.(2018·菏泽质检)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解:(1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:∑i =14x 2i =86,x -=3+4+5+64=4.5(吨),y -=2.5+3+4+4.54=3.5(吨).已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x -·y-∑i =14x 2i -4x -2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y --b ^x -=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).B 组 能力提升1.(2018·重庆测试)为了判定两个分类变量X 和Y 是否有关系,应用独立性检验法算得K 2的观测值为5,又已知P (K 2≥3.841)=0.05,P (K 2≥6.635)=0.01,则下列说法正确的是( )A .有95%的把握认为“X 和Y 有关系”B .有95%的把握认为“X 和Y 没有关系”C .有99%的把握认为“X 和Y 有关系”D .有99%的把握认为“X 和Y 没有关系”解析:选A 依题意,K 2=5,且P (K 2≥3.841)=0.05,因此有95%的把握认为“X 和Y 有关系”,选A .2.(2018·河南八市联考)某公司在2018年上半年的收入x (单位:万元)与月支出y (单位:万元)的统计资料如表所示:月份 1 2 3 4 5 6 收入x 12.3 14.5 15.0 17.0 19.8 20.6 支出y5.635.755.825.896.116.18根据统计资料,则( )A .月收入的中位数是15,x 与y 有正线性相关关系B .月收入的中位数是17,x 与y 有负线性相关关系C .月收入的中位数是16,x 与y 有正线性相关关系D .月收入的中位数是16,x 与y 有负线性相关关系解析:选C 月收入的中位数是15+172=16,由表可知收入增加,支出增加,故x 与y有正线性相关关系,故选C .3.(2018·临沂质检)已知变量x 与y 之间的回归直线方程为y ^=-3+2x ,若∑i =110x i =17,则∑i =110y i 的值等于( )A .3B .4C .0.4D .40解析:选B 依题意x -=1710=1.7,而直线y ^=-3+2x 一定经过样本点的中心(x -,y -),所以y -=-3+2x -=-3+2×1.7=0.4,所以∑i =110y i =0.4×10=4.4.(2018·河南八市联考)为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:开业天数 10 2030 40 50 销售额/天(万元)62758189根据上表提供的数据,求得y 关于x 的线性回归方程为y =0.67x +54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为________.解析:设表中模糊看不清的数据为m .因为x -=10+20+30+40+505=30,又样本中心(x -,y -)在回归直线y ^=0.67x +54.9上, 所以y -=m +3075=0.67×30+54.9,得m =68.答案:685.(2018·烟台质检)在2017年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =________.解析:x -=9+9.5+m +10.5+115=8+m 5,y -=11+n +8+6+55=6+n 5,回归直线一定经过样本点中心(x -,y -), 即6+n5=-3.2⎝⎛⎭⎫8+m 5+40,即3.2m +n =42. 又因为m +n =20,即⎩⎪⎨⎪⎧ 3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.答案:106.(2018·沈阳质检)为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.(1)求2×2列联表中的数据x ,y ,A ,B 的值; (2)绘制发病率的条形统计图,并判断疫苗是否有效?(3)能够有多大把握认为疫苗有效? 附:K 2=n (ad -bc )2(a +b )(a +c )(c +d )(b +d ),n =a +b +c +dP (K 2≥k 0)0.05 0.01 0.005 0.001 k 03.8416.6357.87910.828解:(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”为事件E ,由已知得P (E )=y +30100=25,所以y =10,B =40,x =40,A =60.(2)未注射疫苗发病率为4060=23,注射疫苗发病率为1040=14.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率,且注射疫苗的发病率小,故判断疫苗有效.(3)K 2=100×(20×10-30×40)250×50×40×60=503≈16.667>10.828. 所以至少有99.9%的把握认为疫苗有效.7.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1—7分别对应年份2008—2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以证明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t)2∑i =1n(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解:(1)由折线图中的数据和附注中的参考数据得t =4,∑i =17(t i -t)2=28, ∑i =17(y i -y )2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103. a ^=y -b ^t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.。