高考文科数学命题热点名师解密专题:统计的命题规律(有答案)AlAlwU
2017高考数学文新课标版考前冲刺复习讲义:第2部分专

透视全国高考 揭秘命题规律(三)——数列(全国卷第17题)数列问题是高频考点中的高频,历年来是命题专家命题的热点,每年的考题都是在以基础知识为起点上的推陈出新,似有岁岁年年花相似、年年岁岁题不同之感,然而归纳起来有下列三种常考题型.数列的基本运算[学生用书P37](2016·高考全国卷甲)等差数列{a n }中,a 3+a 4=4,a 5+a 7=6. (1)求{a n }的通项公式;(2)设b n =[a n ],求数列{b n }的前10项和,其中[x ]表示不超过x 的最大整数,如[0.9]=0,[2.6]=2.【解】 (1)设数列{a n }的公差为d ,由题意有2a 1+5d =4,a 1+5d =3. 解得a 1=1,d =25.所以{a n }的通项公式为a n =2n +35.(2)由(1)知,b n =⎣⎡⎦⎤2n +35.当n =1,2,3时,1≤2n +35<2,b n =1;当n =4,5时,2<2n +35<3,b n =2;当n =6,7,8时,3≤2n +35<4,b n =3;当n =9,10时,4<2n +35<5,b n =4.所以数列{b n }的前10项和为1×3+2×2+3×3+4×2=24.1.根据数列类型,结合两个已知条件,列出方程组.(若是等差数列,列出关于首项a 1与公差d 的方程组;若是等比数列,列出关于首项a 1,与公比q 的方程组).2.根据条件,求解方程组.3.根据结论需求代入相关公式求通项或前n 项和.数列的判定与证明[学生用书P37]已知数列{a n }的前n 项和为S n ,a 1=1,a n ≠0,a n a n +1=λS n -1,其中λ为常数. (1)证明:a n +2-a n =λ;(2)是否存在λ,使得{a n }为等差数列?并说明理由.【解】 (1)证明:由题设知a n a n +1=λS n -1,a n +1a n +2=λS n +1-1, 两式相减得a n +1(a n +2-a n )=λa n +1, 由于a n +1≠0, 所以a n +2-a n =λ.(2)由题设知a 1=1,a 1a 2=λS 1-1,可得a 2=λ-1. 由(1)知,a 3=λ+1. 令2a 2=a 1+a 3, 解得λ=4.故a n +2-a n =4,由此可得{a 2n -1}是首项为1,公差为4的等差数列,a 2n -1=4n -3; {a 2n }是首项为3,公差为4的等差数列,a 2n =4n -1. 所以a n =2n -1,a n +1-a n =2,因此存在λ=4,使得数列{a n }为等差数列.1.将已知关系转化为a n +1-a n =d (等差数列)或a n +1a n=q (等比数列).2.常用a n 与S n 的关系式a n =⎩⎪⎨⎪⎧S 1,n =1S n -S n -1,n ≥2.3.常见的类型有①a n =kn +b ⇔{a n }是等差数列. ②S n =An 2+Bn ⇔{a n }是等差数列. ③a n =c 1·c n 2(c 1c 2≠0)⇔{a n }是等比数列. ④S n =c +λq n ⇔{a n }是等比数列.已知递推关系求解数列[学生用书P38]满分展示(满分12分)(2016·高考全国卷乙)已知{a n }是公差为3的等差数列,数列{b n }满足b 1=1,b 2=13,a n b n +1+b n +1=nb n .(1)求{a n }的通项公式; (2)求{b n }的前n 项和. [联想破译]联想因素:等差数列、通项公式、前n 项和联想线路:(1)把n =1代入式子a n b n +1+b n +1=nb n ,即可求出数列{a n }的首项,再利用等差数列的通项公式,即可求其通项公式;(2)将(1)中得到的{a n }的通项公式代入式子a n b n +1+b n +1=nb n ,即可判断{b n }为等比数列,再利用等比数列的前n 项和公式,得出结果.[标准答案](1)由已知,a 1b 2+b 2=b 1,b 1=1,b 2=13,得a 1=2.(3分)所以数列{a n }是首项为2,公差为3的等差数列,(4分) 通项公式为a n =3n -1.(6分)第(1)问得分点说明: 正确求出a 1的值得3分; 指出数列{a n }的性质得1分; 正确求出数列{a n }的通项公式得2分(2)由(1)和a n b n +1+b n +1=nb n ,得b n +1=b n3,(9分)因此数列{b n }是首项为1,公比为13的等比数列.(10分) 设数列{b n }的前n 项和为S n ,则S n =1-⎝⎛⎭⎫13n1-13=32-12×3n -1.(12分)第(2)问得分点说明:正确求出b n +1与b n 的关系得3分; 指出数列{b n }的性质得1分; 代入求和公式,正确求出S n 得2分 ,[解题程序]第一步:将n =1代入关系式a n b n +1+b n +1=nb n ,求出a 1的值; 第二步:利用等差数列的通项公式求出a n ;第三步:将第(1)问中求得的a n 代入关系式a n b n +1+b n +1=nb n ,求得b n +1与b n 的关系; 第四步:判断数列{b n }为等比数列; 第五步:代入等比数列的前n 项和公式求S n . [满分心得] (1)写全得分步骤对于解题过程中是得分点的步骤,有则给分,无则没分,所以对于得分点步骤一定要写全,如第(1)问要写出a 1b 2+b 2=b 1,b 1=1,b 2=13,才能得出a 1,第(2)问中一定要写出求b n+1=b n3的步骤并要指明{b n }的性质. (2)写明得分关键对于解题过程中的关键点,有则给分,无则没分,所以在答题时一定要写清得分关键点,如第(1)问中不能直接写出a 1=2,必须列出a 1b 2+b 2=b 1,b 1=1,b 2=13,否则不能得全分;必须指出数列{a n }的性质,不能直接写出a n ,否则不能得全分;第(2)问中必须由a n b n +1+b n+1=nb n 得出b n +1=13b n ,并得出{b n }为等比数列的结论,否则不得分,必须代入求和公式而不能直接写出结果,否则要扣分.。
2020年高考一轮复习数学(文)教学课件第十章 统计与统计案例第一节 随机抽样

(三)填一填 4.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对
其服务的评价有较大差异.为了解客户的评价,该公司准 备进行抽样调查,可供选择的抽样方法有简单随机抽样、 分层抽样和系统抽样,则最合适的抽样方法是________. 解析:因为客户数量大,且不同年龄段客户对其服务的评 价有较大差异,所以最合适的抽样方法是分层抽样. 答案:分层抽样
[答案] B
[解题技法] 应用简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是 否方便;二是号签是否易搅匀.一般地,当总体容量和样本容 量都较小时可用抽签法. (2)在使用随机数法时,如遇到三位数或四位数,可从选择 的随机数表中的某行某列的数字计起,每三个或四个作为一个 单位,自左向右选取,有超过总体号码或出现重复号码的数字 舍去.
2.(2018·南昌摸底调研)某校高三(2)班现有 64 名学生,随机编 号为 0,1,2,…,63,依编号顺序平均分成 8 组,组号依次 为 1,2,3,…,8.现用系统抽样方法抽取一个容量为 8 的样 本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取 的号码为________. 解析:由题知分组间隔为684=8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号码为 5×8+5=45.
[题组训练]
1.总体由编号为 01,02,…,19,20 的 20 个个体组成,利用下
面的随机数表选取 5 个个体,选取方法是从随机数表第 1
行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,
则选出来的第 5 个个体的编号为
()
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
部编版高中数学必修二第九章统计带答案解题技巧总结

(名师选题)部编版高中数学必修二第九章统计带答案解题技巧总结单选题1、某大品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13),[13,17),[17,21),[21,25],并整理得到如下的频率分布直方图,据此估计其全部销售员工中销售额在区间[9,13)内的人数为()A.16B.22C.64D.882、中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是()A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三增加了1倍以上C.这一星期内甲的日步数的平均值大于乙D.这一星期内甲的日步数的方差大于乙3、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.54、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.55、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.196、奥运会跳水比赛中共有7名评委给出某选手原始评分,在评定该选手的成绩时,去掉其中一个最高分和一个最低分,得到5个有效评分,则与7个原始评分(不全相同)相比,一定会变小的数字特征是()A.众数B.方差C.中位数D.平均数7、某高中学校为了促进学生个体的全面发展,针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团.已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:.为了了解学生对两个社团活动的满意程其中x:y:z=5:3:2,且“泥塑”社团的人数占两个社团总人数的35度,从中抽取一个容量为50的样本进行调查,则从“剪纸”社团的高二年级学生中应抽取的人数为()A.4B.6C.9D.108、某书店新进了一批书籍,下表是某月中连续6天的销售情况记录:本B.1110本C.1340本D.1278本多选题9、某校高三1班48名物理方向的学生在一次质量检测中,语文成绩、数学成绩与六科总成绩在全年级中的排名情况如下图所示,“”表示的是该班甲、乙、丙三位同学对应的点.从这次考试的成绩看,下列结论正确的是()A.该班六科总成绩排名前6的同学语文成绩比数学成绩排名更好B.在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是语文C.数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强D.在甲、乙两人中,其语文成绩名次比其六科总成绩名次靠前的学生是甲10、甲、乙两人进行飞镖游戏,甲的10次成绩分别为8,6,7,7,8,10,10,9,7,8,乙的10次成绩的平均数为8,方差为0.4,则()A.甲的10次成绩的极差为4B.甲的10次成绩的75%分位数为8C.甲和乙的20次成绩的平均数为8D.甲和乙的20次成绩的方差为111、某校举行“永远跟党走、唱响青春梦”歌唱比赛,在歌唱比赛中,由9名专业人士和9名观众代表各组成一个评委小组给参赛选手打分.根据两个评委小组(记为小组A、小组B)对同一名选手打分的分值绘制成折线图如图所示,则()A.小组A打分的分值的众数为47B.小组B打分的分值第80百分位数为69C.小组A是由专业人士组成的可能性较大D.小组B打分的分值的方差小于小组A打分的分值的方差填空题12、一组数据共40个,分为6组,第1组到第4组的频数分别为10、5、7、6,第5组的频率为0.1,则第6组的频数为______.13、以下数据为某校参加数学竞赛的20名同学的成绩:82,80,84,89,90,76,88,82 ,96,95,95,96,90,89,95,92,98,83,90,91.则这20人成绩的第75百分位数可以是______.部编版高中数学必修二第九章统计带答案(二十八)参考答案1、答案:C分析:先由各组的频率和为1,求出a,从而可求得区间[9,13)的频率,进而可求出在区间[9,13)内的人数由题意得,4(0.02+a+0.09+0.03+0.03)=1,解得a=0.08,所以销售额在区间[9,13)内的频率为0.32,所以全部销售员工中销售额在区间[9,13)内的人数为200×0.32=64,故选:C2、答案:B分析:对于A:直接求出中位数;对于B:求出乙的星期三和星期四步数,计算可得;对于C:分别计算出甲、乙平均数,即可判断;对于D:分别计算出甲、乙方差,即可判断;对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:乙的星期三步数7030,星期四步数12970.因为129707030≈1.84<2,所以没有增加1倍上.故B不正确;对于C:x甲=17(16000+7965+12700+2435+16800+9500+11600)=11000,x乙=17(14200+12300+7030+12970+5340+11600+10060)=10500.所以x甲>x乙.故C正确;对于D:s甲2=17[(16000−11000)2+(7965−11000)2+(12700−11000)2+(2435−11000)2+(16800−11000)2+(9500−11000)2+(11600−11000)2]≈20958636s乙2=17[(14200−10500)2+(12300−10500)2+(7030−10500)2+(12970−10500)2+(5340−10500)2+(11600−10500)2+(10060−10500)2]≈9014429所以s甲2>s乙2.故D正确;故选:B.3、答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案.一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.4、答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A5、答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.6、答案:B分析:根据题意,由数据的中位数、平均数、方差、众数的定义,分析可得答案. 对于A :众数可能不变,如8,7,7,7,4,4,1,故A 错误;对于B :方差体现数据的偏离程度,因为数据不完全相同,当去掉一个最高分、一个最低分,一定使得数据偏离程度变小,即方差变小,故B 正确;对于C :7个数据从小到大排列,第4个数为中位数,当首、末两端的数字去掉,中间的数字依然不变,故5个有效评分与7个原始评分相比,不变的中位数,故C 错误; 对于C :平均数可能变大、变小或不变,故D 错误; 故选:B 7、答案:B分析:先按分层抽样求出高二年级人数,再按样本占总体的比例得解. 因为“泥塑”社团的人数占总人数的35,所以“剪纸”社团的人数占总人数的25,人数为800×25=320. 因为“剪纸”社团中高二年级人数比例为yx+y+z =35+3+2=310, 所以“剪纸”社团中高二年级人数为320×310=96. 以从“剪纸”社团的高二年级学生中抽取的人数为96×50800=96×116=6.故选:B. 8、答案:A分析:由表格中的数据可以看出每天的销售数量在一个数值附近波动,故用平均数估计总体即可.由表中6天的销售情况可得,一天的平均销售量为16(30+40+28+44+38+42)=37(本),该月共31天,故该月的销售总量约为37×31=1147(本). 故选: A 9、答案:BCD分析:结合图形可分析出答案.由图可得,该班六科总成绩排名前6的同学数学成绩比语文成绩排名更好,故A 错误;由右图可得丙同学的总成绩排在班上倒数第三名,其语文成绩排在250到300名之间, 从左图可得其数学成绩排在400名左右,故B 正确;数学成绩与六科总成绩的相关性比语文成绩与六科总成绩的相关性更强,因为右图的点的分布较左图更分散,故C 正确;由左图可得甲的总成绩排在班上第7名,年级名次100多一点,对应到右图可得,其语文成绩排在年级近100名,故甲的语文成绩名次比其六科总成绩名次靠前, 由左图可得甲的总成绩排在班上第27名,年级名次接近250名,对应到右图可得,其语文成绩排在年级250名之后,故乙的语文成绩名次比其六科总成绩名次靠后,故D 正确; 故选:BCD 10、答案:ACD分析:根据极差,百分位数,平均数和方差的定义计算求解即可 甲的10次成绩中,最大值为10,最小值为6,极差等于4,故A 正确,因为10×75%=7.5,所以将甲的10次成绩从小到大排列后,第8个数为75%分位数,即75%分位数等于9,故B 不正确,经计算,甲的10次成绩的平均数等于8,又已知乙的10次成绩的平均数等于8,则甲和乙的20次成绩的平均数为8,故C 正确,s 甲2=110[(6−8)2+3×(7−8)2+(9−8)2+2×(10−8)2]=1.6,s 2=10×(1.6+0)+10×(0.4+0)10+10=120×[(10×1.6+10×0.4)+10×1010+10×0]=1,故D 正确,方差也可以用s 2=1n∑(x i −x̅)2ni=1=1n∑(x i 2−nx̅2)ni=1=1n∑x i 2ni=1−x̅进行求解,即:s 甲2=110∑x i 210i=1−x̅=110∑x i 210i=1−8=1.6,s 乙2=110∑x i 220i=11−x̅=110∑x i 220i=11−8=0.4,所以110∑x i 220i=1−16=2,即120∑x i 220i=1−8=1,故D 正确. 故选:ACD 11、答案:AC分析:根据小组A中数据,可得其众数,可判断A的正误;根据百分位数的求法,可判断B的正误;根据数据波动情况,可判断C、D的正误,即可得答案.由折线图知,小组A打分的9个分值排序为:42,45,46,47,47,47,50,50,55,小组B打分的9个分值排序为:36,55,58,62,66,68,68,70,75;对于A:小组A打分的分值的众数为47,故选项A正确;对于B:小组B打分的分值第80百分位数为9×80%=7.2,所以应排序第8,所以小组B打分的分值第80百分位数为70,故选项B不正确;对于C:小组A打分的分值比较均匀,即对同一个选手水平对评估相对波动较小,故小组A更像是由专业人士组成,故选项C正确;对于D:小组A打分的分值的均值约47.7,小组B打分的分值均值为62,根据数据的离散程度可知小组B波动较大,方差较大,选项D不正确;故选:AC12、答案:8分析:根据第5组的频率为0.1可求第5组的频数,从而可求第6组的频数.因为第5组的频率为0.1,故第5组的频数为0.1×40=4,故第6组的频数为40−10−5−7−6−4=30−22=8,所以答案是:8.13、答案:95分析:利用百分位数的求法直接求解即可.解:将所给数据按照从小到大的顺序排列:76,80,82,82,83,84,88,89,89,90 ,90,90,91,92,95,95,95,96,96,98.数据量n=20,∵c=n×75%=20×75%=15是整数,∴P75=x15+x162=95+952=95所以答案是:95.。
统计(5大易错点分析+解题模板+举一反三+易错题通关)-备战2024年高考数学考试易错题(原卷版)

专题13统计易错点一:统计用表中概念不清、识图不准致误(频率分布直方图、总体取值规律)频率分布直方图作频率分布直方图的步骤①求极差:极差为一组数据中最大值与最小值的差.②决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.③将数据分组④列频率分布表各小组的频率=小组频数样本容量.⑤画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.频率分布直方图的性质①因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.②在频率分布直方图中,各小矩形的面积之和等于1.③频数相应的频率=样本容量.④频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.易错提醒:频率分布条形图和频率分布直方图是两个完全不同的概念,考生应注意两者之间的区别.虽然它们的横轴表示的内容是相同的,但是频率分布条形图的纵轴表示频率;频率分布直方图的纵轴表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.例:如图所示是某公司(共有员工300人)2021年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有______人.易错分析:解本题容易出现的错误是审题不细,对所给图形观察不细心,认为员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.1020.60-++⨯=,从而得到员工中年薪在1.4万元~1.6万元之间的共有3000.60180⨯=(人)的错误结论.正解:由所给图形,可知员工中年薪在1.4万元~1.6万元之间的频率为()10.020.080.080.100.1020.24-++++⨯=,所以员工中年薪在1.4万元~1.6万元之间的共有3000.2472⨯=(人).故72.易错警示:考生误认为频率分布直方图中纵轴表示的是频率,这是错误的,而是“频率/组距”,所以频率对应的是各矩形的面积.变式1:某大学有男生2000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将这100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[)66,70、[)70,74、[]74,78,绘制成如下的频率分布直方图:70,78上的男生大约有人.该校体重(单位:kg)在区间[]变式2:现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测量物性指标值,得到如下频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为.变式3:如图是根据我国部分城市某年6月份的平均气温数据得到的样本频率分布直方图,其中平均气温的范围是[20,26],样本数据的分组为[20,21),[21,22),[22,23),[23,24),[24,25),[25,26].已知样本中平均气温低于22°C的城市个数为11,样本中平均气温不低于25°C的城市个数是.1.已知某班全体学生在某次数学考试中的成绩(单位:分)的频率分布直方图如图所示,则图中a所代表的数值是.2.某校共有400名学生参加了趣味知识竞赛(满分:这400名学生的竞赛成绩分组如下:分布直方图如图所示,则这400名学生中竞赛成绩不低于3.从某小学所有学生中随机抽取100名学生,将他们的身高(单位:图),其中样本数据分组[100,110),[110,120),[120,130),[130,140),[140,150)4.某工厂抽取100件产品测其重量(单位:[[[[,42],据此绘制出如图所示的频率分布直方图,则重量在40,40.5),40.5,41),41,41.5),41.5件数为.5.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数()()()f c p c q c =+,则函数()f c 在区间[95,105]取得最小值时c =.6.某大学有男生10000名.为了解该校男生的身体体重情况,随机抽查了该校100100名男生的体重(单位:kg )分成以下六组:[)54,58、[)58,62、[)62,66、[66,70kg []7.某中学为了解高三男生的体能情况,通过随机抽样,获得了秒),将数据按照[)11.5,12,[)12,12.5,…8.某工厂对一批产品的长度(单位:mm)进行检验,将抽查的产品所得数据分为五组,整理后得到的频率分布直方图如图所示,若长度在20mm以下的产品有30个,9.某中学为了解学生的数学学习情况,在全体学生中随机抽取30,40成绩,将所得的数据分为7组:[)图,则在被抽取的学生中,该次数学考试成绩不低于10.某区为了解全区12000名高二学生的体能素质情况,测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这平均成绩的估计值为.11.将一个容量为100的样本数据,按照从小到大的顺序分为组号123456频数10161815若第6组的频率是第3组频率的12.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理易错点二:统计中的数字特征的实际意义理解不清楚致误(频率分布直方图特征数考查)众数、中位数、平均数①众数:一组数据中出现次数最多的数.②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.③平均数:如果n个数x1,x2,…,x n,那么()∑==+++=niinxnxxxnx12111叫做这n个数的平均数.总体集中趋势的估计①平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.②一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.频率分布直方图中平均数、中位数、众数的求法①样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.②在频率分布直方图中,中位数左边和右边的直方图的面积应相等.③将最高小矩形所在的区间中点作为众数的估计值.易错提醒:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例.某班50名学生期中考试数学成绩的频率分布直方图如图所示.根据频率分布直方图,估计该班本次测试众数为.变式1:为响应自己城市倡导的低碳出行,小李上班可以选择自行车,他记录了100次骑车所用时间(单位:分钟),得到频率分布直方图,则骑车时间的众数的估计值是分钟变式2:数学兴趣小组的四名同学各自抛掷骰子5次,分别记录每次骰子出现的点数,四名同学的部分统计结果如下:甲同学:中位数为3,方差为2.8;乙同学:平均数为3.4,方差为1.04;丙同学:中位数为3,众数为3;丁同学:平均数为3,中位数为2.根据统计结果,数据中肯定没有出现点数6的是同学.变式3:以下5个命题中真命题的序号有.①样本数据的数字特征中,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息;②若数据1x ,2x ,3x ,…,n x 的标准差为S ,则数据1ax b +,2ax b +,3ax b +,…,n ax b +的标准差为aS ;③将二进制数(2)11001000转化成十进制数是200;④x 是区间[0,5]内任意一个整数,则满足“3x <”的概率是35.1.2022年11月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,组委会在某场比赛结束后,随机抽取了1000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:[)70,75,[)75,80,[)80,85,[)85,90,[)90,95,[]95,100,得到如图所示的频率分布直方图.图中部分数据丢失,若已知这1000名观众评分的中位数估计值为87.5,则m=.2.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为e m ,众数为o m ,平均数为x ,则,,e o m m x 的大小关系是.3.《中国居民膳食指南(2022)》数据显示,学生的体重情况,某机构从该地中学生中随机抽取数据,按[)40,45,[)45,50,[50,55所示.根据调查的数据,估计该地中学生体重的中位数是4.为了解某校高三学生的数学成绩,随机地抽查了该校布直方图如图所示.请根据以上信息,估计该校高三学生数学成绩的中位数为两位)5.2021年某省高考体育百米测试中,成绩全部介于按如下方式分成六组:第一组[12,13该100名考生的成绩的中位数(保留一位小数)是6.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别为.7.某快递驿站统计了近期每天代收快件的数量,并制成如下图所示的频率分布直方图.则该快递驿站每天代收包裹数量的中位数为8.某质检部门对某新产品的质量指标随机抽取10.某大学天文台随机调查了该校100位天文爱好者的年龄,得到如下样本数据频率分布直方图,则估计该校100名天文爱好者的平均岁数为.11.众数、平均数和中位数都描述了数据的集中趋势,、、分别表示众数、平均数、形态中,m n p12.如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为易错点三:运用数字特征作评价时考虑不周(方差、标准差的求算)方差、标准差①假设一组数据为n x x x x ,,,321,则这组数据的平均数()∑==+++=ni i n x n x x x n x 12111 ,方差为()()()[]()⎪⎪⎭⎫ ⎝⎛-=-=-+-+-=∑∑=2221222212111n ii n i i n x n x n x x n x x x x x x ns ,标准差()211∑=-=ni i x x n s ②若假设一组数据为n x x x x ,,,321,它的平均数为x ,方差为2s ,则一组数据为b ax b ax b ax b ax n ++++ ,,,321,的平均数为b x a +,方差为22s a 。
专题03 统计初步-2020年江苏省高考数学命题规律大揭秘(解析版)

专题03 统计初步【真题感悟】1、【2019年江苏,5】已知一组数据6,7,8,8,9,10,则该组数据的方差是____.【答案】53【解析】由题意,该组数据的平均数为678891086+++++=,所以该组数据的方差是22222215[(68)(78)(88)(88)(98)(108)]63-+-+-+-+-+-=. 2、【2018江苏,理3】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.3. 【2017江苏,3】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件. 【答案】18【解析】所求人数为300601810000⨯=,故答案为18.4. 【2016江苏,4】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【解析】这组数据的平均数为1(4.7 4.8 5.1 5.4 5.5) 5.15⨯++++=,2222221(4.7 5.1)(4.8 5.1)(5.1 5.1)(5.4 5.1)(5.5 5.1)0.15s ⎡⎤∴=⨯-+-+-+-+-=⎣⎦.故答案应填:0.1 5. 【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6 【解析】46587666x +++++==【考纲要求】一、抽样方法1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.二、总体分布的估计及特征数的估计1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.【考向分析】1. 统计均是以填空题的形式进行考查,题目多为中低档题,着重考查学生运算求解能力、数据处理及分析问题解决问题的能力.统计一般不与其它章节知识结合考查,常单独设置题目.2.统计是高考中的常考题,统计考查的难度中等偏简单,复习时应以基础题为主.复习中,要在全面掌握的基础上理解相关概念,如分层抽样、频率分布直方图、方差等.要务实统计的基础知识,熟悉统计问题的基本解法,从而提高应用统计知识去分析问题和解决问题的能力.【高考预测】1.考查方向是总体特征数的估计,系统抽样和分层抽样、频率分布直方图、方差等,重点考查方差的计算,属于简单题.2.考查能力为相关计算能力.3.考题形式为填空题.【迎考策略】(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解.(3)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.【强化演练】1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7D .0.8【答案】C【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C .2.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( ) A .中位数 B .平均数 C .方差D .极差 【答案】A【解析】设9位评委评分按从小到大排列为123489x x x x x x <<<<<.则①原始中位数为5x ,去掉最低分1x ,最高分9x 后剩余2348x x x x <<<<,中位数仍为5x ,A 正确;②原始平均数1234891()9x x x x x x x =<<<<<,后来平均数23481()7x x x x x '=<<<,平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确; ③2222111[()()()]9q S x x x x x x =-+-++-,22222381[()()()]7s x x x x x x '=-'+-'++-',由②易知,C 不正确;④原极差91x x =-,后来极差82x x =-,显然极差变小,D 不正确.故选A . 3.【2019年高考浙江卷】设0<a <1,则随机变量X 的分布列是则当a 在(0,1)内增大时,( ) A .()D X 增大B .()D X 减小C .()D X 先增大后减小D .()D X 先减小后增大【答案】D【解析】方法1:由分布列得1()3aE X +=, 则2222111111211()(0)()(1)()333333926a a a D X a a +++=-⨯+-⨯+-⨯=-+, 则当a 在(0,1)内增大时,()D X 先减小后增大.故选D .方法2:则222221(1)222213()()()0[()]3399924a a a a D X E X E X a +-+=-=++-==-+,则当a 在(0,1)内增大时,()D X 先减小后增大.故选D .4.【2019年高考全国Ⅱ卷理数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________. 【答案】0.98【解析】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10201040++=,所以该站所有高铁平均正点率约为39.20.9840=. 5.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.6.有100件产品编号从00到99,用系统抽样方法从中抽取5件产品进行检验,分组后每组按照相同的间隔抽取产品,若第5组抽取的产品编号为91,则第2组抽取的产品编号为___________.【答案】31【解析】据系统抽样原理,抽样间隔为.设第1组抽取数据为,则第5组抽取的产品编号为,解得.第2组抽取的产品编号为.故答案为:31.7.从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 度到 350 度之间,频率分布直方图如图所示.则在这些用户中,用电量落在区间内的户数为__________.【答案】22【解析】由频率分布直方图得:用电量落在区间内的频率为:1-(0.0024+0.0036+0.0024+0.0012)50=0.22,用电量落在区间内的户数为:1000.22=22.故答案为:22.8.某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为的样本,已知从高中生中抽取70人,则为____.【答案】100.【解析】分层抽样的抽取比例为,总体个数为3500+1500=5000,∴样本容量n=5000×=100.故答案为:100.9.某公司生产甲、乙、丙三种不同型号的轿车,产量分别为1400辆、5600辆、2000辆.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取45辆进行检验,则应从丙种型号的产品中抽取______件.【答案】10【解析】抽样比例是,故应从丙种型号的产品中抽取故答案为:10.10.已知样本数据的均值=5,则样本数据的均值为______.【答案】16【解析】由题意结合均值的性质可知:样本数据的均值为.11.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间的一等品,在区间和的为二等品,其余均为三等品,则样本中三等品的件数为__________.【答案】100.【解析】由题意得,三等品的长度在区间,和内,根据频率分布直方图可得三等品的频率为,∴样本中三等品的件数为.12.某学校为了了解住校学生每天在校平均开销情况,随机抽取了500名学生,他们的每天在校平均开销都不低于20元且不超过60元,其频率分布直方图如图所示,则其中每天在校平均开销在元的学生人数为_________.【答案】【解析】由频率分布直方图,得:每天在校平均开销在[50,60]元的学生所点的频率为:1﹣(0.01+0.024+0.036)×10=0.3∴每天在校平均开销在[50,60]元的学生人数为500×0.3=150.故答案为:15013.一次考试后,从高三(1)班抽取5人进行成绩统计,其茎叶图如右图所示,则这五人成绩的方差为____.【答案】.【解析】由题得所以成绩的方差为故答案为:20.814.已知某高级中学,高一、高二、高三学生人数分别为880、860、820,现用分层抽样方法从该校抽调128人,则在高二年级中抽调的人数为__________.【答案】43【解析】由题意可知,在高二年级中抽调的人数为15.已知一组数据分别是,若这组数据的平均数、中位数、众数成等差数列,则数据的所有可能值为__________.【答案】-11或3或17【解析】由题得这组数据的平均数为,众数是2,若x≤2,则中位数为2,此时x=﹣11,若2<x<4,则中位数为x,此时2x=,x=3,若x≥4,则中位数为4,2×4=,x=17,所有可能值为﹣11,3,17.故填-11或3或17.。
【新高考数学】热点11 计数原理(解析版)

,含
x2 的项的系
数为 (1)2C62 2 (1)3C63 25 ,故选 B.
【名师点睛】本题主要考查二项式定理的应用,二项展开式的通项公式,二项式系数的性
质,属于基础题.
3.(2019·湖南高二期中(理))9 件产品中,有 4 件一等品,3 件二等品,2 件三等品,
现在要从中抽出 4 件产品来检查,至少有两件一等品的种数是( )
捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列. 相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列, 再把规定的相离的几个元素插入上述几个元素的空位和两端. 定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方 法. 标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步 再排另一个元素,如 此继续下去,依次即可完成. 有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法. 对于二项式定理的应用,只要会求对应的常数项以及对应的 n 项即可,但是应注意是二项 式系数还是系数. 【考查题型】选择题
D. 6
【答案】D
【解析】
【分析】
将二项式变形后得出 1 x 2x2 1 x4 1 x4 x 1 x4 2x2 1 x4 ,得出其展
开式通项为 C4r xr C4m xm1 2C4n xn2 ,然后令 r m 1 n 2 3 ,求出 r 、 m 、 n 的值,再代入展开式通项可得出展开式中含 x3 项的系数.
热点 11 计数原理
【命题趋势】 计数原理包含排列组合与二项式定理,在高考数学中通常是以选择题的形式呈现.另外
在解答题中与统计概率相结合比较普遍.高考中通常难度不是很大,主要考查是排列与组合 的先后顺序或者是有条件限制的排列与组合.二项式定理也是高考考查的一个重点,主要考 查二项式定理的展开.本专题通过列举排列组合与二项式定理常见的考题类型,总结此些类 型题目的解题方法以及易错点,能够让你在高考中遇到计数原理类型的题目能够迎刃而解. 【满分技巧】
专题概率与统计热点问题-2024年高考数学六大题解满分解题技巧秘籍

概率与统计是高考数学中的一个重要的知识点,也是考察学生分析问题、统计数据以及进行概率计算的能力。
下面是2024年高考数学中概率与统计方面的热点问题解题指导,希望能对你备考有所帮助。
1.求二项式分布的期望和方差二项式分布可以描述在n次独立重复试验中,出现其中一事件的次数的概率分布。
求二项式分布的期望和方差是常见的题型。
对于n次独立重复试验中,事件A出现的次数X,其期望和方差分别为E(x) = np,Var(x) = np(1-p),其中p为单次试验中事件A发生的概率。
2.求事件的概率求事件的概率是概率与统计中的基本题型。
根据题目给出的条件,利用概率公式进行计算即可。
常见的题型有求交、并、互斥事件的概率,以及条件概率等。
3.求样本的点估计和区间估计在统计学中,样本是用来推断总体特征的重要依据。
对于样本中一些统计量,如平均值、比例等,可以利用它们作为总体特征的点估计。
而对于总体特征的区间估计,可以利用样本统计量的分布特性,计算出一个区间,该区间包含了总体特征的真值。
4.利用正态分布进行计算正态分布是概率与统计中最重要的概率分布之一,也是高考数学中的重点内容。
在许多情况下,可以使用正态分布来近似计算一些事件的概率或样本统计量的分布。
利用标准正态分布的概率表或计算器,可以方便地计算出正态分布的概率或分布的特征。
5.判断两个事件是否独立判断两个事件是否独立,可以利用概率的定义和条件概率的性质进行推导。
如果两个事件相互独立,则它们的联合概率等于事件的概率的乘积。
反之,如果联合概率不等于概率的乘积,则说明两个事件不独立。
6.利用抽样方法进行调查在概率与统计中,抽样是一种重要的数据收集方法。
通过合理地设计抽样方法和调查问卷,可以获得可靠的调查数据。
在解题时,需要注意抽样误差和样本的代表性等问题,以确保所得到的调查结果具有较高的可靠性。
以上是2024年高考数学概率与统计方面的热点问题解题指导。
在备考过程中,要牢固掌握概率与统计的基本概念和常用方法,多做相关的题目,提高解题能力。
高考数学(文)专题15+统计的命题规律

【学习目标】1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 【知识要点】 1.抽样方法(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有简单随机抽样、系统抽样和分层抽样.(2)简单随机抽样是指一个总体的个数为(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为抽签法和随机数表法.(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后按各部分所占比例抽样,其中所分成的各部分叫做层.(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先按确定的在各部分抽取. 2.总体分布的估计(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差) ②决定组距与组数 ③将数据分组 ④列频率分布表(下图)分组频数频率累计频率…………01[)t t ,1r 1f 1f 12[)t t ,2r 2f 12f f +1[]k k t t -,k r k f⑤画频率分布直方图,将区间标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得个矩形,这样得到的图形叫频率分布直方图.频率分布直方图的性质:①第个矩形的面积等于样本值落入区间的频率;②由于,所以所有小矩形的面积的和为1.三.高考命题类型分析 (一)随机抽样例1.从名学生中选取50名学生参加某一活动,若采用下面的方法选取:先用简单随机抽样从人中剔除18人,剩下的人再按系统抽样的方法抽取50人,则在这人中,每个人入选的概率 ( )A .不全相等B .均不相等C .都相等,且为D .都相等,且为【答案】C 【解析】【详解】因为简单随机抽样和系统抽样都是等可能抽样,从个个体中抽取个个体,则每个个体被抽到的概率都等于,即从2 018名学生中选取50名学生参加全国数学联赛,每人入选的概率都相等,且为,故选C.练习1.下列说法中错误的是( )A .先把高二年级的名学生编号为1到,再从编号为1到50的50名学生中随机抽取1名学生,其编号为,然后抽取编号为,,的学生,这样的抽样方法是系统抽样法;B .独立性检验中,越大,则越有把握说两个变量有关;C .若两个随机变量的线性相关性越强,则相关系数的值越接近于1;D .若一组数据1、a 、3的平均数是2,则该组数据的方差是. 【答案】C【解析】对于A ,根据个体数目较多,且没有明显的差异,抽取样本间隔相等,知这种抽样方法是系统抽样法,∴A 正确;[)a b ,k i 1[)i i t t -,对应B,独立性检验中,越大,应该是说明两个变量有关系的可能性大,即有足够的把握说明两个变量有关,B正确;对于C,两个随机变量的线性相关性越强,则相关系数|r|的值越接近于1,C错误;对于D,一组数据1、a、3的平均数是2,∴a=2;∴该组数据的方差是s2=×[(1﹣2)2+(2﹣2)2+(3﹣2)2]=,D正确.故选:C. 上购物经历的人数,所得数据的茎叶图如图所示,则这20个班有网购经历的人数的众数为()A.24 B.37 C.35 D.48【答案】C【解析】这20个班有网购经历的人数最多的数字为35;所以众数为35,故选C.【点睛】本题主要考查利用茎叶图求众数,意在考查对基础知识的掌握与应用,是基础题.练习2.已知一组数据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,那么3,4,5,a,b这组数据的方差为()A.B.2 C.D.【答案】D【解析】根据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,可知,由方差公式求解即可.(三)频率分布直方图例3..例3..APEC会议于11月10日至11日在越南岘港举行,某研究机构为了了解各年龄层对APEC会议的关注程度,随机选取了100名年龄在[20,45]内的市民举行了调查,并将结果绘制成如图所示的频率分布直方图(分组区间分布为[20,25),[25.30),[30,35),[35,40),[40,45]).(1)求选取的市民年龄在[30,35)内的人数;(2)若从第3,4组用分层抽样的方法选取5名市民进行座谈,再从中选取2人参与APEC会议的宣传活动,求参与宣传活动的市民中至少有一人的年龄在[35,40)内的概率.【答案】(1)30;(2).【解析】(1)由频率分布直方图可得年龄在内的频率为,从而可得结果;(2)利用分层抽样的方法可知,所选的5人中,从第3组选3人,从第4组选2人,利用列举法,求出总事件以及至少有一人的年龄在内的事件,再利用古典概型概率公式即可得出结果.【详解】(1)由频率分布直方图可得年龄在[30,35)内的频率为0.06×5=0.3,则选取的市民年龄在[30,35)内的人数0.3×100=30;【点睛】本题考查古典概率概率公式与频率分布直方图的应用,属于中档题.利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有(1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先,…. ,再,…..依次….… 这样才能避免多写、漏写现象的发生.练习3.某市要对多名出租车司机的年龄进行调査,现从中随机抽出100名司机,已知该市的司机年龄都在[20,45]之间,根据调査结果得出司机的年龄情况的频率分布直方图如图所示,估计该市出租车司机年龄在频率是()A.0.02 B.0.04 C.0.2 D.0.84【答案】C(四)茎叶图例4.将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是( )A.;乙比甲成绩稳定B.;甲比乙成绩稳定C.;乙比甲成绩稳定D.;甲比乙成绩稳定【答案】A练习1.为比较甲、乙两地某月12时的气温状况,随机选取该月中的5天,将这5天中12时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:①甲地的平均气温低于乙地的平均气温;②甲地的平均气温高于乙地的平均气温;③甲地气温的标准差小于乙地气温的标准差;④甲地气温的标准差大于乙地气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )A.①③B.①④C.②③D.②④【答案】B【解析】由已知的茎叶图,我们易分析出甲、乙两地某月12时的气温抽取的样本温度,进而求出两组数据的平均数、方差,可得答案.【详解】由茎叶图中的数据,我们可得甲,乙两地某月12 时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:28,29,30,31,32;所以甲地该月12时的气温的标准差大于乙地该月12时的气温标准差.①正确,故选B.故数据的方差是,故标准差是,故选:D.【点睛】本题考查了解方程组问题,考查求数据的平均数和方差问题,是一道基础题.练习2.若样本的平均数是,方差是,则对样本,下列结论正确的是( )A.平均数为14,方差为5 B.平均数为13,方差为25C.平均数为13,方差为5 D.平均数为14,方差为2【答案】C【解析】根据平均数和方差的定义和性质进行求解即可.【点睛】本题主要考查样本数据的方差和平均数的计算,根据相应的公式进行计算是解决本题的关键.(七)极差、方差、标准差例7.已知某7个数的平均数为3,方差为,现又加入一个新数据3,此时这8个数的平均数为x,方差为,则()A.,B.,C.,D.,【答案】B【解析】由题设条件,利用平均数和方差的计算公式,进行求解,即可得到答案.【详解】由题意,根据这7个数的平均数为3,方差为,即,,即,现又加入一个新数据3,此时这8个数的平均数为,方差为,即,故选B.练习1.在下列命题中,下列选项正确的是()A.在回归直线中,变量时,变量的值一定是15.B.两个变量相关性越强,则相关系数就越接近于1.C.在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.D.若是两个相等的非零实数,则是纯虚数.【答案】D【解析】根据回归方程的定义判断;根据相关系数的定义判断;根据残差图的性质判断;根据纯虚数的定义判断.【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.(九)回归分析例9.26.已知某商品的价格(元)与需求量(件)之间的关系有如下一组数据:x1416182022y1210753;参考:;当时, ,(1)求,;(2)求出回归直线方程;(3)计算相关系数r的值,并说明回归模型拟合程度的好坏。
2018届高三文科数学概率与统计解题方法规律技巧详细总结版

2018届高三文科数学概率与统计解题方法规律技巧详细总结版【简介】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类古典概型概率的计算方法,另外近几年对于变量间的相关关系与统计案例的考察也时常出现,这部分也要做复习的重点.【3年高考试题比较】从近几年的高考命题来看,高考对概率的考查,一般以实际生活题材为背景,以应用题的形式出现.主要考查图表信息的整理及分析,古典概型和统计的相关知识,以回归直线方程和独立性检验为主.概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率.解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或其对立事件的概率求解.解决古典概型问题的关键在于确定基本事件.回归直线方程以线性为主,对于非线性的往往通过换元得到线性关系,并会利用应用回归方程作出估计,独立性检验以利用2列联表计算K 2为主. 概率统计的试题在高考中文字较大,信息量较大,需要认真阅读,理解题意.【必备基础知识融合】1.概率问题(1)求某些较复杂的概率问题时,通常有两种方法:一是将其分解为若干个彼此互斥的事件的和,然后利用概率加法公式求其值;二是求此事件A 的对立事件A 的概率,然后利用P (A )=1-P (A )可得解;(2)用列举法把古典概型试验的基本事件一一列出来,然后再求出事件A 中的基本事件,利用公式P (A )=m n求出事件A 的概率,这是一个形象、直观的好办法,但列举时必须按照某一顺序做到不重复,不遗漏;(3)求几何概型的概率,最关键的一步是求事件A 所包含的基本事件所占据区域的测度,这里需要解析几何的知识,而最困难的地方是找出基本事件的约束条件. 2.统计问题(1)统计主要是对数据的处理,为了保证统计的客观和公正,抽样是统计的必要和重要环节,抽样的方法有三:简单随机抽样、系统抽样和分层抽样;(2)用样本频率分布来估计总体分布一节的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,考点是:频率分布表和频率分布直方图的理解及应用;(3)用茎叶图优点是原有信息不会抹掉,能够展开数据发布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了;(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.①在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. ②在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. ③如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. (5)线性回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x+a ^,则b ^=1122211()()()n niii ii i nniii i x x y y x y nx yx x xnx ====---=--∑∑∑∑,a ^=y ^-b ^x .其中,b ^是回归方程的斜率,a ^是在y 轴上的截距. 回归直线一定过样本点的中心(x ,y ).③.残差分析:残差:对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为e ^i =y i -y ^i =y i -b ^x i -a ^,i =1,2,…,n .e ^i 称为相应于点(x i ,y i )的残差.⑤相关指数:R 2=1-2121()()niii nii y y y y ==--∑∑.其中21()niii y y =-∑是残差平方和,其值越小,则R 2越大(接近1),模型的拟合效果越好. (6).独立性检验①利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.②列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为计则随机变量K 2=n (ad -bc )(a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样本容量.【解题方法规律技巧】典例1:我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【规律方法】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.(3)利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.典例2:某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b -),(a ,b ),(a -,b ),(a -,b -),(a ,b ),(a ,b ),(a ,b -),(a -,b ),(a -,b -),(a ,b -)(a ,b ),(a ,b -),(a -,b ),(a ,b ).其中a ,a -分别表示甲组研发成功和失败;b ,b -分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b -),(a -,b ),(a ,b -),(a -,b ),(a ,b -),(a ,b -),(a -,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【规律方法】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.典例3:随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=∑ni =1t i y i -nt -y -∑n i =1t 2i -nt -2,a ^=y --b ^t -.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元). 【规律方法】(1)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. (2)正确运用计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键,并充分利用回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -)进行求值.典例4:微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中23是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表;(2)由列联表中所得数据判断,是否有99.9%的把握认为“经常使用微信与年龄有关”?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)【规律方法】(1)在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:①根据样本数据制成2×2列联表:②根据公式K2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K2的观测值k0;③比较k0与临界值的大小关系,作统计推断.典例5: 某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(1)估计顾客同时购买乙和丙的概率;(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1.所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.【规律方法】1)解题的关键是根据统计图表分析满足条件的事件发生的频数,计算频率,用频率估计概率.(2)频率反映了一个随机事件出现的频繁程度,频率是随机的,而概率是一个确定的值,通常用概率来反映随机事件发生的可能性的大小,通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数(概率),因此有时也用频率来作为随机事件概率的估计值.典例6:某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中一次购物量超过8件的顾客占55%.(1)确定x,y的值,并估计顾客一次购物的结算时间的平均值;(2)求一位顾客一次购物的结算时间不超过2分钟的概率(将频率视为概率).解(1)由已知得25+y+10=55,x+30=45,所以x=15,y=20.【规律方法】(1)①求解本题的关键是正确判断各事件的关系,以及把所求事件用已知概率的事件表示出来.②结算时间不超过2分钟的事件,包括结算时间为2分钟的情形,否则会计算错误.(2)求复杂的互斥事件的概率一般有两种方法:一是直接求解法,将所求事件的概率分解为一些彼此互斥的事件的概率再求和;二是间接法,先求该事件的对立事件的概率,再由P(A)=1-P(A -)求解.当题目涉及“至多”、“至少”型问题,多考虑间接法.典例7:某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖.抽奖方法是:从装有2个红球A 1,A 2和1个白球B 的甲箱与装有2个红球a 1,a 2和2个白球b 1,b 2的乙箱中,各随机摸出1个球.若摸出的2个球都是红球则中奖,否则不中奖.(1)用球的标号列出所有可能的摸出结果;(2)有人认为:两个箱子中的红球比白球多,所以中奖的概率大于不中奖的概率,你认为正确吗?请说明理由. 解 (1)依题意,所有可能的摸出的结果是{A 1,a 1},{A 1,a 2},{A 1,b 1},{A 1,b 2},{A 2,a 1},{A 2,a 2},{A 2,b 1},{A 2,b 2},{B ,a 1},{B ,a 2},{B ,b 1},{B ,b 2}.(2)不正确.理由如下:由(1)知,所有可能的摸出结果共12种,其中摸出的2个球都是红球的结果为{A 1,a 1},{A 1,a 2},{A 2,a 1},{A 2,a 2},共4种,所以中奖的概率为P 1=412=13,不中奖的概率为P 2=1-P 1=23.由于P 1=13<P 2=23.故这种说法不正确.【规律方法】(1)求较复杂事件的概率问题,解题关键是理解题目的实际含义,把实际问题转化为概率模型,必要时将所求事件转化成彼此互斥事件的和,或者先求其对立事件的概率,进而再用互斥事件的概率加法公式或对立事件的概率公式求解.(2)本题常见的错误:①理解不清题意,不能把基本事件列举出来;②不能恰当分类,列举基本事件有遗漏,再者本题中基本事件(x ,y)看成有序的,(1,2)与(2,1)等表示不同的基本事件.典例8:空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;>300为严重污染.一环保人士记录了某地2016年某月10天的AQI 的茎叶图如图所示. (1)利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算);(2)若从样本中的空气质量不佳(AQI >100)的这些天中,随机地抽取两天深入分析各种污染指标,求该两天的空气质量等级恰好不同的概率.【规律方法】有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点,概率与统计结合题,无论是直接描述还是利用概率分布表、分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键.典例9:菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但蔬菜上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x (单位:千克)清洗蔬菜1千克后,蔬菜上残留的农药y (单位:微克)的统计表:(1)在下面的坐标系中,描出散点图,并判断变量x 与y 是正相关还是负相关;(2)若用解析式2y cx d ∧=+作为蔬菜农药残量y ∧与用水量x 的回归方程,令2w x =,计算平均值w 与y ,完成以下表格(填在答题卡中),求出y ∧与x 的回归方程.(,c d 保留两位有效数字);(3)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请评估需要用多少千克的清水清洗一千克蔬菜?(精确到0.1,参考数据2.236≈)(附:对于一组数据()()()1122,,,,......,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘法估计分别为:()()()121,niii nii u u v v v u u u βαβ∧∧∧==--==--∑∑)【答案】(1)负相关(2)22.060y x ∧=-+(3)需要4.5千克的清水解析:(1)负相关.(含散点图) (2)11,38w y ==()()()()()()()222221020716215914287512.03741072514c -⨯+-⨯+-⨯+⨯-+⨯-==-≈-+-+-++ 2751381160, 2.060 2.060374d y cw y w x ∧⎛⎫=-=--⨯≈=-+=-+ ⎪⎝⎭. (3)当20y ∧<时, 22.06020, 4.5x x -+≈∴为了放心食用该蔬菜,估计需要4.5千克的清水清洗一千克蔬菜.【规律总结】(1)回归直线y =bx +a 必过样本点的中心(x ,y ).(2)正确运用计算b ,a 的公式和准确的计算,是求线性回归方程的关键.(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(4)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱. 典例10:已知向量a =(-2,1),b =(x ,y ).(1)若x ,y 分别表示将一枚质地均匀的正方体骰子(六个面的点数分别为1,2,3,4,5,6)先后抛掷两次时第一次、第二次出现的点数,求满足a ·b =-1的概率; (2)若x ,y 在连续区间[1,6]上取值,求满足a ·b <0的概率.解 (1)将一枚质地均匀的正方体骰子先后抛掷两次,所包含的基本事件总数为6×6=36(个);由a ·b =-1, 得-2x +y =-1,∴a ·b =-1包含的基本事件为(1,1),(2,3),(3,5),共3种情形.故P (a ·b = -1)=336=112.(2)若x ,y 在连续区间[1,6]上取值,则全部基本事件的结果为Ω={(x ,y )|1≤x ≤6,1≤y ≤6};满足a ·b <0的基本事件的结果为A ={(x ,y )|1≤x ≤6,1≤y ≤6且-2x +y <0};画出图形如图,正方形的面积为S 正方形=25,阴影部分的面积为S 阴影=25-12×2×4=21,故满足a ·b <0的概率为2125.【规律总结】古典概型中基本事件数的探求方法 (1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. (4)排列组合法:适用于限制条件较多且元素数目较多的题目.几何概型:(1)当试验的结果构成的区域为长度、面积、体积等时,应考虑使用几何概型求解.(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.(3)几何概型有两个特点:一是无限性,二是等可能性.基本事件可以抽象为点,尽管这些点是无限的,但它们所占据的区域都是有限的,因此可用“比例解法”求解几何概型的概率.【归纳常用万能模板】1.海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.审题路线图利用分层抽样的特征确定各层的抽样比→求出样品中各层的数量→列举基本事件空间→利用古典概型公式求解评分细则(1)各层抽样数量每个算对给1分;(2)没有列举基本事件只求对基本事件个数给1分;(3)求对样本事件个数而没有列出的给1分;(4)最后没下结论的扣1分.2.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.满分解答(1)解因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.3分(2)解由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4. 所以该企业职工对该部门评分不低于80的概率的估计值为0.4.5分(3)解受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1,B2,8分从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.11分又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=110.12分❶抓住关键,准确计算(1)得关键分:如第(1)问中,正确求得a=0.006;第(3)问中列出10个基本事件,错写或多写,少写均不得分.(2)得转化计算分:如第(1)问,第(2)问中的计算要正确,否则不得分;第(3)问中利用“频数、样本容量、频率之间的关系”求得各区间的人数,转化为古典概型的概率.❷步骤规范,防止失误抓住得分点的步骤,“步步为赢”求得满分,本题的易失分点:(1)不能利用频率分布直方图的频率求出a值;(2)求错评分落在[50,60),[40,50)间的人数;(3)没有指出“基本事件总数”与“事件M”包含的基本事件个数,或者只指出事件个数,没有一一列举10个基本事件及事件M包含的基本事件,导致扣3分或2分.第一步:由各矩形的面积之和等于1,求a的值.第二步:由样本频率分布估计概率.第三步:设出字母,列出基本事件总数及所求事件M所包含的基本事件.第四步:利用古典概型概率公式计算.第五步:反思回顾,查看关键点,易错点和答题规范.【易错易混温馨提醒】一、样本的数字特征的计算1.随着雾霾的日益严重,中国部分省份已经实施了“煤改气”的计划来改善空气质量指数.2017年支撑我国天然气市场消费增长的主要资源是国产常规气和进口天然气,资源每年的增量不足以支撑天然气市场连续300亿立方米的年增量.进口LNG和进口管道气受到接收站、管道能力和进口气价资源的制约.未来,国产常规气产能释放的红利将会逐步减弱,产量增量将维持在80亿方以内.为了测定某市是否符合实施煤改气计划的标准,某监测站点于2016年8月某日起连续200天监测空气质量指数(AQI),数据统计如下:(1)根据上图完成下列表格(2)计算这200天中,该市空气质量指数的平均数;(3)若按照分层抽样的方法,从空气质量指数在101~150以及151~200的等级中抽取7天进行调研,再从这7天中任取2天进行空气颗粒物分析,求恰有1天空气质量指数在101~150上的概率.【答案】(1)见解析(2)95(3)1021 P=【解析】试题分析:(1)根据题意给出的数列,即可求得所求表格数据,进而完成图表;(2)依题意,利用平均数的计算公式,即可求解数列的平均数.(3)依题意,从空气质量指数在101~150以及151~200的天数为5,记为,,,,a b c d e,空气质量指数在151~200的天数为2,记为1,2,列出基本事件的个数,根据古典概型,即可求解相应的概率值.试题解析:解:(1)所求表格数据如下:(2)依题意,故所求平均数为250.2750.41250.251750.12250.0595⨯+⨯+⨯+⨯+⨯=2.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)轮胎的宽度在[]194,196内,则称这个轮胎是标准轮胎.(i)若从甲乙提供的10个轮胎中随机选取1个,求所选的轮胎是标准轮胎的概率P;(ii)试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?【答案】(1)x=甲()195mm.x乙()194mm=.(2)(i)35P=.(ii)见解析.【解析】试题分析:(1)利用折线图能求出甲厂这批轮胎宽度的平均值和乙厂这批轮胎宽度的平均值.(2))①从甲厂提供的10个轮胎中有6个轮胎是标准轮胎,从中随机选取1个,能求出所选的轮胎是标准轮胎的概率.②甲厂这批轮胎宽度都在[194,196]内的数据为195,194,196,194,196,195,乙厂这批轮胎宽度都在[194,196]内的数据为195,196,195,194,195,195,求出两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,从而乙厂的轮胎相对更好.3.为了调查观众对某热播电视剧的喜爱程度,某电视台在甲、乙两地各随机抽取了8名观众作问卷调查,得分统计结果如图所示:(1)计算甲、乙两地被抽取的观众问卷的平均得分;(2)计算甲、乙两地被抽取的观众问卷得分的方差;(3)若从甲地被抽取的8名观众中再邀请2名进行深入调研,求这2名观众中恰有1人的问卷调查成绩在90分以上的概率.【答案】(1)85,85 (2)35.5,41(3)123287 P==(3)依题意,所有的事件的可能性为()()()78,79,78,81,78,82, ()()()78,84,78,88,78,93,()()()78,95,79,81,79,82,()()()79,84,79,88,79,93,()()()79,95,81,82,81,84,()()()81,88,81,93,81,95,()()()82,84,82,88,82,93,()()()82,95,84,88,84,93,()84,95,()()()88,93,88,95,93,95,共28种,其中满足条件的为()()()78,93,78,95,79,93, ()()()79,95,81,93,81,95, ()()()82,93,82,95,84,93, ()()()84,95,88,93,88,95,共12种,故所求概率123287P ==. 二、图表数据的处理4.“砥砺奋进的五年”,首都经济社会发展取得新成就.自2012年以来,北京城乡居民收入稳步增长.随着扩大内需,促进消费等政策的出台,居民消费支出全面增长,消费结构持续优化升级,城乡居民人均可支配收入快速增长,人民生活品质不断提升.下图是北京市2012-2016年城乡居民人均可支配收入实际增速趋势图(例如2012年,北京城镇居民收入实际增速为7.3%,农村居民收入实际增速为8.2%).(Ⅰ)从2012-2016五年中任选一年,求城镇居民收入实际增速大于7%的概率;(Ⅱ)从2012-2016五年中任选一年,求至少有一年农村和城镇居民收入实际增速均超过7%的概率; (Ⅲ)由图判断,从哪年开始连续三年农村居民收入实际增速方差最大?(结论不要求证明) 【答案】(Ⅰ)35;(Ⅱ) 910;(Ⅲ)2014年.试题解析:(Ⅰ)设城镇居民收入实际增速大于7%为事件A ,由图可知,这五年中有2012,2013,2014这三年城镇居民收入实际增速大于7%,所以P (A )=35. (Ⅱ)设至少有一年农村和城镇居民实际收入增速均超7%为事件B ,这五年中任选两年,有(2012,2013),(2012,2014),(2012,2015),(2012,2016),(2013,2014),(2013,2015),(2013,2016),(2014,2015),(2014,2016),(2015,2016)共10种情况,其中至少有一年农村和城镇居民实际收入增速均超过7%的为前9种情况,所以P (B )=910. (Ⅲ)从2014开始连续三年农村居民收入实际增速方差最大. 三、非线性回归方程转化为线性回归方程5.已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x (单位:℃),对某种鸡的时段产蛋量y (单位: t )和时段投入成本z (单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度i x 和产蛋量()1,2,,7i y i =⋅⋅⋅的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.。
2024年高考数学命题热点全覆盖专题02函数问题的解题规律文

专题02 函数问题的解题规律一、函数问题的解题规律解题技巧及留意事项1.定义域陷阱2.抽象函数的隐含条件陷阱3.定义域和值域为全体实数陷阱4.还原后新参数范围陷阱5.参数范围漏解陷阱6.函数求和中的倒序求和问题7.分段函数问题8.函数的解析式求法9.恒成立问题求参数范围问题10.随意存在问题二.学问点【学习目标】1.了解映射的概念,了解构成函数的要素,会求一些简洁函数的定义域、值域及函数解析式;2.在实际情境中,会依据不同的须要选择适当的方法(图象法、列表法、解析法)表示函数;3.了解简洁的分段函数,并能简洁应用;4.驾驭求函数定义域及解析式的基本方法.【学问要点】1.函数的概念设A,B是非空的数集,假如依据某个确定的对应关系f,使对于集合A中的随意一个数x,在集合B 中都有唯一确定的数f(x)和它对应,那么称f:A→B为从集合A到集合B的一个函数,记作:,其中x叫做自变量,x的取值范围A叫做函数的定义域;与x的值相对应的y的值叫做函数值,函数值的集合{f(x)|x∈A}叫做函数的值域.明显{f(x)|x∈A}⊆B.2.映射的概念设A,B是两个集合,假如依据某种对应关系f,对于集合A中的随意一个元素,在集合B中都有唯一确定的元素和它对应,那么这样的对应(包括集合A,B,以及集合A到集合B的对应关系f)叫做集合A到集合B的映射.3.函数的特点①函数是一种特别的映射,它是由一个集合到另一个集合的映射;②函数包括定义域A、值域B和对应法则f,简称函数的三要素;③关键是对应法则.4.函数的表示法函数的表示法:图示法、解析法.5.推断两个函数为同一个函数的方法两个函数的定义域和对应法则完全相同(当值域未指明时),则这两个函数相等.6.分段函数若函数在定义域的不同子集上对应法则不同,可用几个式子表示函数,这种形式的函数叫分段函数.留意:不要把分段函数误认为是多个函数,它是一个整体,分段处理后,最终写成一个函数表达式.三.典例分析及变式训练(一)定义域陷阱例1. 【曲靖一中2024模拟】已知,若函数在(﹣3,﹣2)上为减函数,且函数=在上有最大值,则的取值范围为()A. B. C. D.【答案】A【分析】由在上为减函数,可得;由在上有最大值,可得,综上可得结果,.【解析】在上为减函数,,且在上恒成立,,,又在上有最大值,且在上单调递增,在上单调递减,且,,解得,综上所述,,故选A.【点评】本题主要考查对数函数的单调性、复合函数的单调性、分段函数的单调性,以及利用单调性求函数最值,意在考查对基础学问驾驭的娴熟程度,考查综合应用所学学问解答问题的实力,属于难题. 推断复合函数单调性要留意把握两点:一是要同时考虑两个函数的的定义域;二是同时考虑两个函数的单调性,正确理解“同增异减”的含义(增增增,减减增,增减减,减增减).故答案为:D.练习2.已知函数则__________.【答案】1008【解析】分析:由关系,可类比等差数列一次类推求值即可.详解:函数,则,故答案为:1008.点睛:可类比“等差数列”或函数周期性来处理.(七)分段函数问题例7.【河北省廊坊市2025届高三上学期第三次联考】若函数在上是单调函数,且存在负的零点,则的取值范围是()A. B. C. D.【答案】B【解析】通过函数的单调性及存在负的零点,列出不等式,化简即可.【详解】当时,,所以函数在上只能是单调递增函数,又存在负的零点,而当时,f(0)=1+a,当时,f(0)=3a-2,0<3a-21+a,解得.故选B.【点评】本题考查分段函数的应用,考查分类探讨思想,转化思想以及计算实力.练习1.已知函数,则f(1)- f(9)=()A.﹣1 B.﹣2 C. 6 D. 7【答案】A【解析】利用分段函数,分别求出和的值,然后作差得到结果.【详解】依题意得,,所以,故选.【点评】本小题主要考查利用分段函数求函数值,只须要将自变量代入对应的函数段,来求得相应的函数值.属于基础题.练习2.已知,那么等于( )A. 2 B. 3 C. 4 D. 5【答案】A【解析】将逐步化为,再利用分段函数第一段求解.【详解】由分段函数其次段解析式可知,,继而,由分段函数第一段解析式,,故选A.【点睛】本题考查分段函数求函数值,要确定好自变量的取值范围,再代入相应的解析式求得对应的函数值,分段函数分段处理,这是探讨分段函数图象和性质最核心的理念.(八)函数的解析式求法例8. (1)已f ()=,求f(x)的解析式.(2).已知y =f(x)是一次函数,且有f [f(x)]=9x+8,求此一次函数的解析式【答案】(1);(2). 【解析】(1)利用换元法即可求解;(2)已知函数是一次函数,可设函数解析式为f(x)=ax+b,再利用待定系数法列出关于a、b的方程组即可求解出a、b的值.【详解】(1)设(x≠0且x≠1)(2)设f(x)=ax+b,则f[f(x)]=af(x)+b=a(ax+b)+b=a2x+ab+b=9x+8或所以函数的解析式为.【点睛】本题考查函数解析式的求解,解题中应用了换元法和待定系数法,待定系数法的主要思想是构造方程(组),对运算实力要求相对较高,属于中档题.练习 1.(1) 已知是一次函数,且满意求 ;(2) 推断函数的奇偶性.【答案】(1);(2)见解析.【解析】(1)用待定系数法求一次函数解析式.(2)结合分段函数的性质,分别推断各定义域区间内, f(-x)与f(x)的关系,即可推断函数奇偶性.【点评】本题考查了待定系数法求一次函数,考查了函数的奇偶性的推断,定义域关于原点对称是函数具有奇偶性的前提.再结合分段函数的分段区间,以及对应的解析式,推断关系式f(-x)=f(x)或f(-x)=-f (x)是否成立.练习2.已知函数对一切实数x,y都有f(x+y)﹣f(y)=x(x+2y+1)成立,且f(1)=0.(1)求f(0)的值;(2)求f(x)的解析式;(3)已知a,b∈R,当时,求不等式f(x)+3<2x+a恒成立的a的集合A.【答案】(1)f(0)=﹣2(2)f(x)=x2+x﹣2(3)【解析】(1)令,可得,再依据可得;(2)在条件中的等式中,令,可得,再依据可得所求的解析式;(3)由条件可得当时不等式x2﹣x+1<a恒成立,依据二次函数的学问求出函数上的值域即可得到的范围.【详解】(1)依据题意,在f(x+y)﹣f(y)=x(x+2y+1)中,令x=﹣1,y=1,可得,又,∴.(2)在f(x+y)﹣f(y)=x(x+2y+1)中,令y=0,则f(x)﹣f(0)=x(x+1)又,∴.(3)不等式f(x)+3<2x+a等价于x2+x﹣2+3<2x+a,即x2﹣x+1<a.由当时不等式f(x)+3<2x+a恒成立,可得当时不等式x2﹣x+1<a恒成立.设,则在上单调递减,∴,∴.∴.【点评】(1)解决抽象函数(解析式未知的函数)问题的原则有两个:一是合理运用赋值的方法;二是解题时要运用条件中所给的函数的性质.(2)解答恒成立问题时,一般采纳分别参数的方法,将问题转化为求详细函数最值的方法求解,若函数的最值不存在,则可用函数值域的端点值来代替.练习3.如图,Rt△ABC中,AC=BC=2,正方形CDEF的顶点D、F分别在AC、BC边上,C、D两点不重合,设CD的长度为x,△ABC与正方形CDEF重叠部分的面积为y,则下列图象中能表示y与x之间的函数关系的是()A. (A)B. (B)C. (C)D. (D)【答案】B【解析】当0<x≤1时,y=x2,当1<x≤2时,ED交AB于M,EF交AB于N,如图,CD=x,则AD=2-x,∵Rt△ABC中,AC=BC=2,∴△ADM为等腰直角三角形,∴DM=2-x,∴EM=x-(2-x)=2x-2,∴S△ENM=(2x-2)2=2(x-1)2,∴y=x2-2(x-1)2=-x2+4x-2=-(x-2)2+2,∴y=.故选B.练习4.如图,李老师早晨出门熬炼,一段时间内沿⊙M的半圆形M→A→C→B→M路径匀速慢跑,那么李老师离动身点M的距离与时间x之间的函数关系的大致图象是()A. B.C. D.【答案】D【解析】由题意,得从M到A距离在增加,由A经B到C与M的距离都是半径,由B到M距离渐渐削减,故选D.(九)恒成立问题求参数范围问题例9. 【湖北省武汉市第六中学2024-2025学年调研数学试题】若函数的定义域为,值域为,则的取值范围A. B. C. D.【答案】C【解析】由函数的定义域、值域结合函数单调性求出的取值范围【详解】由函数的对称轴为且函数图像开口向上则函数在上单调递减,在上单调递增,当且仅当处取得最小值由值域可知,故在上函数单调递增,在处取得最大值故,解得综上所述,故选【点睛】本题在知道函数的定义域与值域后求参量的取值范围,在解答题目时结合函数的单调性判定取值域的状况。
高考数学复习考点知识专题讲解28---统计

频数 1
3
2
4
9
26
5
使用了节水龙头 50 天的日用水量频数分布表 日用 水量
频数 1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头 50 天的日用水量数据的频率分布直方图:
5 / 33
(2)估计该家庭使用节水龙头后,日用水量小于 0.35 m3 的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一
1 / 33
的分散程度上是一样的,但在解决实际问题时,一般多采用标准差. 三个特征 利用频率分布直方图估计样本的数字特征: (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以 估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标. 正确运用频率分布条形图和直方图,由于总体分布通常不易知道,我们往往用样本的 频率分布去估计总体分布,一般地,样本容量越大,估计越精确.要求会作、会用频 率分布条形图和直方图. 三种抽样方法: 在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建 立在它的基础上的,三种抽样方法的共同点:它们都是等概率抽样,体现了抽样的公 平性;三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应 的抽样方法. 分析两个变量相关关系的常用方法: 一是利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到 散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变 量之间具有线性相关关系;二是利用相关系数 r 进行判断:|r|≤1 而且|r|越接近于 1,相 关程度越大;|r|越接近于 0,相关程度越小.
高考文科数学命题热点名师解密专题:统计的命题规律(含答案)

【学习目标】1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 【知识要点】 1.抽样方法(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有简单随机抽样、系统抽样和分层抽样.(2)简单随机抽样是指一个总体的个数为(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为抽签法和随机数表法.(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后按各部分所占比例抽样,其中所分成的各部分叫做层.(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先按确定的在各部分抽取. 2.总体分布的估计(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差) ②决定组距与组数 ③将数据分组 ④列频率分布表(下图)⑤画频率分布直方图,将区间标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得个矩形,这样得到的图形叫频率分布直方图.[)a b ,k频率分布直方图的性质:①第个矩形的面积等于样本值落入区间的频率;②由于,所以所有小矩形的面积的和为1.三.高考命题类型分析 (一)随机抽样例1.从2018名学生中选取50名学生参加某一活动,若采用下面的方法选取:先用简单随机抽样从2018人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在这2018人中,每个人入选的概率 ( )A .不全相等B .均不相等C .都相等,且为D .都相等,且为【答案】C 【解析】【详解】因为简单随机抽样和系统抽样都是等可能抽样,从个个体中抽取个个体,则每个个体被抽到的概率都等于,即从2 018名学生中选取50名学生参加全国数学联赛,每人入选的概率都相等,且为,故选C.练习1.下列说法中错误的是( )A .先把高二年级的2000名学生编号为1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为,然后抽取编号为,,的学生,这样的抽样方法是系统抽样法;B .独立性检验中,越大,则越有把握说两个变量有关;C .若两个随机变量的线性相关性越强,则相关系数的值越接近于1;D .若一组数据1、a 、3的平均数是2,则该组数据的方差是. 【答案】C【解析】对于A ,根据个体数目较多,且没有明显的差异,抽取样本间隔相等,知这种抽样方法是系统抽样法,∴A 正确;对应B,独立性检验中,越大,应该是说明两个变量有关系的可能性大,即有足够的把握说明两个变量有关,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数|r |的值越接近于1,C 错误; 对于D ,一组数据1、a 、3的平均数是2,∴a =2;i 1[)i i t t -,∴该组数据的方差是s2=×[(1﹣2)2+(2﹣2)2+(3﹣2)2]=,D正确.故选:C. 上购物经历的人数,所得数据的茎叶图如图所示,则这20个班有网购经历的人数的众数为()A.24 B.37 C.35 D.48【答案】C【解析】这20个班有网购经历的人数最多的数字为35;所以众数为35,故选C.【点睛】本题主要考查利用茎叶图求众数,意在考查对基础知识的掌握与应用,是基础题.练习2.已知一组数据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,那么3,4,5,a,b这组数据的方差为()A.B.2 C.D.【答案】D【解析】根据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,可知,由方差公式求解即可.(三)频率分布直方图例3..例3..2017年APEC会议于11月10日至11日在越南岘港举行,某研究机构为了了解各年龄层对APEC 会议的关注程度,随机选取了100名年龄在[20,45]内的市民举行了调查,并将结果绘制成如图所示的频率分布直方图(分组区间分布为[20,25),[25.30),[30,35),[35,40),[40,45]).(1)求选取的市民年龄在[30,35)内的人数;(2)若从第3,4组用分层抽样的方法选取5名市民进行座谈,再从中选取2人参与APEC会议的宣传活动,求参与宣传活动的市民中至少有一人的年龄在[35,40)内的概率.【答案】(1)30;(2).【解析】(1)由频率分布直方图可得年龄在内的频率为,从而可得结果;(2)利用分层抽样的方法可知,所选的5人中,从第3组选3人,从第4组选2人,利用列举法,求出总事件以及至少有一人的年龄在内的事件,再利用古典概型概率公式即可得出结果.【详解】(1)由频率分布直方图可得年龄在[30,35)内的频率为0.06×5=0.3,则选取的市民年龄在[30,35)内的人数0.3×100=30;【点睛】本题考查古典概率概率公式与频率分布直方图的应用,属于中档题.利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有(1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先,…. ,再,…..依次….… 这样才能避免多写、漏写现象的发生.练习3.某市要对2000多名出租车司机的年龄进行调査,现从中随机抽出100名司机,已知该市的司机年龄都在[20,45]之间,根据调査结果得出司机的年龄情况的频率分布直方图如图所示,估计该市出租车司机年龄在频率是( )A.0.02 B.0.04 C.0.2 D.0.84【答案】C(四)茎叶图例4.将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是( )A.;乙比甲成绩稳定B.;甲比乙成绩稳定C.;乙比甲成绩稳定D.;甲比乙成绩稳定【答案】A练习1.为比较甲、乙两地某月12时的气温状况,随机选取该月中的5天,将这5天中12时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:①甲地的平均气温低于乙地的平均气温;②甲地的平均气温高于乙地的平均气温;③甲地气温的标准差小于乙地气温的标准差;④甲地气温的标准差大于乙地气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )A.①③B.①④C.②③D.②④【答案】B【解析】由已知的茎叶图,我们易分析出甲、乙两地某月12时的气温抽取的样本温度,进而求出两组数据的平均数、方差,可得答案.【详解】由茎叶图中的数据,我们可得甲,乙两地某月12 时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:28,29,30,31,32;所以甲地该月12时的气温的标准差大于乙地该月12时的气温标准差.①正确,故选B.故数据的方差是,故标准差是,故选:D.【点睛】本题考查了解方程组问题,考查求数据的平均数和方差问题,是一道基础题.练习2.若样本的平均数是,方差是,则对样本,下列结论正确的是( )A.平均数为14,方差为5 B.平均数为13,方差为25C.平均数为13,方差为5 D.平均数为14,方差为2【答案】C【解析】根据平均数和方差的定义和性质进行求解即可.【点睛】本题主要考查样本数据的方差和平均数的计算,根据相应的公式进行计算是解决本题的关键.(七)极差、方差、标准差例7.已知某7个数的平均数为3,方差为,现又加入一个新数据3,此时这8个数的平均数为x,方差为,则()A.,B.,C.,D.,【答案】B【解析】由题设条件,利用平均数和方差的计算公式,进行求解,即可得到答案.【详解】由题意,根据这7个数的平均数为3,方差为,即,,即,现又加入一个新数据3,此时这8个数的平均数为,方差为,即,故选B.练习1.在下列命题中,下列选项正确的是()A.在回归直线中,变量时,变量的值一定是15.B.两个变量相关性越强,则相关系数就越接近于1.C.在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.D.若是两个相等的非零实数,则是纯虚数.【答案】D【解析】根据回归方程的定义判断;根据相关系数的定义判断;根据残差图的性质判断;根据纯虚数的定义判断.【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.(九)回归分析例9.26.已知某商品的价格(元)与需求量(件)之间的关系有如下一组数据:;参考:;当时, ,(1)求,;(2)求出回归直线方程;(3)计算相关系数r的值,并说明回归模型拟合程度的好坏。
统计与成对数据的统计分析 (7方法技巧+3易错易混)(解析版)2025年高考数学一轮复习知识清单

专题18统计与成对数据的统计分析(思维构建+知识盘点+重点突破+方法技巧+易混易错)知识点1随机抽样1、抽样调查(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.2、简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.适用于总体个数较少的情况。
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.适用于总体个数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.(3)简单随机抽样的特征(只有四个特点都满足的抽样才是简单随机抽样)①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.3、分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的.(2)分层抽样问题类型及解题思路①求某层应抽个体数量:按该层所占总体的比例计算.②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”【注意】分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ii N n n N=⋅1,2,,i k = )个个体(其中i 是层数,n 是抽取的样本容量,i N 是第i 层中个体的个数,N 是总体容量).知识点2用样本估计总体1、频率分布直方图(1)频率、频数、样本容量的计算方法①频率组距×组距=频率.②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于1.(2)频率分布直方图中数字特征的计算①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的.设中位数为x ,利用x 左(右)侧矩形面积之和等于0.5,即可求出x .③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有1111n n x x p x p x p =+++ ,其中n x 为每个小长方形底边的中点,n p 为每个小长方形的面积.2、百分位数(1)定义:一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有00p 的数据小于或等于这个值,且至少有()00100p -的数据大于或等于这个值.(2)计算一组n 个数据的的第p 百分位数的步骤①按从小到大排列原始数据.②计算00i n p =⨯.③若i 不是整数而大于i 的比邻整数j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第1i +项数据的平均数.(3)四分位数:我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.3、样本的数字特征(1)众数、中位数、平均数①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.③平均数:n 个样本数据12,,,n x x x ⋅⋅⋅的平均数为12nx x x x n++⋅⋅⋅+=,反应一组数据的平均水平,公式变形:1ni i x nx ==∑.(2)标准差和方差①标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示.假设样本数据是12,,,n x x x ⋅⋅⋅,x表示这组数据的平均数,则标准差s =.②方差:方差就是标准差的平方,即2222121[(()()]n s x x x x x x n=-+-+⋅⋅⋅+-.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.【注意】标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.③平均数、方差的性质:如果数据12,,,n x x x ⋯⋯的平均数为x ,方差为2s ,那么一组新数据12,,n x b x b x b ++⋯⋯+的平均数为x b +,方差是2s .一新数据12,,,n ax ax ax ⋯⋯的平均数为ax ,方差是22a s .一组新数据12,,,n ax b ax b ax b ++⋯⋯+的平均数为ax b +,方差是22a s .知识点3成对数据的统计分析1、两个变量的线性相关(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2、回归分析与回归方程(1)回归分析的定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(3)回归方程:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+ 的求法为1122211()()nni i i ii i n ni i i i x x y y x ynx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 其中,11n i i x x n ==∑,11ni i y y n ==∑,(x ,y )称为样本点的中心.(3)相关系数若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x 与y的相关系数(nnii iixx y y x ynx yr ---==∑∑通常用r 来衡量x 与y 之间的线性关系的强弱,r 的范围为11r -≤≤.①当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.②r 越接近1,表示两个变量的线性相关性越强;r 越接近0,表示两个变量间几乎不存在线性相关关系.当||1r =时,所有数据点都在一条直线上.③通常当0.75r >时,认为两个变量具有很强的线性相关关系.3、残差分析对于预报变量y ,通过观测得到的数据称为观测值i y ,通过回归方程得到的 y 称为预测值,观测值减去预测值等于残差,ˆi e称为相应于点(,)i i x y 的残差,即有ˆi e =ˆi i y y -.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(1)残差图:通过残差分析,残差点()ˆ,i i x e比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.(2)通过残差平方和21ˆ()ni i i Q y y==-∑分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.(3)相关指数:用相关指数来刻画回归的效果,其计算公式是:22121ˆ()1(nii i n ii yyR yy ==-=--∑∑.2R 越接近于1,说明残差的平方和越小,也表示回归的效果越好.4、独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表:假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表(3)独立性检验:计算随机变量2()()()()()a b c d a c b d χ-=++++利用2χ的取值推断分类变量X 和Y 是否独立的方法称为χ2独立性检验.α0.100.050.0100.0050.001x α2.7063.8416.6357.87910.828重难点1频率分布直方图的计算1、由频率分布直方图进行相关计算需掌握的2个关系式(1)频率组距×组距=频率.(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.2、利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.【典例1】(24-25高三上·江西上饶·月考)(多选)某高中举行的纪念红军长征出发90周年的知识答题比赛,对参赛的2000名考生的成绩进行统计,可得到如图所示的频率分布直方图,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是()A .参赛成绩的众数约为75分B .用分层抽样从该校学生中抽取容量为200的样本,则应在[)70,80内的成绩抽取30人C .参赛成绩的第75百分位数约为82.5分D .参赛成绩的平均分约为【答案】AC【解析】对于A :由频率分布直方图可得众数为7080752+=,故A 正确;对于B :由频率分布直方图可得[)70,80内应抽取2000.031060⨯⨯=人,故B 错误;对于C :分数在[40,80)内的频率为()0.0050.0150.020.03100.70.75+++⨯=<,在[40,90)内的频率为()0.0050.0150.020.030.02100.90.75++++⨯=>,因此第75百分位数位于80,90内,第75百分位数为0.750.7801082.50.2-+⨯=,故C 正确;对于D :平均数为()10450.005550.015650.02750.03850.02950.0172.5⨯⨯+⨯+⨯+⨯+⨯+⨯=,故D 错误.故选:AC.【典例2】(23-24高三下·湖南衡阳·月考)亚运聚欢潮,璀璨共此时.2023年9月第19届亚洲运动会在杭州举办,来自亚洲45个国家和地区的1万多名运动员在这里团结交流、收获友谊,奋勇拼搏、超越自我,共同创造了亚洲体育新的辉煌和荣光,赢得了亚奥理事会大家庭和国际社会的广泛好评.亚运会圆满结束后,杭州某学校组织学生参加与本届亚运会有关的知识竞赛.为更好地了解该校学生对本届亚运会有关赛事和知识的掌握情况,采用随机抽样的方法抽取了600名学生进行调查,成绩全部分布在40~100分之间,根据调查的结果绘制的学生成绩频率分布直方图如图所示,(1)求频率分布直方图中a 的值;(2)估计这600名学生成绩的中位数;(3)根据频率分布直方图,按分层抽样的方法从成绩在[)[]40,60,90,100的学生中选取5人,再从这5人中任意选取2人,求这2人中至少有1人成绩不低于90分的概率.【答案】(1)0.018a =;(2)80;(3)910【解析】(1)由频率分布直方图,得()100.0040.0080.0120.0260.0321a ⨯+++++=,解得0.018a =;(2)由频率分布直方图,得()100.0040.0080.0120.240.5⨯++=<,10(0.0040.0080.0120.5⨯+++=,则估计这600名学生成绩的中位数为80;(3)由题意得,成绩在[)40,60的频率为0.012100.12⨯=,成绩在[]90,100的频率为0.018100.18⨯=,频率之比为2:3,所以按分层抽样的方法从中选取5人,成绩在[)40,60的学生有2人,分别记为12,a a ,成绩在[]90,100的学生有3人,分别记为123,,b b b ,从这5人中任意选取2人,有12111213212223121323,,,,,,,,,a a a b a b a b a b a b a b b b b b b b ,共10种选法,其中至少有1人成绩不低于90分的选法有1112132122231213,,,,,,,a b a b a b a b a b a b b b b b ,23b b ,共9种,所以这2人中至少有1人成绩不低于90分的概率910P =.重难点02非线性回归分析的求法(1)根据原始数据作出散点图;(2)根据散点图选择恰当的拟合函数;(3)作恰当变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应变换,即可得非线性回归方程.【典例1】(24-25高三上·福建泉州·月考)一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:温度/C x 212324272932产卵数/y 个61120275777经计算得:()()()()6666622111111126,33,557,84,3930,66i i i i i i i i i i i x x y y x x y y x x y y =========--=-=-=∑∑∑∑∑线性回归模型的残差平方和()628.06051236.64,e 3167ˆi i i y y=-=≈∑,其中,i i x y 分别为观测数据中的温差和产卵数,1,2,3,4,5,6i =.(1)若用线性回归方程,求y 关于x 的回归方程ˆˆˆybx a =+(精确到0.1);(2)若用非线性回归模型求得y 关于x 回归方程为0.2303ˆ0.06e x y=,且相关指数2R =0.9522.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好.(ii )用拟合效果好的模型预测温度为35C 时该种药用昆虫的产卵数(结果取整数).附:一组数据()()()1122,,,,,,n n x y x y x y ⋯,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计为()()()121ˆˆˆ,ni i i nii x x y y ba y bx x x ==--==--∑∑;相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑.【答案】(1)ˆ 6.6138.6y x =-;(2)(i )非线性回归模型拟合效果更好;(ii )190;【解析】(1)由题意6n =,则611266i i x x ===∑,611336i i y y ===∑,61621()()557ˆ 6.684()iii ii x x y y bx x ==--==≈-∑∑,ˆ33 6.626138.6a =-⨯=-,y 关于x 的线性回归方程为ˆ 6.6138.6yx =-.(2)(i )对于线性回归模型,621(3930i i y y =-=∑,621()236.64i i i y y =-=∑,相关指数为 621621()1(ii i ii yy yy ==---∑∑236.6413930=-10.06020.9398≈-=,因为0.93980.9522<,所以用非线性回归模型拟合效果更好.(ii )当35x =,时0.230335ˆ0.06e y⨯=8.06050.06e =⨯0.063167190.02190=⨯=≈(个)所以温度为35C ︒时,该种药用昆虫的产卵数估计为190个.【典例2】(23-24高三下·山东济南·三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019年至2023年对应的年份代码依次为1,2,3,4,5.(1)根据散点图判断,y a bx =+和2y c dx =+哪一个适宜作为企业利润y (单位:亿元)关于年份代码x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)中的判断结果,建立y 关于x 的回归方程;(3)根据(2)的结果,估计2024年的企业利润.参考公式及数据;121ˆniii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-,12555i i x =∑=,145979i i x =∑=,15390i i y =∑=,151221i i i x y =∑=,1254607.9i i i x y =∑=【答案】(1)2y c dx =+适宜作为企业利润y (单位:亿元)关于年份代码x 的回归方程类型(2)268.65ˆ0.85yx =+;(3)估计2024年的企业利润为93.3亿元【解析】(1)由散点图的变化趋势,知2y c dx =+适宜作为企业利润y (单位:亿元)关于年份代码x 的回归方程类型;(2)由题意得:()52211115i i x x ===∑,151785i i y y ==∑=,()()()12251222225553904607.955317.9550.8537455597955ˆi i i i i x y x yd x x ==-⨯⨯∑-⨯====⎛⎫∑-⨯-⨯ ⎪⎝⎭,()390ˆˆ550.8568.6555cy d x =-⨯=-⨯=,所以268.65ˆ0.85yx =+;(3)令6x =,268.650.85699.25ˆy=+⨯=,估计2024年的企业利润为99.25亿元.一、应用随机数表法的两个关键点1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.【典例1】(23-24高三下·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是()322118342978645407325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345A .623B .328C .072D .457【答案】A【解析】从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,第五个是328,第六个数是623,,故A 正确.故选:A.【典例2】(23-24高三下·云南·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01,02,,55 进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为()062743132432532709412512631763232616804560111410957774246762428114572042533237322707360751245179301423102118219137263890014005232617A .51B .25C .32D .12【答案】A【解析】依题意,前6个编号依次为:31,32,43,25,12,51,所以选出来的第6个号码所对应的学生编号为51.故选:A二、解决分层抽样的常用公式先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.(1)抽样比=样本容量总体容量=各层样本容量各层个体总量;(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.【典例1】(23-24高三下·河南·三模)国内某优秀新能源电池制造企业在锂电池单位能量密度技术上取得了重大突破,该制造企业内的某车间有两条生产线,分别生产高能量密度锂电池和低能量密度锂电池,总产量为400个锂电池.质检人员采用分层随机抽样的方法随机抽取了一个容量为80的样本进行质量检测,已知样本中高能量密度锂电池有35个,则估计低能量密度锂电池的总产量为().A .325个B .300个C .225个D .175个【答案】C【解析】根据分层随机抽样可知低能量密度锂电池的产量为803540022580-⨯=(个).故选:C 【典例2】(23-24高三下·江西南昌·模拟预测)已知,,A B C 三种不同型号的产品数量之比依次为4:3:7,现用分层抽样的方法抽取容量为N 的样本,若样本中A 型号产品有20件,则N 为()A .60B .70C .80D .90【答案】B【解析】因为,,A B C 三种不同型号的产品数量之比依次为4:3:7,且用分层抽样的方法抽取一个容量为N 的样本,所以A 型号产品被抽的抽样比为:424377=++,因为A 型号产品有20件,所以2027N =,解得70N =.故选:B.三、百分位数的计算计算一组n 个数据的的第p 百分位数的步骤①按从小到大排列原始数据.②计算00i n p =⨯.③若i 不是整数而大于i 的比邻整数j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第1i +项数据的平均数.【典例1】(24-25高三上·江苏南通·月考)已知一组数据1,2,3,4,x 的下四分位数是x ,则x 的可能取值为()A .5B .4C .3D .2【答案】D【解析】一共有5个数据,525% 1.25⨯=,故数据的下四分位数为从数据从小排到大的每2个数据,所以12x ≤≤.故选:D.【典例2】(24-25高三上·广东·月考)样本数据90,80,79,85,72,74,82,77的极差和第75百分位数分别为.【答案】18,83.5【解析】将这组数据从小到大排列为:72,74,77,79,80,82,85,90,共8个,极差为907218-=,因为875%6⨯=,所以这组数据的第75百分位数为828583.52+=.故答案为:18,83.5.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【典例1】(24-25高三上·江苏·开学摸底)如图,已知某频率分布直方图形成“右拖尾”形态,则下列结论正确的是()A .众数=平均数=中位数B .众数<中位数<平均数C .众数<平均数<中位数D .中位数<平均数<众数【答案】B【解析】由频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小,平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,故平均数大于中位数,所以众数<中位数<平均数.故选:B【典例2】(23-24高三下·湖北·模拟预测)(多选)某公司为保证产品生产质量,连续10天监测某种新产品生产线的次品件数,得到关于每天出现的次品的件数的一组样本数据:3,4,3,1,5,3,2,5,1,3,则关于这组数据的结论正确的是()A .极差是4B .众数小于平均数C .方差是1.8D .数据的80%分位数为4【答案】AC【解析】数据从小到大排列为1,1,2,3,3,3,3,4,5,5.对于A ,该组数据的极差为514-=,故A 正确;对于B ,众数为3,平均数为12234452310⨯++⨯++⨯=,两者相等,故B 错误;对于C ,方差为222221(13)2(23)1(33)4(43)1(53)2 1.810⎡⎤-⨯+-⨯+-⨯+-⨯+-⨯=⎣⎦,故C 正确;对于D ,1080%8⨯= ,∴这组数据的80%分位数为第8个数和第9个数的平均数4.5,故D 错误.故选:AC .五、判断相关关系的2种方法1、散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系;2、相关系数法:利用相关系数判定,当|r |越趋近于1时,相关性越强【典例1】(24-25高三上·天津·月考)已知5个成对数据(),x y 的散点图如下,若去掉点()4,3D ,则下列说法正确的是()A .变量x 与变量y 呈正相关B .变量x 与变量y 的相关性变强C .残差平方和变大D .样本相关系数r 变大【答案】B【解析】由散点图可知,去掉点()4,3D 后,y 与x 的线性相关加强,且为负相关,所以B 正确,A 错误;由于y 与x 的线性相关加强,所以残差平方和变小,所以C 错误,由于y 与x 的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r 变小,所以D 错误.故选:B.【典例2】(23-24高三上·湖南·月考)某校数学兴趣小组在某座山测得海拔高度x (单位:千米)与气压y (单位:千帕)的六组数据()(),1,2,,6i i x y i = 绘制成如下散点图,分析研究发现B 点相关数据不符合实际,删除B 点后重新进行回归分析,则下列说法正确的是()A .删除点B 后,样本数据的两变量,x y 正相关B .删除点B 后,相关系数r 的绝对值更接近于1C .删除点B 后,新样本的残差平方和变大D .删除点B 后,解释变量x 与响应变量y 相关性变弱【答案】B 【解析】由题意,后,样本数据的两变量,x y 负相关,所以A 错误;由于B 点较其他点偏离程度大,故去掉B 点后,回归效果更好,从而相关系数r 的绝对值更接近于1,所以B 正确;同理决定系数2R 越接近于1,所以新样本的残差平方和变小,所以C 错误;从而解释变量x 与响应变量y 相关性增强,所以D 错误.故选:B.六、线性回归分析问题的类型及解题方法1、求回归直线方程①计算出x ,y ,错误!2i ,错误!i y i 或错误!(x i -x )(y i -y ),错误!(x i -x )2的值;②利用公式计算回归系数a ^,b ^;③写出回归直线方程y ^=b ^x +a ^.2、回归模型的拟合效果:利用相关系数r 判断,当|r |越趋近于1时,两变量的线性相关性越强.【典例1】(24-25高三上·河北沧州·月考)2024年2月初某地骤降大雪,给开车回家过年的人们带来很大麻烦,地面积雪会影响汽车的行驶安全,车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过试验测得行驶里程与轮胎凹槽深度成负相关,且相关性较强的数据如下:附:经验回归方程ˆˆybx a =+中:()()()1122211ˆiii i i i nniii i x x y y x y nxyb x x xnx ====---==--∑∑∑∑,ˆˆay bx =-.(1)求轮胎凹槽深度y 与行驶里程x 的经验回归方程(ˆa、ˆb 计算结果精确到0.01);(2)若轮胎凹槽的深度小于2.5mm 时,需要换轮胎,则预测汽车行驶多少里程就需要换轮胎(计算结果精确到0.01)?【答案】(1)9.10 1.ˆ13yx =-;(2)5.84万km 【解析】(1)由题意得,919219115.1ˆ09 2.57 6.2028.3061.1325.0925.099i i i ii x yxybxx ==--⨯⨯-===≈--∑∑,6.2 1.139.1ˆ0ay bx =-=+⨯≈ ,所以经验回归方程为 1.ˆ13yx =-.(2)由题意,9.1 1.13 2.5x -≤,解得 5.84x ≥,所以当汽车行驶5.84万km 时,需要更换轮胎.【典例2】(23-24高三下·湖北武汉·模拟预测)随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.年月2023年8月2023年9月2023年10月2023年11月2023年12月2024年1月月份编号x 123456销售金额y /万15.425.435.485.4155.4195.4元若y 与x 的相关关系拟用线性回归模型表示,回答如下问题:(1)试求变量y 与x 的样本相关系数r (结果精确到0.01);(2)试求y 关于x 的经验回归方程,并据此预测2024年2月份该公司的销售金额.(ˆˆ,b a ,均保留一位小数)附:经验回归方程ˆˆˆybx a =+,其中()()()1122211ˆˆˆ,,n niii i i i nniii i x x y y x y nxyb a y bxx x xnx ====---===---∑∑∑∑,样本相关系数()()nniiiix x yy x ynxyr ---=∑∑参考数据:61i i i x y ===∑.【答案】(1)0.96;(2)38.348.7,219.4y x =-万元【解析】(1)123456715.425.435.485.4155.4195.4,85.4,626x y ++++++++++====6221496149162536617.54ii xx =-=+++++-⨯=∑,所以6762463.4685.467020.962035i ix y xyr --⨯⨯==≈⨯∑.(2)由题意616221762463.4685.42ˆ38.317.56i ii ii x y xybxx ==--⨯⨯==≈-∑∑,所以7ˆ785.438.348.2a=-⨯=-,所以y 关于x 的经验回归方程为38.348.7y x =-,所以预测2024年2月份该公司的销售金额为38.3748.7219.4y =⨯-=万元.七、独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式22()()()()()n ad bc a b c d a c b d χ-=++++计算.(3)比较2χ与临界值的大小关系,作统计推断.【典例1】(24-25高三上·广东深圳·月考)(多选)某中学为更好地开展素质教育,现对外出研学课程是否和性别有关做了一项调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的35,女生中选修外出研学课程的人数占女生总人数的12.如果依据0.05α=的独立性检验认为选修外出研学课程与性别有关,但依据0.01α=的独立性检验认为选修外出研学课程与性别无关,则调查人数中男生可能有()附:20()P K k ≥0.050.01k 3.841 6.63522()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .150人B .225人C .300人D .375人【答案】BC【解析】设男生人数为()*5N n n ∈,根据题意可得22⨯列联表如下:则25510321022119995522n n n n n n K n n n n ⎛⎫⋅-⋅ ⎪⎝⎭==⋅⋅⋅,依据依据0.05α=的独立性检验认为选修外出研学课程与性别有关,但依据0.01α=的独立性检验认为选修外出研学课程与性别无关,则103.841 6.63599n≤<,解得38.025965.6865n ≤<,则190.12955328.4325n ≤<.故选:BC .【典例2】(24-25高三上·重庆沙坪坝·开学考试)某学生兴趣小组在研究所在学校的学生性别与身高(身高分为低于170cm 和不低于170cm )的相关关系时,记事件A =“学生身高不低于170cm ”,事件B =“学生为女。
2017高考数学文新课标版考前冲刺复习讲义:第2部分专

透视全国高考揭秘命题规律(六)——概率与统计(全国卷第18题)统计图与概率统计[学生用书P64](2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:【解】(1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.第一步:从统计图(频率分布直方图、茎叶图、扇形图、条形图、折线图等)提取相关的信息与数据.第二步:根据统计原理和方法,理清统计量之间的关系.第三步:将问题“翻译”为“数据”,根据问题要求用数据刻画(或估计)问题.统计表与概率统计[学生用书P64](2016·高考全国卷甲)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)记A(2)记B为事件“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求P(B)的估计值;(3)求续保人本年度平均保费的估计值.【解】(1)事件A发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50200=0.55,故P(A)的估计值为0.55.(2)事件B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30200=0.3,故P(B)的估计值为0.3.(3)由所给数据得调查的0.85a×0.30+a×0.25+1.25a×0.15+1.5a×0.15+1.75a×0.10+2a×0.05=1.192 5a.因此,续保人本年度平均保费的估计值为1.192 5a.第一步:注重“三位一体”的对应关系,即频数、频率和事件的统一体的对应关系.第二步:将“事件”翻译为“数据”,根据事件包含的子事件用数据刻画(或估计).第三步:根据统计原理和方法,求出相关的统计量,并用统计量估计或刻画相应问题.回归分析问题[学生用书P65](2016·高考全国卷丙)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:【解】(1)由折线图中数据和附注中参考数据得r =2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^==2.8928≈0.103, a ^=y -b ^t =1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.第一步:作出散点图或折线图(含已有的散点图或折线图). 第二步:根据散点图选择模拟函数,其中含有以下三类:(1)问题已经指明了用线性回归进行拟合(常考题型),则根据回归方程y ^=b ^x +a ^,其中b ^=求出回归方程.(2)根据散点图分布情况,给出几个模拟函数,要求作出选择,则根据散点分布趋势,结合常规的函数的图象进行恰当选择,取恰当(即拟合效果好)的函数,求回归方程.求回归方程分三步.①换元列表进行恰当的换元,使回归方程化为线性的(即一次函数形),并根据原数据列出换元后的对应表.②利用求线性回归方程的方法求出换元后的线性回归方程.③利用换元变换关系回代得出原回归方程.(3)根据散点图分布情况,自行联想常规函数进行回归方程设置,然后可根据(2)中的方法求回归方程.第三步:回归分析与预测①利用相关系数公式进行回归分析,当|r|越大(|r|趋近于1),线性相关程度越高,拟合效果越好.②利用回归方程预测出x=x0时y的值,从而进行决策处理.备注:当数据不易运算时,试题会提供相关运算结果,但要注意有时要作恰当的数据转化.决策性问题[学生用书P66]满分展示(满分12分)(2016·高考全国卷乙)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; [解题程序]第一步:分别求出x ≤19,x >19时的函数关系式. 第二步:写出y 与x 的函数解析式. 第三步:通过柱状图求n 的最小值.第四步:求购买19个易损零件时,所需费用的平均数. 第五步:求购买20个易损零件时,所需费用的平均数.第六步:作出判断.(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?[联想破译]联想因素:易损零件数、易损零件所需费用、函数解析式、频率不小于0.5、平均数. 联想线路:(1)读懂题意与柱状图,即可用分段函数的形式表示y 与x 的函数解析式; (2)读懂不小于即是大于或等于,并且把频率问题转化为频数问题,即可求出n 的最小值;(3)分别求出n =19与n =20时,这100台机器在购买易损零件上所需费用的平均数,比较平均数大小,即可得出结论.[标准答案] (1)(当x ≤19时,y =3 800;)(1分) 当x >19时,y =3 800+500(x -19),=500x -5 700.(3分)所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19500x -5 700,x >19(x ∈N ).(4分)(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(5分)第(1)问得分点说明: 求出x ≤19时,y 的值得1分;求出x>19时,x与y的关系式得2分;正确写出解析式得1分(3)若每台机器在购机同时都购买19个易损零件,则这100台机,器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,,10台的费用为4 800,因此这100台机器在购买易损零件上所需费,用的平均数为1100×(3 800×70+4 300×20+4 800×10)=4 000.(8分)若每台机器在购机同时都购买20个易损零件,则这100台机器中,有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为,1100×(4 000×90+4 500×10)=4 050.(11分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)第(3)问得分点说明: 求出购买19个易损零件时所需费用的平均数得3分;求出购买20个易损零件时所需费用的平均数得3分;正确作出判断得1分[满分心得](1)写全得分步骤对于解题过程中是得分点的步骤,有则给分,无则没分,所以对于得分点步骤一定要写全,如第(1)问中,分别求x≤19,x>19时的关系式得分.(2)写明得分关键对于解题过程中的关键点,有则给分,无则没分,所以在答题时,一定要写清得分关键点,如第(1)问中应写出求解析式的过程,第(2)问应写出n的最小值为19的原因,第(3)问应写出求平均数的过程,对于上述问题,如果直接写出结果,只能得部分分.。
(精选试题附答案)高中数学第九章统计解题技巧总结

(名师选题)(精选试题附答案)高中数学第九章统计解题技巧总结单选题1、已知100个数据的第75百分位数是9.3,则下列说法正确的是( )A .这100个数据中一定有75个数小于或等于9.3B .把这100个数据从小到大排列后,9.3是第75个数据C .把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数D .把这100个数据从小到大排列后,9.3是第75个与第74个数据的平均数答案:C分析:举反例否定选项AB ;依据第75百分位数的定义去判断选项CD.若100个数据全为9.3,满足题意,但不满足选项A ,故A 错误;当这100个数据均为9.3时,把这100个数据从小到大排列后,9.3不一定是第75个数据.选项B 判断错误; 把这100个数据从小到大排列后,9.3是第75个与第76个数据的平均数.则选项C 判断正确,选项D 判断错误.故选:C2、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为3.10故选:C3、嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为()4567321212310201045215200112512932049234493582 003623486969387481A.12B.20C.29D.23答案:C分析:依次从数表中读出答案.依次从数表中读出的有效编号为:12,02,01,04,15,20,01,29,得到选出来的第7个个体的编号为29.故选:C.4、北京舞蹈学院为了解大一舞蹈专业新生的体重情况,对报到的1000名舞蹈专业生的数据(单位:kg)进行统计,得到如图所示的体重频率分布直方图,则体重在60kg以上的人数为()A.100B.150C.200D.250答案:D分析:根据频率分布直方图求出体重在60kg以上的小矩形的面积,即为概率,根据总人数即可求解.0.040×5+0.010×5=0.25,1000×0.25=250,故选:D.5、某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图,90后从事互联网行业岗位分布条形图,则下列结论错误的是()注:90后指1990年及以后出生,80后指1980−1989年之间出生,80前指1979年及以前出生.A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后一定比80前多D.互联网行业中从事技术岗位的人数90后一定比80后多答案:D解析:根据整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,对四个选项逐一分析,即可得出正确选项.对于选项A,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术和运营岗位的人数占的比分别为39.6%和17%,则“90后”从事技术和运营岗位的人数占总人数的56%×(39.6%+17%)≈31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A正确;对于选项B,因为互联网行业从业人员中,“90后”占比为56%,其中从事技术岗位的人数占的比为39.6%,则“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过20%,故选项B正确;对于选项C,“90后”从事运营岗位的人数占总人数的比为56%×17%≈9.5%,大于“80前”的总人数所占比3%,故选项C正确;选项D,“90后”从事技术岗位的人数占总人数的56%×39.6%≈22.2%,“80后”的总人数所占比为41%,条件中未给出从事技术岗位的占比,故不能判断,所以选项D错误.故选:D.小提示:关键点点睛:本题考查利用扇形统计图和条形统计图解决实际问题,解本题的关键就是利用条形统计图中“90后”事互联网行业岗位的占比乘以“90后”所占总人数的占比,再对各选项逐一分析即可.6、“二万五千里长征”是1934年10月到1936年10月中国工农红军进行的一次战略转移,是人类历史上的伟大奇迹,向世界展示了中国工农红军的坚强意志,在期间发生了许多可歌可泣的英雄故事.在中国共产党建党100周年之际,某中学组织了“长征英雄事迹我来讲”活动,已知该中学共有高中生2700名,用分层抽样的方法从该校高中学生中抽取一个容量为45的样本参加活动,其中高三年级抽取了14人,高二年级抽取了15人,则该校高一年级学生人数为()A.720B.960C.1020D.1680答案:B解析:根据分层抽样中样本容量比与总体容量比相等可得.由题意高一抽取的学生为45−14−15=16.设高一学生数为n,则n2700=1645,解得n=960.故选:B.7、2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为()A.40B.39C.38D.37答案:C分析:利用中位数左右两边的小矩形的面积都等于0.5即可求解.年龄位于[18,24)的频率为0.013×6=0.078,年龄位于[24,30)的频率为0.023×6=0.138,年龄位于[30,36)的频率为0.034×6=0.204,年龄位于[36,42)的频率为0.040×6=0.240,因为0.078+0.138+0.204=0.42<0.5,而0.078+0.138+0.204+0.240=0.42=0.66>0.5,所以中位数位于[36,42),设中位数为x,则0.078+0.138+0.204+(x−36)×0.04=0.5,解得:x=38,故选:C.8、从某班50名学生中抽取6名学生进行视力状况的统计分析,下列说法正确的是()A.50名学生是总体B.每个被调查的学生是个体C.抽取的6名学生的视力是一个样本D.抽取的6名学生的视力是样本容量答案:C分析:根据总体、样本、个体、样本容量的概念判断.从某班50名学生中抽取6名学生进行视力状况的统计分析,则50个学生的视力状况是总体,抽取的6名学生的视力是一个样本,每个被调查的学生的视力状况是个体,样本容量是6,结合所给的选项,只有C正确.故选:C.9、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确. 故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题10、已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27、28、39、40、m 、50;乙组:24、n 、34、43、48、52.若这两组数据的30百分位数、80百分位数分别相等,则m n 等于( )A .127B .107C .43D .74答案:A分析:根据百分位数的定义,求出30%×6=1.8,故选取第2个数据为30百分位数,同理选取第5个数据作为80百分位数,求出m =48,n =28,进而求出结果.因为30%×6=1.8,大于1.8的比邻整数为2,所以30百分位数为n =28,80%×6=4.8,大于4.8的比邻整数为5,所以80百分位数为m =48,所以m n =4828=127.故选:A填空题11、设某组数据均落在区间[10,60]内,共分为[10,20),[20,30),[30,40),[40,50),[50,60]五组,对应频率分别为p 1,p 2,p 3,p 4,p 5.已知依据该组数据所绘制的频率分布直方图为轴对称图形,给出下列四个条件:①p 1=0.1,p 3=0.4;②p 2=2p 5;③p 1+p 4=p 2+p 5=0.3;④p 1⩽2p 2⩽4p 3⩽2p 4⩽p 5.其中能确定该组数据频率分布的条件有__________.答案:①④分析:由已知对称性加下四个条件中的一个能求出p 1,p 2,p 3,p 4,p 5,即符合题意.已知p 1=p 5,p 2=p 4,p 1+p 2+p 3+p 4+p 5=1,若①p 1=0.1,p 3=0.4,则p 2=0.2,p 4=0.2,p 5=0.1;若②p 2=2p 5,则p 3+6p 1=1,不能得出p 1,p 3;若③p 1+p 4=p 2+p 5=0.3,则可得p 3=0.4,但p 1,p 2,p 4,p 5的解不确定,若p 1⩽2p 2⩽4p 3⩽2p 4⩽p 5.则p 1=2p 2=4p 3=2p 4=p 5,可得p 3=113,p 1=p 5=413,p 2=p 4=213, 所以答案是:①④.小提示:本题考查频率分布直方图的性质,本题实质就是由频率分布直方图得出p 1=p 5,p 2=p 4,p 1+p 2+p 3+p 4+p 5=1,然后判断再加哪个条件能求得各频率即可,通过解方程组可得.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x 150 解得:x =90所以答案是:9013、为了了解高一、高二、高三年级学生的身体状况,现用分层随机抽样的方法抽取一个容量为1200的样本,三个年级学生人数之比依次为k:5:3.已知高一年级共抽取了240人,则高三年级抽取的人数为___________人. 答案:360分析:根据高一年级学生所占的比例,求出k ,得到高三年级抽取的人数.由已知高一年级抽取的比例为2401200=15,所以k k+5+3=15,得k =2,故高三年级抽取的人数为1200×32+5+3=360.所以答案是:36014、用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个容量为3的样本,若个体a在第一次被抽到的可能性为18,那么n=________,在整个抽样中,每个个体被抽到的可能性为________.答案: 8 38分析:依据简单随机抽样方式,总体中的每个个体被抽到的概率都是一样的,再结合容量是3,可以看成是抽3次,从而可求得概率.简单随机抽样时第一次抽样可以理解为从n个个体中抽取一个个体,则每个个体被抽到的可能性是1n,因此n=8;整个抽样过程中每个个体被抽到的可能性是18×3=38.所以答案是:8,38.15、一组数据共40个,分为6组,第1组到第4组的频数分别为10、5、7、6,第5组的频率为0.1,则第6组的频数为______.答案:8分析:根据第5组的频率为0.1可求第5组的频数,从而可求第6组的频数.因为第5组的频率为0.1,故第5组的频数为0.1×40=4,故第6组的频数为40−10−5−7−6−4=30−22=8,所以答案是:8.解答题16、某校现有学生1500人,为了解学生数学学习情况,对学生进行了数学测试,得分在[50,100]之间,按[50,60),[60,70),[70,80),[80,90),[90,100]分组,得到的频率分布直方图如图,且已知m=32n.(1)求m、n的值;(2)估计该校数学测试的平均分;(3)估计该校数学分数在[50,70)的人数.答案:(1)m=0.015,n=0.01(2)76.5分(3)375分析:(1)由题意可得{m=32n(n+m+0.035+0.03+n)×10=1,解方程组即可求出结果;(2)利用频率分布直方图中平均数的计算公式即可求出结果;(3)分别计算出[50,60)和[60,70)的人数即可求出结果.(1)由题意得{m=32n(n+m+0.035+0.03+n)×10=1,解得m=0.015,n=0.01;(2)(55×0.01+65×0.015+75×0.035+85×0.03+95×0.01)×10=76.5(分)(3)分数在[50,60)的频率是0.01×10=0.1,估计该校数学分数在[50,60)的人数是1500×0 .1=150;同理,分数在[60,70)的频率是0.015×10=0.15,估计该校数学分数在[60,70)的人数是1500×0.15=225.∴估计该校数学分数在[50,70)的人数为150+225=375.17、中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为:正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10000刀(1刀=100张),该公司按照某种质量指标x给宣纸确定等级如表所示:在该公司所生产的宣纸中随机生产了一刀进行检验,得到频率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸利润为8元,废品的利润为−20元.(1)试估计该公司的年利润;(2)市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量;据调查这种机器生产的宣纸的质量指标x如表所示:其中为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请该公司是否购买这种机器,请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表)答案:(1)520万元;(2)建议该公司购买这种机器,理由见解析.分析:(1)计算出一刀宣纸中正牌纸、副牌纸以及废品纸的张数,结合已知条件计算出一刀宣纸的利润的估计值,再乘以10000可得结果;(2)计算出该公司改进前后一刀宣纸的利润,比较大小后可得出结论.(1)由频率分布直方图得:一刀宣纸有正牌100×0.1×4=40张,有副牌100×0.05×4×2=40张,有废品100×0.025×4×2=20张,∴该公司一刀宣纸的利润的估计值为40×15+40×8−20×20=520元,∴估计该公司的年利润为520万元;(2)由频率分布直方图得:x=42×0.025×4+46×0.025×4+50×0.1×4+50×0.1×4+58×0.025×4=50.这种机器生产的宣纸的质量指标x如下表所示:∴一刀宣纸中有正牌的张数估计为100×0.6827=68.27,废品的张数估计为:100×(1−0.9545)=4.55,副牌的张数为:100×(0.9545−0.6827)=27.18,∴一刀宣纸的利润为:68.27×12+27.18×5−4.55×20=864.14元,∴公司改进后该公司的利润为:864.14−100=764.14万元,∵764.14>520,∴建议该公司购买这种机器.18、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例、使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数、将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图的频率分布直方图.(1)估计总体400名学生中分数小于60的人数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)根据该大学规定、把25%的学生划定为不及格、确定本次测试的及格分数线、低于及格分数线的学生需要补考.答案:(1)80(2)20(3)65分分析:(1)由频率分布直方图求出分数不小于60的频率,即可得到分数小于60的频率,即可估计人数;(2)由频率分布直方图求出分数在区间[40,50)内的人数,即可估计总体中分数在区间[40,50)内的人数;(3)根据百分位数计算规则计算可得.(1)解:据频率分布直方图可知,样本中分数不小于60的频率为(0.02+0.04+0.02)×10=0 .8,所以样本中分数小于60的频率为1−0.8=0.2,所以估计总体400名学生中分数小于60的人数为400×0.2=80.(2)解:根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100−100×0.9−5=5,=20.所以总体中分数在区间[40,50)内的人数估计为400×5100(3)解:设分数的第25百分位数为x,分数小于70的频率为1−(0.04+0.02)×10=0.4,分数小于60的频率为1−(0.02+0.04+0.02)×10=0.2,所以x∈[60,70),即0.2+(x−60)×0.01=0.25,解得x=65,则本次考试的及格分数线为65分.19、2022年北京冬奥会防寒服中的“神奇内芯”—仿鹅绒高保暖絮片,是国家运动员教练员比赛服装的保暖材料.该“内芯”具有超轻超薄、湿态保暖、高蓬松度等特点,其研发是国家重点研发计划“科技冬奥”重点专项之一,填补了国内空白.为了保证其质量,厂方技术员从生产的一批保暖絮片中随机抽取了100处,分别测量了其纤维长度(单位:mm)的均值,并制成如下频率分布直方图:(1)估计该批保暖絮片纤维长度的平均数x̅和样本方差s2(同一组数据用该区间的中点值作代表);(2)该批保暖絮片进人成品库之前需进行二次检验,从中随机抽取15处测量其纤维长度均值,数据如下:31.8,32.7,28.2,34.3,29.1,34.8,37.2,30.8,30.6,25.2,32.9,28 .9,33.9,29.5,34.5.请问该批保暖絮片是否s,则认为保暖絮片合格,否则认为不合格).合格?(若二次抽检纤维长度均值y̅满足|x̅−y̅|<12答案:(1)31,12.28;(2)合格﹒分析:(1)根据频率分布直方图,求出每一组的频率和频数,根据方差计算公式即可计算方差;s的大小关系即可判断.(2)求出y̅,比较|x̅−y̅|、12(1)由频率分布直方图可得,纤维长度区间是[23,25)、[25,27)、[27,29)、[29,31)、[31,33)、[33,35)、[35,37)、[37,39]的频率分别为:0.04、0.09、0.16、0.24、0.18、0.14、0.10、0.05,对应的频数分别为:4、9、16、24、18、14、10、5,故样本均值为:1(4×24+9×26+16×28+24×30+18×32+14×34+10×36+5×38)=31;100样本方差为:1(4×72+9×52+16×32+24×1+18×1+14×32+10×52+5×72)=12.28﹒100∴估计该保暖絮片的纤维长度的平均数为x̅=31,方差为s2=12.28;(2)二次抽检纤维长度均值:y̅=30+115(1.8+2.7−1.8+4.3−0.9+4.8+7.2+0.8+0.6−4.8+2.9−1.1+3.9−0 .5+4.5)=31.6,∵|x̅−y̅|2=0.62=0.36<(12s)2=3.07,∴该批保暖絮片合格﹒。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【学习目标】1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 【知识要点】 1.抽样方法(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有简单随机抽样、系统抽样和分层抽样.(2)简单随机抽样是指一个总体的个数为(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为抽签法和随机数表法.(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后按各部分所占比例抽样,其中所分成的各部分叫做层.(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先按确定的在各部分抽取. 2.总体分布的估计(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差) ②决定组距与组数 ③将数据分组 ④列频率分布表(下图)分组频数频率累计频率…………率除以组距的商为高,分别画矩形,共得个矩形,这样得到的图形叫频率分布直方图.频率分布直方图的性质:①第个矩形的面积等于样本值落入区间的频率;②由于,所以所有小矩形的面积的和为1.三.高考命题类型分析 (一)随机抽样例1.从2018名学生中选取50名学生参加某一活动,若采用下面的方法选取:先用简单随机抽样从201801[)t t ,1r 1f 1f 12[)t t ,2r 2f 12f f +1[]k k t t -,k r k f k i 1[)i i t t -,人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在这2018人中,每个人入选的概率()A.不全相等B.均不相等C.都相等,且为D.都相等,且为【答案】C【解析】【详解】因为简单随机抽样和系统抽样都是等可能抽样,从个个体中抽取个个体,则每个个体被抽到的概率都等于,即从2 018名学生中选取50名学生参加全国数学联赛,每人入选的概率都相等,且为,故选C.练习1.下列说法中错误的是()A.先把高二年级的2000名学生编号为1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为,然后抽取编号为,,的学生,这样的抽样方法是系统抽样法;B.独立性检验中,越大,则越有把握说两个变量有关;C.若两个随机变量的线性相关性越强,则相关系数的值越接近于1;D.若一组数据1、a、3的平均数是2,则该组数据的方差是.【答案】C【解析】对于A,根据个体数目较多,且没有明显的差异,抽取样本间隔相等,知这种抽样方法是系统抽样法,∴A正确;对应B,独立性检验中,越大,应该是说明两个变量有关系的可能性大,即有足够的把握说明两个变量有关,B正确;对于C,两个随机变量的线性相关性越强,则相关系数|r|的值越接近于1,C错误;对于D,一组数据1、a、3的平均数是2,∴a=2;∴该组数据的方差是s2=×[(1﹣2)2+(2﹣2)2+(3﹣2)2]=,D正确.故选:C.上购物经历的人数,所得数据的茎叶图如图所示,则这20个班有网购经历的人数的众数为()A.24 B.37 C.35 D.48【答案】C【解析】这20个班有网购经历的人数最多的数字为35;所以众数为35,故选C.【点睛】本题主要考查利用茎叶图求众数,意在考查对基础知识的掌握与应用,是基础题.练习2.已知一组数据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,那么3,4,5,a,b这组数据的方差为()A.B.2 C.D.【答案】D【解析】根据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,可知,由方差公式求解即可.(三)频率分布直方图例3..例3..2017年APEC会议于11月10日至11日在越南岘港举行,某研究机构为了了解各年龄层对APEC会议的关注程度,随机选取了100名年龄在[20,45]内的市民举行了调查,并将结果绘制成如图所示的频率分布直方图(分组区间分布为[20,25),[25.30),[30,35),[35,40),[40,45]).(1)求选取的市民年龄在[30,35)内的人数;(2)若从第3,4组用分层抽样的方法选取5名市民进行座谈,再从中选取2人参与APEC会议的宣传活动,求参与宣传活动的市民中至少有一人的年龄在[35,40)内的概率.【答案】(1)30;(2).【解析】(1)由频率分布直方图可得年龄在内的频率为,从而可得结果;(2)利用分层抽样的方法可知,所选的5人中,从第3组选3人,从第4组选2人,利用列举法,求出总事件以及至少有一人的年龄在内的事件,再利用古典概型概率公式即可得出结果.【详解】(1)由频率分布直方图可得年龄在[30,35)内的频率为0.06×5=0.3,则选取的市民年龄在[30,35)内的人数0.3×100=30;【点睛】本题考查古典概率概率公式与频率分布直方图的应用,属于中档题.利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有(1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先,…. ,再,…..依次….… 这样才能避免多写、漏写现象的发生.练习3.某市要对2000多名出租车司机的年龄进行调査,现从中随机抽出100名司机,已知该市的司机年龄都在[20,45]之间,根据调査结果得出司机的年龄情况的频率分布直方图如图所示,估计该市出租车司机年龄在频率是( )A.0.02 B.0.04 C.0.2 D.0.84【答案】C(四)茎叶图例4.将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是( )A.;乙比甲成绩稳定B.;甲比乙成绩稳定C.;乙比甲成绩稳定D.;甲比乙成绩稳定【答案】A练习1.为比较甲、乙两地某月12时的气温状况,随机选取该月中的5天,将这5天中12时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:①甲地的平均气温低于乙地的平均气温;②甲地的平均气温高于乙地的平均气温;③甲地气温的标准差小于乙地气温的标准差;④甲地气温的标准差大于乙地气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )A.①③B.①④C.②③D.②④【答案】B【解析】由已知的茎叶图,我们易分析出甲、乙两地某月12时的气温抽取的样本温度,进而求出两组数据的平均数、方差,可得答案.【详解】由茎叶图中的数据,我们可得甲,乙两地某月12 时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:28,29,30,31,32;所以甲地该月12时的气温的标准差大于乙地该月12时的气温标准差.①正确,故选B.故数据的方差是,故标准差是,故选:D.【点睛】本题考查了解方程组问题,考查求数据的平均数和方差问题,是一道基础题.练习2.若样本的平均数是,方差是,则对样本,下列结论正确的是( )A.平均数为14,方差为5 B.平均数为13,方差为25C.平均数为13,方差为5 D.平均数为14,方差为2【答案】C【解析】根据平均数和方差的定义和性质进行求解即可.【点睛】本题主要考查样本数据的方差和平均数的计算,根据相应的公式进行计算是解决本题的关键.(七)极差、方差、标准差例7.已知某7个数的平均数为3,方差为,现又加入一个新数据3,此时这8个数的平均数为x,方差为,则()A.,B.,C.,D.,【答案】B【解析】由题设条件,利用平均数和方差的计算公式,进行求解,即可得到答案.【详解】由题意,根据这7个数的平均数为3,方差为,即,,即,现又加入一个新数据3,此时这8个数的平均数为,方差为,即,故选B.练习1.在下列命题中,下列选项正确的是()A.在回归直线中,变量时,变量的值一定是15.B.两个变量相关性越强,则相关系数就越接近于1.C.在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.D.若是两个相等的非零实数,则是纯虚数.【答案】D【解析】根据回归方程的定义判断;根据相关系数的定义判断;根据残差图的性质判断;根据纯虚数的定义判断.【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.(九)回归分析例9.26.已知某商品的价格(元)与需求量(件)之间的关系有如下一组数据:x 14 16 18 20 22y 12 10 7 5 3;参考:;当时, ,(1)求,;(2)求出回归直线方程;(3)计算相关系数r的值,并说明回归模型拟合程度的好坏。
【答案】(1);(2);(3),拟合效果好.【解析】(1)由平均数公式计算x,y的平均值即可;(2)结合回归方程系数公式和(1)的结论求解回归方程即可;(3)利用相关系数的计算公式求得相关系数即可比较拟合效果的好坏.【点睛】本题考查了线性回归方程的实际应用,线性回归方程的性质,相关系数的概念等,重点考查学生的计算能力和对基础概念的理解,属于中等题.练习1.某工厂每日生产一种产品吨,每日生产的产品当日销售完毕,日销售额为万元,产品价格随着产量变化而有所变化,经过一段时间的产销,得到了的一组统计数据如下表:(1)请判断与中,哪个模型更适合刻画之间的关系?可从函数增长趋势方面给出简单的理由;(2)根据你的判断及下面的数据和公式,求出关于的回归方程,并估计当日产量时,日销售额是多少?(结果保留整数)参考公式及数据:线性回归方程中,,.,,【答案】(1)答案见解析;(2)23万元.【解析】分析:(1)从函数增长趋势考虑可知更适合刻画之间的关系.(2)由题意可得非线性回归方程为,据此预测当日产量时,日销售额是23万元.点睛:本题主要考查非线性回归方程的求解,回归分析的数学思想等知识,意在考查学生的转化能力和计算求解能力.(十一)独立性检验例11.《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据:月份 1 2 3 4 5违章驾驶员人数120 105 100 90 85(1)请利用所给数据求违章人数与月份之间的回归直线方程;(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:能否据此判断有的把握认为“礼让斑马线”行为与驾龄有关?不礼让斑马线礼让斑马线合计驾龄不超过1年22 8 30驾龄1年以上8 12 20合计30 20 50参考公式及数据:.(其中)【答案】(1);(2)有的把握认为“礼让斑马线”行为与驾龄关.【解析】(1)利用所给数据计算、,求出回归系数,写出回归直线方程;(2)由列联表中数据计算K2,对照临界值得出结论.(2)的可能取值为,,,,,,,,所以的分布列为。