高考数学一轮复习人教B版 统计初步 名师精编学案

合集下载

高考数学一轮复习 讲义统计教案

高考数学一轮复习 讲义统计教案

第十一讲 复习统计一、本讲进度《统计》复习 二、本讲主要内容1、本章内容是初中《统计初步》与高中《概率》内容的深入和扩展,对数理统计中要研究的两个基本问题;如何从总体中抽取样本以及如何通过对所抽取的样本进行计算和分析,从而对总体的相应情况作出推断,作了初步的介绍。

几个基本名词:在统计中,考察对象的全体称为总体,总体中的每一个对象称为个体。

若记总体中N 个个体取值分别为x 1,x 2,…,x N ,则称)x x x (N1N 21+++=μ 为总体平均数(μ为N 个个体的算术平均数)若记])x ()x ()x [(N12N 22212μ-+μ-+μ-=σ ,则称σ2为总体方差,σ称为总体标准差。

初中《统计初步》的主要内容⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎨⎧⎩⎨⎧⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧→⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎪⎩⎪⎨⎧平均数样本平均数去估计总体样本容量等样本个体总体样本去估计总体频率分布从整体分布上描述标准差方差描述其被动大小中位数众数平均数描述集中趋势从特征数上描述描述一组数据的方法,,, 2、抽样方法的分类:按照抽取样本时总体中的每个个体被抽取的概率是否相等⎩⎨⎧不等概率抽样等概率抽样本章只研究等概率抽样 等概率抽样⎩⎨⎧不放回抽样放回抽样常用的三种抽样方法的比较:3、用样本的频率分布估计总体分布,分两种情况:(1)当总体中的个数体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图。

例如射击的环数,掷单粒骰子时出现的点数等;(2)当总体中的个体取不同值较多甚至无限时,此时需要对样本数据进行整理,其频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率。

画第二种情况频率分布图的步骤是: ①计算最大值与最小值的差; ②决定组距与组数;③决定分点,通常使分点比数据多一位小数,并且把第一小组的起点稍微减小一点; ④列出频率分布表; ⑤画出频率分布直方图频率分布将随着样本容量的增大而更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的概率密度曲线。

高三数学理一轮配套教案:《统计、统计案列》人教B版

高三数学理一轮配套教案:《统计、统计案列》人教B版

§11.1随机抽样1. 简单随机抽样(1)定义:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数表法. 2. 系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =Nn ;当Nn 不是整数时,可随机地从总体中剔除余数,再确定分段间隔; (3)在第1段用简单随机抽样确定第一个个体编号s (s ≤k );(4)按照一定的规则抽取样本,通常是将s 加上间隔k 得到第2个个体编号(s +k ),再加k 得到第3个个体编号(s +2k ),依次进行下去,直到获取整个样本. 3. 分层抽样(1)分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)当总体由有明显差异的几部分组成时,往往选用分层抽样.1. 判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √ ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关. ( × ) (3)系统抽样在起始部分抽样时采用简单随机抽样.( √ )(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × ) (5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )2. 在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是( )A .随机抽样B .分层抽样C .系统抽样D .以上都不是答案 C3. 将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )A .700B .669C .695D .676 答案 C解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.4. 大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________. 答案 简单随机抽样解析因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.5.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.答案12解析样本的抽取比例为2148+36=14,所以应抽取男运动员48×14=12(人).题型一简单随机抽样例1下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.(3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.思维启迪判断一个抽样是否为简单随机抽样,要判断是否符合简单随机抽样的特征.解(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.(2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(4)不是简单随机抽样.因为不是等可能抽样.思维升华(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08答案 D解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.题型二系统抽样例2将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9思维启迪系统抽样又称“等距抽样”.可以根据“等距”确定各营区被抽中的人数.答案 B解析由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N+)组抽中的号码是3+12(k-1).令3+12(k-1)≤300得k≤103,因此第Ⅰ营区被抽中的人数是25;4令300<3+12(k-1)≤495得1034<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B.思维升华(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 题型三 分层抽样例3(2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A.9 B.10 C.12 D.13思维启迪分层抽样,抽样比是一个定值.答案 D解析∵360=n120+80+60,∴n=13.思维升华在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373x y男生377370zA.24 B.18 C.答案 C解析依题意我们知道二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三=16.年级抽取的学生人数为64×28五审图表找规律典例:(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404080200中年80120160240600青年40160280720 1 200小计160320480 1 040 2 000(1)(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情况了解相当 将单位人员看作一个整体↓(从表中数据看总人数为2 000人) 人员较多,可采用系统抽样 规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取, [1分] 抽取比例为402 000=150.[2分] 故老年人,中年人,青年人各抽取4人,12人,24人.[4分](2)按管理、技术开发、营销、生产分层,用分层抽样法抽取, [5分]抽取比例为252 000=180,[6分]故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. [8分](3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]温馨提醒 (1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.方法与技巧三种抽样方法的比较进行分层抽样时应注意几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.A组专项基础训练(时间:30分钟)一、选择题1.(2012·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808 C.1 212 D.2 012答案 B解析由题意知抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有1296=101N,解得N=808.2. 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )A .6B .8C .10D .12 答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽人数为14×4070=8. 3. 某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .35 答案 B解析 由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.4. 为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为 ( )A .13B .19C .20D .51 答案 C解析 抽样间隔为46-33=13, 故另一位同学的编号为7+13=20,选C.5. 某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按1100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为( ) A .8 B .11 C .16 D .10 答案 A解析 设高一学生有x 人,则高三学生有2x 人,高二学生有(x +300)人,学校共有4x +300=3 500(人),解得x =800(人),由此可得按1100的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为1100×800=8(人),故应选A.二、填空题6. (2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校. 答案 18 9解析 150×30150+75+25=150×30250=18,75×30250=9.7. 将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________. 答案 16,28,40,528. (2012·福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________. 答案 12解析 依题意,女运动员有98-56=42(人). 设应抽取女运动员x 人,根据分层抽样特点, 得x 42=2898,解得x =12. 9. 课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________. 答案 2解析 由已知得抽样比为624=14,∴丙组中应抽取的城市数为8×14=2.10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________. 答案 11解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x ,则由系统抽样的法则可知,第n 组抽出个体的号码应该为x +(n -1)×8,所以第16组应抽出的号码为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.B 组 专项能力提升 (时间:30分钟)1. 某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( )A .②、③都不能为系统抽样B .②、④都不能为分层抽样C .①、④都可能为系统抽样D .①、③都可能为分层抽样答案 D解析 因为③为系统抽样,所以选项A 不对;因为②为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.2. (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15 答案 C解析 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 3. 为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________. 答案 404. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码 为______.若采用分层抽样,40岁以下年龄段应抽取______人. 答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人, 则40200=x100,解得x =20. 5. 一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.6. 某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.。

2024年高考数学(人教B版)一轮复习学案第9章9.2用样本估计总体

2024年高考数学(人教B版)一轮复习学案第9章9.2用样本估计总体

§9.2 用样本估计总体考试要求 1.会用统计图表对总体进行估计,会求n 个数据的p %分位数.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理 1.百分位数设一组数按照从小到大排列后为x 1,x 2,…,x n ,计算i =np %的值,如果i 不是整数,设i 0为大于i 的____________,取xi 0为p %分位数;如果i 是整数,取x i +x i +12为p %分位数.特别地,规定:0分位数是x 1(即最小值),100%分位数是________(即最大值). 2.平均数、中位数和众数(1)平均数:x = .(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最 的一个数据(当数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时). (3)众数:一组数据中出现次数 的数据(即频数最大值所对应的样本数据). 3.方差和标准差 (1)方差:s 2=或1n ∑i =1n x 2i -x 2.(2)标准差:s = .4.用样本的数字特征估计总体的数字特征(1)一般情况下,如果样本容量恰当,抽样方法合理,在估计总体的数字特征时,只需直接算出________对应的数字特征即可.(2)对于分层抽样的情况,我们以分两层抽样的情况为例.假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x ,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y ,方差为t 2.则x =1m ∑i =1m x i ,s 2=1m ∑i =1m (x i -x )2,y =1n ∑i =1n y i ,t 2=1n ∑i =1n(y i -y )2.如果记样本均值为a ,样本方差为b 2,则可以算出 a =1m +n (∑i =1mx i +∑i =1n y i )=m x +n y m +n,b 2=m [s 2+(x -a )2]+n [t 2+(y -a )2]m +n=1m +n ⎣⎡⎦⎤(ms 2+nt 2)+mn m +n (x -y )2.常用结论1.若x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x +a . 2.数据x 1,x 2,…,x n 与数据x 1′=x 1+a ,x 2′=x 2+a ,…,x n ′=x n +a 的方差相等,即数据经过平移后方差不变.3.若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2. 思考辨析判断下列结论是否正确(请在括号中打“√”或“×”) (1)对一组数据来说,平均数和中位数总是非常接近.( ) (2)方差与标准差具有相同的单位.( )(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.( ) (4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( ) 教材改编题1.若数据x 1,x 2,…,x 9的方差为2,则数据2x 1,2x 2,…,2x 9的方差为( ) A .2 B .4 C .6 D .82.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的80%分位数为( )A .88.5B .89C .91D .89.53.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.题型一 样本的数字特征和百分位数的估计例1 (1)从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、25%分位数分别为( ) A .92,85 B .92,88 C .95,88D .96,85延伸探究 本例中,70%分位数是多少?________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________(2)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是() A.极差B.中位数C.众数D.平均数听课记录:______________________________________________________________________________________________________________________________________思维升华计算一组n个数据第p百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的75%分位数为()A.102 B.103 C.109.5 D.116(2)(多选)冬季奥林匹克运动会,是世界规模最大的冬季综合性运动会.自1924年起,每四年举办一届.2022年2月在北京举办了第24届冬季奥林匹克运动会,为了宣传奥运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则()A.甲社团宣传次数的众数小于乙社团宣传次数的众数B.甲社团宣传次数的极差大于乙社团宣传次数的极差C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数D.甲社团宣传次数的方差大于乙社团宣传次数的方差题型二总体集中趋势的估计例2为了讴歌中华民族实现伟大复兴的奋斗历程,增进学生对中国共产党的热爱,某学校举办了一场党史竞赛活动,共有500名学生参加了此次竞赛活动.为了解本次竞赛活动的成绩,从中抽取了50名学生的成绩(成绩均为整数,满分为100分)进行统计,所有学生的成绩都不低于60分,将这50名学生的成绩(单位:分)进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100],得到如图所示的频率分布直方图.(1)求图中m的值,并估计此次竞赛活动学生成绩的中位数;(2)根据频率分布直方图,估计此次竞赛活动成绩的平均数.若对成绩不低于平均数的同学进行奖励,请估计在参赛的500名学生中有多少名学生获奖.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2022·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a的值及众数、中位数;(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用分层抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?________________________________________________________________________________________________________________________________________________________________________________________________________________________题型三总体离散程度的估计例3(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.________________________________________________________________________________________________________________________________________________________________________________________________________________________。

2024届高考一轮复习数学教案(新人教B版):统计

2024届高考一轮复习数学教案(新人教B版):统计

必刷大题18统计1.某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩(满分100分),得到了样本的频率分布直方图(如图).一般学校认为成绩大于等于80分的学生为优秀.(1)根据频率分布直方图,估计3000名学生在该次数学考试中成绩优秀的学生数;(2)依据样本的频率分布直方图,估计总体成绩的众数和平均数.解(1)由样本的频率分布直方图可知,在该次数学考试中成绩优秀的频率是(0.020+0.008)×10=0.28,则3000名学生在该次数学考试中成绩优秀的学生数为3000×0.28=840.(2)由样本的频率分布直方图可知,总体成绩的众数为70+80=75,2平均数为0.002×10×35+0.006×10×45+0.012×10×55+0.024×10×65+0.028×10×75+0.020×10×85+0.008×10×95=71.2.所以总体成绩的众数为75,平均数为71.2.2.为进一步增强疫情防控期间群众的防控意识,使广大群众充分了解疫情防护知识,提高预防能力,做到科学防护.某组织通过网络进行疫情防控科普知识问答.共有100人参加了这次问答,将他们的成绩(满分100分)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]这六组,制成如图所示的频率分布直方图.(1)求图中a的值,并估计这100人问答成绩的中位数和平均数;(同一组数据用该组数据的中点值代替)(2)用分层抽样方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,再从样本中任意抽取2人,求这2人的问答成绩均在[70,80)内的概率.解(1)由图可知,10×(2×0.005+a +0.02+0.025+0.03)=1,解得a =0.015.设中位数为x ,则0.05+0.15+0.2+0.03×(x -70)=0.5,所以x =2203.这100人问答成绩的平均数为45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.(2)用分层抽样方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,则问答成绩在[60,70)内的有22+3×5=2(人),分别记为A ,B ;问答成绩在[70,80)内的有32+3×5=3(人),分别记为a ,b ,c .从中任意抽取2人,则试验的样本空间Ω={(A ,B ),(A ,a ),(A ,b ),(A ,c ),(B ,a ),(B ,b ),(B ,c ),(a ,b ),(a ,c ),(b ,c )},共有10个样本点.设事件A 为2人的问答成绩均在[70,80)内,则A ={(a ,b ),(a ,c ),(b ,c )},共有3个样本点,所以这2人的问答成绩均在[70,80)内的概率P (A )=310.3.为弘扬劳动精神,树立学生“劳动最美,劳动最光荣”的观念,某校持续开展“家庭劳动大比拼”活动.某班统计了本班同学1~7月份的人均月劳动时间(单位:小时),并建立了人均月劳动时间y 关于月份x 的回归直线方程y ^=b ^x +4,y 与x 的原始数据如表所示:月份x 1234567人均月劳动时间y89m12n1922由于某些原因导致部分数据丢失,但已知错误!i y i =452.(1)求m ,n 的值;(2)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).参考公式:在回归直线方程y ^=b ^x +a ^中,b ^=错误!,a ^=y -b ^x .解(1)由表知,x =17×(1+2+3+4+5+6+7)=4,y =17×(8+9+m +12+n +19+22)=70+m +n7,所以错误!2i -7x 2=12+22+32+42+52+62+72-7×42=28,所以b ^=错误!=452-7×4×70+m +n 728,即m +n =43-7b ^,①因为回归直线恒过点(x ,y ),所以70+m +n7=4b ^+4,即m +n =28b ^-42,②由①②,得b ^=177,m +n =26,③因为错误!i y i =8+18+3m +48+5n +114+154=452,所以3m +5n =110,④由③④,得m =10,n =16.(2)由(1)知,回归直线方程为y ^=177x +4,所以当x =6时,预测值y ^=177×6+4=1307,此时残差为19-1307=37.4.为推动更多人去阅读和写作,联合国教科文组织确定每年的4月23日为“世界读书日”,其设立目的是希望居住在世界各地的人,无论你是年老还是年轻,无论你是贫穷还是富裕,都能享受阅读的乐趣,都能尊重和感谢为人类文明做出过巨大贡献的思想大师们,都能保护知识产权.为了解不同年龄段居民的主要阅读方式,某校兴趣小组在全市随机调查了200名居民,这200人中通过电子阅读与纸质阅读的人数之比为3∶1.将这200人按年龄(单位:岁)分组,统计得到通过电子阅读的居民的频率分布直方图如图所示.(1)求a 的值及通过电子阅读的居民的平均年龄;(2)把年龄在[15,45)内的居民称为中青年,年龄在[45,65]内的居民称为中老年,若选出的200人中通过纸质阅读的中老年有30人,请完成下面2×2列联表,并判断是否有97.5%的把握认为阅读方式与年龄有关.电子阅读纸质阅读总计中青年中老年总计附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .α=P (χ2≥k )0.150.10.050.0250.01k2.0722.7063.8415.0246.635解(1)由频率分布直方图可得10×(0.01+0.015+a +0.03+0.01)=1,解得a =0.035,所以通过电子阅读的居民的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).(2)这200人中通过电子阅读的人数为200×33+1=150,通过纸质阅读的人数为200-150=50.因为(0.01+0.015+0.035)∶(0.03+0.01)=3∶2,所以通过电子阅读的中青年的人数为150×33+2=90,中老年的人数为150-90=60.2×2列联表为电子阅读纸质阅读总计中青年9020110中老年603090总计15050200由表中数据,得χ2=200×(90×30-20×60)2110×90×150×50≈6.061,所以有97.5%的把握认为阅读方式与年龄有关.5.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加.图1所示的条形图反映了某省某年1~7月份煤改气、煤改电的用户数量.图1图2(1)在图2给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归直线方程(系数精确到0.01),预测该年11月份该省煤改气、煤改电的用户数量.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线方程v ^=β^u +α^的斜率和截距的最小二乘估计公式分别为β^=错误!=错误!,α^=v -β^u .参考数据:错误!i =9.24,错误!i y i =39.75,错误!≈0.53,7≈2.646.相关系数r =错误!.解(1)作出散点图如图所示.由条形图数据和参考数据得,t =4,错误!(t i -t )2=28,错误!≈0.53,错误!(t i -t )(y i -y )=错误!i y i -t 错误!i =39.75-4×9.24=2.79,所以r ≈2.790.53×2×2.646≈0.99.y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.247=1.32,又由(1)得b ^=错误!=2.7928≈0.10,a ^=y -b ^t ≈1.32-0.10×4=0.92,所以y 关于t 的回归直线方程为y ^=0.92+0.10t .将t =11代入回归直线方程得y ^=0.92+0.10×11=2.02.所以预测该年11月份该省煤改气、煤改电的用户数量达到2.02万户.6.在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某地区2015年年底到2022年年底新能源汽车保有量的数据统计表如下:年份(年)20152016201720182019202020212022年份代码x 12345678保有量y /千辆1.952.924.386.589.8715.0022.5033.70(1)根据统计表中的数据画出散点图(如图),请判断y =bx +a 与y =e cx+d哪一个更适合作为y关于x 的回归模型(给出判断即可,不必说明理由),并根据你的判断结果建立y 关于x 的回归方程;(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2022年年底该地区传统能源汽车保有量为500千辆,预计到2027年年底传统能源汽车保有量将下降10%.试估计到哪一年年底新能源汽车保有量将超过传统能源汽车保有量.参考公式:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线方程v ^=β^u +α^的斜率和截距的最小二乘估计公式分别为β^=错误!=错误!,α^=v -β^u .参考数据:y =12.1,t =2.1,错误!2i =204,错误!i y i =613.7,错误!i t i =92.4,其中t i =ln y i ,lg 2≈0.30,lg 3≈0.48,lg e ≈0.43.解(1)根据散点图显示的该地区新能源汽车保有量的增长趋势知,应选择的函数模型是y =e cx +d ,因为t =ln y ,则t ^=c ^x +d ^,因为x =18×(1+2+3+4+5+6+7+8)=4.5,错误!2i =204,错误!i t i =92.4,t =2.1,所以c ^=错误!=92.4-8×4.5×2.1204-8×4.52=16.842=0.4,d ^=t -c ^x =2.1-0.4×4.5=0.3,所以t ^=0.4x +0.3,即y ^=e 0.4x+0.3.(2)设传统能源汽车保有量每年下降的百分比为r ,依题意得,500(1-r )5=500(1-10%),解得1-r =150.9,设从2022年底起经过x 年后的传统能源汽车保有量为y 千辆,则有y =500(1-r )x =500(150.9)x,设从2022年底起经过x 年后新能源汽车的保有量将超过传统能源汽车保有量,则有e0.4(x +8)+0.3>500(150.9)x ,所以(0.4x +3.5)lg e>3-lg 2+0.2x (2lg 3-1),解得x >3-lg 2-3.5lg e0.2+0.4lg e -0.4lg 3≈6.64,故从2022年年底起经过7年后,即2029年年底新能源汽车的保有量将超过传统能源汽车保有量.。

全国通用近年高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版(2021年

全国通用近年高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版(2021年

(全国通用版)2019版高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((全国通用版)2019版高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(全国通用版)2019版高考数学大一轮复习第十章统计与统计案例第2节用样本估计总体学案理新人教B版的全部内容。

第2节用样本估计总体最新考纲1。

了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3。

能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4。

会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识梳理1.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=错误!;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本落在该组内的频率。

2。

茎叶图统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数。

3。

样本的数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数在频率分布直方图中,中位数左边和右边的直方图的面积相等。

2020届高考数学一轮复习人教B版计数原理、概率、随机变量及其分布列学案Word版

2020届高考数学一轮复习人教B版计数原理、概率、随机变量及其分布列学案Word版

计数原理、概率、随机变量及其分布列[全国卷3年考情分析](1)概率、随机变量及其分布是高考命题的热点之一,命题形式为“一小一大”,即一道选择题(或填空题)和一道解答题.(2)选择题或填空题常出现在第4~10题或第13~15题的位置,主要考查随机事件的概率、古典概型、几何概型,难度一般.考点一 二项式定理 保分考点·练后讲评[大稳定——常规角度考双基]1.[求特定项的系数](2018·全国卷Ⅲ)⎝⎛⎭⎪⎫x 2+2x 5的展开式中x 4的系数为( )A .10B .20C .40D .80解析:选C ⎝⎛⎭⎪⎫x 2+2x 5的展开式的通项公式为T r +1=C r 5·(x 2)5-r·⎝ ⎛⎭⎪⎫2xr =C r 5·2r ·x10-3r , 令10-3r =4,得r =2.故展开式中x 4的系数为C 25·22=40.2.[求特定项系数](2017·全国卷Ⅰ)⎝⎛⎭⎪⎫1+1x 2(1+x )6展开式中x 2的系数为( )A .15B .20C .30D .35解析:选C (1+x )6展开式的通项T r +1=C r 6x r ,所以⎝⎛⎭⎪⎫1+1x2(1+x )6的展开式中x 2的系数为1×C 26+1×C 46=30.3.[有关系数和问题]在⎝⎛⎭⎪⎫x +3x n的展开式中,各项系数和与二项式系数和之比为32∶1,则x 2的系数为( )A .50B .70C .90D .120解析:选C 令x =1,则⎝⎛⎭⎪⎫x +3x n =4n ,所以⎝ ⎛⎭⎪⎫x +3x n 的展开式中,各项系数和为4n,又二项式系数和为2n,所以4n2n =2n =32,解得n =5.二项展开式的通项T r +1=C r 5x 5-r ⎝ ⎛⎭⎪⎫3x r =C r 53r x 5-32r ,令5-32r =2,得r =2,所以x 2的系数为C 2532=90,故选C.4.[求参数值]若二项式⎝ ⎛⎭⎪⎫2x +a x 7的展开式中1x3的系数是84,则实数a 等于( )A .2 B.34 C .1D.24解析:选C 二项式⎝⎛⎭⎪⎫2x +a x 7的展开式的通项T r +1=C r 727-r x 7-r a r x -r=27-r C r 7a r x7-2r, 令7-2r =-3,得r =5,所以T 6=4C 57a 5=84,解得a =1.5.[二项式系数或各项系数的最值]在⎝⎛⎭⎪⎪⎫x 2-13x n的展开式中,只有第5项的二项式系数最大,则展开式的常数项是( )A .-7B .7C .-28D .28解析:选B 因为只有第5项的二项式系数C 4n 最大,所以n2=4,即n =8.⎝ ⎛⎭⎪⎪⎫x 2-13x 8的展开式的通项公式为T r +1=C r 8⎝ ⎛⎭⎪⎫x 28-r ⎝ ⎛⎭⎪⎪⎫-13x r =-r C r 828-rx 8-43r , 令8-43r =0,解得r =6,故常数项为T 7=-6C6822=7.故选B.6.[求多项式的特定项系数](x 2+x +y )4的展开式中,x 3y 2的系数是________. 解析:法一:(x 2+x +y )4=[(x 2+x )+y ]4, 其展开式的第r +1项T r +1=C r 4(x 2+x )4-r y r,因为要求x 3y 2的系数,所以r =2,所以T 3=C 24(x 2+x )4-2y 2=6(x 2+x )2y 2.因为(x 2+x )2的展开式中x 3的系数为2,所以x 3y 2的系数是6×2=12. 法二:(x 2+x +y )4表示4个因式x 2+x +y 的乘积,在这4个因式中,有2个因式选y ,其余的2个因式中有一个选x ,剩下的一个选x 2,即可得到含x 3y 2的项,故x 3y 2的系数是C 24·C 12·C 11=12. 答案:12 [解题方略]1.求二项式与代数式积的展开式特定项系数问题的关键一是将二项式看作一个整体,利用分配律整理所给式子;二是利用二项展开式的通项公式,求特定项,特定项的系数即为所要求的系数.2.求(x +y +z )n的展开式的特定项的系数问题的技巧若三项能用完全平方公式,那当然比较简单,若三项不能用完全平方公式,只需根据题目特点,把“三项”当成“两项”看,再利用二项展开式的通项公式去求特定项的系数;把(x +y +z )n看作n 个因式x +y +z 的乘积,再利用组合数公式求解.3.二项式系数最大项的确定方法若n 是偶数,则中间一项⎝ ⎛⎭⎪⎫第n2+1项的二项式系数最大;若n 是奇数,则中间两项第n +12项与第n +12+1项的二项式系数,最大.[小创新——变换角度考迁移]1.[二项式定理与函数的交汇]在(1+x )6(2+y )4的展开式中,记x m y n项的系数为f (m ,n ),则f (4,0)+f (3,1)+f (2,2)+f (1,3)+f (0,4)=( )A .1 240B .1 289C .600D .880解析:选B (1+x )6的展开式中,x m的系数为C m6,(2+y )4的展开式中,y n 的系数为C n 424-n,则f (m ,n )=C m 6·C n 4·24-n,从而f (4,0)+f (3,1)+f (2,2)+f (1,3)+f (0,4)=C 46·C 04·24+C 36·C 14·23+C 26·C 24·22+C 16·C 34·21+C 06·C 44·20=1 289.2.[二项式定理与三角函数的交汇]已知(1+ax +by )5(a ,b 为常数,a ∈N *,b ∈N *)的展开式中不含字母x 的项的系数和为243,则函数f (x )=2sin 2x +b 2sin ⎝⎛⎭⎪⎫x +π4,x ∈⎣⎢⎡⎦⎥⎤0,π2的最小值为______.解析:令x =0,y =1,得(1+b )5=243,解得b =2.因为x ∈⎣⎢⎡⎦⎥⎤0,π2,所以x +π4∈⎣⎢⎡⎦⎥⎤π4,3π4,则sin x +cos x =2sin ⎝ ⎛⎭⎪⎫x +π4∈[1,2],所以f (x )=2sin 2x +b 2sin ⎝⎛⎭⎪⎫x +π4=2sin 2x +2sin x +cos x =4sin x ·cos x +2sin x +cos x =2(sin x +cos x )=22sin ⎝⎛⎭⎪⎫x +π4,所以2≤f (x )≤2 2.故f (x )的最小值为2.答案:2考点二 古典概型、几何概型及条件概率 保分考点练后讲评1.[古典概型](2018·全国卷Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是( )A.112 B.114C.115D.118解析:选C 不超过30的所有素数为2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有C 210=45种情况,而和为30的有7+23,11+19,13+17这3种情况,∴所求概率为345=115.故选C.2.[几何概型](2018·全国卷Ⅰ)如图,来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则( )A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3解析:选A 法一:∵S △ABC =12AB ·AC ,以AB 为直径的半圆的面积为12π·⎝ ⎛⎭⎪⎫AB 22=π8AB 2,以AC 为直径的半圆的面积为12π·⎝ ⎛⎭⎪⎫AC 22=π8AC 2,以BC 为直径的半圆的面积为12π·⎝ ⎛⎭⎪⎫BC 22=π8BC 2, ∴S Ⅰ=12AB ·AC ,S Ⅲ=π8BC 2-12AB ·AC ,S Ⅱ=⎝ ⎛⎭⎪⎫π8AB 2+π8AC 2-⎝⎛⎭⎪⎫π8BC 2-12AB ·AC =12AB ·AC . ∴S Ⅰ=S Ⅱ.由几何概型概率公式得p 1=S ⅠS 总,p 2=S ⅡS 总, ∴p 1=p 2.故选A.法二:不妨设△ABC 为等腰直角三角形,AB =AC =2,则BC =22,所以区域Ⅰ的面积即△ABC 的面积, 为S 1=12×2×2=2,区域Ⅱ的面积S 2=π×12-⎣⎢⎡⎦⎥⎤π222-2=2,区域Ⅲ的面积S 3=π222-2=π-2.根据几何概型的概率计算公式, 得p 1=p 2=2π+2,p 3=π-2π+2, 所以p 1≠p 3,p 2≠p 3,p 1≠p 2+p 3,故选A.3.[条件概率]一个口袋中装有6个小球,其中红球4个,白球2个.如果不放回地依次摸出2个小球,则在第1次摸出红球的条件下,第2次摸出红球的概率为________.解析:设“第1次摸出红球”为事件A ,“第2次摸出红球”为事件B ,则“第1次和第2次都摸出红球”为事件AB ,所求事件为B |A .事件A 发生的概率为P (A )=46=23,事件AB 发生的概率为P (AB )=46×35=25.由条件概率的计算公式可得,所求事件的概率为P (B |A )=P ABP A =2523=35.答案:35[解题方略]1.求解几何概型的步骤2.条件概率的求法(1)利用定义,分别求P (A )和P (AB ),得P (B |A )=P ABP A.这是通用的求条件概率的方法.(2)借助古典概型概率公式,先求事件A 包含的基本事件数n (A ),再在事件A 发生的条件下求事件B 包含的基本事件数,即n (AB ),得P (B |A )=n ABn A.考点三 随机变量的分布列、均值与方差 增分考点广度拓展题型一 超几何分布及其均值与方差[例1] 某大学志愿者协会有6名男同学,4名女同学.在这10名同学中,3名同学来自数学学院,其余7名同学来自物理、化学等其他互不相同的七个学院.现从这10名同学中随机选取3名同学到希望小学进行支教活动(每位同学被选到的可能性相同).(1)求选出的3名同学是来自互不相同学院的概率;(2)设X 为选出的3名同学中女同学的人数,求随机变量X 的分布列和数学期望E (X ). [解] (1)设“选出的3名同学是来自互不相同的学院”为事件A ,则P (A )=C 13C 27+C 03C 37C 310=4960. 所以选出的3名同学是来自互不相同学院的概率为4960.(2)随机变量X 的所有可能值为0,1,2,3.P (X =k )=C k 4C 3-k6C 310(k =0,1,2,3).所以P (X =0)=C 04C 36C 310=16,P (X =1)=C 14C 26C 310=12,P (X =2)=C 24C 16C 310=310,P (X =3)=C 34C 06C 310=130.所以随机变量X 的分布列为:故随机变量X 的数学期望E (X )=0×16+1×12+2×310+3×130=65.[解题方略]1.超几何分布的应用条件及实质(1)条件:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数X 的概率分布.(2)实质:古典概型问题. 2.超几何分布的均值与方差对于实际问题中的随机变量X ,如果能够断定它服从超几何分布H (N ,M ,n ),则其概率可直接利用公式P (X =k )=C k M C n -kN -MC n N(k =0,1,…,m ,其中m =min{M ,n },且n ≤N ,M ≤N ,n ,M ,N ∈N *).题型二 相互独立事件的概率及均值与方差[例2] (2019届高三·益阳、湘潭调研)某乒乓球俱乐部派甲、乙、丙三名运动员参加某运动会的单打资格选拔赛,本次选拔赛只有出线和未出线两种情况.规定一名运动员出线记1分,未出线记0分.假设甲、乙、丙出线的概率分别为23,34,35,他们出线与未出线是相互独立的.(1)求在这次选拔赛中,这三名运动员至少有一名出线的概率;(2)记在这次选拔赛中,甲、乙、丙三名运动员的得分之和为随机变量ξ,求随机变量ξ的分布列和数学期望E (ξ).[解] (1)记“甲出线”为事件A ,“乙出线”为事件B ,“丙出线”为事件C ,“甲、乙、丙至少有一名出线”为事件D ,则P (D )=1-P (A B C )=1-13×14×25=2930.(2)由题意可得,ξ的所有可能取值为0,1,2,3, 则P (ξ=0)=P (A B C )=13×14×25=130;P (ξ=1)=P (A B C )+P (A B C )+P (A B C )=23×14×25+13×34×25+13×14×35=1360; P (ξ=2)=P (AB C )+P (A B C )+P (A BC )=23×34×25+23×14×35+13×34×35=920; P (ξ=3)=P (ABC )=23×34×35=310.所以ξ的分布列为E (ξ)=0×130+1×1360+2×920+3×310=12160.[解题方略] 求相互独立事件的概率的两种方法题型三 二项分布及其均值与方差[例3] 雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格指标考核.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A ,B ,C 三个城市进行治霾落实情况抽查.(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X ,求X 的分布列.[解] (1)随机选取,共有34=81种不同方法,恰有一个城市没有专家组选取的有C 13(C 14A 22+C 24)=42种不同方法,故恰有一个城市没有专家组选取的概率P =4281=1427.(2)设事件A :“一个城市需复检”,则P (A )=1-⎝ ⎛⎭⎪⎫124=1516,X 的所有可能取值为0,1,2,3,P (X =0)=C 03·⎝ ⎛⎭⎪⎫1163=14 096, P (X =1)=C 13·⎝ ⎛⎭⎪⎫1162·1516=454 096, P (X =2)=C 23·116·⎝ ⎛⎭⎪⎫15162=6754 096, P (X =3)=C 33·⎝ ⎛⎭⎪⎫15163=3 3754 096. 所以X 的分布列为[解题方略] 破解有关二项分布的“四关”考点四 利用均值与方差破解决策性问题 增分考点讲练冲关[典例] (2018·洛阳第一次统考)甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:甲公司送餐员送餐单数频数表乙公司送餐员送餐单数频数表(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率.(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X (单位:元),求X 的分布列和数学期望E (X );②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.[解] (1)记抽取的3天送餐单数都不小于40为事件M , 则P (M )=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a =38时,X =38×6=228, 当a =39时,X =39×6=234, 当a =40时,X =40×6=240, 当a =41时,X =40×6+1×7=247, 当a =42时,X =40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E (X )=228×10+234×5+240×5+247×5+254×10=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7, 所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. [解题方略] 利用均值与方差进行决策的思路方法利用随机变量的均值与方差可以帮助我们作出科学的决策,其中随机变量X 的均值的意义在于描述随机变量的平均程度,而方差则描述了随机变量稳定与波动或集中与分散的状况.品种的优劣、仪器的好坏、预报的准确与否、机器的性能好坏等很多指标都与这两个特征量有关.[多练强化]为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求: ①顾客所获的奖励额为60元的概率; ②顾客所获的奖励额的分布列及均值;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解:(1)设顾客所获的奖励额为X . ①依题意,得P (X =60)=C 11C 13C 24=12,即顾客所获的奖励额为60元的概率为12.②依题意,得X 的所有可能取值为20,60. P (X =60)=12,P (X =20)=C 23C 24=12,即X 的分布列为所以顾客所获的奖励额的均值E (X )=20×2+60×2=40元.(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找均值为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以均值不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以均值也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X 1,则X 1的分布列为X 1的均值E (X 1)=20×16+60×3+100×6=60,X 1的方差D (X 1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X 2,则X 2的分布列为X 2的均值E (X 2)=40×16+60×3+80×6=60,X 2的方差D (X 2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003. 由于两种方案的奖励额的均值都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.考点五 正态分布及其应用 增分考点·讲练冲关[典例] (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性; ②下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得x =116∑i =116x i =9.97,s =116∑i =116x i -x 2=116⎝ ⎛⎭⎪⎪⎫∑i =116x 2i -16x2≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x 作为μ的估计值μ^,用样本标准差s 作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.997 4.0.997 416≈0.959 2,0.008≈0.09.[解] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X ~B (16,0.002 6).因此P (X ≥1)=1-P (X =0)=1-0.997 416≈0.040 8.X 的数学期望为EX =16×0.002 6=0.041 6.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.②由x =9.97,s ≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115(16×9.97-9.22)=10.02,因此μ的估计值为10.02.i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115(1 591.134-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09.[解题方略] 利用正态曲线的对称性求概率的策略(1)解题的关键是利用对称轴x =μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时,可借助图形判断.(2)对于正态分布N (μ,σ2),由x =μ是正态曲线的对称轴知: ①对任意的a ,有P (X <μ-a )=P (X >μ+a ); ②P (X <x 0)=1-P (X ≥x 0);③P (a <X <b )=P (X <b )-P (X ≤a ).(3)对于特殊区间求概率一定要掌握服从N (μ,σ2)的随机变量X 在三个特殊区间的取值概率,将所求问题向P (μ-σ<X ≤μ+σ),P (μ-2σ<X ≤μ+2σ),P (μ-3σ<X ≤μ+3σ)转化,然后利用特定值求出相应概率.同时,要充分利用正态曲线的对称性和曲线与x 轴之间的面积为1这些特殊性质.[多练强化](2018·聊城期末)已知某厂生产的电子产品的使用寿命X (单位:小时)服从正态分布N (1 000,σ2),且P (X <800)=0.1,P (X ≥1 300)=0.02.(1)现从该厂随机抽取一件产品,求其使用寿命在[1 200,1 300)的概率;(2)现从该厂随机抽取三件产品,记抽到的三件产品使用寿命在[800,1 200)的件数为Y ,求Y 的分布列和数学期望E (Y ).解:(1)因为X ~N (1 000, σ2),P (X <800)=0.1,P (X ≥1 300)=0.02,所以P (1 200≤X <1 300)+P (X ≥1 300)=P (X ≥1 200)=P (X <800)=0.1.所以P (1 200≤X <1 300)=0.1-0.02=0.08, 即其使用寿命在[1 200,1 300)的概率为0.08.(2)因为P (800≤X <1 200)=1-2P (X <800)=1-2×0.1=0.8=45,所以Y ~B ⎝ ⎛⎭⎪⎫3,45. 所以P (Y =0)=⎝ ⎛⎭⎪⎫1-453=1125,P (Y =1)=C 13⎝ ⎛⎭⎪⎫45⎝⎛⎭⎪⎫1-452=12125, P (Y =2)=C 23⎝ ⎛⎭⎪⎫452⎝⎛⎭⎪⎫1-45=48125, P (Y =3)=⎝ ⎛⎭⎪⎫453=64125, 所以Y 的分布列为所以E (Y )=0×1125+1×12125+2×48125+3×64125=125.⎝⎛⎭⎪⎫或E Y =np =3×45=125数据分析——随机变量及其分布列与期望问题的求解[典例] 某网络广告公司计划从甲、乙两个网站中选择一个网站拓展公司的广告业务,为此该公司随机抽取了甲、乙两个网站某月中10天的日访问量(单位:万次),整理后得到如图所示的茎叶图.(1)请说明该公司应该选择哪个网站;(2)根据双方规定,该公司将根据所选网站的日访问量进行付费,付费标准如下:考虑到资金有限,若要使该公司每个月(按30天计)付的费用最少,则该公司应该选择哪个网站?[解] (1)根据题中的茎叶图得,x甲=110×(15+24+28+25+30+36+30+35+32+45)=30,s2甲=110[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(35-30)2+(32-30)2+(45-30)2]=58.x乙=110×(18+25+22+24+32+38+30+36+35+40)=30,s2乙=110[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35-30)2+(40-30)2]=49.8.因为x甲=x乙,s2甲>s2乙,所以该公司应选择乙网站.(2)设选择甲网站每日需付的费用为随机变量X,选择乙网站每日需付的费用为随机变量Y,则随机变量X的分布列为其数学期望E(X),故该公司若选择甲网站,则每个月需付的费用为720×30=21 600(元).随机变量Y的分布列为其数学期望E(Y),故该公司若选择乙网站,则每个月需付的费用为730×30=21 900(元).因此应选择甲网站.[素养通路]数据分析是指针对研究对象获取数据,运用统计方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.本题先分析茎叶图中的数据,分别求出甲、乙的平均数、方差,然后做出最佳选择,再通过分布列、数学期望的计算后的“数据分析”,对实际问题做出合理的判断.考查了数据分析这一核心素养.。

【人教课标B版】201x高考一轮复习【理科数学】精品 第9单元-统计与统计案例

【人教课标B版】201x高考一轮复习【理科数学】精品 第9单元-统计与统计案例

第九单元 │ 使用建议
2.教学指导 在复习过程中,要注意以下三个方面: (1)强化概念的教学,本单元概念较多,引导学生结合 具体题目,仔细体会概念的含义,通过适当练习,学会如何 使用概念解题. (2)统计图表是统计中的主要工具,教学中要使学生学 会从图表中提取有关的数据信息、进行统计推断的方法. (3)加强运算能力的培养,统计的数字计算较繁,要求 学生培养良好的运算习惯,通过统计的复习提高运算能力.
第九单元 │ 命题趋势
预计2012年仍然会顺应近三年高考命题的基本趋势,在 高考试卷中这部分会命制1~2个小题,考查统计的基础知识 和基本方法,在综合解答题中和概率统计的其他知识一起进 行综合考查.
第九单元 │ 使用建议
使用建议
1.编写意图 本单元内容将教材中必修3第二章《统计》和选修1-2 第三章《统计案例》整合在一起.本单元内容与生产生活实 际相结合,数据多,公式多,要求考生有较强的数据处理能 力,公式一般不需要记忆,考试时会给出公式.根据考试说 明和高考对本单元考查的实际情况,本单元在编写时注意到 以下几点:一是注意了基础知识的全面性和系统性;二是注 意了统计方法的讲解,编写中把各种统计方法的使用放在首 位;三是注意了高考的发展趋势,加强了对统计案例的复习 力度.
2.一个总体含有N个个体,从中逐个不放回地抽取n个 个体作为样本(n≤N),如果每次抽取时总体内的各个个体被 抽到的机会都相等,就把这种抽样方法叫做__简__单__随__机____抽 样.两种常见的实施简单随机抽样的办法是:抽签法和随机 数法.
第52讲 │ 知识梳理
3.当总体中的个体数较多时,将总体分成均衡的几个部分, 然后按照预先定出的规则,从每一部分抽取一个个体,得到所
第九单元 │ 命题趋势

高三数学理一轮配套教案:《统计、统计案列》人教B版_1

高三数学理一轮配套教案:《统计、统计案列》人教B版_1

§11.2用样本估计总体1.作频率分布直方图的步骤:(1)计算极差(即一组数据中最大值与最小值的差).(2)决定组数与组距.(3)决定分点.(4)列频率分布表.(5)绘制频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:把频率分布直方图中各个长方形上边的中点用线段连接起来,就得到频率分布折线图.(2)设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y =f (x )来描绘,这条光滑曲线就叫做总体密度曲线. 3. 茎叶图的优点用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以在比赛时随时记录,方便记录与表示. 4. 样本的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差设样本的元素为x 1,x 2,…,x n ,样本的平均数为x , ①样本方差:s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n ,②样本标准差: s =(x 1-x )2+(x 2-x )2+…+(x n -x )2n.1. 判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( √ )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. ( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )2. 某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.答案 3.2解析 x =10+6+8+5+65=7,∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165=3.2.3. 一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.7解析 x =20-(2+3+5+4+2)=4, P =2+3+4+520=0.7或P =1-4+220=0.7.4. (2012·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)答案 6.8解析 依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8.5. 某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.答案600解析由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.题型一频率分布直方图的绘制与应用例1某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.思维启迪利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).思维升华频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.(2013·陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45答案 D解析设区间[25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45. 题型二茎叶图的应用例2如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关思维启迪去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.答案 B解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.思维升华由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367 C .36 D.677 答案 B 解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2] =17(16+9+1+0+1+9+0)=367. 题型三 用样本的数字特征估计总体的数字特征例3甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思维启迪(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解(1)由题图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲>s2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.(1)(2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有.答案(1)D(2)甲解析(1)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.(2)x甲=x乙=9环,s2甲=15[(10-9)2+(8-9)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15[(10-9)2+(10-9)2+(7-9)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定,故填甲.高考中频率分布直方图的应用典例:(5分)为了研究大学生就业后的收入问题,一个研究机构调查了在2009年已经就业且工作满两年的10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方法抽出200人作进一步调查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,则应在低收入者和高收入者中分别抽取的人数是()A.1 000,2 000 B.40,80C.20,40 D.10,20思维启迪根据频率分布直方图的意义,分别计算出低收入者和高收入者的频率即可,为方便直接计算,这个频率分布直方图也可以看作是200个样本的频率分布直方图.解析低收入者的频率是0.000 2×500=0.1,故从低收入者中抽取200×0.1=20人;高收入者的频率是(0.000 3+0.000 1)×500=0.2,故从高收入者中抽取200×0.2=40人.故选C.答案 C温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.方法与技巧1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x+b,方差为a2s2.失误与防范频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练(时间:40分钟)一、选择题1.(2013·重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2 B.0.4C.0.5 D.0.6答案 B解析10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为410=0.4.故选B.2.(2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45 B.50 C.55 D.60答案 B解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=150.3=50.3.(2012·陕西)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53答案 A解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则()A .m e =m o =x .m e =m o <x C .m e <m o <x .m o <m e <x答案 D解析 30个数中第15个数是5,第16个数是6,所以中位数m e =5+62=5.5,众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930.5. 若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x ,方差为s 2,则( )A.x =5,s 2<2B.x =5,s 2>2C.x >5,s 2<2D.x >5,s 2>2答案 A解析 考查样本数据的平均数及方差. ∵18(x 1+x 2+…+x 8)=5, ∴19(x 1+x 2+…+x 8+5)=5, ∴x =5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强, ∴s 2<2,故选A. 二、填空题6. (2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4. 则:(1)平均命中环数为________;(2)命中环数的标准差为________.答案(1)7(2)2解析(1)x=110(7+8+7+9+5+4+9+10+7+4)=7010=7.(2)s2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴命中环数的标准差为2.7.(2012·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案9解析结合直方图和样本数据的特点求解.最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.8.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.答案60解析∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数和为2+3+420·n =27,故n =60.三、解答题9. (2012·安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数. 解 (1)如下表所示频率分布表.(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件,依题意505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数大约是1 980件.10.(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.B 组 专项能力提升 (时间:30分钟)1. (2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()答案 A解析由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.2.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83答案 A解析由题意,知4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则有6×0.27+15d=1-0.01-0.03-0.09,解得d=-0.05,从而求得b=78.3.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是()A.70,75 B.70,50C.75,1.04 D.62,2.35答案 B解析因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得:s2=12+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],48[(x1-70)而更正前有75=12+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],48[(x1-70)化简整理得s2=50.4.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.答案160解析 ∵小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1, ∴样本的频率构成一个等比数列,且公比为2, ∴a 1+2a 1+4a 1+8a 1=15a 1=300,∴a 1=20, ∴小长方形面积最大的一组的频数为8a 1=160.5. 从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案 0.030 3解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =1-0.70010=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=310,∴在[140,150]中选取的学生应为3人.6. 某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.(1)(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求:第4组至少有一名学生被考官A面试的概率.解(1)由题意可知,第2组的频数为0.35×100=35,=0.300,第3组的频率为30100频率分布直方图如图所示:(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为第3组:3060×6=3人,第4组:2060×6=2人,第5组:1060×6=1人.所以第3、4、5组分别抽取3人、2人、1人. (3)设第3组的3位同学为A 1,A 2,A 3, 第4组的2位同学为B 1,B 2, 第5组的1位同学为C 1,则从六位同学中抽两位同学有15种可能如下:(A 1,A 2),(A 1,A 3),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,A 3),(A 2,B 1),(A 2,B 2),(A 2,C 1),(A 3,B 1),(A 3,B 2),(A 3,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1).其中第4组的2位同学至少有一位同学入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1)9种可能, 所以第4组的2位同学至少有一位同学入选的概率为915=35.。

版高考数学一轮复习 10.3统计案例精品学案 新人教版

版高考数学一轮复习 10.3统计案例精品学案 新人教版

2013版高考数学一轮复习精品学案:第十章 统计、统计案例10.3统计案例 【高考新动向】 一、考纲点击1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;2.了解回归分析的基本思想、方法及其简单应用. 二、热点提示1.本部分主要内容是变量的相关性及其几种常见的统计方法.在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来了解一些基本的统计思想;2.本部分在高考中多为选择、填空题,也有可能出现解答题,都为中低档题. 【考纲全景透析】 1.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a b 和为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y 中,回归方程的截距和斜率的最小二乘估计公式分别为:121()()ˆˆˆˆ,.()niii nii x x y y bay bx x x ==--==--∑∑其中1111,,(,)n ni i i i x x y y x y n n ====∑∑称为样本点的中心.(4)相关系数①()()niix x y y r --=∑②当0r >时,表明两个变量正相关; 当0r <时,表明两个变量负相关.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常||r 大于0.75时,认为两个变量有很强的线性相关性. 2.残差分析(1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii y y =-∑(2)残差数据点和它回归直线上相应位置的差异()i i y y -是随机误差的效应,称i i i e y y =-为残差.(3)残差平方和21()niii y y =-∑.(4)相关指数22121()()niii nii y y R y y ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的贡献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量. (3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?(2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d )取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【热点难点精析】(一)线性回归分析 ※相关链接※1.首先利用散点图判断两个变量是否线性相关.2.求回归方程y bx a =+.(1)线性回归方程中的截距a 和斜率b 都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.(2)回归方程y bx a =+中的b 表示x 增加1个单位时y 的变化量为b . (3)可以利用回归方程y bx a =+预报在x 取某一个值时y 的估计值.3.相关系数r利用相关系数r 来衡量两个变量之间的线性相关的强弱. 4.建立回归模型的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y bx a =+).(4)按一定规则估计回归方程中的参数(如最小二乘法).(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值. ※例题解析※〖例〗测得某国10对父子身高(单位:英寸)如下:(1)对变量y x 与进行相关性检验;(2)如果y x 与之间具有线性相关关系,求回归方程.(3)如果父亲的身高为73英寸,估计儿子的身高.思路解析:(1)先根据已知计算相关系数r ,判断是否具有相关关系. (2)再利用分工求出回归方程进行回归分析. 解答:(1)10101022221111066.8,67.01,4462.24,4490.4,44974,44941.93,44842.4,10iii i i i i i ix y x y x y x y x y x yr ======≈===-==∑∑∑∑0.804.≈所以y x 与之间具有很强的线性相关关系.(2)设回归方程为y bx a =+.由101102211044842.444762.6879.72ˆ0.46464479444662.4171.610i ii i i x y x ybx x==--===≈--∑∑.ˆˆ67.010.464666.835.97.a y bx =-=-⨯≈故所求的回归方程为:ˆ0.464635.97y x =+.(3)当x=73时, ˆ0.46467335.9769.9y =⨯+≈.所以当父亲身高为73英寸时,估计儿子身高约为69.9英寸.(二)非线性回归分析※相关链接※1.非线性回归模型:当回归方程不是形如y bx a =+时称之为非线性回归模型.2.非线性回归模型的拟合效果:对于给定的样本点1122(,),(,),,(,)n n x y x y x y ,两个含有未知数的模型(1)(2)(,)(,)y f x a y g x b ==和,其中a b 和都是未知参数.可按如下的步骤比较它们的拟合效果:(1)分别建立对应于两个模型的回归方程(1)(2)ˆˆˆˆ(,)(,)y f x a y g x b ==和,其中ˆˆa b 和分别是参数a b 和的估计值;(2)分别计算两个回归方程的残差平方和(1)(1)2(2)(2)211ˆˆˆˆ()()n ni i i i i i Q y y Q y y ===-=-∑∑和;(3)若(1)ˆQ <(2)ˆQ ,则(1)(2)ˆˆˆˆ(,)(,)y f x a y g x b ==的效果比;反之, (1)(2)ˆˆˆˆ(,)(,)yf x a yg x b ==的效果不如的好.※例题解析※〖例〗为了研究某种细菌随时间x 变化时,繁殖个数y 的变化,收集数据如下:(1)用天数x 作解释变量,繁殖个数y 作预报变量,作出这些数据的散点图; (2)描述解释变量x 与预报变量y 之间的关系; (3)计算残差平方和、相关指数.思路解析:作出散点图→分析与哪种曲线拟合→转化线性关系→进行回归分析. 解答:(1)所作散点图如图所示.(2)由散点图看出样本点分析在一条指数函数21c xy c e =的周围,于是令ln z y =,则由计算器得:ˆ0.69 1.112,z x =+则有 1.69 1.112ˆx y e +=.(3)则662211ˆˆ() 3.1643iiii i ey y ===-=∑∑,621ˆ()iii y y=-∑=24642.8,2 3.164310.999924642.8R =-=,即解释变量天数对预报变量细菌的繁殖个数解释了99.99%.(三)独立性检验〖例〗在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效? 思路解析:(1)先由已知作出调查数据的列联表; (2)再根据列联表画出二维条形图,并进行分析; (3)利用独立性检验作出判断.解答:根据题目所给的数据作出如下的联表:根据列联表作出相应的二维条形图,如图所示.从二维条形图来看,在男人中患色盲的比例38480,要比在女人中患色盲的比例6520要大,其差值为386||0.068,480520-≈差值较大,因而我们可以认为“性别与患色盲是有关的”,根据列联表中所给的数据可以有38,442,6,514,480,520,44,956,1000,a b c d a b c d a c b d n ====+=+=+=+==代入公式22()()()()()n ad bc K a b c d a c b d -=++++得221000(385146442)27.148052044956K ⨯⨯-⨯=≈⨯⨯⨯。

高考数学一轮复习 第十一章概率与统计11.7随机抽样教学案 新人教B版

高考数学一轮复习 第十一章概率与统计11.7随机抽样教学案 新人教B版

11.7 随机抽样考纲要求1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.1.总体、个体、样本、样本容量的概念一般把所考察对象的某一数值指标的全体构成的集合看作______,构成总体的每一个元素作为______,从总体中抽取若干个体所组成的集合叫做______,样本中个体的数目叫做__________.2.简单随机抽样(1)定义:一般地,从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有________的可能性被抽到,这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做________.(2)最常用的简单随机抽样的方法:________和________.3.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体______.(2)确定__________,对编号进行______.当N n 是整数时,取k =N n.(3)在第1段用______________确定第一个个体编号s (s ≤k ).(4)按照一定的规则抽取样本,通常是将s 加上间隔k 得到第2个个体编号______,再加k 得到第3个个体编号______,依次进行下去,直到获取整个样本.4.分层抽样(1)定义:当总体由________________组成时,常将总体中各个个体按某种特征分成若干个______的几部分,每一部分叫做____,在各层中按____________________,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.为确保食品安全,质检部门检查一箱装有1 000件包装食品的质量,抽查总量的2%.在这个问题中下列说法正确的是( ).A .总体是指这箱1 000件包装食品B .个体是一件包装食品C .样本是按2%抽取的20件包装食品D .样本容量为202.一个班级有5个小组,每一个小组有10名学生,随机编号为1~10号,为了了解他们的学习情况,要求抽取每组的2号学生留下来进行问卷调查,这里运用的方法是( ).A .分层抽样法B .抽签法C .随机数表法D .系统抽样法3.一个总体分为A ,B 两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中每个个体被抽到的概率都为112,则总体中的个体数为__________. 4.为了了解参加一次知识竞赛的1 252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是__________.一、简单随机抽样【例1】 某大学为了支援我国西部教育事业,决定从2012年应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数法设计抽样方案.方法提炼1.一个抽样试验能否用抽签法,关键是看两点:一是抽签是否方便;二是号签是否容易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.2.随机数表中共随机出现0,1,2,…,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字记起,每三个或每四个作为一个单位,按事先确定的读数方向选取,有超过总体号码或出现重复号码的数字舍去.请做演练巩固提升1二、系统抽样【例2】某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?方法提炼1.当总体中的个体数较多,并且没有明显的层次差异时,可用系统抽样的方法,把总体分成均衡的几部分,按照预先制定的规则,从每一部分抽取一个个体,得到需要的样本.2.在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.请做演练巩固提升2,3三、分层抽样【例3】为了对某课题进行研究,用分层抽样方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).高校相关人数抽取人数A18xB36 2C54y(1)求x,y;(2)若从高校B,C抽取的人中选2人作专题发言,求这2人都来自高校C的概率.方法提炼分层抽样适用于总体是由差异明显的几部分组成的情况,这样更能反映总体的情况,是等可能抽样.当各层抽取的个体数目确定后,每层中的样本抽取可用简单随机抽样或系统抽样的方法.用分层抽样法抽样的关键是确定抽样比,抽样比=样本容量总体中的个体数=每层抽取的个体数该层的个体数.用抽样比乘以该层的个体数就等于在该层中应抽取的个体数.请做演练巩固提升3要重视分层抽样的抽样比【典例】 (2012江苏高考)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取__________名学生.解析:根据分层抽样的特点,可得高二年级学生人数占学生总人数的310,因此在样本中,高二年级的学生所占比例也应该为310,故应从高二年级抽取50×310=15(名)学生.答案:15答题指导:1.看清总体是按什么样的标准抽样.2.计算各层的个数和总数的比,按各层个体数占总体数的比确定各层应抽取个体数.1.下面的抽样方法是简单随机抽样的是( ).A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验2.为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是( ).A.5,10,15,20,25 B.2,4,8,16,32C.1,2,3,4,5 D.7,17,27,37,473.(2012浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为__________.参考答案基础梳理自测知识梳理1.总体 个体 样本 样本容量2.(1)相同 简单随机样本 (2)抽签法 随机数表法3.(1)编号 (2)分段间隔k 分段 (3)简单随机抽样 (4)s +k s +2k4.(1)有明显差别的几部分 互不重叠层 层在总体中所占比例进行简单随机抽样或系统抽样基础自测1.D 解析:由从总体中抽取样本的意义知D 是正确的.2.D 解析:由系统抽样的特点可知选D.3.120 解析:分层抽样中,每个个体被抽到的概率都相等,则10x =112 x =120. 4.2 解析:由系统抽样特点知应剔除2个.考点探究突破【例1】解:抽签法:第一步,将18名志愿者编号,编号为1,2,3, (18)第二步,将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签. 第三步,将18个号签放入一个不透明的盒子里,充分搅匀.第四步,从盒子中逐个抽取6个号签,并记录上面的编号.第五步,所得号码对应的志愿者,就是志愿小组的成员.随机数法:第一步,将18名志愿者编号,编号为01,02,03, (18)第二步,在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读.第三步,从数7开始,向右读,每次取两位,凡不在01~18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步,找出以上号码对应的志愿者,就是志愿小组的成员.【例2】解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k =62062=10,将总体分成62组,每组含10人. (5)从第一段,即为000至009号随机抽取一个号l .(6)按编号将l,10+l,20+l ,…,610+l 共62个号码选出.这62个号码所对应的职工组成样本.【例3】解:(1)由题意,可得x 18=236=y 54,所以x =1,y =3. (2)记从高校B 抽取的2人为b 1,b 2,从高校C 抽取的3人为c 1,c 2,c 3,则从高校B ,C 抽取的5人中选2人作专题发言的基本事件有(b 1,b 2),(b 1,c 1),(b 1,c 2),(b 1,c 3),(b 2,c 1),(b 2,c 2),(b 2,c 3),(c 1,c 2),(c 1,c 3),(c 2,c 3)共10种.设选中的2人都来自高校C 的事件为X ,则X 包含的基本事件有(c 1,c 2),(c 1,c 3),(c 2,c 3)共3种.因此P (X )=310. 故选中的2人都来自高校C 的概率为310. 演练巩固提升1.D 解析:A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体的个体有明显的层次差异;D 是简单随机抽样.2.D 解析:利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10.3.160 解析:根据分层抽样的特点,此样本中男生人数为560560+420×280=160.。

高中数学人教版B版精品学案《统计与概率的应用》

高中数学人教版B版精品学案《统计与概率的应用》

统计与概率的应用【学习目标】1.通过实例进一步理解统计与概率的意义及应用2.能用统计与概率的知识解决实际生活中的问题【学习重难点】1.统计与概率的意义2.统计与概率的应用【学习过程】一、新知探究1.统计在决策中的应用2021年4月2021福建省人民政府公布了“3+1+2”新高考方案,方案中“2”指的是在思想政治、地理、化学、生物4门中选择2门.“2”中记入高考总分的单科成绩是由原始分转化得到的等级分,学科高考原始分在全省的排名越靠前,等级分越高.小明同学是2021级的高一学生.已确定了必选地理且不选政治,为确定另选一科,小明收集并整理了化学与生物近10大联考的成绩百分比排名数据如=19的含义是指在该次考试中,成绩高于小明的考生占参加该次考试的考生数的19%,绘制茎叶图如下.(1)分别计算化学、生物两个学科10次联考的百分比排名的平均数和中位数;(2)根据已学的统计知识,并结合上面的数据,帮助小明作出选择.并说明理由.【解】(1)化学学科10大联考的成绩百分比排名的平均数为错误!=,化学学科10大联考百分比排名的中位数为26.生物学科10大联考百分比排名的平均数为错误!=29.6,生物学科10大联考百分比排名的中位数为31.(2)从平均数来看,小明的生物学科比化学学科百分比排名靠前,应选生物.或者:从中位数来看,小明的化学学科比生物学科百分比排名靠前,应选化学.2.概率在决策中的应用某地政府准备对当地的农村产业结构进行调整,为此政府进行了一次民意调查100个人接受了调查,要求他们在赞成调整、反对调整、对这次调整不发表看法中任选一项.调查结果如下表所随机选取一个被调查者,他对这次调整表示反对或不发表看法的概率是多少?【解】用A表示事件“对这次调整表示反对”,B表示“对这次调整不发表看法”,由互斥事件的概率加法公式,得=100,由概率的统计定义可知个样本进行标记,设总体为未知量n,则标记概率为错误!(2)随机抽取n1个个体,出现其中m1个被标记,则标记频率为错误!(3)用频率近似等于概率,建立等式错误!≈错误!(4)求得n≈错误!三、精炼反馈1.若经检验,某厂的产品合格率为98%,估算该厂8 000件产品中的次品件数为A.7 840 B.160C.16 D.784解析:选B.8 000×98%=7 840件,8 000-7 840=160件.故次品件数为160件.2.据人口普查统计,育龄妇女生男生女是等可能的,如果生育二胎,则某一育龄妇女两胎均是女孩的概率是A.错误!B.错误!C.错误!D.错误!解析:选C.所含的基本事件总数为4,分别为男,男,男,女,女,男,女,女,所以两胎均是女孩的概率为错误!3.在所有的两位数10~99中,任取一个数,则这个数能被2或3整除的概率为A.错误!B.错误!C.错误!D.错误!解析:选C.10~99中有90个两位数,这些两位数中,偶数有45个,10~99中有30个能被3整除的数,其中奇数有30÷2=15个,所以所求的概率为错误!=错误!4.电脑“扫雷”游戏的操作面被平均分成480块,其中有99块埋有地雷,现在操作面上任意点击一下,则碰到地雷的概率为________.解析:由古典概型的概率公式可得碰到地雷的概率为错误!=错误!答案:错误!5.某栏目中的“百宝箱”互动环节,是一种竞猜游戏,游戏规则如下:在2021标牌中,有5个商标牌的背面注明一定的奖品,其余没有奖品,参与游戏的观众有三次翻牌机会翻过的牌不能再翻.(1)第一次翻牌获奖的概率是多少?(2)某观众前两次翻牌均获奖,那么他第三次翻牌获奖的概率是多少?解:(1)第一次翻牌时有5个有奖品,故获奖的概率为P=错误!错误!未定义书签。

高考数学一轮复习 第十一章概率与统计11.8用样本估计

高考数学一轮复习 第十一章概率与统计11.8用样本估计

11.8 用样本估计总体考纲要求1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.用样本的频率分布估计总体的分布(1)在频率分布直方图中,纵轴表示________________,数据落在各小组内的频率用____________表示,所有长方形面积之和______.(2)作频率分布直方图的步骤如下:①计算极差(即一组数据中________与________的差).②决定______与______.③决定______.④列__________.⑤绘制______________.(3)频率分布折线图和总体密度曲线:①频率分布折线图:连接频率分布直方图中各小长方形上边的______,就得频率分布折线图.一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际的意义.②总体密度曲线:随着__________的增加,作图时__________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=____________,反映了一组数据的平均水平.(4)标准差:s=______________________________,反映了样本数据的离散程度.(5)方差:s2=________________,反映了样本数据的离散程度.1.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,其中,中位数为22,则x等于( ).A.21 B.22 C.23 D.202.某部门计划对某路段进行限速,为调查限速60 km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这300辆汽车中车速低于限速的汽车有( ).A.75辆B.120辆C.180辆D.270辆3.如图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( ).A.84,4.84 B.84,1.6C.85,1.6 D.85,44.某个容量为100的样本的频率分布直方图如下,则在区间[4,5)上的数据的频数..为__________.5.甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为5,乙所得环数如下:5,6,9,10,5,那么这两人中成绩较稳定的是__________.一、用样本的频率分布估计总体分布【例1】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.方法提炼频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,表示数据分布的规律.图中各小长方形的面积等于相应各组的频率,它直观地反映了数据在各个小组的频率的大小.请做演练巩固提升3二、用样本的数字特征估计总体【例2】从甲、乙两种玉米苗中各抽取10株,分别测得它们的株高如下:(单位:cm) 甲:25,41,40,37,22,14,19,39,21,42;乙:27,16,44,27,44,16,40,40,16,40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?方法提炼1.用样本的平均数、方差可以估计总体的平均数和方差.平均数可反映总体取值的平均水平,方差可以反映总体的稳定性,方差越大,稳定性越差,方差越小,稳定性越好.2.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.但是茎叶图不能直接反映总体的分布情况,往往要根据茎叶图所给的数据求出其数字特征,进一步估计总体情况.请做演练巩固提升3巧用中点值来估算【典例】 (12分)(2012广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y 1∶12∶13∶44∶5 规范解答:(1)由题意得:(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(3分)(2)平均分约为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.(7分)(3)易得数学成绩在[50,90)内的人数为5+20+40+25=90,(10分)∴数学成绩在[50,90)之外的人数为100-90=10.(12分)答题指导:1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x+b,方差为a2s2.1.(2012陕西高考) 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ).A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53 2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m o,平均值为x,则( ).A.m e=m o=x B.m e=m o<xC.m e<m o<x D.m o<m e<x3.(2012山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为__________.参考答案基础梳理自测知识梳理1.(1)频率与组距的比值 小长方形的面积 等于1 (2)①最大值 最小值 ②组数 组距③分点 ④频率分布表 ⑤频率分布直方图 (3)①中点 ②样本容量 所分的组数2.(3)x 1+x 2+…+x nn(4)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2](5)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]基础自测1.A 解析:因为样本数据个数为偶数,中位数为x +232=22,故x =21. 2.C 解析:据直方图可得300辆中车速低于限速的汽车所占的频率为10×0.025+10×0.035=0.6,故其频数为300×0.6=180.3.C 解析:去掉最高分93,最低分79.平均分为15(84+84+86+84+87)=85,方差s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=1.6.4.30 解析:样本数据在[1,4)和[5,6]上的频率为(0.05+0.10+0.15+0.40)×1=0.7,故样本数据在[4,5)上的频率为1-0.7=0.3,其频数为100×0.3=30.5.乙 解析:x 乙=5+6+9+10+55=7,2s 乙=15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=4.4,∵2s 甲>2s 乙,∴乙的成绩较稳定.考点探究突破【例1】 解:(1)频率分布表如下:成绩分组 频数 频率 [40,50) 2 0.04 [50,60) 3 0.06 [60,70) 10 0.20 [70,80) 15 0.30 [80,90) 12 0.24 [90,100] 8 0.16 合计50 1.00(2)频率分布直方图如图所示.(3)成绩在[60,90)的学生比例即为学生成绩在[60,90)的频率,即为(0.20+0.30+0.24)×100%=74%.【例2】解:(1)x 甲=110(25+41+40+37+22+14+19+39+21+42)=30,x 乙=110(27+16+44+27+44+16+40+40+16+40)=31,∴x 甲<x 乙.(2)2s 甲=110[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2,同理2s 乙=128.8,∴2s 甲<2s 乙.∴乙种玉米的苗长得高,甲种玉米的苗长得整齐. 演练巩固提升1.A 解析:由茎叶图可知中位数为46,众数为45,极差为68-12=56.故选A. 2.D 解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e =6+52=5.5,又众数m o =5,平均值x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,∴m o <m e <x .3.9 解析:由于组距为1,则样本中平均气温低于22.5 ℃的城市频率为 0.10+0.12=0.22.平均气温低于22.5 ℃的城市个数为11,所以样本容量为110.22=50.而平均气温高于25.5 ℃的城市频率为0.18,所以,样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.。

高考数学一轮复习 第40讲 统计精品学案

高考数学一轮复习 第40讲 统计精品学案

2013年普通高考数学科一轮复习精品学案第40讲统计一.课标要求:1.统计案例通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。

(1)通过对典型案例(如"肺癌与吸烟有关吗"等)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用;(2)通过对典型案例(如"质量控制"、"新药是否有效"等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用;(3)通过对典型案例(如"昆虫分类"等)的探究,了解聚类分析的基本思想、方法及初步应用;(4)通过对典型案例(如"人的体重与身高的关系"等)的探究,进一步了解回归的基本思想、方法及初步应用。

2.随机变量的分布列(1)在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性;(2)通过实例(如彩票抽奖),理解超几何分布及其导出过程,并能进行简单的应用;(3)在具体情境中,了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题;(4)通过实例,理解取有限值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题;(5)通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义。

二.命题走向统计案例本部分内容主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用,是教材新增内容,估计高考中比重不会过大。

预测2013年的高考主要有以下几种情况:(1)知识点将会考察回归分析的基本思想方法,用独立性检验判断A 与B 间的关系,及2×2列联表;(2)考查的形式主要以选择、填空题为主,但不会涉及很多; 随机变量的分布列本部分内容主要包括随机变量的概念及其分布列,离散性随机变量的均值和方差,正态分布,从近几年的高考观察,这部分内容有加强命题的趋势。

人教版2019学年高中数学第一章统计案例章末复习同步学案新人教B版选修1_2

人教版2019学年高中数学第一章统计案例章末复习同步学案新人教B版选修1_2

第一章统计案例章末复学目 1. 理解独立性的基本思想及施步.2. 会求回直方程,并用回直行.1.2× 2 列表2× 2 列表如表所示:B B合A n n n+11121A n21n22n2+合n+1n+2n其中+ 1=11+21,+2= 12+22,n n n n n nn 1+11122+2122= n + n, n= n +n,n=n11+ n21+ n12+ n22. 2.最小二乘法于一数据 ( x i,y i ) ,i= 1,2,⋯, n,若是它性有关,回直方程^ ^y= b x+^^=!,!=!-!! .a,其中 b=!3.独立性常用量χ2= ! 来两个量可否有关系.型一独立性例 1认识某班学生喜打球可否与性有关,本班48 人行了卷获取了以下的2× 2 列联表:喜爱打篮球不喜爱打篮球共计男生6女生10共计482.已知在全班48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为3(1)请将上面的 2× 2 列联表补充完满; ( 不用写计算过程 )(2)可否在出错误的概率不高出 0.05 的前提下认为喜爱打篮球与性别有关?说明你的原因.考点独立性查验及其基本思想题点独立性查验的综合应用解(1) 列联表补充以下:喜爱打篮球不喜爱打篮球共计男生22628女生101020共计321648(2) 由χ2=错误 ! ≈ 4.286.由于 4.286>3.841 ,因此能在出错误的概率不高出0.05 的前提下认为喜爱打篮球与性别有关.反省与感悟经过公式χ 2=错误!计算出χ 2的值,再与临界值作比较,最后得出结论.追踪训练 1 奥运会期间,为检查某高校学生可否愿意供应志愿者服务,用简单随机抽样方法从该校检查了 60 人,结果以下:可否愿意供应志愿者服务愿意不愿意性别男生2010女生1020(1) 用分层抽样的方法在愿意供应志愿者服务的学生中抽取 6 人,其中男生抽取多少人?(2) 你可否在出错误的概率不高出的前提下认为该高校学生可否愿意供应志愿者服务与性别有关?下面的临界值表供参照:20P(χ ≥ x )x0考点独立性查验思想的应用题点独立性查验在分类变量中的应用20解(1) 由题意,可知男生抽取6×20+10=4( 人).(2) χ2=错误 ! ≈ 6.667 ,由于 6.667 > 6.635 ,因此能在出错误的概率不高出0.01 的前提下认为该高校学生可否愿意供应志愿者服务与性别有关.种类二线性回归剖析例 2某城市理论展望2010 年到 2014年人口总数与年份的关系如表所示:年份 201x( 年)01234人口数 y(十万)5781119(1)请画出上表数据的散点图;^^^(2) 请依照上表供应的数据,求出y 对于 x 的回归直线方程y=b x+a;(3) 据此估计2019 年该城市人口总数.考点回归剖析思想的应用题点回归剖析思想的应用解 (1) 散点图如图:(2) 由于x=0+ 1+2+3+4= 2,5y =5+ 7+ 8+11+ 19= 10,55i i=0× 5+1× 7+2× 8+3×11+4×19= 132,x yi = 15x2i = 02+ 12+ 22+ 32+ 42= 30,i = 1^132-5×2×10=3.2 ,因此 b=30-5×22^^x =3.6.a=y- b^因此回归直线方程为y= x+3.6.^(3) 令x= 9,则 y=3.2 × 9+ 3.6 = 32.4 ,故估计 2019 年该城市人口总数为32.4( 十万 ) .反省与感悟解决回归剖析问题的一般步骤(1)画散点图.依照已知数据画出散点图.(2)判断变量的有关性并求回归方程.经过察看散点图,直观感知两个变量可否拥有有关关系;在此基础上,利用最小二乘法求回归系数,尔后写出回归方程.(3)本质应用.依照求得的回归方程解决实责问题.追踪训练2某运动员训练次数与运动成绩之间的数据关系以下:次数 x3033353739444650成绩 y3034373942464851(1)作出散点图;(2)求出回归直线方程;(3)计算有关系数并进行有关性查验;(4) 试展望该运动员训练47 次及 55 次的成绩.解(1) 作出该运动员训练次数x 与成绩 y 之间的散点图,以以下列图,由散点图可知,它们之间拥有线性有关关系.(2)列表计算:次数 x i成绩 y i x i2y i2x i y i30309009009003334 1 089 1 156 1 1223537 1 225 1 369 1 2953739 1 369 1 521 1 4433942 1 521 1 764 1 6384446 1 936 2 116 2 0244648 2 116 2 304 2 2085051 2 500 2 601 2 550由上表可求得8x = 39.25 , y =40.875 ,∑x i2= 12 656 ,i= 188x i y i=13 180,∑y i2=13 731,∑i = 1i = 18xiyi- 8x y^∑^^i = 1,∴ b=≈ 1.041 5 , a = y- b x =- 0.003 88 82∑ x2i - 8 xi = 1∴回归直线方程为y =1.041 5 - 0.003 88.x(3)计算有关系数 r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的有关关系.(4) 由上述剖析可知,我们可用回归直线方程y=1.041 5 x-0.003 88作为该运动员成绩的预告值.将 x=47和 x=55分别代入该方程可得y≈49和 y≈57.故展望该运动员训练47 次和 55次的成绩分别为49 和 57.1.从某地域老人中随机抽取500 人,其生活可否自理的情况以下表所示,则()性别人数男女生活可否自理能178278不能够2321A. 有 95%的掌握认为老人生活可否自理与性别有关B.有 99%的掌握认为老人生活可否自理与性别有关C.没有充足原因认为老人生活可否自理与性别有关D.以上都不对考点独立性查验及其基本思想题点独立性查验的思想答案C剖析经计算,得χ 2=错误 !≈2.925<3.841 ,故我们没有充足的原因认为老人生活可否自理与性别有关.2.“回归”一词是在研究子女的身高与父亲母亲的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.依照他的结论,在儿子的身高y 与父亲的^ ^ ^^)身高 x 的回归直线方程 y=b x+a中,b的值(A.在 ( - 1,0) 内B.等于 0C.在 (0,1) 内D.在 [1 ,+∞ ) 内考点线性回归剖析题点回归直线方程的应用答案C剖析子代平均身高向中心回归,^b应为正的真分数,应选 C.3.四名同学依照各自的样本数据研究变量x, y 之间的有关关系,并求得回归方程,分别获取以下四个结论:^① y 与 x 负有关且y= x-;^② y 与 x 负有关且y=- x+;③ y 与 x ^;正有关且 y = 5.437 x +④ y 与 x^x -4.578.正有关且 y =-其中必然不正确的结论的序号是()A .①②B .②③C .③④D .①④考点 线性回归剖析题点 回归直线方程的应用答案 D剖析①中,回归方程中 x 的系数为正,不是负有关;④中,回归方程中x 的系数为负,不是正有关,因此①④必然不正确.^ ^^时,对应的 y 的估计值是 17,当 x = 8 时,对应 4.对于回归直线方程 y = b x + a ,当 x = 3 的 y 的估计值是 22,那么,该回归直线方程是 ________,依照回归直线方程判断当x =________时, y 的估计值是 38. 考点 线性回归剖析题点 回归直线方程的应用答案 ^y = x +14 24剖析第一把两组值代入回归直线方程,得^^^3b + a = 17,b = 1,^ 解得^^8b + a = 22, a = 14.^因此回归直线方程是y = x + 14.令 x + 14= 38,可得 x = 24,即当 x = 24 时, y 的估计值是 38.1.成立回归模型的基本步骤(1) 确定研究对象,明确哪个变量是自变量,哪个变量是因变量. (2) 画出散点图,察看它们之间的关系. (3) 由经验确定回归方程的种类.(4) 依照必然的规则估计回归方程中的参数.2.独立性查验是对两个分类变量间可否存在有关关系的一种案例剖析方法 .一、选择题1.当χ2>3.841 时,认为事件A与事件 B()A.有 95%的掌握有关B.有 99%的掌握有关C.没有原因说它们有关D.不确定答案 A2.下表显示出样本中变量y 随变量 x 变化的一组数据,由此判断它最可能是() x45678910y14181920232528A. 线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型考点回归剖析题点成立回归模型的基本步骤答案A剖析画出散点图 ( 图略 ) 能够获取这些样本点在某一条直线上或在该直线周边,故最可能是线性函数模型.3.下表是某厂1~ 4 月份用水量 ( 单位:百吨 ) 的一组数据:月份 x1234用水量 y43由散点图可知,用水量y 与月份 x 之间有较好的线性有关关系,其回归直线方程是^y=-^^)0.7 x+ a,则 a等于 (A.10.5 B.5.15 C. 5.2 D .考点回归直线方程题点样本中心点的应用答案D^剖析样本点的中心为(2.5,3.5),将其代入回归直线方程可解得a=5.25.4.据统计,用于数学学习的时间( 单位:小时 ) 与成绩 ( 单位:分 ) 近似于线性有关关系,对某小组每周用于数学学习时间x 与数学成绩y 进行数据收集如表:x1516181922y10298115115120由表中样本数据求回归直线方程^ ^ ^^ ^y=110的地址关系y= bx+a,则点(a,b)与直线 x+18为 ()A.点在直线左侧B.点在直线右侧C.点在直线上D.无法确定考点回归直线方程题点样本点中心的性质答案C剖析由题意知 x =18, y =110,样本点中心为^ (18,110) 在回归直线上,故 110= 18b+^^ ^a,即点( a, b)在直线上.5.某察看团对全国 10 大城市进行员工人均薪水水平x(单位:千元)与居民人均花销水平y(单位:千元)统计检查, y 与 x 拥有线性有关关系,回归直线方程为^y= 0.66 x+ 1.562.若某城市居民人均花销水平为7.675 千元,估计该城市人均花销额占人均薪水收入的百分比约为 ()A.83% B . 72% C.67% D .66%考点线性回归剖析题点回归直线方程的应用答案A剖析将 y=代入回归直线方程,可计算得x≈9.26 ,因此该城市人均花销额占人均薪水收入的百分比约为7.675 ÷9.2 6≈0.83 ,即约为83%.6.已知变量x和y知足关系y=- 0.1 x+1,变量y与z正有关.以下结论中正确的选项是() A.x与y正有关,x与z负有关B.x与y正有关,x与z正有关C.x与y负有关,x与z负有关D.x与y负有关,x与z正有关考点线性回归剖析题点回归直线方程的应用答案C剖析由于y =-+ 1,- 0.1<0 ,因此x与y负有关.又y与z正有关,故可设z=xay+ b( a>0),因此 z=- ax+a+ b,- a<0,因此 x 与 z 负有关.应选 C.二、填空题7.已知x与y之间的一组数据:x0246y a353a已求得对于 y 与 x 的回归直线方程为考点线性回归剖析题点回归直线方程的应用答案^y = x+,则 a=________.剖析x =3, y = a+2,将(3, a+2)代入方程,得a+2=+,解得 a=2.15. 8.某工厂为了新研发的一种产品进行合理订价,将该产品按起初拟订的价钱进行试销,获取以下数据:单位 x(元)456789销量 y(件)908483807568由表中数据,求得回归直线方程为^^y=- 4x+a,若在这些样本点中任取一点,则它在回归直线左下方的概率为________.考点线性回归剖析题点回归直线方程的应用答案1 3剖析由表中数据得 x = 6.5 , y =^^^ 80,由点 ( x , y ) 在直线y=- 4x+a上,得a=106,即回归直线方程为^x+106,经过计算只有点(9,68)和(5,84)在直线的左下y =-42 1方,故所求概率为= .6 39.某工厂为了检查工人文化程度与月收入之间的关系,随机检查了部分工人,获取以下表所示的 2× 2 列联表 ( 单位:人 ) :月收入 2 000 元以下月收入 2 000元及以上总计高中文化以上104555高中文化及以下203050总计3075105由 2× 2 列联表计算可知,我们有 ________以上的掌握认为“文化程度与月收入有关系”.P(χ2≥ x0)x0考点独立性查验及其基本思想题点独立性查验的方法答案97.5%2剖析由表中的数据可得χ =错误!≈ ,因此我们有97.5%以上的掌握认为“文化程度与月收入有关系”.10.某医疗研究所为了查验某种血清预防感冒的作用,把500 名使用血清的人与其他500名未使用血清的人一年中的感冒记录作比较,提出假定H0:“这种血清不能够起到预防感22冒的作用”,利用 2× 2 列联表计算得χ ≈ ,经查临界值表知P(χ ≥3.841)≈0.05.①在出错误的概率不高出5%的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%.考点独立性查验及其基本思想题点独立性查验的方法答案①剖析查临界值表知P(χ2≥3.841)≈,故有95%的掌握认为“这种血清能起到预防感冒的作用” .95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100 个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.三、解答题11.某城区为研究城镇居民家庭月人均生活费支出和月人均收入的有关关系,随机抽取10户进行检查,其结果以下:月人均收入x(元)300390420520570月人均生活费y(元)255324335360450月人均收入x(元)700760800850 1 080月人均生活费y(元)520580*********(1)作出散点图;(2)求出回归直线方程;(3) 试展望月人均收入为 1 100 元和月人均收入为 1 200 元的两个家庭的月人均生活费.考点题点解 (1) 作出散点图以以下列图,由图可知月人均生活费与月人均收入之间拥有较强的线性有关关系.(2) 经过计算可知x =639, y =480.4 ,10∑ x i2=4 610 300i =110,∑ x y =3 417 560,i = 1 i i10xiyi- 10 x y^∑^^i = 1,∴ b =≈ 0.659 9 , a= y - b x =58.723 9 10x2∑ x2i - 10i = 1∴回归直线方程为^=0.659 9 x+ 58.723 9. y(3)由以上剖析可知,我们能够利用线性回归方程^y = 0.659 9 x+ 58.723 9来计算月人均生活费的展望值.将 x=1 100代入,得 y≈,将 x=1 200代入,得 y≈850.60.故展望月人均收入分别为 1 100 元和 1 200 元的两个家庭的月人均生活费分别为元和 850.60 元.12.某公司有两个分厂生产某种零件,按规定内径尺寸( 单位:mm)的值落在 [29.94,30.06)的零件为优秀品.从两个分厂生产的零件中各抽出了500 件,量其内径尺寸,得结果如下表:甲厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数12638618292614乙厂:分组[29.86 ,[29.90 ,[29.94 ,[29.98 ,,[30.06 ,[30.10 ,29.90)29.94)29.98)30.02)30.06)30.10)30.14]频数297185159766218(1)试分别估计两个分厂生产的零件的优秀品率;(2) 由以上统计数据填写下面的2× 2 列联表,并问可否在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别”?甲厂乙厂共计优秀品非优秀品共计考点独立性查验及其基本思想题点独立性查验的方法360解(1) 甲厂抽查的产品中有360 件优秀品,进而甲厂生产的零件的优秀品率估计为=500 72%;乙厂抽查的产品中有'320 件优秀品,进而乙厂生产的零件的优秀品率估计为320= 64%. 500(2)2 × 2 列联表以下:甲厂乙厂共计优秀品360320680非优秀品140180320共计5005001 000χ2=错误 ! ≈ 7.353>6.635 ,因此在出错误的概率不高出0.01 的前提下认为“两个分厂生产的零件的质量有差别.”四、研究与拓展13.某校高一年级理科有 8 个班,在一次数学考试中成绩情况剖析以下:班级12345678大于 145 分的人数66735337不大于 145 分的人数3939384240424238附:88∑x i y i=171,∑ x i2=204.i = 1i = 1求 145 分以上人数y 对班级序号x 的回归直线方程.( 精准到 0.000 1)考点独立性查验思想的应用题点独立性查验与回归直线方程、希望的综合应用解x = 4.5 , y =88i2= 204,5,∑i i =171,∑i=1x y i =1x8- 8 x y^∑ xiyi171-8×4.5 ×5i = 1=b=8204-8×x2i-8 x 2∑i = 13=-14≈- 0.214 3 ,^^×4.5≈ 5.964 4 ,a= y -b x =5- ( -0.214 3)^∴回归直线方程为y=- 0.214 3 x+ 5.964 4.。

人教版数学高一B版必修3学案 阶段复习课 第2章 统计

人教版数学高一B版必修3学案 阶段复习课 第2章 统计

第二课 统计[核心速填]1.抽样方法(1)当总体容量较小,样本容量也较小时,可采用抽签法. (2)当总体容量较大,样本容量较小时,可用随机数表法. (3)当总体由差异明显的几部分组成时,可用分层抽样法. 2.用样本估计总体 (1)用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便. (2)样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差. 3.变量间的相关关系(1)两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系). (2)求回归方程的步骤:①先把数据制成表,从表中计算出x ,y,∑ni =1x 2i ,∑ni =1x i y i; ②计算回归系数a ^,b ^.公式为⎩⎪⎨⎪⎧b ^=∑ni =1x i y i-n x y∑ni =1x 2i -n x2,a^=y -b ^x .③写出回归方程y ^=bx +a .[体系构建][题型探究]抽样方法及应用(1)利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14B.13C.514D.1027(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号(从左向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第9行)________. 84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211 (1)C (2)025,016,105,185,395 [(1)根据题意,9n -1=13,解得n =28.故在整个抽样过程中每个个体被抽到的概率为1028=514.(2)由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047.凡不在000~499中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5袋牛奶的编号为025,016,105,185,395.][规律方法]随机抽样有简单随机抽样和分层抽样两种.其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.分层抽样时都要用到简单随机抽样.应用各种抽样方法抽样时要注意以下问题:(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;(2)利用随机数表法时注意编号位数要一致;(3)在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.[跟踪训练]1.某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代理商.公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记这项调查为①;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是________.分层抽样,简单随机抽样[由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差异,所以完成②宜采用简单随机抽样.]用样本的频率分布估计总体分布如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142) 人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.[思路探究](1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134 cm的频率.[解](1)样本的频率分布表:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计120 1.00(2)画出频率分布直方图,如下图所示:(3)因为样本中身高低于134 cm的人数的频率为5+8+10120=23120≈0.19,所以估计身高低于134 cm的人数约占总人数的19%.[规律方法]总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.[跟踪训练]2.为了了解某校高一学生的视力情况,随机地抽查了该校100名高一学生的视力情况,得到频率分布直方图如图2-1,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()图2-1A.64B.54C.48D.27B[[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-(0.62+0.05+0.11)=1-0.78=0.22,∴a=(0.22+0.32)×100=54.]用样本的数字特征估计总体的数字特征甲、乙两人数学成绩的茎叶图如图2-2所示:图2-2(1)求出这两名同学的数学成绩的平均数、标准差;(2)比较两名同学的成绩,谈谈你的看法.[思路探究](1)利用茎叶图中的数据计算平均数、标准差.(2)从平均数和方差两方面比较两人的成绩.[解]x甲=110(65+70+80+86+89+95+91+94+107+113)=89.s2甲=110[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91-89)2+(94-89)2+(107-89)2+(113-89)2]=199.2,∴s甲≈14.1.x乙=110(79+86+83+88+93+99+98+98+102+114)=94.s2乙=110[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98-94)2+(98-94)2+(102-94)2+(114-94)2]=96.8.∴s乙≈9.8.∴x甲<x乙且s甲>s乙.∴乙同学的平均成绩较高且标准差较小;说明乙同学比甲同学的成绩扎实,稳定.[跟踪训练]3.小明是班里的优秀学生,他的历次数学成绩分别是96分,98分,95分,93分,但最近的一次考试成绩只有45分,原因是他带病参加了考试.期末评价时,按照60~79分为“合格”,80~90分为“良好”,90~100分为“优秀”的原则,这样给小明评价:这五次数学考试的平均分是96+98+95+93+455=85.4,则按平均分给小明一个“良好”.试问这种评价是否合理?如果不合理请给出更合理的评价.[解]这种评价是不合理的.尽管平均数是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:45,93,95,96,98.中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩,应评定为“优秀”.用回归直线方程对总体进行估计下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1 000 ℃时,黄酮延长性的情况.[思路探究]先画出散点图,确定y与x之间是否线性相关,再根据求回归直线方程的步骤求出回归直线方程,最后根据回归方程确定黄酮延长性的情况.[解](1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. (3)列出下表并用科学计算器进行有关计算.i 1 2 3 4 5 6 x i 300 400 500 600 700 800 y i 40 50 55 60 67 70 x i y i 12 000 20 000 27 500 36 000 46 900 56 000 x 2i90 000160 000250 000360 000490 000640 000x =550,y =57,∑6i =1x 2i =1 990 000,∑6i =1x i y i =198 400 于是可得b ^=∑6i =1x i y i-6x y ∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86,a^=y -b ^x =57-0.058 86×550=24.627. 因此所求的回归直线的方程为: y ^=0.058 86x +24.627. (4)将x =1 000代入回归方程得 y ^=0.058 86×1 000+24.627=83.487, 即退水温度是1 000 ℃时, 黄酮延长性大约是83.487%.[规律方法] 分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线的方程叫做回归方程. 求回归方程的步骤:(1)先把数据制成表,从表中计算出∑i =1nx i ,∑i =1ny i ,∑i =1nx 2i ,∑i =1nx i y i ;(2)计算回归系数a ^,b ^;(3)写出回归方程y ^=bx +a .[跟踪训练]4.有人收集了2016年春节期间平均气温x 与某取暖商品销售额y的有关数据如下表:方程y ^=bx +a 的系数b ^=-2.4,则预测平均气温为-8℃时该商品的销售额为( )A .34.6万元B .35.6万元C .36.6万元D .37.6万元A [x =(-2)+(-3)+(-5)+(-6)4=-4,y =20+23+27+304=25,所以25=(-2.4)×(-4)+a . 所以a^=15.4. 所以回归直线方程为y ^=-2.4x +15.4.当x =-8时,y =34.6,即预测平均气温为-8℃时,该商品的销售额为34.6万元.故选A.]。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

微专题95 高中涉及的统计学知识
一、基础知识:
(一)随机抽样:
1、抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到容量为n 的样本
2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:
(1)先将总体的N 个个体编号
(2)确定分段间隔k ,设样本容量为n ,若N n 为整数,则N k n
= (3)在第一段中用简单随机抽样确定第一个个体编号l ,则后面每段所确定的个体编号与前一段确定的个体编号差距为k ,例如:第2段所确定的个体编号为l k +,第m 段所确定的个体编号为()1l m k +-,直至完成样本
注:(1)若N n
不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被n 整除,再进行系统抽样。

例如501名学生所抽取的样本容量为10,则先随机抽去1个,剩下的500个个体参加系统抽样
(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k
3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。

分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到
(二)频率分布直方图:
1、频数与频率
(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数据的个数.
(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数
(3)各试验结果的频率之和等于1
2、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表(表格形式)和频率分布直方图(图像形式)直观的列出
(1)极差:一组数据中最大值与最小值的差
(2)组距:将一组数据平均分成若干组(通常5-12组),则组内数据的极差称为组距,所以
有组距=极差/组数
(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图
(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”
(5)频率分布直方图的特点:
② 因为各试验结果的频率之和等于1,所以可得在频率分布直方图中,各个矩形的面积和为1
(三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据中除了末位数前面的其他数位,叶通常代表每个数据的末位数。

并按末位数之前的数位进行分类排列,相同的数据需在茎叶图中体现多次
(四)统计数据中的数字特征:
1、众数:一组数据中出现次数最多的数值,叫做众数
2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均值。

,,n x ,则有:n x +
+ ,
,n x ,其平均数为(n x x ++-越小,说明数据越集中5、标准差:也代表数据分布的分散程度,为方差的算术平方根
二、典型例题
例1:某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为
185的样本,
已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有学生_______人.
思路:分层抽样即按比例抽样,由高一年级和高二年级的人数可得高三人数为185756050--=人,所以抽样比为
501=100020,从而总人数为1185370020
÷=人 答案:3700 例2:某企业三月中旬生产,A .B .C 三种产品共3000件,根据分层抽样的结果;企业统计
员制作了如下的统计表格:
由于不小心,表格中A.C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是件.
思路:由B产品可得抽样比为1301
130010
=,所以若A产品的样本容量比C产品的样本容量多
10,则A产品的数量比C产品的数量多
1
10100
10
÷=,且,A C产品数量和为
30001300170
-=,从而可解得C产品的数量为800
答案:800
例3:某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维所得数据均在区间[]
5,40中,其频率分布直方图如图所示,则在抽测的100根中___________根棉花纤维的长度小于15mm.
思路:由频率直方图的横纵轴可得:组距为5mm,所以小于15mm的频率为()
0.010.0150.1
+⨯=,所以小于15mm共有1000.1=10
⨯根
答案:10
例4:某班甲、乙两位同学升入高中以来的5次数学考试成绩的茎叶图如图,则乙同学这5次数学成绩的中位数是;已知两位同学这5次成绩的平均数都是84,成绩比较稳定的是(第二个空填“甲”或“乙”).
思路:由茎叶图可读出,乙同学的成绩为79,80,82,88,91,甲同学的成绩为81,82,83,84,91,所以乙同学的成绩的中位数为82,相比较而言,甲同学的成绩比较集中,所以比较稳定的是甲
答案:82,甲
小炼有话说:在求中位数时要注意先将数据从小到大排列,判断成绩稳定,本题甲,乙稳定性的判断定量上要依靠方差,但因为本题从茎叶图上看出甲,乙数据稳定性差距较大,所以定性的判断。

例6:某校从参加高三年级期末考试的学生中随机抽取100名学生,将其数学成绩分成五段:[)[)[)[)50,70,70,90,90,110,110,130,[]130,150,它的频率分布直方图如图所示,则该批学生中成绩不低于90分的人数是_____.
思路:[)90,100的高度未知,但由于直方图体现的是全部样本的情况,所以各部分频率和为1,可以考虑间接法。

从图中可观察到(]50,90的频率为()0.00250.0150200.35+⨯=,所以不低于90分的频率为10.350.65-=,故人数为1000.6565⨯=(人)
答案:65
例7:从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图所示.
(1)直方图中x 的值为___________;
(2)在这些用户中,用电量落在区间[)100,250内的户数为_____________.
思路:(1)依题意可得频率直方图中的频率和等于1,由图可得组距为50,所以有()0.00240.00360.00600.00240.0012501x +++++⨯=,解得0.0044x =
(2)图中[)100,250的频率为()0.00360.0060.0044500.7++⨯=,所以用户数为1000.770
⨯=(户) 答案:(1)0.0044x = (2)70户
例7:某校1000名学生的数学测试成绩分布直方图如图所示,分数不低于a 即为优秀,如果优秀的人数为175人,则a 的估计值是________.
思路:可先从频率直方图中按分数从高到低统计分数段的人数,组距为10,从而可得: (]140,150的人数为()10000.0110100⨯⨯=,同理可得(]130,140的人数为150人,而优秀的人数为175人,所以应包含(]140,150的全体,以及(]130,140中的一半人数,所以估计值为130到140的中间值,即135
答案:135a ≈
例8:某地区为了解中学生的日平均睡眠时间(单位:h ),随机选择了n 位中学生进行调查,根据所得数据,画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n = _______.
思路:设第一个的面积为1S a =,则第4个为40.1S a =+,第2个为20.2S a =+,第3个为30.3S a =+,依题意可得四部分的频率和为1,从而12341S S S S +++=可解得0.1a =,所以10.1S =,从而101000.1n =
= 答案:100
例9:某单位有职工200名,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第10组抽出的号码应是_________
思路:由系统抽样可知,每组抽出的号码依次成等差数列,且公差为组距5d =,所以522a =,则1055222547a a d =+=+=
答案:47
例10:某单位有840名职工, 现采用系统抽样抽取42人做问卷调查, 将840人按1, 2, …, 840随机编号, 则抽取的42人中, 编号落入区间[]61,120的人数为 .
思路:由系统抽样可知:组距为8402042
=,所以区间[]61,120可拆分为[)[)[)61,80,81,100,101,120,而每个区间只有一人被抽取,所以共有3人
答案:3。

相关文档
最新文档