江苏专用2018版高考数学大一轮复习第十一章统计11.2用样本估计总体课件理
高三数学一轮复习 第十一章 统计、统计案例 11.2用样本估计总体课件 新人教B版
.
4.(2010·福建)若某校高一年级 8 个班参加 合唱比赛的得分如茎叶图所示,则这组 数据的中位数和平均数分别是( )
A.91.5 和 91.5 C.91 和 91.5
B.91.5 和 92 D.92 和 92
.
解析 将这组数据从小到大排列,得 87,89, 90,91,92,93,94,96. 故平均数 x =87+89+90+91+8 92+93+94+96 =91.5, 中位数为91+2 92=91.5,故选 A. 答案 A
.
5.某工厂对一批电子元件进行了抽样检测,根据抽样检测后元 件使用寿命(单位:小时)的数据绘制的频率分布直方图如图 所示,其中元件使用寿命的范围是[100,600],样本数据分组 为[100,200),[200,300),[300,400),[400,500),[500,600], 若样本元件的总数为 1 000 个,则样本中使用寿命大于或等 于 200 小时并且小于 400 小时的元件的个数是( )
第十一章 统计、统计案例
§11.2 用样本估计总体
基础知识 自主学习
要点梳理
1.频率分布直方图 (1)通常我们对总体作出的估计一般分成两种,一种 是用 样本的频率分布估计总体的分布 ,另一 种是用 样本的数字特征估计总体的数字特征. (2)在频率分布直方图中,纵轴表示频 组率 距,数据落在 各小组内的频率用 各小长方形的面积 表示.各 小长方形的面积总和等于 1.
请结合频率分布直方图提供的信息,解答下列问题:
.
(1)样本的容量是多少? (2)列出频率分布表; (3)成绩落在哪个范围内的人数最多?并求该小组的 频数、频率; (4)估计这次竞赛中,成绩不低于 60 分的学生占总人 数的百分比. 解 (1)由于各组的组距相等,所以各组的频率与各 小长方形的高成正比且各组频率的和等于 1,那么各 组的频率分别为116,136,166,146,126.设该样本容量 为 n,则6n=126,所以样本容量为 n=48.
2018版高考数学理江苏专用大一轮复习讲义教师版文档第
1.简单随机抽样(1)定义:一般地,从个体为N 的总体中逐个不放回地取出n 个个体作为样本(n ∈N ),如果每个个体都有相同的机会被取到,那么这样的抽样方法,称为简单随机抽样. (2)最常用的简单随机抽样方法有两种——抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. ①采用随机的方法将总体中的N 个个体编号;②将编号按间隔k 分段,当N n 是整数时,取k =N n ;当Nn 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N ′能被n 整除,这时取k =N ′n ,并将剩下的总体重新编号;③在第一段中用简单随机抽样确定起始的个体编号l ;④按照一定的规则抽取样本,通常将编号为l ,l +k ,l +2k ,…,l +(n -1)k 的个体抽出. 3.分层抽样(1)定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”. (2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法. 【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”) (1)简单随机抽样是一种不放回抽样.( √ )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( × ) (3)抽签法中,先抽的人抽中的可能性大.( × )(4)系统抽样在第1段抽样时采用简单随机抽样.( √ )(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × )(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为______________. 答案 25,56,19解析 因为125∶280∶95=25∶56∶19, 所以抽取人数分别为25,56,19.2.(2015·四川改编)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是__________. 答案 分层抽样法解析 根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法 问题与方法配对正确的是____________. 答案 (1)Ⅲ,(2)Ⅰ解析 通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法. 4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________. 答案 695解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为15+(35-1)×20=695.5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 答案 15解析设应从高二年级抽取x名学生,则x∶50=3∶10,解得x=15.题型一简单随机抽样例1(1)以下抽样方法是简单随机抽样的有________.①在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖;②某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格;③某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见;④用抽签方法从10件产品中选取3件进行质量检验.(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.答案(1)④解析(1)①、②不是简单随机抽样,因为抽取的个体间的间隔是固定的;③不是简单随机抽样,因为总体的个体有明显的层次;④是简单随机抽样.(2)由题意知前5个个体的编号为08,02,14,07,01.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有________.①从某厂生产的5 000件产品中抽取600件进行质量检验;②从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验;③从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验;④从某厂生产的5 000件产品中抽取10件进行质量检验.(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.答案(1)②(2)①②③④解析(1)①、④中的总体个体数较多,不适宜抽签法,③中甲、乙两厂的产品质量有区别,也不适宜抽签法.②是简单随机抽样.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.题型二系统抽样例2(1)(2015·湖南改编)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________.答案(1)4(2)12解析(1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.(2)由84042=20,即每20人抽取1人,所以抽取编号落在区间[481,720]的人数为720-48020=24020=12.引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________.答案144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2016·南京模拟)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是________.(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为________. 答案 (1)18 (2)10解析 (1)分段间隔为524=13,故还有一个学生的编号为5+13=18.(2)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69, (939)落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 题型三 分层抽样命题点1 求总体或样本容量例3 (1)(2016·苏北四市联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n =________.(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)90 (2)1 800解析 (1)依题意得33+5+7×n =18,解得n =90,即样本容量为90.(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件. 命题点2 求某层入样的个体数例4 (2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为________.(2)(2015·福建)某校高一年级有名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 (1)180 (2)25解析 (1)由题意抽样比为3201 600=15,∴该样本中的老年教师人数为900×15=180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取的人数为45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20. (2)1 00080=x 4,x =50.五审图表找规律典例 (14分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对广州亚运会举办情况的了解↓(可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当) 将单位人员看作一个整体 ↓(从表中数据看总人数为2 000) 人员较多,可采用系统抽样 规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取, [1分] 抽取比例为402 000=150.[3分] 故老年人、中年人、青年人各抽取4人、12人、24人.[5分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取, [6分] 抽取比例为252 000=180,[8分]故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人. [10分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[14分]1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为________. 答案 8解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.2.(2017·扬州月考)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是______________. 答案 系统抽样解析 符合系统抽样的特点,故是系统抽样.3.(2016·南京、盐城联考)某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________. 答案 17解析 由题意可得从高二年级学生中抽出的人数为20400×360=18,故从高三年级学生中抽取的人数为55-20-18=17.4.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1~160进行编号,并按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若按等距的规则从第16组抽出的号码为126,则第1组中用抽签法确定的号码是________. 答案 6解析 第1组中用抽签法确定的号码是126-15×8=6.5.(2016·镇江模拟)将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是______________. 答案 16,28,40,52解析 编号组数为5,间隔为605=12,因为在第一组抽得04号:又4+12=16,16+12=28,28+12=40,40+12=52, 所以其余4个号码为16,28,40,52.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为__________________. 答案 25,17,8解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1). 令3+12(k -1)≤300得k ≤1034,因此第Ⅰ营区被抽中的人数是25; 令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17. 7.(2016·山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是__________. 答案110,110解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110.8.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 设应从一年级本科生中抽取x 名学生,则x 300=44+5+5+6,解得x =60.9.某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意,可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.10.一个总体中有90个个体,随机编号0,1,2,…,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为64×28=16.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.*14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x ,y 的值. 解 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m ,∴3050=m5,解得m =3. 抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3),其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2), ∴从中任取2人,至少有1人学历为研究生的概率为710. (2)由题意,得10N =539,解得N =78,∴35~50岁中被抽取的人数为78-48-10=20, ∴4880+x =2050=1020+y, 解得x =40,y =5,即x ,y 的值分别为40,5.。
2018版高考数学文江苏专用大一轮复习讲义文档 第十一章 概率 11.1 含答案 精品
1.概率和频率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数,称事件A 出现的比例f n (A )=n An 为事件A 出现的频率.(2)对于给定的随机事件A ,在相同条件下,随着试验次数的增加,事件A 发生的频率会在某个常数附近摆动并趋于稳定,我们可以用这个常数来刻画随机事件A 发生的可能性大小,并把这个常数称为随机事件A 的概率,记作P (A ). 2.事件的关系与运算3.概率的几个基本性质(1)概率的取值范围:0≤P (A )≤1. (2)必然事件的概率P (E )=1.(3)不可能事件的概率P(F)=0.(4)概率的加法公式如果事件A与事件B互斥,则P(A∪B)=P(A)+P(B).(5)对立事件的概率若事件A与事件B互为对立事件,则P(A)=1-P(B).【知识拓展】互斥事件与对立事件的区别与联系互斥事件与对立事件都是两个事件的关系,互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生,因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)事件发生频率与概率是相同的.(×)(2)随机事件和随机试验是一回事.(×)(3)在大量重复试验中,概率是频率的稳定值.(√)(4)两个事件的和事件是指两个事件都得发生.(×)(5)对立事件一定是互斥事件,互斥事件不一定是对立事件.(√)(6)两互斥事件的概率和为1.(×)1.从{1,2,3,4,5}中随机选取一个数a,从{1,2,3}中随机选取一个数b,则b>a的概率是________.答案1 5解析基本事件的个数有5×3=15,其中满足b>a的有3种,所以b>a的概率为315=15.2.(教材改编)将一枚硬币向上抛掷10次,其中“正面向上恰有5次”是________.(填序号) ①必然事件②随机事件③不可能事件④无法确定答案②解析抛掷10次硬币正面向上的次数可能为0~10,都有可能发生,正面向上5次是随机事件.3.从某班学生中任意找出一人,如果该同学的身高小于160 cm的概率为0.2,该同学的身高在[160,175](单位:cm)内的概率为0.5,那么该同学的身高超过175 cm的概率为________.答案0.3解析因为必然事件发生的概率是1,所以该同学的身高超过175 cm的概率为1-0.2-0.5=0.3.4.给出下列三个命题,其中正确的命题有________个.①有一大批产品,已知次品率为10%,从中任取100件,必有10件是次品; ②做7次抛硬币的试验,结果3次出现正面,因此正面出现的概率是37;③随机事件发生的频率就是这个随机事件发生的概率. 答案 0解析 ①错,不一定是10件次品;②错,37是频率而非概率;③错,频率不等于概率,这是两个不同的概念.5.(教材改编)袋中装有9个白球,2个红球,从中任取3个球,则①恰有1个红球和全是白球;②至少有1个红球和全是白球;③至少有1个红球和至少有2个白球;④至少有1个白球和至少有1个红球.在上述事件中,是对立事件的为________. 答案 ②解析 ①是互斥不对立的事件,②是对立事件,③④不是互斥事件.题型一 事件关系的判断例1 (1)从1,2,3,…,7这7个数中任取两个数,其中: ①恰有一个是偶数和恰有一个是奇数; ②至少有一个是奇数和两个都是奇数; ③至少有一个是奇数和两个都是偶数; ④至少有一个是奇数和至少有一个是偶数. 上述事件中,是对立事件的是________.(2)设条件甲:“事件A 与事件B 是对立事件”,结论乙:“概率满足P (A )+P (B )=1”,则甲是乙的____________条件. 答案 (1)③ (2)充分不必要解析 (1)③中“至少有一个是奇数”即“两个奇数或一奇一偶”,而从1~7中任取两个数根据取到数的奇偶性可认为共有三个事件:“两个都是奇数”、“一奇一偶”、“两个都是偶数”,故“至少有一个是奇数”与“两个都是偶数”是对立事件,易知其余都不是对立事件. (2)若事件A 与事件B 是对立事件,则A ∪B 为必然事件,再由概率的加法公式得P (A )+P (B )=1.设掷一枚硬币3次,事件A :“至少出现一次正面”,事件B :“3次出现正面”,则P (A )=78,P(B)=18,满足P(A)+P(B)=1,但A,B不是对立事件.(3)(2016·镇江模拟)某城市有甲、乙两种报纸供居民订阅,记事件A为“只订甲报纸”,事件B为“至少订一种报纸”,事件C为“至多订一种报纸”,事件D为“不订甲报纸”,事件E为“一种报纸也不订”.判断下列每对事件是不是互斥事件;如果是,再判断它们是不是对立事件.①A与C;②B与E;③B与C;④C与E.解①由于事件C“至多订一种报纸”中有可能“只订甲报纸”,即事件A与事件C有可能同时发生,故A与C不是互斥事件.②事件B“至少订一种报纸”与事件E“一种报纸也不订”是不可能同时发生的,故B与E 是互斥事件.由于事件B不发生可导致事件E一定发生,且事件E不发生会导致事件B一定发生,故B与E还是对立事件.③事件B“至少订一种报纸”中有这些可能:“只订甲报纸”、“只订乙报纸”、“订甲、乙两种报纸”,事件C“至多订一种报纸”中有这些可能:“一种报纸也不订”、“只订甲报纸”、“只订乙报纸”,由于这两个事件可能同时发生,故B与C不是互斥事件.④由③的分析,事件E“一种报纸也不订”是事件C的一种可能,即事件C与事件E有可能同时发生,故C与E不是互斥事件.思维升华(1)准确把握互斥事件与对立事件的概念①互斥事件是不可能同时发生的事件,但可以同时不发生.②对立事件是特殊的互斥事件,特殊在对立的两个事件不可能都不发生,即有且仅有一个发生.(2)判断互斥、对立事件的方法判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.下列命题:①将一枚硬币抛两次,设事件M:“两次出现正面”,事件N:“只有一次出现反面”,则事件M与N互为对立事件;②若事件A与B互为对立事件,则事件A与B为互斥事件;③若事件A与B为互斥事件,则事件A与B为对立事件;④若事件A与B互为对立事件,则事件A∪B为必然事件.其中,真命题是________.答案②④解析对①,将一枚硬币抛两次,共出现{正,正},{正,反},{反,正},{反,反}四种结果,则事件M与N是互斥事件,但不是对立事件,故①错;对②,对立事件首先是互斥事件,故②正确;对③,互斥事件不一定是对立事件,如①中两个事件,故③错;对④,事件A 、B 为对立事件,则在一次试验中A 、B 一定有一个要发生,故④正确. 题型二 随机事件的频率与概率例2 (2016·全国甲卷)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:(1)记A 为事件:“一续保人本年度的保费不高于基本保费”,求P (A )的估计值;(2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P (B )的估计值;(3)求续保人本年度的平均保费的估计值.解 (1)事件A 发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50200=0.55,故P (A )的估计值为0.55.(2)事件B 发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30200=0.3,故P (B )的估计值为0.3.(3)由所给数据得调查的200名续保人的平均保费为0.85a ×0.30+a ×0.25+1.25a ×0.15+1.5a ×0.15+1.75a ×0.10+2a ×0.05=1.192 5a .因此,续保人本年度平均保费的估计值为1.192 5a . 思维升华 (1)概率与频率的关系频率反映了一个随机事件出现的频繁程度,频率是随机的,而概率是一个确定的值,通常用概率来反映随机事件发生的可能性的大小,有时也用频率作为随机事件概率的估计值. (2)随机事件概率的求法利用概率的统计定义求事件的概率,即通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数,这个常数就是概率.(2015·北京)某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(1)估计顾客同时购买乙和丙的概率;(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大? 解 (1)从统计表可以看出,在这1 000位顾客中有200位顾客同时购买了乙和丙, 所以顾客同时购买乙和丙的概率可以估计为2001 000=0.2.(2)从统计表可以看出,在这1 000位顾客中,有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品.所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为100+2001 000=0.3.(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1.所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 题型三 互斥事件、对立事件的概率 命题点1 互斥事件的概率例3 袋中有12个小球,分别为红球、黑球、黄球、绿球,从中任取一球,得到红球的概率是13,得到黑球或黄球的概率是512,得到黄球或绿球的概率也是512,试求得到黑球、黄球和绿球的概率各是多少?解 方法一 从袋中选取一个球,记事件“摸到红球”“摸到黑球”“摸到黄球”“摸到绿球”分别为A ,B ,C ,D ,则有 P (A )=13,P (B ∪C )=P (B )+P (C )=512,P (C ∪D )=P (C )+P (D )=512,P (B ∪C ∪D )=P (B )+P (C )+P (D )=1-P (A )=1-13=23,解得P (B )=14,P (C )=16,P (D )=14,因此得到黑球、黄球、绿球的概率分别是14,16,14. 方法二 设红球有n 个,则n 12=13,所以n =4,即红球有4个. 又得到黑球或黄球的概率是512,所以黑球和黄球共5个. 又总球数是12,所以绿球有12-4-5=3(个).又得到黄球或绿球的概率也是512,所以黄球和绿球共5个,而绿球有3个,所以黄球有5-3=2(个).所以黑球有12-4-3-2=3(个). 因此得到黑球、黄球、绿球的概率分别是 312=14,212=16,312=14. 命题点2 对立事件的概率例4 某商场有奖销售中,购满100元商品得1张奖券,多购多得.1 000张奖券为一个开奖单位,设特等奖1个,一等奖10个,二等奖50个.设1张奖券中特等奖,一等奖,二等奖的事件分别为A ,B ,C ,求: (1)P (A ),P (B ),P (C ); (2)1张奖券的中奖概率;(3)1张奖券不中特等奖且不中一等奖的概率. 解 (1)P (A )=11 000,P (B )=101 000=1100, P (C )=501 000=120. 故事件A ,B ,C 的概率分别为11 000,1100,120. (2)1张奖券中奖包含中特等奖,一等奖,二等奖. 设“1张奖券中奖”这个事件为M ,则M =A ∪B ∪C . ∵A ,B ,C 两两互斥,∴P (M )=P (A ∪B ∪C )=P (A )+P (B )+P (C ) =1+10+501 000=611 000.故1张奖券的中奖概率为611 000. (3)设“1张奖券不中特等奖且不中一等奖”为事件N ,则事件N 与“1张奖券中特等奖或中一等奖”为对立事件,∴P (N )=1-P (A ∪B )=1-⎝⎛⎭⎫11 000+1100=9891 000. 故1张奖券不中特等奖且不中一等奖的概率为9891 000.思维升华 求复杂事件的概率的两种方法求概率的关键是分清所求事件是由哪些事件组成的,求解时通常有两种方法: (1)将所求事件转化成几个彼此互斥的事件的和事件,利用概率加法公式求解概率;(2)若将一个较复杂的事件转化为几个互斥事件的和事件时,需要分类太多,而其对立面的分类较少,可考虑利用对立事件的概率公式,即“正难则反”.它常用来求“至少”或“至多”型事件的概率.经统计,在某储蓄所一个营业窗口等候的人数相应的概率如下:求:(1)至多2人排队等候的概率; (2)至少3人排队等候的概率.解 (1)记“无人排队等候”为事件A ,“1人排队等候”为事件B ,“2人排队等候”为事件C ,“3人排队等候”为事件D ,“4人排队等候”为事件E ,“5人及5人以上排队等候”为事件F ,则事件A 、B 、C 、D 、E 、F 彼此互斥. 记“至多2人排队等候”为事件G ,则G =A +B +C , 所以P (G )=P (A +B +C )=P (A )+P (B )+P (C ) =0.1+0.16+0.3=0.56.(2)方法一 记“至少3人排队等候”为事件H , 则H =D +E +F ,所以P (H )=P (D +E +F )=P (D )+P (E )+P (F )=0.3+0.1+0.04=0.44. 方法二 记“至少3人排队等候”为事件H ,则其对立事件为事件G , 所以P (H )=1-P (G )=0.44.21.用正难则反思想求互斥事件的概率典例 (14分)某超市为了了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中一次购物量超过8件的顾客占55%. (1)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;(2)求一位顾客一次购物的结算时间不超过...2分钟的概率.(将频率视为概率)思想方法指导 若某一事件包含的基本事件多,而它的对立事件包含的基本事件少,则可用“正难则反”思想求解. 规范解答解 (1)由已知得25+y +10=55,x +30=45, 所以x =15,y =20.[2分]该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为1×15+1.5×30+2×25+2.5×20+3×10100=1.9(分钟).[7分](2)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,A 1,A 2分别表示事件“该顾客一次购物的结算时间为2.5分钟”,“该顾客一次购物的结算时间为3分钟”,将频率视为概率得P (A 1)=20100=15,P (A 2)=10100=110.[10分]P (A )=1-P (A 1)-P (A 2)=1-15-110=710.[12分]故一位顾客一次购物的结算时间不超过2分钟的概率为710.[14分]1.(2016·宿迁模拟)甲、乙两人下棋,若甲获胜的概率为15,甲、乙下成和棋的概率为25,则乙不输棋的概率为________. 答案 45解析 乙不输棋的概率为1-15=45.2.(教材改编)袋中装有3个白球,4个黑球,从中任取3个球,则①恰有1个白球和全是白球;②至少有1个白球和全是黑球;③至少有1个白球和至少有2个白球;④至少有1个白球和至少有1个黑球.在上述事件中,是对立事件的为________. 答案 ②解析 至少有1个白球和全是黑球不同时发生,且一定有一个发生.∴②中两事件是对立事件.3.(2016·镇江模拟)从一箱产品中随机地抽取一件,设事件A ={抽到一等品},事件B ={抽到二等品},事件C ={抽到三等品},且已知P (A )=0.65,P (B )=0.2,P (C )=0.1,则事件“抽到的产品不是一等品”的概率为________. 答案 0.35解析 ∵“抽到的产品不是一等品”与事件A 是对立事件,∴所求概率P =1-P (A )=0.35. 4.(2016·常州模拟)在一次随机试验中,彼此互斥的事件A ,B ,C ,D 的概率分别是0.2,0.2,0.3,0.3,则下列说法正确的是________.①A +B 与C 是互斥事件,也是对立事件; ②B +C 与D 是互斥事件,也是对立事件; ③A +C 与B +D 是互斥事件,但不是对立事件; ④A 与B +C +D 是互斥事件,也是对立事件. 答案 ④解析 由于A ,B ,C ,D 彼此互斥,且A +B +C +D 是一个必然事件,故其事件的关系可由如图所示的Venn 图表示,由图可知,任何一个事件与其余3个事件的和事件必然是对立事件,任何两个事件的和事件与其余两个事件的和事件也是对立事件,④正确.5.从一篮子鸡蛋中任取1个,如果其重量小于30克的概率为0.3,重量在[30,40]克的概率为0.5,那么重量不小于30克的概率为________.答案0.7解析由互斥事件概率公式知重量大于40克的概率为1-0.3-0.5=0.2,又∵0.5+0.2=0.7,∴重量不小于30克的概率为0.7.6.对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和[25,30)上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为________.答案0.45解析设区间[25,30)对应矩形的高为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45.7.在200件产品中,有192件一级品,8件二级品,则下列事件:①在这200件产品中任意选出9件,全部是一级品;②在这200件产品中任意选出9件,全部是二级品;③在这200件产品中任意选出9件,不全是二级品.其中________是必然事件;________是不可能事件;________是随机事件.答案③②①8.(2016·苏州模拟)已知某运动员每次投篮命中的概率都为40%,现采用随机模拟的方法估计该运动员三次投篮恰有两次命中的概率:先由计算器产生0到9之间取整数值的随机数,指定1,2,3,4表示命中,5,6,7,8,9,0表示不命中;再以每三个随机数为一组,代表三次投篮的结果.经随机模拟产生了如下20组随机数:907966191925271932812458569683 431257393027556488730113537989据此估计,该运动员三次投篮恰有两次命中的概率为________.答案0.25解析20组随机数中表示三次投篮恰好有两次命中的是191,271,932,812,393,其频率为520=0.25,以此估计该运动员三次投篮恰有两次命中的概率为0.25.9.若随机事件A ,B 互斥,A ,B 发生的概率均不等于0,且P (A )=2-a ,P (B )=4a -5,则实数a 的取值范围是________________. 答案 (54,43]解析 由题意可知⎩⎪⎨⎪⎧0<P (A )<1,0<P (B )<1,P (A )+P (B )≤1⇒⎩⎪⎨⎪⎧0<2-a <1,0<4a -5<13a -3≤1,⇒⎩⎪⎨⎪⎧1<a <2,54<a <32,a ≤43⇒54<a ≤43. 10.(2016·江苏苏州五中期中)一个口袋内装有大小相同的红球,白球和黑球,从中摸出一个球,摸出红球或白球的概率为0.58,摸出红球或黑球的概率为0.62,那么摸出红球的概率为________. 答案 0.2解析 记事件A ,B ,C 分别是摸出红球,白球和黑球,则A ,B ,C 互为互斥事件且P (A +B )=0.58,P (A +C )=0.62,所以P (C )=1-P (A +B )=0.42,P (B )=1-P (A +C )=0.38,P (A )=1-P (C )-P (B )=1-0.38-0.42=0.2.11.某保险公司利用简单随机抽样方法,对投保车辆进行抽样,样本车辆中每辆车的赔付结果统计如下:(1)(2)在样本车辆中,车主是新司机的占10%,在赔付金额为4 000元的样本车辆中,车主是新司机的占20%,估计在已投保车辆中,新司机获赔金额为4 000元的概率.解 (1)设A 表示事件“赔付金额为3 000元”,B 表示事件“赔付金额为4 000元”,以频率估计概率得P (A )=1501 000=0.15,P (B )=1201 000=0.12.由于投保金额为2 800元,赔付金额大于投保金额对应的情形是赔付金额为3 000元和4 000元,所以其概率为P (A )+P (B )=0.15+0.12=0.27.(2)设C 表示事件“投保车辆中新司机获赔4 000元”,由已知,样本车辆中车主为新司机的有0.1×1 000=100(辆),而赔付金额为4 000元的车辆中,车主为新司机的有0.2×120=24(辆),所以样本车辆中新司机车主获赔金额为4 000元的频率为24100=0.24,由频率估计概率得P (C )=0.24.12.国家射击队的队员为在射击世锦赛上取得优异成绩,正在加紧备战,经过近期训练,某队员射击一次命中7~10环的概率如下表所示:(1)射中9环或10环的概率; (2)命中不足8环的概率.解 (1)记事件“射击一次,命中k 环”为A k (k ∈N ,k ≤10),则事件A k 之间彼此互斥. 记“射击一次,射中9环或10环”为事件A ,那么当A 9,A 10之一发生时,事件A 发生,由互斥事件的加法公式得P (A )=P (A 9)+P (A 10)=0.28+0.32=0.6.(2)设“射击一次,至少命中8环”的事件为B ,则B 表示事件“射击一次,命中不足8环”. 又B =A 8∪A 9∪A 10,由互斥事件概率的加法公式得 P (B )=P (A 8)+P (A 9)+P (A 10) =0.18+0.28+0.32=0.78.故P (B )=1-P (B )=1-0.78=0.22.因此,射击一次,命中不足8环的概率为0.22.13.一盒中装有12个球,其中5个红球,4个黑球,2个白球,1个绿球.从中随机取出1球,求:(1)取出1球是红球或黑球的概率; (2)取出1球是红球或黑球或白球的概率. 解 方法一 (利用互斥事件求概率) (1)记事件A 1={任取1球为红球},A 2={任取1球为黑球},A 3={任取1球为白球},A 4={任取1球为绿球}, 则P (A 1)=512,P (A 2)=412=13,P (A 3)=212=16,P (A 4)=112.根据题意知,事件A 1,A 2,A 3,A 4彼此互斥,由互斥事件的概率公式,得 取出1球为红球或黑球的概率为 P (A 1∪A 2)=P (A 1)+P (A 2) =512+412=34. (2)取出1球为红球或黑球或白球的概率为 P (A 1∪A 2∪A 3)=P (A 1)+P (A 2)+P (A 3) =512+412+212=1112.方法二(利用对立事件求概率)(1)由方法一知,取出1球为红球或黑球的对立事件为取出1球为白球或绿球,即A1∪A2的对立事件为A3∪A4,所以取出1球为红球或黑球的概率为P(A1∪A2)=1-P(A3∪A4)=1-P(A3)-P(A4)=1-212-112=34.(2)因为A1∪A2∪A3的对立事件为A4,所以P(A1∪A2∪A3)=1-P(A4)=1-112=1112.。
高考数学一轮复习 第十一章 统计与概率 第1讲 抽样方法与总体分布的估计 理(2021年最新整理)
2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高考数学一轮复习第十一章统计与概率第1讲抽样方法与总体分布的估计理的全部内容。
第十一章统计与概率第1讲抽样方法与总体分布的估计一、选择题1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是().A.总体 B.个体是每一个零件C.总体的一个样本 D.样本容量解析200个零件的长度是总体的一个样本.答案C2.用随机数表法从100名学生(其中男生25人)中抽取20人进行评教,某男学生被抽到的概率是( ).A.错误! B。
错误! C.错误! D.错误!解析从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是错误!=错误!。
答案C3.样本中共有五个个体,其值分别为a,0,1,2,3。
若该样本的平均值为1,则样本方差为().A。
错误!B。
错误! C.错误!D.2解析由题可知样本的平均值为1,所以错误!=1,解得a=-1,所以样本的方差为错误![(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2。
答案D4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则().A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9。
高考数学一轮复习 11.2 用样本估计总体 理 苏教版
11.2 用样本估计总体一、选择题1.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是____,____. 解析 平均数增加,方差不变. 答案 62.8,3.62.对某校400 名学生的体重(单位:kg )进行统计,得到如图所示的频率分布直方图,则学生体重在60kg 以上的人数为 人.解析 60kg 以频率为0.04050.01050.25⨯+⨯=,故人数为4000.25100⨯=(人). 答案 1003.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为 . 解析 由题可知样本的平均值为1, 所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2. 答案 24.为了了解某地区10 000名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,请你估计该地区高三男生中体重在[56.5,64.5]的学生人数是 人.解析 依题意得,该地区高三男生中体重在[56.5,64.5]的学生人数是 10 000×(0.03+2×0.05+0.07)×2=4 000. 答案 4 0005.甲、乙两名同学学业水平考试的9科成绩如茎叶图所示,请你根据茎叶图判断谁的平均分高________.(填“甲”或“乙”)解析 由茎叶图可以看出,x 甲=19(92+81+89×2+72+73+78×2+68)=80,x 乙=19(91+83+86+88+89+72+75+78+69)≈81.2, x 乙>x 甲,故乙的平均数大于甲的平均数. 答案 乙6.如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是 .解析 由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162(cm).答案 162 cm7.从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图.根据茎叶图,下列描述正确的是 .①甲种树苗的平均高度大于乙种树苗的平均高度,且甲种树苗比乙种树苗长得整齐 ②甲种树苗的平均高度大于乙种树苗的平均高度,但乙种树苗比甲种树苗长得整齐③乙种树苗的平均高度大于甲种树苗的平均高度,且乙种树苗比甲种树苗长得整齐 ④乙种树苗的平均高度大于甲种树苗的平均高度,但甲种树苗比乙种树苗长得整齐 解析 根据茎叶图计算得甲种树苗的平均高度为27,而乙种树苗的平均高度为30,但乙种树苗的高度分布不如甲种树苗的高度分布集中. 答案 ④8.对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是 .解析 寿命在100~300 h 的电子元件的频率为⎝ ⎛⎭⎪⎫12 000+32 000×100=420=15;寿命在300~600 h 的电子元件的频率为⎝ ⎛⎭⎪⎫1400+1250+32 000×100=45. ∴它们的电子元件数量之比为15∶45=14.答案 149.世界卫生组织(WHO)证实,英国葛兰素史克(GSK)药厂生产的甲型流感疫苗在加拿大种植后造成多人出现过敏症状的情况,下面是加拿大五个地区有过敏症状人数(单位:个)的茎叶统计图,则该组数据的标准差为 8 9 7 9 0 1 3 解析 由茎叶图,得该组数据的平均数为x =90,则该组数据的标准差为 s =15[89-902+87-902+90-902+91-902+93-902=2.答案 210.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.解析 根据样本的频率分布直方图,成绩小于60分的学生的频率为(0.002+0.006+0.012)×10=0.20,所以可推测3 000名学生中成绩小于60分的人数为600名. 答案 60011. 如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.0891035(注:方差2222121()()()n s x x x x x x n⎡⎤=-+-++-⎣⎦L ,其中x 为x 1,x 2,…,x n 的平均数)答案 6.812.某校开展“爱我青岛,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________.解析 当x≥4时,89+89+92+93+92+91+947=6407≠91,∴x<4,则89+89+92+93+92+91+x +907=91,∴x=1.答案 113.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h ,1 020 h ,1 032 h ,则抽取的100件产品的使用寿命的平均值为_______h.解析9801 1 0202 1 0321x 1 013.4⨯+⨯+⨯==答案 1 013二、解答题14.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在[120,130)内的频率;(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+1102=105.)作为这组数据的平均分,据此,估计本次考试的平均分;(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率. 解析 (1)分数在[120,130)内的频率为1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3. (2)估计平均分为x =95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.(3)由题意,[110,120)分数段的人数为60×0.15=9(人).[120,130)分数段的人数为60×0.3=18(人).∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本, ∴需在[110,120)分数段内抽取2人,并分别记为m ,n ;在[120,130)分数段内抽取4人,并分别记为a ,b ,c ,d ;设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,则基本事件共有(m,n),(m,a),…,(m,d),(n,a),…,(n,d),(a,b),…,(c,d)共15种.则事件A包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d)共9种.∴P(A)=915=3 5.15.某制造商3月生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据进行分组,得到如下频率分布表:分组频数频率[39.95,39.97) 10[39.97,39.99) 20[39.99,40.01) 50[40.01,40.03] 20合计100(1)补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图;(2)若以上述频率作为概率,已知标准乒乓球的直径为40.00 mm,试求这批乒乓球的直径误差不超过0.03 mm的概率;(3)统计方法中,同一组数据常用该组区间的中点值(例如区间[39.99,40.01)的中点值是40.00)作为代表.据此估计这批乒乓球直径的平均值(结果保留两位小数).解析(1)频率分布表如下:分组频数频率[39.95,39.97) 10 0.10[39.97,39.99) 20 0.20[39.99,40.01) 50 0.50[40.01,40.03] 20 0.20合计100 1频率颁布直方图如图:(2)误差不超过0.03 mm ,即直径落在[39.97,40.03]内, 其概率为0.2+0.5+0.2=0.9.(3)整体数据的平均值为39.96×0.10+39.98×0.20+40.00×0.50+40.02×0.20=40.00(mm ).16.某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品.现用两种新配方(分别称为A 配方和B 配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A 配方的频数分布表指标值 分组 [90,94) [94,98) [98,102) [102,106)[106,110]频数82042228指标值 分组 [90,94) [94,98) [98,102) [102,106)[106,110]频数412423210(2)已知用B 配方生产的一件产品的利润y(单位:元)与其质量指标值t 的关系式为y =⎩⎪⎨⎪⎧-2,t <94,2,94≤t<102,4,t≥102.估计用B 配方生产的一件产品的利润大于0的概率,并求用B 配方生产的上述100件产品平均一件的利润.解析 (1)由试验结果知,用A 配方生产的产品中优质品的频率为22+8100=0.3,所以用A 配方生产的产品的优质品率的估计值为0.3.由试验结果知,用B 配方生产的产品中优质品的频率为32+10100=0.42,所以用B 配方生产的产品的优质品率的估计值为0.42.(2)由条件知,用B配方生产的一件产品的利润大于0当且仅当其质量指标值t≥94,由试验结果知,质量指标值t≥94的频率为0.96.所以用B配方生产的一件产品的利润大于0的概率估计值为0.96.用B配方生产的产品平均一件的利润为1×[4×(-2)+54×2+42×4]=2.68(元).10017.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.样本频率分布表:(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解析(1)频率分布表:分组 频数 频率 [41,51) 2 230 [51,61) 1 130 [61,71) 4 430 [71,81) 6 630 [81,91) 10 1030 [91,101) 5 530 [101,111]2230(2)频率分布直方图:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115.有26天处于良的水平,占当月天数的1315.处于优或良的天数共有28天,占当有月数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.18.某良种培育基地正在培育一种小麦新品种A ,将其与原有的一个优良品种B 进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427, 430,430,434,443,445,445,451,454;品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403, 406,407,410,412,415,416,422,430. (1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.[思路] (1)按照茎叶图的作法、对照数据解决;(2)根据茎叶图的特点写结论;(3)根据样本数据的平均值和方差作结论,但我们只是对“A与B的亩产量及其稳定性进行比较”,写出比较优劣的结论即可.解析 (1)茎叶图如图所示:(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.(3)通过计算,可以发现品种A的平均每亩产量约为411.1千克,品种B的平均亩产量为397.8千克.由此可知,品种A的平均亩产量比品种B的平均亩产量高.但通过观察茎叶图可知品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近.[点评] 用茎叶图表示数据时,不会损失原始信息,所有的数据信息都可以从茎叶图中得到.因此,可以根据样本数据中的“叶”的分布估计总体分布,但样本数据较多时茎叶图就显得不太方便了.当把数据制成茎叶图后,这组数据中的每一个数据都反映在这个图中,这些数据的分布情况也反映在这个图中,当两组数据的平均水平和稳定性有比较大的差异时,我们也可以从这个图上对两组数据的平均数和方差作出定性的大小判断.。
江苏专用2018版高考数学大一轮复习第十一章概率11.1随机事件的概率课件文
内容索引
基础知识 题型分类
自主学习 深度剖析
课时作业
基础知识
自主学习
知识梳理
1.概率和频率 (1) 在相同的条件 S 下重复 n 次试验,观察某一事件 A 是否出现,称 n 次 试验中事件A出现的次数nA为事件A出现的 频数 , 称 事 件 A 出 现 的 比 nA 例fn(A)=___ n 为事件A出现的 频率 . (2)对于给定的随机事件A,在相同条件下,随着试验次数的增加,事 件A发生的 频率 会在某个常数附近摆动并趋于稳定,我们可以用这个 常数来刻画随机事件A发生的可能性大小,并把这个常数 称 为 随 机 事 件A的概率,记作P(A).
甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最
多购买了2种商品.
所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为
100+200 =0.3. 1 000
(3) 如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的 可能性最大?
解答
与(1)同理,可得:
200 顾客同时购买甲和乙的概率可以估计为 1 000 =0.2,
随机调查了该险种的 200 名续保人在一年内的出险情况,得到如下统
计表: 出险次数 频数 0 60 1 50 2 30 3 30 4 20 ≥5 10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)
的估计值;
解答
事件A发生当且仅当一年内出险次数小于2.
60+50 由所给数据知,一年内出险次数小于 2 的频率为 200 =0.55,
跟踪训练2
(2015· 北京)某超市随机选取1 000位顾客,记录了他们购
买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”
江苏专用2018版高考数学大一轮复习第十章统计10.2用样本估计总体课件文
4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离 . (2)标准差:
1 2 2 2 [ x - x + x - x + „ + x - x ] 1 2 n n s=______________________________________. 1 2 2 2 [( x - x ) + ( x - x ) + „ + ( x - x ) ] 2 1 2 n n (3)方差:s = (xn 是样本数据,
跟踪训练 3
(2016· 全国乙卷 )某公司计划购买 1台机器,该种机器使用三年后
即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备
件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决
策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器 在三年使用期内更换的易损零件数,得以下柱状图:
引申探究
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.
解答
由原题可知x=5, 9+12+15+24+27 则甲组平均数为 =17.4. 5 而乙组平均数为16.8,所以甲组成绩较好.
2.在本例(2)条件下:①求乙组数据的中位数、众数;
解答
由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
答案 解析
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中 的成绩(单位:分).
已知甲组数据的中位数为 15 ,乙组数据的平均数为 16.8 ,则 x , y 的
答案 5,8 值分别为____. 解析
由茎叶图及已知得x=5,又乙组数据的平均数为16.8,
9+15+10+y+18+24 即 = 16.8 ,解得 y = 8. 5
2018高考数学(文)(人教新课标)大一轮复习课件:第十一章 统计 11.1
3.变量的相关性 (1)会做两个有关联变量的数据的散点图,并利用散点图认识 变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数 公式建立线性回归方程(线性回归方程系数公式不要求记忆). 4.统计案例 (1)通过典型案例了解回归分析的思想、方法,并能初步应用 回归分析的思想、方法解决一些简单的实际问题. (2)通过典型案例了解独立性检验的思想、方法,并能初步应 用独立性检验的思想、方法解决一些简单的实际问题.
2.系统抽样 (1)一般地,假设要从容量为 N 的总体中抽取容量为 n 的样本,我们 可以按下列步骤进行系统抽样: ①先将总体的 N 个个体________. 有时可直接利用个体自身所带的 号码,如学号、准考证号、门牌号等; N ②确定分段间隔 k,对编号进行分段.当 (n 是样本容量)是整数时, n N N 取 k= ,如果遇到 不是整数的情况,可以先从总体中随机地剔除几个 n n 个体,使得总体中剩余的个体数能被样本容量整除; ③ 在 第 1 段 用 ______________ 抽 样 方 法 确 定 第 一 个 个 体 编 号 l(l≤k); ④按照一定的规则抽取样本.通常是将 l 加上________得到第 2 个 个体编号________,再________得到第 3 个个体编号________,依次进 行下去,直到获取整个样本.
第十一章 第一章
集合与常用逻辑用语 统 计
考纲链接 11.1 随机抽样
பைடு நூலகம்
1.随机抽样 (1)理解随机抽样的必要性和重要性. (2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体 (1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎 叶图,体会它们各自的特点. (2)理解样本数据标准差的意义和作用,会计算数据标准差. (3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数 字特征,理解用样本估计总体的思想. (5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
苏教版江苏专版版高考数学一轮复习第十一章统计与概率第一节抽样方法用样本估计总体教案文解析版
1.简单随机抽样(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数表法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样的步骤(1)采用随机的方式将总体中的N个个体编号;(2)将编号按间隔k分段,当错误!是整数时,取k=错误!;当错误!不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时取k=错误!,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)按照一定的规则抽取样本,通常将编号为l,l+k,l+2k,…,l+(n—1)k的个体抽出.4.作频率分布直方图的步骤(1)求全距;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.5.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.[提醒] 茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.6.样本的数字特征(1)众数、中位数、平均数(2)标准差、方差1标准差:样本数据到平均数的一种平均距离,一般用s表示,s=错误!.2方差:标准差的平方s2s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2],其中x i(i=1,2,3,…,n)是样本数据,n是样本容量,错误!是样本平均数.[小题体验]1.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3000人,则该校学生总人数是________.解析:设该校学生总人数为n,则1—错误!=错误!,解得n=7 500.答案:7 5002.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:483.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数错误!=错误!=5.1,所以它们的方差s2=错误![(4.7—5.1)2+(4.8—5.1)2+(5.1—5.1)2+(5.4—5.1)2+(5.5—5.1)2]=0.1.答案:0.11.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当错误!不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[小题纠偏]1.已知某商场新进3000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为________.解析:每组袋数:d=错误!=20,由题意知这些号码是以11为首项,20为公差的等差数列.a61=11+60×20=1211.答案:12112.如图是甲、乙两名篮球运动员在五场比赛中所得分数的茎叶图,则在这五场比赛中得分较为稳定(方差较小)的那名运动员得分的方差为________.解析:由茎叶图知,得分较为稳定的那名运动员是乙,他在五场比赛中得分分别为8,9,10,13,15,所以错误!乙=错误!=11,s错误!=错误!×[(8—11)2+(9—11)2+()2+(13—11)2+(15—11)2]=6.8.答案:6.8错误!错误![题组练透]1.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 657208026314070243699728 01983204923449358200 36234869 6938 7481解析:由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案:012.采用系统抽样方法从1000人中抽取50人做问卷调查,将他们随机编号1,2,…,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C 的人数为________.解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d=错误!=20的等差数列{a n},所以通项公式a n=8+20(n—1)=20n—12,令751≤20n—12≤1000,得错误!≤n≤错误!,又因为n∈N*,所以39≤n≤50,所以做问卷C的共有12人.答案:123.(2019·南京调研)某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业中抽取40名学生进行调查,则应从丙专业抽取的学生人数为________.解析:由题意得,应从丙专业抽取的学生人数为40×错误!=16.答案:164.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是________件.解析:设样本容量为x,则错误!×1300=130,所以x=300.所以A产品和C产品在样本中共有300—130=170(件).设C产品的样本容量为y,则y+y+10=170,所以y=80.所以C产品的数量为错误!×80=800(件).答案:800[谨记通法]三种抽样方法的比较分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成错误!错误![典例引领]1.(2019·启东模拟)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x +y的值为________.解析:由茎叶图知,甲组的中位数为65,当乙组的中位数也为65时,y=5,此时乙组的平均数为错误!=66,所以x=66×5—(56+65+62+74+70)=3,所以x+y=8.答案:82.(2018·海安质量测试)某校高一年级共有800名学生,根据他们参加某项体育测试的成绩得到了如图所示的频率分布直方图,则成绩不低于80分的学生人数为________.解析:由题设中提供的频率分布直方图可以看出:不低于80分的学生人数为(0.02+0.01)×10×800=240.答案:2403.(2018·苏州测试)为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,其频率分布直方图如图所示,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数为________.解析:设报考飞行员的学生人数为x,则错误!=(1—0.037×5—0.013×5)×错误!,解得x=48,即报考飞行员的学生人数为48.答案:48[由题悟法]1.茎叶图中的3个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.2.由频率分布直方图进行相关计算时,需掌握的2个关系式(1)错误!×组距=频率.(2)错误!=频率,此关系式的变形为错误!=样本容量,样本容量×频率=频数.[即时应用]1.(2018·苏北四市期末)某次比赛甲得分的茎叶图如图所示,若去掉一个最高分,去掉一个最低分,则剩下4个分数的方差为________.错误!错误!解析:剩下的4个分数是42,44,46,52,则其平均数是46,故方差为错误!×(16+4+0+36)=14.答案:142.随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若该校的学生总人数为3000,则成绩不超过60分的学生人数大约为________.解析:由频率分布直方图知,成绩不超过60分的学生的频率为(0.005+0.01)×20=0.3,所以成绩不超过60分的学生人数大约为0.3×3000=900.答案:900错误!错误![锁定考向]样本的数字特征常与频率分布直方图、茎叶图等知识交汇命题.常见的命题角度有:(1)样本的数字特征与直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题.[题点全练]角度一:样本的数字特征与直方图交汇1.(2019·苏州调研)样本容量为100的频率分布直方图如图所示,根据样本频率分布直方图估计平均数为________ .解析:平均数为错误!×(6×10+20×12+40×14+24×16+10×18)=14.24.答案:14.24角度二:样本的数字特征与茎叶图交汇2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示.则7个剩余分数的方差为________.解析:根据茎叶图,去掉1个最低分87,1个最高分99,则错误![87+94+90+91+90+(90+x)+91]=91,所以x=4.所以s2=错误![(87—91)2+(94—91)2+(90—91)2+(91—91)2+(90—91)2+(94—91)2+(91—91)2]=错误!.答案:错误!角度三:样本的数字特征与优化决策问题3.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799解析:因为错误!甲=错误!乙=9,s错误!=错误!×[(9—10)2+(9—8)2+(9—9)2+(9—9)2+(9—9)2]=错误!,s错误!=错误!×[(9—10)2+(9—10)2+(9—7)2+(9—9)2+(9—9)2]=错误!>s错误!,故甲更稳定.答案:甲[通法在握]1.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.2.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[演练冲关]1.(2019·常州调研)用茎叶图记录甲、乙两名同学高三前5次数学测试的成绩,如图.他们在分析对比成绩变化时,发现乙同学成绩的一个数字看不清楚了.若已知乙的平均成绩低于甲的平均成绩,则看不清楚的数字为________.解析:甲的平均成绩为错误!×(99+100+101+102+103)=101,设看不清楚的数字为x,则由题意得错误!×(93+94+97+110+110+x)<101,解得x<1.因为x≥0,x∈N,所以x=0,即看不清楚的数字为0.答案:02.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析:不妨设样本数据为x1,x2,x3,x4,x5,且x1<x2<x3<x4<x5,则由样本方差为4,知(x1—7)2+(x2—7)2+(x3—7)2+(x4—7)2+(x5—7)2=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x1=4,x2=6,x3=7,x4=8,x5=10;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.答案:10一抓基础,多练小题做到眼疾手快1.(2019·南通中学高三学情调研)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为________.解析:由题意知错误!=错误!,解得z=400.答案:4002.(2018·泰州调研)某校在高三年级的1000名学生中随机抽出100名学生的数学成绩作为样本进行分析,得到样本频率分布直方图如图所示,则估计该校高三学生中数学成绩在[110,140)之间的人数为________.解析:由样本频率分布直方图知该校高三学生中数学成绩在[110,140)之间的频率为(0.02+0.026+0.02)×10=0.66,所以估计该校高三学生中数学成绩在[110,140)之间的人数为1000×0.66=660.答案:6603.某校高三年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为研究血型与色弱之间的关系,现用分层抽样的方法从这500名学生中抽取一个容量为60的样本,则应抽取________名血型为AB的学生.解析:在整个抽样过程中,每个个体被抽到的概率为错误!=错误!,所以血型为AB的学生应抽取的人数为50×错误!=6.答案:64.已知一组数据:87,x,90,89,93的平均数为90,则该组数据的方差为________.解析:由题意知错误!×(87+x+90+89+93)=90,解得x=91,所以方差s2=错误!×[(87—90)2+(91—90)2+(90—90)2+(89—90)2+(93—90)2]=4.答案:45.(2019·启东第一中学月考)某厂共有1000名员工,准备选择50人参加技术评估,现将这1000名员工编号为1到1000,准备用系统抽样的方法抽取.已知随机抽取到的员工最小的编号是15,那么抽取到的员工最大的编号是________.解析:样本间隔为1000÷50=20,∵随机抽取到的最小的编号是15,∴在抽取到的员工中最大的编号是15+49×20=995.答案:9956.(2018·苏州期末)若一组样本数据9,8,x,10,11的平均数为10,则该组样本数据的方差为________.解析:由错误!=10,得x=12,故方差s2=错误!=2.答案:2二保高考,全练题型做到高考达标1.(2018·通州期末)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,则x的值为________.答案:72.(2019·如皋检测)从编号为01,02,…,50的50个产品中用系统抽样的方法抽取一个样本,已知样本中的前两个编号分别为03,08(编号按从小到大的顺序排列),则样本中最大的编号是________.解析:由题意知,抽样间隔是5,∴样本中最大的编号是3+5×9=48.答案:483.(2018·南京学情调研)为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.解析:根据频率分布直方图得,时速在区间[40,60)内的频率为(0.01+0.03)×10=0.4,故时速在区间[40,60)内的汽车有0.4×200=80(辆).答案:804.用分层抽样的方法从某高中学生中抽取一个容量为45的样本,其中高一年级抽20人,高三年级抽10人,已知该校高二年级共有学生300人,则该校学生的总人数为________.解析:样本中高二年级抽45—20—10=15(人),设该校学生的总人数为n,则错误!=错误!,所以n=900.答案:9005.(2018·扬州期末)某学校从高三年级共800名男生中随机抽取50名测量身高.根据测量结果可知被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组[155,160),第二组[160,165),…,第八组[190,195].按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高在180 cm以上(含180 cm)的人数为________.解析:这所学校高三年级全体男生身高在180 cm以上(含180 cm)的频率为1—(0.008+0.016+0.04+0.04+0.06)×5=1—0.82=0.18,所以全体男生身高在180 cm以上(含180 cm)的人数为0.18×800=144.答案:1446.(2019·海门中学检测)已知数据x1,x2,…,x10的均值为2,标准差为s,又知数据3x1+2,3x2+2,…,3x10+2的方差为27,则s=________.解析:∵数据x1,x2,…,x10的均值为2,标准差为s,数据3x1+2,3x2+2,…,3x10+2的方差为27,∴9s2=27,解得s=错误!.答案:错误!7.已知x是1,2,3,x,5,6,7这七个数据的中位数且1,2,x2,—y这四个数据的平均数为1,则y—错误!的最小值为________.解析:由题意1+2+x2—y=4,所以y=x2—1.由中位数定义知,3≤x≤5,所以y—错误!=x2—1—错误!.当x∈[3,5]时,函数y=x2—1与y=—错误!均为增函数,所以y=x2—1—错误!在[3,5]上为增函数,所以错误!min=8—错误!=错误!.答案:错误!8.(2018·南通调研)为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为________.解析:由茎叶图可知,在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×错误!=160.答案:1609.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373x y男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解:(1)因为错误!=0.19,所以x=380.(2)初三年级人数为y+z=2000—(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:错误!×500=12(名).10.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值.(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分.(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5解:(1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,因此a=0.005.(2)估计这次成绩的平均分错误!=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.所以数学成绩在[50,90)之外的人数有100—(5+20+40+25)=10(人).三上台阶,自主选做志在冲刺名校1.(2018·苏州测试)已知等差数列{a n}的公差为d,若a1,a2,a3,a4,a5的方差为8,则d =________.解析:因为数列{a n}为等差数列,所以a1,a2,a3,a4,a5的平均数为a3,所以方差为错误![(—2d)2+(—d)2+0+d2+(2d)2]=2d2=8,解得d=±2.答案:±22.一组数据是19,20,x,43,已知这组数据的平均数是整数,且24<x<28,则这组数据的方差为________.解析:因为错误!(19+20+x+43)=错误!为整数,且24<x<28,所以x=26,所以这组数据的平均数为错误!=27,方差为错误![(19—27)2+(20—27)2+(26—27)2+(43—27)2]=错误!(64+49+1+256)=错误!×370=92.5.答案:92.53.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等,试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1—0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100—100×0.9—5=5.所以总体中分数在区间[40,50)内的人数估计为400×错误!=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×错误!=30.所以样本中的男生人数为30×2=60,女生人数为100—60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.。
高考数学一轮复习 第十一章 统计 11.2 用样本估计总体课件 理
2021/12/8
第二页,共三十二页。
2.用样本的数字特征估计总体的数字特征
(1)众数,中位数,平均数
众数:在一组数据中,出现次数________的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或
者最中间两个数据的________)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即 x=______________.
第第十一一章章
集合统与常用逻计辑(luójí)用语
11.2 用样本估计(gūjì)总体
2021/12/8
第一页,共三十二页。
1.用样本的频率分布估计总体分布 (1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________ 估计总体的__________;另一种是用样本的________估计总体的__________. (2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用 ________________表示.各小长方形的面积总和等于________. (3) 连 接频率 分布 直方图中 各小 长方形 上端的 中点 ,就 得到频 率分 布 ________.随着样本容量的增加,作图时所分的________增加,组距减小,相 应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________, 它能够更加精细地反映出____________________________________. (4) 当 样本数 据较 少时,用 茎叶 图表示 数据的 效果 较好 ,它不 但可 以 ____________________,而且可以______________,给数据的记录和表示都带 来方便.
(3)s= s2= 1900=130,
江苏2018届高考数学总复习专题11.2统计与统计案例试题含解析
专题11.2 统计与统计案例【三年高考】1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取▲ 件.【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18.【考点】分层抽样【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6【解析】46587666x+++++==【考点定位】平均数4. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】【考点】 折线图【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】试题分析:由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.【考点】线性相关与线性回归方程的求法与应用.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】 试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B【考点】样本特征数【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平; 中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】【考点】茎叶图、样本的数字特征【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中︒,B 月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C︒.下面叙述不正确的是.点表示四月的平均最低气温约为5C︒以上②七月的平均温差比一月的平均温差大①各月的平均最低气温都在0C︒的月份有5个③三月和十一月的平均最高气温基本相同④平均气温高于20C【答案】④【解析】︒均在虚线框内,所以各月的平均最低气温都在0℃以上,①正确;由试题分析:由图可知0C图可在七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在5C ︒,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确. 考点:1、平均数;2、统计图.【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).【答案】1.76【解析】试题分析:将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.考点:中位数的概念.【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力. 10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.【答案】①16;②29C BA139142考点: 统计分析【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下 08 9 12 5 8 20 0 3 3 8 3 1 2则这组数据中的中位数是 .【答案】20【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .(高中部)(初中部)男男女女60%70%【答案】137 【解析】由图可知该校女教师的人数为11070%150(160%)7760137⨯+⨯-=+=.13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】169【解析】设这批米内夹谷的个数为x ,则由题意并结合简单随机抽样可知,282541534x =,即281534169254x =⨯≈. 14.【2015高考广东,文12】已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,所以样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为2125111x +=⨯+=,所以答案应填:11.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .【答案】乙;数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(I )估计顾客同时购买乙和丙的概率;(II )估计顾客在甲、乙、丙、丁中同时购买中商品的概率;(III )如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? (Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=,顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中x 的值是0.0075(2)月平均用电量的众数是2202402302+=,因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户,抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户【2018年高考命题预测】概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .【答案】155;156.8【解析】根据中位数的定义知中位数由200.005200.0150.0200.5m ⨯+⨯+⨯=,解得5m =,所以中位数为:1505155+=;平均数为:1200.0051400.0151600.0201800.0052000.0032200.002156.8⨯+⨯+⨯+⨯+⨯+⨯=,所以答案为:155;156.8.2.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户? 【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中的值是0.0075.(2)月平均用电量的众数是2202402302+=;因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224.【考点2】相关性、最小二乘估计与统计案例 【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关. 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用表达式[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为:∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a ).其中x =1n ∑i =1nx i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心.(3)相关系数①1()()nniii x x y y x yn x yr -------==∑∑r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. 4.独立性检验(1)设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1. 2×2列联表构造一个随机变量2()()()()()n ad bc K a b c d a c b d -=++++其中d c b a n +++=为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验. (3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;②当χ2>2.706时,有90%的把握判定变量A ,B 有关联; ③当χ2>3.841时,有95%的把握判定变量A ,B 有关联; ④当χ2>6.635时,有99%的把握判定变量A ,B 有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.3.正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键.回归直线方程y =bx +a 必过样本点中心(x ,y ).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算2K 值,2K 值越大,说明“两个变量有关系”的可能性越大. 【考点针对训练】1.已知x 、y 的取值如下表所示,若y 与x 线性相关,且yˆ=0.95x +,则=____________.【答案】6.2 【解析】244310=+++=x ,5.447.68.43.42.2=+++=y ,样本中心点,在回归直线上,所以代入aˆ295.05.4+⨯=,所以6.2ˆ=a 2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:22n(ad bc )K (a b )(c d )(a c )(b d )-=++++参照附表,在如下结论:A .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 中正确的是 . 【答案】C【解析】由表计算得:22100(45153010)==3.0355457525K ⨯-⨯⨯⨯⨯,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C .【两年模拟详解析】1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________. 【答案】 (或5.2)【解析】2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数x ,则x 的值为 .【答案】19.7 【解析】3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据12345,,,,x x x x x 的方差23s =,则样本数据123452,2,2,2,2x x x x x 的方差为 ▲ . 【答案】12【解析】由题意得方差为2224312s =⨯=4. 【2017年第三次全国大联考江苏卷】已知样本7,8,9,,x y 的平均数为,且60xy =,则此样本的方差为_____________. 【答案】2 【解析】因为78985x y++++=,所以16x y +=,而60xy =,所以610x y =⎧⎨=⎩或106x y =⎧⎨=⎩,从而样本的方差为22221[(1)01(2)2]25⨯-+++-+=.5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为9,11,10,8,12,则这组数据的标准差为_______. 【答案】2【解析】因为这组数据的平均数是10591110812=++++=x ,所以其方差25)109()1011()1010()108()1012(222222=-+-+-+-+-=s ,故所求这组数据的标准差2=s .6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在h km /9050-的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在h km /70以下的汽车有 辆.)【答案】75【解析】由频率分布直方图得,速度在h km /70以下的汽车所占频率为(0.020.03)100.5+⨯=,则速度在h km /70以下的汽车有1500.575⨯=辆7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.【答案】40【解析】(0.0550.0250.015)10040⨯+⨯+⨯⨯=.8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm 和195cm 之间,将测量结果按如下方式分成八组:第一组[)160155,、第二组[)165160,、……、第八组[]195190,. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm 以上(含180cm )的人数为 .【答案】144【解析】由图得,身高180cm 以上(含180cm )的频率为()150.0080.0160.0420.060.18-⨯++⨯+=,则人数为8000.18144⨯=9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 . 【答案】17【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 . 【答案】2【解析】由题意得12x =,因此方差为221(12201)25++++=11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h ~120km/h ,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.【答案】1700【解析】2000(0.0350.030.02)101700⨯++⨯=12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .【答案】【解析】950)002.0004.0(30=⨯+⨯13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出人.【答案】25⨯⨯=【解析】由题意得:0.00055001002514.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:则甲、乙两位选手中成绩最稳定的选手的方差是.【答案】0.02【一年原创真预测】1. 以下四个命题中:R的值判断模型的拟合效果, 2R越大,模型的拟合效果越①在回归分析中,可用相关指数2好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③若数据123,,n x x x x 的方差为1,则1232,2,22n x x x x 的方差为2;④对分类变量与y 的随机变量2k 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为 . 【答案】2【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.2.某单位为了了解某办公楼用电量y (度)与气温x (oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:得到的回归方程为a bx y+=ˆ,则a 0,b 0. 【答案】>,<【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题. 3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:。
2018版高考数学大一轮复习第十一章统计与统计案例113变量间的相关关系统计案例课件理
×
考点自测
1.(2015·湖北)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关
答案
解析
D.x与y负相关,x与z正相关
因为y=-0.1x+1,-0.1<0,所以x与y负相关. 又y与z正相关,故可设z=by+a(b>0), 所以z=-0.1bx+b+a,-0.1b<0,所以x与z负相关.故选C.
n
∑ xi- x 2
i=1
n
∑ yi- y 2
i=1
n
xi yi n x y
i=1
n
n
xi2 n x 2
yi2 n y 2
i=1
i=1
②当r>0时,表明两个变量
;
正相关
当r<0时,表明两个变量
;
当r=0时,表明两个变量
负.相关
|r|值越接近于1,表明两个变量之间的线性相关程度
.
|r|值越接近于0,表明两个变量之间的线性相关程度线越性低不.相关
①y与x负相关且y=2.347x-6.423;
②y与x负相关且y=-3.476x+5.648;
③y与x正相关且y=5.437x+8.493;
④y与x正相关且y=-4.326x-4.578.
其中一定不正确的结论的序号是
A.①②
B.②③
C.③④
D.①④
答案
解析
(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.
思维升华
跟踪训练2 (2015·课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传 费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和 年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
2018版高考数学(理)一轮复习文档:第十一章统计与概率11.3含解析
1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程错误!=错误!x+错误!是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中a,^,错误!是待定参数.错误!3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(错误!,错误!)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r〈0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K2=错误!,其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系"的方法称为独立性检验.【思考辨析】判断下列结论是否正确(请在括号中打“√"或“×")(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √)(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程错误!=-2。
2018版高考数学(理)一轮复习文档:第十一章统计与概率11.1含解析
1.简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样方法有两种--抽签法和随机数法.2.系统抽样的步骤一般地,假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段.当错误!(n是样本容量)是整数时,取k=错误!;(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.【思考辨析】判断下列结论是否正确(请在括号中打“√"或“×”)(1)简单随机抽样是一种不放回抽样.(√)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)抽签法中,先抽的人抽中的可能性大.(×)(4)系统抽样在第1段抽样时采用简单随机抽样.( √)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案C解析根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法Ⅱ。
(江苏专用)2018版高考数学大一轮复习第十一章概率11.2古典概型课件文苏教版
概型.
1
答案
解析
①中,硬币质地不均匀,不是等可能事件,
所以不是古典概型;
②④的基本事件都不是有限个,不是古典概型;
③符合古典概型的特点,是古典概型.
题型二 古典概型的求法 例2 (1)(2015· 江苏)袋中有形状、大小都相同的4只球,其中1只白球,
1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的 5 6 . 答案 解析 概率为___ 设取出的2只球颜色不同为事件A.
解答
这个试验的基本事件为
(1,1),(1,2),(1,3),(1,4), (2,1),(2,2),(2,3),(2,4), (3,1),(3,2),(3,3),(3,4), (4,1),(4,2),(4,3),(4,4).
②事件“出现点数之和大于3”包含的基本事件;
解答
事件“出现点数之和大于3”包含的基本事件为 (1,3),(1,4),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3), (3,4),(4,1),(4,2),(4,3),(4,4).
§11.2 古典概型
内容索引
基础知识 题型分类
自主学习 深度剖析
课时作业
基础知识
自主学习
知识梳理
1.基本事件的特点
(1)任何两个基本事件是互斥 的;
(2)任何事件(除不可能事件)都可以表示成 基本事件 的和.
2.古典概型
古典概率模型 ,简称古典概型. 具有以下两个特点的概率模型称为
(1)所有的基本事件只有有限 个;
解答
由于共有11个球,且每个球有不同的编号,故共有11种不同的摸法.
又因为所有球大小相同,因此每个球被摸中的可能性相等,故以球
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
①数据x1+a,x2+a,„,xn+a的方差也为s2;
②数据ax1,ax2,„,axn的方差为a2s2.
思考辨析 判断下列结论是否正确(请在括号中打“√”或“×”) (1) 平 均 数 、 众 数 与 中 位 数 从 不 同 的 角 度 描 述 了 一 组 数 据 的 集 中 趋
势.( √ )
(2) 一组数据的众数可以是一个或几个,那么中位数也具有相同的结
4.(2016· 江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 ____. 0.1
答案 解析
4.7+4.8+5.1+5.4+5.5 x= = 5.1 , 5 1 2 则方差 s = 5 [(4.7- 5.1)2+ (4.8- 5.1)2+ (5.1- 5.1)2+ (5.4- 5.1)2+
跟踪训练 3
(2016· 全国乙卷 )某公司计划购买 1台机器,该种机器使用三年后
即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备
件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决
策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器 在三年使用期内更换的易损零件数,得以下柱状图:
(5.5-5.1)2] =0.1.
5.(2017· 扬州质检)为了了解一片经济林的生长情况,随机抽测了其中 60株树木的底部周长 (单位:cm) ,所得数据均在区间[80,130]上,其 24 株树木 频率分布直方图如图所示,则在抽测的60株树木中,有_____ 的底部周长小于100 cm.
答案 解析
价格为4元/立方米,w至少定为多少?
解答
如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×
0.5=0.85.
∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计 该市居民该月的人均水费.
(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
①分别求出两人得分的平均数与方差; 解答
②根据图和上面算得的结果,对两人的训练成绩作出评价.
解答
思维升华
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它
们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其
集中趋势,方差和标准差描述其波动大小.
且易知y=3,∴x-y=-3.
(2)(2016· 盐城模拟)如图所示是某学校一名篮球运动员在五场比赛中所 6.8 得分数的茎叶图,则该运动员在这五场比赛中得分的方差为____.
答案 解析
由茎叶图可得该运动员得分的平均数为
8+9+10+13+15 =11, 5 8-112+9-112+10-112+13-112+15-112 则方差为 = 6.8. 5
n 是样本容量, x 是样本平均数).
知识拓展
1.频率分布直方图的特点
频率 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示 , 组距 频率 频率=组距× . 组距
(2)频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方
图中组距是一个固定值,所以各小长方形高的比也就是频率比.
题型三 用样本的数字特征估计总体的数字特征 例3 (1)(2017· 南京模拟)抽样统计甲、乙两位射击运动员的5次训练成
绩(单位:环),结果如下: 运动员
甲
第1次
87
第2次
91
第3次
90
第4次
89
第5次Leabharlann 93乙8990
91
88
92
2 则成绩较为稳定(方差较小)的那位运动员成绩的方差为___.
答案 解析
§11.2 用样本估计总体
内容索引
基础知识 题型分类
自主学习 深度剖析
课时作业
基础知识
自主学习
知识梳理
1.作频率分布直方图的步骤 (1)求极差(即一组数据中 最大值 与最小值的差). (2)决定组距与组数 . (3)将数据分组 . (4)列 频率分布表 . (5)画 频率分布直方图 .
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的 中点 顺次连结起来,就得到频率分布折线图. (2)总体分布的密度曲线:将 样本容量 取得足够大,分组的组距取得 足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线 为总体分布的密度曲线. 3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列 数,叶就是从茎的旁边生长出来的数.
图①
B地区用户满意度评分的频数分布表
满意度评分分组 [50,60) 频数 2
[60,70) 8
[70,80) 14
[80,90) 10
[90,100] 6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方
图比较两地区满意度评分的平均值及分散程度 (不要求计算出具体值,
给出结论即可).
答案 解析
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中 的成绩(单位:分).
已知甲组数据的中位数为 15 ,乙组数据的平均数为 16.8 ,则 x , y 的
答案 5,8 值分别为____. 解析
由茎叶图及已知得x=5,又乙组数据的平均数为16.8,
9+15+10+y+18+24 即 = 16.8 ,解得 y = 8. 5
故中位数为18,众数为18.
②求乙组数据的方差.
解答
s2=
1 [(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76. 5
思维升华
茎叶图的优缺点 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类 似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没 有任何信息损失,第二点是茎叶图便于记录和表示 .其缺点是当样本容 量较大时,作图较烦琐.
4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离 . (2)标准差:
1 2 2 2 [ x - x + x - x + „ + x - x ] 1 2 n n s=______________________________________. 1 2 2 2 [( x - x ) + ( x - x ) + „ + ( x - x ) ] 2 1 2 n n (3)方差:s = (xn 是样本数据,
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易
损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
解答
当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
题型分类
深度剖析
题型一 频率分布直方图的绘制与应用
例1
(2016· 北京)某市居民用水拟实行阶梯水价,每人月用水量中不超
过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方
米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,
整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水
3 800,x≤19, y= (x∈N). 500x-5 700,x>19
跟踪训练2
(1)(2016· 连云港模拟 ) 一次数学考试后,某老师从自己所
带的两个班级中各抽取 5 人,记录他们的考试成绩,得到如图所示的
茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位
-3 数为73,则x-y的值为_____.
答案 解析
72+77+80+x+86+90 由题意得, =81⇒x=0, 5
引申探究
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.
解答
由原题可知x=5, 9+12+15+24+27 则甲组平均数为 =17.4. 5 而乙组平均数为16.8,所以甲组成绩较好.
2.在本例(2)条件下:①求乙组数据的中位数、众数;
解答
由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
2.(2015· 陕西改编 ) 某中学初中部共有 110 名教师,高中部共有 150 名教 137 师,其性别比例如图所示,则该校女教师的人数为____.
答案 解析
由题干扇形统计图可得该校女教师人数为110×70%+150×(1-60%)
=137.
3.(2016· 宿迁模拟)若数据x1,x2,x3,„,xn的平均数为 x =5,方差s2 =2,则数据3x1+1,3x2+1,3x3+1,„,3xn+1的平均数和方差分别为 16,18 答案 _______.
考点自测
1. (教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示, 91.5和91.5 则这组数据的中位数和平均数分别是__________.
答案 解析
这组数据由小到大排列为87,89,90,91,92,93,94,96,
91+92 ∴中位数是 2 =91.5, 87+89+90+91+92+93+94+96 平均数 x = = 91.5. 8
解析
∵x1,x2,x3,„,xn的平均数为5,
x1+x2+x3+„+xn ∴ = 5 , n 3x1+3x2+3x3+„+3xn ∴ + 1 = 3 × 5 + 1 = 16 , n
∵x1,x2,x3,„,xn的方差为2, ∴3x1+1,3x2+1,3x3+1,„,3xn+1的方差是32×2=18.