2019届高考数学大一轮复习第十一章统计与统计案例11.1学案理北师大版

合集下载

北师大版版高考数学一轮复习算法初步统计与统计案例统计图表用样本估计总体教学案理解析版

北师大版版高考数学一轮复习算法初步统计与统计案例统计图表用样本估计总体教学案理解析版

[考纲传真] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.常用统计图表(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=错误!;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.横轴表示样本数据,纵轴表示错误!,每个小矩形的面积表示样本落在该组内的频率.(3)频率分布折线图和总体密度曲线1频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(4)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将各个数据的茎按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!=错误!称为x1,x2,…,x n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!;s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2].错误!1.频率分布直方图中各小矩形的面积之和为1.2.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.3.若数据x1,x2,…,x n的平均数为错误!,方差为s2,则数据mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m错误!+a,方差为m2s2.[基础自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.()[答案] (1)√(2)×(3)√(4)×2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数B[标准差反映样本数据的离散波动大小,故选B.]3.数据1,3,4,8的平均数与方差分别是()A.2,2.5B.2,10.5C.4,2D.4,6.5D[平均数为错误!=4,方差为错误!=6.5.]4.某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5D.119.5B[22次考试中,所得分数最高的为98,最低的为56,所以极差为98—56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.]5.(教材改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.48 [由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人). ]样本的数字特征的计算与应用1.在某次测量中,得到的A样本数据为81,82,82,84,84,85,86,86,86,若B样本数据恰好是A样本数据分别加2后所得的数据,则A,B两个样本的下列数字特征对应相同的是()A.众数B.平均数C.标准差D.中位数C[由题意可得A,B两组数据的众数分别是86和88,排除A;B组数据的平均数比A组数据的平均数大2,排除B;B组数据的中位数比A组数据的中位数大2,排除D;A,B两组数据的标准差相同,C正确,故选C.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差C[根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况为5环、5环、5环、6环、9环.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!=2,乙的成绩的方差为错误!=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C正确,故选C.]3.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4D[由题意可知错误!∴错误!∴(x+y)2=x2+y2+2xy,即208+2xy=400,∴xy=96.∴(x—y)2=x2+y2—2xy=16,∴|x—y|=4,故选D.][规律方法] 众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=错误![(x错误!+x错误!+…+x错误!)—n错误!2],或写成s2=错误!(x错误!+x错误!+…+x错误!)—错误!2,即方差等于原数据平方的平均数减去平均数的平方.【例1】某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产量的数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出品种A与B亩产量数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.[解] (1)画出茎叶图如图所示.(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.(3)通过观察茎叶图可以看出:1品种A的亩产量的平均数(或均值)比品种B高;2品种A的亩产量的标准差(或方差)比品种B大,故品种A的亩产量的稳定性较差.[规律方法] 茎叶图中的两个关注点(1)重复出现的数据要重复记录,不能遗漏.(2)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.易错警示:茎叶图中数字大小排列不一定从小到大排列,一定要看清楚.气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)(2)如图所示的茎叶图是甲、乙两位选手在某次比赛中的比赛得分,则下列说法正确的是()A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的平均数等于乙的中位数(1)146 (2)C[(1)该样本中AQI大于100的频数是4,频率为错误!,由此估计该地全年AQI大于100的频率为错误!,估计此地该年AQI大于100的天数约为365×错误!=146.(2)由茎叶图可知,错误!甲=错误!×(59+45+32+38+24+26+11+12+14)=29,错误!乙=错误!×(51+43+30+34+20+25+27+28+12)=30,s错误!=错误!×(302+162+32+92+52+32+182+172+152)≈235.3,s错误!=错误!×(212+132+02+42+102+52+32+22+182)≈120.9,甲的中位数为26,乙的中位数为28.所以甲的方差大于乙的方差.故选C.]频率分布直方图【例2】某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240]的用户中应抽取多少户?[解] (1)(0.002+0.009 5+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.007 5.即直方图中x的值为0.007 5.(2)月平均用电量的众数是错误!=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.0125)×20=0.7>0.5,∴月平均用电量的中位数在[220,240)内.设中位数为a,则0.45+0.0125×(a—220)=0.5,解得a=224,即中位数为224.(3)月平均用电量在[220,240]的用户有0.0125×20×100=25(户).同理可得月平均用电量在[240,260)的用户有15户,月平均用电量在[260,280)的用户有10户,月平均用电量在[280,300]的用户有5户,故抽取比例为错误!=错误!.∴月平均用电量在[220,240)的用户中应抽取25×错误!=5(户).[规律方法] 频率、频数、样本容量的计算方法(1)错误!×组距=频率.(2)错误!=频率,错误!=样本容量,样本容量×频率=频数.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125]频数62638228(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?[解] (1)如图所示:(2)质量指标值的样本平均数为错误!=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(—20)2×0.06+(—10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.1.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了1月至12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A[对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A[设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.]。

2019届一轮复习北师大版 统计与统计案例 课件( 51张)

2019届一轮复习北师大版    统计与统计案例    课件(  51张)

(2)独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表 是:
y1 x1 x2 a c
y2 b d
总计 a+b c+d
总计
2
a+c
b+d
n
n(ad-bc)2 则K= (其中 n=a+b+c+d (a+b)(c+d)(a+c)(b+d) 为样本容量).
热点一 抽样方法
∴有 99%的把握认为箱产量与养殖方法有关.
(3) 由箱产量的频率分布直方图可知,旧养殖法的箱产量平均值 (或中位
数)约在45~50 kg之间,新养殖法的箱产量平均值(或中位数)约在50~ 55 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法分布集中程
度高,可知新养殖法的箱产量高且稳定,从而新养殖法优于旧养殖法.
i 1 i =1 10 10
生的脚长为 24,据此估计其身高为( C ) A.160 C.166 B.163 D.170
解析
由已知得 x =22.5, y =160,


- - ^=4, ∵回归直线方程过样本点中心( x , y ),且b
^,解得a ^=70. ∴160=4×22.5+a ∴回归直线方程为^ y=4x+70,当 x=24 时,^ y=166.
- 1 (3)平均数:样本数据的算术平均数,即 x =n(x1+x2+„+xn).
(4)方差与标准差. 1 - - - s2=n[(x1- x )2+(x2- x )2+„+(xn- x )2], s= 1 - 2 - 2 - 2 [ ( x 1- x ) +(x2- x ) +„+(xn- x ) ]. n
D.平均最高气温高于20 ℃的月份有5个
解析
根据雷达图可知全年最低气温都在 0 ℃ 以上,故A正确;一月平

高考数学一轮复习第十一章统计与统计案例第一节随机抽样课件文北师大版

高考数学一轮复习第十一章统计与统计案例第一节随机抽样课件文北师大版

件.
【解析】所求件数为60× 3 0 0 =18,故答案为18.
1000
答案:18
必备知识·自主学习
休息时间到啦
同学们,下课休息十分钟。现在是休息时间,你们休息 一下眼睛,
看看远处,要保护好眼睛哦~站起来动一动,久坐对身 体不好哦~
结束语
同学们,你们要相信梦想是价值的源泉,相信成 功的信念比成功本身更重要,相信人生有挫折没 有失败,相信生命的质量来自决不妥协的信念, 考试加油。
【知识点辨析】 (正确的打“√”,错误的打“×”) (1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关. ( )
(2)系统抽样在起始部分抽样时采用简单随机抽样.( ) (3)分层抽样中,每个个体被抽到的可能性与层数及分层有关. ( ) (4)要从2 021个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除1 个学生,这样对被剔除者不公平. ( )
复习课件
高考数学一轮复习第十一章统计与统计案例第一节随机抽样课件文北师大版
2021/4/17
高考数学一轮复习第十一章统计与统计案例第一节随机抽样课件
1
随 机 抽 样
内容索引
必备知识·自主学习 核心考点·精准研析 核心素养测评
【教材·知识梳理】 1.简单随机抽样 (1)定义:设一个总体含有N个个体,从中_逐__个__不__放__回__地__抽__取__n个个体作为样本 (n≤N),如果每次抽取时总体内的各个个体被抽到的机会都_相__等__,就把这种抽样 方法叫作简单随机抽样. (2)常用方法:_抽__签__法__和_随__机__数__法__.
提示:(1)×.简单随机抽样过程中每个个体被抽到的概率相等,若样本容量为n, 总体容量为N,每个个体被抽到的概率是 n .

近年届高考数学大一轮复习第十一章统计与统计案例第1讲抽样方法练习理北师大版(2021年整理)

近年届高考数学大一轮复习第十一章统计与统计案例第1讲抽样方法练习理北师大版(2021年整理)

2019届高考数学大一轮复习第十一章统计与统计案例第1讲抽样方法练习理北师大版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019届高考数学大一轮复习第十一章统计与统计案例第1讲抽样方法练习理北师大版)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019届高考数学大一轮复习第十一章统计与统计案例第1讲抽样方法练习理北师大版的全部内容。

第1讲抽样方法一、选择题1.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是( )A。

系统抽样B。

分层抽样C。

简单随机抽样D。

非以上三种抽样方法解析符合系统抽样的特征。

答案A2。

为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )A。

简单随机抽样 B.按性别分层抽样C.按学段分层抽样 D.系统抽样解析不同的学段在视力状况上有所差异,所以应该按照学段分层抽样。

答案C3.(2017·南昌一中测试)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100 B。

150 C.200 D。

250解析法一由题意可得错误!=错误!,解得n=100。

法二由题意,抽样比为错误!=错误!,总体容量为3 500+1 500=5 000,故n=5 000×错误!=100.答案A4.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B。

高三数学一轮复习 11-1统计、统计案例 (北师大版)

高三数学一轮复习 11-1统计、统计案例 (北师大版)

上页
下页
末页
第二章 函数与基本初等函数
基础自测
1.(2010·四川文)一个单位职工800人,其中具有高级
职称的160人,具有中级职称的320人,具有初级职称的
200人,其余人员120人,为了解职工收入情况,决定采用
分层抽样的方法,从中抽取容量为40的样本,则从上述各
层中依次抽取的人数分别是( )
A.12,24,15,9
首页
上页
下页
末页
第二章 函数与基本初等函数
(4)独立性检验的一般步骤 ①根据样本数据制成 2×2 列联表. ②根据公式 χ2=a+ban+adc-bb+cd2 c+d,计算 χ2 的值. ③比较 χ2 与临界值的大小关系作统计推断.
首页
上页
下页
末页
第二章 函数与基本初等函数
首页
上页
下页
末页
第二章 函数与基本初等函数
首页
上页
下页
末页
第二章 函数与基本初等函数
(3)分析两个变量相关关系的常用方法 ①利用散点图进行判断:把样本数据表示的点在平面 直角坐标系中作出,从而得到散点图,如果这些点大致分 布在通过散点图中心的一条直线附近,那么就说这两个变 量之间具有线性相关关系. ②利用相关系数r进行判断:|r|≤1而且|r|越接近于1, 相关程度越大;|r|越接近于0,相关程度越小.
第二章 函数与基本初等函数
首页
上页
下页
末页
第二章 函数与基本初等函数
首页
上页
下页
末页
第二章 函数与基本初等函数
首页
上页
下页
末页
第二章 函数与基本初等函数
首页
上页

近年届高考数学大一轮复习第十一章统计与统计案例11.3学案理北师大版(2021年整理)

近年届高考数学大一轮复习第十一章统计与统计案例11.3学案理北师大版(2021年整理)

2019届高考数学大一轮复习第十一章统计与统计案例11.3学案理北师大版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019届高考数学大一轮复习第十一章统计与统计案例11.3学案理北师大版)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019届高考数学大一轮复习第十一章统计与统计案例11.3学案理北师大版的全部内容。

§11。

3 变量间的相关关系、统计案例最新考纲考情考向分析1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3。

了解独立性检验的基本思想、方法及其初步应用.4。

了解回归分析的基本思想、方法及简单应用。

回归分析,独立性检验是全国卷高考重点考查的内容,必考一个解答题,选择、填空题中也会出现.主要考查回归方程,相关系数,利用回归方程进行预测,独立性检验的应用等。

1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是非线性相关的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.线性回归方程(1)最小二乘法如果有n个点(x1,y1),(x2,y2),…,(x n,y n),可以用[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2来刻画这些点与直线y=a+bx 的接近程度,使得上式达到最小值的直线y=a+bx就是所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y),…,(x n,y n)的线性回归方程,其中a,b是待定参数.2错误!3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n)中,(错误!,y)称为样本点的中心.(3)相关系数①r=错误!=错误!;②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;当r=0时,表明两个变量线性不相关.|r|值越接近于1,表明两个变量之间的线性相关程度越高.|r|值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=错误!.2×2列联表:A B B1B2总计A1a b a+bA2c d c+d总计a+c b+d n=a+b+c+d构造一个统计量χ2=错误!。

2019版高考数学(北师大版理科)一轮复习课件:第11章 统计与统计案例 第3讲

2019版高考数学(北师大版理科)一轮复习课件:第11章 统计与统计案例 第3讲

2.回归分析 相关关系 的两个变量进行统计分析的方法叫回归分 对具有 ___________
析.其基本步骤是: (ⅰ)画散点图;(ⅱ)求 回归直线方程 ;(ⅲ)用回归直线方程作 预报. (1) 回 归 直 线 : 如 果 散 点 图 中 点 的 分 布 从 整 体 上 看 大 致 在 一条直线 附近,就称这两个变量之间具有线性相关关系,这 __________ 条直线叫做回归直线. (2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x,y 的一组观察值为(xi,yi)(i =1,2,…,n),则回归直线方程 y=a+bx 的系数为:
n n x i y i - n x y xi- x yi- y i= 1 i =1 = b= n n 2 2 - n x x2 xi- x i i=1 i= 1 a= y -b x .
1n 1n 中心 其中 x =n xi,y=n yi,( x , y )称为样本点的__________. i=1 i=1
解析 只有χ2 ≥6.635才能有99%的把握认为该电
视栏目是否优秀与改革有关系,而既使K2≥6.635
也只是对“该电视栏目是否优秀与改革有关系 ” 这个论断成立的可能性大小的结论,与是否有 99%的人等无关.故只有D正确. 答案 D
4.(2015· 福建卷)为了解某社区居民的家庭年收入与年支出的
小,所以z随x的增大而减小,x与z负相关,故选C.
答案 C
3.为了评价某个电视栏目的改革效果,在改革前后分别从居 民点抽取了 100 位居民进行调查,经过计算 χ2 ≈ 0.99 ,根 据这一数据分析,下列说法正确的是( )
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系

2019年高考数学一轮复习学案+训练+课件(北师大版文科):重点强化训练5统计与统计案例文北师大版_39

2019年高考数学一轮复习学案+训练+课件(北师大版文科):重点强化训练5统计与统计案例文北师大版_39

重点强化训练(五)统计与统计案例A 组基础达标 (建议用时:30分钟)一、选择题1.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为()A .101B .808C .1212D .2019B [由题意知抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有1296=101N,解得N =808.]2.设某大学的女生体重y (单位:kg)写身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确的是() A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1cm ,则其体重约增加0.85kgD .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg D [∵0.85>0,∴y 与x 正相关,∴A 正确;∵回归直线经过样本点的中心(x ,y ),∴B 正确; ∵Δy =0.85(x +1)-85.71-(0.85x -85.71)=0.85, ∴C 正确.]3.亚冠联赛前某参赛队准备在甲、乙两名球员中选一人参加比赛.如图9所示的茎叶图记录了一段时间内甲、乙两人训练过程中的成绩,若甲、乙两名球员的平均成绩分别是x 1,x 2,则下列结论正确的是()图9A.x1>x2,选甲参加更合适B.x1>x2,选乙参加更合适C.x1=x2,选甲参加更合适D.x1=x2,选乙参加更合适A[根据茎叶图可得甲、乙两人的平均成绩分别为x1≈31.67,x2≈24.17,从茎叶图来看,甲的成绩比较集中,而乙的成绩比较分散,因此甲发挥得更稳定,选甲参加比赛更合适.] 4.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x,y6月份生产甲胶囊产量为()A.8.1万盒B.8.2万盒C.8.9万盒D.8.6万盒A[由题意知x=3,y=6,则a=y-0.7x=3.9,∴x=6时,y=8.1.]5.利用如图10所示算法在平面直角坐标系上打印一系列点,则打印的点在圆x2+y2=10内的个数为()图10A.2 B.3C.4 D.5B[执行题中的程序框图,打印的点的坐标依次为(-3,6),(-2,5),(-1,4),(0,3),(1,2),(2,1),其中点(0,3),(1,2),(2,1)位于圆x2+y2=10内,因此打印的点位于圆x2+y2=10内的共有3个.]二、填空题6.在某市“创建文明城市”活动中,对800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图11),但是年龄组为[25,30)的数据不慎丢失,据此估计这800名志愿者年龄在[25,30)内的人数为________.图11160[设年龄在[25,30)内的志愿者的频率是P,则有5×0.01+P+5×0.07+5×0.06+5×0.02=1,解得P=0.2.故估计这800名志愿者年龄在[25,30)内的人数是800×0.2=160.]7.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:关”.参考附表:99%[假可得χ2=-2≈7.822>6.635,60×50×60×50所以有99%的把握认为“喜爱《开门大吉》节目与否和性别有关”.]8.数列{a n}满足a n=n,阅读如图12所示的算法框图,运行相应的程序,若输入n=5,a n =n,x=2的值,则输出的结果v=________.图12129[该算法框图循环4次,各次v的值分别是14,31,64,129,故输出结果v=129.] 三、解答题9.全世界越来越关注环境保护问题,某监测站点于2019年8月某日起连续n天监测空气质量指数(AQI),数据统计如下表:图13(2)由频率分布直方图,求该组数据的平均数与中位数;(3)在空气质量指数分别为(50,100]和(150,200]的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A“两天空气质量等级都为良”发生的概率.[解](1)∵0.004×50=20n,∴n =100,∵20+40+m +10+5=100,∴m =25.40100×50=0.008;25100×50=0.005;10100×50=0.002;5100×50=0.001.2分由此完成频率分布直方图,如图:4分(2)由频率分布直方图得该组数据的平均数为25×0.004×50+75×0.008×50+125×0.005×50+175×0.002×50+225×0.001×50=95,6分∵[0,50)的频率为0.004×50=0.2,[50,100)的频率为0.008×50=0.4, ∴中位数为50+0.5-0.20.4×50=87.5.8分 (3)由题意知在空气质量指数为(50,100]和(150,200]的监测天数中分别抽取4天和1天,9分在所抽取的5天中,将空气质量指数为(50,100]的4天分别记为a ,b ,c ,d ; 将空气质量指数为(150,200]的1天记为e ,从中任取2天的基本事件为(a ,b ),(a ,c ),(a ,d ),(a ,e ),(b ,c ),(b ,d ),(b ,e ),(c ,d ),(c ,e ),(d ,e ),共10个, 其中事件A “两天空气质量等级都为良”包含的基本事件为 (a ,b ),(a ,c ),(a ,d ),(b ,c ),(b ,d ),(c ,d ),共6个. 11分 所以P (A )=610=35.12分10.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)(2)用所求回归方程预测该地区2019年(t =6)的人民币储蓄存款.附:回归方程y =bt +a 中,b =∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a =y -b t .[解](1)列表计算如下:这里n =5,t =1n ∑i =1nt i =155=3,y =1n ∑i =1n y i =365=7.2.2分又l tt =∑i =1nt 2i -n t 2=55-5×32=10,l ty =∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b =l ty l tt =1210=1.2, a =y -b t =7.2-1.2×3=3.6,故所求回归方程为y =1.2t +3.6.7分(2)将t =6代入回归方程可预测该地区2019年的人民币储蓄存款为y =1.2×6+3.6=10.8(千亿元).12分B 组能力提升 (建议用时:15分钟)1.如图14所示的算法框图,若输出k 的值为6,则判断框内可填入的条件是()图14A .s >12B .s >35C .s >710D .s >45C [第一次执行循环:s =1×910=910,k =8,s =910应满足条件; 第二次执行循环:s =910×89=810,k =7,s =810应满足条件,排除选项D ;第三次执行循环:s =810×78=710,k =6,不再满足条件,结束循环.因此判断框中的条件为s >710.]2.已知某产品连续4个月的广告费用x 1(千元)与销售额y 1(万元),经过对这些数据的处理,得到如下数据信息:①∑i =14x i =18,∑i =14y i =14;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y =bx +a 中的b =0.8(用最小二乘法求得).那么,广告费用为6千元时,可预测销售额约为________万元.4.7[因为∑i =14x i =18,∑i =14y i =14,所以x =4.5,y =3.5,因为回归直线方程y =bx +a 中的b =0.8, 所以3.5=0.8×4.5+a ,所以a =-0.1,所以y =0.8x -0.1.x =6时,可预测销售额约为4.7万元.]3.某工厂36名工人的年龄数据如下表.(1)到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2;(3)36名工人中年龄在x -s 与x +s 之间有多少人?所占的百分比是多少(精确到0.01%)?[解](1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n -2(n =1,2,…,9), 其年龄数据为:44,40,36,43,36,37,44,43,37. 5分(2)由均值公式知:x =44+40+…+379=40,由方差公式知:s 2=19[(44-40)2+(40-40)2+…+(37-40)2]=1009.8分 (3)因为s 2=1009,s =103,所以36名工人中年龄在x -s 和x +s 之间的人数等于年龄在区间[37,43]上的人数, 即40,40,41,…,39,共23人.所以36名工人中年龄在x -s 和x +s 之间的人数所占的百分比为2336×100%≈63.89%.12分。

2019版高考数学大一轮复习 第十一章 统计与统计案例 11.1 随机抽样试题 理 北师大版

2019版高考数学大一轮复习 第十一章 统计与统计案例 11.1 随机抽样试题 理 北师大版

2019版高考数学大一轮复习第十一章统计与统计案例 11.1 随机抽样试题理北师大版1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.(2)总体和样本调查对象的全体称为总体,被抽取的一部分称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率相同.(2)通常采用的简单随机抽样的方法:抽签法和随机数法.3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)抽签法中,先抽的人抽中的可能性大.( ×)(4)系统抽样在第1段抽样时采用简单随机抽样.( √)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ×)1.(教材改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.2.(2015·四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案 C解析根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.3.(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从10名家长中抽取3名参加座谈会.Ⅰ.简单随机抽样法Ⅱ.系统抽样法Ⅲ.分层抽样法问题与方法配对正确的是( )A.(1)Ⅲ,(2)Ⅰ B.(1)Ⅰ,(2)ⅡC.(1)Ⅱ,(2)Ⅲ D.(1)Ⅲ,(2)Ⅱ答案 A解析通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法.4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为________.答案695解析由题意可知,第一组随机抽取的编号l=15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 答案 15解析 设应从高二年级抽取x 名学生,则x ∶50=3∶10,解得x =15.题型一 简单随机抽样例1 (1)以下抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481A.08 B .07 C .02 D .01 答案 (1)D (2)D解析 (1)选项A 、B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C 不是简单随机抽样,因为总体的个体有明显的层次;选项D 是简单随机抽样. (2)由题意知前5个个体的编号为08,02,14,07,01. 思维升华 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.(1)下列抽样试验中,适合用抽签法的有( )A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验(2)下列抽取样本的方式不属于简单随机抽样的有________________.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.答案(1)B (2)①②③④解析(1)A,D中的总体个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.(2)①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.题型二系统抽样例2 (1)(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A.3 B.4 C.5 D.6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A.11 B.12 C.13 D.14答案 (1)B (2)B解析 (1)由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)由84042=20,即每20人抽取1人,所以抽取编号落在区间[481,720]的人数为720-48020=24020=12. 引申探究1.本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是________. 答案 144解析 在第八组中抽得的号码为(8-3)×20+44=144.2.本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240(人),又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.(1)(2016·马鞍山模拟)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是( ) A .8 B .13 C .15D .18(2)(2016·烟台模拟)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10D .15答案 (1)D (2)C解析 (1)分段间隔为524=13,故还有一个学生的编号为5+13=18,故选D.(2)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69, (939)落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 题型三 分层抽样命题点1 求总体或样本容量例 3 (1)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( )A .54B .90C .45D .126(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)B (2)1 800解析 (1)依题意得33+5+7×n =18,解得n =90,即样本容量为90.(2)分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件. 命题点2 求某层入样的个体数例4 (1)(2015·北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 B .100 C .180 D .300(2)(2015·福建)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案 (1)C (2)25解析 (1)由题意抽样比为3201 600=15,∴该样本中的老年教师人数为900×15=180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取的人数为45×500900=25.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.(2)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为________.答案 (1)200,20 (2)50解析 (1)该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20. (2)设广告部门的员工人数为x , 则由分层抽样,得1 00080=x4,解得x =50.五审图表找规律典例 (12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数 管理 技术开发 营销 生产 共计 老年40404080200中年 80 120 160 240 600 青年 40 160 280 720 1 200 共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响 ↓(表中管理、技术开发、营销、生产分类清楚,人数确定) 要以管理、技术开发、营销、生产人员分层,用分层抽样 ↓要抽20人调查对广州亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情,况了解相当 将单位人员看作一个整体 ↓(从表中数据看总人数为2 000) 人员较多,可采用系统抽样 规范解答解 (1)按老年、中年、青年分层,用分层抽样法抽取,[1分] 抽取比例为402 000=150.[2分]故老年人、中年人、青年人各抽取4人、12人、24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分] 抽取比例为252 000=180,[6分]故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人.[8分](3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10 D .12 答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽学生人数为14×4070=8.2.(2017·榆林质检)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本.这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法答案 A解析 符合系统抽样的特点,故选A.3.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 4.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20 答案 C解析 由1 00040=25,可得分段的间隔为25.5.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270 关于上述样本的下列结论中,正确的是( ) A .②、③都不能为系统抽样 B .②、④都不能为分层抽样 C .①、④都可能为系统抽样 D .①、③都可能为分层抽样 答案 D解析 因为③可以为系统抽样,所以选项A 不对;因为②可以为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N +)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17.故选B. 7.(2016·山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310D.310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.8.(2016·天津质检)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生. 答案 60解析 设应从一年级本科生中抽取x 名学生, 则x300=44+5+5+6,解得x =60. 9.(2017·潍坊质量预测)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的5.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意,可知样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.10.一个总体中有90个个体,随机编号0,1,2,…,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.一年级 二年级 三年级女生 373 xy 男生377370z答案 16解析 依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故用分层抽样法应在三年级抽取的学生人数为64×28=16.13.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N 个人,其中35岁以下48人,50岁以上10人,再从这N 个人中随机抽取出1人,此人的年龄为50岁以上的概率为539,求x ,y 的值. 解 (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m ,∴3050=m5,解得m =3. 抽取的样本中有研究生2人,本科生3人,分别记作S 1,S 2;B 1,B 2,B 3.从中任取2人的所有等可能基本事件共有10个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2),(B 1,B 2),(B 1,B 3),(B 2,B 3),其中至少有1人的学历为研究生的基本事件有7个:(S 1,B 1),(S 1,B 2),(S 1,B 3),(S 2,B 1),(S 2,B 2),(S 2,B 3),(S 1,S 2), ∴从中任取2人,至少有1人学历为研究生的概率为710. (2)由题意,得10N =539,解得N =78,∴35~50岁中被抽取的人数为78-48-10=20, ∴4880+x =2050=1020+y, 解得x =40,y =5,即x ,y 的值分别为40,5.。

2019高考数学(理)一轮复习全套学案

2019高考数学(理)一轮复习全套学案

2019高考数学(理)一轮复习全套学案目录第一章集合与常用逻辑用语第1节集合第2节命题及其关系、充分条件与必要条件第3节全称量词与存在量词、逻辑联结词“且”“或”“非”第二章函数、导数及其应用第1节函数及其表示第2节函数的单调性与最值第3节函数的奇偶性、周期性与对称性第4节二次函数与幂函数第5节指数与指数函数第6节对数与对数函数第7节函数的图像第8节函数与方程第9节函数模型及其应用第10节变化率与导数、计算导数第11节第1课时导数与函数的单调性第11节第2课时导数与函数的极值、最值学案第11节第3课时导数与函数的综合问题学案第12节定积分与微积分基本定理第三章三角函数、解三角形第1节任意角、弧度制及任意角的三角函数第2节同角三角函数的基本关系与诱导公式第3节三角函数的图像与性质第4节函数y=Asin(ωx+φ)的图像及应用学案第5节两角和与差及二倍角的三角函数第6节正弦定理和余弦定理第6节简单的三角恒等变换第7节正弦定理和余弦定理第8节解三角形实际应用举例第四章平面向量、数系的扩充与复数的引入第1节平面向量的概念及线性运算第2节平面向量的基本定理及坐标表示第3节平面向量的数量积与平面向量应用举例第4节数系的扩充与复数的引入第五章数列第1节数列的概念与简单表示法第2节等差数列及其前n项和第3节等比数列及其前n项和第4节数列求和第六章不等式、推理与证明第1节不等式的性质与一元二次不等式第2节基本不等式及其应用第3节二元一次不等式(组)与简单的线性规划问题第4节归纳与类比第5节综合法、分析法、反证法第6节数学归纳法第七章立体几何第1节简单几何体的结构及其三视图和直观图第2节空间图形的基本关系与公理第3节平行关系第4节垂直关系第5节简单几何体的表面积与体积第6节空间向量及其运算第7节第1课时利用空间向量证明平行与垂直第7节第2课时利用空间向量求空间角第八章平面解析几何第1节直线的倾斜角与斜率、直线的方程第2节两条直线的位置关系第3节圆的方程第4节直线与圆、圆与圆的位置关系第5节椭圆第6节抛物线第7节双曲线第8节曲线与方程第9节第1课时直线与圆锥曲线的位置关系第9节第2课时定点、定值、范围、最值问题第九章算法初步、统计与统计案例第1节算法与算法框图第2节随机抽样第3节统计图表、用样本估计总体学案第4节变量间的相关关系与统计案例第十章计数原理、概率、随机变量及其分布第1节分类加法计数原理与分步乘法计数原理第2节排列与组合第3节二项式定理第4节随机事件的概率学案第5节古典概型第6节几何概型第7节离散型随机变量及其分布列第8节二项分布与正态分布第9节离散型随机变量的均值与方差不等式选讲第1节绝对值不等式不等式选讲第2节不等式的证明坐标系与参数方程第1节坐标系坐标系与参数方程第2节参数方程第一节 集 合[考纲传真] 1.了解集合的含义,体会元素与集合的属于关系;能用自然语言、图形语言、集合语言(列举法或描述法)描述不同的具体问题.2.理解集合之间包含与相等的含义,能识别给定集合的子集;在具体情境中,了解全集与空集的含义.3.(1)理解两个集合的并集与交集的含义,会求两个简单集合的并集与交集.(2)理解在给定集合中一个子集的补集的含义,会求给定子集的补集.(3)能使用Venn 图表达集合间的基本关系及集合的基本运算.[基础知识填充]1.元素与集合(1)集合中元素的三个特性:确定性、互异性、无序性. (2)元素与集合的关系是属于或不属于,表示符号分别为∈和∉. (3)集合的三种表示方法:列举法、描述法、Venn 图法. (4)常见数集的记法2.中至少有一AB3.A ∪BA ∩B∁A[(1)若有限集A 中有n 个元素,则A 的子集有2n个,真子集有2n-1个. (2)任何集合是其本身的子集,即:A ⊆A . (3)子集的传递性:A ⊆B ,B ⊆C ⇒A ⊆C . (4)A ⊆B ⇔A ∩B =A ⇔A ∪B =B .(5)∁U (A ∩B )=(∁U A )∪(∁U B ),∁U (A ∪B )=(∁U A )∩(∁U B ).[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)任何集合都有两个子集.( )(2){x |y =x 2}={y |y =x 2}={(x ,y )|y =x 2}.( ) (3)若{x 2,1}={0,1},则x =0,1.( ) (4){x |x ≤1}={t |t ≤1}.( )(5)对于任意两个集合A ,B ,关系(A ∩B )⊆(A ∪B )恒成立. (6)若A ∩B =A ∩C ,则B =C .( )[解析] (1)错误.空集只有一个子集,就是它本身,故该说法是错误的.(2)错误.三个集合分别表示函数y =x 2的定义域(-∞,+∞),值域[0,+∞),抛物线y =x 2上的点集.(3)错误.当x =1时,不满足互异性.(4)正确.两个集合均为不大于1的实数组成的集合. (5)正确.由交集、并集、子集的概念知,正确. (6)错误.当A =∅时,B ,C 可为任意集合.[答案] (1)× (2)× (3)× (4)√ (5)√ (6)×2.(教材改编)若集合A ={x ∈N |x ≤22},a =2,则下列结论正确的是( )A .{a }⊆AB .a ⊆AC .{a }∈AD .a ∉A D [由题意知A ={0,1,2},由a =2,知a ∉A .]3.若集合A ={x |-2<x <1},B ={x |x <-1或x >3},则A ∩B =( )A .{x |-2<x <-1}B .{x |-2<x <3}C .{x |-1<x <1}D .{x |1<x <3}A [∵A ={x |-2<x <1},B ={x |x <-1或x >3}, ∴A ∩B ={x |-2<x <-1}.故选A.]4.设全集U ={x |x ∈N +,x <6},集合A ={1,3},B ={3,5},则∁U (A ∪B )等于( )A .{1,4}B .{1,5}C .{2,5}D .{2,4}D [由题意得A ∪B ={1,3}∪{3,5}={1,3,5}.又U ={1,2,3,4,5},∴∁U (A ∪B )={2,4}.] 5.已知集合A ={x 2+x,4x },若0∈A ,则x =________.-1 [由题意,得⎩⎪⎨⎪⎧x 2+x =0,4x ≠0或⎩⎪⎨⎪⎧4x =0,x 2+x ≠0,解得x =-1.](第2页)(1)设集合A ={1,2,3},B ={4,5},M ={x |x =a +b ,a ∈A ,b ∈B },则M 中的元素个数为( ) A .3 B .4 C .5 D .6(2)已知a ,b ∈R ,若⎩⎨⎧⎭⎬⎫a ,b a,1={a 2,a +b,0},则a 2 019+b 2 019为( )A .1B .0C .-1D .±1(1)B (2)C [(1)因为集合M 中的元素x =a +b ,a ∈A ,b ∈B ,所以当b =4,a =1,2,3时,x =5,6,7. 当b =5,a =1,2,3时,x =6,7,8. 由集合元素的互异性,可知x =5,6,7,8. 即M ={5,6,7,8},共有4个元素. (2)由已知得a ≠0,则b a=0,所以b =0,于是a 2=1,即a =1或a =-1,又根据集合中元素的互异性可知a =1应舍去,因此a =-1,故a2 019+b2 019=(-1)2 019+02 019=-1.]确定集合中的元素是什么,即集合是数集还是点集看这些元素满足什么限制条件根据限制条件列式求参数的值或确定集合中元素的个数,要注意检验集合是否满足元素的互异性[跟踪训练A.92 B.98 C .0 D .0或98(2)已知集合A ={m +2,2m 2+m },若3∈A ,则m 的值为________.【79140001】(1)D (2)-32 [(1)若集合A 中只有一个元素,则方程ax 2-3x +2=0只有一个实根或有两个相等实根.当a =0时,x =23,符合题意;当a ≠0时,由Δ=(-3)2-8a =0得a =98,所以a 的取值为0或98.(2)因为3∈A ,所以m +2=3或2m 2+m =3.当m +2=3,即m =1时,2m 2+m =3, 此时集合A 中有重复元素3, 所以m =1不符合题意,舍去;当2m 2+m =3时,解得m =-32或m =1(舍去),此时当m =-32时,m +2=12≠3符合题意.所以m =-32.](1)已知集合A ={x |y =1-x 2,x ∈R },B ={x |x =m 2,m ∈A },则( ) A .A B B .B A C .A ⊆BD .B =A(2)已知集合A ={x |(x +1)(x -3)<0},B ={x |-m <x <m }.若B ⊆A ,则m 的取值范围为________. (1)B (2)m ≤1 [(1)由题意知A ={x |-1≤x ≤1}, 所以B ={x |x =m 2,m ∈A }={x |0≤x ≤1}, 因此B A .(2)当m ≤0时,B =∅,显然B ⊆A ,当m >0时,因为A ={x |(x +1)(x -3)<0}={x |-1<x <3}. 当B ⊆A 时,有所以⎩⎪⎨⎪⎧-m ≥-1,m ≤3,-m <m .所以0<m ≤1.综上所述,m 的取值范围为m ≤1.] 化简集合,从表达式中寻找两集合的关系用列举法或图示法等表示各个集合,从元素或图形中寻找关系2.根据集合间的关系求参数的方法已知两集合间的关系求参数时,关键是将两集合间的关系转化为元素或区间端点间的关系,进而转化为参数满足的关系,解决这类问题常常要合理利用数轴、A ≠,应分[跟踪训练] (1)已知集合A ={x |x 2-3x +2=0,x ∈R },B ={x |0<x <5,x ∈N },则满足条件A ⊆C ⊆B 的集合C 的个数为( ) A .1 B .2 C .3 D .4(2)已知集合A ={x |-2≤x ≤7},B ={x |m +1<x <2m -1},若B ⊆A ,则实数m 的取值范围是________. (1)D (2)(-∞,4] [(1)由x 2-3x +2=0,得x =1或x =2,所以A ={1,2}. 由题意知B ={1,2,3,4},所以满足条件的C 可为{1,2},{1,2,3},{1,2,4},{1,2,3,4}. (2)∵B ⊆A ,∴当B =∅时,有m +1≥2m -1,则m ≤2. 当B ≠∅时,若B ⊆A ,如图.则⎩⎪⎨⎪⎧m +1≥-2,2m -1≤7,m +1<2m -1,解得2<m ≤4.综上,m 的取值范围为m ≤4.]◎角度1 集合的运算(1)(2017·全国卷Ⅰ)已知集合A ={x |x <1},B ={x |3x<1},则( ) A .A ∩B ={x |x <0} B .A ∪B =R C .A ∪B ={x |x >1}D .A ∩B =∅(2)(2018·九江一中)设U =R ,A ={-3,-2,-1,0,1,2},B ={x |x ≥1},则A ∩(∁U B )=( ) A .{1,2}B .{-1,0,1,2}C .{-3,-2,-1,0}D .{2}(1)A (2)C [(1)∵B ={x |3x<1},∴B ={x |x <0}.又A ={x |x <1},∴A ∩B ={x |x <0},A ∪B ={x |x <1}.故选A. (2)由题意得∁U B ={x |x <1},∴A ∩(∁U B )={-3,-2,-1,0},故选C.] ◎角度2 利用集合的运算求参数(2018·合肥第二次质检)已知A =[1,+∞),B =⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫x ∈R ⎪⎪⎪12a ≤x ≤2a -1,若A ∩B ≠∅,则实数a 的取值范围是( )A .[1,+∞)B .⎣⎢⎡⎦⎥⎤12,1 C.⎣⎢⎡⎭⎪⎫23,+∞ D .(1,+∞)A [集合A ∩B ≠∅,则⎩⎪⎨⎪⎧12a ≤2a -1,2a -1≥1,解得a ≥1,故选A.] ◎角度3 新定义集合问题如果集合A 满足若x ∈A ,则-x ∈A ,那么就称集合A 为“对称集合”.已知集合A ={2x,0,x 2+x },且A 是对称集合,集合B 是自然数集,则A ∩B =______.{0,6} [由题意可知-2x =x 2+x ,所以x =0或x =-3.而当x =0时不符合元素的互异性,所以舍去.当x =-3时,A ={-6,0,6},所以A ∩B ={0,6}.]看元素组成,集合是由元素组成的,从研究集合中元素的构成入手是解决集合运算问题的前提看集合能否化简,集合能化简的先化简,再研究其关系并进行运算,可使问题简单明了,易于求解要借助用数轴表示,并注意端点值的取舍以集合为依托,对集合的定义、运算、性质加以创新,但最终应转化为原来的集合问题来解决[跟踪训练A .{1,-3} B .{1,0} C .{1,3}D .{1,5}(2)已知全集U =R ,集合M ={x |(x -1)(x +3)<0},N ={x ||x |≤1},则阴影部分(如图1­1­1)表示的集合是( )图1­1­1A .[-1,1)B .(-3,1]C .(-∞,-3)∪[-1,+∞)D .(-3,-1)(3)设A ,B 是非空集合,定义A ⊗B ={x |x ∈A ∪B 且x ∉A ∩B }.已知集合A ={x |0<x <2},B ={y |y ≥0},则A ⊗B =________.【79140002】(1)C (2)D (3){0}∪[2,+∞) [(1)∵A ∩B ={1}, ∴1∈B .∴1-4+m =0,即m =3. ∴B ={x |x 2-4x +3=0}={1,3}.故选C.(2)由题意可知,M=(-3,1),N=[-1,1],∴阴影部分表示的集合为M∩(∁U N)=(-3,-1).(3)由已知A={x|0<x<2},B={y|y≥0},又由新定义A⊗B={x|x∈A∪B且x∉A∩B},结合数轴得A⊗B={0}∪[2,+∞).]第二节命题及其关系、充分条件与必要条件[考纲传真] 1.理解命题的概念;了解“若p,则q”形式的命题及其逆命题、否命题与逆否命题,会分析四种命题的相互关系.2.理解必要条件、充分条件与充要条件的意义.(第3页)[基础知识填充]1.四种命题及其相互关系(1)四种命题间的相互关系图1­2­1(2)四种命题的真假关系①两个命题互为逆否命题,它们有相同的真假性;②两个命题互为逆命题或互为否命题,它们的真假性没有关系.2.充分条件与必要条件(1)若p⇒q,则p是q的充分条件,q是p的必要条件;(2)若p⇒q,且⇒/p,则p是q的充分不必要条件;(3)若p⇒/q且q⇒p,则p是q的必要不充分条件;(4)若p⇔q,则p是q的充要条件;(5)若p⇒/q且q⇒/p,则p是q的既不充分也不必要条件.[知识拓展] 集合与充要条件设集合A={x|x满足条件p},B={x|x满足条件q},则有:(1)若A⊆B,则p是q的充分条件,若A B,则p是q的充分不必要条件.(2)若B⊆A,则p是q的必要条件,若B A,则p是q的必要不充分条件.(3)若A=B,则p是q的充要条件.[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)“x 2+2x -3<0”是命题.( )(2)命题“若p ,则q ”的否命题是“若p ,则﹁q ”.( ) (3)四种形式的命题中,真命题的个数为0或2或4.( ) (4)当q 是p 的必要条件时,p 是q 的充分条件.( )(5)“若p 不成立,则q 不成立”等价于“若q 成立,则p 成立”.( ) [解析] (1)错误.该语句不能判断真假,故该说法是错误的. (2)错误.否命题既否定条件,又否定结论.(3)正确.因为两个命题互为逆否命题,它们有相同的真假性. (4)正确.q 是p 的必要条件说明p ⇒q ,所以p 是q 的充分条件. (5)正确.原命题与逆否命题是等价命题. [答案] (1)× (2)× (3)√ (4)√ (5)√2.(教材改编)命题“若α=π4,则tan α=1”的逆否命题是( )A .若α≠π4,则tan α≠1B .若α=π4,则tan α≠1C .若tan α≠1,则α≠π4D .若tan α≠1,则α=π4C [“若p ,则q ”的逆否命题是“若﹁q ,则﹁p ”,显然﹁q :tan α≠1,﹁p :α≠π4,所以该命题的逆否命题是“若tan α≠1,则α≠π4”.]3.“x =1”是“(x -1)(x +2)=0”的( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件A [若x =1,则(x -1)(x +2)=0显然成立,但反之不一定成立,即若(x -1)(x +2)=0,则x =1或-2.]4.命题“若a >-3,则a >-6”以及它的逆命题、否命题、逆否命题中真命题的个数为( )A .1B .2C .3D .4B [原命题正确,从而其逆否命题也正确;其逆命题为“若a >-6,则a >-3”是假命题,从而其否命题也是假命题.因此4个命题中有2个真命题.]5.(2017·天津高考)设x ∈R ,则“2-x ≥0”是“|x -1|≤1”的( )A .充分而不必要条件B .必要而不充分条件C .充要条件D .既不充分也不必要条件 B [∵2-x ≥0,∴x ≤2. ∵|x -1|≤1,∴0≤x ≤2.∵当x ≤2时不一定有x ≥0,当0≤x ≤2时一定有x ≤2, ∴“2-x ≥0”是“|x -1|≤1”的必要而不充分条件. 故选B.](第4页)(1)命题“若a 2>b 2,则a >b ”的否命题是( ) A .若a 2>b 2,则a ≤b B .若a 2≤b 2,则a ≤b C .若a ≤b ,则a 2>b 2D .若a ≤b ,则a 2≤b 2(2)(2017·河南开封二十五中月考)下列命题中为真命题的是( ) A .命题“若x >1,则x 2>1”的否命题 B .命题“若x >y ,则x >|y |”的逆命题 C .命题“若x =1,则x 2+x -2=0”的否命题 D .命题“若1x>1,则x >1”的逆否命题(1)B (2)B [(1)根据命题的四种形式可知,命题“若p ,则q ”的否命题是“若﹁p ,则﹁q ”.该题中,p 为a 2>b 2,q 为a >b ,故﹁p 为a 2≤b 2,﹁q 为a ≤b .所以原命题的否命题为:若a 2≤b 2,则a ≤b .(2)对于A ,命题“若x >1,则x 2>1”的否命题为“若x ≤1,则x 2≤1”,易知当x =-2时,x2=4>1,故为假命题;对于B ,命题“若x >y ,则x >|y |”的逆命题为“若x >|y |,则x >y ”,分析可知为真命题;对于C ,命题“若x =1,则x 2+x -2=0”的否命题为“若x ≠1,则x 2+x -2≠0”,易知当x =-2时,x 2+x -2=0,故为假命题;对于D ,命题“若1x>1,则x >1”的逆否命题为“若x ≤1,则1x≤1”,易知为假命题,故选B.]联系已有的数学公式、定理、结论进行正面直接判断利用原命题与逆否命题,逆命题与否命题的等价关系进行判断易错警示:写一个命题的其他三种命题时,需注意:判断一个命题为真命题,要给出推理证明;判断一个命题是假命题,只需举出反例[跟踪训练个等于0”,在该命题的逆命题、否命题、逆否命题中,真命题的个数为( )【79140007】A.0 B.1C.2 D.3D[原命题为真命题,逆命题为“已知a,b,c为实数,若a,b,c中至少有一个等于0,则abc=0”,也为真命题.根据命题的等价关系可知其否命题、逆否命题也是真命题,故在该命题的逆命题、否命题、逆否命题中,真命题的个数为3.](1)(2017·北京高考)设m,n为非零向量,则“存在负数λ,使得m=λn”是“m·n<0”的( )A.充分而不必要条件B.必要而不充分条件C.充分必要条件D.既不充分也不必要条件(2)(2017·安徽百所重点高中二模)“a3>b3”是“ln a>ln b”的( )A.充分不必要条件B.必要不充分条件C.充要条件D.既不充分也不必要条件(1)A(2)B[(1)法一:由题意知|m|≠0,|n|≠0.设m与n的夹角为θ.若存在负数λ,使得m=λn,则m与n反向共线,θ=180°,∴m·n=|m||n|cos θ=-|m||n|<0.当90°<θ<180°时,m·n<0,此时不存在负数λ,使得m=λn.故“存在负数λ,使得m=λn”是“m·n<0”的充分而不必要条件.故选A.法二:∵m=λn,∴m·n=λn·n=λ|n|2.∴当λ<0,n≠0时,m·n<0.反之,由m ·n =|m ||n |cos 〈m ,n 〉<0⇔cos 〈m ,n 〉<0⇔〈m ,n 〉∈⎝ ⎛⎦⎥⎤π2,π, 当〈m ,n 〉∈⎝⎛⎭⎪⎫π2,π时,m ,n 不共线.故“存在负数λ,使得m =λn ”是“m ·n <0”的充分而不必要条件. 故选A.(2)由a 3>b 3可得a >b ,当a <0,b <0时,ln a ,ln b 无意义;反之,由ln a >ln b 可得a >b ,故a 3>b 3.因此“a 3>b 3”是“ln a >ln b ”的必要不充分条件.]定义法:根据集合法:根据断问题.等价转化法:根据一个命题与其逆否命题的等价性,把判断的命题转化为其逆否命题进行判断,适用于条件和结论带有否定性词语的命题[跟踪训练] (1)(2017·天津高考)设θ∈R ,则“⎪⎪⎪⎪⎪⎪θ-12<12”是“sin θ<2”的( )A .充分而不必要条件B .必要而不充分条件C .充要条件D .既不充分也不必要条件(2)(2018·合肥第一次质检)祖暅原理:“幂势既同,则积不容异”.它是中国古代一个涉及几何体体积的问题,意思是两个同高的几何体,如在等高处的截面积恒相等,则体积相等.设A ,B 为两个同高的几何体,p :A ,B 的体积不相等,q :A ,B 在等高处的截面积不恒相等,根据祖暅原理可知,p 是q 的( )A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件(1)A (2)A [(1)∵⎪⎪⎪⎪⎪⎪θ-π12<π12,∴-π12<θ-π12<π12,即0<θ<π6.显然0<θ<π6时,sin θ<12成立.但sin θ<12时,由周期函数的性质知0<θ<π6不一定成立.故0<θ<π6是sin θ<12的充分而不必要条件.故选A.(2)由祖暅原理可得﹁q ⇒﹁p ,即p ⇒q ,则充分性成立;反之不成立,如将同一个圆锥正放和倒放,在等高处的截面积不恒相等,但体积相等,∴p 是q 的充分不必要条件,故选A.]m 的取值范围为________.[0,3] [由x 2-8x -20≤0得-2≤x ≤10, ∴P ={x |-2≤x ≤10},由x ∈P 是x ∈S 的必要条件,知S ⊆P . 则⎩⎪⎨⎪⎧1-m ≤1+m ,1-m ≥-2,1+m ≤10,∴0≤m ≤3.即所求m 的取值范围是[0,3].]1.把本例中的“必要条件”改为“充分条件”,求m 的取值范围.[解] 由x ∈P 是x ∈S 的充分条件,知P ⊆S ,则⎩⎪⎨⎪⎧1-m ≤1+m ,1-m ≤-2,1+m ≥10,解得m ≥9,即所求m 的取值范围是[9,+∞).2.本例条件不变,问是否存在实数m ,使x ∈P 是x ∈S 的充要条件?并说明理由.[解] 不存在.理由:若x ∈P 是x ∈S 的充要条件,则P =S ,∴⎩⎪⎨⎪⎧1-m =-2,1+m =10,∴⎩⎪⎨⎪⎧m =3,m =9,无解,∴不存在实数m ,使x ∈P 是x ∈S 的充要条件. 组求解易错警示:求解参数的取值范围时,一定要注意区间端点值的检验,尤其是利用两个集合之间的关系求解参数的取值范围时,不等式是否能够取等号决定端点值的取舍,处理不当容易出现漏解或增解的现象[跟踪训练] (1)已知p :x ≥k ,q :x +1<1,如果p 是q 的充分不必要条件,则实数k 的取值范围是( ) A .[2,+∞) B .(2,+∞) C .[1,+∞)D .(-∞,-1)(2)已知条件p :2x 2-3x +1≤0,条件q :a ≤x ≤a +1.若﹁p 是﹁q 的必要不充分条件,则实数a 的取值范围是________.【79140008】(1)B (2)⎣⎢⎡⎦⎥⎤0,12 [(1)∵3x +1<1,∴3x +1-1=2-x x +1<0,即(x -2)(x +1)>0,∴x >2或x <-1, ∵p 是q 的充分不必要条件,∴k >2.(2)命题p 为⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫x ⎪⎪⎪12≤x ≤1, 命题q 为{x |a ≤x ≤a +1}.﹁p 对应的集合A =⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫x ⎪⎪⎪x >1或x <12, ﹁q 对应的集合B ={}x |x >a +1或x <a .∵﹁p 是﹁q 的必要不充分条件,∴⎩⎪⎨⎪⎧a +1>1,a ≤12或⎩⎪⎨⎪⎧a +1≥1,a <12,∴0≤a ≤12.]第三节 全称量词与存在量词、逻辑联结词“且”“或”“非”[考纲传真] 1.了解逻辑联结词“且”“或”“非”的含义.2.理解全称量词与存在量词的意义.3.能正确地对含有一个量词的命题进行否定.(第5页) [基础知识填充]1.简单的逻辑联结词(1)命题中的“且”“或”“非”叫作逻辑联结词. (2)命题p 且q ,p 或q ,﹁p 的真假判断2.(1)常见的全称量词有:“任意一个”“一切”“每一个”“任给”“所有的”等.(2)常见的存在量词有:“存在一个”“至少有一个”“有些”“有一个”“某个”“有的”等.3.全称命题与特称命题(1)含有全称量词的命题叫全称命题. (2)含有存在量词的命题叫特称命题.4.命题的否定(1)全称命题的否定是特称命题;特称命题的否定是全称命题. (2)p 或q 的否定为:﹁p 且﹁q ;p 且q 的否定为:﹁p 或﹁q .[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)命题“5>6或5>2”是假命题.( )(2)命题﹁(p 且q )是假命题,则命题p ,q 中至少有一个是假命题.( ) (3)“长方形的对角线相等”是特称命题.( )(4)命题“对顶角相等”的否定是“对顶角不相等”.( ) [解析] (1)错误.命题p 或q 中,p ,q 有一真则真. (2)错误.p 且q 是真命题,则p ,q 都是真命题.(3)错误.命题“长方形的对角线相等”可叙述为“所有长方形的对角线相等”,是全称命题. (4)错误.“对顶角相等”是全称命题,其否定为“有些对顶角不相等”. [答案] (1)× (2)× (3)× (4)×2.(教材改编)已知p :2是偶数,q :2是质数,则命题﹁p ,﹁q ,p 或q ,p 且q 中真命题的个数为( )A .1B .2C .3D .4B [p 和q 显然都是真命题,所以﹁p ,﹁q 都是假命题,p 或q ,p 且q 都是真命题.] 3.下列四个命题中的真命题为( )A .存在x 0∈Z,1<4x 0<3B .存在x 0∈Z,5x 0+1=0C .任意x ∈R ,x 2-1=0 D .任意x ∈R ,x 2+x +2>0D [选项A 中,14<x 0<34且x 0∈Z ,不成立;选项B 中,x 0=-15,与x 0∈Z 矛盾;选项C 中,x ≠±1时,x 2-1≠0;选项D 正确.]4.命题:“存在x 0∈R ,x 20-ax 0+1<0”的否定为________.任意x ∈R ,x 2-ax +1≥0 [因为特称命题的否定是全称命题,所以命题“存在x 0∈R ,x 20-ax 0+1<0”的否定是“任意x ∈R ,x 2-ax +1≥0”.]5.若命题“任意x ∈R ,ax 2-ax -2≤0”是真命题,则实数a 的取值范围是________.[-8,0] [当a =0时,不等式显然成立.当a ≠0时,依题意知⎩⎪⎨⎪⎧a <0,Δ=a 2+8a ≤0,解得-8≤a <0.综上可知-8≤a≤0.](第6页)(1)(2018·东北三省四市模拟(一))已知命题p:函数y=lg(1-x)在(-∞,1)上单调递减,命题q:函数y=2cos x是偶函数,则下列命题中为真命题的是( )A.p且q B.(﹁p)或(﹁q)C.(﹁p)且q D.p且(﹁q)(2)若命题“p或q”是真命题,“﹁p为真命题”,则( )A.p真,q真B.p假,q真C.p真,q假D.p假,q假(1)A(2)B[(1)命题p中,因为函数u=1-x在(-∞,1)上为减函数,所以函数y=lg(1-x)在(-∞,1)上为减函数,所以p是真命题;命题q中,设f(x)=2cos x,则f(-x)=2cos(-x)=2cos x=f(x),x∈R,所以函数y=2cos x是偶函数,所以q是真命题,所以p且q是真命题,故选A.(2)因为﹁p为真命题,所以p为假命题,又因为p或q为真命题,所以q为真命题.]确定命题的构成形式;判断依据“或”——一真即真,p”等形式命题的真假是y=|tan x| [跟踪训练] (2018·呼和浩特一调)命题p:x=2π是函数y=|sin x|的一条对称轴,q:2的最小正周期,下列命题①p或q;②p且q;③p;④﹁q,其中真命题有( )【79140013】A.1个B.2个C.3个D.4个C[由已知得命题p为真命题,命题q为假命题,所以p或q为真命题,p且q为假命题,﹁q为真命题,所以真命题有①③④,共3个,故选C.]◎角度1 全称命题、特称命题的真假判断下列命题中,真命题是( ) A .任意x ∈R ,x 2-x -1>0B .任意α,β∈R ,sin(α+β)<sin α+sin βC .存在x ∈R ,x 2-x +1=0D .存在α,β∈R ,sin(α+β)=cos α+cos βD [因为x 2-x -1=⎝ ⎛⎭⎪⎫x -122-54≥-54,所以A 是假命题.当α=β=0时,有sin(α+β)=sin α+sin β,所以B 是假命题.x 2-x +1=⎝ ⎛⎭⎪⎫x -122+34≥34,所以C 是假命题.当α=β=π2时,有sin(α+β)=cos α+cos β,所以D 是真命题,故选D.] ◎角度2 含有一个量词的命题的否定命题“任意n ∈N +,f (n )∈N +且f (n )≤n ”的否定形式是( ) A .任意n ∈N +,f (n )∉N +且f (n )>n B .任意n ∈N +,f (n )∉N +或f (n )>n C .存在n 0∈N +,f (n 0)∉N +且f (n 0)>n 0 D .存在n 0∈N +,f (n 0)∉N +或f (n 0)>n 0D [写全称命题的否定时,要把量词“任意”改为“存在”,并且否定结论,注意把“且”改为“或”.]要判断一个全称命题是真命题,必须对限定集合x 成立;但要判断全称命题是假命题,只要能找出集合x 0不成立即可要判断一个特称命题是真命题,只要在限定集合中,至少能找到一个=x 0,使x 0成立即可,否则,这一特称命题就是假命题2.全称命题与特称命题的否定改写量词:确定命题所含量词的类型,省去量词的要结合命题的含义加上量词,再对量词进行改写否定结论:对原命题的结论进行否定[跟踪训练] (1)已知命题p :存在x ∈⎝⎭⎪⎫0,2,使得cos x ≤x ,则﹁p 为( )A .存在x ∈⎝ ⎛⎭⎪⎫0,π2,使得cos x >xB .存在x ∈⎝ ⎛⎭⎪⎫0,π2,使得cos x <xC .任意x ∈⎝⎛⎭⎪⎫0,π2,总有cos x >xD .任意x ∈⎝⎛⎭⎪⎫0,π2,总有cos x ≤x(2)下列命题中的假命题是( ) A .存在x 0∈R ,lg x 0=0 B .存在x 0∈R ,tan x 0= 3 C .任意x ∈R ,x 3>0D .任意x ∈R,2x>0(1)C (2)C [(1)原命题是一个特称命题,其否定是一个全称命题,而“cos x ≤x ”的否定是“cos x >x ”.故选C.(2)当x =1时,lg x =0,故命题“存在x 0∈R ,lg x 0=0”是真命题;当x =π3时,tan x =3,故命题“存在x 0∈R ,tan x 0=3”是真命题;由于x =-1时,x 3<0,故命题“任意x ∈R ,x 3>0”是假命题;根据指数函数的性质,对任意x ∈R,2x>0,故命题“任意x ∈R,2x>0”是真命题.]给定命题p :对任意实数x 都有ax 2+ax +1>0成立;q :关于x 的方程x 2-x +a =0有实数根.如果p 或q 为真命题,p 且q 为假命题,求实数a 的取值范围.[解] 当p 为真命题时,“对任意实数x 都有ax 2+ax +1>0成立”⇔a =0或⎩⎪⎨⎪⎧a >0,Δ<0,∴0≤a <4.当q 为真命题时,“关于x 的方程x 2-x +a =0有实数根”⇔Δ=1-4a ≥0,∴a ≤14.∵p 或q 为真命题,p 且q 为假命题, ∴p ,q 一真一假.∴若p 真q 假,则0≤a <4,且a >14,∴14<a <4;若p 假q 真,则⎩⎪⎨⎪⎧a <0或a ≥4,a ≤14,即a <0.故实数a 的取值范围为(-∞,0)∪⎝ ⎛⎭⎪⎫14,4.先求出每个简单命题是真命题时参数的取值范围再根据复合命题的真假确定各个简单命题的真假情况有时不一定只有一种情况最后由的结果求出满足条件的参数取值范围[跟踪训练] (1)(2018·太原模拟(二))若命题“任意x ∈(0,+∞),x +x≥m ”是假命题,则实数m 的取值范围是________.【79140014】(2)已知p :存在x 0∈R ,mx 20+1≤0,q :任意x ∈R ,x 2+mx +1>0,若p 或q 为假命题,则实数m 的取值范围为( ) A .m ≥2B .m ≤-2C .m ≤-2或m ≥2D .-2≤m ≤2(1)(2,+∞) (2)A [(1)由题意,知“存在x ∈(0,+∞),x +1x<m ”是真命题,又因为x ∈(0,+∞),所以x +1x≥2,当且仅当x =1时等号成立,所以实数m 的取值范围为(2,+∞).(2)依题意知,p ,q 均为假命题.当p 是假命题时,任意x ∈R ,mx 2+1>0恒成立,则有m ≥0;当q 是假命题时,则有Δ=m 2-4≥0,m ≤-2或m ≥2.因此,由p ,q 均为假命题得⎩⎪⎨⎪⎧m ≥0,m ≤-2或m ≥2,即m ≥2.]第一节 函数及其表示[考纲传真] 1.了解构成函数的要素,会求一些简单函数的定义域和值域,了解映射的概念.2.在实际情境中,会根据不同的需要选择恰当的方法(如图像法、列表法、解析法)表示函数.3.了解简单的分段函数,并能简单应用(函数分段不超过三段).(第8页) [基础知识填充]1.函数与映射的概念2.(1)函数的定义域、值域:数集A 叫作函数的定义域;函数值的集合{f (x )|x ∈A }叫作函数的值域. (2)函数的三要素:定义域、对应关系和值域.(3)相等函数:如果两个函数的定义域相同,并且对应关系完全一致,则这两个函数为相等函数. (4)函数的表示法:表示函数的常用方法有解析法、图像法和列表法. 3.分段函数若函数在其定义域内,对于定义域的不同取值区间,有着不同的对应关系,这样的函数通常叫作分段函数.分段函数是一个函数,分段函数的定义域是各段定义域的并集,值域是各段值域的并集.[知识拓展]1.函数与映射的本质是两个集合间的“多对一”和“一对一”关系.2.分段函数是高考必考内容,常考查(1)求最值;(2)求分段函数单调性;(3)分段函数解析式;(4)利用分段函数求值,解题的关键是分析用哪一段函数,一般需要讨论.[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)函数是特殊的映射.( )(2)函数y =1与y =x 0是同一个函数.( )(3)与x 轴垂直的直线和一个函数的图像至多有一个交点.( ) (4)分段函数是两个或多个函数.( ) [答案] (1)√ (2)× (3)√ (4)×2.(教材改编)函数y =2x -3+1x -3的定义域为( ) A.⎣⎢⎡⎭⎪⎫32,+∞ B .(-∞,3)∪(3,+∞) C.⎣⎢⎡⎭⎪⎫32,3∪(3,+∞) D .(3,+∞)C [由题意知⎩⎪⎨⎪⎧2x -3≥0,x -3≠0,解得x ≥32且x ≠3.]3.如图2­1­1所示,所给图像是函数图像的有( )图2­1­1A .1个B .2个C .3个D .4个B [(1)中,当x >0时,每一个x 的值对应两个不同的y 值,因此(1)不是函数图像;(2)中,当x =x 0时,y 的值有两个,因此(2)不是函数图像;(3)(4)中,每一个x 的值对应唯一的y 值,因此(3)(4)是函数图像,故选B.]4.设函数f (x )=⎩⎪⎨⎪⎧x 2+1,x ≤1,2x,x >1,则f (f (3))=________.139 [f (3)=23,f (f (3))=⎝ ⎛⎭⎪⎫232+1=139.]5.(2015·全国卷Ⅱ)已知函数f (x )=ax 3-2x 的图像过点(-1,4),则a =________.-2 [∵f (x )=ax 3-2x 的图像过点(-1,4), ∴4=a ×(-1)3-2×(-1),解得a =-2.](第9页)(1)(2018·济南一模)函数f (x )=2x-12+3x +1的定义域为________.(2)若函数y =f (x )的定义域为[0,2],则函数g (x )=f x x -1的定义域是________.(1)(-1,+∞) (2)[0,1) [(1)由题意得⎩⎨⎧2x -12≥0,x +1≠0,解得x >-1,所以函数f (x )的定义域为(-1,+∞).(2)由0≤2x ≤2,得0≤x ≤1,又x -1≠0,即x ≠1,所以0≤x <1,即g (x )的定义域为[0,1).]已知函数解析式,构造使解析式有意义的不等式组求解实际问题:由实际意义及使解析式有意义构成的不等式组求解抽象函数:①若已知函数x 的定义域为g x 的定义域由不等式x b 求出;②若已知函数g x 的定义域为x 的定义域为x 在时的值域.x 定义域为[m x 定义域,先求φx 值域[a a ≤h xb ,.[跟踪训练] (1)函数f (x )=1-x+lg(3x +1)的定义域是( )A.⎝ ⎛⎭⎪⎫-13,1 B.⎝ ⎛⎭⎪⎫-13,+∞C.⎝ ⎛⎭⎪⎫-13,13 D.⎝⎛⎭⎪⎫-∞,-13 (2)已知函数f (2x)的定义域为[-1,1],则f (x )的定义域为________.【79140019】(1)A (2)⎣⎢⎡⎦⎥⎤12,2 [(1)由题意可知{ 1-x >0,x +1>0,解得⎩⎨⎧x <1,x >-13,∴-13<x <1,故选A.(2)∵f (2x)的定义域为[-1,1], ∴12≤2x ≤2,即f (x )的定义域为⎣⎢⎡⎦⎥⎤12,2.](1)已知f ⎝⎛⎭⎪⎫x +1x =x 2+1x2,求f (x )的解析式;(2)已知f ⎝ ⎛⎭⎪⎫2x+1=lg x ,求f (x )的解析式;(3)已知f (x )是二次函数且f (0)=2,f (x +1)-f (x )=x -1,求f (x )的解析式;(4)已知f (x )+2f ⎝ ⎛⎭⎪⎫1x =x (x ≠0),求f (x )的解析式.[解] (1)由于f ⎝ ⎛⎭⎪⎫x +1x =x 2+1x2=⎝ ⎛⎭⎪⎫x +1x 2-2,令t =x +1x,当x >0时,t ≥2x ·1x=2,当且仅当x =1时取等号;当x <0时,t =-⎝ ⎛⎭⎪⎫-x -1x ≤-2,当且仅当x =-1时取等号,∴f (t )=t 2-2t ∈(-∞,-2]∪[2,+∞).综上所述.f (x )的解析式是f (x )=x 2-2,x ∈(-∞,-2]∪[2,+∞).(2)令2x +1=t ,由于x >0,∴t >1且x =2t -1,∴f (t )=lg2t -1,即f (x )=lg 2x -1(x >1). (3)设f (x )=ax 2+bx +c (a ≠0),由f (0)=2,得c =2,f (x +1)-f (x )=a (x +1)2+b (x +1)-ax 2-bx =x -1,即2ax +a +b =x -1,∴{ 2a =1,a +b =-1,即⎩⎨⎧a =12,b =-32,∴f (x )=12x 2-32x +2.(4)∵f (x )+2f ⎝ ⎛⎭⎪⎫1x =x ,∴f ⎝ ⎛⎭⎪⎫1x+2f (x )=1x.联立方程组⎩⎨⎧fx +2f ⎝ ⎛⎭⎪⎫1x =x ,f ⎝ ⎛⎭⎪⎫1x +2f x =1x ,解得f (x )=23x -x3(x ≠0).待定系数法:若已知函数的类型,可用待定系数法换元法:已知复合函数gx 的解析式,可用换元法,此时要注意新元的取值范围构造法:已知关于x 与f ⎝ ⎛⎭⎪⎫1x 或f -x 的表达式,可根据已知条件再构造出另外一个等式,通过解方程组求出x已知f x +1)=,求f (x )的解析式;(2)设y =f (x )是二次函数,方程f (x )=0有两个相等实根,且f ′(x )=2x +2,求f (x )的解析式. [解] (1)法一:(换元法)设x +1=t (t ≥1),则x =t -1,所以f (t )=(t -1)2+2(t -1)=t 2-1(t ≥1),所以f (x )=x 2-1(x ≥1).法二:(配凑法)f (x +1)=x +2x =(x +1)2-1, 又x +1≥1,所以f (x )=x 2-1(x ≥1). (2)设f (x )=ax 2+bx +c (a ≠0), 则f ′(x )=2ax +b =2x +2, 所以a =1,b =2,f (x )=x 2+2x +c . 又因为方程f (x )=0有两个相等的实根, 所以Δ=4-4c =0,c =1, 故f (x )=x 2+2x +1.◎角度1 求分段函数的函数值(2015·全国卷Ⅱ)设函数f (x )={ 1+log 2-x ,x <1,x -1,x ≥1,则f (-2)+f (log 212)=( )A .3B .6C .9D .12C [∵-2<1,∴f (-2)=1+log 2(2+2)=1+log 24=1+2=3. ∵log 212>1,∴f (log 212)=2log 212-1=122=6.∴f (-2)+f (log 212)=3+6=9.故选C.]。

高考数学一轮复习第十一章统计11.4统计案例习题理

高考数学一轮复习第十一章统计11.4统计案例习题理

§11.4 统计案例1.回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归模型用y =bx +a +e 表示,其中a 和b 为模型的未知参数,e 称为____________.它的均值满足E (e )=__________,D (e )=σ2,σ2越小,精度越________.(3)在具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,回归方程的斜率和截距的最小二乘估计公式分别为:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=---=∑∑==.ˆˆ)())((ˆ121x b y ax x y y x x b ni i ni i i 其中x =1n ∑=ni i x 1,y =1n ∑=ni i y 1, 称为样本点的中心.(4)残差:i eˆ= 称为相应于点(i x ,i y )的残差,残差平方和为 . (5)相关指数R 2= . R 2越大,说明残差平方和 ,即模型的拟合效果 ;R2越小,残差平方和 ,即模型的拟合效果 .在线性回归模型中,R 2表示解释变量对于预报变量变化的 ,R 2越接近于1,表示回归的效果 .2. 独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为___________.(2)像下表所示列出两个分类变量的频数表,称为___________.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2 },其样本频数列联表(称为2×2列联表)为y 1 y 2 总计x 1 a b a+b x 2c d c+d 总计a+c b+d a+b+c+d构造一个随机变量K 2=___________, 其中n =a+b+c+d 为样本容量.如果K 2的观测值k ≥k 0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的k 0为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过P (K 2≥k 0).上面这种利用随机变量K 2来判断“两个分类变量有关系”的方法称为___________.自查自纠1. (2) 随机误差 0 高 (3)(x ,y )(4)i i yy ˆ- ∑=-ni i iyy12)ˆ((5)1-∑∑==--n i ini i iy yyy1212)()ˆ( 越小 越好 越大 越差 贡献率 越好2.(1)分类变量(2)列联表n (ad -bc )2(a +b )(c +d )(a +c )(b +d )独立性检验r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强;③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1B .2C .3D .4解:|r|越大,两变量相关性越强.故选D .在回归分析中,代表了数据点和它在回归直线上相应位置差异的是( ) A .总偏差平方和 B .残差平方和 C .回归平方和D .相关指数R 2解:残差平方和描述了数据点和它在回归直线上相应位置的差异,故选B .利用独立性检验来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可P (K 2≥k 0) 0.500.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果K 2≥5.024,那么有把握认为“X 与Y 有关系”的百分数为( ) A .25% B .75% C .2.5% D .97.5%解:∵K 2≥5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X 和Y 有关系”.故选D .在回归分析中,相关指数R 2的值越大,说明残差平方和________. 解:R 2越大,残差平方和越小,故填越小. 下面是一个2×2列联表y 1 y 2总计 x 1 a21 73 x 21225 37 总计b46则表中a ,b 处的值分别为________.解:∵a +21=73,∴a =52.又∵a +12=b ,∴b =64.故填52,64.类型一回归分析的相关概念(1)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( )A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25解:相关指数越大,模型拟合效果越好.故选A.(2)下列四个命题:①残差平方和越小的模型,拟合的效果越好;②用相关指数R2来刻画回归效果,R2越小,说明模型拟合的效果越好;③散点图中所有点都在回归直线附近;④随机误差e满足E(e)=0,其方差D(e)的大小可用来衡量预报精确度.其中正确命题的个数是( )A.1 B.2 C.3 D.4解:②中R2越大,拟合效果越好;③中回归直线同样可以远远偏离变异点;①④正确.注意④,e是随机变量,其方差衡量预报精度.故选B.【点拨】回归模型的诊断主要是看残差图上、下是否大致均匀分布.另外相关指数R2也决定着模型拟合的优劣,R2越大,模型拟合效果越好.而随机误差e满足E(e)=0,D(e)=σ2,σ2越小,线性回归模型预报真实值的精度越高.(1)如图的5个数据,去掉D(3,10)后,下列说法错误..的是( )A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解:观察可知,去掉D(3,10)后,拟合效果更好.因此相关系数变大,残差平方和变小,相关指数变大,解释变量与预报变量的相关性变强.故选B.(2)给出下列结论:①回归分析中,可用相关指数R2判断模型的拟合效果,R2越大,模型的拟合效果越好;②回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;③回归分析中,可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好;④回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的个数为( )A.1 B.2 C.3 D.4解:②的判断正好相反;③应改为|r|越大,模型拟合效果越好,①④正确.故选B.类型二回归分析(1)已知某商品的价格x 1416182022y 121075 3 (Ⅰ)画出y关于x的散点图;(Ⅱ)用最小二乘法求出回归直线方程;(Ⅲ)计算R2的值,并说明回归模型拟合程度的好坏.解:(Ⅰ)散点图如图所示.(Ⅱ)18=x,4.7=y,∑==5121660iix,∑==51620iiiyx,所以15.155ˆ512251-=--=∑∑==iiixxyxyxbii,1.28ˆˆ=-=x bya,yˆ=-1.15x+28.1.(Ⅲ)列出残差表:y i-iyˆ00.3-0.4-0.10.2y i-y 4.6 2.6-0.4-2.4-4.4 所以3.0)ˆ(512=-∑=iiiyy,.2.53)(512=-∑=iiyy.994.0)()ˆ(15125122≈---=∑∑==iiiiiyyyyR所以,回归模型拟合效果很好.【点拨】用相关指数R 2来刻画回归效果,R 2越大,说明模型拟合的效果越好.另外,计算也不能出错.※(2)下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归方程.使用 年数 x1 2 3 4 5 6 7 8 9 10年均 价格 y (美元)2651 1943 1494 1087 765 538 484 290 226 204 解:作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此y 与x 之间应是非线性相关关系.与已学函数图象比较,用a x b y ˆˆe ˆ+=来刻画题中模型更为合理,令z ˆ=ln y ˆ,则z ˆ=b ˆx +a ˆ,题中数据如下表所示: x 1 2 3 4 5 6 7 8 9 10 z 7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据得bˆ≈-0.298, aˆ=6.527-(-0.298)×5.5≈8.166, 故回归直线方程为zˆ=-0.298x +8.166. 则yˆ=e z ˆ=e -0.298x +8.166. 【点拨】①对于非线性(可线性化)回归分析,可通过散点图直观找到函数类型,再通过变换z =f(y)变为线性回归问题;②常用的函数类型有f(x)=k e bx +a ,f(x)=k ln x, f(x)=kx 2, f(x)=kx 3,f(x)=k x等.(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t )和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x.根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为β^=∑∑==--ni ini i u uv u u u121i)()()-(,α^=v -β^u .解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑∑==--81281i)()()-(i ii iw w y y w w =6.18.108=68,c ^=y -d ^w =563-68×6.8=100.6.所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x.(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x)-x =-x +13.6x +20.12=-(x -6.8)2+6.82+20.12.所以当x =6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.类型三 独立性检验的相关概念(1)独立性检验中的统计假设就是假设相关事件A ,B( ) A .互斥B .不互斥C .相互独立D .不独立解:独立性检验中的假设是H 0:A ,B 独立,当我们拒绝H 0时,A ,B 就相关了.故选C .(2)下列说法中正确的是( )①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断;③独立性检验一定能给出明确的结论.A.①②B.①③C.②③D.①②③解:假设检验的基本思想是:“在一次试验中,小概率事件不可能发生”,若小概率事件发生了,则有理由认为原假设不成立,故①②正确,当小概率事件没有发生,则不能拒绝原假设但也不能够肯定原假设,此时结论不明确,③不正确.故选A.【点拨】如果K2的观测值k很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H0.(1)想要检验是否喜欢参加体育活动是不是与性别有关,应检验( )A.H0:男生喜欢参加体育活动B.H0:女生不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关解:独立性检验中的假设是喜欢参加体育活动与性别无关,当我们拒绝喜欢参加体育活动与性别无关时,喜欢参加体育活动与性别就相关了.故选D.(2)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法均不正确解:独立性检验的结论仅仅是一种数学关系,得出的结论也可能犯错误.有95%的把握认为吸烟与患肺病有关系,也可以说这个结论出错的概率为0.05以下,这是数学中的统计思维与确定性思维差异的反映.故选C.类型四独立性检验(2015·福建模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表优秀非优秀总计甲班10乙班30合计105已知从全部105人中随机抽取1人为优秀的概率为7.(1)请完成上面的列联表;(2)根据列联表的数据,能否有95%的把握认为“成绩与班级有关系”?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P (K 2≥k 0)0.05 0.01 k 03.8416.635解:(1)列联表如下:优秀 非优秀 总计 甲班 10 45 55 乙班 20 30 50 合计3075105(2)根据列联表中的数据,得K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.【点拨】在利用2×2列联表计算K 2的值之前,应先假设两个分类变量是无关的,最后再利用K 2的值的大小对二者关系进行含概率的判断.(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )成绩性别不及格 及格 总计 男 6 14 20 女 10 22 32 总计16 3652视力 性别好 差 总计 男 4 16 20 女 12 20 32 总计163652智商性别偏高 正常 总计 男 8 12 20 女 8 24 32 总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩 B.视力 C.智商 D.阅读量解:K21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别关联的可能性最大.故选D.1.线性回归分析的方法、步骤(1)画出两个变量的散点图;(2)求相关系数r,并确定两个变量的相关程度的高低;(3)用最小二乘法求回归直线方程yˆ=bˆx+aˆ,⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.ˆˆ,)())((ˆ1221121x byax nxy x nyxxxyyxxbniiniiiniiniii(4)利用回归直线方程进行预报.注:①对于非线性(可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原.②利用相关指数R2=1-∑∑==--niiniiiyyyy1212)()ˆ(刻画回归效果时,R2越大,意味着残差平方和∑=-niiiyy12)ˆ(越小,模型的拟合效果越好.2.独立性检验的一般步骤(1)假设两个分类变量x与y没有关系;(2)计算出K2的观测值,其中K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d);(3)把K 2的值与临界值比较,作出合理的判断. 3.独立性检验的注意事项(1)在列联表中注意事件的对应及相关值的确定,不可混淆.(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.1.一位母亲记录了儿子3~9岁的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归方程为y ˆ=7.19x +73.93.用这个方程预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高在145.83 cm 左右解:回归模型的预报值是一种估计值,故选D .2.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的回归系数为bˆ,回归截距是aˆ,那么必有( ) A .bˆ与r 的符号相同 B .a ˆ与r 的符号相同 C .bˆ与r 的符号相反 D .a ˆ与r 的符号相反 解:根据bˆ和r 的定义公式可知A 正确,故选A . 3.设()x 1,y 1,()x 2,y 2,…,()x n ,y n 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )解:选项具体分析结论A 相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同不正确 B相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量为负相关 不正确Cl 两侧的样本点的个数分布与n 是奇是偶无关,也不一定是平均分布不正确D 由于aˆ=y -b ˆx ,即y =b ˆx +a ˆ,因正确故选D .4.在对两个分类变量A 与B 进行的独立性检验中,当K 2>3.841时,我们认为A 与B ( ) A .有95%的把握有关 B .有99%的把握有关 C .没有理由说它们有关 D .不确定解:∵K 2>3.841,∴有95%的把握认为A ,B 有关.故选A .5.如果女大学生身高x (cm)与体重y (kg)的关系满足线性回归模型y =0.85x -88+e ,其中|e |≤4,如果已知某女大学生身高160 cm ,则体重预计不会低于( )A .44 kgB .46 kgC .50 kgD .54 kg解:由||e =||y -0.85x +88≤4,得0.85x -92≤y ≤0.85x -84,当x =160时,44≤y ≤52.故选A . 6.(2013·湖北模拟)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,由表中数据,求得线性回归方程为y =-20x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( ) A.12B.13C.14D.15 解:易得x =8.5,y =80,故a ^=y -b ^x =80-(-20)×8.5=250,∴y ^=-20x +250,写成y ^+20x -250=0,令f (x ,y )=y +20x -250,由f (0,0)<0且点(0,0)在回归直线的左下方可知,满足f (x ,y )<0的数据点均在回归直线的左下方,逐一验证可知使f (x ,y )<0的是(8.2,84)和(9,68)两组数据点.故所求概率为P =26=13.故选B . 7.某校为了研究学生的性别与对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.669,则所得到的统计学结论是:有________%的把握认为“学生性别与支持该活动有关系”.附:P (K 2≥k 0) 0.100 0.050 0.025 0.010 0.001k 02.7063.841 5.024 6.635 10.828解:因为6.669与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.故填99.8.若一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间满足y i =bx i +a +e i (i =1,2,…,n ),若e i 恒为0,则R 2为________.解:此时回归方程为yˆ=bx +a ,故y ˆi =y i ,∴R 2=1-∑∑==--n i ini i iy yyy1212)()ˆ(=1.故填1.9. 对于数据:x 1 2 3 4y 2 3 4 5两位同学分别给出了拟合直线y ˆ=x +1和y ˆ=0.9x +1.2,试利用“最小二乘法”理论解释两条直线的拟合效果.解:对于拟合直线yˆ=x +1:∑=-412)ˆ(i i iyy=0. 对于拟合直线yˆ=0.9x +1.2: ∑=-412)ˆ(i i iyy=(-0.1)2+02+0.12+0.22=0.06>0, 因而拟合直线yˆ=x +1的拟合效果更好. 事实上,拟合直线yˆ=x +1应是针对这组数据的所有拟合直线中最优的. 10.(2015·河北模拟)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修该课程的(1)判断是否有99.5%的把握认为喜欢“应用统计”课程与性别有关?(2)用分层抽样的方法从喜欢“应用统计”课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d)解:(1)∵K 2=55×(20×20-10×5)230×25×25×30≈11.978>7.879,∴有99.5%的把握认为喜欢“应用统计”课程与性别有关.(2)设所抽样本中有m 个男生,则630=m 20,得m =4,∴样本中有4个男生,2个女生.从中任选2人有C 26=15种情形,其中恰有1个男生和1个女生的有C 14·C 12=8种情形,所求概率P =815.11.(2014·辽宁)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:南方学生 60 20 80 北方学生 10 10 20 合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”; (2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),P(K 2≥k)0.100 0.050 0.010 k2.7063.8416.635解:(1)将2×2列联表中的数据代入公式计算,得K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(60×10-20×10)270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. (2)从5名数学系学生中任取3人有C 35=10种情形,其中至多有1人喜欢甜品的有C 33+C 12C 23=7种,故所求概率P =710.(2015·贵州模拟)某校学习小组开展“学生语文成绩与外语成绩的关系”的课题研究,对该校高二年级800名学生上学期期末语文和外语成绩按优秀和不优秀分类:语文和外语都优秀的有60人,语文成绩优秀但外语不优秀的有140人,外语成绩优秀但语文不优秀的有100人.(1)能否在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系?(2)将上述调查所得的频率视为概率,从该校高二年级学生成绩中,有放回地随机抽取3名学生的成绩,记抽取的3名学生成绩中语文、外语两科至少有一科优秀的个数为X ,求X 的分布列和期望E(X).P(K 2≥k 0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 01.3232.0722.7063.8415.0246.6357.87910.828解:(1) 语文优秀 语文不优秀总计 外语优秀 60 100 160 外语不优秀140 500 640 总计200600800∵K 2=800160×640×200×600≈16.667>10.828,∴能在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系.(2)由已知数据,语文、外语两科成绩至少一科为优秀的频率是38,则X ~B ⎝ ⎛⎭⎪⎫3,38,P(X =k)=C k 3⎝ ⎛⎭⎪⎫38k ⎝ ⎛⎭⎪⎫583-k ,k =0,1,2,3. X 的分布列为E(X)=3×38=98.一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.下列抽样中不是系统抽样的是( )A .从标有1~15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点i 0,以后i 0+5,i 0+10(超过15则从1再数起)号入样B .工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品进行检验C .搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D .电影院调查观众的某一指标,通知每排(每排人数相同)座位号为14的观众留下来谈 解:选项C 为简单随机抽样,其余选项为系统抽样.故选C .2.有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号可以是( ) A .5,10,15,20,25 B .5,15,20,35,40 C .5,11,17,23,29 D .10,20,30,40,50 解:间隔为10.故选D .3.(2015·湖南模拟)某工厂有3个车间,在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行检查,若从第一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500解:∵a ,b ,c 成等差数列,∴2b =a +c ,第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的三分之一,即3600×13=1200(双).故选C .4.在检验某产品直径尺寸的过程中,将尺寸数据分成若干组,[a ,b )是其中的一组,抽查出的个体数在该组上的频率为m ,该组在频率分布直方图上的高为h ,则|a -b |=( )A.m hB.h mC .mhD .与h ,m 无关解:根据频率分布直方图的概念可知,|a -b |×h =m ,由此可知|a -b |=m h.故选A .5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1解:因为所有点都分布在一条直线上,说明相关性很强,且正相关系数达到最大值,即为1.故选D .6.(2014·广东)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生的近视人数分别为( )A .100,10B .200,10C .100,20D .200,20解:样本容量为(3500+4500+2000)×2%=200,抽取的高中生人数为2000×2%=40,由于高中生的近视率为50%,所以抽取的高中生近视人数为40×50%=20.综上知,故选D .7.通过随机询问110男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=n (ad -bc 2(a +b )(c +d )(a +c )(b +d )算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解:由K 2≈7.8>6.635,而P (K 2≥6.635)=0.010,故由独立性检验的意义可知,有99%以上的把握认为“爱好该项运动与性别有关”.故选A .8.(2015·兰州模拟)对具有线性相关关系的变量x ,y ,有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+…+y 8)=6,则实数a ^的值是( )A.116B.18C.14D.12解:依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18.故选B . 9.(2013·湖北)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确...的结论的序号是( ) A .①② B .②③ C .③④ D .①④解:当y 与x 正相关时,应满足斜率大于0;当y 与x 负相关时,应满足斜率小于0,故①④一定不正确.故选D .10.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解:样本数据每个都加2后所得数据的波动情况并没有发生改变,所以标准差不变.故选D .11.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为s 21=15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,s 22=15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 正确;甲、乙的成绩的极差均为4,D 错.故选C .12.(2013·福建)已知x 与y x 1 2 3 4 5 6y2 13 3 4假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′解:由题意得n =6,x =1+2+3+4+5+66=72,y =0+2+1+3+3+46=136,b ^=∑∑==--ni i ni i i x n xyx n y x 1221=58-45.591-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13.∵直线y =b ′x +a ′过两点(1,0)和(2,2),∴b ′=2-02-1=2,把点(1,0)代入y =2x +a ′得a ′=-2.通过比较可得b ^<b ′,a ^>a ′.故选C .二、填空题:本大题共4小题,每小题5分,共20分.13.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解:分层抽样中各层的抽样比相同.样本中甲设备生产的有50件,则乙设备生产的有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品总数为4 800×38=1 800件.故填1800.14.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出的职工号码为____________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本方差为____________. 解:(1)由分组可知,抽号的间隔为8,又第1组抽出的号码为2,所以所有被抽出的职工号码为2,10,18,26,34.(2)由茎叶图知5名职工体重的平均数x =59+62+70+73+815=69,则该样本的方差s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.故填2,10,18,26,34;62.15.(2015·江苏模拟)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生人数是____________.解:由频率分布直方图知,随机抽取的200名学生中成绩小于60分的学生人数是(0.002+0.006+0.012)×10×200=40,设这3000名学生中该次数学成绩小于60分的学生人数为x ,则40x =2003 000,解得x =600.故填600.16.(2015·武汉模拟)利用独立性检验来判断两个分类变量X 和Y 是否有关系,通过查阅下表来确定“X 和Y 有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得K 2≈3.855,那么,在犯错误的概率不超过____________的前提下认为用电脑时间与视力下降有关系.。

2021版高考数学一轮复习第十一章统计与统计案例第2讲用样本估计总体教学案理北师大版

2021版高考数学一轮复习第十一章统计与统计案例第2讲用样本估计总体教学案理北师大版

第2讲 用样本估计总体一、知识梳理 1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图. (2)频率分布折线图①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a nn称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]常用结论1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率组距. (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 二、教材衍化1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4 B .8 C .12D .16解析:选B.设频数为n ,则n32=0.25,所以n =32×14=8. 2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92解析:选A.因为这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人.解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.答案:254.甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲0 1 0 2 2 0 3 1 2 4乙 2 3 1 1 0 2 1 1 0 1则机床性能较好的为________.解析:因为x甲=1.5,x乙=1.2,s2甲=1.65,s2乙=0.76,所以s2乙<s2甲,所以乙机床性能较好.答案:乙一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( )答案:(1)√(2)√(3)×(4)√(5)√二、易错纠偏常见|K(1)平均数与方差的性质理解出错;误区(2)中位数、众数、平均数的求法不清导致出错.1.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( )A .5,2B .16,2C .16,18D .16,9解析:选C.因为x 1,x 2,x 3,…,x n 的平均数为5,所以x 1+x 2+x 3+…+x nn=5,所以3x 1+3x 2+3x 3+…+3x nn+1=3×5+1=16,因为x 1,x 2,x 3,…,x n 的方差为2,所以3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18.故选C.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)解析:由题图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n <m <x . 答案:n <m <x茎叶图(自主练透)1.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析:选A.根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以56+62+65+74+(70+x )5=59+61+67+(60+y )+785,解得x =3.故选A.2.(2020·陕西渭南模拟)已知甲,乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,每组投中个数的茎叶图如图所示,则下列结论错误的是( )A .甲投中个数的极差是29B .乙投中个数的众数是21C .甲的投中率比乙高D .甲投中个数的中位数是25解析:选D.由茎叶图可知甲投中个数的极差为37-8=29,故A 正确;易知乙投中个数的众数是21,故B 正确;甲的投中率为8+12+13+20+22+24+25+26+27+3740×10=0.535,乙的投中率为9+11+13+14+18+19+20+21+21+2340×10=0.422 5,所以甲的投中率比乙高,C 正确;甲投中个数的中位数为22+242=23,D 不正确,故选D.3.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )A .117B .118C .118.5D .119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76, 所以此学生该门功课考试分数的极差与中位数之和为42+76=118.茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.频率分布直方图(多维探究)角度一求样本的频率、频数(2020·湖南五市十校联考)在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.39 B.35C.15 D.11【解析】由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78.所以成绩在[13,15)内的频率为1-0.78=0.22.则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.【答案】 D角度二求样本的数字特征(2019·高考全国卷Ⅲ改编)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.角度三与概率结合的问题(2020·安徽芜湖一模)某社区为了解该社区退休老人每天的平均户外活动时间,从该社区退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.(1)求图中a 的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在[1,1.5),[1.5,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.【解】 (1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,由1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a +0.5a , 解得a =0.30. (2)设中位数为m 时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m <2.5. 所以0.50×(m -2)=0.5-0.47,解得m =2.06.故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时. (3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20. 按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人,4人,从7人中随机抽取2人,共有C 27=21种方法,抽取的两人恰好都在同一个组有C 24+C 23=9种方法,故抽取的2人恰好在同一个组的概率P =921=37.频率、频数、样本容量的计算方法频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.[提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.1.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A.15 B.18C.20 D.25解析:选A.根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故选A.2.(2020·安徽淮南二模)某乡镇为了打赢脱贫攻坚战,决定盘活贫困村的各项经济发展要素,实施了产业、创业、就业“三业并举”工程.在实施过程中,引导某贫困村农户因地制宜开展种植某经济作物.该类经济作物的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k,其质量指标的等级划分如表:质量指标值k 产品等级k≥90优秀80≤k<90良好75≤k<80合格k<75不合格并随机抽取了甲、乙两个不同品种的各10 000件产品,测量了每件产品的质量指标值,得到下面产品质量指标值频率分布直方图(图甲和图乙).(1)若将频率视为概率,从乙品种产品中有放回地随机抽取3件,记“抽出乙品种产品中至少有1件优等品(质量指标值k≥80为优等品)”为事件A,求事件A发生的概率P(A);(结果保留小数点后3位)(2)若甲、乙两个品种的销售利润率y与质量指标值k满足下表:质量指标值k k ≥9080≤k <90 75≤k <80 k <75销售利润率y3t5t 2t 2-t其中16<t <4.试分析,从长期来看,种植甲、乙哪个品种的平均利润率较大?解:(1)设“从乙品种产品中抽取1件为优等品”的概率为P ,则根据频率分布直方图可得P =(0.03+0.08+0.04+0.02)×5=0.85,则P (A )=1-C 33(1-P )3=1-0.153≈0.997.(2)由频率分布直方图可得,甲品种产品的利润率的分布列为y 3t 5t 2t 2P0.20.70.1Ey 甲=0.2×3t +0.7×5t 222乙品种产品的利润率的分布列为y 3t 5t 2t 2-t P0.30.550.10.05Ey 乙=0.3×3t 222+0.85t .Ey 甲-E (y )乙=3.6t 2+0.6t -(2.85t 2+0.85t )=0.75t 2-0.25t =0.25t (3t -1),由于16<t <14,所以Ey 甲-Ey 乙<0,即Ey 甲<Ey 乙.故种植乙品种的平均利润率较大.样本数字特征的求解与应用(师生共研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892(1)(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价.【解】 (1)x 甲=15(87+91+90+89+93)=90, x 乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.故填2.(2)①由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13; x 乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4; s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述;②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)在计算平均数、方差时可利用平均数、方差的有关结论.1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:选C. x 甲=15(4+5+6+7+8)=6, x 乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2, 乙的成绩的方差为15(12×3+32×1)=2.4. 甲的成绩的中位数为6,乙的成绩的中位数为5,甲的成绩的极差为4,乙的成绩的极差为4,故选C.2.(2020·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩x 甲=68+76+79+86+88+956=82, 学生乙的平均成绩x 乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x 甲=x 乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.[基础题组练]1.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A.记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.(2020·陕西商洛质检)在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩性为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )A .95B .96C .97D .98解析:选C.由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为88+94+99+1074=97,故选C. 3.(2020·广东珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20元,二等奖10元,三等奖5元,参与奖2元,获奖人数的分配情况如图所示,则以下说法不正确的是( )A .获得参与奖的人数最多B .各个奖项中三等奖的总费用最高C .购买奖品的平均费用为9.25元D .购买奖品的费用的中位数为2元解析:选C.设全班人数为a .由扇形统计图可知.一等奖占5%,二等奖占10%,三等奖占30%,参与奖占55%,获得参与奖的人数最多,故A 正确;一等奖的总费用为5%a ×20=a .二等奖的总费用为10%a ×10=a ,三等奖的总费用为30%a ×5=32a ,参与奖的总费用为55%a×2=1110a ,所以各个奖项中三等奖的总费用最高,故B 正确;购买奖品的平均费用为5%×20+10%×10+30%×5+55%×2=4.6(元),故C 错误;参与奖占55%,所以购买奖品的费用的中位数为2元,故D 正确.故选C.4.(2020·安徽六安毛坦厂中学月考)某位教师2017年的家庭总收入为80 000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4 750元,则该教师2018年的家庭总收入为( )A .100 000元B .95 000元C .90 000元D .85 000元解析:选D.由已知得,2017年的就医费用为80 000×10%=8 000(元).故2018年的就医费用为8 000+4 750=12 750(元),所以该教师2018年的家庭总收入为12 75015%=85 000(元).故选D.5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x 甲,x 乙,标准差分别为σ甲,σ乙,则( )A.x甲<x乙,σ甲<σ乙B.x甲<x乙,σ甲>σ乙C.x甲>x乙,σ甲<σ乙D.x甲>x乙,σ甲>σ乙解析:选C.由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知x甲>x乙,题图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.6.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m 的值是________.解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m+5)=88,解得m=3.由乙组学生成绩的中7位数是89,可得n=9,所以n-m=6.答案:67.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.解析:由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数为40×50%=20.答案:200 208.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60. 答案:609.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a 的值;(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1,解得a =0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,所以2.5≤x <3.由0.3×(x -2.5)=0.85-0.73,解得x =2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.10.有A ,B ,C ,D ,E 五位工人参加技能竞赛培训.现分别从A ,B 二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A ,B 二人预赛成绩的中位数分别是多少?(2)现要从A ,B 中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由;(3)若从参加培训的5位工人中选2人参加技能竞赛,求A ,B 二人中至少有一人参加技能竞赛的概率.解:(1)A 的中位数是83+852=84,B 的中位数是84+822=83. (2)派B 参加比较合适.理由如下: x B =18(78+79+81+82+84+88+93+95)=85, x A =18(75+80+80+83+85+90+92+95)=85,s 2B =18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2A =18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,因为x A =x B ,但s 2B <s 2A ,说明B 稳定,派B 参加比较合适.(3)5位工人中选2人有10种:(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),(D ,E );A ,B 都不参加的有3种:(C ,D ),(C ,E ),(D ,E ), A ,B 二人中至少有一人参加技能竞赛的概率P =1-310=710.[综合题组练]1.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A 县、B 县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A 县、B 县两个地区浓度的方差较小的是( )A .A 县B .B 县C .A 县、B 县两个地区相等D .无法确定解析:选A.根据茎叶图中的数据可知,A 县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B 县的数据分布比较分散,不如A 县数据集中,所以A 县的方差较小.2.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4解析:选D.由题意知这组数据的平均数为10,方差为2,可得:x +y =20,(x -10)2+(y -10)2=8, 设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8,得t 2=4,所以|x -y |=2|t |=4.3.设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________. 解析:设样本数据的平均数为x ,则y i =2x i -1的平均数为2x -1,则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2+…+(2x 2 017-1-2x +1)2]=4×12 017[(x 1-x )2+(x 2-x )2+…+(x 2 017-x )2]=4×4=16. 答案:164.我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y成等比数列,则1a +4b的最小值为________.解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =(1a +4b )×(a 4+b 4)=14(1+b a +4a b +4)≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94. 答案:945.(2020·东北三省三校二模)一个经销鲜花产品的微店,为保障售出的百合花品质,每天从某省鲜花基地空运固定数量的百合花,如有剩余则免费分赠给第二天购花顾客,如果不足,则从本地鲜花供应商处进货.今年四月前10天,微店百合花的售价为每支2元,某省空运来的百合花每支进价1.6元,本地供应商处的百合花每支进价1.8元,微店这10天的订单中百合花的日需求量(单位:支)依次为:251,255,231,243,263,241,265,255,244,252.(1)求今年四月前10天订单中百合花日需求量的平均数和众数,并完成频率分布直方图;(2)预计四月的后20天,订单中百合花日需求量的频率分布与四月前10天相同,百合花进货价格与售价均不变,请根据(1)中频率分布直方图判断(同一组中的需求量数据用该组区间的中点值作代表,位于各区间的频率代替位于该区间的概率),微店每天从某省固定空运250支,还是255支百合花,四月后20天百合花销售总利润会更大?解:(1)四月前10天订单中百合需求量众数为255,平均数x =110×(231+241+243+244+251+252+255+255+263+265)=250. 频率分布直方图如图:(2)设订单中百合花的日需求量为a (支),由(1)中频率分布直方图知,a 可能取值为235,245,255,265,相应频率分别为0.1,0.3,0.4,0.2.所以20天中a =235,245,255,265相应的天数为2天,6天,8天,4天.①若空运250支,a =235,当日利润为235×2-250×1.6=70(元),a =245,当日利润为245×2-250×1.6=90(元),a =255,当日利润为255×2-250×1.6-5×1.8=101(元),a =265,当日利润为265×2-250×1.6-15×1.8=103(元),20天总利润为70×2+90×6+101×8+103×4=1 900(元).②若空运255支,a =235,当日利润为235×2-255×1.6=62(元),a =245,当日利润为245×2-255×1.6=82(元),a =255,当日利润为255×2-255×1.6=102(元),a =265,当日利润为265×2-255×1.6-10×1.8=104(元),20天总利润为62×2+82×6+102×8+104×4=1 848(元).因为1 900>1 848,所以每天空运250支百合花,四月后20天总利润更大.6.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.解:(1) x 甲 =18(7+9+11+13+13+16+23+28)=15,x 乙=18(7+8+10+15+17+19+21+23)=15,s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75, s 2乙=18[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,高考总复习21 两人失分均超过15分的概率为P 1P 2=316,X 的所有可能取值为0,1,2.依题意,X ~B ⎝ ⎛⎭⎪⎫2,316,P (X =k )=C k 2⎝ ⎛⎭⎪⎫316k⎝ ⎛⎭⎪⎫13162-k ,k =0,1,2,则X 的分布列为X 的均值EX =2×16=8.。

2019届高考数学大一轮复习 第十一章 统计与统计案例 11.1学案 理 北师大版

2019届高考数学大一轮复习 第十一章 统计与统计案例 11.1学案 理 北师大版

§11.1随机抽样最新考纲考情考向分析1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法. 在抽样方法的考查中,系统抽样,分层抽样是考查的重点,题型主要以选择题和填空题为主,属于中低档题.1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.(2)总体和样本调查对象的全体称为总体,被抽取的一部分称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率相同.(2)通常采用的简单随机抽样的方法:抽签法和随机数法.3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)抽签法中,先抽的人抽中的可能性大.( ×)(4)系统抽样在第1段抽样时采用简单随机抽样.( √)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ×)题组二教材改编2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.4.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是( )A.10 B.11 C.12 D.16答案 D解析从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三易错自纠5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ) A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32答案 B解析间隔距离为10,故可能的编号是3,13,23,33,43.6.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案 1 800解析分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件.题型一简单随机抽样1.某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是( )A.这次抽样中可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率答案 A解析利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D 均错误,故选A.2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )7816657208026314070243699728019832049234493582003623486969387481A.08 B .07 C .02 D .01 答案 D解析 由题意知前5个个体的编号为08,02,14,07,01.3.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14B.13 C.514 D.1027答案 C 解析 由题意知9n -1=13,得n =28,所以整个抽样过程中每个个体被抽到的概率为1028=514,故选C.思维升华 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.题型二 系统抽样典例 (1)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示: 13 0 0 3 4 5 6 6 8 8 8 9 14 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0122333若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A .3 B .4 C .5 D .6 答案 B解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]内的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. 引申探究1.若本例(2)中条件不变,若号码“5”被抽到,那么号码“55”________被抽到.(填“能”或“不能”) 答案 不能解析 若55被抽到,则55=5+20n ,n =2.5,n 不是整数.故不能被抽到.2.若本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. 跟踪训练 将参加夏令营的600名学生按001,002,…,600进行编号.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分别住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N +)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17;第Ⅲ营区被抽中的人数为50-25-17=8.题型三 分层抽样命题点1 求总体或样本容量典例 (1)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A .9 B .10 C .12 D .13 答案 D解析 ∵360=n 120+80+60,∴n =13.(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A .54 B .90 C .45 D .126 答案 B解析 依题意得33+5+7×n =18,解得n =90,即样本容量为90.命题点2 求某层入样的个体数典例 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师的人数为( )A.90 B .100 C .180 D .300 答案 C解析 由题意得抽样比为3201 600=15,∴该样本中的老年教师的人数为900×15=180.(2)(2017·重庆一诊)我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人 C .112人D .120人答案 B解析 由题意可知,这是一个分层抽样的问题,其中北乡可抽取的人数为300×8 1008 100+7 488+6 912=300×8 10022 500=108,故选B.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.跟踪训练 (1)(2017·南昌一模)某校为了了解学生学习的情况,采用分层抽样的方法从高一1 000人,高二1 200人,高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n 等于( ) A .860 B .720 C .1 020 D .1 040答案 D解析 分层抽样是按比例抽样的,所以81× 1 2001 000+1 200+n=30,解得n =1 040.(2)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.答案 200,20解析 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.五审图表找规律典例 (12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404080200中年80120160240600青年40160280720 1 200共计160320480 1 040 2 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对天津全运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个25人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对天津全运会举办情况的了解↓ 可认为全运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体↓(从表中数据看总人数为2 000)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层用分层抽样法抽取,[1分]抽取比例为402 000=150.[2分]故老年人、中年人、青年人各抽取4人,12人,24人.[4分] (2)按管理、技术开发、营销、生产分层用分层抽样法抽取,[5分] 抽取比例为252 000=180,[6分]故管理、技术开发、营销、生产各部门分别抽取2人,4人,6人,13人.[8分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.(2018·广东茂名月考)在一个容量为N 的总体中抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3答案 D解析 由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D. 2.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,则这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法 答案 A解析 符合系统抽样的特点,故选A.3.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310 答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个样本编号为( ) A .700 B .669 C .695 D .676 答案 C解析 由题意可知,第一组随机抽取的编号为015,分段间隔数k =N n =1 00050=20,由题意知抽出的这些号码是以15为首项,20为公差的等差数列,则抽取的第35个样本编号为15+(35-1)×20=695.5.某工厂的一、二、三车间在11月份共生产了3 600双皮靴,在出厂前检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 成等差数列,则二车间生产的产品数为( ) A .800 B .1 000 C .1 200 D .1 500答案 C解析 因为a ,b ,c 成等差数列,所以2b =a +c ,所以从二车间抽取的产品数占抽取产品总数的13,根据分层抽样的性质可知,二车间生产的产品数占产品总数的13,所以二车间生产的产品数为3 600×13=1 200.故选C.6.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15 答案 C解析 由系统抽样的特点知,抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 7.(2018·湖南怀化模拟)某电视台为了调查“爸爸去哪儿”节目的收视率,现用分层抽样的方法从4 300人中抽取一个样本,这4 300人中青年人1 600人,且中年人人数是老年人人数的2倍,现根据年龄采用分层抽样的方法进行调查,在抽取的样本中青年人有320人,则抽取的样本中老年人的人数为( ) A .90 B .180 C .270 D .360 答案 B解析 设老年人有x 人,从中抽取y 人,则1 600+3x =4 300,得x =900,即老年人有900人,则9001 600=y 320,得y =180.故选B.8.(2017·雅礼中学月考)某中学教务处采用系统抽样方法,从学校高三年级全体1 000名学生中抽50名学生做学习状况问卷调查.现将1 000名学生从1到1000进行编号,求得间隔数k =20,即分50组每组20人.在第一组中随机抽取一个号,如果抽到的是17号,则第8组中应抽取的号码是( ) A .177 B .157 C .417 D .367 答案 B解析 根据系统抽样的特点可知,抽取出的编号成首项为17,公差为20的等差数列,所以第8组应抽取的号码是17+(8-1)×20=157.9.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18解析 ∵样本容量总体个数=60200+400+300+100=350,∴应从丙种型号的产品中抽取350×300=18(件).10.(2017·潍坊模拟)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意可知,样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,若第5组抽取号码为22,则第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件得,200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取__________名学生. 答案 60解析 根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.13.(2017·宁夏中卫二模)某市教育主管部门为了全面了解2017届高三学生的学习情况,决定对该市参加2017年高三第一次全省统一考试(后称统考)的32所学校进行抽样调查.将参加统考的32所学校进行编号,依次为1到32,现用系统抽样法抽取8所学校进行调查,若抽到的最大编号为31,则最小编号是( ) A .3 B .1 C .4 D .2 答案 A解析 根据系统抽样的特点可知,总体分成8组,组距为328=4,若抽到的最大编号为31,则最小编号是3.14.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.一年级 二年级 三年级女生 373 xy 男生377370z答案 16解析 由题意可知二年级女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.15.(2018·泉州质检)某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( ) A .36人 B .30人 C .24人 D .18人 答案 A解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x ,x,3x ,由题意可得3x -x =12,x =6,∴持“喜欢”态度的有6x =36(人).16.(2017·开封模拟)某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1人,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .解 总体容量为6+12+18=36.当样本容量为n 时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18. 当样本容量为(n +1)时,总体容量剔除以后是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6,即样本容量n=6.。

2019届高考数学大一轮复习 第十一章 统计与统计案例 11.2学案 理 北师大版

2019届高考数学大一轮复习 第十一章 统计与统计案例 11.2学案 理 北师大版

§11.2 统计图表、用样本估计总体最新考纲考情考向分析1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数,标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.主要考查平均数,方差的计算以及茎叶图与频率分布直方图的简单应用;题型以选择题和填空题为主,出现解答题时经常与概率相结合,难度为中低档.1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等. 2.数据的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示f iΔx i ,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较. 知识拓展1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示f i Δx i ,频率=组距×f iΔx i .(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 教材改编2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4 B .8 C .12 D .16 答案 B解析 设频数为n ,则n32=0.25,∴n =32×14=8.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人.答案 25解析 0.5×0.5×100=25. 题组三 易错自纠5.若数据x1,x2,x3,…,x n的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为( )A.5,2 B.16,2C.16,18 D.16,9答案 C解析∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5,∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16,∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________.(用“<”连接)答案n<m<x解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.故n<m<x.题型一茎叶图的应用1.(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )A .3,5B .5,5C .3,7D .5,7 答案 A解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A. 2.(2017·长沙一模)空气质量指数(Air Quality Index ,简单AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI 大于100的天数约为________.(该年有365天)答案 146解析 该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二 频率分布直方图的绘制与应用命题点1 用频率分布直方图求频率、频数典例 从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1∶3∶6∶4∶2,最右边一组的频数是6,请结合频率分布直方图提供的信息,解答下列问题:(1)求样本的容量; (2)列出频率分布表;(3)成绩落在哪个范围内的人数最多,并求出该小组的频数、频率; (4)估计这次竞赛中,成绩高于60分的学生占总人数的百分比.解 (1)由于最右边一组的频数是6,从左到右各小组的长方形的高之比为1∶3∶6∶4∶2, 故设样本容量为n ,得(1+3+6+4+2)∶n =2∶6, 解得n =(1+3+6+4+2)×62=48.(2)频率分布表如下:分组 频数 频率 [50.5,60.5) 3 116 [60.5,70.5) 9 316 [70.5,80.5) 18 38 [80.5,90.5) 12 14 [90.5,100.5)6 18 合计481(3)由(2)知成绩落在[70.5,80.5)内的人数最多,频数为18,频率为38.(4)估计成绩高于60分的学生占总人数的百分比为3+6+4+21+3+6+4+2×100%=93.75%.命题点2 用频率分布直方图估计总体典例(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.思维升华 (1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.(2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练(2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90),并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. 题型三 用样本的数字特征估计总体的数字特征典例 (1)(2017·南京模拟)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2解析 x 甲=15(87+91+90+89+93)=90,x 乙=15(89+90+91+88+92)=90,s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价. 解 ①由图像可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练 (2018·福建漳平质检)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数x 甲=1015=23;方差为s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29. 乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数x 乙=915=35;方差为s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625. 因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记恰有一组研发成功为事件E ,在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5, 所以直方图中x 的值是0.007 5.[2分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,得a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300)的用户有0.002 5×20×100=5(户), 抽取比例为1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[12分]1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.(2018届广东肇庆检测)下面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )A.5 8 B.4 9C.6 7 D.3 10答案 A解析由题意根据甲组数据的中位数为15,可得x=5;乙组数据的平均数为16.8,则9+15+18+24+10+y5=16.8,求得y=8.3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )A.各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个 答案 D解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.4.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为( )A .20B .25C .22.5D .22.75答案 C解析 产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x ,则由0.1+0.2+0.08×(x -20)=0.5,得x =22.5,故选C.5.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.6.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8 B.15 C.16 D.32答案 C解析已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16,故选C.7.已知样本数据x1,x2,…,x n的平均数x=5,则样本数据2x1+1,2x2+1,…,2x n+1的平均数为________.答案11解析由x1,x2,…,x n的平均数x=5,得2x1+1,2x2+1,…,2x n+1的平均数为2x+1=2×5+1=11.8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130)上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 9.(2018·郑州模拟)某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9)内,其频率分布直方图如图所示:(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6 000解析由频率分布直方图及频率和等于1,可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9)内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.10.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.答案 2解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 11.(2017·贵州遵义检测)在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求A 组数的众数和B 组数的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组A 与小组B 哪一个更像是由专业人士组成的?并说明理由.解 (1)由茎叶图可得:A 组数据的众数为47,B 组数据的中位数为55+582=56.5.(2)小组A ,B 数据的平均数分别为x A =112(42+42+44+45+46+47+47+47+49+50+50+55)=56412=47, x B =112(36+42+46+47+49+55+58+62+66+68+70+73)=67212=56, 小组A ,B 数据的方差分别为s 2A =112[(42-47)2+(42-47)2+…+(55-47)2] =112(25+25+9+4+1+0+0+0+4+9+9+64)=12.5, s 2B =112[(36-56)2+(42-56)2+…+(73-56)2]=112(400+196+100+81+49+1+4+36+100+144+196+289)=133.因为s2A<s2B,所以A组成员的相似程度高,由于专业裁判给分更符合专业规则,相似程度应该高,因此A组更像是由专业人士组成的.12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时该市居民该月的人均水费估计为10.5元.13.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.14.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数281410 6(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记C A 表示事件:“A 地区用户的满意度等级为不满意”;C B 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6,P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.15.(2017·山西大学附中诊断测试)已知样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =a x +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定答案 A解析 由题意可得x =x 1+x 2+…+x nn,y =y 1+y 2+…+y mm,z =x 1+x 2+…+x n +y 1+y 2+…+y mn +m=nn +m ·x 1+x 2+…+x n n +m n +m ·y 1+y 2+…+y mm=n n +m·x +m n +m·y =a x +(1-a )y ,所以nn +m=a ,mn +m =1-a ,又0<a <12, 所以0<nn +m <12<m n +m,所以n <m .故选A. 16.(2018·洛阳质检)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)样本数据的分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。

2019届北师大版高三数学(理)复习学案:学案59 统计案例(含答案)

2019届北师大版高三数学(理)复习学案:学案59 统计案例(含答案)

学案59 统计案例导学目标: 1.了解回归分析的基本思想、方法及其简单应用.2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.自主梳理1.回归分析(1)回归直线一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程的截距和斜率的最小二乘估计分别为a ^ =__________________________,b ^=______________________________________,其中x =____________________,y =_____________________________________,________________称为样本点的中心.(2)相关系数r①r=∑ni =1i -x i -y ∑ni =1 i -x 2∑n i =1 i -y 2;②当r>0时,表明两个变量________;当r<0时,表明两个变量________.r 的绝对值越接近于1,表明两个变量的线性__________;r 的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r 的绝对值大于________时认为两个变量有很强的线性相关关系.2.独立性检验(1)列联表:列出的两个分类变量的________,称为列联表.(2)2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=为样本容量.(3)独立性检验利用随机变量________来判断“两个分类变量________”的方法称为独立性检验.自我检测1.对有线性相关关系的两个变量建立的回归直线方程y ^ =a ^ +b ^ x 中,回归系数b ^( )A .可以小于0B .小于0C .能等于0D .只能等于02.(2018·天津模拟)下面是2×2列联表:则表中a ,b 的值分别为( )A .94,72B .52,50C .52,74D .74,523.如果有95%的把握说事件A和B有关系,那么具体计算出的数据( )A.K2>3.841 B.K2<3.841C.K2>6.635 D.K2<6.6354.(2018·绍兴月考)具体数据如下表:则可判断约有________探究点一独立性检验例1(2018·湛江模拟)利用统计变量K2的观测值来判断两个分类变量之间的关系的可信程度.考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示变式迁移1 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,探究点二线性回归分析例2一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:(1)y与x(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?变式迁移2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺(1)对变量y与x(2)如果y与x有线性相关关系,求回归直线方程.探究点三综合应用例3(2018·辽宁)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A表2:注射药物B完成下面2×2B后的疱疹面积有差异”.表3:.附:K2=1.回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.2.利用图形来判断两个变量之间是否有关系,可以画出二维条形图,但从图形上只可以粗略地估计两个分类变量的关系,还要结合所求的数值来进行比较.作图应注意单位统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.(满分:75分)一、选择题(每小题5分,共25分)1.对于独立性检验,下列说法中错误的是( )A.K2的值越大,说明两事件相关程度越大B.K2的值越小,说明两事件相关程度越小C.K2≤3.841时,有95%的把握说事件A与B无关D.K2>6.635时,有99%的把握说事件A与B有关2.下列说法中正确的有:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上( )A.①② B.②③ C.①③ D.①②③3.(2018·天津汉沽一中月考)甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r则哪位同学的试验结果体现AA.甲B.乙C.丙D.丁4.下列①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;②残差平方和越小的模型,模型拟合的效果越好;③用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好.A.1 B.2 C.3 D.05.(2018·济南模拟)2}和{y1,y2},其样本频数列联表如下:则两个分类变量x和yA.95% B.97.5%C.99% D.99.5%二、填空题(每小题4分,共12分)650名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2根据表中数据,得到K2=-10×223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为______.7.(2018·银川模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程y ^ =b ^ x +a ^必过点(x ,y );④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量间有关系的可能性是90%.其中错误..的 8.若两个分类变量x 和y 的列联表为:则x 与y 之间有关系的概率约为三、解答题(共38分)9.(12分)试判断晕机与性别是否有关?10.(12分)(201811.(14分)(2018·全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500(1)(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:K 2=-2++++学案59 统计案例自主梳理1.(1)y -b ^x ∑ni =1 i-xi -y ∑n i =1 i -x 2 1n ∑n i =1x i 1n ∑n i =1y i (x ,y ) (2)②正相关 负相关 相关性越强 几乎不存在线性相关关系 0.75 2.(1)频数表 (2)-2++++a +b +c +d (3)K 2 有关系自我检测1.A [b ^ =0时,得r =0,这时不具有线性相关关系,但b ^能大于0,也能小于0.]2.C [∵a+21=73,∴a=52.又a +22=b ,∴b=74.]3.A [比较K 2的值和临界值的大小,有95%的把握则K 2>3.841,K 2>6.635约有99%的把握.]4.99.5%解析 因为K 2=-240×60×46×54≈9.689>7.879, 所以有99.5%的把握认为“主修统计专业与性别之间有关系”.课堂活动区例1 解题导引 利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K 2的值,K 2的值越大说明两个变量间有关系的可能性越大,再参考临界值,从而判断两个变量有关系的可信程度.解 由列联表知:a =26,b =184,c =50,d =200.∴a+b =210,c +d =250,a +c =76,b +d =384,n =a +b +c +d =460.∴K 2=-2++++=-2210×250×76×384≈4.804. ∵K 2≈4.804>3.841.∴有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.变式迁移1 解 假设做过心脏搭桥手术与又发作心脏病没有关系.由于a =39,b =157,c =29,d =167,a +b =196,c +d =196,a +c =68,b +d =324,n =392,由公式可得K 2的观测值为k =-2++++=-2196×196×68×324≈1.78, 因为k≈1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.例2 解题导引 这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x 与y 是否线性相关,如果线性相关,才可以求解后面的问题,否则就使得求回归直线方程没有意义,要作相关性检验,应先利用r =∑ni =1x i y i -n x y∑ni =1 2i -n x 2∑n i =1y 2i -n y2求出样本相关系数r.利用当r>0时,两个变量正相关,当r<0时,两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常当|r|大于0.75时,认为两个变量有很强的线性相关关系,因而求回归直线方程才有意义.解 (1)x =55,y =91.7, ∑10i =1x 2i =38 500,∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 因此r =∑10i =1x i y i -10x y∑10i =1x 2i -10x 2∑10i =1y2i -10y2 =55 950-10×55×91.7-10×55287 777-10×91.72 ≈0.999 8,由于r =0.999 8>0.75,因此x 与y 之间有很强的线性相关关系.(2)设所求的回归直线方程为y ^=b ^x +a ^ 则有b ^=∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668. a ^ =y -b ^x =91.7-0.668×55=54.96.因此,所求的回归直线方程为y ^=0.668x +54.96.(3)当x =200时,y 的估计值为y ^ =0.668×200+54.96=188.56≈189,因此,加工200个零件所用的工时约为189分.变式迁移2 解 (1)x =12.5,y =8.25,∑4i =1x i y i =438,4x y =412.5, ∑4i =1x 2i =660,∑4i =1y 2i =291, 所以r =∑4i =1x i y i -4x y ⎝⎛⎭⎫∑4i =1x 2i -4x 2⎝⎛⎭⎫∑4i =1y 2i -4y 2=438-412.5--=25.5656.25≈25.5025.62≈0.995 3. 因为r>0.75,所以y 与x 有很强的线性相关关系.(2)由(1)知:b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x2 =438-412.5660-4×12.52≈0.7286,a ^ =y -b ^x =-0.8575.∴回归直线方程为y ^=0.728 6x -0.857 5.例3 解题导引 分类变量的独立性检验是建立在2×2列联表基础之上的,因而根据题目提示的分类标准设计2×2列联表是独立性检验的关键所在.解 列联表如下:K 2=-100×100×105×95≈24.56. 由于K 2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.变式迁移3 解 对于上述四个科目,分别构造四个随机变量K 21,K 22,K 23,K 24.由表中数据可以得到语文:k 1=-2201×43×204×40≈7.294>6.635,数学:k 2=-2201×43×201×43≈30.008>10.828,英语:k 3=-252201×43×200×44≈24.155>10.828, 综合科目: k 4=-2201×43×201×43≈17.264>10.828,所以,有99%的把握认为语文上线与总分上线有关系,有99.9%的把握认为数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.课后练习区1.C [在独立性检验中,随机变量K 2的取值大小可说明两个变量关系的程度.一般地随机变量K 2的值越大,两变量的相关程度越大,反之就越小.K 2>6.635说明有99%的把握认为二者有关系.]2.C [若r>0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确.r<0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.]3.D [因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高.]4.A [①r 有正负,应为|r|越大,相关性越强;②正确;③R 2越大,拟合效果越好.]5.C [由公式得K 2=-2246×54×150×150≈7.317, 因为7.317>6.635,所以我们有99%的把握认为两个分类变量x 与y 有关系.]6.5%解析 ∵K 2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.7.②④⑤解析 根据方差的计算公式,可知①正确;由线性回归方程的定义及最小二乘法的思想,知③正确,②④⑤不正确.8.0.999解析 K 2=+15+40+-42++++≈18.822,查表知P(K 2≥10.828)≈0.001,∴x 与y 之间有关系的概率约为1-0.001=0.999.9.解 K 2=-220×90×30×80≈6.366>5.024, (5分)故有97.5%的把握认为“晕机与性别有关”.(12分)10.解a=10,b=45,c=20,d=30,a+b=55,c+d=50,a+c=30,b+d=75,n=105,(2分)K2=-2++++(4分)=-255×50×75×30≈6.11,(8分)因为K2=6.11>5.024,从而有97.5%的把握认为药物有效.(12分)11.解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为70500×100%=14%.(4分)(2)K2=-32200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(10分)(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.(14分)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§11.1随机抽样1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.(2)总体和样本调查对象的全体称为总体,被抽取的一部分称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①迅速、及时;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率相同.(2)通常采用的简单随机抽样的方法:抽签法和随机数法.3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)抽签法中,先抽的人抽中的可能性大.( ×)(4)系统抽样在第1段抽样时采用简单随机抽样.( √)(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ×)题组二教材改编2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.4.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是( )A.10 B.11 C.12 D.16答案 D解析从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三易错自纠5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ) A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32答案 B解析间隔距离为10,故可能的编号是3,13,23,33,43.6.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.答案 1 800解析分层抽样中各层的抽样比相同.样本中甲设备生产的产品有50件,则乙设备生产的产品有30件.在4 800件产品中,甲、乙设备生产的产品总数比为5∶3,所以乙设备生产的产品的总数为1 800件.题型一简单随机抽样1.某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是( )A.这次抽样中可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率答案 A解析利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D 均错误,故选A.2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B .07 C .02 D .01 答案 D解析 由题意知前5个个体的编号为08,02,14,07,01.3.利用简单随机抽样,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14B.13 C.514 D.1027答案 C 解析 由题意知9n -1=13,得n =28,所以整个抽样过程中每个个体被抽到的概率为1028=514,故选C.思维升华 应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.题型二 系统抽样典例 (1)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示: 13 0 0 3 4 5 6 6 8 8 8 9 14 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0122333若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A .3 B .4 C .5 D .6 答案 B解析 由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]内的运动员共有4组,故由系统抽样法知,共抽取4名.故选B.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. 引申探究1.若本例(2)中条件不变,若号码“5”被抽到,那么号码“55”________被抽到.(填“能”或“不能”) 答案 不能解析 若55被抽到,则55=5+20n ,n =2.5,n 不是整数.故不能被抽到.2.若本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. 跟踪训练 将参加夏令营的600名学生按001,002,…,600进行编号.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分别住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8 C .25,16,9 D .24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N +)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17;第Ⅲ营区被抽中的人数为50-25-17=8.题型三 分层抽样命题点1 求总体或样本容量典例 (1)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A .9 B .10 C .12 D .13 答案 D解析 ∵360=n 120+80+60,∴n =13.(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A .54 B .90 C .45 D .126 答案 B解析 依题意得33+5+7×n =18,解得n =90,即样本容量为90.命题点2 求某层入样的个体数典例 (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师的人数为( )A.90 B .100 C .180 D .300 答案 C解析 由题意得抽样比为3201 600=15,∴该样本中的老年教师的人数为900×15=180.(2)(2017·重庆一诊)我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人 C .112人D .120人答案 B解析 由题意可知,这是一个分层抽样的问题,其中北乡可抽取的人数为300×8 1008 100+7 488+6 912=300×8 10022 500=108,故选B.思维升华 分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.跟踪训练 (1)(2017·南昌一模)某校为了了解学生学习的情况,采用分层抽样的方法从高一1 000人,高二1 200人,高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n 等于( ) A .860 B .720 C .1 020 D .1 040答案 D解析 分层抽样是按比例抽样的,所以81× 1 2001 000+1 200+n=30,解得n =1 040.(2)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.答案 200,20解析 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.五审图表找规律典例 (12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对天津全运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况)样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样↓要开一个25人的座谈会↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对天津全运会举办情况的了解↓ 可认为全运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体↓(从表中数据看总人数为2 000)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层用分层抽样法抽取,[1分]抽取比例为402 000=150.[2分]故老年人、中年人、青年人各抽取4人,12人,24人.[4分] (2)按管理、技术开发、营销、生产分层用分层抽样法抽取,[5分] 抽取比例为252 000=180,[6分]故管理、技术开发、营销、生产各部门分别抽取2人,4人,6人,13人.[8分] (3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]1.(2018·广东茂名月考)在一个容量为N 的总体中抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3答案 D解析 由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D. 2.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,则这种抽样方法是( ) A .系统抽样 B .分层抽样C .简单随机抽样D .非以上三种抽样方法 答案 A解析 符合系统抽样的特点,故选A.3.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B.310,15 C.15,310 D.310,310 答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.4.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个样本编号为( ) A .700 B .669 C .695 D .676 答案 C解析 由题意可知,第一组随机抽取的编号为015,分段间隔数k =N n =1 00050=20,由题意知抽出的这些号码是以15为首项,20为公差的等差数列,则抽取的第35个样本编号为15+(35-1)×20=695.5.某工厂的一、二、三车间在11月份共生产了3 600双皮靴,在出厂前检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 成等差数列,则二车间生产的产品数为( ) A .800 B .1 000 C .1 200 D .1 500答案 C解析 因为a ,b ,c 成等差数列,所以2b =a +c ,所以从二车间抽取的产品数占抽取产品总数的13,根据分层抽样的性质可知,二车间生产的产品数占产品总数的13,所以二车间生产的产品数为3 600×13=1 200.故选C.6.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A .7 B .9 C .10 D .15 答案 C解析 由系统抽样的特点知,抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 7.(2018·湖南怀化模拟)某电视台为了调查“爸爸去哪儿”节目的收视率,现用分层抽样的方法从4 300人中抽取一个样本,这4 300人中青年人1 600人,且中年人人数是老年人人数的2倍,现根据年龄采用分层抽样的方法进行调查,在抽取的样本中青年人有320人,则抽取的样本中老年人的人数为( ) A .90 B .180 C .270 D .360 答案 B解析 设老年人有x 人,从中抽取y 人,则1 600+3x =4 300,得x =900,即老年人有900人,则9001 600=y 320,得y =180.故选B.8.(2017·雅礼中学月考)某中学教务处采用系统抽样方法,从学校高三年级全体1 000名学生中抽50名学生做学习状况问卷调查.现将1 000名学生从1到1000进行编号,求得间隔数k =20,即分50组每组20人.在第一组中随机抽取一个号,如果抽到的是17号,则第8组中应抽取的号码是( ) A .177 B .157 C .417 D .367 答案 B解析 根据系统抽样的特点可知,抽取出的编号成首项为17,公差为20的等差数列,所以第8组应抽取的号码是17+(8-1)×20=157.9.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18解析 ∵样本容量总体个数=60200+400+300+100=350,∴应从丙种型号的产品中抽取350×300=18(件).10.(2017·潍坊模拟)某高中在校学生有2 000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动.每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为________. 答案 36解析 根据题意可知,样本中参与跑步的人数为200×35=120,所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.11.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,若第5组抽取号码为22,则第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件得,200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人,则40200=x100,解得x =20.12.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取__________名学生. 答案 60解析 根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.13.(2017·宁夏中卫二模)某市教育主管部门为了全面了解2017届高三学生的学习情况,决定对该市参加2017年高三第一次全省统一考试(后称统考)的32所学校进行抽样调查.将参加统考的32所学校进行编号,依次为1到32,现用系统抽样法抽取8所学校进行调查,若抽到的最大编号为31,则最小编号是( ) A .3 B .1 C .4 D .2 答案 A解析 根据系统抽样的特点可知,总体分成8组,组距为328=4,若抽到的最大编号为31,则最小编号是3.14.某校共有学生2 000名,各年级男、女学生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为________.答案 16解析 由题意可知二年级女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.15.(2018·泉州质检)某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( ) A .36人 B .30人 C .24人 D .18人 答案 A解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x ,x,3x ,由题意可得3x -x =12,x =6,∴持“喜欢”态度的有6x =36(人).16.(2017·开封模拟)某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1人,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .解 总体容量为6+12+18=36.当样本容量为n 时,由题意知,系统抽样的间隔为36n,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18. 当样本容量为(n +1)时,总体容量剔除以后是35人,系统抽样的间隔为35n+1,因为35n+1必须是整数,所以n只能取6,即样本容量n=6.。

相关文档
最新文档