最新新高考题库考点46随机抽样、用样本估计总体、变量间的相关关系、统计案例汇总

合集下载

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

温馨提示:此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2013·四川高考文科·T7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示。

以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()【解析】选A.由[0,5),[5,10)内的频数均为1,可知频率分布直方图中的高度相等,可以排除选项B;由于分组时按照组距为5分的,而选项C,D的组距为10,故错误;所以选A.2.(2013·重庆高考理科·T4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x 、y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8 【解题指南】直接利用中位数和平均数的定义进行求解.【解析】选C. 因为甲组数据的中位数为15,所以易知5=x ,又乙组数据的平均数为16.8,所以8.165241018159=+++++y ,解得8=y .故选C.3. (2013·重庆高考文科·T6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为( )A.0.2B.0.4C.0.5D.0.6【解题指南】直接根据数据的总个数和落在区间[22,30)内的个数求解即可. 【解析】选B. 落在区间[20,30)内的个数为4个,总的数据有10个,故概率为0.4.选B.4.(2013·湖南高考理科·T2)某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法 【解题指南】 本题要弄懂三种抽样方法之间的区别和联系。

高考二轮复习数学考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

高考二轮复习数学考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

温馨提示:此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2012·湖北高考文科·T2)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( )(A)0.35 (B)0.45(C)0.55 (D)0.65【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P=9=0.45.202.(2012·湖南高考文科·T5)与(2012·湖南高考理科·T4)相同设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断.【解析】选D.bx可知直线3. (2012·陕西高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53(C) 47,45,56 (D) 45,47,53【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即1(4547)462+=,排除C,D;再计算极差,最小数据是12,最大数据是68,所以681256-=,故选A.4.(2012·陕西高考理科·T6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )(A) x x <甲乙,m 甲>m 乙 (B) x x <甲乙,m 甲<m 乙 (C) x x >甲乙,m 甲>m 乙 (D) x x >甲乙,m 甲<m 乙【解题指南】平均数的大小可以根据茎叶图中数据分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小 【解析】选B.观察茎叶图可知x x <甲乙,甲组数据中的中位数是1(1822)202+=,乙组数据中的中位数是1(2731)292+=,∴m 甲<m 乙.故选B.5.(2012·安徽高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )()A 甲的成绩的平均数小于乙的成绩的平均数 ()B 甲的成绩的中位数等于乙的成绩的中位数 ()C 甲的成绩的方差小于乙的成绩的方差 ()D 甲的成绩的极差小于乙的成绩的极差【解题指南】根据平均数、方差、中位数的定义计算即可.【解析】选C .甲的成绩的方差为221(2212)25⨯+⨯=,乙的成绩的方差为221(1331) 2.45⨯+⨯=.甲的成绩的极差为4,乙的成绩的极差为4.6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( )(A )-1 (B )0 (C )12(D )1【解题指南】理清相关系数与相关性强弱的关系是解决本题的关键. 【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线112y x =+上,样本的相关系数应为1.7.(2012·江西高考文科·T6)小波一星期的总开支分布图如图1所示,一 星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比 为( )(A)30% (B)10% (C)3% (D)不能确定【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系. 【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.8. (2012·江西高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本的平均数为y()x y ≠.若样本的平均数()1z x yαα=+-,其中102α<<,则,n m 的大小关系为( )(A)n m < (B )n m > (C )n m = (D )不能确定 【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由α的范围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系.【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,()()1212+n m x x x y y y z m n++++++=+……nx m ym n +=+=()1x y αα+-整理得()()10x y m n αα-+-=⎡⎤⎣⎦,,x y ≠∴()10m n αα+-=即1n m αα=-,又10,,0121ααα⎛⎫∈∴<< ⎪-⎝⎭,1,n n m m ∴<∴<.9.(2012·山东高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) (A)众数 (B)平均数 (C)中位数 (D)标准差 【解题指南】本题考查用样本的数字特征来估计总体.【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据,则众数、中位数、平均数比原来的都多2,而标准差不变.10.(2012·山东高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )(A )7 (B )9 (C )10 (D )15【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列.【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的号码为解得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故应选C. 二、填空题11.(2012·天津高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校. 【解题指南】根据抽取样本的比例计算. 【解析】从小学中抽取150330=30=18150+75+255⨯⨯(所),同理可得从中学中抽取75330=30=9150+75+2510⨯⨯(所).【答案】18 912. (2012·山东高考文科·T14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距. 【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.【答案】913.(2012·湖北高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.【解析】由842656⨯=,可知结果.【答案】614.(2012·浙江高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.【解题指南】利用抽样比乘以组内人数即可求出. 【解析】此样本中男生人数为【答案】16015.(2012·广东高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列) 【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两个数的平均数)的求法,以及标准差公式.【解析】假设这组数据按从小到大的顺序排列为1234,x x x x ,,,则1234142323+++=2,+=4,4+=4,+=2,2x x x x x x x x x x ⎧⎪⎧⎪∴⎨⎨⎩⎪⎪⎩2212(2)(2)2x x ∴-+-=,同理可求得2234(2)(2)2x x -+-=,由1234,x x x x ,,,均为正整数,且1234()()x x x x ,,,均为圆22(2)(2)2x y -+-=上的点,分析知1234,x x x x ,,,应为1,1,3,3.【答案】1,1,3,316.(2012·福建高考文科·T14)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.【解题指南】女运动员本来占多大的比例,抽取后也应该占多大的比例,这就是分层抽样的精髓.【解析】由题意知,女运动员数为42,因此抽取的女运动员人数为42281298⨯=.【答案】1217.(2012·江苏高考·T2)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_______名学生.【解题指南】关键算出高二年级学生人数在总数中的比例.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15.18.(2012·辽宁高考文科·T19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(Ⅰ)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?(Ⅱ)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附22112212211212(),n n n n n n n n n χ++++-=【解题指南】(1)据频率分布直方图可计算“体育迷”, “非体育迷”人数,按照提供的公式,计算相关数值,与所给数据比较,获得结论;(2)将所有的基本事件罗列,很容易解决问题. 【解析】由所给的频率分布直方图知, “体育迷”人数为100(100.020100.005)25⨯⨯+⨯=“非体育迷”人数为75,则据题意完成22⨯列联表:将22⨯列联表的数据代入公式计算:2100(30104515)2112212217525455511221221()100 3.03033n n n n n n n n n χ⨯-⨯⨯⨯⨯-===≈⨯⨯⨯22100(30104515)22122175254555221221)100 3.03033n n n n n n ⨯-⨯⨯⨯⨯-==≈⨯⨯ 因为3.030 3.841<,所以没有理由认为“体育迷”与性别有关. (2)由所给的频率分布直方图知 “超级体育迷”人数为100(100.005)5⨯⨯=, 记(1,2,3)i a i =表示男性,(1,2)j b j =表示女性,所有可能结果构成的基本事件空间为{}12132311213112223212(),(),(),(),(),(),(),(),(),()a a a a a a ab a b a b a b a b a b b b Ω=,共有10个基本事件组成,且每个基本事件出现是等可能的;用A 表示事件“任选2人,至少1名女性”, 则{}11213112223212(),(),(),(),(),(),()A a b a b a b a b a b a b b b =,共有7个基本事件组成,故“任选2人,至少1名女性”的概率为7()10P A =.19. (2012·安徽高考文科·T18)若某产品的直径长与标准值的差的绝对值不超过1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm), 将所得数据分组,得到如下频率分布表:(Ⅰ)将上面表格中缺少的数据填在相应的位置上;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.【解析】(I)(Ⅱ)不合格品的直径长与标准值的差落在区间(1,3]内的概率为0.50.20.7+=. (Ⅲ)合格品的件数为50002020198050⨯-=(件)20.(2012·湖南高考文科·T17)(本小题满分12分)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中的一次购物量超过8件的顾客占55%. (Ⅰ)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;(Ⅱ)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率) 【解析】(Ⅰ)由已知得251055,35,15,20y x y x y ++=+=∴==,该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为:115 1.530225 2.5203101.9100⨯+⨯+⨯+⨯+⨯=(分钟).(Ⅱ)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,123,,A A A 分别表示事件“该顾客一次购物的结算时间为1分钟”, “该顾客一次购物的结算时间为1.5分钟”, “该顾客一次购物的结算时间为2分钟”.将频率视为概率,得123153303251(),(),()10020100101004P A P A P A ======. 123123,,,A A A A A A A =且是互斥事件,123123()()()()()P A P A A A P A P A P A ∴==++33172010410=++=.故一位顾客一次购物的结算时间不超过2分钟的概率为710.21.(2012·福建高考文科·T18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (Ⅰ)求回归直线方程y bx a =+,其中20b =-,a y bx =-;(Ⅱ)预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(Ⅰ)由于1234561()8.56x x x x x x x =+++++=, 1234561()806y y y y y y y =+++++=.所以80208.5250a y bx =-=+⨯=,从而回归直线方程为ˆ20250yx =-+. (Ⅱ)设工厂获得的利润为L 元,依题意得22(20250)4(20250)20330100020(8.25)361.25L x x x x x x =-+--+=-+-=--+当且仅当8.25x =时,L 取得最大值,故当单价定为8.25元时,工厂可获得最大利润.22.(2012·广东高考文科·T17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中α的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.【解题指南】(1)本题根据每个区间上的矩形的面积和为1,可建立关于a 的方程,解出a 的值.(2)由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积之和. (3)本题关键是先把语文成绩在[50,60),[60,70),[70,80),[80,90)的人数求出来.根据每段的频率求出每段的频数.【解析】(1)由频率分布直方图知(0.040.030.022)101,0.005a a +++⨯=∴=. (2)550.05650.4750.3850.2950.0573⨯+⨯+⨯+⨯+⨯=. 所以平均分为73分.(3) 分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为0.051005,0.410040,0.310030,0.210020⨯=⨯=⨯=⨯=.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:-+++=(人). 5,20,40,25.所以数学成绩在[50,90)之外的人数有100(5204025)10关闭Word文档返回原板块。

样本估计总体 系统抽样 统计与统计案例

样本估计总体 系统抽样 统计与统计案例

高考总复习:统计与统计案例【考纲要求】1.随机抽样(1)理解随机抽样的必要性和重要性;(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:(1)各种抽样的个体被抽到的概率相等;(2)抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s = (2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关(1)相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程$y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y L 的回归方程,期中,a b 是待定参数.$1122211()()()n ni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑$要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例 1.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y L 中回归方程的截距和斜率的最小二乘估计公式分别为:$$121()(),=-()nii i nii xx y y ba y bxxx ==--=-∑∑$$ 其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,表明两个变量正相关; 当<0r 时,表明两个变量负相关.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常r 大于0.75时,认为两个变量有很强的线性相关性.2.残差分析 (1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异µ2()i i y y -是随机误差的效应,称µµ=i ii e y y -为残差. (3)残差平方和µ21()nii i yy =-∑.(4)相关指数µ22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的贡献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1x a b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?(2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d )取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 本题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.若m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60(人),300×2/15=40(人),300×5/15=100(人),300×2/15=40(人),300×3/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.(3)将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例; (Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】(Ⅰ)设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. (Ⅱ)游泳组中,抽取的青年人数为320040%604⨯⨯=(人);抽取的中年人数为32004⨯⨯50%=75(人); 抽取的老年人数为32004⨯⨯10%=15(人).类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎乙6 7 4 9 97 6 6 5 4 3 2 1 8 0 2 4 5 9 90 9 1由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组【变式2】甲、乙两名运动员的5次测试成绩如下图所示,设12,s s分别表示甲、乙两名运动员测试成绩的标准差,12,x x分别表示甲、乙两名运动员测试成绩的平均数,则有()A.12x x=,12s s<B.12x x=,12s s>C.12x x>,12s s> D.12x x=,12s s=【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X表示.甲组乙组6 X8 74 1 9 0 0 3甲茎乙5 7 16 88 8 2 2 3 6 7(Ⅰ)如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;(Ⅱ)如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.(注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数)【思路点拨】(Ⅰ)利用平均数的基本概念加以求解。

考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例

温馨提示:考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2014·湖北高考文科·T6)根据如下样本数据得到的回归方程为ˆy=bx+a,则 ( ) A.a>0,b<0 B.a>0,b>0 C.a<0,b<0 D.a<0,b>0【解题提示】考查根据已知样本数据绘制散点图,由散点图判断线性回归方程中的b 与a 的符号问题. 【解析】选A.画出散点图如图所示,y 的值大致随x 的增加而减小,所以b<0,a>0.2. (2014·湖南高考文科·T3)与(2014·湖南高考科理科·T2)相同对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( )123.A p p p =< 231.B p p p =< 132.C p p p =< 123.D p p p ==【解题提示】根据三种抽样方法的特点求解。

【解析】选D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

3. (2014·湖南高考理科·T2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别是123,,,p p p 则( ) A .123p p p =< B .231p p p =< C .132p p p =< D .123p p p == 【解题提示】根据三种抽样方法的特点求解。

【解析】选D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

4.(2014·广东高考文科·T6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为 ( ) A.50B.40C.25D.20【解题提示】分段的间隔等于样本空间总数除以抽取容量. 【解析】选C.分段的间隔为1000÷40=25.5. (2014·山东高考理科·T7)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,......,第五组.右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.1B.8C.12D.18【解题指南】本题考查了频率分布直方图,先利用已知数据估计总体数据数据,然后再根据比例计算第三组数据有效的人数. 【解析】选C.由图知,样本总数为5024.016.020=+=N .设第三组中有疗效的人数为x ,则36.0506=+x,解得12=x . 6. (2014·山东高考文科·T8)与(2014·山东高考理科·T7)相同(2014·陕西高考文科·T9)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为 ( ) A.,s 2+1002B.+100,s 2+1002C.,s 2D.+100,s 2【解题指南】根据样本数据均值和方差的计算公式代入求解即可. 【解析】选D.样本数据x1,x 2,…,x 10的均值=(x 1+x 2+…+x 10),方差s 2=[(x1-)2+(x 2-)2+…+(x 10-)2] 新数据x 1+100,x 2+100,…,x 10+100的均值,=(x1+100+x 2+100+…+x 10+100)=(x 1+x 2+…+x 10)+100=+100, 新数据x 1+100,x 2+100,…,x 10+100的方差,s'2=[(x1+100--100)2+(x 2+100--100)2+…+(x 10+100--100)2]=[(x1-)2+(x 2-)2+…+(x 10-)2]=s 2.7.(2014·陕西高考理科·T9)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a(a 为非零常数,i=1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为 ( ) A.1+a,4B.1+a,4+aC.1,4D.1,4+a【解题指南】根据样本数据均值和方差的计算公式代入求解即可.【解析】选A.样本数据x 1,x 2,…,x 10的均值=(x 1+x 2+…+x 10)=1,方差s'2=[(x 1-1)2+(x 2-1)2+…+(x 10-1)2]=4, 新数据x 1+a,x 2+a,…,x 10+a 的均值=(x 1+a+x 2+a+…+x 10+a)=(x 1+x 2+…+x 10)+a=1+a, 新数据x 1+a,x 2+a,…,x 10+a 的方差s2=[(x1+a-1-a)2+(x2+a-1-a)2+…+(x10+a-1-a)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]=4.8.(2014·四川高考文科·T2)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本【解题提示】考查统计中总体的有关概念,属基本题.【解析】选A. 从500份中抽取200份,样本容量是200,抽取的200份是一个样本,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.所以选A.9. (2014·重庆高考文科·T3)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A. 100B.150C. 200D.250【解题提示】直接根据分层抽样的定义列出关于n的等式求解即可.【解析】选A.由分层抽样的定义可知70350035001500n=+,解得100.n=二、填空题10. (2014·湖北高考文科·T11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.【解析】依题意,设在甲生产的设备中抽50x件,则在乙生产的设备中抽30x件,所以50x+30x=4800,解得x=60,故乙设备生产的产品总数为1800件.答案:1800【误区警示】本题的易错点是理解分层抽样是一个等比例抽样,记忆公式是重点.11. (2014·湖北高考理科·T4)根据如下样本数据得到的回归方程为a bx y +=ˆ,则A.0,0>>b aB.0,0<>b aC.0,0><b aD.0.0<<b a【解题提示】考查根据已知样本数判绘制散点图,由散点图判断线性回归方程中的b 与a 的符号问题【解析】选B.画出散点图如图所示,y 的值大致随x 的增加而减小,因而两个变量呈负相关,所以0<b ,0>a 12. (2014·上海高考理科·T1)某校高一、高二、高三分别有学生1600名、1200名、800名.为了解该校高中学生的牙齿健康情况,按各年级的学生数进行分层抽样.若高三抽取20名学生,则高一、高二共需抽取的学生数为___________.【解题提示】 根据分层抽样的定义,按三个年级的比例抽取,已知高三了,高一高二易得.【解析】三个年级的学生数之比为4:3:2,高三抽取了20人,则高一、高二应分别抽取40、30人,故共抽取70人.13. (2014·天津高考文科·T9,同2014·天津高考理科·T9))某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取 名学生. 【解析】由430060,4556⨯=+++知应从一年级本科生中抽取60名学生.【答案】60三、解答题14. (2014·辽宁高考理科·T18)(本小题满分12分)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示:将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(Ⅰ)求在未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个的概率;(Ⅱ)用X 表示在未来3天里日销售量不低于100个的天数,求随机变量X 的分布列,期望()E X 及方差()D X .【解析】(Ⅰ)记1A 表示事件“日销售量不低于100个”,2A 表示事件“日销售量低于50个”,B 表示事件“未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个”,因此结合日销售量的频率分布直方图得()()10.0060.0040.002500.6p A =++⨯=; ()20.003500.15p A =⨯=; ()0.60.60.1520.108p B =⨯⨯⨯=(Ⅱ)X 的可能取值为0,1,2,3,相应的概率为()()31310.60.064p X C =-=,()()21230.610.60.288p X C =⨯-=()()122230.610.60.432p X C =⨯-=,()33330.60.216p X C ==所以X 的分布列为因为()3,0.6XB ,所以随机变量X 的期望()30.6 1.8E X =⨯=,方差()()30.610.60.72D X =⨯⨯-= 15. (2014·辽宁高考文科·T18)(本小题满分12分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(Ⅰ)根据表中数据,问是否有95℅的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:,()11221221211222112n n n n n n n n n κ-=【解析】(Ⅰ)将22⨯列联表中的数据代入计算公式,得()2210060102010100 4.7627030802021κ⨯-⨯==≈⨯⨯⨯由于4.762 3.841>,所以有95℅的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(Ⅱ)从5名数学系学生中人去3人的一切可能结果所组成的基本事件为下列10个:()()()()()()121122123112113123,,,,,,,,,,,,,,,,,,a a b a a b a a b a b b a b b a b b ()()()()212213223123,,,,,,,,,,,a b b a b b a b b b b b其中(1,2)i a i =表示喜欢甜品的学生,(1,2,3)j b j =表示不喜欢甜品的学生,这10个基本事件的出现是等可能的.抽取3人,至多有1人喜欢甜品的事件为以下7个:()()()112113123,,,,,,,,,a b b a b b a b b ()()()()212213223123,,,,,,,,,,,a b b a b ba b b b b b从这5名学生中随机抽取3人,至多有人喜欢甜品的概率为7.1016. (2014·新课标全国卷Ⅱ高考理科数学·T19)(本小题满分12分)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程.(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121,niii ni i t t y y b t t ==--=-∑∑a y bt =-.【解题提示】(1)利用公式求得回归直线方程.(2)利用回归方程中b 的正负分析变化情况,将2015年的年份代号代入回归方程,估计家庭人均纯收入. 【解析】(1)因为t =1277+++…=4, y =2.9 3.3 3.6 4.4 4.8 5.2 5.97++++++=4.3,设回归方程为y=bt+a,代入公式,经计算得 b=()3 1.420.700.5 1.8 4.89412⨯++++++++⨯=14142⨯=12, a=y -b t =4.3-12×4=2.3, 所以,y 关于t 的回归方程为y=0.5t+2.3. (2)因为b=12>0,所以2007年至2013年该地区人均纯收入稳步增长,预计到2015年, 该地区人均纯收入y=0.5×9+2.3=6.8(千元),所以,预计到2015年,该地区人均纯收入约6800元左右.17. (2014·重庆高考文科·T17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a 的值;(2)分别求出成绩落在[)50,60 与[)60,70 中的学生人数;(3)从成绩在[)50,70的学生中任选2人,求此 2人的成绩都在[)60,70中的概率. 【解题提示】 直接根据频率之和为1 可求出a 的值,再根据对应频率可求出成绩落在[)50,60 与[)60,70 中的学生人数,然后利用古典概型概率公式求解成绩都在[)60,70中的概率.【解析】(1)据直方图知组距为10 ,由(23672)101,a a a a a ++++⨯= 解得10.005200a == . (2)成绩落在[)50,60中的学生人数为20.0051020 2.⨯⨯⨯= 成绩落在[)60,70中的学生人数为30.0051020 3.⨯⨯⨯=(3)记成绩落在[)50,60中的2 人为12,,A A 成绩落在[)60,70中的3 人123,,B B B , 则从成绩在[)50,70的学生中任选2人的基本事件共有10 个:12(,),A A 11(,),A B 12(,),A B 13(,),A B 21(,),A B 22(,),A B 23(,),A B 12(,),B B 13(,),B B 23(,),B B其中2人的成绩都在[)60,70中的基本事件有3 个:12(,),B B 13(,),B B 23(,),B B故所求概率为3.10p =18.(2014·安徽高考文科·T17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()22n(ad bc)a b c d a c b d K -=++++【解题提示】分清样本总体、个体的概念,识别频率分布直方图,正确列出列联表求解,本题属于容易题。

高考数学真题分类解析总复习资料考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

高考数学真题分类解析总复习资料考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

温馨提示:此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2012·湖北高考文科·T2)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( )(A)0.35 (B)0.45(C)0.55 (D)0.65【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P=9=0.45.202.(2012·湖南高考文科·T5)与(2012·湖南高考理科·T4)相同设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断.【解析】选D.bx可知直线3. (2012·陕西高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53(C) 47,45,56 (D) 45,47,53【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即1(4547)462+=,排除C,D;再计算极差,最小数据是12,最大数据是68,所以681256-=,故选A.4.(2012·陕西高考理科·T6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )(A) x x <甲乙,m 甲>m 乙 (B) x x <甲乙,m 甲<m 乙 (C) x x >甲乙,m 甲>m 乙 (D) x x >甲乙,m 甲<m 乙【解题指南】平均数的大小可以根据茎叶图中数据分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小【解析】选B.观察茎叶图可知x x <甲乙,甲组数据中的中位数是1(1822)202+=,乙组数据中的中位数是1(2731)292+=,∴m 甲<m 乙.故选B.5.(2012·安徽高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )()A 甲的成绩的平均数小于乙的成绩的平均数()B 甲的成绩的中位数等于乙的成绩的中位数()C 甲的成绩的方差小于乙的成绩的方差()D 甲的成绩的极差小于乙的成绩的极差【解题指南】根据平均数、方差、中位数的定义计算即可.【解析】选C .甲的成绩的方差为221(2212)25⨯+⨯=,乙的成绩的方差为221(1331) 2.45⨯+⨯=.甲的成绩的极差为4,乙的成绩的极差为4.6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( ) (A )-1 (B )0 (C )12(D )1 【解题指南】理清相关系数与相关性强弱的关系是解决本题的关键.【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线112y x =+上,样本的相关系数应为1.7.(2012·江西高考文科·T6)小波一星期的总开支分布图如图1所示,一 星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比 为( )(A)30% (B)10% (C)3% (D)不能确定【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系.【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.8. (2012·江西高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本的平均数为y()x y ≠.若样本的平均数()1z x y αα=+-,其中102α<<,则,n m 的大小关系为( ) (A)n m < (B )n m > (C )n m = (D )不能确定【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由α的范围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系.【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,()()1212+n m x x x y y y z m n ++++++=+……nx m ym n +=+=()1x y αα+- 整理得()()10x y m n αα-+-=⎡⎤⎣⎦,,x y ≠∴()10m n αα+-= 即1n m αα=-,又10,,0121ααα⎛⎫∈∴<< ⎪-⎝⎭,1,n n m m ∴<∴<.9.(2012·山东高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )(A)众数 (B)平均数 (C)中位数 (D)标准差【解题指南】本题考查用样本的数字特征来估计总体.【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据,则众数、中位数、平均数比原来的都多2,而标准差不变.10.(2012·山东高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )(A )7 (B )9 (C )10 (D )15【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列.【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的号码为解得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故应选C.二、填空题11.(2012·天津高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校.【解题指南】根据抽取样本的比例计算.【解析】从小学中抽取150330=30=18150+75+255⨯⨯(所),同理可得从中学中抽取75330=30=9150+75+2510⨯⨯(所). 【答案】18 912. (2012·山东高考文科·T14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距.【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.【答案】913.(2012·湖北高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.【解析】由842656⨯=,可知结果.【答案】614.(2012·浙江高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.【解题指南】利用抽样比乘以组内人数即可求出.【解析】此样本中男生人数为【答案】16015.(2012·广东高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列)【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两个数的平均数)的求法,以及标准差公式.【解析】假设这组数据按从小到大的顺序排列为1234,x x x x ,,, 则1234142323+++=2,+=4,4+=4,+=2,2x x x x x x x x x x ⎧⎪⎧⎪∴⎨⎨⎩⎪⎪⎩2212(2)(2)2x x ∴-+-=,同理可求得2234(2)(2)2x x -+-=, 由1234,x x x x ,,,均为正整数,且1234()()x x x x ,,,均为圆22(2)(2)2x y -+-=上的点,分析知1234,x x x x ,,,应为1,1,3,3.【答案】1,1,3,316.(2012·福建高考文科·T14)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.【解题指南】女运动员本来占多大的比例,抽取后也应该占多大的比例,这就是分层抽样的精髓.【解析】由题意知,女运动员数为42,因此抽取的女运动员人数为42281298⨯=.【答案】1217.(2012·江苏高考·T2)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_______名学生.【解题指南】关键算出高二年级学生人数在总数中的比例.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15.18.(2012·辽宁高考文科·T19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(Ⅰ)根据已知条件完成下面的22 列联表,并据此资料你是否认为“体育迷”与性别有关?(Ⅱ)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 附22112212211212(),n n n n n n n n n χ++++-=【解题指南】(1)据频率分布直方图可计算“体育迷”, “非体育迷”人数,按照提供的公式,计算相关数值,与所给数据比较,获得结论;(2)将所有的基本事件罗列,很容易解决问题.【解析】由所给的频率分布直方图知,“体育迷”人数为100(100.020100.005)25⨯⨯+⨯=“非体育迷”人数为75,则据题意完成22⨯列联表:将22⨯列联表的数据代入公式计算:2100(30104515)2112212217525455511221221()100 3.03033n n n n n n n n n χ⨯-⨯⨯⨯⨯-===≈⨯⨯⨯22100(30104515)22122175254555221221)100 3.03033n n n n n n ⨯-⨯⨯⨯⨯-==≈⨯⨯ 因为3.030 3.841<,所以没有理由认为“体育迷”与性别有关.(2)由所给的频率分布直方图知“超级体育迷”人数为100(100.005)5⨯⨯=,记(1,2,3)i a i =表示男性,(1,2)j b j =表示女性,所有可能结果构成的基本事件空间为{}12132311213112223212(),(),(),(),(),(),(),(),(),()a a a a a a ab a b a b a b a b a b b b Ω=,共有10个基本事件组成,且每个基本事件出现是等可能的;用A 表示事件“任选2人,至少1名女性”,则{}11213112223212(),(),(),(),(),(),()A a b a b a b a b a b a b b b =,共有7个基本事件组成,故“任选2人,至少1名女性”的概率为7()10P A =.19. (2012·安徽高考文科·T18)若某产品的直径长与标准值的差的绝对值不超过1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm ), 将所得数据分组,得到如下频率分布表:(Ⅰ)将上面表格中缺少的数据填在相应的位置上;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数. 【解析】(I )(Ⅱ)不合格品的直径长与标准值的差落在区间(1,3]内的概率为0.50.20.7+=. (Ⅲ)合格品的件数为50002020198050⨯-=(件)20.(2012·湖南高考文科·T17)(本小题满分12分)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中的一次购物量超过8件的顾客占55%. (Ⅰ)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;(Ⅱ)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率) 【解析】(Ⅰ)由已知得251055,35,15,20y x y x y ++=+=∴==,该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为:115 1.530225 2.5203101.9100⨯+⨯+⨯+⨯+⨯=(分钟).(Ⅱ)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,123,,A A A 分别表示事件“该顾客一次购物的结算时间为1分钟”, “该顾客一次购物的结算时间为1.5分钟”, “该顾客一次购物的结算时间为2分钟”.将频率视为概率,得123153303251(),(),()10020100101004P A P A P A ======.123123,,,A A A A A A A =且是互斥事件, 123123()()()()()P A P A A A P A P A P A ∴==++33172010410=++=.故一位顾客一次购物的结算时间不超过2分钟的概率为710.21.(2012·福建高考文科·T18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (Ⅰ)求回归直线方程y bx a =+,其中20b =-,a y bx =-;(Ⅱ)预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【解析】(Ⅰ)由于1234561()8.56x x x x x x x =+++++=,1234561()806y y y y y y y =+++++=.所以80208.5250a y bx =-=+⨯=,从而回归直线方程为ˆ20250yx =-+. (Ⅱ)设工厂获得的利润为L 元,依题意得22(20250)4(20250)20330100020(8.25)361.25L x x x x x x =-+--+=-+-=--+当且仅当8.25x =时,L 取得最大值,故当单价定为8.25元时,工厂可获得最大利润.22.(2012·广东高考文科·T17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中α的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.【解题指南】(1)本题根据每个区间上的矩形的面积和为1,可建立关于a 的方程,解出a 的值.(2)由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积之和. (3)本题关键是先把语文成绩在[50,60),[60,70),[70,80),[80,90)的人数求出来.根据每段的频率求出每段的频数.【解析】(1)由频率分布直方图知(0.040.030.022)101,0.005a a +++⨯=∴=. (2)550.05650.4750.3850.2950.0573⨯+⨯+⨯+⨯+⨯=.所以平均分为73分.(3) 分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为⨯=⨯=⨯=⨯=.0.051005,0.410040,0.310030,0.210020所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:-+++=(人). 5,20,40,25.所以数学成绩在[50,90)之外的人数有100(5204025)10关闭Word文档返回原板块。

高考数学 分类题库考点26 随机抽样、用样本估计整体、变量间的相关关系、统计案例(2010年)理

高考数学 分类题库考点26 随机抽样、用样本估计整体、变量间的相关关系、统计案例(2010年)理

考点26 随机抽样、用样本估量整体、变量间的相关关系、统计案例1.(2020·陕西高考文科·T4)如图,样本A 和B 别离取自两个不同的整体,它们的样本平均数别离为A B x x 和,样本标准不同离为s A 和s B ,那么( )(A) A x >B x ,s A >s B (B) A x <B x ,s A >s B (C) A x >B x ,s A <s B (D) A x <B x ,s A <s B 【命题立意】此题考查样本平均数、标准差的概念的灵活应用,属保分题. 【思路点拨】直接观看图像易患结论,不用具体的运算.【标准解答】选B 由图易患A x <B x ,又A 波动性大,B 波动性小,因此s A >s B .【方式技术】统计内容有抽样方式、样本特点数(均值、方差,直方图等)、回归分析、预测(应用)等,弄清大体概念,原理,计算方式等.2.(2020·山东高考理科·T6)样本中共有五个个体,其值别离为a,0,1,2,3,,假设该样本的平均值为1,那么样本方差为( ) (A)65(B) 65 (C) 2 (D)2【命题立意】此题考查用样本的平均数、方差,考查了考生的运算求解能力. 【思路点拨】先由平均值求出a ,再利用方差的计算公式求解.【标准解答】选D,由题意知1a+0+1+2+3)=15(,解得a=-1,因此样本方差为2222221S =[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5=2,应选D.3. (2020·山东高考文科·T6)在某项体育竞赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方不同离为(A )92 , 2 (B) 92 , (C) 93 , 2 (D) 93 ,【命题立意】此题考查样本数据的平均值和方差的概念及运算,考查了考生的运算求解能力. 【思路点拨】依照平均值和方差的公式直接计算即可,应注意去掉一个最高分和一个最低分后再计算. 【标准解答】选B.去掉一个最高分95一个最低分89,剩下5个数的平均值为1(9090939493)925++++=,方差为222221[(9092)(9092)(9392)(9492)(9392)] 2.85-+-+-+-+-=. 4. (2020·福建高考文科·T9)假设某校高一年级8个班参加合唱竞赛的得分如茎叶图所示,那么这组数据的中位数和平均数别离是( )(A)和 (B)和92(C)91和 (D)92和92 【命题立意】此题考查中位数与平均数的求解.【思路点拨】把数据从小到大排列后可得其中位数,平均数是把所有的数据加起来除以数据的个数. 【标准解答】选A ,数据从小到大排列后可得其中位数为919291.52+=,平均数为878990919293949691.58+++++++=.【方式技术】给出实际数据求解中位数和平均数等数据特点相对较为容易,可是同窗也要明白得“众数、中位数、平均数与频率散布直方图的关系”,会用频率散布直方图估量众数、中位数、平均数.1. 众数:取最高小长方形底边中点的横坐标作为众数;2. 中位数:在频率散布直方图中,把频率散布直方图划分左右两个面积相等的分界限与x 轴交点的横坐标称为中位数.3. 平均数:平均数是频率散布直方图的“重心”,等于频率散布直方图中每一个小矩形的面积乘以小矩形底边中点的横坐标之和.5.(2020·广东高考理科·T7)已知随机变量X 服从正态散布N(3,1),且P (2 ≤X ≤4)=, 那么P (X>4)=( ) (A) (B) (C) (D)【命题立意】此题考察随机变量的正态散布的意义.【思路点拨】由已知条件先求出(24)P X X <>或,再求出(4)P X >的值. 【标准解答】选B .(24)1(24)10.68260.3174P X X P X <>=-≤≤=-=或6. (2020·湖南高考文科·T3)某商品销售量y(件)与销售价钱x(元/件)负相关,那么其回归方程可能是()(A)^10200y x=-+(B)^10200 y x=+(C)^10200y x=--(D)^10200 y x=-【命题立意】以朴素的题材为背景,让学生感受线性回归的意义,变量之间的转变趋势.【思路点拨】负相关说明斜率为负,而价钱为0时,销量不能为负.【标准解答】选A.∵商品销售量y(件)与销售价钱x(元/件)负相关,∴a<0,排除B,D.又∵x=0时,y>0 排除C.【方式技术】回归问题要紧研究变量之间的相关性,转变趋势,分为正相关和负相关,线性相关不是研究变量之间的确信性,而是相关性,即有关联.求斜率和截距经常使用给定的公式.7.(2020·江苏高考·T4)某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率散布直方图如下图,那么在抽测的100根中,有_____________根棉花纤维的长度小于20mm.【命题立意】此题考查频率散布直方图及其相关知识.【思路点拨】频率散布直方图的纵坐标为频率/组距,小矩形的面积为相应数据所占的频率.【标准解答】由频率散布直方图观看得,棉花纤维的长度小于20mm的根数为100×(++)×5=30.【答案】30【方式技术】关于统计图表问题,求解时,最重要的确实是认真观看图表,从中发觉有效的信息和数据.关于频率散布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积之和为1,当有两个小矩形的高相等时,说明数据落在这两个区间上的频率相等,在进行计算时,不能漏掉其中的任何一个.8.(2020·浙江高考文科·T11)在如下图的茎叶图中,甲、乙两组数据的中位数别离是 .【命题立意】此题要紧考察了茎叶图所表达的含义,和从样本数据中提取数字特点的能力,属容易题. 【思路点拨】把甲、乙两组数据从小到大排序后,找位于中间的数或中间两数的平均数. 【标准解答】甲位于中间的数是45,把乙的数据排序后,位于中间的数是46. 【答案】45,469.(2020·福建高考文科·T14)将容量为n 的样本中的数据分成6组,绘制频率散布直方图.假设第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,那么n 等于 . 【命题立意】此题考查频率散布直方图中频数与频率的关系. 【思路点拨】频率之比即为频数之比,按比例设六组的频数,可解.【标准解答】设第一组到第六组的频数别离为2a,3a,4a,6a,4a,a ,2a 3a 4a 27,a 3,∴++=∴=2a 3a 4a 6a 4a a 20a 60∴+++++==.【答案】6010.(2020·北京高考理科·T11)从某小学随机抽取100名同窗,将他们的身高(单位:厘米)数据绘制成频率散布直方图(如图).由图中数据可知a = .假设要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方式选取18人参 加一项活动,那么从身高在[140 ,150]内的学生当选取的人数应为 .【命题立意】此题考查频率公布直方图,抽样方式中的分层抽样.熟练把握频率公布直方图的性质,分层抽样的原理是解决此题的关键.【思路点拨】利用各矩形的面积之和为1可解出a .分层抽样时,选算身世高在[140 ,150]内的学生在三组学生中所占比例,再从18人中抽取相应比例的人数.8 9 1 2 59 4 5 8 2 62 3 4甲乙【标准解答】各矩形的面积和为:0.005100.03510100.02010a ⨯+⨯+⨯+⨯0.010101+⨯=,解得0.030a =.身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生人数别离为:30,20,10,人数的比为3:2:1,因此从身高在[140 ,150]内的学生当选取的人数应为1816⨯=3人. 【答案】 311.(2020·广东高考文科·T12)某市居民2005~2020年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:依照统计资料,居民家庭年平均收入的中位数是 ,家庭年平均收入与年平均支出有 _________线性相关关系.【命题立意】此题考察统计中大体特点量的意义和变量间的关系. 【思路点拨】按大小排列出收入数据的顺序,找出中间的那个数据.【标准解答】收入数据按大小排列为:11.5,12.1,13,13.3,15,因其中位数为13. 【参考答案】13 正向12.(2020·安徽高考文科·T14)某地有居民100 000户,其中一般家庭99 000户,高收入家庭1 000户.从一般家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发觉共有120户家庭拥有3套或3套以上住房,其中一般家庭50户,高收人家庭70户.依据这些数据并结合所把握的统计知识,你以为该地拥有3套或3套以上住房的家庭所占比例的合理估量是 . 【命题立意】此题要紧考查分层抽样原理,考查考生用样本估量整体的大体思想.【思路点拨】依照分层抽样原理,别离估量一般家庭和高收入家庭拥有3套或3套以上住房的户数, 进而得出100 000户居民中拥有3套或3套以上住房的户数,用它除以100 000即可取得结果. 【标准解答】该地拥有3套或3套以上住房的家庭估量约有:50709900010005700990100⨯+⨯=户, 因此所占比例的合理估量约是5700100000 5.7%÷=. 【参考答案】5.7%13.(2020·陕西高考理科·T19)为了解学生身高情形,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情形的统计图如下: (Ⅰ)估量该校男生的人数;(Ⅱ)估量该校学生身高在170~185cm之间的概率;(Ⅲ)从样本中身高在165~180cm之间的女生中任选2人,求至少有1人身高在170~180cm之间的概率.【命题立意】此题考查了分层抽样的概念、条形图的识别、概率的简单求法等基础知识,考查了同窗们利用所学知识解决实际问题的能力.【思路点拨】读懂频数条形图是解题的关键【标准解答】(Ⅰ)样本中男生人数为40 ,由分层抽样比例为10%估量全校男生人数为400.(Ⅱ)由统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35人,样本容量为70,因此样本中学生身高在170~185cm之间的频率350.5,70f==故由f估量该校学生身高在170~180cm 之间的概率0.5.p=(Ⅲ)样本中女生身高在165~180cm之间的人数为10,身高在170~180cm之间的人数为4.设A表示事件“从样本中身高在165~180cm之间的女生中任选2人,至少有1人身高在170~180cm之间”,那么2112664422101022 ()1(()).33C C C CP A P AC C+=-===或14. (2020·陕西高考文科·T19)为了解学生身高情形,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情形的统计图如下:(Ⅰ)估量该校男生的人数;(Ⅱ)估量该校学生身高在170~185cm之间的概率;(Ⅲ)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm 之间的概率.【命题用意】此题考查了分层抽样的概念、条形图的识别、概率的简单求法等基础知识,考查了同窗们利用所学知识解决实际问题的能力.【思路点拨】读懂频数条形图是解题的关键【标准解答】(Ⅰ)(Ⅱ)同理科(Ⅲ)样本中身高在180~185c m之间的男生有4人,设其编号为①,②,③,④,样本中身高185~190cm之间的男生有2人,设其编号为⑤,⑥从上述6人中任取2人的树状图为:故从样本中身高在180~190cm之间的6名男生中任选2人的所有可能结果数为15,至少有1人身高在185~190cm之间的可能结果数为9,因此,所求概率93.155P==15. (2020·辽宁高考文科·T18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2别离是注射药物A和药物B的实验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数散布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数散布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015(Ⅰ)完成下面频率散布直方图,并比较注射两种药物后疱疹面积的中位数大小;(Ⅱ)完成下面2×2列联表,并回答可否有%的把握以为“注射药物A后的疱疹面积与注射药物B 后的疱疹面积有不同”.表3疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物A a=b=注射药物B c=d=合计n=附:K2=2()()()()()n ad bca b c d a c b d-++++P(K2≥k)k【命题立意】考查了频率散布直方图、中位数、独立性查验的知识.【思路点拨】(I)依照频率散布直方图,估量中位的范围,比较中位数的大小.(II )将各数据代入公式计算,比较2K . 【标准解答】(I )能够看出注射药物A 后的疱疹面的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,因此注射药物A 后的疱疹面积的中位数小于注射药物B 后疱疹面积的中位数. (II )2200(70653530)K 24.5610010010595⨯⨯-⨯≈⨯⨯⨯=.由于2K 10.828,>因此有99%的把握以为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有不同”. 【方式技术】1.在做频率散布直方图时,必然要注意,小长方形的高表示的是频率与组距的比,不要当做了频率.2.依照频率散布直方图确信中位所在的大致区间,确实是在直方图中做一条垂直于横轴的直线,使直线双侧的小长方形的面积大致相等,那么直线的垂足所在区间确实是中位数所在的区间.(K 2>=是“指注射药物A 后的疱疹面积于注射药物B 后的疱疹面积没有不同”的概率,因此有关的概率是1- P(K 2>=%.16. (2020·辽宁高考理科·T18)为了比较注射A, B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B. (Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(Ⅱ)下表1和表2别离是注射药物A 和B 后的实验结果.(疱疹面积单位:mm 2) 表1:注射药物A 后皮 肤疱疹面积的频数散布表表2:注射药物B 后皮肤疱疹面积的频数散布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85) 频数1025203015(ⅰ)完成下面频率散布直方图,并比较注射两种药物后疱疹面积的中位数大小;(ⅱ)完成下面2×2列联表,并回答可否有%的把握以为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有不同”. 表3疱疹面积小于70mm 2疱疹面积不小于70mm 2合计注射药物A a = b = 注射药物B c =d =合计n =附:K 2=2()()()()()n ad bc a b c d a c b d -++++【命题立意】此题考查了古典概型、频率散布直方图、独立性查验等知识. 【思路点拨】(I )(II )计算小长方形的高,作图【标准解答】(Ⅰ)甲、乙两只家兔分在不同组的概率为(Ⅱ)(i )图Ⅰ注射药物A 后皮肤疱疹面积的频率散布直方图 图Ⅱ注射药物B 后皮肤疱疹面积的频率散布直方图能够看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,因此注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.(ii )表3:由于K 2>,因此有%的把握以为“注射药物A 后的疱疹面积于注射药物B 后的疱疹面积有不同”.所有可能的基本满足条件的基本求概率【方式技术】1.在频率散布直方图中,小长方形的高是频率与组距的比值,不要当做了频率.2.依照频率散布直方图确信中位所在的大致区间,确实是在直方图中做一条垂直于横轴的直线,使直线双侧的小长方形的面积大致相等,那么直线的垂足所在区间确实是中位数所在的区间. (K 2>=是“指注射药物A 后的疱疹面积于注射药物B 后的疱疹面积没有不同”的概率,因此有关的概率是1- P(K 2>=%17. (2020·广东高考理科·T17)某食物厂为了检查一条自动包装流水线的生产情形,随机抽取该流水线上40件产品作为样本算出他们的质量(单位:克),质量的分组区间为(490,]495,(495,]500,……(510,]515,由此取得样本的频率散布直方图,如图4所示. (1) 依照频率散布直方图,求质量超过505克的产品数量.(2) 在上述抽取的40件产品中任取2件,设Y 为质量超过505克的产品数量,求Y 的散布列. (3) 从流水线上任取5件产品,求恰有2件产品的质量超过505克的概率.【命题立意】此题考察统计中的频率散布直方图的意义、随机变量的散布列和概率中古典概型的计算. 【思路点拨】直方图中小矩形的面积等于样本在该范围的频率.【标准解答】(1)质量超过505克的产品散布在最右边的两个直方内,由频率散布直方图得其数量为:40(0.0550.015)400.312⨯⨯+⨯=⨯=件.(2)Y 的所有可能取值为0,1,2.其中228240378(0)780C P Y C ===,112812240336(1)780C C P Y C ⋅===,21224066(2)780C P Y C === 因此,Y 的散布列为Y 0 1 2P378780 336780 66780克的概率为: 【方式技术】求随机变量的散布列,第一要明确变量的所有可能取值,在计算相应的概率.18. (2020·广东高考文科·T17)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(1)由表中数据直观分析,收看新闻节目的观众是不是与年龄有关?(2)用分层抽样方式在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.【命题立意】此题是一道应用题,要紧考察统计的意义和分层抽样的方式和概率的大体计算.【思路点拨】在计算概率是,要列出所有大体事件,从而求解.【标准解答】解:(1)假设收看新闻节目的观众与年龄无关,那么18275842=,即992914=,这是矛盾的,因此收看新闻节目的观众与年龄有关. (2)设应该抽取大于40岁的观众x 名,那么有:52745x =,解得 3.x = 因此大于40岁的观众应该抽取3名.(3)设所抽取的5名观众中,a ,b 两人为20至40岁;C ,D ,E 三人为40岁以上,从中任抽取2人,所有抽法有:ab ,aC ,aD ,aE ,bC ,bD ,bE ,CD ,CE ,DE 共10种,其中恰有1名观众的年龄为20至40岁的抽法有aC ,aD ,aE ,bC ,bD ,bE 共6种,因此恰有1名观众的年龄为20至40岁的概率为:63.105= 【方式技术】在计算大体事件数时,可用字母把大体事件一一列出.19. (2020·安徽高考文科·T18)某市2020年4月1日—4月30日对空气污染指数的监测数据如下(要紧污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(Ⅰ) 完成频率散布表;(Ⅱ)作出频率散布直方图;(Ⅲ)依照国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评判.【命题立意】此题要紧考查频率散布直方图,用样本估量整体的思想,考查学生运用统计知识解决简单实际问题的能力,数据处置能力和应用意识.【思路点拨】第一依照题目中的数据完成频率散布表,作出频率散布直方图,依照污染指数,确信空气质量为优、良、轻微污染、轻度污染的天数.【标准解答】(Ⅲ)答对下述两条中的一条即可:(1)该市一个月中空气污染指数有2天处于优的水平,占当月天数的115,有26天处于良的水平,占当月天数的1315,处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量大体良好.(2)轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【方式技术】1在频率散布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.2在频率散布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.3关于开放性问题的回答,要选择适当的数据特点进行考察,依照数据特征分析得出实际问题的结论. 20.(2020 •海南高考•理科T19)为调查某地域老年人是不是需要志愿者提供帮忙,用简单随机抽样方式从该地域调查了500位老年人,结果如下:(Ⅰ)估量该地域老年人中,需要志愿者提供帮忙的老年人的比例;(Ⅱ)可否有99%的把握以为该地区的老年人是不是需要志愿者提供帮忙与性别有关?(Ⅲ)依照(Ⅱ)的结论,可否提出更好的调查方式来估量该地域的老年人中,需要志愿者提供帮忙的老年人的比例?说明理由.【命题立意】此题重点考查了统计中独立性查验的相关知识,要求学生能够熟练的利用图表中的数据来进行分析,进而得出相应的结论.【思路点拨】利用古典概型的计算公式和列联表的相关知识求解.【标准解答】(Ⅰ) 调查的500位老年人中有70为需要志愿者提供帮忙,因此在该地域老年人中,需要帮忙的老年人的比例的估量值为7014%500=.(Ⅱ)22500(4027030160)9.96720030070430K⨯⨯-⨯=≈⨯⨯⨯因为9.967 6.635>,因此有99%的把握以为该地区的老年人是不是需要志愿者提供帮忙与性别有关.(Ⅲ)依照(Ⅱ)的结论可知,该地区的老年人是不是需要志愿者提供帮忙与性别有关,而且从样本数据能够看出该地域男性老年人与女性老年人中需要帮忙的比列有明显不同,因此在调查时,先确信该地域老年人中男女的比例,在把老年人分成男女两层,并采纳分层抽样方式比简单随机抽样方式更好.。

高考数学 考点26 随机抽样、用样本估计总体、变量间的相关关系、统计案例 试题

高考数学 考点26  随机抽样、用样本估计总体、变量间的相关关系、统计案例 试题

考点26 随机抽样、用样本估计总体、创 作人:荧多莘 日 期: 二O 二二 年1月17日变量间的相关关系、统计案例1.〔2021·高考文科·T4〕如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本HY 差分别为s A 和s B ,那么〔 〕(A) A x >B x ,s A >s B (B) A x <B x ,s A >s B (C) A x >B x ,s A <s B (D) A x <B x ,s A <s B 【命题立意】此题考察样本平均数、HY 差的概念的灵敏应用,属保分题。

【思路点拨】直接观察图像易得结论,不用详细的运算【标准解答】选B 由图易得A x <B x ,又A 波动性大,B 波动性小,所以s A >s B【方法技巧】统计内容有抽样方法、样本特征数〔均值、方差,直方图等〕、回归分析、预测〔应用〕等,表达算法思想.弄清根本概念,原理,计算方法等.2.〔2021·高考理科·T6〕样本中一共有五个个体,其值分别为a,0,1,2,3,,假设该样本的平均值为1,那么样本方差为〔 〕65652 (D)2 【命题立意】此题考察用样本的平均数、方差,考察了考生的运算求解才能. 【思路点拨】先由平均值求出a ,再利用方差的计算公式求解.【标准解答】选D,由题意知1a+0+1+2+3)=15(,解得a=-1,所以样本方差为2222221S =[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5=2,应选D.3. 〔2021·高考文科·T6〕在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 〔A 〕 (C) 93 , 2【命题立意】此题考察样本数据的平均值和方差的概念及运算,考察了考生的运算求解才能. 【思路点拨】根据平均值和方差的公式直接计算即可,应注意去掉一个最高分和一个最低分后再计算.【标准解答】选了B ,去掉一个最高分95一个最低分89,剩下5个数的平均值为1(9090939493)925++++=,方差为222221[(9092)(9092)(9392)(9492)(9392)] 2.85-+-+-+-+-=4. 〔2021·高考文科·T9〕假设某校高一年级8个班参加合唱比赛的得分如茎叶图所示,那么这组数据的中位数和平均数分别是( )和和92和和92【命题立意】此题考察中位数与平均数的求解。

2020高考数学总复习 第四十八讲 随机抽样、用样本估计总体、变量间的相互关系、统计案例 新人教版

2020高考数学总复习 第四十八讲 随机抽样、用样本估计总体、变量间的相互关系、统计案例 新人教版

第四十八讲 随机抽样、用样本估计 总体、变量间的相互关系、统计案例班级________ 姓名________ 考号________ 日期________ 得分________ 一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内.)1.一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1~160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出.解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,…,153~160号为第20组.从第一组中用抽签方式抽到一个为k 号(1≤k ≤8),其余组是(k +8n )号(n =1,2,3,…,19),如此抽到20人.解法三:按20160=18的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是( ) A .解法一、解法二、解法三 B .解法二、解法一、解法三 C .解法一、解法三、解法二 D .解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C. 答案:C2.一个样本a,3,5,7的平均数是b ,且a 、b 是方程x 2-5x +4=0的两根,则这个样本的方差是( )A .3B .4C .5D .6解析:x 2-5x +4=0的两根是1,4.当a =1时,a,3,5,7的平均数是4,当a =4时,a,3,5,7的平均数不是1. ∴a =1,b =4.则方差s 2=14×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.答案:C3.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力从4.6到5.0之间的学生数为b ,则a ,b的值分别为( )A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:由图知共有9组,故后6组的频率是以2.7×0.1=0.27为首项,d为公差的等差数列,又各组频率之和为0.01+0.03+0.09+0.27×6+15d=1,故d=-0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a=0.27,b=(0.27+0.22+0.17+0.12)×100=78,故选A.答案:A4.下列有关线性回归的说法,不正确的是( )A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确.答案:D5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为( )C.2.5% D.97.5%解析:∵k>5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6.下面是一个2×2列联表则表中a,bA .94,96B .52,50C .52,54D .54,52解析:∵a +21=73,∴a =52. 又∵a +2=b 知b =54,故选C. 答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上.) 7.某企业三月中旬生产A 、B 、C 三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A A 产品的样本容量比C 产品的样本容量多10.根据以上信息,可得C 产品的数量是________件.解析:设样品的容量为x ,则x3000×1300=130,所以x =300.所以A 产品和C 产品在样本中共有300-130=170(件).设C 产品的样本容量为y ,则y +(y +10)=170,所以y =80.所以C 产品的数量为3000300×80=800(件).答案:8008.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a ,b 的取值是________和________.解析:由题意a +b =21,故平均数x -=10. 欲使方差最小,只需使(a -10)2+(b -10)2最小,又∵(a -10)2+(b -10)2=a 2+b 2-20(a +b )+200=a 2+b 2-220=(a +b )2-2ab -220=221-2ab ≥221-2⎝⎛⎭⎪⎫a +b 22,当且仅当a =10.5,b =10.5时最小,故a =10.5,b =10.5时,s 2最小.答案:10.5 10.59.某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在[140,150]段的约是________人.解析:设500人的数学成绩在[140,150]段的人数为x,10000人的数学成绩在[140,150]段的人数为n .由样本频率分布直方图知数学成绩在[140,150]段的频率最小矩形的面积,即为0.008×10=0.08=x 500,∴x =40.又样本的个数占总个数的120,即每组的抽样比为120,∴120=40n,∴n =800. ∴10000人的数学成绩在[140,150]段的约是800人. 答案:80010.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1924.7,当x 分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为2777+2871.7+2966.4+3061.1≈11676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤.)11.一个地区共有5个乡镇30000人,其中人口比例为32514,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程.解:应采用分层抽样的方法. 具体抽样过程如下:(1)计算抽样比:30030000=1100;(2)计算各乡镇人口数分别为:315×30000=6000,215×30000=4000,515×30000=10000,115×30000=2000,415×30000=8000; (3)计算各乡镇抽取的人口数分别为:6000×1100=60,4000×1100=40,10000×1100=100,2000×1100=20,8000×1100=80;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人; (5)将抽取的个体合在一起,就构成所要抽取的一个样本. 12.据报道,某公司的33名职工的月工资(以元为单位)如下:(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法. 解:(1)平均数是x -=1500+4000+3500+2000×2+1500+1000×5+500×3+0×2033≈1500+591=2091(元).中位数是1500元,众数是1500元. (2)平均数是x -′=1500+28500+18500+2000×2+1500+1000×5+500×3+0×2033≈1500+1788=3288(元). 中位数是1500元,众数是1500元.(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平.13.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:x 63 67 45 88 81 71 52 99 58 76 y65785282828973985675表中(1)画出散点图; (2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)ix iy ix 2iy 2ix i y i1 63 65 3969 4225 40952 67 78 4489 6084 52263 45 52 2025 2704 2340 4 88 82 7744 6724 72165 81 82 6561 6724 66426 71 89 5041 7921 63197 52 73 2704 5329 37968 99 98 9801 9604 9702 9 58 56 3364 3136 3248 10 76 75 5776 5625 5700 合计700750514745807654284可求得x -=110(63+67+…+76)=70,y -=110(65+78+…+75)=75.b =54284-10×70×7551474-10×702≈0.721, ∴a =75-0.721×70≈24.53. 所求的线性回归方程为 y -=0.721x +24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程 y -=0.721x +24.53可得y -≈82分.。

高三数学 专项精析精炼 考点44 随机抽样、用样本估计总体、变量间的相关关系、统计案例

高三数学 专项精析精炼 考点44  随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点44 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1.(2011·福建卷文科·T4)在某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) (A )6 (B )8 (C )10 (D )12【思路点拨】根据分层抽样的特点,各层的样本容量之比等于每一层的总体容量之比,根据此关系可确定高二年级的学生中应抽取的人数.【精讲精析】选B .分层抽样的原则是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则30640n=,得8n =. 2.(2011·山东高考理科·T7)某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆy bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )(A )63.6万元 (B )65.5万元 (C )67.7万元 (D )72.0万元【思路点拨】本题可先利用公式求出回归直线方程,再预报广告费用为6万元时的销售额. 【精讲精析】选 B.由表可计算4235742x +++==,49263954424y +++==,因为点7(,42)2在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4,所以7ˆ429.42a =⨯+, 解得$9.1a =,故回归方程为ˆ9.49.1yx =+, 令x=6得ˆy =65.5,选B. 3.(2011·山东高考文科·T8)某产品的广告费用x 万元与销售额y 万元的统计数据如下表:根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时,销售额为( )(A )63.6万元 (B )65.5万元 (C )67.7万元 (D )72.0万元【思路点拨】本题可先利用公式求出回归直线方程,再预报广告费用为6万元时销售额. 【精讲精析】选 B.由表可计算4235742x +++==,49263954424y +++==,因为点7(,42)2在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4,所以7ˆ429.42a =⨯+, 解得$9.1a =,故回归方程为ˆ9.49.1yx =+, 令x=6得ˆy =65.5,故选B. 4.(2011·湖南高考理科·T4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由2222n(ad bc)K (a b)(c d)(a c)(b d)110(40302020)K 7.8.60506050-=++++⨯⨯-⨯=≈⨯⨯⨯算得,附表:)(2k K P ≥0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )(A )在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”(B )在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” (C )有99%以上的把握认为“爱好该项运动与性别有关” (D )有99%以上的把握认为“爱好该项运动与性别无关”【思路点拨】本题考查独立性检验基础知识和运用知识的实际能力. 【精讲精析】选C.因为2K 7.8 6.635≈≥,所以相关的概率大于1-0.010=0.99,所以选C.5.(2011·湖南高考文科T5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列表:2222n(ad bc)K (a b)(c d)(a c)(b d)110(40302020)K 7.8.60506050-=++++⨯⨯-⨯=≈⨯⨯⨯由算得,附表:参照附表,得到的正确结论是( )(A )有99%以上的把握认为“爱好该项运动和性别有关” (B )有99%以上的把握认为“爱好该项运动和性别无关”(C )在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” (D )在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【思路点拨】本题考查独立性检验基础知识和运用知识的实际能力.【精讲精析】选 A. 因为2K 7.8 6.635≈≥,所以相关的概率大于1-0.010=0.99,所以选A.6.(2011·江西高考理科·T6) 变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( )(A )2r < 1r <0 (B )0<2r < 1r (C )2r <0<1r (D )2r =1r【思路点拨】先根据数据作出X 与Y 及U 与V 的散点图,再根据散点图判断出变量之间的正负相关.【精讲精析】选C.由散点图可得:变量Y 与X 正相关,变量V 与U 负相关,故12r 0,r 0.>< 7.(2011·江西高考文科·T7)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为e m ,众数为0m ,平均值为x ,则( ) (A )e m =0m =x (B )e m =0m <x (C )e m <0m <x (D )0m <e m <x【思路点拨】首先将这30个数据按照大小顺序排列,易得中位数,众数,最后计算平均值. 【精讲精析】选D.由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为e 56m 5.5,2+==又众数为0324351066738292102m 5,x 30⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯==平均值0e 179,m m x.30=∴<< 8.(2011·江西高考文科·T8)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x(cm) 174 176 176 176 178 儿子身高y(cm)175175176177177则y 对x 的线性回归方程为( )(A )$1=-y x (B )$1=+y x (C ) $1882=+y x (D )$176=y【思路点拨】由散点图可知,表中五组数据大体在$1y88x 2=+的附近. 【精讲精析】选C.将表中的五组数据分别代入选项验证,可知1x 2=+y 88最适合.9.(2011·陕西高考理科·T9)设1122(,),(,)x y x y ,…,(,)n n x y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )(A )x 和y 的相关系数为直线l 的斜率 (B )x 和y 的相关系数在0到1之间(C )当n 为偶数时,分布在l 两侧的样本点的个数一定相同 (D )直线l 过点(,)x y【思路点拨】根据最小二乘法的有关概念:样本点的中心,相关系数,线性回归直线的意义等进行判断. 【精讲精析】选D . 选项 具体分析结论A相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同不正确 B相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量为负相关不正确Cl 两侧的样本点的个数分布与n 的奇偶性无关,也不一定是平均分布不正确D 回归直线l 一定过样本点中心(,)x y ;由回归直线方程的计算公式$ay bx =-$可知直线l 必过点(,)x y 正确10.(2011·陕西高考文科·T9)设1122(,),(,),x y x y ··· ,(,)n n x y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )(A) 直线l 过点(,)x y(B )x 和y 的相关系数为直线l 的斜率 (C )x 和y 的相关系数在0到1之间(D )当n 为偶数时,分布在l 两侧的样本点的个数一定相同【思路点拨】根据最小二乘法的有关概念:样本点的中心,相关系数,线性回归方程的意义等进行判断. 【精讲精析】选A. 选项具体分析结论A回归直线l 一定过样本点中心(,)x y ;由回归直线方程的计算公式$=-$ay bx 可知直线l 必过点(,)x y 正确 B相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度,它们的计算公式也不相同不正确C相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在1-到0之间时,两个变量为负相关不正确D l 两侧的样本点的个数分布与n 的奇偶性无关,也不一定是平均分布 不正确二、填空题11.(2011.天津高考理科.T9)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为___________.【思路点拨】根据抽取样本的比例计算.21148=48=1248+364⨯⨯【精讲精析】.【答案】1212.(2011·浙江高考文科·T13)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测这3 000名学生在该次数学考试中成绩小于60分的学生数是____________.【思路点拨】本题主要考查由频率分布直方图求某组的频率.【精讲精析】在该次数学考试中成绩小于60分共有3组,频率之和为0.02+0.06+0.12=0.2, 所以在该次数学考试中成绩小于60分的学生数大约为3 0000.2⨯=600名. 【答案】600名 三、解答题13.(2011·安徽高考文科·T20)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程$ybx a =+; (Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地2012年的粮食需求量.【思路点拨】将数据处理一下,方便计算,然后利用公式求回归直线方程,并进行预测. 【精讲精析】(Ⅰ)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下:由预处理的数据,容易算得2.3,0==y x22224224294192)11()2()21()4(+++⨯+⨯+-⨯-+-⨯-=b =5.640260=. 2.3=-=x b y a .由上述计算结果,知所求回归直线方程为.2.3)2006(5.6)2006(257+-=+-=-∧x a x b y即 .2.260)2006(5.6+-=∧x y(Ⅱ)利用所求得的直线方程,可预测2012年的粮食需求量为6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).。

必修3 第二章 随机抽样、用样本估计总体、变量间的相关关系(学生版)

必修3 第二章  随机抽样、用样本估计总体、变量间的相关关系(学生版)

教学辅导教案1.(循环结构)阅读如图所示的程序框图,运行相应的程序,输出的S的值等于()A.18B.20C.21D.402.执行如图所示的程序框图,若输出k的值为8,则判断框内可填入的条件是()成为受人尊敬的百年育人集团第1页共24 页A .43≤s B .65≤s C .1211≤s D .2425≤s3.下边程序框图的算法思路源于我国古代数学名著《九章算术》中的“更相减损术”.执行该程序框图,若输入的a ,b 分别为14,18,则输出的a =( )A .0B .2C .4D .144.把38化为二进制数为( ) A .100110(2) B .101010(2)C .110010(2)D .110100(2)1.为了了解全校1 320名高一学生的身高情况,从中抽取220名学生进行测量,下列说法正确的是( )A .样本容量是220B .个体是每一个学生C .样本是220名学生D .总体是1 3202.某次科技创新活动有200名学生参加,现采用系统抽样方法,从参加活动的200人中抽取20人做问卷调查,将200人按1,2,…,200随机编号,则抽取的20人中,编号落入区间[121,180]的人数为 . 3.现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查.①科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.①高新中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是()A.①简单随机抽样,①系统抽样,①分层抽样B.①简单随机抽样,①分层抽样,①系统抽样C.①系统抽样,①简单随机抽样,①分层抽样D.①分层抽样,①系统抽样,①简单随机抽样4.如图是某校高三(1)班上学期期末数学考试成绩整理得到的频率分布直方图,由此估计该班学生成绩的众数、中位数分别为()A.115,113.3B.115,125C.125,113.3D.105,103 5.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图,则下面结论中错误的一个是()A.甲的极差是29 B.乙的众数是21C.甲罚球命中率比乙高D.甲的中位数是246.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.7.表中提供了某厂节能降耗技术改造后生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据.根据下表提供的数据,求出y 关于x 的线性回归方程为0.70.35y x =+,那么表中t 的值为( )x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.5知识点一 随机抽样 1.简单随机抽样 (1)总体个数有限;(2)抽取方式:逐个不放回抽取; (3)每个个体被抽到的概率:相等; (4)常用方法:抽签法、随机数法. 2.系统抽样将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样. 3.分层抽样当已知总体由差异明显的几部分组成时,将总体分成几部分(各部分互不交叉),然后按照各部分所占的比例进行抽样,这种抽样方法叫做分层抽样,所分成的部分叫做层.题型一 简单随机抽样【例1】 下列抽取样本的方式是否属于简单随机抽样? (1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. (3)从20件玩具中一次性抽取3件进行质量检验.第三步:将各个数据的叶依次写在其茎的右(左)侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是 s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2] s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]题型五 频率分布直方图的绘制与应用【例5】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组 [75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)在下表中作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【变式5】某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(总分为100分)分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]的6组加以统计,得到如图所示的频率分布直方图.已知不及格的人数比优秀(不低于90分)的人数多60人,则高一年级共有学生( )A .300人B .600人C .200人D .700人题型六 茎叶图的应用【例6】 如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关【变式6】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为 ( )A .1169B .367C .36D .677题型七 用样本的数字特征估计总体的数字特征【例7】 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.[来【变式7】(1)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B 两样本的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.知识点三变量间的相关关系1.变量间的相关关系变量间的关系常见的有两类:函数关系和相关关系.2.两个变量的线性相关(1)回归分析:对具有相关关系的两个变量进行统计分析的方法;即寻找相关关系中非确定性关系的某种确定性.(2)散点图:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图. (3)正负相关正相关:对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,正相关时散点图的点散布在从左下角到由上角的区域内.负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从左上角到右下角的区域. 3.回归直线方程(1)如果散点图中点的分布从整体上看大致分布在一条直线附近,我们就称这两个变量具有线性相关关系,这条直线叫回归直线.(2)回归直线方程记为:y bx a =+.其中,1221()ni i i nii x y nx yb x n x ---∑=-∑,a y bx =-(3)),(y x 称为样本的中心点,回归直线一定过样本点的中心),(y x . (4)线性相关关系的强与弱线性相关系数r :1≤r ,统计学认为]75.0,1[--∈r ,那么负相关很强;]1,75.0[∈r ,那么正相关很强;当0.25≤r ,那么相关性较弱. 题型八 由散点图判断变量的相关关系【例8】已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A .25.1ˆ+=x yB .25.1ˆ+-=x yC .25.1ˆ-=x yD .25.1ˆ--=x y 题型九 线性回归方程【例9】如图是我国2010年至2016年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1﹣7分别对应年份2010﹣2016.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以证明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑,721()0.55i i y y =-=∑,7 2.646≈.参考公式:12211()()()()ni i i nn i i i i t t y y r t t y y ===--∑=--∑∑,回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()=()ni i i ni i t t y y b t t ==-⋅-∑-∑,a y bt =-.【变式9-1】对于线性回归方程y bx a =+,下列说法中不正确的是( ) A .样本数据中x =0时,一定有y a = B .x 增加一个单位时,y 平均增加b 个单位 C .样本数据中x =0时,可能有y a = D .直线必经过点(x ,y )【变式9-2】四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程和相关系数r ,分别得到以下四个结论:①42.635.2-=x y ,93.0-=r ①65.547.3+-=x y ,95.0-=r ①49.843.5+=x y ,98.0=r ①58.432.4--=x y ,r = 0.89 其中,一定不正确的结论序号是( ) A .①① B .①①C .①①①D .①①①题型十 利用回归方程对总体进行估计【例10】已知变量 x ,y 具有线性相关关系,它们之间的一组数据如下表所示,若 y关于 x 的线性回归方程为13.1ˆ-=x y,则m = ; x 1 2 3 4 y0.11.8m4【变式10】为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元) 8.2 8.6 10.0 11.3 11.9 支出y (万元)6.27.58.08.59.8据上表得回归直线方程y bx a =+,其中0.76b =,a y bx =-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元 B .11.8万元 C .12.0万元D .12.2万元1.某校要从高一、高二、高三共2 012名学生中选取50名组成志愿团,若采用下面的方法选取,先用简单随机抽样的方法从2 012人中剔除12人,剩下的2 000人再按分层抽的方法进行,则每人入选的概率( ) A .都相等且为502 012B .都相等且为140C .不会相等D .均不相等2.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到编号之和为48,则抽到的最小编号为( )A.2 B.3 C.4 D.53.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为k①5①3,现用分层抽样方法抽出一个容量为120的样本,已知A种型号产品共抽取了24件,则C种型号产品抽取的件数为()A.24 B.30 C.36 D.404.一个年级有12个班,每个班有50名同学,随机编号为1~50,为了了解他们在课外的兴趣,要求每班第40号同学留下来进行问卷调查,这里运用的抽样方法是()A.抽签法B.分层抽样法C.随机数表法D.系统抽样法5.某校高三年级的学生共1 000人,一次测验成绩的分布直方图如图所示,现要按如图所示的4个分数段进行分层抽样,抽取50人了解情况,则80~90分数段应抽取________人.6.某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.7.五一期间,某淘宝店趁势推出了“抢红包”的促销活动.已知每人有5次抢红包的机会,每次可得到1元至30元不等的红包.甲、乙二人在这5次抢红包活动中获得的红包金额的茎叶图如图所示.若甲5次获得的红包金额的均值为x1,乙5次获得的红包金额的均值为x2,则x1-x2=________.8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.9.某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.10.某工厂经过技术改造后,生产某种产品的产量(吨)与相应的生产能耗(吨标准煤)有如下几组样本数据:x 3 4 5 6 y2.5344.5据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,那么这组数据的回归直线方程是 .(参考公式:1221ni i i nii x y nx yb x nx==-∑=-∑,a y bx =- )11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方9.5467.0ˆ+=x y. 零件数x 个 10 2030 40 50 加工时间y (min )62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为 . 12.对具有线性相关关系的变量x ,y ,测得一组数据如下x 2 4 5 6 8 y2040607080根据上表,利用最小二乘法得它们的回归直线方程为a x yˆ5.10ˆ+=,据此模型预测当x =10时,y 的估计值为( ) A .105.5B .106C .106.5D .107【查漏补缺】1.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .722.若6名男生和9名女生身高(单位:cm )的茎叶图如图,则男生的平均身高与女生身高的中位数分别为( )A .181 166B .181 168C .180 166D .180 1683.已知变量x 与y 负相关,且由观测数据算得样本平均数2=x ,5.1=y ,则由该观测数据算得的线性回归方程可能是( ) A .y =0.6x +1.1B .y =3x ﹣4.5C .y =﹣2x +5.5D .y =﹣0.4x +3.34.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5. (1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)估计在这次测试中,学生跳绳次数的中位数、众数及平均数。

2017-2018学年高中数学 考点45 随机抽样_用样本估计总体_变量间的相关关系_统计案例(

2017-2018学年高中数学 考点45 随机抽样_用样本估计总体_变量间的相关关系_统计案例(

考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2014·湖北高考文科·T6)根据如下样本数据得到的回归方程为ˆy=bx+a,则 ( ) A.a>0,b<0 B.a>0,b>0 C.a<0,b<0 D.a<0,b>0【解题提示】考查根据已知样本数据绘制散点图,由散点图判断线性回归方程中的b 与a 的符号问题.【解析】选A.画出散点图如图所示,y 的值大致随x 的增加而减小,所以b<0,a>0.2. (2014·湖南高考文科·T3)与(2014·湖南高考科理科·T2)相同对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( )123.A p p p =< 231.B p p p =< 132.C p p p =< 123.D p p p ==【解题提示】根据三种抽样方法的特点求解。

【解析】选D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

3. (2014·湖南高考理科·T2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别是123,,,p p p 则( )A .123p p p =<B .231p p p =<C .132p p p =<D .123p p p == 【解题提示】根据三种抽样方法的特点求解。

【解析】选 D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

4.(2014·广东高考文科·T6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为 ( ) A.50B.40C.25D.20【解题提示】分段的间隔等于样本空间总数除以抽取容量. 【解析】选C.分段的间隔为1000÷40=25. 5. (2014·山东高考理科·T7)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,......,第五组.右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.1B.8C.12D.18【解题指南】本题考查了频率分布直方图,先利用已知数据估计总体数据数据,然后再根据比例计算第三组数据有效的人数. 【解析】选C.由图知,样本总数为5024.016.020=+=N .设第三组中有疗效的人数为x ,则36.0506=+x,解得12=x . 6. (2014·山东高考文科·T8)与(2014·山东高考理科·T7)相同(2014·陕西高考文科·T9)某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A.,s2+1002B.+100,s2+1002C.,s2D.+100,s2【解题指南】根据样本数据均值和方差的计算公式代入求解即可.【解析】选D.样本数据x1,x2,…,x10的均值=(x1+x2+…+x10),方差s2=[(x1-)2+(x2-)2+…+(x10-)2]新数据x1+100,x2+100,…,x10+100的均值,=(x1+100+x2+100+…+x10+100)=(x1+x2+…+x10)+100=+100,新数据x1+100,x2+100,…,x10+100的方差,s'2=[(x1+100--100)2+(x2+100--100)2+…+(x10+100--100)2]=[(x1-)2+(x2-)2+…+(x10-)2]=s2.7.(2014·陕西高考理科·T9)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a 为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )A.1+a,4B.1+a,4+aC.1,4D.1,4+a【解题指南】根据样本数据均值和方差的计算公式代入求解即可.【解析】选A.样本数据x1,x2,…,x10的均值=(x1+x2+…+x10)=1,方差s'2=[(x1-1)2+(x2-1)2+…+(x10-1)2]=4,新数据x1+a,x2+a,…,x10+a的均值=(x1+a+x2+a+…+x10+a)=(x1+x2+…+x10)+a=1+a,新数据x1+a,x2+a,…,x10+a的方差s2=[(x1+a-1-a)2+(x2+a-1-a)2+…+(x10+a-1-a)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]=4.8.(2014·四川高考文科·T2)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本【解题提示】考查统计中总体的有关概念,属基本题.【解析】选A. 从500份中抽取200份,样本容量是200,抽取的200份是一个样本,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.所以选A.9. (2014·重庆高考文科·T3)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A. 100B.150C. 200D.250【解题提示】直接根据分层抽样的定义列出关于n的等式求解即可.【解析】选A.由分层抽样的定义可知70350035001500n=+,解得100.n=二、填空题10. (2014·湖北高考文科·T11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.【解析】依题意,设在甲生产的设备中抽50x件,则在乙生产的设备中抽30x件,所以50x+30x=4800,解得x=60,故乙设备生产的产品总数为1800件.答案:1800【误区警示】本题的易错点是理解分层抽样是一个等比例抽样,记忆公式是重点.11. (2014·湖北高考理科·T4)根据如下样本数据得到的回归方程为a bx y +=ˆ,则A.0,0>>b aB.0,0<>b aC.0,0><b aD.0.0<<b a【解题提示】考查根据已知样本数判绘制散点图,由散点图判断线性回归方程中的b 与a 的符号问题【解析】选B.画出散点图如图所示,y 的值大致随x 的增加而减小,因而两个变量呈负相关,所以0<b ,0>a12. (2014·上海高考理科·T1)某校高一、高二、高三分别有学生1600名、1200名、800名.为了解该校高中学生的牙齿健康情况,按各年级的学生数进行分层抽样.若高三抽取20名学生,则高一、高二共需抽取的学生数为___________.【解题提示】 根据分层抽样的定义,按三个年级的比例抽取,已知高三了,高一高二易得. 【解析】三个年级的学生数之比为4:3:2,高三抽取了20人,则高一、高二应分别抽取40、30人,故共抽取70人.13. (2014·天津高考文科·T9,同2014·天津高考理科·T9))某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取 名学生. 【解析】由430060,4556⨯=+++知应从一年级本科生中抽取60名学生.【答案】60三、解答题14. (2014·辽宁高考理科·T18)(本小题满分12分)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示:将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(Ⅰ)求在未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个的概率;(Ⅱ)用X 表示在未来3天里日销售量不低于100个的天数,求随机变量X 的分布列,期望()E X 及方差()D X .【解析】(Ⅰ)记1A 表示事件“日销售量不低于100个”,2A 表示事件“日销售量低于50个”,B 表示事件“未来连续3天里,有连续2天的日销售量都不低于100个且另一天的日销售量低于50个”,因此结合日销售量的频率分布直方图得()()10.0060.0040.002500.6p A =++⨯=; ()20.003500.15p A =⨯=; ()0.60.60.1520.108p B =⨯⨯⨯=(Ⅱ)X 的可能取值为0,1,2,3,相应的概率为()()301310.60.064p X C =-=,()()21230.610.60.288p X C =⨯-=()()122230.610.60.432p X C =⨯-=,()33330.60.216p X C ==所以X 的分布列为因为()3,0.6XB ,所以随机变量X 的期望()30.6 1.8E X =⨯=,方差()()30.610.60.72D X =⨯⨯-=15. (2014·辽宁高考文科·T18)(本小题满分12分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(Ⅰ)根据表中数据,问是否有95℅的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(Ⅱ)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:2κ=【解析】(Ⅰ)将22⨯列联表中的数据代入计算公式,得()2210060102010100 4.7627030802021κ⨯-⨯==≈⨯⨯⨯由于4.762 3.841>,所以有95℅的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(Ⅱ)从5名数学系学生中人去3人的一切可能结果所组成的基本事件为下列10个:()()()()()()121122123112113123,,,,,,,,,,,,,,,,,,a a b a a b a a b a b b a b b a b b ()()()()212213223123,,,,,,,,,,,a b b a b b a b b b b b其中(1,2)i a i =表示喜欢甜品的学生,(1,2,3)j b j =表示不喜欢甜品的学生,这10个基本事件的出现是等可能的.抽取3人,至多有1人喜欢甜品的事件为以下7个:()()()112113123,,,,,,,,,a b b a b b a b b ()()()()212213223123,,,,,,,,,,,a b b a b b a b b b b b从这5名学生中随机抽取3人,至多有人喜欢甜品的概率为7.1016. (2014·新课标全国卷Ⅱ高考理科数学·T19)(本小题满分12分)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程.(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121,niii ni i t t y y b t t ==--=-∑∑a y bt =-.【解题提示】(1)利用公式求得回归直线方程.(2)利用回归方程中b 的正负分析变化情况,将2015年的年份代号代入回归方程,估计家庭人均纯收入. 【解析】(1)因为t =1277+++ (4)y =2.93.3 3.64.4 4.85.2 5.97++++++=4.3, 设回归方程为y=bt+a,代入公式,经计算得 b=()3 1.420.700.5 1.8 4.89412⨯++++++++⨯=14142⨯=12, a=y -b t =4.3-12×4=2.3, 所以,y 关于t 的回归方程为y=0.5t+2.3. (2)因为b=12>0,所以2007年至2013年该地区人均纯收入稳步增长,预计到2015年, 该地区人均纯收入y=0.5×9+2.3=6.8(千元),所以,预计到2015年,该地区人均纯收入约6800元左右.17. (2014·重庆高考文科·T17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a 的值;(2)分别求出成绩落在[)50,60 与[)60,70 中的学生人数;(3)从成绩在[)50,70的学生中任选2人,求此 2人的成绩都在[)60,70中的概率. 【解题提示】 直接根据频率之和为1 可求出a 的值,再根据对应频率可求出成绩落在[)50,60 与[)60,70 中的学生人数,然后利用古典概型概率公式求解成绩都在[)60,70中的概率.【解析】(1)据直方图知组距为10 ,由(23672)101,a a a a a ++++⨯= 解得10.005200a == . (2)成绩落在[)50,60中的学生人数为20.0051020 2.⨯⨯⨯= 成绩落在[)60,70中的学生人数为30.0051020 3.⨯⨯⨯=(3)记成绩落在[)50,60中的2 人为12,,A A 成绩落在[)60,70中的3 人123,,B B B , 则从成绩在[)50,70的学生中任选2人的基本事件共有10 个:12(,),A A 11(,),A B 12(,),A B 13(,),A B 21(,),A B 22(,),A B 23(,),A B 12(,),B B 13(,),B B 23(,),B B其中2人的成绩都在[)60,70中的基本事件有3 个:12(,),B B 13(,),B B 23(,),B B故所求概率为3.10p18.(2014·安徽高考文科·T17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时) (1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()22n(ad bc)a b c d a c b d K -=++++【解题提示】分清样本总体、个体的概念,识别频率分布直方图,正确列出列联表求解,本题属于容易题。

高中数学 考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含高考试题)新人教A版

高中数学 考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含高考试题)新人教A版

考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2015·四川高考文科·T3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是 ( ) A.抽签法B.系统抽样法C.分层抽样法D.随机数法【解析】选C.因为题干中总体是由差异明显的三个部分组成的,所以选择分层抽样法. 2.(2015·安徽高考理科·T6)若样本数据1x ,2x ,⋅⋅⋅,10x 的标准差为8,则数据121x -,221x -,⋅⋅⋅,1021x -的标准差为( )A.8B.15C.16D.32【解题指南】应用标准差、方差公式和性质计算标准差。

【解析】选C 。

样本数据1x ,2x ,⋅⋅⋅,10x 8,则DX=64,而样本数据121x -,221x -,⋅⋅⋅,1021x -的方差D (2X-1)=222264DX =⨯,16=。

3. (2015·北京高考文科·T4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取样本中,青年教师有320人,则该样本的老年教师人数为 ( ) A.90B.100C.180D.300【解题指南】分层抽样总体与样本中各层的比相同. 【解析】选C.设样本中老年教师人数为n 人,3201600900n =,解得n=180. 4.(2015·山东高考文科·T6)为比较甲、乙两地14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为 ( ) A.①③B.①④C.②③D.②④【解题指南】由1255x x x x +++=L 和222125()()()5x x x x x x s -+-++-=L 求解.【解析】选B. 2628293131295x ++++==甲,2829303132305x ++++==乙,22222(2629)(2829)(2929)(3129)(3129)1855s -+-+-+-+-==甲,22222(2830)(2930)(3030)(3130)(3230)1055s -+-+-+-+-==乙. 5.(2015·新课标全国卷Ⅱ理科·T3)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图,以下结论不正确的是 ( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【解析】选D.由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关.6.(2015·新课标全国卷Ⅱ文科·T3)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图,以下结论不正确的是 ( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【解析】选D.由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关.7.(2015·湖北高考理科·T2)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( ) A.134石 B.169石 C.338石D.1 365石【解题指南】简单随机抽样,样本估计总体. 【解析】选B.设这批米内夹谷x 石,则由题意知, 28,2541534=x即281534169.254=⨯≈x 8.(2015·湖北高考文科·T2)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( ) A.134石 B.169石 C.338石D.1 365石【解析】选B.设这批米内夹谷x 石,则由题意知,28,2541534=x 即281534169.254=⨯≈x 9. (2015·重庆高考理科·T3)重庆市2013年各月的平均气温(C ︒)数据的茎叶图如下: 0 8 91 5 82 0 03 3 8 3 1 2则这组数据的中位数是( ) A.19B.20C.21.5D.23【解题指南】直接利用中位数的概念进行计算即可.【解析】选B.由中位数的概念可知,该组数据的从小到大顺序排列的第6和第7个数据的平均数即所要求的中位数,为20.10. (2015·重庆高考文科·T4)同(2015·重庆高考文科·T3)重庆市2013年各月的平均气温(C ︒)数据的茎叶图如下: 0 8 9 1 5 82 0 03 3 8 3 1 2则这组数据的中位数是( ) A.19B.20C.21.5D.23【解题指南】直接利用中位数的概念进行计算即可.【解析】选B.由中位数的概念可知,该组数据的从小到大顺序排列的第6和第7个数据的平均数即所要求的中位数,为20.11.(2015·福建高考理科·T4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为 ( ) A.11.4万元B.11.8万元C.12.0万元D.12.2万元【解题指南】样本点的中心(,)一定在回归直线上. 【解析】选B.由题意得1059.113.110.106.82.8_=++++=x ,858.95.80.85.72.6_=++++=y ,所以=8-0.76×10=0.4,所以=0.76x+0.4,把x=15代入得到=11.8.12. (2015·陕西高考理科·T2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 ( )A.167B.137C.123D.93【解题指南】根据扇形统计图可得初中部女教师所占比例为70%,高中部女教师所占比例为40%,再用各自的总人数乘以所占的比例即可求得答案. 【解析】选B.初中部女教师人数为110×70%=77, 高中部女教师人数为150×40%=60, 则该校女教师的人数为77+60=137, 故B 正确.13. (2015·陕西高考文科·T2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 ( )A.93B.123C.137D.167【解题指南】根据扇形统计图可得初中部女教师所占比例为70%,高中部女教师所占比例为40%,再用各自的总人数乘以所占的比例即可求得答案. 【解析】选C.初中部女教师人数为110×70%=77, 高中部女教师人数为150×40%=60, 则该校女教师的人数为77+60=137.14. (2015·湖北高考文科·T4)已知变量x 和y 满足关系y=-0.1x+1,变量y 与z 正相关,下列结论中正确的是 ( )A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关【解析】选C.因为变量x和y满足关系y=-0.1x+1,其中-0.1<0,所以x与y成负相关;又因为变量y与z正相关,不妨设z=ky+b(k>0),则将y=-0.1x+1代入即可得到:z=k(-0.1x+1)+b=-0.1kx+(k+b),所以-0.1k<0,所以x与z负相关.二、填空题15.(2015·湖北高考文科·T14)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a= .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【解题指南】利用频率和为1,求得a,由消费金额在区间[0.5,0.9]内的频率,求得消费金额在区间[0.5,0.9]内的购物者的人数.【解析】由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3,消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.答案:(1)3 (2)600016.(2015·福建高考文科·T13)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.【解题指南】首先计算出男生人数,再计算出男女比例,从而确定抽取男生人数.【解析】由题意知,男生人数=900-400=500,所以抽取比例为男生︰女生=500∶400=5∶4,样本容量为45,所以抽取的男生人数为45×=25.答案:2517. (2015·江苏高考·T2)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 . 【解题指南】利用平均数的概念计算即可. 【解析】12n x x x x n +++=L ,所以这组数据的平均数为46587666+++++=. 答案:618. (2015·广东高考文科·T12)已知样本数据x 1,x 2,…,x n 的均值=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为 .【解析】因为样本数据x 1,x 2,…,x n 的均值=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为2+1=2×5+1=11. 答案:11 三、解答题19. (2015·广东高考文科·T17)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x 的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 【解析】(1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得: x=0.0075,所以直方图中x 的值是0.0075. (2)月平均用电量的众数是2202402302+= 因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(2)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户, 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户, 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户, 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户, 抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户。

高中数学 考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含2015高考试题)

高中数学 考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含2015高考试题)

考点42 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2015·四川高考文科·T3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是 ( ) A 。

抽签法 B 。

系统抽样法 C.分层抽样法D.随机数法【解析】选C.因为题干中总体是由差异明显的三个部分组成的,所以选择分层抽样法. 2.(2015·安徽高考理科·T6)若样本数据1x ,2x ,⋅⋅⋅,10x 的标准差为8,则数据121x -,221x -,⋅⋅⋅,1021x -的标准差为( )A.8B 。

15C 。

16D 。

32【解题指南】应用标准差、方差公式和性质计算标准差.【解析】选C 。

样本数据1x ,2x ,⋅⋅⋅,10x 8,则DX=64,而样本数据121x -,221x -,⋅⋅⋅,1021x -的方差D(2X-1)=222264DX =⨯,16=。

3. (2015·北京高考文科·T4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取样本中,青年教师有320人,则该样本的老年教师人数为 ( ) A 。

90B 。

100C 。

180D 。

300【解题指南】分层抽样总体与样本中各层的比相同。

【解析】选C 。

设样本中老年教师人数为n 人,3201600900n=,解得n=180. 4.(2015·山东高考文科·T6)为比较甲、乙两地14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差。

考点26随机抽样 用样本估计总体 变量间的相关关系 统计案例

考点26随机抽样 用样本估计总体 变量间的相关关系 统计案例

考点26随机抽样用样本估计总体变量间的相关关系统计案例考点26随机抽样用样本估计总体变量间的相关关系统计案例考点26随机抽样&period;用样本估计总体&period;变量间的相关关系&period;统计案例中考题库为word版,恳请握住ctrl,滑动鼠标滚轴,调节最合适的观赏比例,页面右上角的关闭按钮可以回到目录。

考点26随机抽样、用样本估计总体、变量间的有关关系、统计数据案例1.(2021·陕西高考文科·t4)如图,样本a和b分别取自两个不同的总体,它们的样本平均数分别为xa和xb,样本标准差分别为sa和sb,则()(a)xa>xb,sa>sb(b)xa<xb,sa>sb(c)xa>xb,sa<sb(d)xa<xb,sa<sb【命题立意】本题考查样本平均数、标准差的概念的有效率应用领域,属于保分题。

【思路指点】轻易观测图像养胃结论,不必具体内容的运算【规范解答】选b由图易得xa<xb,又a波动性大,b波动性小,所以sa>sb【方法技巧】统计数据内容存有样本方法、样本特征数(均值、方差,直方图等)、重回分析、预测(应用领域)等,彰显算法思想.弄清楚基本概念,原理,计算方法等.2.(2021·山东高考理科·t6)样本中共有五个个体,其值分别为a,0,1,2,3,,若该样本的平均值为1,则样本方差为()【命题立意】本题考查用样本的平均数、方差,考查了学生的运算解能力.【思路指点】先由平均值算出a,再利用方差的计算公式解.【规范解答】选d,由题意知a+0+1+2+3)=1,解得a=-1,所以样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故挑选d.3.(2021·山东高考文科·t6)在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493换成一个最高分和一个最低分后,所余数据的平均值和方差分别为(a)92,2(b)92,2.8(c)93,2(d)93,2.8【命题立意】本题考查样本数据的平均值和方差的概念及运算,考查了考生的运算求解能力.【思路点拨】根据平均值和方差的公式直接计算即可,应注意去掉一个最高分和一个最低分后再计算.【规范解答】选了b,去掉一个最高分95一个最低分89,剩下5个数的平均值为(9090939493)92,方差为[(9092)2(9092)2(9392)2(9492)2(9392)2] 2.8554.(2021·福建高考文科·t9)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()a.91.5和91.5b.91.5和92c.91和91.5d.92和92【命题立意】本题考查中位数与平均数的求解。

高中数学 考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含2014高考试题)

高中数学 考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例(含2014高考试题)

考点45 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2014·湖北高考文科·T6)根据如下样本数据 x345678 y 4。

0 2.5 —0。

50。

5 -2.0—3.0得到的回归方程为ˆy=bx+a,则 ( ) A.a>0,b 〈0 B.a 〉0,b>0 C.a<0,b<0 D 。

a 〈0,b 〉0【解题提示】考查根据已知样本数据绘制散点图,由散点图判断线性回归方程中的b 与a 的符号问题。

【解析】选A.画出散点图如图所示,y 的值大致随x 的增加而减小,所以b 〈0,a>0.2. (2014·湖南高考文科·T3)与(2014·湖南高考科理科·T2)相同对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( )123.A p p p =< 231.B p p p =< 132.C p p p =< 123.D p p p ==【解题提示】根据三种抽样方法的特点求解。

【解析】选D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

3。

(2014·湖南高考理科·T2)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别是123,,,p p p 则( )A .123p p p =<B .231p p p =<C .132p p p =<D .123p p p == 【解题提示】根据三种抽样方法的特点求解。

【解析】选 D.因为随机抽样时,不论三种抽样方法的哪一种都要保证总体中每个个体被抽到的概率相等,所以三个概率值相等。

高考数学新一轮复习 详细分类题库 考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

高考数学新一轮复习 详细分类题库 考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2013·四川高考文科·T7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示。

以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )【解析】选 A.由[0,5),[5,10)内的频数均为1,可知频率分布直方图中的高度相等,可以排除选项B;由于分组时按照组距为5分的,而选项C,D 的组距为10,故错误;所以选A.2. (2013·重庆高考理科·T4)以下茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15 ) A. 2,5 B. 5,5 C. 5,8 D. 8,8 【解题指南】直接利用中位数和平均数的定义进行求解.【解析】选 C. 因为甲组数据的中位数为15,所以易知5=x ,又乙组数据的平均数为16.8,所以8.165241018159=+++++y ,解得8=y .故选C.3. (2013·重庆高考文科·T6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为( )A.0.2B.0.4C.0.5D.0.6【解题指南】直接根据数据的总个数和落在区间[22,30)内的个数求解即可.【解析】选B. 落在区间[20,30)内的个数为4个,总的数据有10个,故概率为0.4.选B. 4.(2013·湖南高考理科·T2)某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法 【解题指南】 本题要弄懂三种抽样方法之间的区别和联系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012年新高考题库考点46随机抽样、用样本估计总体、变量间的相关关系、统计案例温馨提示:此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例一、选择题1. (2012·湖北高考文科·T2)容量为20的样本数据,分组后的频数如下表:分组[10,20) [20,30) [30,40) [40,50) [50,60) [60,70)频数 2 3 4 5 4 2则样本数据落在区间[10,40)的频率为()(A)0.35 (B)0.45(C)0.55 (D)0.65【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P==0.45.2.(2012·湖南高考文科·T5)与(2012·湖南高考理科·T4)相同设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断. 【解析】选D.选项具体分析结论A x的系数大于零,正相关;正确B 回归直线l一定过样本点中心(,)x y;由回归直线方程的计算公式a y bx=-可知直线l必过点(,)x y正确C 由一次函数的单调性知,x每增加1cm,体重均增加0.85kg,是估计变量;正确D 体重应约为58.79kg,是估计变量. 不正确3. (2012·陕西高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53(C) 47,45,56 (D) 45,47,53【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即1(4547)462+=,排除C ,D ;再计算极差,最小数据是12,最大数据是68,所以681256-=,故选A.4.(2012·陕西高考理科·T6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )(A) x x <甲乙,m 甲>m 乙(B) x x <甲乙,m 甲<m 乙(C) x x >甲乙,m 甲>m 乙(D) x x >甲乙,m 甲<m 乙【解题指南】平均数的大小可以根据茎叶图中数据分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小【解析】选B.观察茎叶图可知x x <甲乙,甲组数据中的中位数是1(1822)202+=,乙组数据中的中位数是1(2731)292+=,∴m 甲<m 乙.故选B.5.(2012·安徽高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )()A 甲的成绩的平均数小于乙的成绩的平均数()B 甲的成绩的中位数等于乙的成绩的中位数()C 甲的成绩的方差小于乙的成绩的方差()D 甲的成绩的极差小于乙的成绩的极差【解题指南】根据平均数、方差、中位数的定义计算即可.【解析】选C .甲的成绩的方差为221(2212)25⨯+⨯=,乙的成绩的方差为221(1331) 2.45⨯+⨯=.甲的成绩的极差为4,乙的成绩的极差为4.6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( )(A )-1 (B )0 (C )12(D )1 【解题指南】理清相关系数与相关性强弱的关系是解决本题的关键.【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线112y x =+上,样本的相关系数应为1.7.(2012·江西高考文科·T6)小波一星期的总开支分布图如图1所示,一 星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比 为( )(A)30% (B)10% (C)3% (D)不能确定【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系.【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.8. (2012·江西高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本的平均数为y ()x y ≠.若样本的平均数()1z x y αα=+-,其中102α<<,则,n m 的大小关系为( )(A)n m < (B )n m > (C )n m = (D )不能确定【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由α的范围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系.【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,()()1212+n m x x x y y y z m n ++++++=+……nx m ym n +=+=()1x y αα+-整理得()()10x y m n αα-+-=⎡⎤⎣⎦,,x y ≠∴()10m n αα+-=即1n m αα=-,又10,,0121ααα⎛⎫∈∴<< ⎪-⎝⎭,1,n n m m ∴<∴<.9.(2012·山东高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )(A)众数 (B)平均数 (C)中位数 (D)标准差【解题指南】本题考查用样本的数字特征来估计总体.【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据,则众数、中位数、平均数比原来的都多2,而标准差不变.10.(2012·山东高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )(A )7 (B )9 (C )10 (D )15【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列.【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的号码为解得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故应选C.二、填空题11.(2012·天津高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校.【解题指南】根据抽取样本的比例计算.【解析】从小学中抽取1503⨯⨯(所),同理可得从中学中抽取30=30=18150+75+255753⨯⨯(所).30=30=9150+75+2510【答案】18 912. (2012·山东高考文科·T14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距. 【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.【答案】913.(2012·湖北高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.【解析】由842656⨯=,可知结果.【答案】614.(2012·浙江高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.【解题指南】利用抽样比乘以组内人数即可求出.【解析】此样本中男生人数为【答案】16015.(2012·广东高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列)【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两个数的平均数)的求法,以及标准差公式.【解析】假设这组数据按从小到大的顺序排列为1234,x x x x ,,,则1234142323+++=2,+=4,4+=4,+=2,2x x x x x x x x x x ⎧⎪⎧⎪∴⎨⎨⎩⎪⎪⎩2212(2)(2)2x x ∴-+-=,同理可求得2234(2)(2)2x x -+-=, 由1234,x x x x ,,,均为正整数,且1234()()x x x x ,,,均为圆22(2)(2)2x y -+-=上的点,分析知1234,x x x x ,,,应为1,1,3,3.【答案】1,1,3,316.(2012·福建高考文科·T14)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.【解题指南】女运动员本来占多大的比例,抽取后也应该占多大的比例,这就是分层抽样的精髓.【解析】由题意知,女运动员数为42,因此抽取的女运动员人数为42281298⨯=.【答案】1217.(2012·江苏高考·T2)某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_______名学生.【解题指南】关键算出高二年级学生人数在总数中的比例.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15. 【答案】15.18.(2012·辽宁高考文科·T19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(Ⅰ)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(Ⅱ)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附2 2112212211212(), n n n n nn n n nχ++++-=【解题指南】(1)据频率分布直方图可计算“体育迷”,“非体育迷”人数,按照提供的公式,计算相关数值,与所给数据比较,获得结论;(2)将所有的基本事件罗列,很容易解决问题.【解析】由所给的频率分布直方图知,“体育迷”人数为100(100.020100.005)25⨯⨯+⨯=“非体育迷”人数为75,则据题意完成22⨯列联表:非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计7525100将22⨯列联表的数据代入公式计算:2100(30104515)2112212217525455511221221()100 3.03033n n n n n n n n n χ⨯-⨯⨯⨯⨯-===≈⨯⨯⨯22100(30104515)22122175254555221221)100 3.03033n n n n n n ⨯-⨯⨯⨯⨯-==≈⨯⨯因为3.030 3.841<,所以没有理由认为“体育迷”与性别有关. (2)由所给的频率分布直方图知 “超级体育迷”人数为100(100.005)5⨯⨯=, 记(1,2,3)i a i =表示男性,(1,2)j b j =表示女性,所有可能结果构成的基本事件空间为{}12132311213112223212(),(),(),(),(),(),(),(),(),()a a a a a a a b a b a b a b a b a b b b Ω=,共有10个基本事件组成,且每个基本事件出现是等可能的;用A 表示事件“任选2人,至少1名女性”, 则{}11213112223212(),(),(),(),(),(),()A a b a b a b a b a b a b b b =,共有7个基本事件组成,故“任选2人,至少1名女性”的概率为7()10P A =.19. (2012·安徽高考文科·T18)若某产品的直径长与标准值的差的绝对值不超过1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm ), 将所得数据分组,得到如下频率分布表:分组 频数 频率 [-3, -2) 0.10 [-2, -1)8(Ⅰ)将上面表格中缺少的数据填在相应的位置上;(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.【解析】(I)(Ⅱ)不合格品的直径长与标准值的差落在区间(1,3]内的概率为0.50.20.7+=.(Ⅲ)合格品的件数为50002020198050⨯-=(件)20.(2012·湖南高考文科·T17)(本小题满分12分)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中的一次购物量超过8件的顾客占55%. (Ⅰ)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值; (Ⅱ)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率)【解析】(Ⅰ)由已知得251055,35,15,20y x y x y ++=+=∴==,该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为:115 1.530225 2.5203101.9100⨯+⨯+⨯+⨯+⨯=(分钟).(Ⅱ)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,123,,A A A 分别表示事件“该顾客一次购物的结算时间为1分钟”, “该顾客一次购物的结算时间为1.5分钟”, “该顾客一次购物的结算时间为2分钟”.将频率视为概率,得123153303251(),(),()10020100101004P A P A P A ======. 123123,,,A A A A A A A =且是互斥事件,123123()()()()()P A P A A A P A P A P A ∴==++33172010410=++=.故一位顾客一次购物的结算时间不超过2分钟的概率为710.21.(2012·福建高考文科·T18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (Ⅰ)求回归直线方程y bx a =+,其中20b =-,a y bx =-;(Ⅱ)预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(Ⅰ)由于1234561()8.56x x x x x x x =+++++=, 1234561()806y y y y y y y =+++++=.所以80208.5250a y bx =-=+⨯=,从而回归直线方程为ˆ20250yx =-+. (Ⅱ)设工厂获得的利润为L 元,依题意得22(20250)4(20250)20330100020(8.25)361.25L x x x x x x =-+--+=-+-=--+当且仅当8.25x =时,L 取得最大值,故当单价定为8.25元时,工厂可获得最大利润.22.(2012·广东高考文科·T17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中α的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.【解题指南】(1)本题根据每个区间上的矩形的面积和为1,可建立关于a 的方程,解出a 的值.(2)由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积之和. (3)本题关键是先把语文成绩在[50,60),[60,70),[70,80),[80,90)的人数求出来.根据每段的频率求出每段的频数.【解析】(1)由频率分布直方图知(0.040.030.022)101,0.005a a +++⨯=∴=. (2)550.05650.4750.3850.2950.0573⨯+⨯+⨯+⨯+⨯=. 所以平均分为73分.(3) 分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为⨯=⨯=⨯=⨯=.0.051005,0.410040,0.310030,0.210020所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:-+++=(人). 5,20,40,25.所以数学成绩在[50,90)之外的人数有100(5204025)10关闭Word文档返回原板块。

相关文档
最新文档