步步高高二数学暑假作业:【文】作业18统计、统计案例
高二数学典型统计案例习题及答案
典型案例作业1.某商场经理根据以往经验知道,有40%的客户在结账时会使用信用卡,则连续三位顾客都使用信用卡的概率为( )2.三个同学同时作一电学实验,成功的概率分别为1P ,2P ,3P ,则此实验在三人中三人都不成功的概率是( ) 3人被聘用是相互独立的,则甲乙两人中没有一人被聘用的概率( ) 4.甲射击运动员分别对一目标射击三次,甲射中的概率为0.4,则至少有一次射中的概率是________5.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:比较这两种手术对病人又发作心脏病的影响有没有差别.________.6.回答能否有99.9% 的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”7. 某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5工作年限x/年 3 5 6 7 9推销金额y/万元 2 3 3 4 5(1)求年推销金额y与工作年限x之间的相关系数;(2)求年推销金额y关于工作年限x的线性回归方程;(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.(参考数据: 1.04≈1.02;由检验水平0.01及n-2=3,查表得=0.959)8.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2010年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下表:该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数^=bx+a;据,求出y关于x的线性回归方程y(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?典型案例答案1. 0.0642.( 1-1P )(1-2P )(1-3P5.解:提出假设H 0:两种手术对病人又发作心脏病的影响没有差别. 根据列联表中的数据,可以求得K 2=392×(39×167-29×157)268×324×196×196≈1.78.当H 0成立时K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论. 6.解:K 2=200×(70×65-35×30)2100×100×105×95≈24.56.由于K 2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”. 7.解:(1)由∑i =1n(xi -x )(yi -y )=10,∑i =1n(xi -x )2=20,∑i =1n(yi -y )2=5.2,可得相关系数r =10104≈0.98. (2)设所求的线性回归方程为y ^ =b ^ x +a ^, 则b ^ =1020=0.5,a ^ =y -b^ x ∴年推销金额y 关于工作年限x 的线性回归方程为y^ =0.5x +0.4.(3)由(2)可知,当x =11时,y ^ =0.5x +0.4=0.5×11+0.4=5.9(万元) ∴ 8.解:(1)由数据,求得x=12,y=27.由公式,求得b=52,a=y-b x=-3.所以y关于x的线性回归方程为y^=52x-3.(2)当x=10,y^=52×10-3=22,|22-23|<2;同样,当x=8时,y^=52×8-3=17,|17-16|<2;所以,该研究所得到的回归方程是可靠的.。
步步高 高三数学(理)二轮专题突破课件 专题六 第3讲《统计与统计案例》
取 40 名职工作样本.用系统抽样法,将全体职工随机按 1~
200 编号,并按编号顺序平均分为 40 组(1~5 号,6~10 号,…,
196~200 号).若第 5 组抽出的号码为 22,则第 8 组抽出的号
本 讲
码应是________.若用分层抽样方法,则 40 岁以下年龄段应
栏 目
抽取________人.
热点分类突破
专题六 第3讲
附表:
P(K2(χ2)≥k) 0.050 0.010 0.001
k
3.841 6.635 10.828
本 参照附表,得到的正确结论是
()
讲 栏
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项
目 开
运动与性别有关”
关 B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项
两个数据的平均数) 横坐标
平均数
样本数据的算术平均 数
每个小矩形的面积乘 以小矩形底边中点的 横坐标之和
主干知识梳理
专题六 第3讲
(2)方差:s2=n1[(x1- x )2+(x2- x )2+…+(xn- x )2].
标准差:
本
s= n1[x1- x 2+x2- x 2+…+xn- x 2].
(2)2
热点分类突破
专题六 第3讲
(1)反映样本数据分布的主要方式有:频率分布
表、频率分布直方图、茎叶图.关于频率分布直方图要明确
每个小矩形的面积即为对应的频率,其高低能够描述频率的
本 讲
大小,高考中常常考查频率分布直方图的基本知识,同时考
栏 目
查借助频率分布直方图估计总体的概率分布和总体的特征
开 关
目
开 深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样
安徽省六安市2016年高二数学文暑假作业第18天Word版含
第18天 数列的概念与通项课标导航:1.了解数列的概念和几种简单的表示法; 2.了解数列是自变量为整数的一类函数. 一、选择题1. 下面是关于公差d>0的等差数列{a n }的四个命题:p 1:数列{a n }是递增数列; p 2:数列{na n }是递增数列;p 3:数列a nn是递增数列;p 4:数列{a n +3nd}是递增数列,其中的真命题为 ( ) A .p 1,p 2B .p 3,p 4C .p 2,p 3D .p 1,p 42. 已知数列 ,12,,7,5,3,1-n ,则53是它的( )A. 第22项B. 第23项C. 第24项D. 第28项 3. 已知031=--+n n a a ,则数列{}n a 是( )A. 递增数列B. 递减数列C. 常数列D. 摆动数列4. 数列{}n a 的通项公式为n n a n 2832-=,则数列{}n a 各项中最小项是( )A. 第4项B. 第5项 C . 第6项 D. 第7项5. 数列1,0,1,0,1,0,……的一个通项公式是( )A. ()2111+--=n n a B. ()2111+-+=n n a C. ()211--=n na D. ()211nna ---=6. 已知数列{}n a 知足()nn n n a a a 111-+=--且11=a ,则=35a a( )A.1516B.34 C. 158 D. 38 7. 已知()*1133,21N n a a a a n n n ∈+==+,则=n a ( )A.52+n B.42+n C. 53+n D. 43+n 8. 数列{a n }的通项a n =)(9998N n n n ∈--,则数列{a n }的前30项中最大项是( ) A .30aB .10aC . 9aD . 1a 二、填空题9. 数列{}n a 知足11=a ,13321++=-+n n a a n n ,依照那个数列的前4项并归纳通项公式得n a = ;10. 设{a n }是首项为1的正项数列,且(n +1)a n +12-na n 2+a n +1a n =0(n ∈N *),则它的通项公式a n =______________;11. 数列{}n a 中,已知()*1221,2,1N n a a a a a n n n ∈-===++,则=2002a ;12. 数列{}n a 知足⎪⎪⎩⎪⎪⎨⎧<≤-<≤=+)121(12)210(21n n n n n a a a a a ,若761=a ,则=8a .三、解答题13.已知数列{}n a 知足q pa a a n n +==+11,1,且15,342==a a ,求q p ,的值.14. 设数列{}n a 的前n 项和为n S ,已知()21nn n ba b S -=-(1)证明:当2b =时,{}12n n a n --⋅是等比数列; (2)求{}n a 的通项公式.15. 已知公差不为0的等差数列{}n a 的前3项和3S =9,且125,,a a a 成等比数列. (1)求数列{}n a 的通项公式和前n 项和n S ; (2)设n T 为数列11{}n n a a +的前n 项和,若1n n T a λ+≤对一切n N *∈恒成立,求实数λ的最小值.16. 设同时知足条件:①122++≥+n n n b b b ;②n b M ≤(N n +∈,M 是与n 无关的常数)的无穷数列{}n b 叫“仁风”数列.已知数列{}n a 的前n 项和n S 知足: (1)1n n aS a a =--(a 为常数,且0a ≠,1a ≠). (1)求{}n a 的通项公式; (2)设21nn n S b a =+,若数列{}n b 为等比数列,求a 的值,并证明此刻⎭⎬⎫⎩⎨⎧n b 1为“仁风”数列.【链接高考】[2013·安徽卷] 设数列{a n }知足a 1=2,a 2+a 4=8,且对任意n ∈N *,函数f(x)=(a n -a n +1+a n +2)x +a n +1cos x -a n +2sin x 知足'()2f π=0.(1)求数列{a n }的通项公式; (2)若,求数列{b n }的前n 项和S n .第18天1~8 DBAB BBCB ;9. 3n ; 10.n 1;11. 1-; 12. 75;13.⎩⎨⎧=-=63q p 或⎩⎨⎧==12q p ’14.(1)证明:由题意知12a =,且()21nn n ba b S -=-,()11121n n n ba b S +++-=-两式相减得()()1121nn n n b a a b a ++--=-,即12n n n a ba +=+ ① 当2b =时,由①知122n n n a a +=+,于是()()1122212n n n n n a n a n +-+⋅=+-+⋅()122n n a n -=-⋅又111210n a --⋅=≠,因此{}12n n a n --⋅是首项为1,公比为2的等比数列。
高考数学(文)自由复习步步高系列07(解析版).docx
高中数学学习材料唐玲出品【课本内容再回顾——查缺补漏】 回顾一:统计与统计案例 (1)随机抽样:①简单随机抽样:一般地,从元素个数为N 的总体中__________地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:____________和________________.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
②系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体________;第二步,确定____________,对编号进行________,当N n (n 是样本容量)是整数时,取k =N n ;当Nn (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用________________确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号____________,再加k 得到第3个个体编号__________,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
③分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个______________的几部分,每一部分叫做______,在各层中按层在总体中所占比例进行____________抽样或________抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样. (2)用样本估计总体:在研究总体时,常用样本的频率分布去估计总体分布,一般地,样本容量越大,这种估计就越精确。
步步高高二数学暑假作业:【文】作业18 随机变量及其分布
C.0.6
D.1
6. 在如图所示的正方形中随机投掷10000个点,则落入阴影部分(曲线 为正态分布
附:若
,则
,
的密度曲线)的点的个数的估计值为( ) .
A.1193
B.1359
C.2718
D.3413
7. 夏秋两季,生活在长江口外浅海域的中华鱼回游到长江,历经三千多公里的溯流搏击,回到金沙江一带产卵繁殖,产后待幼鱼长大到15厘米 左右,又携带它们旅居外海.一个环保组织曾在金沙江中放生一批中华鱼鱼苗,该批鱼苗中的雌性个体能长成熟的概率为0.15,雌性个体长成熟 又能成功溯流产卵繁殖的概率为0.05,若该批鱼苗中的一个雌性个体在长江口外浅海域已长成熟,则其能成功溯流产卵繁殖的概率为( )
14. 从甲地到乙地要经过 个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为 , , . ( )设 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量 的分布列和均值. ( )若有 辆车独立地从甲地到乙地,求这 辆车共遇到 个红灯的概率.
步步高高二数学暑假作业:【文】作业18 随机变量及其分布
步步高高二数学暑假作业:【文】作业18 随机变量及其分布
一、单选题
1. 若离散型随机变量 的分布列为:
0
1
则常数 的值为( )
A. 或
B.
C.
D.1
2. 打靶时,甲每打10次可中靶8次,乙每打10次可中靶7次,若两人同时射击一个目标,则他们同时中靶的概率是( )
A.
B.
C.
D.
3. 设随机变量
,则
等于( )
12. 某商场在儿童节举行回馈顾客活动,凡在商场消费满100元者即可参加射击赢玩具活动,具体规则如下:每人最多可射击3次,一旦击中,则
高中暑假作业:高二数学暑假作业答案解析.doc
高中暑假作业:高二数学暑假作业答案解析为大家整理的高中暑假作业:高二数学暑假作业答案解析文章,供大家学习参考!更多最新信息请点击高二考试网一、选择题(本大题共10小题,每小题3分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.已知集合,,则( C )A. B. C. D.2. 设是定义在上的奇函数,当时,,则( A )A. B. C.1 D.33. 已知向量满足,则( D )A.0B.1C.2D.4.设是等比数列,则“ ”是“数列是递增数列”的( B )A.充分而不必要条件B.必要而不充分条件C.充分必要条件D.既不充分也不必要条件5. 设m,n是两条不同的直线,、、是三个不同的平面,给出下列命题,正确的是( B )A.若,,则B.若,,则C.若,,则D.若,,,则[来6. 函数y=sin(2x+φ)的图象沿x轴向左平移个单位后,得到一个偶函数的图象,则φ的一个可能的值为(A)A. B. C. D.7.已知的内角A,B,C所对的边分别为a,b,c,若的可能取值为( D )A. B. C. D.8.设函数,则的值为( A )A. B.2014 C.2013 D.09.已知F是双曲线的左焦点,A为右顶点,上下虚轴端点B、C,若FB交CA于D,且,则此双曲线的离心率为( B )A . B. C. D.10.球O为边长为2的正方体ABCD-A1B1C1D1的内切球,P为球O的球面上动点,M为B1C1中点,,则点P的轨迹周长为( D )A . B. C. D.二、填空题(本大题共6小题,每小题3分,共18分).当平面上动点到定点的距离满足时,则的取值范围是▲ .16.如图,在扇形OAB中,,C为弧AB上的一个动点.若,则的取值范围是▲ .三、解答题(本大题共5小题,共52分,解答应写出文字说明、证明过程或演算过程)17. (本题满分10分)在中,角所对的边为,且满足(Ⅰ)求角的值;(Ⅱ)若且,求的取值范围.18.(本题满分10分)已知数列的首项,.(Ⅰ)求证:数列为等比数列;(Ⅱ)若,求的正整数.19.(本题满分10分)如图所示,平面平面,且四边形为矩形,四边形为直角梯形,,,,.(Ⅰ)求证平面;(Ⅱ)求平面与平面所成锐二面角的余弦值.四边形为直角梯形,四边形为矩形,,,又,平面,,又平面平面,为平面与平面所成锐二面角的平面角.,.即平面与平面所成锐二面角的余弦值为.(法二)(Ⅰ) 四边形为直角梯形,四边形为矩形,,,又平面平面,且,取,得.平面,平面一个法向量为,设平面与平面所成锐二面角的大小为,则.因此,平面与平面所成锐二面角的余弦值为.20.(本题满分10分)已知椭圆的两个焦点分别为,且,点在椭圆上,且的周长为6.(Ⅰ)求椭圆的方程;(Ⅱ)若点的坐标为,不过原点的直线与椭圆相交于不同两点,设线段的中点为,且三点共线.设点到直线的距离为,求的取值范围.解:(Ⅰ)由已知得,且,解得,又所以椭圆的方程为(Ⅱ) 当直线与轴垂直时,由椭圆的对称性可知:点在轴上,且原点不重合,显然三点不共线,不符合题设条件.所以可设直线的方程为,由消去并整理得:……①则,即,设,且,则点,因为三点共线,则,即,而,所以此时方程①为,且因为所以21. (本题满分12分)已知是不全为的实数,函数,,方程有实根,且的实数根都是的根,反之,的实数根都是的根.(Ⅰ)求的值;(Ⅱ)若,求的取值范围.解(Ⅰ)设是的根,那么,则是的根,则即,所以.(Ⅱ) ,所以,即的根为0和-1,①当时,则这时的根为一切实数,而,所以符合要求.当时,因为=0的根不可能为0和,所以必无实数根,②当时,= = ,即函数在,恒成立,又,所以,即所以;③当时,= = ,即函数在,恒成立,又,所以,,而,舍去综上,所以.。
2021【暑假作业】新高三数学 考点18 统计与统计案例(学生版)
5
三、解答题 15. BIM 指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是 否健康的一个标准.对于高中男体育特长生而言,当 BIM 数值大于或等于 20.5 时,我们说体重较重,当 BIM
数值小于 20.5 时,我们说体重较轻,身高大于或等于170cm 我们说身高较高,身高小于 170cm 我们说身高 较矮.
yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 y =0.85x-85.71,则下列结论中不正确的是( )
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( x , y )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 3.如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已 知该年级男生女生各 500 名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽 取 32 人,则抽取的男生人数为( )
(1)根据茎叶图找出 40 岁以上网友中满意度得分的众数和中位数;
(2)根据茎叶图完成下面列联表,并根据以上数据,判断是否有 99% 的把握认为满意度与年龄有关;
满意
不满意
合计
40 岁以下
40 岁以上
合计
(3)先采用分层抽样的方法从 40 岁及以下的网友中选取 7 人,再从这 7 人中随机选出 2 人,将频率
1
A.16
B.32
C.24
D.8
4.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校 2400 名学生中抽取 30 人
【步步高】2021届高考数学总温习 创新题目技术练 统计、统计案例 理 新人教B版(1)
创新题目技术练——统计、统计案例A 组 专项基础训练 (时刻:40分钟)一、选择题1. 从2 012名学生当选取50名学生参加数学竞赛,假设采纳下面的方式选取:先用简单随机抽样从2 012人中剔除12人,剩下的2 000人再按系统抽样的方式抽取50人,那么在2 012人中,每人入选的概率( )A .不全相等B .均不相等C .都相等,且为251 006D .都相等,且为140答案 C解析 在各类抽样中,不管是不是剔除个体,也不管抽取的前后顺序,每一个个体被抽到的可能性都是相等的,这是各类抽样的一个特点,也说明了抽样的公平性.故此题包括被剔除的12人在内,每人入选的概率是相等的,都是502 012=251 006.2. 右图是依照某校10位高一同窗的身高(单位:cm)画出的茎叶图,其中左侧的数字从左到右别离表示学生身高的百位数字和十位数字, 右边的数字表示学生身高的个位数字,从图中能够取得这10位同 学身高的中位数是( )A .161 cmB .162 cmC .163 cmD .164 cm 答案 B解析 由给定的茎叶图可知,这10位同窗身高的中位数为161+1632=162(cm).3. 已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)知足回归直线方程y ^=b ^x +a ^,那么“(x 0,y 0)知足回归直线方程y ^=b ^x +a ^”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的 ( )A .充分没必要要条件B .必要不充分条件C .充要条件D .既不充分也没必要要条件答案 B解析 x 0,y 0为这10组数据的平均值, 依照公式计算回归直线方程y ^=b ^x +a ^的b ^以后, 再依照a ^=y -b ^x (x ,y 为样本平均值)求得a ^.因此(x ,y )必然知足回归直线方程,但知足回归直线方程的除(x ,y )外,可能还有其他样本点. 4. 在样本频率散布直方图中,共有11个小长方形,假设中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,那么中间一组的频数为( )A .32B .0.2C .40D .0.25 答案 A解析 由频率散布直方图的性质,可设中间一组的频率为x ,那么x +4x =1, ∴x =0.2,故中间一组的频数为160×0.2=32,选A.5. 假设某校高一年级8个班参加合唱竞赛的得分茎叶图如下图,那么这组数据的中位数和平均数别离是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5. 二、填空题6. 某校开展“爱我海西、爱我家乡”摄影竞赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发觉有一个数字(茎叶图中的x ) 无法看清,假设记分员计算无误,那么数字x 应该是________. 答案 1解析 当x ≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,则89+89+92+93+92+91+x +907=91,∴x =1.7. 甲、乙两人在10天中天天加工零件的个数用茎叶图表示如以下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,那么这10天甲、乙两人日加工零件的平均数别离为________和________. 答案 24 23 解析x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24.x 乙=110×(19+17+11+21+24+22+24+30+32+30)=23.8. 如下图是某公司(员工总人数300人)2021年员工年薪情形的频率散布直方图,由此可知,员工中年薪在2.4万元~2.6万元之间的共有________人. 答案 72解析 由所给图形,可知员工中年薪在2.4万元~2.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24,因此员工中年薪在2.4万元~2.6万元之间的共有300×0.24=72(人). 三、解答题9. 某个体服装店经营某种服装,一周内获纯利y (元)与该周天天销售这种服装的件数x 之间的一组数据如下:已知:∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑7i =1x i y i =3 487. (1)求x ,y ;(2)判定纯利润y 与天天销售件数x 之间是不是线性相关,若是线性相关,求出回归直线方程. 解 (1)x =17(3+4+5+6+7+8+9)=6,y =17(66+69+73+81+89+90+91)≈79.86.(2)依照已知∑7i=1x2i=280,∑7i=1y2i=45 309,∑7i=1x i y i=3 487,得相关系数r=3 487-7×6×79.86280-7×6245 309-7×79.862≈0.973.由于0.973>0.754,因此纯利润y与天天销售件数x之间具有显著的线性相关关系.利用已知数据可求得回归直线方程为y^=4.75x+51.36.10.某低级中学共有学生2 000名,各年级男、女生人数如表:初一年级初二年级初三年级女生373x y男生377370z(1)求x的值;(2)现用分层抽样的方式在全校抽取48名学生,问应在初三年级抽取多少名?(3)已知y≥245,z≥245,求初三年级中女生比男生多的概率.解(1)因为x2 000=0.19,因此x=380.(2)初三年级人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方式在全校抽取48名学生,应在初三年级抽取的人数为500×482 000=12.(3)设“初三年级中女生比男生多”的事件为A,初三年级中女生、男生人数记为(y,z);由(2),知y+z=500,且y,z∈N,大体事件空间包括的大体事件有(245,255)、(246,254)、(247,253)、…、(255,245)共11个,事件A包括的大体事件有(251,249)、(252,248)、(253,247)、(254,246)、(255,245)共5个,因此P(A)=511.B组专项能力提升(时刻:30分钟)1.某地域选出600名消防官兵参与灾区救援,将其编号为001,002,…,600.为打通生命通道,先采纳系统抽样方式抽出50名为先遣军队,且随机抽得的号码为003.这600名官兵来源于不同的县市,从001到300来自A 市,从301到495来自B 市,从496到600来自C 市,那么三个市被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9答案 B解析 依题意可知,在随机抽样中,第一次抽到003号,以后每隔12个号抽到一个人,那么别离是003、01五、027、03九、05一、063、07五、…,容易明白抽到的编号组成以3为首项,12为公差的等差数列,故被抽到的第n 名消防官兵的编号为a n =3+(n -1)×12=12n -9,由1≤12n A -9≤300,那么1≤n A ≤25,因此抽取到的A 市的人数为25人. 同理可知其他两市的人数为17和8.应选B.2. 在2021年3月15日那天,南昌市物价部门对本市5家商场某商品的一天销售量及其价钱进行了调查,5家商场的售价x 元和销售量y 件之间的一组数据如表所示:通过散点图,可知销售量y 与价钱x 之间有较好的线性相关关系,其回归直线方程是y ^=-3.2x +a ^,那么a ^等于( )A .-24B .35.6C .40.5D .40答案 D解析 由题意,得x =15×(9+9.5+10+10.5+11)=10,y =15×(11+10+8+6+5)=8,且回归直线必通过点(x ,y )即点(10,8), 那么有8=-3.2×10+a ^,解得a ^=40.3. 已知某商场新进3 000袋奶粉,为检查其三聚氰胺是不是达标,现采纳系统抽样的方式从中抽取150袋进行检查,假设第一组抽出的号码是11,那么第六十一组抽出的号码为________. 答案 1211解析 每组袋数d =3 000150=20,由题意知抽出的这些号码是以11为首项,20为公差的等差数列,故第六十一组抽出的号码为11+60×20=1211.4. 有同窗在用电子邮件时发觉了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少.为了研究国籍与邮箱名称是不是含有数字有关,于是咱们共搜集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么以为“国籍和邮箱名称里是不是含有数字有关”的把握性为________.(用百分数表示)P (χ2≥k 0) 0.25 0.15 0.10 0.05 0.025 0.010 k 01.3232.0722.7063.8415.0246.635答案 97.5% 解析中国人 外国人 总计 有数字 43 27 70 无数字 21 33 54 总计6460124由表中数据,得χ2=124×43×33-27×21270×54×64×60≈6.201,∵χ2≥5.024,∴有97.5%的把握以为“国籍和邮箱名称里是不是含有数字有关”.5. 某校高三数学竞赛初赛后,对考生成绩进行统计(考生成绩均不低于90分,总分值150分),将成绩按如下方式分成六组,第一组[90,100),第二组[100,110),……,第六组[140,150].如下图为其频率散布直方图的一部份,第四组,第五组,第六组的人数依次成等差数列,且第六组有4人.(1)请补充完整频率散布直方图,并估量这组数据的平均数M ;(计算时能够用组中值代替各组数据的平均值) (2)现依照初赛成绩从第四组和第六组中任意选2人,记他们的成绩别离为x ,y ,假设|x -y |≥10,那么称此2人为“黄金帮扶组”,试求选出的2人为“黄金帮扶组”的概率. 解 (1)设第四组,第五组的频率别离为m ,n , 那么2n =m +0.005×10,① m +n =1-(0.005+0.015+0.020+0.035)×10,②由①②解得m =0.15,n =0.1,从而得出频率散布直方图(如下图).M =95×0.2+105×0.15+115×0.35+125×0.15+135×0.1+145×0.05=114.5.(2)依题意,知第四组人数为4×0.0150.005=12,而第六组有4人,因此第四组和第六组一共有16人,从中任选2人,一共有C 216=120(种)选法,假设知足|x -y |≥10,那么必然是别离从两个小组中各选1人,因此有C 112C 14=48(种)选法,因此选出的2人为“黄金帮扶组”的概率P =48120=25.。
【步步高】2015届高三数学人教B版【配套文档】 第十一章 统计、统计案例 第1课
§11.1 随机抽样1. 简单随机抽样(1)定义:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数表法. 2. 系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =Nn ;当Nn 不是整数时,可随机地从总体中剔除余数,再确定分段间隔; (3)在第1段用简单随机抽样确定第一个个体编号s (s ≤k );(4)按照一定的规则抽取样本,通常是将s 加上间隔k 得到第2个个体编号(s +k ),再加k 得到第3个个体编号(s +2k ),依次进行下去,直到获取整个样本. 3. 分层抽样(1)分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)当总体由有明显差异的几部分组成时,往往选用分层抽样.1. 判断下面结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √ ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关. ( × ) (3)系统抽样在起始部分抽样时采用简单随机抽样.( √ )(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( × ) (5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( × )2. 在某班的50名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是( )A .随机抽样B .分层抽样C .系统抽样D .以上都不是答案 C3. 将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )A .700B .669C .695D .676 答案 C解析 由题意可知,第一组随机抽取的编号l =15,分段间隔数k =N n =1 00050=20,则抽取的第35个编号为a 35=15+(35-1)×20=695.4. 大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为________________. 答案 简单随机抽样解析 因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.5. 一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________. 答案 12解析 样本的抽取比例为2148+36=14, 所以应抽取男运动员48×14=12(人).题型一简单随机抽样例1下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.(3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.思维启迪判断一个抽样是否为简单随机抽样,要判断是否符合简单随机抽样的特征.解(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.(2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.(4)不是简单随机抽样.因为不是等可能抽样.思维升华(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()答案 D解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.题型二系统抽样例2将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9思维启迪系统抽样又称“等距抽样”.可以根据“等距”确定各营区被抽中的人数.答案 B解析由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N+)组抽中的号码是3+12(k-1).令3+12(k-1)≤300得k≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k-1)≤495得1034<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B.思维升华(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为() A.11 B.12 C.13 D.14答案 B解析由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人).题型三分层抽样例3(2013·湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A.9 B.10 C.12 D.13思维启迪分层抽样,抽样比是一个定值.答案 D解析∵360=n120+80+60,∴n=13.思维升华在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )A.24 B .18 C .答案 C解析 依题意我们知道二年级的女生有380人,那么三年级的学生人数应该是2 000-373-377-380-370=500,即总体中各个年级的人数比为3∶3∶2,故在分层抽样中应在三年级抽取的学生人数为64×28=16.五审图表找规律典例:(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人? (3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况↓(观察图表中的人数分类统计情况) 样本人群应受年龄影响↓(表中老、中、青分类清楚,人数确定) 要以老、中、青分层,用分层抽样 ↓要开一个25人的座谈会 ↓(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响↓(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样↓要抽20人调查对广州亚运会举办情况的了解↓可认为亚运会是大众体育盛会,一个单位人员对情况了解相当将单位人员看作一个整体↓(从表中数据看总人数为2 000人)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,[1分]抽取比例为402 000=150. [2分]故老年人,中年人,青年人各抽取4人,12人,24人.[4分] (2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,[5分]抽取比例为252 000=180,[6分]故管理,技术开发,营销,生产各抽取2人,4人,6人,13人.[8分](3)用系统抽样,对全部2 000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1 900,共20人组成一个样本.[12分]温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.方法与技巧三种抽样方法的比较进行分层抽样时应注意几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同; (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.A 组 专项基础训练 (时间:30分钟)一、选择题1. (2012·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为 ( )A .101B .808C .1 212D .2 012 答案 B解析 由题意知抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有1296=101N,解得N =808.2. 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 ( )A .6B .8C .10D .12 答案 B解析 设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽人数为14×4070=8. 3. 某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A .7B .15C .25D .35 答案 B解析 由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.4. 为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为 ( )A .13B .19C .20D .51 答案 C解析 抽样间隔为46-33=13, 故另一位同学的编号为7+13=20,选C.5. 某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按1100的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为( )A .8B .11C .16D .10 答案 A解析 设高一学生有x 人,则高三学生有2x 人,高二学生有(x +300)人,学校共有4x +300=3 500(人),解得x =800(人),由此可得按1100的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为1100×800=8(人),故应选A. 二、填空题6. (2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校. 答案 18 9解析 150×30150+75+25=150×30250=18,75×30250=9.7. 将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.答案 16,28,40,528. (2012·福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________. 答案 12解析 依题意,女运动员有98-56=42(人). 设应抽取女运动员x 人,根据分层抽样特点, 得x 42=2898,解得x =12. 9. 课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________. 答案 2解析 由已知得抽样比为624=14,∴丙组中应抽取的城市数为8×14=2.10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是______________. 答案 11解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x ,则由系统抽样的法则可知,第n 组抽出个体的号码应该为x +(n -1)×8,所以第16组应抽出的号码为x +(16-1)×8=123,解得x =3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.B 组 专项能力提升 (时间:30分钟)1. 某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250 ②5,9,100,107,111,121,180,195,200,265 ③11,38,65,92,119,146,173,200,227,254 ④30,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是 ( )A .②、③都不能为系统抽样B .②、④都不能为分层抽样C .①、④都可能为系统抽样D .①、③都可能为分层抽样答案 D解析 因为③为系统抽样,所以选项A 不对;因为②为分层抽样,所以选项B 不对;因为④不为系统抽样,所以选项C 不对,故选D.2. (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15 答案 C解析 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.3. 为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________. 答案 404. 200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号分为40组,分别为1~5, 6~10,…,196~200,第5组抽取号码为22,第8组抽取号码 为______.若采用分层抽样,40岁以下年龄段应抽取______人. 答案 37 20解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x 人, 则40200=x100,解得x =20. 5. 一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同,若m =8,则在第8组中抽取的号码是________. 答案 76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.6. 某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n 2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n +1)时,总体容量是35人,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6.即样本容量n =6.。
【步步高】高中数学 第二章 §2.3.1平均数及其估计配套训练 苏教版必修3
§2.3 总体特征数的估计2.3.1 平均数及其估计一、基础过关1. 已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a ,中位数为b ,众数为c ,则a ,b ,c 的大小关系为________. 2. 下列说法错误的是________.(填序号)①在统计里,把所需考察对象的全体叫作总体; ②一组数据的平均数一定大于这组数据中的每个数据;③平均数、众数与中位数从不同的角度描述了一组数据的集中趋势; ④众数是一组数据中出现次数最多的数.3. 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于________.4. 已知样本数据x 1,x 2,…,x 10,其中x 1,x 2,x 3的平均数为a ,x 4,x 5,x 6,…,x 10的平均数为b ,则样本数据的平均数为____________.5. 期中考试以后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么MN为________. 6. 某课外活动小组对该市空气含尘调查,下面是一天每隔两小时测得的数据:0.03、0.03、0.04、0.05、0.01、0.03(单位G/M 3) (1)求出这组数据的众数和中位数?(2)若国标(国家环保局的标准)是平均值不得超过0.025 G/M 3;问这一天城市空气是否符合标准?7. 某地区全体九年级的3 000名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人. 请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格). 二、能力提升8. 电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计为______小时. 9. 某商店的大米价格是3.00元/千克,面粉的价格是3.60元/千克,大米与面粉的销量分别是1 000千克,500千克,则该商店出售的粮食的平均价格是______元/千克. 10.若有一个企业,70%的员工收入1万,25%的员工年收入3万,5%的员工年收入11万,则该企业员工的年收入的平均数是______万,中位数是____万,众数是____万.11.有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5),8,0.08.试估计总体的平均数.三、探究与拓展12.已知一组数据:125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128(1)填写下面的频率分布表:(2)(3)根据直方图或频率分布表求这组数据的众数、中位数和平均数.答案1.c >b >a 2.② 3.-3 4.3a +7b10 5.16.解 (1)由题知众数是0.03,中位数为0.03;(2)这一天数据平均数是0.003, ∵0.03>0.025,∴这一天该城市空气不符合国标. 7. 解 运用计算器计算得:100×12+90×30+80×18+70×24+60×12+50×4100=79.40,(12+30+18+24+12)÷100=96%,所以样本的平均分是79.40分,合格率是96%,由此来估计总体3 000名学生的平均分是79.40分,合格率是96%. 8.28 9.3.20 10.2 1 111.解 由于每组数据是一个范围,所以可以用组中值近似地表示平均数.方法一 总体的平均数约为1100(13.5×6+15.5×16+17.5×18+19.5×22+21.5×20+23.5×10+25.5×8)=19.42.故总体的平均数约为19.42.方法二 求组中值与对应频率积的和13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.故总体的平均数约为19.42. 12.解 (1)(2)(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5.图中虚线对应的数据为中位数,即124.5+2×58=125.75.使用“组中值”求平均数:x=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8.。
高二数学统计案例试题
高二数学统计案例试题1.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④【答案】C【解析】①函数关系是一种确定性关系,这是一个正确的结论.②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对.与③对比,依据定义知④是正确的,故答案为C。
【考点】本题主要考查相关关系。
点评:本题主要考查相关关系,对本题的正确判断需要对相关概念的熟练掌握。
2.在分析两个分类变量之间是否有关系时,常用到的图表有.【答案】列联表、三维柱形图、二维条形图【解析】在分析两个分类变量之间是否有关系时,常用到的图表有列联表、三维柱形图、二维条形图。
【考点】本题主要考查变量的相关关系。
点评:用列联表、三维柱形图、二维条形图等研究变量关系。
3.在回归分析中,通过模型由解释变量计算预报变量的值时,应注意什么问题?【答案】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值【解析】应注意下列问题:(1)回归方程只适用于我们所研究的样本的总体;(2)我们所建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.【考点】本题主要考查回归分析的基本思想和方法及其应用。
点评:明确概念,牢记性质。
4.某10名同学的数学、物理、语文成绩如下表:试分别研究他们的数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,你能发现什么规律?【答案】数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【解析】可求出物理成绩与数学成绩的相关系数,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.【考点】本题主要考查回归分析、相关系数。
2018届高二数学第1章统计案例1.2回归分析14
1.2 回归分析1.线性回归模型(1)线性回归模型y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差. (2)随机误差产生的原因主要有以下几种: ①所用的确定性函数不恰当引起误差; ②忽略了某种因素的影响; ③存在观测误差.(3)在线性回归方程y ^=a ^+b ^x 中b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -(其中x -=1n ∑i =1n x i ,y -=1n ∑i =1ny i ).其中,a ^,b ^分别为a ,b 的估计值,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 2.相关系数(1)计算两个随机变量间线性相关系数的公式∑i =1nx i -x-2∑i =1ny i -y-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x-2∑i =1ny 2i -n y -2(2)r 具有如下性质:①|r |≤1;②|r |越接近于1,x ,y 的线性相关程度越强; ③|r |越接近于0,x ,y 的线性相关程度越弱. 3.对相关系数进行显著性检验的基本步骤(1)提出统计假设H 0:变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式y ^=a ^+b ^x 就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出b ^,再由a ^=y --b ^x -求出a ^,写出回归直线方程y ^=b ^x +a ^.计算时应注意:(1)求b ^时,利用公式b ^=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x-2,先求出x -=1n (x 1+x 2+…+x n ),y -=1n(y 1+y 2+…+y n ),∑i =1nx i y i =x 1y 1+x 2y 2+…+x n y n ,∑i =1nx 2i =x 21+x 22+…+x 2n .再由a ^=y --b ^x -求出a ^的值,并写出回归直线方程.(2)线性回归方程中的截距a ^和斜率b ^都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.(3)回归直线方程y ^=a ^+b ^x 中的b ^表示x 增加1个单位时,y ^的变化量为b ^,而a ^表示y ^不随x 的变化而变化的部分.(4)可以利用回归直线方程y ^=a ^+b ^x 求在x 取某一个值时y 的估计值.[例1] 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计资料:若由数据可知,y 对x 呈线性相关关系. (1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少?[思路点拨] 由于题目条件已经指明y 对x 呈线性相关关系,所以可直接利用公式求a ^与b ^,然后求出线性回归方程,最后把10代入,估计维修费用.[精解详析] (1)列表如下:经计算得:x -=4,y -=5,∑i =15x 2i =90,∑i =15x i y i =112.3,于是b ^=∑i =15x i y i -5x -y-∑i =15x 2i -5x -2=1.23,a ^=y --b ^·x -=0.08,所以线性回归方程为y ^=b ^x +a ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元),即若估计使用年限为10年时,维修费用为12.38万元.[一点通] 若题目中没有指明y 对x 呈线性相关关系,而只给出资料,则需根据散点图或利用线性相关系数先确定变量是否线性相关,再求线性回归方程.1.(辽宁高考)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2542.(湖北高考改编)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是________.解析:由回归直线方程y ^=b ^x +a ^,知当b ^>0时,x 与y 正相关,当b ^<0时,x 与y 负相关,所以①④一定错误.答案:①④3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时的销售额为________万元.解析:∵x -=4+2+3+54=72,y -=49+26+39+544=42.又y ^=b ^x +a ^必过(x -,y -), ∴42=72×9.4+a ^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). 答案:65.54.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=bx +a ,其中b =-20,a =y --b x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y -bx =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.[例2] 10名同学在高一和高二的数学成绩如下表:其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.[思路点拨] 可先计算线性相关系数r 的值,然后与r 0.05比较,进而对x 与y 的相关性做出判断.[精解详析] (1)由已知表格中的数据,求得x -=71,y -=72.3,r=∑i =110x i -x-y i -y-∑i =110x i -x-2∑i =110y i -y-2≈0.78.由检验水平0.05及n -2=8,在课本附录1中查得r 0.05=0.632,因为0.78>0.632, 所以y 与x 之间具有很强的线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y ^=a ^+b ^x ,则有b ^=∑i =110x i -x-y i -y-∑i =110x i -x-2≈1.22,a^=y --b ^x -=72.3-1.22×71=-14.32.所以y 关于x 的回归直线方程为y ^=1.22x -14.32.[一点通] 判断x 与y 是否具有线性相关关系,还可以先作出散点图,从点的分布特征来判定是否线性相关.有些同学不对问题进行必要的相关性检验,直接求x 与y 的回归直线方程,它就没有任何实际价值,也就不能准确反映变量x 与y 间的变化规律.另外,要注意计算的正确性.5.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则r 1与r 2的关系为________.解析:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0,所以有r 2<0<r 1.答案:r 2<0<r 16.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x +1上,样本的相关系数应为1.答案:17.为了了解某地母亲身高x 与女儿身高y 的相关关系,现随机测得10对母女的身高,所得数据如下表所示:试对x 与y 进行线性回归分析,并预测当母亲身高为161 cm 时,女儿的身高为多少? 解:作线性相关性检验. x -=110×(159+160+…+157)=158.8, y -=110×(158+159+…+156)=159.1,∑i =110x 2i -10(x -)2=(1592+1602+…+1572)-10×158.82=47.6, ∑i =110x i y i -10x -y -=(159×158+160×159+…+157×156)-10×158.8×159.1=37.2,∑i =110y 2i -10(y -)2=(1582+1592+…+1562)-10×159.12=56.9, 因此r =∑i =110x i y i -10x -y-[∑i =110x 2i -x-2][∑i =110y 2i -y-2]=37.247.6×56.9≈0.71.由检验水平0.05及n -2=8,在课本附录1中查得r 0.05=0.632,因为0.71>0.632,所以可以认为x 与y 有较强的相关关系,因而求回归直线方程有必要.又b ^=∑i =110x i y i -10x -y -∑i =110x 2i -x-2=37.247.6≈0.78, a ^=159.1-0.78×158.8≈35.2,由此得回归直线方程为y ^=35.2+0.78x ,回归系数b ^=0.78反映出当母亲身高每增加1 cm 时女儿身高平均增加0.78 cm ,a ^=35.2可以理解为女儿身高中不受母亲身高影响的部分,当母亲身高为161 cm 时女儿身高为y ^=0.78×161+35.2=160.78≈161(cm),这就是说当母亲身高为161 cm 时,女儿身高大致也为161 cm.1.求线性回归方程的方法 确定线性回归方程的基本步骤为:(1)先求b ^;(2)再求a ^;(3)写出方程y ^=b ^x +a ^. 2.分析两个变量的相关关系常用的方法(1)散点图法.该法主要是用来直观地分析两变量间是否存在相关关系.(2)相关系数法.该法主要是从量上分析两个变量间相互联系的密切程度,|r |越接近于1,相关程度越强,|r|越接近于0,相关程度越弱.一、填空题1.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点得到的线性回归直线(如图),以下结论正确的序号是________.①直线l 过点(x ,y );②x 和y 的相关系数为直线l 的斜率; ③x 和y 的相关系数在0到1之间;④当n 为偶数时,分布在l 两侧的样本点的个数一定相同.解析:因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近于1,两个变量的线性相关程度越强,所以②③错误;④中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以④错误;根据回归直线方程一定经过样本中心点可知①正确.答案:①2.(湖北高考改编)根据如下样本数据得到的回归方程为y ^=bx +a ,则下列说法正确的是________.(填序号) ①a >0,b >0 ②a >0,b <0 ③a <0,b >0 ④a <0,b <0 解析:由表中数据画出散点图,如图,由散点图可知b <0,a >0,故②正确. 答案:②3.设有一个回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y ________. 解析:由回归系数的意义可知当变量x 增加一个单位时,y ^的平均改变量为b ^,由题目回归方程y ^=2-2.5x ,可得当变量x 增加一个单位时,y ^平均减少2.5个单位.答案:平均减少2.5个单位4.某数学老师的身高是176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm.解析:设父亲身高为x cm ,儿子身高为y cm ,则x =173,y =176,b ^=0×(-6)+(-3)×0+3×602+9+9=1,a ^=y -b ^x -=176-1×173=3,∴y ^=x +3,当x =182时,y ^=185.答案:1855.为了对学业水平测试成绩进行分析,在得分60分以上的全体同学中随机抽取8位.他们的物理、化学成绩如下:若用变量x ,y 分别记作物理成绩和化学成绩,则x ,y 之间的线性相关系数r 为________. (参考数据:x -≈85,y -=81,∑i =18(x i -x -)2≈457,∑i =18(y i -y -)2≈550,∑i =18(x i -x -)(y i-y -)≈501,457≈21.4,550≈23.5)解析:r =∑i =18(x i -x -)(y i -y -)∑i =18(x i -x -)2∑i =18(y i -y -)2≈501457×550≈50121.4×23.5≈0.996.答案:0.996 二、解答题6.某企业上半年产品产量与单位成本资料如下:且已知产量x 与单位成本y 具有线性相关关系. (1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解:(1)n =6,x -=3.5,y -=71,=1 481-6×3.5×7179-6×3.52≈-1.82, a ^=y --b ^x -=71+1.82×3.5=77.37,则线性回归方程为y ^=b ^x +a ^=-1.82x +77.37.(2)因为单位成本平均变动b ^=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b ^的意义有产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件, 即x =6时,代入线性回归方程, 得y ^=77.37-1.82×6=66.45(元).即当产量为6 000件时,单位成本大约为66.45元.7.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转速度的变化而变化,下表为抽样试验的结果:(1)利用散点图或相关系数r 的大小判断变量y 对x 是否线性相关?为什么? (2)如果y 对x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?(最后结果精确到0.001,参考数据:656.26≈25.617,16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291)解:(1)∵x -=12.5,y -=8.25,∑i =14(x i -x -)(y i -y -)=25.5,∑i =14x i -x-2∑i =14y i -y-2=656.25≈25.617,∴r 0.05≈0.995,由检验水平0.05及n -2=2,在附录1中查得r 0.05=0.950,因为0.995>0.950,∴y 与x 有线性相关关系.(2)∵∑i =14(x i -x -)2=35,∴b ^≈0.729,a ^=y --b ^x -≈-0.863.∴线性回归方程为y ^=0.729x -0.863. (3)0.729x -0.863≤10,解得x ≤14.901. 故机器运转速度应在14转/秒之内.8.(重庆高考)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 解:(1)依题意得:b ^=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2=184-10×8×2720-10×82=0.3,a ^=y --b ^x -=2-0.3×8=-0.4,故所求回归方程为y =0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).。
14-15版《步步高》疑难规律与方法1:统计案例
1 加深理解回归分析与独立性检验一、回归分析1.回归直线方程y ^=b ^x +a ^,其中:b ^=∑ni =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2,a ^ =y -b ^ x . (注:b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2主要方便计算,其中(x i ,y i )为样本数据,(x ,y )为样本点的中心)公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势. 公式联系:是进行残差分析的基础. 2.样本相关系数的具体计算公式: r =∑ni =1 (x i -x )(y i -y )∑n i =1(x i -x )2∑ni =1(y i -y )2=∑ni =1x i y i -n x y(∑ni =1x 2i -n x 2)(∑ni =1y 2i -n y 2)公式作用:反映两个变量之间线性相关关系的强弱.当r 的绝对值接近1时,表明两个变量的线性相关性越强;当r 的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系.规定当r >r 0.05时,有95%的把握认为两个变量具有线性相关关系.公式联系:(1)由于分子与回归方程中的斜率b ^的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r >0时,两个变量正相关;当r <0时,两个变量负相关. (2)常配合散点图判断两个随机变量是否线性相关.散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.相关系数r 是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据点的分布情况,准确可靠. 二、独立性检验(一)基础概念的梳理与理解1.分类变量:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.像这样的变量的不同“值”表示个体所属的不同类别的变量称为分类变量.例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种.2.两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的.3.2×2列联表:列出的两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2}的样本频数表称为2×2(二)独立性检验的基本思想上面通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方法.下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法. 1.基本思想与图形的联系假设两类分类变量是无关的,可知如下的比应差不多,即: a a +b ≈c c +d⇒|ad -bc |=0. 构造随机变量χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d )(此公式如何记忆,其特点是什么?结合2×2列联表理解).显然所构造的随机变量与|ad -bc |的大小具有一致性. 2.独立性检验的思想方法如果χ2的观察值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率事件发生);如果χ2的观察值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法. 3.得到χ2的值常与以下两个临界值加以比较:如果χ2>3.841,就有95%的把握认为两分类变量X 和Y 有关系;如果χ2>6.635,就有99%的把握认为两分类变量X 和Y 有关系;如果χ2≤3.841,就认为没有充分的证据说明变量X 和Y 有关系.像这种利用随机变量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.2 回归分析题型归纳相关关系是自然中普遍存在的关系,高考中对具有线性相关关系的考查已成为趋势,有的考查概念性质,更多是考查线性回归直线方程的实际应用,下面精选几例题型供赏析. 1.考查相关系数例1 变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( ) A .r 2<r 1<0 B .0<r 2<r 1 C .r 2<0<r 1 D .r 2=r 1解析 方法一 由散点图可以得出结论:变量X 与Y 正相关;变量U 与V 负相关.故r 1>0,r 2<0,因此选C. 方法二 由线性相关系数公式知r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.∵X =U =11.72,Y =V =3,X i =U i (i =1,2,…,5),Y i =V 6-i (i =1,2,…,5), ∴∑i =15(X i -X)2∑i =15(Y i -Y)2=∑i =15(U i -U)2∑i =15(V i -V )2.令∑i =15(X i -X )(Y i -Y )=A=(10-X )(1-Y )+(11.3-X )(2-Y )+(11.8-X )(3-Y )+(12.5-X )(4-Y )+(13-X )(5-Y ),∑i =15(U i -U )(V i -V )=B=(10-U )(5-V )+(11.3-U )(4-V )+(11.8-U )(3-V )+(12.5-U )(2-V )+(13-U )(1-V ),∴A >0,B <0,∴r 1>0,r 2<0. 答案 C2.考查线性回归直线的性质例2 设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,y )解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据线性回归方程一定经过样本中心点可知D 正确.所以选D. 答案 D3.考查回归直线方程的应用例3 调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析 由题意知[]0.254(x +1)+0.321-(0.254x +0.321)=0.254. 答案 0.254点评 注意把回归直线方程与学过的直线的斜截式进行类比,明确各个系数的含义.如本题中0.321为斜截式直线方程的截距,0.254为斜率,并且一次项的系数决定增长幅度.3 巧解非线性回归问题如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想. 1.案例分析温度x /℃ 2 3 4 5 6 7 8 某项指标y5.7906.8108.19910.00112.19014.79017.801试建立某项指标y 关于温度x 的回归模型.分析 根据表中的数据画出散点图,再由图设出相应的回归模型.解 画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线y =Bx 2+A 的周围.令X =x 2,则变换后的样本点应该分布在y =bX +a (b =B ,a =A )的周围. X 4 9 16 25 36 49 64 某项指标y5.7906.8108.19910.00112.19014.79017.801计算得到线性回归方程为y =0.199 94X +4.999 03.用x 2替换X ,得某项指标y 关于温度x 的回归直线方程y ^=0.199 94x 2+4.999 03.点评 本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图象相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决. 2.知识拓展常见的非线性函数转换方法:(1)幂型函数y =ax m (a 为正数,x ,y 取正值)解决方案:对y =ax m 两边取常用对数,有lg y =lg a +m lg x ,令u =lg y ,v =lg x ,则原式可变为u =m v +lg a ,其中m ,lg a 为常数,该式表示u ,v 的线性函数. (2)指数型函数y =c ·a x (a ,c >0,且a ≠1)解决方案:对y =ca x 两边取常用对数,则有lg y =lg c +x lg a ,令u =lg y ,则原式可变为u =x lg a +lg c ,其中lg a 和lg c 为常数,该式表示u ,x 的线性函数.与幂函数不同的是x 保持不变,用y 的对数lg y 代替了y .(3)反比例函数y =kx (k >0)解决方案:令u =1x ,则y =ku ,该式表示y ,u 的线性函数.(4)二次函数y =ax 2+c解决方案:令u =x 2,则原函数可变为y =au +c ,该式表示y ,u 的线性函数. (5)对数型函数y =c log a x解决方案:令x =a u ,则原函数可变为y =cu ,该式表示y ,u 的线性函数.4判断两个变量线性相关的方法1.由散点图判断两个变量线性相关例1“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺某季度的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到数据如下:店铺编号区内大学生数x(万人)某季度销售额y(万元)10.2 5.820.610.530.88.840.811.85 1.211.76 1.613.77215.78216.99 2.214.910 2.620.2(1)画出散点图,并判断各店铺该季度的销售额y与店铺附近地区大学生人数x是否具有线性相关关系?(2)若具有线性相关关系,求回归直线方程,然后再进一步根据回归直线方程预测一个区内大学生有1万人的店铺的季度销售额.分析先根据表中的数据画出散点图,然后判断是否具有线性相关关系,若具有线性相关关系,再根据所给的数据求出回归直线方程,最后进行预测.解(1)散点图如图所示.由散点图可以看出:这些点分布在一条直线的附近.所以各店铺该季度的销售额y与店铺附近地区大学生人数x具有线性相关关系.(2)由表中数据可知x=1.4,y =13,∑i =110x 2i -10x 2=5.68,∑i =110x i y i -10x y =28.4.所以b ^ =28.45.68=5,a ^=13-5×1.4=6.因此回归直线方程是y ^=5x +6.当x =1时,y ^=5×1+6=11,即区内大学生有1万人的店铺的季度销售额约为11万元. 点评 本题根据线性回归方程进行预测,这要求同学们具备一定的数据分析、推测能力.通过学习,体会数据收集、分析在现实生活中的作用. 2.由样本相关系数判断两个变量线性相关例2 2010年4月14日青海省玉树县发生7.1级大地震,为了抗震救灾,某工厂需大批生产帐篷支援灾区,工厂为了规定工时定额,需要确定加工帐篷所花费的时间,为此进行了10试问:(1)对x 与Y 进行相关性检验;(2)如果x 与Y 具有线性相关关系,求出回归直线方程.分析 可通过计算相关系数判断Y 与x 是否具有相关关系,如果Y 与x 具有相关关系可将有关数据代入公式求得回归直线方程.解 (1)①作统计假设:x 与Y 不具有线性相关关系. ②由小概率0.05与n -2=8在附表中查得r 0.05=0.632. ③根据已知数据,可求得x =55,y =91.7,∑i =110x 2i =38 500,∑i =110y 2i =87 777,∑i =110x i y i =55 950.因此,r =55 950-10×55×91.7(38 500-10×552)×(87 777-10×91.72)≈0.999 8.④|r |>0.632,即|r |>r 0.05,从而有95%的把握认为x 与Y 之间具有线性相关关系,因而求回归直线方程是有意义的.(2)设所求的回归直线方程为y ^=b ^x +a ^,则有b ^=55 950-10×55×91.738 500-10×552≈0.668,a ^ =y -b ^x =54.96.因此,所求的回归直线方程是y ^=0.668x +54.96.点评 求解两个变量的相关系数及它们的回归直线方程的计算量大,需要细心、谨慎地计算.。
【北师大版】高三数学步步高(理)第十一编 统计、统计案例
第十一编 统计、统计案例§11.1 随机抽样1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是( )A.B.C .总体的一个样本D.答案C2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 ( )A.B.C.D.答案D3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为( )A .5,10,15B .3,9,18C .3,10,17D .5,9,16答案B4.(2008·广东理,3)某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )A .24B .48C .16D .12答案C5.某工厂生产A、B 、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号产品有16件,那么此样本的容量n = . 答案 80例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和产生随机数法设计抽样方案. 解 抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 第五步:所得号码对应的志愿者,就是志愿小组的成员.基础自测第一步:将18名志愿者进行编号,编号为01,02,03, (18)第二步:由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意一个位置,比如比第6列和第7列这两列的第三行开始选数,由上到下读,凡不在01—18中的数或已读过的数都不作记录,依次可得到11,07,18,08,09,12.第三步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k =100001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l .(6)按编号将l ,100+l ,200+l ,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本.例3 (12分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程. 解 应采取分层抽样的方法.过程如下:(1)将3万人分为五层,其中一个乡镇为一层.2分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人), 8分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 10分 (3)将300人组到一起即得到一个样本.12分例4 为了考察某校的教学水平,将抽查这个学校高三年级的部分学生本年度的考试成绩.为了全面反映实际情况,采 取以下三种方式进行抽查(已知该校高三年级共有20个班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生的人数相同):①从高三年级20个班中任意抽取一个班,再从该班中任意抽取20名学生,考察他们的学习成绩;②每个班抽取1人,共计20人,考察这20名学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知该校高三学生共1 000人,若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的总体、个体、样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是多少? (2)上面三种抽取方式各自采用的是何种抽取样本的方法? (3)试分别写出上面三种抽取方式各自抽取样本的步骤.解 (1)这三种抽取方式的总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式的样本为所抽取的100名学生本年度的考试成绩,样本容量为100.(2)三种抽取方式中,第一种采用的是简单随机抽样法; 第二种采用的是系统抽样法和简单随机抽样法;第三种采用的是分层抽样法和简单随机抽样法. (3)第一种方式抽样的步骤如下:第一步,首先用抽签法在这20个班中任意抽取一个班.第二步,然后从这个班中按学号用随机数法或抽签法抽取20名学生,考察其考试成绩. 第二种方式抽样的步骤如下:第一步,首先用简单随机抽样法从第一个班中任意抽取一名学生,记其学号为a .第二步,在其余的19个班中,选取学号为a 的学生,加上第一个班中的一名学生,共计20人. 第三种方式抽样的步骤如下:第一步,分层,因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次.第二步,确定各个层次抽取的人数.因为样本容量与总体的个体数之比为:100∶1 000=1∶10,所以在每个层次中抽取的个体数依次为10150,10600,10250,即15,60,25. 第三步,按层次分别抽取.在优秀生中用简单随机抽样法抽取15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.1.有一批机器,编号为1,2,3,…,112,为调查机器的质量问题,打算抽取10台入样,问此样本若采用简单随机抽样方法将如何获得?解 首先,把机器都编上号码001,002,003,…,112,如用抽签法,则把112个形状、大小相同的号签放在同一个箱子里,进行均匀搅拌,抽签时,每次从中抽出1个号签,连续抽取10次,就得到一个容量为10的样本.2.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解 (1)将624名职工用随机方式编号由000至623. (2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619. (4)分段,取间隔k =62620=10,将总体分成62组,每组含10人. (5)从第一段,即为000到009号随机抽取一个号l .(6)按编号将l ,10+l ,20+l ,…,610+l ,共62个号码选出,这62个号码所对应的职工组成样本.3.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样? 解 可用分层抽样方法,其总体容量为12 000.“很喜爱”占000124352,应取60×000124352≈12(人);“喜爱”占000125674,应取60×000125674≈23(人);“一般”占000129263,应取60×000129263≈20(人);“不喜爱”占000120721,应取60×000120721≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.4.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270,使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样答案D一、选择题1.(2008·安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为()A.15,10,20B.10,5,30C.15,15,15D.15,5,25答案A2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么()A.B.C.D.答案A3.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样答案C4.(2008·重庆文,5)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是()A.B.C.产生D.答案D5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断正确的是()A.B.C.D.答案D6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A .4B .5C .6D .7答案C二、填空题7.(2008·天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的 健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 0795 三、解答题9.为了检验某种作业本的印刷质量,决定从一捆(40本)中抽取10本进行检查,利用随机数表抽取这个样本时,应按怎样的步骤进行?分析 可先对这40本作业本进行统一编号,然后在随机数表中任选一数作为起始号码,按任意方向读下去,便会得到10个号码.解 可按以下步骤进行:第一步,先将40本作业本编号,可编为00,01,02, (39)第二步,由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意一个位置,比如第9列和第10列这两列的第3行开始选数.由上至下读数超过39的和重复出现的不能选取.这样选取的10个样本的编号分别为:28,33,16,20,31,37,21,05,01,09.第三步找出编号所对应的作业本.10.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数法抽取14人. (3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.11.从某厂生产的10 002辆电动自行车中随机抽取100辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程. 解 因为总体容量和样本容量都较大,可用系统抽样. 抽样步骤如下:第一步,将10 002辆电动自行车用随机方式编号;第二步,从总体中剔除2辆(剔除法可用产生随机数法),将剩下的10 000辆电动自行车重新编号(分别为00001,00002,…,10000)并分成100段;第三步,在第一段00001,00002,…,00100这一百个编号中用简单随机抽样抽出一个作为起始号码(如00006); 第四步,把起始号码依次加间隔100,可获得样本.12.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n .解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n 36,分层抽样的比例是36n,抽取工程师36n ×6=6n(人),抽取技术人员36n ×12=3n(人), 抽取技工36n ×18=2n(人). 所以n 应是6的倍数,36的约数即n =6,12,18,36.当样本容量为(n +1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.§11.2 用样本估计总体1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )A .2B.5C .15D.80答案B2.(2008·山东理,8)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇 居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数 字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006 年我省城镇居民百户家庭人口数的平均数为 ( ) A.304.6B.303.6C.302.6D.301.6答案B3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b |等于( ) A .hmB .mhC .hm D .h +m答案C4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A .3B.5102 C .3 D .58答案B5.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是( )基础自测A .20B .30C .40D .50答案C例 1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)依题意知第三组的频率为 1464324+++++=51,又因为第三组的频数为12, ∴本次活动的参评作品数为5112=60. (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95, 第六组上交的作品数量为 60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高. 例2 对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表; (2)画出频率分布直方图;(3)估计电子元件寿命在100 h ~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率. 解 (1)样本频率分布表如下:(2)频率分布直方图(3)由频率分布表可以看出,寿命在100 h ~400 h 的电子元件出现的频率为0.65,所以我们估计电子元件寿命在 100 h ~400 h 的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.例3 为了解A ,B 两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程数(单位:1 000 km ) 轮胎A 96, 112, 97, 108, 100, 103, 86, 98 轮胎B108,101,94,105,96,93,97,106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数、中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据你认为哪种型号的轮胎性能更加稳定? 解 (1)A 轮胎行驶的最远里程的平均数为: 898861031001089711296+++++++=100,中位数为:298100+ =99; B 轮胎行驶的最远里程的平均数为: 810697939610594101108+++++++=100,中位数为:297101+=99.(2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为: s =821430831242222222+++++++=2221≈7.43; B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为: s =86374561822222222+++++++=2118≈5.43.(3)由于A 和B 的最远行驶里程的平均数相同,而B 轮胎行驶的最远里程的极差和标准差较小,所以B 轮胎性能更加 稳定.例4 (12分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115,90,85,75,115,110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 3分(2)茎叶图如下:6分(3)甲车间: 平均值: 1x =71(102+101+99+98+103+98+99)=100, 7分 方差:21s =71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.8分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100, 9分 方差:22s =71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4. 10分 ∵1x =2x ,21s <22s ,∴甲车间产品稳定.12分1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n , 则有n =第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.2.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分) [40,50),2;[50,60),3;[60,70),10;[70,80),15; [80,90),12;[90,100],8.(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例; (4)估计成绩在85分以下的学生比例. 解 (1)频率分布表如下:(2)频率分布直方图如图所示.(3)成绩在[60,90)的学生比例即为学生成绩在[60,90)的频率,即为(0.20+0.30+0.24)×100%=74%. (4)成绩在85分以下的学生比例即为学生成绩不足85分的频率. 设相应的频率为b . 由808560.0--b =809060.084.0--,故b =0.72.估计成绩在85分以下的学生约占72%.3.有甲、乙两位射击运动员在相同条件下各射击10次,记录各次命中环数; 甲:8,8,6,8,6,5,9,10,7,4 乙:9,5,7,8,7,6,8,6,8,7 (1)分别计算他们环数的标准差; (2)谁的射击情况比较稳定. 解 (1)x 甲=101(8+8+6+8+6+5+9+10+7+4)=7.1, x 乙=101(9+5+7+8+7+6+8+6+8+7)=7.1, 2甲s =101[(8-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(5-7.1)2+(9-7.1)2+(10-7.1)2+(7-7.1)2+(4-7.1)2]=3.09, ∴s 甲≈1.76.2乙s =101[(9-7.1)2+(5-7.1)2+(7-7.1)2+(8-7.1)2+(7-7.1)2+(6-7.1)2+(8-7.1)2+(6-7.1)2+(8-7.1)2+(7-7.1)2]=1.29, ∴s 乙≈1.14.(2)∵x 甲=x 乙,s 乙<s 甲,∴乙射击情况比较稳定.4.(2008·海南、宁夏理,16)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295301 303 303 307 308 310 314 319 323325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315315 316 318 318 320 322 322 324 327329 331 333 336 337 343 356由以上数据设计了如下茎叶图:根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①;② . 答案①乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).②甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).③甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm.④乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.一、选择题1.下列关于频率分布直方图的说法中正确的是()A.B.C.D.答案D2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩()A.甲比乙稳定B.C.甲、乙的稳定程度相同D.答案A3.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用条形图表示如下:A.0.6 hB.0.9 hC.1.0 hD.1.5 h答案B4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A.0.9,35B.0.9,45C.0.1,35D. 0.1,45答案A5.(2008·佛山模拟)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎,部分数据丢失,但知道前四组的频数成等比数列,后六组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78B.0.27,83C.2.7,78D.27,83答案A6.(2008·菏泽模拟)甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,A.xC.x答案A二、填空题7.(2008·上海理,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是 .答案10.5、10.58.(2008·滨海模拟)某教师出了一份共3道题的测试卷,每道题1分,全班得3分,2分,1分,0分的学生所占比例分别为30%,40%,20%,10%,若全班30人,则全班同学的平均分是分.答案 1.9三、解答题9.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图; (2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)解 (1)各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05. ∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40. ∴落在59.5~69.5的第二小组的小长方形的高=组距频率=1040.0=0.04.则补全的直方图如图所示.(2)设九年级两个班参赛的学生人数为x 人. ∵第二小组的频数为40人,频率为0.40, ∴x40=0.40,解得x =100(人). 所以九年级两个班参赛的学生人数为100人.(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为 391517424+++++=0.08.又因为频率=样本容量第二小组频数,所以样本容量=第二小组频率第二小组频数=08.012=150.(2)由图可估计该学校高一学生的达标率约为 39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 11.观察下面表格:(1)完成表中的频率分布表;(2)根据表格,画出频率分布直方图;(3)估计数据落在[10.95,11.35)范围内的概率约为多少?解 (1)频率依次为:0.03,0.09,0.13,0.16,0.26,0.20,0.07,0.04,0.02,1.00. (2)频率分布直方图如图所示(3)数据落在[10.95,11.35)范围的频率为 0.13+0.16+0.26+0.20=0.75.12.某赛季甲、乙两名篮球运动员每场比赛得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50; 乙的得分:8,13,14,16,23,26,28,33,38,39,59.(1)制作茎叶图,并对两名运动员的成绩进行比较;(2)计算上述两组数据的平均数和方差,并比较两名运动员的成绩和稳定性;(3)能否说明甲的成绩一定比乙好,为什么?解(1)制作茎叶图如下:从茎叶图上可看出,甲运动员发挥比较稳定,总体得分情况比乙好.(2)x甲=33,2甲s≈199.09,∴x甲>x乙, 2甲s<2乙s,s≈127.23,x乙=27,2乙∴甲运动员总体水平比乙好,发挥比乙稳定.(3)不能说甲的水平一定比乙好,因为上述是甲、乙某赛季的得分情况,用样本估计总体也有一定的偶然性,并不能说一定准确反映总体情况.§11.3 变量间的相关关系基础自测1.下列关系中,是相关关系的为()①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A.B.C.D.答案A2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是()A.直线l1,l2有交点(s,t)B.直线l1,l2相交,但是交点未必是(s,t)C.直线l1,l2由于斜率相等,所以必定平行D.直线l1,l2必定重合答案A3.下列有关线性回归的说法,不正确的是()A.相关关系的两个变量不一定是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
步步高高二数学暑假作业:【文】作业18统计、统计案例学校:___________姓名:___________班级:___________考号:___________一、单选题1.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石2.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[)[)[)20,40,40,60,60,80,[80,100].若低于60分的人数是15人,则该班的学生人数是( )A.45B.50C.55D.3.某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,+的值是()则m nA.10 B.11C.12 D.134.假设有两个分类变量X和Y的22⨯列联表如下:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为( )A .45a =,15c =B .40a =,20c =C .35a =,25c =D .30a =,30c =5.如图是一容量为100的样本的重量的频率分布直方图,则由图可估计样本的平均重量为( )A .13B .12C .11D .106.某单位为了了解用电量y 度与气温x°C 之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y ̂=b ̂x +a ̂中b̂=−3,则预测当气温为2°C 时,用电量的度数是( )A .70B .68C .64D .62 7.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.附表:由22()()()()()n ad bcKa b c d a c b d-=++++算得,22100(45222013)9.61658423565K⨯⨯-⨯=≈⨯⨯⨯参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.有99%以上的把握认为“生育意愿与城市级别有关”C.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”D.有99%以上的把握认为“生育意愿与城市级别无关”二、填空题8.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为___9.已知下表所示数据的回归直线方程为4242y x=+,则实数a=________.10.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.11.【最新】7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是3.240y x=-+,且20m n+=,则其中的n=______.三、双空题12.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.四、解答题13.某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中优秀的人数是30人.(1)请完成上面的列联表;(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;参考公式与临界值表()()()()()22n ad bcKa b c d a c b d-=++++.14.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,0,0.5,0.5,1,...,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[) [)4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.参考答案1.B【详解】设夹谷x 石,则281534254x =, 所以153428169.1254x ⨯=≈, 所以这批米内夹谷约为169石,故选B.考点:用样本的数据特征估计总体.2.B【解析】根据频率分布直方可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3. 又因为低于60分的人数是15人,所以该班的学生人数是15÷0.3=50. 本题选择B 选项.3.C【解析】试题分析::∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3又乙组学生成绩的中位数是89,∴n=9,∴m+n=12考点:茎叶图4.A【分析】 由题意得,当10a a +与30c c +相差越大时,X 与Y 有关系的可能性越大,即可得到答案. 【详解】由题意可得,当与相差越大时,X 与Y 有关系的可能性越大,分析四组选项,A中的a,c的值最符合题意,故选A.【点睛】本题主要考查了独立性检验的判定及应用,其中熟记独立性检验的相关知识和2K的计算公式是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.5.B【解析】试题分析:先计算[5,10)的频率为0.065=0.3⨯,[10,15)的频率为0.5,[15,20)的频率为0.2,平均重量7.50.312.50.517.50.212x=⨯+⨯+⨯=,选B考点:频率分布直方图6.A【解析】【分析】由表格中数据求得样本点的中心(13,37),代入确定回归直线的方程,再代入x=2,即可作出预测,得到答案.【详解】由表格中数据得x=14×(20+16+12+4)=13,y=14(14+28+44+62)=37,又回归直线方程ŷ=b̂x+â中b̂=−3,且回归直线过样本点的中心(13,37),所以37=−3×13+â,解得â=76,所以ŷ=−3x+76,当x=2时,ŷ=−3×2+76=70,即预测当气温为2°C时,用电量的度数是70,故选A.【点睛】本题主要考查了回归直线方程求解与应用,其中解答中熟记回归直线方程的基本特征,代入求得â的值,得到回归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.7.B【解析】分析:根据独立性检验求得2K值,与临界值比较,即可判断是否有关.详解:根据()22100452220139.616 6.63558423565K⨯⨯-⨯=≈>⨯⨯⨯所以有99%以上的把握认为“生育意愿与城市级别有关”,或在犯错误的概率不超过1%的前提下,认为“生育意愿与城市级别有关”.所以选B点睛:本题考查了独立性检验的基本内容,主要是注意两种不同回答方式,属于简单题. 8.76【解析】【分析】确定系统抽样间隔k =16,根据样本中含编号为28的产品,即可求解,得到答案.【详解】由系统抽样知,抽样间隔k =805=16,因为样本中含编号为28的产品,则与之相邻的产品编号为12和44,故所取出的5个编号依次为12,28,44,60,76,即最大编号为76.【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的方法,确定好抽样的间隔是解答的关键,着重考查了运算与求解能力,属于基础题.9.262【解析】 由题意,1410285x y a ==+,(), 代入2ˆ442y x =+, 可得11028442422625a a +=⨯+∴=(). 故答案为262.【点睛】本题考查线性回归方程,考查学生的计算能力,利用回归方程恒过样本中心点是关键.10.0.1【解析】 试题分析:这组数据的平均数为1(4.7 4.8 5.1 5.4 5.5) 5.15⨯++++=,2222221(4.7 5.1)(4.8 5.1)(5.1 5.1)(5.4 5.1)(5.5 5.1)0.15s ⎡⎤∴=⨯-+-+-+-+-=⎣⎦.故答案应填:0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.11.10【分析】 计算,x y ,代入回归直线方程,与20m n +=结合,求解出n 的值.【详解】 依题意4030,55m n x y ++==,代入回归直线方程得30403.24055n m ++=-⨯+①,根据题意20m n +=②,解①②组成的方程组得10m n ==,故填10.【点睛】 本小题主要考查回归直线方程过样本中心点(),x y ,考查方程的思想,属于基础题. 12.50 1015【解析】试题分析:共抽取100件时第一分厂应抽取的件数为,第二分厂应抽取件数为,第三分厂应抽取件数为.该产品的平均使用寿命为102050980201030301015100⨯+⨯+⨯=. 考点:平均数问题,考查对数据的处理能力.13.(1)见解析; (2)不能认为“成绩与班级有关系”.【分析】(1)由于从甲、乙两个理科班全部110人中随机抽取人为优秀的概率为311,可得两个班优秀的人数,乙班优秀的人数=30﹣10=20,甲班非优秀的人数=110﹣(10+20+30)=50.即可完成表格.(2)假设成绩与班级无关,根据列联表中的数据可得:K2,和临界值表比对后即可得到答案.【详解】(1)(2)根据列联表中的数据,计算得到()221101030-5020=37.48710.820805068K⨯⨯⨯⨯≈<⨯⨯.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.【点睛】本题考查了列联表、独立性检验,独立性检验的应用的步骤为:根据已知条件将数据归结到一个表格内,列出列联表,再根据列联表中的数据,代入公式K2,计算出k值,然后代入离散系数表,比较即可得到答案.14.(1)0.3;(2)3.6万;(3)2.9.【详解】试题分析:本题主要考查频率分布直方图、频率、频数的计算等基础知识,考查学生的分析问题、解决问题的能力. 第(1)问,由高×组距=频率,计算每组的频率,根据所有频率之和为1,计算出a的值;第(2)问,利用高×组距=频率,先计算出每人月均用水量不低于3吨的频率,再利用频率×样本容量=频数,计算所求人数;第(3)问,将前6组的频率之和与前5组的频率之和进行比较,得出2.5≤x<3,再估计x的值.试题解析:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12="36" 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.3×(x–2.5)=0.85–0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.【考点】频率分布直方图【名师点睛】本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.。