专题40 统计与统计案例-(理)考点分析与性讲练

合集下载

数学(理)一轮复习 第十章 统计与统计案例 第讲 变量间的相关关系、统计案例

数学(理)一轮复习 第十章 统计与统计案例 第讲 变量间的相关关系、统计案例

第3讲变量间的相关关系、统计案例)1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为错误!=错误!x+错误!,其中错误!=错误!,错误!=错误!-错误!错误!.(4)相关系数当r〉0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1a b a+b x2c d c+d总计a+cb+d a+b+c+d(2)K2统计量K2=错误!(其中n=a+b+c+d为样本容量).1.辨明三个易误点(1)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本数据点都不在直线上.(2)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).(3)虽然任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.2.求回归方程的方法求解回归方程的关键是确定回归系数错误!,错误!,因求解错误!的公式计算量太大,一般题目中给出相关的量,如x,错误!,错误!x错误!,错误! x i y i等,便可直接代入求解.充分利用回归直线过样本中心点(错误!,错误!),即有错误!=错误!错误!+错误!,可确定错误!.1.有关线性回归的说法,不正确的是()A.具有相关关系的两个变量是非确定性关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.散点图中的点越集中,两个变量的线性相关性越强D2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归直线方程可能是()A。

统计法律案例分析题(3篇)

统计法律案例分析题(3篇)

第1篇一、案例背景某市统计局(以下简称“统计局”)在组织实施某市2020年度统计调查工作中,存在以下违规行为:1. 在调查过程中,统计局未按照《统计法》的规定,向调查对象提供调查表格和统计资料,导致调查对象无法准确、完整地填写调查表格。

2. 统计局在调查过程中,未对调查对象提供的调查数据进行审核,存在大量错误数据。

3. 统计局在调查结束后,未按照《统计法》的规定,对调查数据进行汇总、分析,形成统计报告。

4. 统计局在统计报告公布前,未对报告内容进行保密,导致统计报告中的部分数据被泄露。

二、案例分析1. 违反《统计法》的相关规定(1)根据《统计法》第十四条第一款规定:“国家统计局、国务院有关部门和地方各级人民政府统计机构,组织实施国家统计调查,编制和公布统计调查表、统计调查对象、统计调查内容、统计调查方式、统计调查时间、统计调查地点、统计调查方法等统计调查方案,并报国务院备案。

”本案例中,统计局未按照规定向调查对象提供调查表格和统计资料,违反了《统计法》的相关规定。

(2)根据《统计法》第二十条规定:“统计机构、统计人员应当对调查对象提供的统计数据进行审核,确保数据的真实、准确、完整。

”本案例中,统计局未对调查数据进行审核,存在大量错误数据,违反了《统计法》的相关规定。

(3)根据《统计法》第二十二条规定:“统计机构、统计人员应当对统计数据进行汇总、分析,形成统计报告,并向有关单位或者部门报送。

”本案例中,统计局未按照规定对调查数据进行汇总、分析,形成统计报告,违反了《统计法》的相关规定。

(4)根据《统计法》第三十条规定:“统计机构、统计人员应当对统计报告中的统计数据进行保密,未经批准,不得对外公布。

”本案例中,统计局在统计报告公布前,未对报告内容进行保密,导致统计报告中的部分数据被泄露,违反了《统计法》的相关规定。

2. 案例中存在的问题及原因(1)统计局在组织实施统计调查过程中,未严格按照《统计法》的规定执行,导致调查工作存在诸多问题。

统计学案例与分析

统计学案例与分析
• 推断性统计分析:检验医疗风险管理策略的效果
• 相关性分析和回归分析:探究医疗风险变量之间的关系,预测未来风险
07
统计软件的介绍与操作
常用统计软件(如Excel、SPSS、R等)的介绍与比较

Excel
• 通用办公软件,提供基本的统计功能
• 操作简单,易于上手
• 适用于数据量较小的分析
SPSS
• 统计功能:各种统计检验和回归分析,以及机器学习算法
Excel
• 数据整理:排序、筛选、查找替换等
• 数据分析:公式计算、数据透视表、图表制作等
• 统计功能:均值、中位数、众数等统计量计算,t检验、卡方检验等
SPSS
• 数据整理:数据导入、清洗、转换等
• 数据分析:描述性统计、推断性统计、相关性分析等
统计学案例与分析
S M A R T C R E AT E
CREATE TOGETHER
01
统计学基本概念及其应用
统计学的基本概念及其重要性
• 统计学是一门研究数据收集、处理、分析和解释的学科
• 数据收集:通过调查、实验等方式获取数据
• 数据处理:对数据进行整理、清洗、转换等操作
• 数据分析:从数据中提取信息、发现规律
• 可能存在多个众数,不一定唯一
绘制统计图表(如直方图、箱线图等)以直观展示数据特征
直方图
• 将数据分组,绘制各组频数分布的柱状图
• 直观展示数据的分布情况
• 可以通过比较不同组的频数发现数据中的规律
箱线图
• 描述数据五数概括的统计图
• 由最小值、第一四分位数、中位数、第三四分位数和最大值组成
• 直观展示数据的离散程度和分布情况
• 研究一个变量如何受其他变量影响

数学高考复习统计与统计案例专题训练(含答案)

数学高考复习统计与统计案例专题训练(含答案)

数学高考复习统计与统计案例专题训练(含答案)统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。

以下是数学高考复习统计与统计案例专题训练,请考生掌握。

一、选择题1.(山西省重点中学第三次四校联考)已知x、y的取值如下表所示:x 0 1 3 4 y 0.9 1.9 3.2 4.4 从散点图分析,y与x线性相关,且=0.8x+a,则a=()A.0.8B.1C.1.2D.1.5[答案] B[解析] ==2,==2.6,又因为回归直线=0.8x+a过样本中心点(2,2.6)所以2.6=0.82+a,解得a=1.2.(文)(豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为32∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为()A.20B.40C.60D.80[答案] B[解析] 由分层抽样的定义知,B型号产品应抽取180=40件.(理)(济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取()A.65人,150人,65人B.30人,150人,100人C.93人,94人,93人D.80人,120人,80人[答案] A[解析] =,1300=65,3000=150,故选A.3.(文)(新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()A.100B.120C.150D. 200[答案] A[解析] 设公差为d,则a1+d=2a1,a1=d,d+2d+3d+4d+5d=1,d=,面积最大的一组的频率等于5=.小长方形面积最大的一组的频数为300=100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为体育迷,则图中x的值为()A.0.01B.0.02C.0.03D.0.04[答案] A[解析] 由题设可知(0.005+x+0.012+0.02+0.025+0.028)10=1,解得x=0.01,选A.4.(东北三校二模)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是()A.平均数B.标准差C.众数D.中位数[答案] B[解析] 因为A组数据为:42,43,46,52,42,50B组数据为:37,38,41,47,37,45.可知平均数、众数、中位数都发生了变化,比原来A组数据对应量都减小了5,但标准差不发生变化,故选B.5.(石家庄质检)等差数列x1,x2,x3,,x9的公差为1,若以上述数据x1,x2,x3,,x9为样本,则此样本的方差为() A. B. C.60 D.30[答案] A[解析] 令等差数列为1,2,39,则样本的平均值=5,S2=[(1-5)2+(2-5)2++(9-5)2]==.6.(文)(郑州市第二次质检)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元) 4 5 6 7 8 9 销量y(件) 90 84 83 80 75 68 由表中数据,求得线性回归方程为=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A. B. C. D.[答案] B[解析] ==,==80,回归直线过点(,80),a=106,=-4x+106,点(5,84),(9,68)在回归直线左下方,故所求概率P==.(理)(河北衡水中学二调)关于统计数据的分析,有以下几个结论,其中正确的个数为()利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;已知随机变量X服从正态分布N(3,1),且P(24)=0.682 6,则P(X4)等于0.158 7某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.A.2B.3C.4D.5[答案] A[解析] 正确,错误,设样本容量为n,则=,n=30,故错.二、填空题7.(吉林九校联合体二模)将某班的60名学生编号为:01,02,,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.[答案] 16,28,40,52[解析] 依据系统抽样方法的定义得知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).8.(龙岩模拟)10名工人某天生产同一零件,生产的件数分别是10,12,14,14,14,15,15,16,16,17,设这10个数的中位数为a,众数为b,则a-b=________.[答案] 0.5[解析] 从数据中可以看出,众数b=14,且中位数a==14.5,a-b=14.5-14=0.5.9.(烟台质检)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为________.[答案] 80[解析] 第四小组和第五小组的频率之和是5(0.0125+0.0375)=0.25,故前三个小组的频率之和是0.75,则第二小组的频率是0.25,则抽取的男生人数是120.25=48人,抽取的女生人数是48=32人,全校共抽取80人.三、解答题10.(文)(东北三省三校二模)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分.上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到的频率分布直方图如图所示.(1)分别求第三,四,五组的频率;(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率.[解析] (1)第三组的频率是0.1502=0.3;第四组的频率是0.1002=0.2;第五组的频率是0.0502=0.1(2)设抽到的两个产品均来自第三组为事件A,由题意可知,从第三、四、五组中分别抽取3个,2个,1个.不妨设第三组抽到的是A1,A2,A3;第四组抽到的是B1,B2;第五组抽到的是C1,所含基本事件总数为:{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A1,C1},{A2,B1},{A2,B2},{A2,C1},{A3,B1},{A3,B2},{A3,C1},{B1,B2},{B1,C1},{B2,C1}所以P(A)==.(理)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲 82 81 79 78 95 88 93 84 乙 92 95 80 75 83 80 90 85(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由;(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,记这3次成绩中高于80分的次数为,求的分布列及数学期望E().[解析] (1)作出茎叶图如下:(2)派甲参赛比较合适,理由如下:甲=(702+804+902+8+9+1+2+4+8+3+5)=85乙=(701+804+903+5+0+0+3+5+0+2+5)=85.S=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88 -85)2+(93-85)2+(95-85)2]=35.5S=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90 -85)2+(92-85)2+(95-85)2]=41甲=乙,SP1,派乙参赛比较合适.(3)记甲同学在一次数学竞赛中成绩高于80分为事件A,则P(A)==,随机变量的分布列为0 1 2 3 P E()=0+1+2+3=.(或E()=np=3=)数学高考复习统计与统计案例专题训练及答案解析的全部内容就是这些,希望考生可以取得优异的成绩。

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题与知识点总结1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距.2.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k ≥0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=x1+x2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s=1[x1-x2+x2-x2+…+x n-x2].n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(5)方差:s2=1n4.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心.③相关系数当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y 2总计x 1a b a +b x 2c d c +d 总计a +cb +da +b +c +d构造一个随机变量K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.(3)独立性检验:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.1.如图为国家统计局2021年1月19日发布的2020年各季度社会消费品零售总额及增速,则下列说法:①各季度社会消费品零售总额增速最快的是4季度;②各季度社会消费品零售总额增速最快的是2季度;③各季度社会消费品零售总额增量最大的是4季度;④各季度社会消费品零售总额增量最大的是2季度.其中所有正确说法的序号为()A.①④B.②③C.①③D.②④2.下图是2020年我国居民消费价格月度涨跌幅度图(来源于国家统计局网站)下列说法错误的是()A.1~12月月度同比的平均值为2.55B .1~12月月度环比的平均值为负数C .1~12月月度同比整体为下降趋势D .1~12月月度环比的方差大于月度同比的方差3.已知相关变量x 和y 的散点图如图所示,若用()11ln y b k x =⋅与22y kx b =+拟合时的相关系数分别为12,r r 则比较12,r r 的大小结果为()A .12r r >B .12r r =C .12r r <D .不确定4.下列说法中错误的个数是①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,则每个女生被抽到的概率为110;②由样本数据得到的回归直线方程y bx a =+$$$必经过样本中心点()x y ;③如果落在回归直线上的样本点越多,则回归直线方程的拟合效果就越好;④在一个2×2列联表中,由计算得出220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系.()A .1B .2C .3D .45.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是()A .112B .53C .38D .96.2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是()A.过去的6年,“甲”的极差小于“乙”的极差B.过去的6年,“甲”的平均值小于“乙”的平均值C.过去的6年,“甲”的中位数小于“乙”的中位数D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率7.为了普及新冠肺炎知识,增强疫情防控意识,某学校从高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试,得分(十分制)情况如下表所示,则下列描述正确的是()高一年级组高二年级组得分45678得分569频数11111频数311A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分B.两组数据的中位数都是6分C.高一年级组数据的极差小于高二年级组数据的极差D.高一年级组成绩的方差小于高二年级组成绩的方差8.某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:则下列结论正确的是()A.与2015年相比,2018年一本达线人数减少B .与2015年相比,2018年二本达线人数增加了0.5倍C .2015年与2018年艺体达线人数相同D .与2015年相比,2018年不上线的人数有所增加9.m 个数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A .平均数为aB .中位数为2bC D .方差为2c10.已知变量y 关于x 的回归方程为0.5bx y e -=,其一组数据如表所示:若5x =,则预测y 值可能为()x1234ye3e 4e 6e A .5e B .112e C .7e D .152e 11.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是()A .①②④B .②③④C .①③④D .②④12.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关13.下列四个命题中,正确的有()①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”;③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .314.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理()附:()()()()()22n ad bc K a c b d a d b c -=++++,其中n a b c d =+++.()20P K k ≥0.100.050.010.0050k 2.7063.8416.6357.879A .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B .有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”15.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2B.0.4C.0.5D.0.616.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.1017.下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5B.3,5C.3,7D.5,718.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.0100.001k 3.841 6.63510.82819.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82820.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:1.C 【分析】根据折线统计图比较各季度社会消费品零售总额增速,可判断①②的正误;计算各季度社会消费品零售总额增量,可判断③④的正误.【详解】第1季度社会消费品零售总额增速为19.0%-,第2季度社会消费品零售总额增速为 3.9%-,第3季度社会消费品零售总额增速为0.9%,第4季度社会消费品零售总额增速为4.6%,故①正确,②错误;第2季度社会消费品零售总额增量为9.377.86 1.51-=(万亿元),第3季度社会消费品零售总额增量为10.119.370.74-=(万亿元),第4季度社会消费品零售总额增量为11.8710.11 1.76-=(万亿元).故③正确,④错误.故选:C.2.D 【分析】根据图表数据计算平均数,然后判断A 和B ;根据图表数据的变化趋势判断C 和D.【详解】同比平均数:()5.4 5.2 4.3 3.3 2.4 2.5 2.7 2.4 1.70.50.50.72.5512++++++++++-+=,环比平均数:()()()()()()1.40.8 1.20.90.80.10.60.40.20.30.60.20.02512++-+-+-+-++++-+-+=-,1-12月月度同比的平均值为2.55,选项A 正确;1~12月月度环比的平均值为0.025-,选项B 正确;观察图表可以得出,1~12月月度同比整体为下降趋势,选项C 正确;1~12月月度环比的波动小于月度同比的波动,选项D 错误.故选:D .3.C 【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,()11ln y b k x =拟合比用22y k x b =+拟合的程度高,故12r r >;又因为此关系为负相关,1212,r r r r ∴->-<故选:C 4.B 【分析】由古典概型的特征可判断①;由回归直线方程的特征可判断②③;由独立性检验思想可判断④.【详解】①错误,古典概率中,每个个体被抽的概率都是一样的,都等于2002021;②正确由回归直线方程的特征可知回归直线方程y bx a =+$$$必经过样本中心点(),x y ;③错误,落在回归直线附近的样本点越多,则回归直线方程的拟合效果越好;④正确,当220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系所以错误个数为2.故选:B.5.A 【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.【详解】由题意知,组距为120158=,设第一组抽取编号为k ,则第n 组抽取的编号为15(1)n k -+,样本中含有编号67的商品,即15(51)67k ⨯-+=,可得7k =,因为1577112⨯+=,即第8组中抽取商品的编号为112.故选:A 6.B 【分析】对茎叶图进行数据分析,分别计算极差、平均数、中位数、及平均增长率,依次判断四个选项.【详解】对于A ,甲的极差为42366-=,乙的极差为41347-=,所以“甲”的极差小于“乙”的极差,A 正确;对于B ,甲的平均数是1230(363737384042)66⨯+++++=,乙的平均数为1228(343638394041)66⨯+++++=,所以“甲”的平均值大于“乙”的平均值,B 错误;对于C ,甲的中位数是1(3738)37.52⨯+=,乙的中位数是1(3839)38.52⨯+=,所以,“甲”的中位数小于“乙”的中位数,C 正确;对于D ,设过去6年甲的平均增长率为x ,则()636142x +=,解得:1x =-,即过去61-;1-.因为42413634<,所以“甲”的平均增长率小于“乙”的平均增长率,D 正确.故选:B.7.D 【分析】根据表中数据,依次讨论各选项即可得答案.【详解】对于A 选项,高一年级和高二年级的平均分均为6分,故A 选项错误;对于B 选项,高一年级的中位数是6,高二年级的中位数是5,故B 选项错误;对于C 选项,高一年级的极差为4,高二年级的极差为3,故高一年级组数据的极差大于高二年级组数据的极差,故C 选项错误;对于D 选项,高一年成绩的方差为()()()()()2222221465666768625S ⎡⎤=-+-+-+-+-=⎣⎦,高二年级成绩的方差为()()()222213566696 2.45S ⎡⎤=-+-+-=⎣⎦,满足,故D 选项正确;故选:D 8.D 【分析】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S ,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到【详解】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S.对于选项A :2015年一本达线人数为0.28S ,2018年一本达线人数为0.24×1.5S =0.36S ,可见一本达线人数增加了,故A 错误;对于选项B :2015年二本达线人数为0.32S ,2018年二本达线人数为0.4×1.5S =0.6S ,显然2018年二本达线人数不是增加了0.5倍,故B 错误;对于选项C :2015年和2018年艺体达线率没变,但是人数是不相同的,故C 错误;对于选项D :2015年不上线人数为0.32S ,2018年不上线人数为0.28×1.5S=0.42S ,不达线人数有所增加,故D 正确.故选:D 9.B 【分析】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,根据平均数、中位数、方差、标准差的定义进行判断即可.【详解】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,则由于平均数为所有数之和除以m ,故平均数变为2a ,故A 错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b ,故B 对;方差描述的是这组数的波动情况,12,,,n x x x 的方差为c ,则122,2,,2n x x x 的方差为224c c =2c =,故C,D 错;故选:B 【点睛】熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.10.D 【分析】将回归方程左右同时取对数得:ln 0.5y bx =-,看作回归直线的形式,由回归直线过样本中心点可构造方程求得b ,由此得到回归方程;将5x =代入回归方程即可求得结果.【详解】由0.5bx y e-=得:ln 0.5y bx =-,346ln ln ln ln 12340.544e e e e b ++++++∴=⋅-,解得: 1.6b =,∴回归方程为 1.60.5x y e -=,若5x =,则1580.52y e e -==.故选:D.【点睛】关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解.11.B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的.故选:B.【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.12.D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D 13.A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-=解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。

概率与统计:统计与统计案例

概率与统计:统计与统计案例

y1 x1 x2 总计 a c
y2 b d
总计 a+b c+d
a+c
b+d
n
2 n ( ad - bc ) 则 K2= (其中 n=a+b+ (a+b)(c+d)(a+c)(b+d)
c+d 为样本容量).
【题型突破】
题型一、抽样方法 【例 1】 (1) 某校老年、中年和青年教师的人数见下表,采用分层
(2)根据题意,样本中分数不小于 50 的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为 100-100×0.9-5=5. 5 所以总体中分数在区间[40,50)内的人数估计为 400× =20. 100 (3)由题意可知,样本中分数不小于 70 的学生人数为 (0.02+0.04)×10×100=60, 1 所以样本中分数不小于 70 的男生人数为 60×2=30. 所以样本中的男生人数为 30×2=60,女生人数为 100-60=40, 男生和女生人数的比例为 60∶40=3∶2. 所以根据分层抽样原理, 总体中男生和女生人数的比例估计为 3∶2.
易求 x 甲=65.2, x 乙=61.8,知 x 甲> x 乙,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s 甲<s 乙,③错误, 因此符合茎叶图所给数据的结论是①②④.
【答案】 C
【例3】我国是世界上严重缺水的国家,某市政府为了鼓励居民节
约用水,计划调整居民生活用水收费方案,拟确定一个合理的 月用水量标准 x( 吨 ) ,一位居民的月用水量不超过 x 的部分按平 价收费,超出x的部分按议价收费 .为了了解居民用水情况,通 过抽样,获得了某年100位居民每人的月均用水量(单位:吨),

《统计》知识点总结+典型例题+练习(含答案)

《统计》知识点总结+典型例题+练习(含答案)

统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。

统计法律案例及分析题(3篇)

统计法律案例及分析题(3篇)

第1篇一、案例背景某市统计局在2021年对全市各行业进行了一次全面统计调查。

在调查过程中,该局发现部分企业存在虚报、瞒报、漏报统计数据的现象。

经调查核实,某市统计局对涉嫌违规的企业进行了处罚,并依法向市政府报告了调查结果。

然而,在后续的审计过程中,审计部门发现某市统计局在统计调查过程中存在违规行为,违反了《中华人民共和国统计法》(以下简称《统计法》)的相关规定。

二、案例概述1. 案件基本情况某市统计局在2021年进行的统计调查中,发现部分企业存在虚报、瞒报、漏报统计数据的现象。

经调查核实,某市统计局对涉嫌违规的企业进行了处罚,并依法向市政府报告了调查结果。

然而,在后续的审计过程中,审计部门发现某市统计局在统计调查过程中存在以下违规行为:(1)未按照规定的时间、程序和方法进行统计调查;(2)未对涉嫌违规的企业进行必要的核查;(3)未将调查结果依法向市政府报告。

2. 违规行为及处罚根据《统计法》的相关规定,某市统计局的违规行为构成了违法行为。

审计部门依法对该局进行了处罚,具体如下:(1)责令某市统计局立即改正违规行为;(2)对某市统计局的主要负责人进行约谈,要求其加强统计工作的领导和管理;(3)对某市统计局的违规行为进行通报批评。

三、案例分析1. 违规行为的定性本案中,某市统计局的违规行为主要表现为未按照规定的时间、程序和方法进行统计调查,未对涉嫌违规的企业进行必要的核查,未将调查结果依法向市政府报告。

这些行为均违反了《统计法》的相关规定,构成了违法行为。

2. 违规行为的原因分析(1)统计法规意识淡薄。

某市统计局在统计调查过程中,未能严格按照《统计法》的规定进行操作,说明该局对统计法规的认识不够深入,法规意识淡薄。

(2)统计工作责任心不强。

某市统计局在调查过程中,未能及时发现和纠正涉嫌违规的企业,说明该局工作人员责任心不强,对统计工作的重要性认识不足。

(3)内部管理制度不完善。

某市统计局在统计调查过程中,未建立健全内部管理制度,导致统计调查工作存在漏洞。

统计案例分析报告及典型例题

统计案例分析报告及典型例题

统计案例分析及典型例题§11.1 抽样方法1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案 ①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,184.某工厂生产A 、B 、C 三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号产品有16件,那么此样本的容量n= . 答案 80例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案. 解 抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号;基础自测第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k=100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 .答案15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是(填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样③从某厂生产的2 000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n=6,12,18,36.当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h ,则|a-b|= . 答案 hm4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40基础自测典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98,99;乙:110, 115, 90,85,75,115, 110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分(2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n, 则有n=第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为 . 答案 0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x 甲、x 乙,则x 甲 x 乙, 比 稳定. 答案 < 乙 甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a 、b 的取值分别是 . 答案 10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系;基础自测②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)x =101 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y=101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分bˆ=∑∑==-∙-ni ini i i x n xyx n y x 1221≈0.813 6,aˆ=1.42-1.74×0.813 6≈0.004 3,13分 ∴回归方程yˆ=0.813 6x+0.004 3.14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx+a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -∙-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -bˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x+0.35. (3)现在生产100吨甲产品用煤 y=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.880 9.aˆ=y -bˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x+67.173.3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n=6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x xyx yx i ii ii -∙-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y-bˆx=71+1.82×3.5=77.37.回归方程为yˆ=aˆ+bˆx=77.37-1.82x.(2)因为单位成本平均变动bˆ=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件时,即x=6,代入回归方程:yˆ=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案a,c,b2.回归方程yˆ=1.5x-15,则下列说法正确的有个.①y=1.5x-15②15是回归系数a③1.5是回归系数a④x=10时,y=0答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为yˆ=8.25x+60.13,下列叙述正确的是 .①该地区一个10岁儿童的身高为142.63 cm②该地区2~9岁的儿童每年身高约增加8.25 cm③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x+5.75 5.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83%6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④8.已知关于某设备的使用年限x 与所支出的维修费用y(万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程yˆ=b ˆx+a ˆ表示的直线一定过定点 . 答案 (4,5) 二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系.(2)以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.196 2aˆ=y -bˆx ≈1.814 2 ∴所求回归直线方程为yˆ=0.196 2x+1.814 2.11.某公司利润y 与销售总额x(单位:千万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y=71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,∑=712i ix=102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -∙-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -bˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x-0.084. (3)把x=24(千万元)代入方程得,yˆ=2.412(千万元).∴估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y =13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -∙-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -bˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x+17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程y ˆ=a ˆ+b ˆx 中,回归系数bˆ与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据 2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r=1或r=-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③基础自测例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++-2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r=)4)(4(42412241241y yx xyx yx i ii ii ii --∙-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x-0.857 1. (3)要使yˆ≤10⇒0.728 6x-0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程.解 作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图象比较,用y ˆ=e a x b ˆˆ来刻画题中模型更为合理,令zˆ=ln y ˆ,则z ˆ=b ˆx+a ˆ,题中数据变成如下表所示:相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r ≈-0.996.|r|>r 0.05.认为x 与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,a ˆ≈8.165,所以z ˆ=-0.298x+8.165,最后回代z ˆ=ln y ˆ,即y ˆ=e -0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P 1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y=71 (66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r=)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.由于0.973>0.754,所以纯利润y与每天销售件数x 之间具有显著线性相关关系. 利用已知数据可求得回归直线方程为yˆ=4.746x+51.386.3.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出y 对x 的回归方程.解 首先作变量置换,令u=x1,题目所给数据变成如下表所示的10对数据:然后作相关性检验.经计算得r ≈0.999 8>0.75,从而认为u 与y 之间具有线性相关关系.由公式得aˆ≈1.125,b ˆ≈8.973, 所以yˆ=1.125+8.973u, 最后回代u=x1,可得y ˆ=1.125+x973.8,这就是题目要求的y 对x 的回归曲线方程.回归曲线的图形如图所示,它是经过平移的反比例函数图象的一个分支.一、填空题1.对于独立性检验,下列说法中正确的是 . ①2χ的值越大,说明两事件相关程度越大 ②2χ的值越小,说明两事件相关程度越小 ③2χ≤2.706时,有90%的把握说事件A 与B 无关 ④2χ>6.635时,有99%的把握说事件A 与B 有关 答案 ①②④2.工人月工资y (元)依劳动生产率x(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是 .①劳动生产率为1 000元时,工资为130元。

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

《中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题一、教学目标1. 让学生理解统计的基本概念,包括平均数、中位数、众数等。

2. 培养学生收集、整理、分析数据的能力。

3. 引导学生运用统计知识解决实际问题。

二、教学内容1. 统计的基本概念介绍。

2. 数据的收集与整理方法。

3. 平均数、中位数、众数的计算及应用。

4. 统计图表的绘制。

5. 实际问题中的统计应用。

三、教学过程1. 导入:通过一个简单的实例,让学生感受统计在生活中的应用,激发学生的学习兴趣。

2. 统计概念讲解:介绍平均数、中位数、众数等基本概念,并用具体的例子进行解释。

3. 数据收集与整理:教授如何收集数据、整理数据的方法,并进行实际操作演示。

4. 统计图表绘制:讲解如何绘制条形图、折线图等统计图表,并让学生进行实践操作。

5. 实际问题分析:给出一个实际问题,让学生运用所学的统计知识进行分析和解决。

四、教学方法1. 讲授法:讲解统计的基本概念、方法和技巧。

2. 实践操作法:让学生动手操作,实际绘制统计图表,解决实际问题。

3. 案例分析法:通过具体的案例,让学生理解统计在生活中的应用。

五、教学评价1. 课堂参与度:观察学生在课堂上的积极参与程度,提问回答问题的积极性等。

2. 实践操作能力:检查学生绘制统计图表的准确性、速度等。

3. 问题解决能力:评估学生在解决实际问题时,运用统计知识的正确性和有效性。

六、教学案例分析1. 案例选择:选择一个与学生生活息息相关的案例,如学校运动会成绩统计。

2. 案例分析:引导学生运用统计知识对案例进行分析,包括数据的收集、整理、计算平均成绩等。

3. 案例讨论:让学生分组讨论,提出问题、解决问题,并分享各自的成果。

七、教学设计1. 教学目标设计:明确本节课的教学目标,包括知识与技能、过程与方法、情感态度与价值观。

2. 教学过程设计:规划课堂导入、新课讲解、实践操作、总结反思等环节。

3. 教学评价设计:设计针对学生学习效果的评价方法,如课堂问答、作业批改、实践操作等。

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

《中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题一、教学目标:1. 让学生了解统计的基本概念和方法,培养学生对数据的收集、整理、分析和解释的能力。

2. 通过案例分析,使学生能够运用统计方法解决实际问题,提高学生的应用能力。

3. 培养学生的团队合作意识,提高学生的沟通交流能力。

二、教学内容:1. 统计的基本概念和方法。

2. 数据的收集和整理。

3. 数据的分析和解释。

4. 统计方法在实际问题中的应用。

5. 团队合作和沟通交流。

三、教学重点与难点:1. 教学重点:统计的基本概念和方法,数据的收集和整理,数据的分析和解释,统计方法在实际问题中的应用。

2. 教学难点:数据的收集和整理,数据的分析和解释。

四、教学方法:1. 讲授法:讲解统计的基本概念和方法,引导学生理解数据的收集和整理,数据的分析和解释。

2. 案例分析法:通过案例分析,让学生学会运用统计方法解决实际问题。

3. 小组讨论法:分组讨论,培养学生的团队合作意识和沟通交流能力。

五、教学过程:1. 导入新课:通过引入实际问题,激发学生的学习兴趣,引出统计的基本概念和方法。

2. 讲解统计的基本概念和方法:讲解统计学的定义、统计数据的类型、统计图表的种类及作用。

3. 数据的收集和整理:介绍数据的收集方法、整理方法,如调查问卷、数据清洗等。

4. 数据的分析和解释:讲解数据分析的方法、解释数据的意义,如描述性统计、推断性统计等。

5. 案例分析:提供典型案例,引导学生运用统计方法进行分析,解决实际问题。

6. 小组讨论:学生分组讨论,培养团队合作意识和沟通交流能力。

8. 布置作业:布置相关练习题,巩固所学知识。

9. 课后跟进:对学生的学习情况进行跟踪,解答学生在学习中遇到的问题。

10. 教学评价:通过测试、课堂表现、作业完成情况等多方面进行教学评价。

六、教学案例分析案例一:某学校想要了解学生的身高分布情况,应该如何进行数据收集和分析?引导学生运用统计方法进行案例分析,掌握数据的收集、整理、分析和解释过程。

知识讲解-高考总复习:统计与统计案例

知识讲解-高考总复习:统计与统计案例

高考总复习:统计与统计案例【考纲要求】〔1〕理解随机抽样的必要性和重要性;〔2〕会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体〔1〕了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.〔2〕理解样本数据标准差的意义和作用,会计算数据标准差.〔3〕能从样本数据中提取基本的数字特征〔如平均数、标准差〕,并作出合理的解释.〔4〕会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.〔5〕会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3.变量的相关性〔1〕会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;〔2〕了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程〔线性回归方程系数公式不要求记忆〕. 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整 理分析数据的数字特征 分层抽样系统抽样变量的相关性指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样 简单随机抽样的概念:设一个总体的个体数为N .如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.① 用简单随机抽样从含有N 个个体的总体中抽取一个容量为n 的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:要点诠释:〔1〕各种抽样的个体被抽到的概率相等;〔2〕抽样过程中个体被抽到的概率相等.5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离,s =(2)方差: 2222121[()()...()]n s x x x x x x n=-+-++- (n x 是样本数据,n 是样本容量,x 是样本平均数)要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标 6. 频率分布直方图反映样本的频率分布 (1)频率分布直方图中横坐标表示组距,纵坐标表示组距频率,频率=组距×组距频率(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. (4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. 考点三、变量的相关性 1. 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.两个变量的线性相关〔1〕相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.(2)正相关在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (4)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.3.回归方程 (1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程方程y bx a =+是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),n n x y x y x y 的回归方程,期中,a b 是待定参数.1122211()()()nni i i ii i n ni ii i x x y y x ynxy b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑要点诠释:相关关系与函数关系的异同点: 相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系; ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 考点四、统计案例(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;(2)随机误差:线性回归模型用y bx a e =++表示,其中a,b 为模型的未知数,e 称为随机误差. (3)样本点的中心在具有线性相关关系的数据1122(,),(,),(,),n n x y x y x y 中回归方程的截距和斜率的最小二乘估计公式分别为:121()(),=-()nii i nii xx y y b a y bx xx ==--=-∑∑其中111,=,(,,)nni i i i x x y x x y n ===∑∑称为样本点的中心.(4)相关系数①()()nii xx y y r --=∑②当>0r 时,说明两个变量正相关; 当<0r 时,说明两个变量负相关.r r 大于0.75时,认为两个变量有很强的线性相关性.(1)总偏差平方和把每个效应(观测值减去总的平均值)的平方加起来即:21()nii yy =-∑(2)残差数据点和它回归直线上相应位置的差异2()i i y y -是随机误差的效应,称=i i i e y y -为残差. (3)残差平方和21()nii i yy =-∑.(4)相关指数22121()()nii i n ii yy R yy ==-=-∑∑2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, 2R 表示解释变量对预报变量变化的奉献率, 2R 越接近于1,表示回归的效果越好.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y,它们的可能取值分别为1122{,}{,}x y x y 和,其样本频数列联表(称为2×2列联表)为2×2列联表1y 2y总计1xa b a b + 2xcd c d + 总计a c +b d +a b c d +++构造一个随机变量22()()()()()n ad bc K a b c d a c b d -=++++,其中a b c d +++为样本容量.(3)独立性检验利用随机变量2K 来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.注: 在独立性检验中经常由2K 得到观测值k ,则k =2K 是否成立?〔2K 与k 的关系并不是k =2K ,k 是2K 的观测值,或者说2K 是一个随机变量,它在a ,b ,c ,d 〕取不同值时,2K 可能不同,而k 是取定一组数a ,b ,c ,d 后的一个确定的值. 【典型例题】类型一、简单随机抽样【例1】某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?【思路点拨】简单随机抽样一般采用两种方法:抽签法和随机数表法.【解析】解法1:〔抽签法〕将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径.解法2:〔随机数表法〕将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种方法可以看出,当总体个数较少时用两种方法都可以,当样本总数较多时,方法2优于方法1.举一反三:【变式】某大学为了支持奥运会,从报名的24名大三的学生中选6人组成志愿小组,请用抽签法和随机数表法设计抽样方案.【思路点拨】(1)总体的个体数较少,利用抽签法或随机数表法可容易获取样本;(2)抽签法的操作要点:编号、制签、搅匀、抽取;(3)随机数表法的操作要点:编号、选起始数、读数、获取样本.【解析】抽签法第一步:将24名志愿者编号,编号为1,2,3, (24)第二步:将24个号码分别写在24张外形完全相同的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;[来源:]第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法第一步:将24名学生编号,编号为01,02,03,……24;第二步:在随机数表中任选一数开始,按某一确定方向读数;第三步:凡不在01~24中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:找出号码与记录的数相同的学生组成志愿小组.类型二、系统抽样【例2】某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.【解析】按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生.采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293.【总结升华】系统抽样可按事先规定的规则抽取样本. 此题采用的规则是第一组随机抽取的学生编号为k,那么第m组抽取的学生编号为k+5(m-1).举一反三:【变式】一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为l ,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第最小组中抽取的号码个位数字与m+k 的个位数字相同.假设m=6,则在第7组中抽取的号码是 .【答案】∵6m =,7k =,∴13m k += ∴在第7小组中抽取的号码是63. 类型三、分层抽样【例3】某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A .分层抽样法,系统抽样法B .分层抽样法,简单随机抽样法C .系统抽样法,分层抽样法D .简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样l 法、第②项调查应采用简单随机抽样法.故选B . 【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定. 举一反三:【变式】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生〔 〕A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B ;根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.【思路点拨】采用分层抽样的方法.【解析】因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:〔1〕将3万人分为5层,其中一个乡镇为一层. 〔2〕按照样本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60〔人〕,300×2/15=40〔人〕,300×5/15=100〔人〕,300×2/15=40〔人〕,300×3/15=60〔人〕,因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人.〔3〕将300人组到一起,即得到一个样本.【总结升华】分层抽样在日常生活中应用广泛,其抽取样本的步骤尤为重要,应牢记按照相应的比例去抽取.举一反三:【变式】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定〔Ⅰ〕游泳组中,青年人、中年人、老年人分别所占的比例; 〔Ⅱ〕游泳组中,青年人、中年人、老年人分别应抽取的人数. 【答案】〔Ⅰ〕设登山组人数为x ,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c ,则有40%347.5%410%310%4x xbxx xc x ⋅+⎧=⎪⎪⎨⋅+⎪=⎪⎩,解得50%10%b c =⎧⎨=⎩故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. 〔Ⅱ〕游泳组中,抽取的青年人数为320040%604⨯⨯=〔人〕; 抽取的中年人数为32004⨯⨯50%=75〔人〕; 抽取的老年人数为32004⨯⨯10%=15〔人〕.类型四、用样本估计总体【例4】甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些? 【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:甲茎 乙 674 9 9 7 6 65 4 3 2 1 80 2 4 5 9 9 091由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如下图,则他们在这次测验中成绩较好的是 组.【答案】甲小组【变式2】甲、乙两名运发动的5次测试成绩如以下图所示,设12,s s 分别表示甲、乙两名运发动测试成绩的标准差,12,x x 分别表示甲、乙两名运发动测试成绩的平均数,则有〔 〕A .12x x =,12s s <B .12x x =, 12s s >C .12x x >, 12s s >D .12x x =, 12s s = 【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学测验中的成绩,甲组记录中有一个数据模糊,无法确认,在图中以X 表示. 甲组 乙组 6 X8 74 1 9 0 0 3甲 茎 乙 5 7 1 6 8 8 8 223 6 7〔Ⅰ〕如果甲组同学与乙组同学的平均成绩一样,求X 及甲组同学数学成绩的方差;〔Ⅱ〕如果X=7,分别从甲、乙两组同学中各随机选取一名,求这两名同学的数学成绩之和大于180的概率.〔注:方差2222121=[()()...()],n s x x x x x x n-+-++-其中12,,...,.n x x x x 为的平均数〕【思路点拨】〔Ⅰ〕利用平均数的基本概念加以求解。

统计案例-讲义(教师版)

统计案例-讲义(教师版)

统计案例一、课堂目标1.能够利用相关系数判断两个变量之间的相关关系.2.熟练求解线性回归方程,并能够根据回归方程进行预测.3.掌握卡方计算公式,能够利用独立性检验判断两个变量是否相关.【备注】【教师指导】1.统计案例属于高考必考内容,在文科中常与统计与概率一起考查,以一道解答题出现在高考试卷中,在期中期末考试中也属于重点考查对象.本讲的重点是掌握相关系数,能够利用相关系数判断两个变量间的相关关系;能够根据题意熟练求解线性回归方程,并能够根据回归方程对变量进行预测;掌握卡方计算公式,能够利用独立性检验判断两个变量是否相关;重点题型是统计案例与统计、概率的综合.2.本讲的关联知识是统计、概率二、知识讲解1. 一元线性回归模型知识精讲(1)如果由变量的成对数据、散点图或直观经验可知,变量与变量之间的关系可以近似地用一次函数来刻画,则称与线性相关;(2)如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.2. 回归直线方程知识精讲(1)用最小二乘法求线性回归方程对于一组具有线性相关关系的数据:,,,,,我们知道其回归直线的斜率和截距的最小二乘法估计分别为:其中,,称为样本点的中心,位于回归直线上.(2)相关系数对于变量与随机抽到的对数据,,,,,可以利用相关系数来衡量两个变量之间线性相关关系,样本相关系数的计算公式为:.具体评判结果如下:①时,表示两个变量正相关;②时,表示两个变量负相关;③越接近于,表明两个变量的线性相关程度越强;④越接近于,表明两个变量的线性相关程度越弱.(3)非线性回归①非线性相关关系研究两个变量的关系是,我们常常根据样本生成点坐标在平面直角坐标系中作出散点图,观察散点图中样本点的分布.从整体看,如果样本点并没有分布在某一条直线附近,我们就称这两个变量之间不具有线性相关关系,也就是非线性相关关系.②确定函数模型根据散点图的分布,若呈现出的是非线性相关关系,我们可以根据散点的分布形状选择其他函数模型),然后利用代数转化手段,将非线性函数转化为线性函数,再作出散点图或计算线性相关系数.(4)常见函数模型的转化①幂函数型移项:;取对数:;作变换:,此时上式变为线性函数.计算分析:先将原数据点计算转化为,然后根据线性回归模型求解出和.②指数函数型移项:;取对数:;作变换:,此时上式变为线性函数.计算分析:先将原数据点计算转化为,然后根据线性回归模型求解出和.经典例题A.万元B.万元C.万元D.万元1.某产品的广告费用与销售额的统计数据如下表广告费用(万元)销售额(万元)根据上表可得回归方程中的为,据此模型预报广告费用为万元时销售额为().【答案】B【解析】计算得,,所以回归方程为.当广告费用为万元时,销售额约为万元.故选.【标注】【知识点】线性回归方程过平均数点;线性回归方程的其他应用;残差分析【备注】【教师指导】熟练掌握线性回归方程中斜率和截距的公式,进而熟练求解线性回归方程.巩固练习A. B. C. D.2.登山族为了了解某山高与气温之间的关系,随机统计了次山高与相应的气温,并制作了对照表:气温山高由表中数据得到线性回归方程,由此估计出山高为处气温的度数为().【答案】D【解析】,,∵,∴,∴,令,得.故选.【标注】【知识点】线性回归方程的其他应用;线性回归方程过平均数点经典例题(1)(2)(3)3.某电脑公司有名产品推销员,其中名推销员的工作年限与年推销金额数据如下表所示:推销员编号工作年限(年)年推销金额(万元)求年推销金额与工作年限之间的相关系数(精确到小数点后两位);求年推销金额关于工作年限的线性回归方程;若第名推销员的工作年限为年,试估计他的年推销金额.【答案】(1)(2)(3)万元【解析】(1)(2)(3)由,,,可得.∴年推销金额与工作年限之间的相关系数约为.由()知,.∴可认为年推销金额关于工作年限之间具有较强的的线性相关关系.设所求的线性回归方程为,则,.∴年推销金额关于工作年限的线性回归方程为.由()可知,当时,【备注】【教师指导】熟练掌握相关系数的公式、线性回归方程,并能够根据回归方程进行预测.(万元).∴可以估计第名推销员的年推销金额为万元.【标注】【知识点】变量间的相关关系;残差分析巩固练习(1)(2)4.在某小区随机抽取名成年男子测量他们的体重,表示第一年的体重,表示第二年的体重,数据如下:对变量与进行相关性检验;如果与具有线性相关关系,求回归直线方程.【答案】(1)(2)与具有线性相关关系.【解析】(1)(2),,,,,,..又查表得,相应于显著水平和自由度的相关系数临界值,由,知与具有线性相关关系.设回归直线方程为,则,,所以回归直线方程为.【标注】【知识点】残差分析;线性回归方程的其他应用经典例题(1)12(2)5.近年来,随着汽车消费的普及,二手车流通行业得到迅猛发展.某汽车交易市场对年成交的二手车的交易前的使用时间(以下简称“使用时间”)进行统计,得到如图所示的频率分布直方图.在图对使用时间的分组中,将使用时间落入各组的频率视为概率.图使用时间年频率组距若在该交易市场随机选取辆年成交的二手车,求恰有辆使用年限在的概率.根据该汽车交易市场往年的数据,得到图所示的散点图,其中(单位:年)表示二手车的使用时间,(单位:万元)表示相应的二手车的平均交易价格.图平均交易价格万元使用时间年由散点图判断,可采用作为该交易市场二手车平均交易价格关于其使用年限的回归方程,相关数据如下表(表,):试选用表中数据,求出关于的回归方程.该汽车交易市场拟定两个收取佣金的方案供选择.甲:对每辆二手车统一收取成交价格的的佣金;乙:对使用年以内(含年)的二手车收取成交价格的的佣金,对使用时间年以上(不含年)的二手车收取成交价格的的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表,并用各时间组的区间中点值代表该组的各个值.判断该汽车交易市场应选择哪个方案能获得更多佣金.附注:.对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,;.参考数据:,,,,.【答案】(1)12(2)..甲方案.【解析】(1)1(2)由频率分布直方图知,该汽车交易市场年成交的二手车使用时间在的频率为,使用时间在的频率为.所以在该汽车交易市场年成交的二手车随机选取辆,其使用时间在的概率为,所以所求的概率为.由得,则关于的线性回归方程为,由于,,则关于的线性回归方程为,所以关于的回归方程为.【备注】【教师指导】对于非线性函数要先转化成线性函数,然后再利用最小二乘法求线性回归方程.2根据频率分布直方图和①中的回归方程,对成交的二手汽车可预测:使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格预测值为;使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格的预测值为;若采用甲方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为万元;若采用乙方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为万元;因为,所以采用甲方案能获得更多佣金.【标注】【知识点】频率分布直方图;残差分析;最小二乘法;线性回归方程过平均数点巩固练习(1)1(2)6.一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的组观测数据如下表:温度产卵数个经计算得:,,,,,线性回归模型的残差平方和,,其中,分别为观测数据中的温度和产卵数,,,,,,.若用线性回归模型,求关于的回归方程(精确到).若用非线性回归模型求得关于的回归方程,且相关指数.试与()中的回归模型相比,用说明哪种模型的拟合效果更好.2用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).【答案】(1)12(2).回归方程拟合效果更好.个.【解析】(1)12(2)由题意得,,∴,∴关于的线性回归方程为.由所给数据求得的线性回归方程为,相关指数为,因为,所以回归方程比线性回归方程拟合效果更好.由()得当温度时,.又∵,∴(个).【标注】【知识点】相关系数问题;线性回归方程的其他应用;最小二乘法;残差分析3. 随机误差与残差知识精讲(1)随机误差①概念:线性回归模型①来表示,其中和为模型的未知参数,称为随机误差.②产生随机误差的原因主要有以下几种:(ⅰ)所用的确定性函数不恰当引起的误差;(ⅱ)忽略了某些因素的影响;(ⅲ)存在观测误差.(2)残差①残差的定义在实际应用中,我们用回归方程中的估计①中的.由于随机误差,所以是的估计量.对于样本点而言,它们的随机误差为其估计值为称为相应于点的残差.()②残差图下表列出了女大学生身高和体重的原始数据以及相应的残差的数据.我们可以利用图形来分析残差特性.作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.如下图:编号12345678身高/165165157170175165155170体重/4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382【备注】【教师指导】从图中可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高 .③的计算常用来刻画回归的效果,其计算公式是:.知识点睛残差分析的一般方法:①作残差图.如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,线性回归方程的预报精度越高;如果残差点分布不均匀,应首先确认采集的样本点是否有误,如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型来拟合数据;如果数据的采集没有错误,那么需要寻找其他的原因.②计算相关指数.根据来刻画回归的效果.对于已经获取的样本数据,表达式中的为确定的数.因此:越大,残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.经典例题7.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是 .【答案】【解析】因为回归方程为,所以当时,, 所以针对某个体的残差是, 故答案为:.【标注】【知识点】残差分析;线性回归方程的其他应用【备注】【教师指导】掌握残差的概念,会计算残差.A.甲B.乙C.丙D.丁8.甲、乙、丙、丁四位同学各自对,两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和,如下表:甲乙丙丁则哪位同学的试验结果体现,两变量有更强的线性相关性( ).【答案】D【解析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于,相关性越强,在四个选项中只有丁的相关系数最大,残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现、两变量有更强的线性相关性,故选:.【标注】【知识点】变量间的相关关系【备注】【教师指导】①相关系数的绝对值越接近于1,相关性越强;②残差平方和越小,相关性越强.巩固练习A.模型①的相关指数为B.模型②的相关指数为C.模型③的相关指数为D.模型④的相关指数为9.在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为( ).【答案】A【解析】根据相关指数的值越大,模型拟合的效果越好,比较、、、选项,的相关指数最大,∴模型①拟合的效果最好.故选.【标注】【知识点】残差分析A.B.C.D.10.在下列说法中,真命题的个数是( ).①随机误差是引起预报值与真实值之间误差的原因之一;②残差平方和越小,预报精度越高;③用相关指数来刻画回归的效果,的值越接近,说明模型的拟合效果越好;④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.【答案】C【解析】随机误差是引起预报值与真实值之间存在误差的原因之一,故①正确;残差平方和越小,预报精度越高,故②正确;相关指数用来刻画回归效果,越接近于,则残差平方的和越小,模型的拟合效果越好,故③正确;因为由任何一组观测值都可以求得一个回归直线方程,检验有意义,必须进行相关性检验,故④错误.故选.【标注】【知识点】相关系数问题;变量间的相关关系;残差分析4. 建立回归模型的基本步骤知识精讲一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量 .(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.经典例题11.运动员训练次数与运动成绩之间的数据关系如下:次数()成绩()(1)(2)(3)(4)(5)做出散点图.求出线性回归方程.做出残差图.计算.预试测该运动员训练次及次的成绩.【答案】(1)(2)(3)(4)(5)见解析.$.见解析..和.【解析】(1)(2)做出运动员训练次数和与成绩的散点图,如图所示,由散点图可知,它们之间具有相关关系.,,,,,∴,,【备注】【教师指导】进一步加深学生对建立回归模型基本步骤的掌握.(3)(4)(5)∴回归直线方程.残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.作残差图,如图所示,由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.计算相关指数,说明了该运动员的成绩的差异有是由训练次数引起的.做出预报:由上述分析可知,回归直线方程可以作为该运动员训练成绩的预报值.将和分别代入该方程可得、,故预测该运动员训练次和次的成绩分别为和.【标注】【知识点】残差分析;线性回归方程的其他应用;变量间的相关关系;散点图5. 独立性检验知识精讲(1)分类变量对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为“分类变量”.在现实生活中,分类变量是大量存在的,例如吸烟变量有吸烟和不吸烟两个“值”,月份变量有十二个“值”.【备注】【教师指导】分类变量中所谓的“变量”和“值”都应该作广义的理解,它们并不是指具体的数值.例如对于性别变量,“变量”指的是性别,而“值”指的是男和女.在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?等等.下面我们借助一个实例来体验一下:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了人,得到如下结果:像上表这样列出的两个分类变量的频数表,称为列联表.由上表可以粗略估计出:在不吸烟样本中,有患肺癌;在吸烟样本中,有患肺癌,因此直观上可以得出结论:吸烟和患肺癌有关. 不患肺癌患肺癌总计不吸烟吸烟总计(2)独立性检验利用统计分析的手段作研究:先假设:吸烟与患肺癌没有关系.用表示不吸烟,表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即.把上表中的数字用字母代替,得到如下用字母表示的列联表:在上表中,恰好为事件发生的频数;和恰好分别为事件和事件发生的频数.因为频率接近于概率.所以在成立的条件下应该有:(其中为样本容量).将上式化简得到.因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强.不患肺癌患肺癌总计不吸烟吸烟总计为了使不同样本容量的数据有统一的评判标准,构造一个随机变量(其中为样本容量).若假设成立,即“吸烟与患肺癌没有关系”,则应该很小.根据数字列联表中的数据,计算得到的观测值约为.这个值到底能告诉我们什么呢?统计学家经过研究后发现,在成立的情况下,.即在成立的情况下,的观测值超过的概率非常小,近似为,是一个小概率事件.而现在的观测值约为,远远大于阀值.所以我们有理由断定不成立,即认为“吸烟与患肺癌有关系”.但这种判断需要承担不超过的风险(即这种判断犯错误的概率不超过).知识点睛独立性检验的具体步骤:(1)准确作出列联表;(2)统计假设成立;(3)计算;(4)将上一步计算得到的观测值与临界值比较,从而接收或拒绝假设.经典例题A.B.C.D.12.通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计由算得,.参照附表,得到的正确结论是().在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”有以上的把握认为“爱好该项运动与性别有关”有以上的把握认为“爱好该项运动与性别无关”【答案】C【备注】【教师指导】本题主要通过独立性检验判断两个变量是否相关.即在犯错误的概率不超过或有以上的把握认为“爱好该项运动与性别有关”.【标注】【知识点】列联表、卡方计算;独立性检验巩固练习A. B. C. D.13.为了增强环保意识,某校从男生中随机制取了人,从女生中随机制取了人参加环保知识测试,统计数据如表所示,经计算,则环保知识是否优秀与性别有关的把握为( ). 优秀非优秀总计男生女生总计附:.【答案】C 【解析】由题意,,所以,在犯错误不超过的情况下认为环保知识是否优秀与性别有关,即有的把握认为环保知识是否优秀与性别有关.故选:.【标注】【知识点】独立性检验;列联表、卡方计算A.B.C.D.14.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取名成年人调查是否吸烟是否患有肺病,得到列联表,经计算的.已知在假设吸烟与患肺病无关的前提条件下,,,则该研究所可以( ).有以上的把握认为“吸烟与患肺病有关”有以上的把握认为“吸烟与患肺病无关”有以上的把握认为“吸烟与患肺病有关”有以上的把握认为“吸烟与患肺病无关”【答案】A经查对临界值表知,∴有的把握说患肺病与吸烟有关故选.【标注】【知识点】列联表、卡方计算;独立性检验经典例题15.某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了件产品进行分析,其中设备改造前生产的合格品有件,不合格品有件;设备改造后生产的合格品有件,不合格品有件,根据上面的数据,计算的值约为(精确到).【答案】【解析】由已知数据得到下表:合格品不合格品合计设备改造后设备改造前合计根据公式.【标注】【知识点】独立性检验;列联表、卡方计算【备注】【教师指导】要求学生熟练掌握卡方计算公式.巩固练习A.B.16.在独立性检验中,统计量有两个临界值:和.当时,有的把握说明两个事件相关;当时,有的把握说明两个事件相关;当时,认为两个事件无关;在一项调查某种药是否对心脏病有治疗作用时,共调查了人,经计算,根据这一数据分析,认为此药物与心脏病之间().有的把握认为两者相关约有的心脏病患者使用药物有作用C.D.有的把握认为两者相关约有的心脏病患者使用药物有作用【答案】A 【解析】∵,∴有的把握认为“两者有关系”.故选.【标注】【知识点】列联表、卡方计算;独立性检验经典例题(1)(2)17.年底,湖北省武汉市等多个地区陆续出现感染新型冠状病毒肺炎的患者.为及时有效地对疫情数据进行流行病学统计分析,某地研究机构针对该地实际情况,根据该地患者是否有武汉旅行史与是否有确诊病例接触史,将新冠肺炎患者分为四类;有武汉旅行史(无接触史),无武汉旅行史(无接触史),有武汉旅行史(有接触史)和无武汉旅行史(有接触史),统计得到以下相关数据.请将列联表填写完整:有接触史无接触史总计有武汉旅行史无武汉旅行史总计能否在犯错误的概率不超过的前提下认为有武汉旅行史与有确诊病例接触史有关系?附:,,【答案】(1)有接触史无接触史总计有武汉旅行史无武汉旅行史总计【备注】【教师指导】第一步,要求学生会填列联表;第二步,要求学生掌握通过独立性检验判断两个变量是否相关.(2)在犯错误的概率不超过的前提下,认为有武汉旅行史与有确诊病例接触史有关系.【解析】(1)(2)请将该列联表填写完整:有接触史无接触史总计有武汉旅行史无武汉旅行史总计根据列联表中的数据,由于,因此,在犯错误的概率不超过的前提下,认为有武汉旅行史与有确诊病例接触史有关系.【标注】【知识点】总体、样本、样本容量;列联表、卡方计算;独立性检验巩固练习(1)18.为了调查某大学学生在某天上网的时间,随机对名男生和名女生进行了不记名的问卷调查.得到了如下的统计结果:表:男生上网时间与频数分布表上网时间(分钟)人数表:女生上网时间与频数分布表上网时间(分钟)人数完成下面的列联表:上网时间少于分钟上网时间不少于分钟合计男生女生,,,,,,,,,,。

统计法基础知识(案例分析、综合应用题)

统计法基础知识(案例分析、综合应用题)

统计法基础知识四、案例分析题1.向阳乡人民政府统计站统计员周某私自改动16个村民委员会上报的2007年农村经济统计年报报表,并根据改过的数据编制2007年全乡的年报,经乡政府主要领导签字及加盖乡政府公章后上报到县统计局,被核查发现,涉嫌统计违法。

县统计局对此种违法行为依法作出了处理。

请回答:(1)统计员周某和向阳乡政府涉嫌何种统计违法行为?(D)A虚报统计资料 B瞒报统计资料 C伪造统计资料D篡改统计资料(2)县统计局对周某和向阳乡政府的统计违法行为可以作出何种处罚?(B、D)A对乡政府罚款B对乡政府通报批评 C撤销该统计员的职务D建议县政府或有关纪检监察部门对涉案责任人给予行政处分(3)有决定权的机关对涉案责任人可以作出何种行政处分?(A、B)A记过 B警告 C调离原工作岗位 D罚款(4)被追究责任人员若不服从处分,可以采取何种措施维护自己的合法权益?(C)A申请行政复议 B向工商局申诉 C向上级申诉 D提起行政诉讼2.某镇主要领导为完成上级下达的计划指标,指使统计人员将2007年全年全镇工业总产出5.78亿元和2008年上半年全镇工业总产出3.65亿元,向县统计局分别上报为9.82亿元和5.73亿元。

在县统计局对其实施执法检查,认定该镇存在统计违法行为,该镇和涉案主要责任人受到了处罚。

请回答:在此案例中该镇有何种统计违法行为?(A、C)A虚报统计资料 B瞒报统计资料C拒报统计资料 D伪造统计资料县统计局对该镇的统计违法行为可以作出何种处罚或采取何种处理措施?(A、D)A警告 B行政记过 C罚款 D建议县政府或有关纪检监察部门对涉案责任人给予行政处分有决定权的机关对涉案负责人可以作出何种处分?(B、D)A罚款B撤职C调离原工作岗位D行政记过本案中受到行政处分的人员若不服从处分决定,可以通过何种途径维护自己的合法权益?(C)A向县政府申请复议 B提起行政诉讼C向上级申诉 D向市统计局申请复议3.某省统计局在对某企业进行统计执法检查时发现该企业从事统计工作的人员为统计学类大学本科毕业生,但没有统计从业资格证书,也未取得统计专业技术职务资格,遂认定该企业存在统计违法行为。

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题

《中小学统计》教学案例分析公开课教案教学设计课件案例测试练习卷题一、教学目标1. 让学生理解统计的基本概念,掌握统计数据的收集、整理、表示和分析方法。

2. 培养学生运用统计方法解决实际问题的能力。

3. 增强学生对统计学科的兴趣,提高学生的数据素养。

二、教学内容1. 统计的基本概念及统计学的作用。

2. 数据的收集方法,如调查、实验等。

3. 数据的整理方法,如列表、绘图等。

4. 数据的表示方法,如条形图、折线图、饼图等。

5. 数据分析方法,如描述性统计、推断性统计等。

三、教学重点与难点1. 教学重点:统计的基本概念、数据的收集与整理方法、数据的表示与分析方法。

2. 教学难点:数据分析方法的应用,如概率、回归分析等。

四、教学方法1. 采用案例教学法,以实际问题引导学生学习统计知识。

2. 利用多媒体课件,生动展示统计数据及分析结果。

3. 组织小组讨论,培养学生合作学习的能力。

4. 进行实践操作,让学生在实际问题中运用统计方法。

五、教学过程1. 导入新课:通过一个生活中的实例,如调查学校学生的身高情况,引出统计学的基本概念。

2. 讲解统计基本概念:介绍统计学的定义、作用及统计数据的类型。

3. 讲解数据的收集方法:讲解调查、实验等数据收集方法的特点及应用。

4. 讲解数据的整理方法:介绍列表、绘图等数据整理方法的操作步骤。

5. 讲解数据的表示方法:讲解条形图、折线图、饼图等表示方法的原理及绘制方法。

6. 讲解数据分析方法:介绍描述性统计、推断性统计等分析方法的概念及应用。

7. 案例分析:选取一个实际问题,让学生运用所学的统计方法进行数据收集、整理、分析,并解释结果。

8. 课堂练习:布置一些有关统计的练习题,让学生巩固所学知识。

9. 总结与拓展:对本节课的内容进行总结,并提出一些拓展问题,激发学生的学习兴趣。

10. 布置作业:布置一些有关统计的作业,让学生进一步巩固所学知识。

六、教学评价1. 评价内容:学生对统计基本概念的理解、数据的收集与整理方法的掌握、数据的表示与分析方法的运用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、考纲要求:1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.5.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.6.理解样本数据标准差的意义和作用,会计算数据标准差.7.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 8.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题. 二、概念掌握及解题上的注意点: 1.简单随机抽样的特点 1抽取的个体数较少.2逐个抽取.3不放回抽取.4等可能抽取.只有四个特点都满足的抽样才是简单随机抽样. 2.抽签法与随机数法的适用情况1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况. 2)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.3.从总体数N 中抽取一个样本容量为n 的样本1)在整个抽样过程中,每个个体被抽到的概率是n N. 2)在一次抽取中,每个个体被抽到的概率是1N.4.系统抽样的三个关注点1)若不改变抽样规则,则所抽取的号码构成一个等差数列,其首项为第一组所抽取的号码,公差为样本间隔.故问题可转化为等差数列问题解决. 2)抽样规则改变,应注意每组抽取一个个体这一特征不变.3)如果总体容量N 不能被样本容量n 整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.5.系统抽样有一个抽样距⎣⎢⎡⎦⎥⎤N n 其步骤为剔除,编号,均分,抽样. 6频率、频数、样本容量的计算方法 1)频率组距×组距=频率. 2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.易错警示:绘制频率分布直方图时的3个注意点1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; 2)频率分布直方图的纵坐标是频率组距,而不是频率.3)注意中值估算法. 三、高考考题题例分析:例1.(2018全国卷II ) 如图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:=﹣30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 【答案】见解析(2)模型②得到的预测值更可靠;因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以,利用模型②的预测值更可靠些.例2.(2018全国卷III)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:超过m 不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828【答案】见解析由此填写列联表如下;超过m 不超过m总计 第一种生产方式 15 5 20 第二种生产方式5 15 20 总计202040(3)根据(2)中的列联表,计算K 2===10>6.635,∴能有99%的把握认为两种生产方式的效率有差异.例10(2017山东高考)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170【答案】C统计与统计案例练习题一、选择题1.下面的抽样方法是简单随机抽样的为()A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D.用抽签方法从10件产品中选取3件进行质量检验【答案】D【解析】:A,B选项中为系统抽样,C为分层抽样.2.重庆市2016年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()A .19B .20C .21.5D .23【答案】B3.下列说法错误的是( )A .回归直线过样本点的中心(x -,y -)B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^平均增加0.2个单位 【答案】C【解析】:根据相关定义分析知A ,B ,D 正确;C 中对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,判断“X 与Y 有关系”的把握程度越大,故C 错误,故选C . 4.福利彩票“双色球”中红色球的编号有33个,分别为01,02,…,33,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76C .02D .17【答案】C【解析】:从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02. 5.某班一次测试成绩的茎叶图和频率分布直方图可见部分(如图),根据图中的信息可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2 B.24,4C.25,2 D.25,4【答案】C6.某公司在2017年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x 12.314.515.017.019.820.6支出y 5.63 5.75 5.82 5.89 6.11 6.18A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系【答案】C【解析】:月收入的中位数是15+172=16,收入增加,支出增加,故x与y有正线性相关关系.7.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为() A.480 B.481C.482 D.483【答案】C8.下列说法错误的是()A .自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好 【答案】B【解析】:根据相关关系的概念知A 正确;当r >0时,r 越大,相关性越强,当r <0时,r 越大,相关性越弱,故B 不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R 2越大,拟合效果越好,所以R 2为0.98的模型比R 2为0.80的模型拟合的效果好,C ,D 正确,故选B .9. 2017年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( )A .9B .4C .3D .2【答案】B【解析】: 由茎叶图得该组数据的平均值为15(87+89+90+91+93)=90,所以该组数据的方差为15[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4,故选B .10.某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500 【答案】C11.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A.8B.15C.16D.32【答案】C【解析】:已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为22×64=2×8=16.12.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9-3-17所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④【答案】B【解析】:由茎叶图中的数据通过计算求得x甲=29,x乙=30,s甲= 3.6,s乙=2,∴x甲<x乙,s甲>s乙,故①④正确.故选B.络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.【答案】(1)3(2)6 000三、解答题17.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平. 【答案】(1) m =3,n =8);(2)见解析【解析】: (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,∴m =3,n =8.(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2, s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2, ∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的平均水平相当,乙组更稳定一些.18.一企业从某条生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到如下的频率分布表:x [11,13) [13,15) [15,17) [17,19) [19,21) [21,23] 频数2123438104(2)若x <13或x ≥21,则该产品不合格.现从不合格的产品中随机抽取2件,求抽取的2件产品中技术指标值小于13的产品恰有一件的概率. 【答案】见解析【解析】: (1)频率分布直方图为19.某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:有效无效总计使用方案A组96120使用方案B组72总计32(1)(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.050.0100.001k0 3.841 6.63510.828 【答案】见解析20.下表数据为某地区某种农产品的年产量x (单位:吨)及对应销售价格y (单位:千元/吨).x 1 2 3 4 5 y7065553822(1)若y 与x y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若每吨该农产品的成本为13.1千元,假设该农产品可全部卖出,预测当年产量为多少吨时,年利润Z 最大?参考公式:⎩⎪⎨⎪⎧b ^=∑ni =1x i y i -n x -y -∑n i =1x 2i -n x-2=∑n i =1 (x i -x )(y i -y -)∑ni =1(x i -x )2,a ^=y --b ^x -.【答案】见解析【解析】: (1)∵x =1+2+3+4+55=3,y -=70+65+55+38+225=50,21.某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计 男生 女生 合计附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .P (K 2≥k 0)0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001 k 00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【解析】:(1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得2×2列联表如下:选择自然科学类选择社会科学类合计 男生 60 45 105 女生 30 45 75 合计9090180则K 2=180×(60×45-30×45)105×75×90×90=367≈5.142 9>5.024, 所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.22.经国务院批复同意,郑州成功入围国家中心城市.某校学生社团针对“郑州的发展环境”对20名学生进行问卷调查打分(满分100分),得到茎叶图,如图① ②(1)分别计算男生、女生打分的平均分,并用数字特征评价男、女生打分的数据分布情况;(2)如图9-3-19②是按照打分区间[50,60),[60,70),[70,80),[80,90),[90,100]绘制的频率分布直方图,求最高矩形的高;(3)从打分在70分以下(不含70分)的学生中抽取3人,求有女生被抽中的概率. 【答案】见解析(2)h =920÷10=0.045.(3)设“有女生被抽中”为事件A ,打分在70分以下(不含70分)的学生中女生有2人,设为a ,b ,男生4人,设为c ,d ,e ,f .基本事件有abc ,abd ,abe ,abf ,acd ,ace ,acf ,ade ,adf ,aef ,bcd ,bce ,bcf ,bde ,bdf ,bef ,cde ,cdf ,cef ,def ,共20种,其中有女生的有16种,所以P (A )=1620=45.。

相关文档
最新文档