变量间的相关关系与统计案例教案(绝对经典)

合集下载

变量间的相关关系第一课时教案-数学高一必修3第二章统计2.3人教A版

变量间的相关关系第一课时教案-数学高一必修3第二章统计2.3人教A版

第二章统计2.3 变量间的相关关系一、学习目标1.知识与技能(1)通过收集现实问题中两个有关联变量的数据、作出散点图,并利用散点图直观认识变量间的相关关系.(2)经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.2.过程与方法明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.情感、态度与价值观通过对事物之间相关关系的了解,让学生们认识到现实中任何事物都是相互联系的辩证法思想.二、重点难点重点:①通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;②利用散点图直观认识两个变量之间的线性关系;难点:①变量之间相关关系的理解;②作散点图和理解两个变量的正相关和负相关.三、专家建议对回归方程的推导,注意以下两点:(1)回归直线是数据最贴近的直线,反映贴近程度的数据是偏差的平方和,即这样,回归直线就是所有直线中Q取最小值的那一条,这种使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)利用最小二乘法求a、b时,是将Q转化为关于a或b的二次函数,利用二次函数的知识求得的.四、教学方法自学-训练-点拨-练习-总结五、教学过程●课堂探究知识点1 变量间的相关关系【问题导思】1.当一个变量的取值一定时,另一个变量的取值被唯一确定,则这两个变量之间是怎样的关系?【提示】这两个变量是一个函数关系.2.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?为什么?【提示】不是函数关系.因为数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.即不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.所以它们的关系不是函数关系.变量与变量之间的关系常见的有两类:一类是确定性的函数关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,称这两个变量具有相关关系.知识点2 两个变量的线性相关【问题导思】一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:1.【提示】2.从散点图中判断x与y之间是否有相关关系?【提示】具有相关关系.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数.【提示】可以.根据散点图作出一条直线,求出直线方程后可预测.(1)两个变量的线性相关①散点图:将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.②正相关与负相关正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.(2)最小二乘法设x、Y的一组观察值为(x i,y i),i=1,2,…,n,且回归直线方程为y^=a+bx,当x取值x i(i=1,2,…,n)时,Y的观察值为y i,差y i-y^i(i=1,2,…,n)刻画了实际观察值y i与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条,由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法.(3)回归直线方程的系数计算公式●典例精讲类型1 相关关系的判断例1.下面是水稻产量与施肥量的一组统计数据(单位:kg):(1)(2)你能从散点图中发现施肥量与水稻产量近似成什么关系吗?水稻产量会一直随施肥量的增加而增加吗?(3)若近似成线性关系,请画出一条直线来近似地表示这种线性关系.【解析】(1)以x轴表示施肥量,y轴表示水稻产量,可得散点图如图所示:(2)从图中可以发现施肥量与水稻产量之间具有正相关关系.当施肥量由小到大变化时,水稻产量也由小变大,但水稻产量只是在一定范围内随着施肥量的增加而增加.(3)如图中所示.1.两个变量x和Y相关关系的判断方法:(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;(2)表格、关系式法:结合表格或关系式进行判断;(3)经验法:借助积累的经验进行分析判断.2.判断两个变量x和Y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.以下是在某地搜集到不同楼盘新房屋的销售价格Y(单位:万元)和房屋面积x(单位:m2)的数据:(1)(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关.类型2 求线性回归方程例2.5个学生的数学和物理成绩(单位:分)如下表:【解析】以x 轴表示数学成绩,y 轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关. 列表,计算: =70,=66,∑5x 2i =24 750,∑5x i y i =23 1901.解答本题要先列出相应的表格,有了表格中的相关数据,求回归系数就容易了. 2.解答此类题目,若知道x 与y 呈线性相关关系,无需进行相关性检验,否则,应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的.某商店统计了最近6个月某商品的进价x 与售价y(单位/元)的对应数据求回归直线方程.类型3 利用回归直线方程对总体进行估计例3.某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表):(1)对变量x 与y(2)若某学生入学数学成绩是80分,试估测他高一期末数学考试成绩.【解析】(1)散点图如图所示,设所求的线性回归方程为y =ax +b ,方法一:x -=63+67+75+88+855=75.6,y -=65+77+80+82+925=79.2,(2)将x =80代入所求出的线性回归方程中,得y ≈82(分),即这个学生的高一期末数学考试成绩预测值为82分.利用回归方程可以对总体进行预测估计,回归方程将部分观测值所反映的规律进行延伸,使我们对有线性相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量的值,根据回归方程得到的数据只是预测值,不是真实值.(2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -bx ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)由于=16(8+8.2+8.4+8.6+8.8+9)=8.5,=16(90+84+83+80+75+68)=80,又b =-20,所以a =-b =80+20×8.5=250,从而回归直线方程为y ∧=-20x +250.(2)设工厂获得的利润为L 元,依题意得 L =x(-20x +250)-4(-20x +250) =-20x 2+330x -1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.●课堂小结1.相关关系与函数关系(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.用回归直线进行拟合两变量关系的线性相关的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a^、b^;并写出线性回归方程.3.在回归直线方程y^=b^x+a^中b^的含义容易理解成增加的单位数,而实际上,它代表x 每增加一个单位,y平均增加的单位数.一般地说,当回归系数b>0时,说明两个变量呈正相关关系,它的意义是:当x每增加一个单位时y就增加b^个单位;当b^<0时,说明两个变量呈负相关关系,它的意义是:当x每增加一个单位时,t就减少|b^|单位.六、板书设计2.3 变量间的相关关系七.当堂检测1.下面哪些变量是相关关系() A.出租车费与行驶的里程B .房屋面积与房屋的价格C .人的身高与体重D .铁块的大小与质量【解析】 A 中由出租车费与行驶的里程的公式知,是确定的函数关系,故A 不对;B 中房屋面积与房屋价格,是确定的函数关系,故B 不对;C 中人的身高会影响体重,但不是唯一因素,故C 对;D 中铁块的大小与质量,是确定的函数关系,故D 不对.故选C.【答案】 C2.下列图形中具有相关关系的两个变量是()【解析】 A 中显然任给一个x 都有唯一确定的y 值和它对应,是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的.【答案】 C3.已知一个回归直线方程为y ^=1.5x +45,x i ∈{1,7,5,13,19},则y =________.【解析】 ∵x i ∈{1,7,5,13,19},∴=9.∵(,)在回归直线上,∴=1.5x +45=1.5×9+45=58.5.【答案】 58.54.已知变量x 与y 有下列对应数据.求y 对x 【解】 x -=1+2+3+44=52,y -=12+32+2+34=74,∑4x 2i =12+22+32+42=30,∑4x i y i =1×12+2×32+3×2+4×3=432,∴b =∑4^ i =1x i y i -4x -y -∑4^ i =1x 2i -4x -2=432-4×52×7430-4×254=45. a =y --b x -=74-45×52=-14. ∴y ^=45x -14.。

变量间的相关关系、统计案例教案(绝对经典)

变量间的相关关系、统计案例教案(绝对经典)

§11.3 变量间的相关关系与独立性检验⎪⎪⎩⎪⎪⎨⎧⎩⎨⎧、不相关、非线性相关、线性相关、不确定的相关关系、确定的函数关系两个变量的关系32121 1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,这条直线叫回归直线.若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. (4)相关系数①r =∑ni =1 (x i -x )(y i -y )∑ni =1(x i -x)2∑ni =1(y i -y )2或()()12211ni i i n ni i i i x ynx yr x x y y ===-=--∑∑∑;②当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当r 的绝对值>0.75时,认为两个变量有很强的线性相关关系。

2.线性回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线ˆˆˆybx a =+的接近程度,使得上式达到最小值的直线ˆˆˆy bx a =+就是所要求的直线,这种方法称为最小二乘法(使得样本数据的点到回归直线的距离平方和最小的方法). (2)回归方程方程ˆˆˆybx a =+是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中,是待定参数.121()()ˆ()niii nii x x y y bx x ==--=-∑∑[]112222212()()()()...()()()()...()nnnx x y y x x y y x x yy x x x x x x --+--++--=⎡⎤-+-++-⎣⎦或者1221ˆni ii nii x ynx ybxnx ==-=-∑∑[]1122222212...,...n n nx y x y x y nx y x x x nx++-⋅=⎡⎤+++-⎣⎦ˆˆay bx =- 线性回归方程过样本点的中心(,)3、回归分析(1)y =bx +a +e 中,a 、b 称为模型的未知参数;e 称为随机误差.(2)随机误差e 的估计值e ˆ(a x b y y y e ii i i i ˆˆˆˆ--=-=)叫做相对于点(x i ,y i )的残差。

变量间的相关关系与统计案例教师版

变量间的相关关系与统计案例教师版

变量间的相关关系与统计案例【知识要点】 1.相关关系的判断(1)如果散点图中点的分布从整体上看大致在一条直线的附近,我们说变量x 和y 具有线性相关关系.(2)样本数据),(i i y x (i =1,2,…,n )的相关系数21211)()())((y yx x y yx x r ini ini iini ----=∑∑∑=== 当0>r 时,两变量正相关,当0<r 时,两变量负相关,当1||≤r 且||r 越接近于1,相关程度越高,当1||≤r 且||r 越接近于0,相关程度越低. 2.回归方程的求法求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.若变量x 与y 具有线性相关关系,有n 个样本数据),(i i y x (i =1,2,…,n ),则回归方程a x b y+=中斜率和截距的最小二乘估计公式分别为:其中i n i x n x ∑==1_1,i ni y n y ∑==1_1,),(__y x 称为样本点的中心.【重点】 回归直线a x b y+=必过样本点的中心),(__y x ,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据. 3.独立性检验设X ,Y 为两个变量,它们的取值分别为{}x 1,x 2和{}y 1,y 2,其样本频数列联表(2×2列联表)如下:利用随机变量22()()()()()n ad bc K a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验.【例题解析】题型一 变量间的相关关系【例1】对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( ) A .r 2<r 4<0<r 3<r 1 B .r 4<r 2<0<r 1<r 3 C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r 2<r 4<0<r 3<r 1.【变式1】四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( )A .①②B .②③C .③④D .①④解析:选D 正相关指的是y 随x 的增大而增大,负相关指的是y 随x 的增大而减小,故不正确的为①④,故选D.相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性. 【例2】(2014·湖北高考)根据如下样本数据得到的回归方程为y ^=bx +a ,则( )A .a >0,b >0B .a >0,b <0C .a <0,b >0D .a <0,b <0 解析:选B 由表中数据画出散点图,如图, 由散点图可知b <0,a >0,选B.【例3】对于下列表格所示五个散点,已知求得的线性回归方程为y ^=0.8x -155,则实数m 的值为( )A.8 B .解析:选A x =196+197+200+203+2045=200,y =1+3+6+7+m 5=17+m5.样本中心点为⎝⎛⎭⎫200,17+m 5,将样本中心点⎝⎛⎭⎫200,17+m 5代入y ^=0.8x -155,可得m =8.故A 正确. 题型二 回归方程的求法【例4】某城市理论预测2011年到2015年人口总数与年份的关系如下表所示(1)请根据上表提供的数据,求最小二乘法求出关于的线性回归方程; (2)据此估计2016年该城市人口总数.参考公式:1221,ni ii nii x y nxyb a y bxxnx =-=-==--∑∑解:(1)210,x y ==,…… 2分∑=51i ii yx = 0×5+1×7+2×8+3×11+4×19=132,∑=51i 2ix=222220123430++++=1221ˆˆˆ 3.6ni ii ni i x y nx ybay bx x nx==-∴==-=-∑∑=3.2, 故y 关于x 的线性回归方程为y ˆ=3.2x+3.6 (2)当x=5时,yˆ=3.2*5+3.6即y ˆ=19.6 据此估计2016年该城市人口总数约为196万. 【例5】某保险公司有一款保险产品的历史户获益率(获益率=获益÷保费收入)的频率分布直方图如图所示: (Ⅰ)试估计平均获益率;(Ⅱ)根据经验若每份保单的保费在20元的基础上每增加x 元,对应的销量y (万份)与x (元)有较强线性相关关系,从历史销售记录中抽样得到如下5组x 与y 的对应数据:(ⅰ)根据数据计算出销量y (万份)与x (元)的回归方程为∧∧=+y b x a ; (ⅱ)若把回归方程∧∧=+y b x a 当作y 与x 的线性关系,用(Ⅰ)中求出的平均获益率估计此产品的获益率,每份保单的保费定为多少元时此产品可获得最大获益,并求出该最大获益.参考公示:1122211()(),()∧∧∧====-∑--===-∑--∑∑nni ii i i i nni ii i x y nx yx x y y b a y b x x x xnx解析:(Ⅰ)区间中值依次为:0.05,0.15,0.25,0.35,0.45,0.55,取值概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,平均获益率为0.050.100.150.200⨯+⨯+(Ⅱ)(i ) 则6.00.10(40)-=--y x 即0.1010.0=-+y x(ii )设每份保单的保费为20+x 元,则销量为0.1010.0=-+y x ,则保费获益为()(20)(0.1010.0)=+-+f x x x 万元, 22()0.182000.1(40)360=-++=--+f x x x x当40=x 元时,保费收入最大为360万元,保险公司预计获益为3600.275=99⨯万元. 题型三 独立性检验【例6】为考察棉花种子经过处理跟生病之间的关系得到下表数据:解析:在假设无关的情况下,根据题意K 2=n ?ad -bc ?2?a +b ??c +d ??a +c ??b +d ?≈0.16,可以得到无关的概率大于50%,所以种子经过处理跟是否生病有关的概率小于50%,所以可以认为种子经过处理与是否生病无关.答案:无【例7】某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:(1)(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.下面的临界值表供参考:(参考公式:K 2=n ?ad -bc ??a +b ??c +d ??a +c ??b +d ?,其中n =a +b +c +d )解:(1)由公式K 2=55×?20×20-10×5?230×25×25×30≈11.978>7.879,所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(2)设所抽样本中有m 个男生,则630=m20,得m =4,所以样本中有4个男生,2个女生,分别记作B 1,B 2,B 3,B 4,G 1,G 2.从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,G 1),(B 1,G 2),(B 2,B 3),(B 2,B 4),(B 2,G 1),(B 2,G 2),(B 3,B 4),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),(G 1,G 2),共15个,其中恰有1个男生和1个女生的事件有(B 1,G 1),(B 1,G 2),(B 2,G 1),(B 2,G 2),(B 3,G 1),(B 3,G 2),(B 4,G 1),(B 4,G 2),共8个.所以恰有1个男生和1个女生的概率为815. 【变式1】经过对计量2K 的研究,得到了若干个临界值如下:当2K 的观测值 3.841K时,我们( A )A. 在犯错误的概率不超过0.05的前提可认为A 与B 有关B. 在犯错误的概率不超过0.05的前提可认为A 与B 无关C. 在犯错误的概率不超过0.01的前提可认为A 与B 有关D. 没有充分理由说明事件A 与B 有关系【变式2】某校高三子啊一次模拟考试后,为了解数学成绩是否与班级有关,对甲乙两个班数学成绩(满分150分)进行分析,按照不小于120分为优秀,120分以下为非优秀的标准统计成绩,已知从全班100人中随机抽取1人数学成绩优秀的概率为310,调查结果如下表所示. (1)请完成上面的列联表;(2)根据列联表的数据,问是否有95%的把握认为“数学成绩与班级有关系”;(3)若按下面的方法从甲班数学成绩优秀的学生中抽取1人:把甲班数学成绩优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数和被记为抽取人的编号,求抽到的编号为6或10的概率.【变式3】为了解人们对新颁布的“生育二孩放开”政策的热度,现在某市进行调查.对[5,65]岁的人群随机抽取了人,得到如下统计表和各年龄段抽取人数的频率分布直方图:(Ⅰ)求,p 的值,并由频率分布直方图估计被调查人群的平均年龄;(Ⅱ)根据以上统计数据填下面2×2列联表,并根据列联表的独立性检验,判断能否有99%的把握认为以45岁为分界点的不同人群对“生育二孩放开”政策的支持度有关系?参考数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++解:(Ⅰ)从[5,15)岁这一年龄组中抽取的人数为450.8=,且频率为0.010100.1⨯=, ∴5500.1n ==; 2分 又第二组的频率为0.2,则第二组人数为10人,∴50.510p == 4分 平均数0.1100.2200.3300.2400.1500.16033x =⨯+⨯+⨯+⨯+⨯+⨯=(岁) 6分 (Ⅱ) 22⨯列联表如下:225171772256.27 6.635232181152K ⨯⨯==≈<⨯⨯,∴没有99%的把握认为以45岁为分界点的不同人群对“生育二孩放开”政策的支持度有关系。

课件3:11.3 变量间的相关关系、统计案例

课件3:11.3 变量间的相关关系、统计案例
10
【规律方法】解独立性检验的应用问题的关注点 (1)两个明确: ①明确两类主体. ②明确研究的两个问题. (2)两个关键: ①准确画出2×2列联表; ②准确理解K2. 提醒:准确计算K2的值是正确判断的前提.
考点3 线性回归分析及应用 知·考情
高考中对线性回归分析的考查主要在两个方面:一是求回归直线 方程,尤其是回归直线必过样本点中心是常考知识点;二是利用回归直 线方程进行预测.
本节内容结束
更多精彩内容请登录:
0.100 2.706
0.050 3.841
0.010 6.635
【规范解答】(1)因为P(K2≥3.841)=0.05,4.844>3.841, 所以判断出错的可能性不超过5%. 答案:不超过5% (2)①将2×2列联表中的数据代入计算公式, 得K2= 100(6010-2010)2 100 4.762,
a y bt 4.3 1 4 2.3, 2
所以y关于t的回归方程为y 1 t 2.3. 2
(2)因为 b
=
1 2
>0,所以2007年至2013年该地区人均纯收入稳步增
长,预计到2015年,该地区人均纯收入y= 1 ×9+2.3=6.8(千元),
2
所以预计到2015年,该地区人均纯收入约6 800元左右.
两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),
其回归方程为 y bx a
n
n
xi x yi y
xiyi nx y
则b i1 n
2
xi x
i1 n
x
2 i
2
nx
,a y bx,
i1
i1
其中, b 是回归方程的_斜__率__, a 是在y轴上的截距.

变量间的相关关系教案

变量间的相关关系教案

变量间的相关关系优秀教案一、教学目标:1. 让学生理解相关关系的概念,能够识别和描述两种变量之间的相关关系。

2. 学生能够运用相关系数来衡量两个变量之间的相关程度。

3. 学生能够运用图表和数学模型来分析变量之间的相关关系。

4. 培养学生的数据分析能力和问题解决能力。

二、教学内容:1. 相关关系的概念和类型。

2. 相关系数的计算和解读。

3. 散点图在分析相关关系中的应用。

4. 线性回归方程的构建和应用。

5. 实际案例分析,运用相关关系解决实际问题。

三、教学重点与难点:重点:相关关系的概念和类型,相关系数的计算和解读,散点图在分析相关关系中的应用。

难点:线性回归方程的构建和应用,实际案例分析。

四、教学方法:1. 采用问题驱动的教学方法,引导学生通过实际案例来理解和应用相关关系。

2. 使用多媒体教学资源,如图表和数学软件,辅助学生直观地理解相关关系。

3. 组织小组讨论和合作活动,培养学生的团队合作能力和问题解决能力。

4. 提供充足的练习机会,让学生通过实践来巩固所学知识。

五、教学过程:1. 引入:通过一个简单的实际案例,引导学生思考两种变量之间的关系。

2. 讲解相关关系的概念和类型,解释相关系数的意义。

3. 演示如何通过散点图来分析两种变量之间的相关关系。

4. 讲解线性回归方程的构建过程,并演示如何应用线性回归方程来预测未知数据。

5. 提供实际案例分析,让学生运用相关关系来解决实际问题。

7. 布置作业,让学生通过练习来巩固所学知识。

六、教学评估与反馈:1. 通过课堂练习和作业,评估学生对相关关系概念的理解程度。

2. 通过小组讨论和案例分析,评估学生在实际问题中运用相关关系的能力。

3. 收集学生的疑问和困难,及时给予反馈和解答。

4. 鼓励学生提出自己的观点和思考,促进学生的主动学习。

七、拓展与深化:1. 介绍相关关系在社会科学、自然科学和工程科学中的应用。

2. 探讨非线性相关关系和多变量相关关系的研究方法。

变量间的相关关系教案

变量间的相关关系教案

变量间的相关关系优秀教案第一章:引言1.1 教学目标让学生理解变量间的相关关系概念让学生掌握绘制散点图的方法让学生了解相关系数的概念1.2 教学内容变量间的相关关系定义散点图的绘制方法相关系数的概念及计算方法1.3 教学过程1.3.1 导入通过实际例子引入变量间的相关关系概念,如身高与体重的关系。

1.3.2 新课导入讲解变量间的相关关系定义,解释相关系数的概念。

演示如何绘制散点图,让学生跟随操作。

1.3.3 案例分析提供一些实际数据,让学生绘制散点图,并计算相关系数。

1.3.4 练习与讨论让学生回答相关问题,巩固所学内容。

引导学生讨论实际问题中的变量间相关关系。

1.4 教学评价通过课堂练习和讨论,评估学生对变量间的相关关系的理解和应用能力。

第二章:线性相关关系2.1 教学目标让学生理解线性相关关系的概念让学生掌握线性相关关系的判断方法让学生学会绘制线性回归直线2.2 教学内容线性相关关系的定义线性相关关系的判断方法线性回归直线的绘制方法2.3 教学过程2.3.1 导入通过实际例子引入线性相关关系概念,如房价与面积的关系。

2.3.2 新课导入讲解线性相关关系的定义,解释线性回归直线的概念。

演示如何判断线性相关关系,让学生跟随操作。

2.3.3 案例分析提供一些实际数据,让学生判断线性相关关系,并绘制线性回归直线。

2.3.4 练习与讨论让学生回答相关问题,巩固所学内容。

引导学生讨论实际问题中的线性相关关系。

2.4 教学评价第三章:非线性相关关系3.1 教学目标让学生理解非线性相关关系的概念让学生掌握非线性相关关系的判断方法让学生学会绘制非线性回归直线3.2 教学内容非线性相关关系的定义非线性相关关系的判断方法非线性回归直线的绘制方法3.3 教学过程3.3.1 导入通过实际例子引入非线性相关关系概念,如温度与冰点的关系。

3.3.2 新课导入讲解非线性相关关系的定义,解释非线性回归直线的概念。

演示如何判断非线性相关关系,让学生跟随操作。

变量间的相关关系教案

变量间的相关关系教案

变量间的相关关系优秀教案一、教学目标1. 让学生理解相关关系的概念,掌握相关系数的概念及计算方法。

2. 培养学生利用相关系数判断变量间关系强度的能力。

3. 引导学生运用相关分析解决实际问题,提高数据分析能力。

二、教学内容1. 相关关系的定义2. 相关系数的概念及计算方法3. 相关系数的判断标准4. 实际问题中的相关分析应用三、教学重点与难点1. 教学重点:相关关系的概念,相关系数的计算方法,相关分析在实际问题中的应用。

2. 教学难点:相关系数的计算,利用相关系数判断变量间关系强度。

四、教学方法1. 讲授法:讲解相关关系的概念,相关系数的计算方法及判断标准。

2. 案例分析法:分析实际问题,引导学生运用相关分析解决问题。

3. 互动讨论法:分组讨论,分享各组在实际问题中应用相关分析的经验。

五、教学准备1. 教学课件:制作相关关系、相关系数、实际问题分析的课件。

2. 案例资料:收集相关分析在实际问题中应用的案例。

3. 分组讨论工具:将学生分成若干小组,便于互动讨论。

六、教学过程1. 导入新课:通过一个简单的实际问题引入变量间的相关关系概念。

2. 讲解相关关系的定义:解释变量间的关系,引导学生理解相关关系。

3. 讲解相关系数的概念:介绍相关系数的概念,解释相关系数的取值范围及意义。

4. 演示相关系数的计算方法:通过课件或板书,演示相关系数的计算过程。

5. 练习计算相关系数:让学生分组计算给定的数据集的相关系数,巩固计算方法。

6. 讲解相关系数的判断标准:解释相关系数的判断标准,引导学生学会利用相关系数判断变量间关系强度。

7. 分析实际问题:让学生分组分析实际问题中的相关关系,运用相关分析解决问题。

8. 分享与讨论:各组分享分析结果,进行课堂讨论,交流心得体会。

七、作业布置2. 请学生复习相关关系的概念和相关系数的计算方法,完成课后练习题。

八、教学反思教师在课后对自己的教学进行反思,分析教学过程中的优点和不足,针对不足之处提出改进措施,以便提高今后的教学质量。

变量间的相关关系与统计案例教师版

变量间的相关关系与统计案例教师版

变量间的相关关系与统计案例教师版教师版:变量间的相关关系与统计案例引言:在统计学中,了解变量间的相关关系是非常重要的。

相关关系描述了两个或更多变量之间的连接,帮助我们理解它们如何相互影响和变化。

本文将介绍变量间相关关系的基本概念,并提供一些统计案例来帮助教师教授有关此主题的课程。

第一部分:相关性的定义和计算相关性是指两个或多个变量之间的关系程度。

直观上,当一个变量的值增加时,另一个变量的值是否也随之增加或减少。

相关性可以是正面的(变量之间的关系是正向的),也可以是负面的(变量之间的关系是反向的)。

相关性的计算可以通过两种方法来完成:Pearson相关系数和Spearman等级相关系数。

Pearson相关系数用于度量两个连续变量之间的线性关系,它的值介于-1和1之间。

当其值接近1时,表示两个变量之间的关系很强;当其值接近-1时,表示两个变量之间的关系是反向的;当其值接近0时,表示两个变量之间的关系较弱。

Spearman等级相关系数用于度量两个等级变量之间的关系,它的计算方式类似于Pearson相关系数,但在计算前将变量转换为等级。

第二部分:相关关系的案例研究案例1:学生的学习时间和学生成绩在这个案例中,我们研究了学生的学习时间和他们的学生成绩之间的相关关系。

我们收集了一组学生的学习时间(以小时为单位)和他们的学生成绩(以百分制为单位)数据。

通过计算Pearson相关系数,我们发现学习时间和学生成绩之间存在较强的正面相关关系(r = 0.8)。

这意味着学习时间越多,学生成绩越高。

案例2:家庭收入和孩子的学习成绩在这个案例中,我们研究了家庭收入与孩子学习成绩之间的相关关系。

我们收集了一组家庭收入水平(以年收入为单位)和孩子的学习成绩(以百分制为单位)数据。

通过计算Pearson相关系数,我们发现家庭收入和孩子学习成绩之间存在较弱的正面相关关系(r = 0.4)。

这意味着家庭收入较高的孩子往往有更好的学习成绩,但这种关系不是很强。

高中数学 第二章 统计 2.3 变量间的相关关系教案数学教案

高中数学 第二章 统计 2.3 变量间的相关关系教案数学教案

《变量间的相关关系》一、教学目标1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及2回归方程系数公式的推导过程,利用电子表格求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解2 、过程与方法:①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。

②通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性。

3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。

利用计算机让学生动手操作,合作交流激发学生的学习兴趣。

二、教学重点、难点重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想借助电子表格求出回归方程。

教学内容的难点:对最小二乘法的数学思想和回归方程的理解教学实施过程中的难点:根据给出的线性回归方程的系数公式建立线性回归方程。

三、教学过程(一)、创设情境导入新课1、相关关系的理解师:我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。

生活中的任何两个变量之间是不是只有确定关系呢?让学生举例,教师总结如:生:不是。

师:能否举出反例?比如,年龄与身高。

生:身高与体重生:教师水平与学生成绩。

生:网速与下载文件所需时间师:不妨以教师水平与学生成绩为例,学生成绩与教师水平有关吗?生:有,一般来说,教师水平越高,学生成绩越好师:即“名师出高徒”,名师一定出高徒吗?生:不一定。

师:即学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。

这就是我们这节课要共同探讨的内容变量间的相关关系。

(板书)生活中还有很多描述相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”设计意图:通过学生熟悉的函数关系,引导学生关注生活中两个变量之间还存在的相关关系。

变量间的相关关系与统计案例教案(绝对经典)

变量间的相关关系与统计案例教案(绝对经典)

第3节变量间的相关关系与统计案例【最新考纲】 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.【高考会这样考】考查回归分析、独立性检验的基本思想和简单应用.要点梳理1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^__,则b^=∑ni=1(x i-x-)(y i-y-)∑ni=1(x i-x-)2=∑ni=1x i y i-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.其中,b^是回归方程的斜率,a^是在y轴上的截距.回归直线一定过样本点的中心(x-,y-).3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(x-,y-)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.(4)相关指数:R2=1-∑ni=1(y i-y^i)2∑ni=1(y i-y-)2.其中∑ni=1(y i-y^i)2是残差平方和,其值越小,则R2越大(接近1),模型的拟合效果越好.4.独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为则随机变量K2=n(ad-bc)(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d为样本容量. [友情提示]1.求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点(x-,y-).2.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.3.根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.基础自测1.思考辨析(在括号内打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)通过回归直线方程y^=b^x+a^可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()答案(1)√(2)√(3)×(4)√2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x 681012y 235 6则y对x的线性回归直线方程为()A.y^=2.3x-0.7B.y^=2.3x+0.7C.y^=0.7x-2.3D.y^=0.7x+2.3解析易求x-=9,y-=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.答案 C3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25解析在两个变量y与x的回归模型中,它们的相关指数R2越近于1,模拟效果越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.答案 A4.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,D不正确.答案 D5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案5%题型分类深度解析考点一相关关系的判断考点一相关关系的判断【例1】(1)已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:m 106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析(1)由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关. (2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性.答案(1)C(2)D规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.2.利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.3.线性回归直线方程中:b^>0时,正相关;b^<0时,负相关.【变式练习1】(1)某公司在2018年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:月份1月份2月份3月份4月份5月份6月份收入x 12.314.515.017.019.820.6支出y 5.63 5.75 5.82 5.89 6.11 6.18根据统计资料,则()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.①x ,y 是负相关关系;②在该相关关系中,若用y =c 1e c 2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程.解析 (1)从统计图表中看出,月收入的中位数是12(15+17)=16,收入增加,则支出也增加,x 与y 正线性相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =c 1e c 2x 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误. 答案 (1)C (2)①②考点二 线性回归方程及应用【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.6 5636.8289.81.61 469108.8表中w i =x i ,w -=18∑i =1w i . (1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:β^=∑ni=1(u i-u-)(v i-v-)∑n i=1(u i-u-)2,α^=v--β^u-.解(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程,由于d^=∑8i=1(w i-w-)·(y i-y-)∑8i=1(w i-w-)2=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.规律方法 1.(1)正确理解计算b^,a^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y^=b^x+a^必过样本点中心(x-,y-).2.(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.(2)本例中y与x不具有线性相关,先作变换,转化为y与w具有线性相关,求出y关于w的线性回归方程,然后进一步求解.【变式练习2】某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:表1为了研究计算的方便,工作人员将上表的数据进行了处理,t =x -2 012,z =y -5得到下表2:表2(1)求z 关于t 的线性回归方程;(2)通过(1)中的方程,求出y 关于x 的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?(附:对于线性回归方程y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -nx -·y-∑ni =1x 2i -nx-2,a ^=y --b ^x -)解 (1)t -=3,z -=2.2,∑5i =1t i z i =45,∑5i =1t 2i =55, b ^=45-5×3×2.255-5×9=1.2,a ^=z --b ^t -=2.2-3×1.2=-1.4, 所以z ^=1.2t -1.4.(2)将t =x -2 012,z =y -5,代入z ^=1.2t -1.4, 得y -5=1.2(x -2 012)-1.4,即y ^=1.2x -2 410.8. (3)因为y ^=1.2×2 022-2 410.8=15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元. 考点三 独立性检验【例3】 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解 (1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表:箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466K 2的观测值为k =200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高.因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.规律方法 1.在2×2列联表中,如果两个变量没有关系,则应满足ad -bc ≈0.|ad -bc |越小,说明两个变量之间关系越弱;|ad -bc |越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值k ;(3)比较观测值k 与临界值的大小关系,作统计推断.【变式练习3】某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查. 现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:K 2=(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得2×2列联表如下:则K 2的观测值为k =180×(60×45-30×45)2105×75×90×90=367≈5.142 9>5.024,所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.课后练习A组(时间:40分钟)一、选择题1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是()A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析依题意K2的观测值为k=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y”有关系.答案 A2.下列说法错误的是()A.回归直线过样本点的中心(x-,y-)B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程y^=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位解析根据相关定义分析知A,B,D正确,C中对分类变量X与Y的随机变量K2的观测值k来说,k越大,判断“X与Y有关系”的把握程度越大,故C错误.答案 C3.已知两个随机变量x,y之间的相关关系如表所示:根据上述数据得到的回归方程为y^=b^x+a^,则大致可以判断()A.a^>0,b^>0B.a^>0,b^<0C.a ^<0,b ^>0D.a ^<0,b ^<0 解析 作出散点图,画出回归直线直观判定b ^>0,a ^<0.答案 C4.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:由K 2=n ((a +b )(c +d )(a +c )(b +d )算得,K 2的观测值为k =110×(40×30-20×20)260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析 根据独立性检验的定义,由K 2的观测值为k ≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”. 答案 A5.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A .160B .163C .166D .170解析 由已知得x -=22.5,y -=160,∵回归直线方程过样本点中心(x -,y -),且b ^=4,∴160=4×22.5+a ^,解得a ^=70.∴回归直线方程为y ^=4x +70,当x =24时,y ^=166.答案 C 二、填空题6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x (个) 10 2030 40 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________. 解析 由x -=30,得y -=0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68. 答案 687.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题 代数题 总计 男同学 22 8 30 女同学 8 12 20 总计302050根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________. 附表:P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析 由列联表计算K 2的观测值k =50(22×12-8×8)230×20×20×30≈5.556>5.024.∴推断犯错误的概率不超过0.025. 答案 0.0258.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y^=b^x+a^中的b^=-2,预测当气温为-4 ℃时,用电量约为________度.解析根据题意知x-=18+13+10+(-1)4=10,y-=24+34+38+644=40.所以a^=40-(-2)×10=60,y^=-2x+60,所以当x=-4时,y=(-2)×(-4)+60=68,所以用电量约为68度.答案68三、解答题9.某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:(1)根据上表,现用分层抽样的方法抽取对产品满意的用户5人,在这5人中任选2人,求被选中的恰好是男、女用户各1人的概率;(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.注:K2=(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.解(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=110.所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×110=3(人).抽取的5人中,三名男用户记为a,b,c,两名女用户记为r,s,则从这5人中任选2人,共有10种情况:ab,ac,ar,as,bc,br,bs,cr,cs,rs.其中恰好是男、女用户各1人的有6种情况:ar,as,br,bs,cr,cs.故所求的概率为P =610=0.6.(2)由题意,得K 2的观测值为k =80(30×20-20×10)2(30+20)(10+20)(30+10)(20+20) =163≈5.333>5.024. 又P (K 2≥5.024)=0.025.故有97.5%的把握认为“产品用户是否满意与性别有关”.10.某市春节期间7家超市广告费支出x i (万元)和销售额y i (万元)数据如下表:(1)若用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)若用二次函数回归模型拟合y 与x 的关系,可得回归方程:y ^=-0.17x 2+5x +20,经计算,二次函数回归模型和线性回归模型的R 2分别约为0.93和0.75,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出3万元时的销售额.参考数据:x -=8,y -=42,∑7i =1x i y i =2 794,∑7i =1x 2i =708. 参考公式:b ^=∑ni =1x i y i -nx - y-∑ni =1x 2i -nx-2,a ^=y --b ^x -.解 (1) b ^=∑7i =1x i y i -7x - y-∑7i =1x 2i -7x-2=2 794-7×8×42708-7×82=1.7. ∴a ^=y --vx -=42-1.7×8=28.4,故y 关于x 的线性回归方程是y ^=1.7x +28.4.(2)∵0.75<0.93,∴二次函数回归模型更合适.当x =3时,y ^=33.47.故选择二次函数回归模型更合适,并且用此模型预测A 超市广告费支出3万元时的销售额为33.47万元.B 组(时间:20分钟)11.济南市地铁R 1线预计2019年年底开通运营,地铁时代的到来能否缓解济南的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:则下列结论正确的是( )附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关” B .有95%的把握认为“对能否缓解交通拥堵的认识与性别无关” C .有99%的把握认为“对能否缓解交通拥堵的认识与性别有关” D .有99%的把握认为“对能否缓解交通拥堵的认识与性别无关” 解析 由2×2列联表,可求K 2的观测值, k =(48+30+12+20)(20×48-12×30)2(48+30)(48+12)(12+20)(30+20) ≈5.288>3.841.由统计表P (K 2≥3.841)=0.05,∴有95%的把握认为“能否缓解交通拥堵的认识与性别有关”. 答案 A12.在2018年3月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =________. 解析 x -=9+9.5+m +10.5+115=8+m5,y -=11+n +8+6+55=6+n5.回归直线一定经过样本中心(x -,y -),即6+n5=-3.2⎝⎛⎭⎫8+m 5+40,即3.2m +n =42.又因为m +n =20,即⎩⎨⎧3.2m +n =42,m +n =20,解得⎩⎨⎧m =10,n =10,故n =10.答案 1013.已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高? (2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利润.月份1 2 3 4 利润y (单位:百万元)4466相关公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -nx - y -∑ni =1x 2i -nx-2,a ^=y --b ^x -.解 (1)由折线图可知5月和6月的平均利润最高.(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元), 第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元). 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元), 所以这3年的前7个月的总利润呈上升趋势.(3)∵x -=2.5,y -=5,12+22+32+42=30,1×4+2×4+3×6+4×6=54, ∴b ^=54-4×2.5×530-4×2.52=0.8,∴a ^=5-2.5×0.8=3.因此线性回归方程为y^=0.8x+3.当x=8时,y^=0.8×8+3=9.4.∴估计第3年8月份的利润为9.4百万元.。

2022年教学教材《2021高中数学一轮学案9.4 变量间的相关关系与统计案例》优秀教案

2022年教学教材《2021高中数学一轮学案9.4 变量间的相关关系与统计案例》优秀教案

第四节变量间的相关关系与统计案例知识体系必备知识1回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数1在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关2在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关3如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系2线性回归方程1最小二乘法:使得样本数据点到回归直线的距离的平方和最小的方法叫做最小二乘法2回归方程:两个具有线性相关关系的变量的一组数据:1,1,2,2,…,,其回归方程为=,那么==,=-n,n3独立性检验1利用随机变量K2来判断“两个分类变量有关系〞的方法称为独立性检验2列联表:列出的两个分类变量的频数表,,它们的可能取值分别为{1,2}和{1,2},其样本频数列联表2×2列联表为12总计b ab1 ad cd2 c总计ac bd abcd那么随机变量K2=其中n=abcd为样本容量1易错点:1易无视样本数据与回归直线的关系回归分析中误以为样本数据必在回归直线上,实际上回归直线必过,,可能所有的数据点都不在回归直线上2易无视回归分析的结果为预测值利用回归方程分析问题时,所得的数据误认为是准确值,而实质上是预测值2注意点:易混淆相关关系与函数关系函数关系是一种确定的关系,相关关系是一种非确定的关系;函数关系是一种因果关系,相关关系不一定是因果关系,可能是伴随关系根底小题1给出以下说法:①“名师出高徒〞可以解释为教师的教学水平与学生的水平成正相关关系;②某同学研究卖出的热饮杯数与气温℃之间的关系,得回归方程=,那么气温为2 ℃时,一定可卖出143杯热饮;③只有两个变量有相关关系,所得到的回归模型才有预测价值;④假设事件X,Y关系越密切,那么由观测数据计算得到的K2的观测值越小其中正确的说法有A①③B①④C②③D②④【解析】选A利用回归方程得到的数据只是预测值,不是准确值,所以②错误;事件X,Y 关系越密切,由观测数据计算得到的K2的观测值越大,所以④错误进行统计分析,所得数据如下表:6 8 10 122 3 5 6那么对的线性回归方程为A= B=C= D=相关公式:=,=-【解析】=6×28×310×512×6=158,==9,==4所以==,=×9=故线性回归方程为=有五组变量:①汽车的质量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的质量和每千米耗油量其中两个变量成正相关的是A①③B②④C②⑤D④⑤【解析】选C由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系4为了判断高中三年级学生选修文理科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男13 10女7 2021知PK2≥≈,PK2≥≈根据表中数据,得到K2的观测值=≈那么认为选修文科与性别有关系出错的可能性为__________【解析】K2的观测值≈,这说明小概率事件发生根据假设检验的根本原理,应该断定“选修文理科与性别之间有关系〞成立,并且这种判断出错的可能性约为5%答案:5%。

2.3.变量间的相关关系-人教B版必修三教案

2.3.变量间的相关关系-人教B版必修三教案

2.3 变量间的相关关系-人教B版必修三教案教学目标1.掌握什么是相关系数及其计算方法2.理解两个变量之间的相关程度3.熟悉散点图的绘制方法4.熟练运用Excel进行相关系数的计算教学重难点1.相关系数的计算方法2.散点图的绘制方法及其解读3.Excel进行相关系数计算的方法教学内容及进度安排教学内容时间(分钟)师生互动介绍 5知识点讲解25实践演示:绘制散点图15小组合作:Excel计算相关系数20总结讲评10教学方法1.师生互动式教学法2.演示法3.合作学习法教学过程及内容步骤一:师生互动介绍(5分钟)老师与学生进行互动,引入相关系数的概念,询问学生是否知道相关系数是什么,以及相关系数的意义。

步骤二:知识点讲解(25分钟)老师通过PPT或黑板,向学生讲解相关系数的定义、代号、计算公式和判定标准。

同时,向学生介绍散点图的绘制方法和散点图的解读。

让学生了解相关系数的三种情况:正相关、负相关、不相关,以及这些情况对应的散点图形态。

步骤三:实践演示:绘制散点图(15分钟)老师设计一个简单的数据表格,让学生利用Excel或手工绘制散点图。

通过散点图,学生可以直观地了解相关系数的计算和判定过程,同时熟练掌握散点图的绘制方法和解读。

步骤四:小组合作:Excel计算相关系数(20分钟)学生分成小组,自行利用Excel或手工计算相关系数,并交流讨论结果。

老师在一旁提供指导和帮助,解决学生可能出现的疑惑和问题。

这个环节让学生通过小组合作的方式更深入地理解相关系数和散点图的含义。

步骤五:总结讲评(10分钟)老师通过讲评,对学生进行总结回顾,让学生了解相关系数的重要性和应用。

同时,老师与学生共同探讨相关系数的应用场景和优缺点。

教学评估1.资料:散点图、Excel计算表格2.成果:学生会手工或利用Excel计算相关系数,会绘制散点图并解读其含义3.测评方式:学生在小组内展示绘制的散点图和相关系数计算结果,并给出解释。

变量间的相关关系教案

变量间的相关关系教案

变量间的相关关系优秀教案一、教学目标:1. 让学生理解相关关系的概念,掌握相关系数的定义和计算方法。

2. 培养学生运用相关系数分析实际问题,判断变量间的关系。

3. 引导学生利用图表和数据进行推理和分析,提高学生的数据分析能力。

二、教学内容:1. 相关关系的概念和性质2. 相关系数的定义和计算方法3. 相关系数的大小与变量间关系的强度和方向4. 实际问题中的相关关系分析三、教学重点与难点:1. 重点:相关关系的概念、相关系数的定义和计算方法,相关系数的大小与变量间关系的判断。

2. 难点:相关系数计算公式的理解和应用,实际问题中的相关关系分析。

四、教学方法:1. 采用问题驱动的教学方法,引导学生通过实例认识相关关系。

2. 利用图表和数据进行分析,帮助学生理解相关系数的含义和作用。

3. 结合生活中的实际问题,培养学生运用相关系数分析和解决问题的能力。

五、教学准备:1. 准备相关关系的实例和数据,制作PPT进行展示。

2. 准备相关系数计算器,方便学生进行实践操作。

3. 准备一些实际问题,用于课堂讨论和分析。

六、教学过程:1. 引入:通过一个简单的实例,如身高和体重之间的关系,引导学生思考变量间的关系。

2. 讲解相关关系的概念和性质,解释相关系数的作用。

3. 讲解相关系数的定义和计算方法,引导学生理解相关系数的大小与变量间关系的强度和方向。

4. 进行实际问题分析,让学生运用相关系数判断变量间的关系。

5. 总结本节课的重点内容,布置课后作业。

七、课堂练习:1. 让学生使用相关系数计算器,计算给定数据集的相关系数。

2. 让学生分析实际问题中的相关关系,判断变量间的关系强度和方向。

3. 让学生解释相关系数在实际问题中的应用和意义。

八、课堂讨论:1. 引导学生讨论实际问题中的相关关系,分享彼此的想法和观点。

2. 引导学生从相关系数的角度分析实际问题,提出解决方案。

3. 鼓励学生提出问题,促进课堂互动和思考。

九、课后作业:1. 让学生完成相关关系练习题,巩固所学知识。

变量间的相关关系、统计案例

变量间的相关关系、统计案例

2.独立性检验思想的理解 独立性检验的思想类似于反证法,即要确定“两个变量 X 与 Y 有关 系”这一结论成立的可信度,首先假设结论不成立,即它们之间没有关 系,也就是它们是相互独立的,利用概率的乘法公式可推知, (ad-bc) nad-bc2 接近于零,也就是随机变量 K = 应该很小,如 a+bc+da+cb+d
A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( x , y ) C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg
【名师点评】 求样本数据的线性回归方程的步骤 第一步,计算平均数 x , y ;
2 第二步,求和i∑ x y , ∑ x ; i i =1 i=1 i n n
∑ xi- x yi- y ∑ x y -n x y =1 =1 i i i i ^= 第三步,计算b = n 2 , n 2 2 ∑ xi- x ∑ x -n x i=1 i=1 i ^= y -b ^x; a ^x+a ^. 第四步,写出回归方程^ y=b
2
由于 9.967>6.635, 所以在犯错误的概率不超过 0.01 的前提下认为该 地区的老年人是否需要帮助与性别有关.
• (3)由(2)的结论知,该地区老年人是否需 要帮助与性别有关,并且从样本数据能看 出该地区男性老年人与女性老年人中需要 帮助的比例有明显差异,因此在调查时, 先确定该地区老年人中男、女的比例,再 把老年人分成男、女两层并采用分层抽样 方法,比采用简单随机抽样方法更好.
• 考向二 回归方程的求法及回归分析 • [例2] (2013年淄博模拟)某种产品的宣传 费支出x与销售额y(单位:万元)之间有如 下对应数据:

变量间的相关关系教案

变量间的相关关系教案

变量间的相关关系优秀教案第一章:引言1.1 课程介绍本课程旨在帮助学生理解变量间的相关关系,并学会如何进行相关性分析。

通过本章的学习,学生将能够掌握相关性概念,并了解相关性在实际应用中的重要性。

1.2 变量间的相关关系概念1.2.1 变量概念变量是研究对象的特征或属性,可以用来衡量或描述。

在本课程中,我们将关注两种类型的变量:定量变量和分类变量。

1.2.2 相关关系概念相关关系是指两个变量之间的相互关系或关联程度。

相关关系可以是正相关的,即一个变量增加时,另一个变量也增加;也可以是负相关的,即一个变量增加时,另一个变量减少。

第二章:皮尔逊相关系数2.1 皮尔逊相关系数的概念皮尔逊相关系数是衡量两个定量变量之间线性相关程度的一种统计方法。

它的取值范围在-1到1之间,当相关系数为1时,表示完全正相关;当相关系数为-1时,表示完全负相关;当相关系数为0时,表示没有相关关系。

2.2 计算皮尔逊相关系数2.2.1 数据收集收集两组定量变量的数据,并将其整理成表格形式。

2.2.2 计算步骤(1)计算两组数据的均值;(2)计算两组数据的标准差;(3)计算协方差;(4)计算皮尔逊相关系数。

2.3 应用案例通过实际案例,让学生了解如何使用皮尔逊相关系数进行相关性分析,并解释结果。

第三章:斯皮尔曼等级相关系数3.1 斯皮尔曼等级相关系数的概念斯皮尔曼等级相关系数是衡量两个变量之间单调相关程度的一种非参数方法。

它适用于非正态分布的数据或有序分类变量。

3.2 计算斯皮尔曼等级相关系数3.2.1 数据收集收集两组有序分类变量的数据,并将其整理成表格形式。

3.2.2 计算步骤(1)将数据进行等级排序;(2)计算等级差的积;(3)计算等级差的平均值;(4)计算斯皮尔曼等级相关系数。

3.3 应用案例通过实际案例,让学生了解如何使用斯皮尔曼等级相关系数进行相关性分析,并解释结果。

第四章:肯德尔等级相关系数4.1 肯德尔等级相关系数的概念肯德尔等级相关系数是衡量多于两个变量之间单调相关程度的一种非参数方法。

2022年 《高三数学 第三节 变量间的相关关系、统计案例》优秀教案

2022年 《高三数学 第三节 变量间的相关关系、统计案例》优秀教案

第三节变量间的相关关系、统计案例教学目标知识与技能:1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解以下常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求2×2列联表)的根本思想、方法及其简单应用.(2)了解回归的根本思想、方法及其简单应用.过程与方法:让学生通过实际问题去理解回归分析及独立性检验的根本思想和初步应用.情感态度与价值观:培养学生运用所学知识,解决实际问题的能力。

明确数学在现实生活中的重要作用和实际价值。

[备考方向要明了]一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .3.通过求Q =∑i =1ny i -bx i -a2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法.4.相关系数当r >0时,说明两个变量正相关; 当r <0时,说明两个变量负相关.r 的绝对值越接近于1,说明两个变量的线性相关性越强.r 的绝对值越接近于0时,说明两个变量之间几乎不存在线性相关关系.通常|r |大于时,认为两个变量有很强的线性相关性.三、独立性检验1.2×2列联表:假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:y 1 y 2 合计x 1 a b a +b x 2cdc +d总计 a +c b +d a +b +c +dK 2=n ad -bc 2a +ba +cb +dc +d(其中n =a +b +c +d 为样本容量).2.用K 2的大小可以决定是否拒绝原来的统计假设H 0,假设K 2值较大,就拒绝H 0,即拒绝事件A 与B 无关.3.当K 2≥时,那么有95%的把握说事件A 与B 有关; 当K 2≥时,那么有99%的把握说事件A 与B 有关;当K2≤时,那么认为事件A与B无关.[例1] (1)(2021·新课标全国卷)在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x 1,x2,…,x n不全相等)的散点图中,假设所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,那么这组样本数据的样本相关系数为( D ) A.-1 B.0 D.1(2)(2021·江西高考)变量X与Y相对应的一组数据为(10,1),,2),,3),,4),(13,5);变量U与V相对应的一组数据为(10,5),,4),,3),,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,那么( C )A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1[冲关锦囊]相关关系的判断有两种方法:(1)利用线性相关系数判断.(2)利用散点图.其中,散点图是相关关系的直观判断方法,假设散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,假设呈曲线型也是有相关性,假设呈图形区域且分布较乱那么不具备相关性.[例2] (2021·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y=bx+a,其中b=-20,a=y-b x;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的本钱是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-本钱)[冲关锦囊]1.最小二乘法估计的一般步骤:(1)作出散点图,判断是否线性相关;(2)如果是,那么用公式求a^、b^,写出回归方程;(3)根据方程进行估计.2.回归直线方程恒过点(x,y-).[例3] 甲、乙两个学校高三年级分别有1 100人、1 000人,为了了解两个学校高三年级的学生在该地区二模考试中的数学成绩情况,采用分层抽样的方法从两个学校一共抽取了105名学生的数学成绩,并作出了频数分布统计表,具体情况如下:甲校:乙校(1)计算(2)假设规定考试成绩在[120,150]内为优秀,请分别估计两个学校数学成绩的优秀率;(3)由以上统计数据填写下面2×2列联表,并判断是否有%的把握认为两个学校的数学成绩有差异.附:k 0K2=n ad-bc2a+b c+d a+c b+d[冲关锦囊]1.独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K2=n ad-bc2a+b a+d a+c b+d计算K2的值;(3)查表比拟K2与临界值的大小关系,作统计判断.2.在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.板书设计教学反思课题例1,3 例2 作业知识要点〔课堂练习〕。

变量间的相关关系与统计案例教案.docx

变量间的相关关系与统计案例教案.docx

变量间的相关关系与统计案例适用学科数学适用年级高二适用区域全国课时时长(分钟)60知识点1相关关系的分类2线性相关3.回归方程4、线性回归模型教学目标1、理解相关关系、正相关、负相关、散点图;2、理清相关关系和散点图之间的关系.教学重点理解相关关系、正相关、负相关、散点图;教学难点熟练应用相关关系、正相关、负相关、散点图解题教学过程_•课程导入:引入新课:在学校里老师对学生经常这样说:〃如果你的数学成绩好,那么你的物理学习就不会有什么大问题.〃按照这种说法, 似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?二.复习预习复习已学统计的知识:1、简单随机抽样2、系统抽样3、分层抽样4、用样本估计总体预习并思考什么是相关关系、正相关、负相关?三、知识讲解考点1.相关关系的判断利用散点图判断两个变量是否有相关关系是比较简便的方法・在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系・即变量之间具有函数关系•如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.考点厶独立性检验独立性检验的步骤: ⑴根据样本数据制成2x2列联表;2 n(ad-bc) (a + b)(a + c)(b + d)(c + d) ⑶比较冷与临界值的大小关系作统计推断・⑵根据公式/计算考点久线性回归方程在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.3.例题精析!1!【例题1]【题干】下面哪些变量是相关关系(A.出租车车费与行驶的里程C .身高与体重B.房屋面积与房屋价格D.铁块的大小与质量【答案】C【解析】A , B , D都是函数关系,其中A —般是分段函数,只有C是相关关系.【例题2】【题干】对变量X, F有观测数据(X/,拥(/di,2 ,…,10),得散点图⑴;对变量一1/有观测数据(3、16)(/= 1,210),得散点图(2)・由这两个散点图可以判断()•错误!未找到引用源。

2.3变量间的相关关系(教、优秀教案)

2.3变量间的相关关系(教、优秀教案)

2.3变量间地相关关系一、教材分析本节知识内容不多,但分析本节内容,至少有下列特点:1)知识地联系面广,应用性强,概念地真正理解有难度,教学既要承前启后,完成统计必修基础知识地构建;也要知道知识地来龙去脉,提升学生运用统计知识解决实际问题地能力,更要抓住本质,正确理解统计推断地结论.2)通过典型案例进行教学,使知识形成地过程中具有可操作性,易于创设问题情境,引导学生参与,而学生借助解决问题,通过自主思维活动,会产生感悟、发现,能提出问题,思考交流,不仅能正确、全面地理解基础知识和基本方法,而且能促进、发展学生地统计意识、统计思想.二、教学目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系;2.知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.三、教学重点难点重点:作出散点图和根据给出地线性回归方程系数公式建立线性回归方程.难点:对最小二乘法地理解.四、学情分析本节是一种对样本数据地处理方法,但侧重地是由样本推断总体,其方法是学生初识地、知识地作用也是学生初见地.知识量并不大,但涉及地数学方法、数学思想较充分,同时,在教材中留有供发现地点,设有开放性问题,既具有体验数学方法、数学思想地功能,也具有培养学生从具体到抽象能力、锻炼创造性思维能力地作用.五、教学方法1.自主探究,互动学习2.学案导学:见后面地学案.3.新授课教学基本环节:预习检查、总结疑惑→情境导入、展示目标→合作探究、精讲点拨→反思总结、当堂检测→发导学案、布置预习六、课前准备1.学生地学习准备:预习课本,初步把握必须地定义.2.教师地教学准备:多媒体课件制作,课前预习学案,课内探究学案,课后延伸拓展学案.七、课时安排:1课时八、教学过程〖复习回顾〗标准差地公式为:______________________________________________________〖创设情境〗1、函数是研究两个变量之间地依存关系地一种数量形式.对于两个变量,如果当一个变量地取值一定时,另一个变量地取值被惟一确定,则这两个变量之间地关系就是一个函数关系2、在中学校园里,有这样一种说法:“如果你地数学成绩好,那么你地物理学习就不会有什么大问题.”按照这种说法,似乎学生地物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间地关系是函数关系吗?3、“名师出高徒”可以解释为教师地水平越高,学生地水平就越高,那么学生地学业成绩与教师地教学水平之间地关系是函数关系吗?〖新知探究〗思考:考察下列问题中两个变量之间地关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内地脂肪含量与年龄.这些问题中两个变量之间地关系是函数关系吗?一、相关关系:自变量取值一定时,因变量地取值带有一定随机性地两个变量之间地关系,叫做相关关系.【说明】函数关系是一种非常确定地关系,而相关关系是一种非确定性关系.思考探究:1、有关法律规定,香烟盒上必须印上“吸烟有害健康”地警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起地,所以可以吸烟”地说法对吗?2、某地区地环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣地现象,如果村庄附近栖息地天鹅多,那么这个村庄地婴儿出生率也高,天鹅少地地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子.你认为这样地结论可靠吗?如何证明这个问题地可靠性?分析:(1)吸烟只是影响健康地一个因素,对健康地影响还有其他地一些因素,两者之间非函数关系即非因果关系;(2)不对,这也是相关关系而不是函数关系.上面提到了很多相关关系,那它们之间地相关关系强还是弱?我们下面来研究一下.二、散点图探究:在一次对人体脂肪含量和年龄关系地研究中,研究人员获得了一组样本数据:其中各年龄对应地脂肪数据是这个年龄人群脂肪含量地样本平均数.思考探究:1、对某一个人来说,他地体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定地规律性.观察上表中地数据,大体上看,随着年龄地增加,人体脂肪含量怎样变化?2、为了确定年龄和人体脂肪含量之间地更明确地关系,我们需要对数据进行分析,通过作图可以对两个变量之间地关系有一个直观地印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应地图形吗?表示具有相关关系地 两个变量地一组数据图 形称为散点图.3、观察人地年龄地与人体脂肪含量散点图地大致趋势,有什么样地特点?阅读课本85~86P ,这种相关关系我们称为什么?还有没有其他地相关关系?它又有怎样地特点?三、线性相关、回归直线方程和最小二乘法在各种各样地散点图中,有些散点图中地点是杂乱分布地,有些散点图中地点地分布有一定地规律性,年龄和人体脂肪含量地样本数据地散点图中地点地分布有什么特点? 如果散点图中地点地分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.我们所画地回归直线应该使散点图中地各点在整体上尽可能地与其接近.我们怎么来实现这一目地呢?说一说你地想法.设所求地直线方程为yˆ=bx +a ,其中a 、b 是待定系数. 则yˆi =bx i +a (i =1,2,…,n ).于是得到各个偏差 y i -yˆi =y i -(bx i +a )(i =1,2,…,n ) 显见,偏差y i -yˆi 地符号有正有负,若将它们相加会造成相互抵消,所以它们地和不能代表几个点与相应直线在整体上地接近程度,故采用n 个偏差地平方和Q =(y 1-bx 1-a )2+(y 2-bx 2-a )2+…+(y n -bx n -a )2 表示n 个点与相应直线在整体上地接近程度. 记Q =∑=--ni i ia bx y12)(这样,问题就归结为:当a 、b 取什么值时Q 最小,a 、b 地值由下面地公式给出:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.,)())((1221121x b y a x n x yx n yx x x y y x x b ni i ni iini i ni i i其中x =n1∑=ni i x 1,y =n1∑=ni iy1,a 为回归方程地斜率,b 为截距.求回归直线,使得样本数据地点到它地距离地平方和最小地方法叫最小二乘法. 【例题精析】有一个同学家开了一个小卖部,他为了研究气温对热饮销售地影响,经过统计,得到(2)从散点图中发现气温与热饮杯数之间关系地一般规律; (3)求回归方程;(4)如果某天地气温是2℃,预测这天卖出地热饮杯数. 解:(4)当x=2时,y=143.063(四)反思总结,当堂检测.1、求样本数据地线性回归方程,可按下列步骤进行: (1)计算平均数x ,y ; (2)求a ,b ;(3)写出回归直线方程.2、回归方程被样本数据惟一确定,对同一个总体,不同地样本数据对应不同地回归直线,所以回归直线也具有随机性..3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具线性相关关系,即不存在回归直线,那么所得地“回归方程”是没有实际意义地.因此,对一组样本数据,应先作散点图,在具有线性相关关系地前提下再求回归方程教师组织学生反思总结本节课地主要内容,并进行当堂检测.设计意图:引导学生构建知识网络并对所学内容进行简单地反馈纠正.(课堂实录) (五)发导学案、布置预习.完成本节地课后练习及课后延伸拓展作业.设计意图:布置下节课地预习作业,并对本节课巩固提高.教师课后及时批阅本节地延伸拓展训练.九、板书设计本课地设计采用了课前下发预习学案,学生预习本节内容,找出自己迷惑地地方.课堂上师生主要解决重点、难点、疑点、考点、探究点以及学生学习过程中易忘、易混点等,最后进行当堂检测,课后进行延伸拓展,以达到提高课堂效率地目地.本节课学习了变量间地相互关系和两个变量地线性相关,以及最小二乘法和回归直线地定义,体会了用最小二乘法解决两个变量线性相关地方法,在解决问题中要熟练掌握求回归系数b、a 地公式,精确计算.同时,要注意培养学生地观察分析两变量地关系和抽象概括地能力在后面地教学过程中会继续研究本节课,争取设计地更科学,更有利于学生地学习,也希望大家提出宝贵意见,共同完善,共同进步!2.3变量间相关关系课前预习学案一、预习目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系;2.知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.二、预习内容1.举例说明函数关系为什么是确定关系?2.一个人地身高与体重是函数关系吗?3.相关关系地概念:4.什么叫做散点图?5.回归分析,(1)求回归直线方程地思想方法;(2)回归直线方程地求法三、提出疑惑同学们,通过你地自主学习,你还有哪些疑惑,请把它填在下面地表格中课内探究学案一、学习目标1.通过收集现实问题中两个有关联变量地数据作出散点图,并利用散点图直观认识变量间地相关关系.2.经历用不同估算方法描述两个变量线性相关地过程,知道最小二乘法地思想,能根据给出地线性回归方程系数公式建立线性回归方程.二、学习重难点:重点:作出散点图和根据给出地线性回归方程系数公式建立线性回归方程难点:对最小二乘法地理解.三、学习过程思考:考察下列问题中两个变量之间地关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内地脂肪含量与年龄.这些问题中两个变量之间地关系是函数关系吗?(一)、相关关系:自变量取值一定时,因变量地取值带有一定随机性地两个变量之间地关系,叫做相关关系.【说明】函数关系是一种非常确定地关系,而相关关系是一种非确定性关系.思考探究:1、有关法律规定,香烟盒上必须印上“吸烟有害健康”地警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起地,所以可以吸烟”地说法对吗?2、某地区地环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣地现象,如果村庄附近栖息地天鹅多,那么这个村庄地婴儿出生率也高,天鹅少地地方婴儿出生率低,于是他得出了一个结论:天鹅能够带来孩子.你认为这样地结论可靠吗?如何证明这个问题地可靠性?(二)、散点图探究:在一次对人体脂肪含量和年龄关系地研究中,研究人员获得了一组样本数据:其中各年龄对应地脂肪数据是这个年龄人群脂肪含量地样本平均数.思考探究:1、对某一个人来说,他地体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定地规律性.观察上表中地数据,大体上看,随着年龄地增加,人体脂肪含量怎样变化?2、为了确定年龄和人体脂肪含量之间地更明确地关系,我们需要对数据进行分析,通过作图可以对两个变量之间地关系有一个直观地印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应地图形吗?3、观察人地年龄地与人体脂肪含量散点图地大致趋势,有什么样地特点?阅读课本P,这种相关关系我们称为什么?还有没有其他地相关关系?它又有怎样地特点?85~86(三)、线性相关、回归直线方程和最小二乘法在各种各样地散点图中,有些散点图中地点是杂乱分布地,有些散点图中地点地分布有一定地规律性,年龄和人体脂肪含量地样本数据地散点图中地点地分布有什么特点?如果散点图中地点地分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.我们所画地回归直线应该使散点图中地各点在整体上尽可能地与其接近.我们怎么来实现这一目地呢?说一说你地想法.这样,问题就归结为:当a、b取什么值时Q最小,a、b地值由下面地公式给出:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.,)())((1221121x b y a x n x yx n yx x x y y x x b ni i ni iini i ni i i其中x =n1∑=ni i x 1,y =n1∑=ni iy1,a 为回归方程地斜率,b 为截距.求回归直线,使得样本数据地点到它地距离地平方和最小地方法叫最小二乘法. 【例题精析】(1)将上表中地数据制成散点图.(2)你能从散点图中发现温度与饮料杯数近似成什么关系吗?(3)如果近似成线性关系地话,请求出回归直线方程来近似地表示这种线性关系. (4)如果某天地气温是-5℃时,预测这天小卖部卖出热茶地杯数.(四)反思总结1、求样本数据地线性回归方程,可按下列步骤进行: (1)计算平均数x ,y ; (2)求a ,b ;(3)写出回归直线方程.2、回归方程被样本数据惟一确定,对同一个总体,不同地样本数据对应不同地回归直线,所以回归直线也具有随机性..3、对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得地“回归方程”是没有实际意义地.因此,对一组样本数据,应先作散点图,在具有线性相关关系地前提下再求回归方程.(五)当堂检测1.有关线性回归地说法,不正确地是 A.相关关系地两个变量不是因果关系 B.散点图能直观地反映数据地相关程度C.回归直线最能代表线性相关地两个变量之间地关系D.任一组数据都有回归方程2.下面哪些变量是相关关系A.出租车费与行驶地里程B.房屋面积与房屋价格C.身高与体重D.铁地大小与质量3.回归方程yˆ=1.5x-15,则A.y=1.5x-15B.15是回归系数aC.1.5是回归系数aD.x=10时,y=04.r是相关系数,则结论正确地个数为①r∈[-1,-0.75]时,两变量负相关很强②r∈[0.75,1]时,两变量正相关很强③r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般④r=0.1时,两变量相关很弱A.1B.2C.3D.45.线性回归方程yˆ=bx+a过定点________.(1)画出散点图;(2)求回归方程.参考答案:1. 答案:D 解析:只有线性相关地数据才有回归直线.2.答案:C 解析:A 、B 、D 都是函数关系,其中A 一般是分段函数,只有C 是相关关系.3.答案:A 解析:D 中x =10时yˆ=0,而非y =0,系数a 、b 地意义要分清. 4.答案:D 解析:相关系数r 地性质.5.答案:(x ,y )解析:yˆ=bx +a ,y ˆ=bx +y -b x ,(y ˆ-y )=b (x -x )课后练习与提高1.下列两个变量之间地关系不具有线性关系地是( ) A.小麦产量与施肥值 B.球地体积与表面积C.蛋鸭产蛋个数与饲养天数D.甘蔗地含糖量与生长期地日照天数2.下列变量之间是函数关系地是( ) A.已知二次函数2y ax bx c =++,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数地判别式:24b ac ∆=-B.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食亩产量3.下面现象间地关系属于线性相关关系地是( ) A.圆地周长和它地半径之间地关系B.价格不变条件下,商品销售额与销售量之间地关系C.家庭收入愈多,其消费支出也有增长地趋势D.正方形面积和它地边长之间地关系4.下列关系中是函数关系地是( )A.球地半径长度和体积地关系B.农作物收获和施肥量地关系C.商品销售额和利润地关系D.产品产量与单位成品成本地关系5.设有一个回归方程为ˆ2 1.5yx =-,则变量x 增加一个单位时( ) A.y 平均增加1.5单位 B.y 平均增加2单位C.y 平均减少1.5单位D.y 平均减少2单位6.工人月工资(x 元)与劳动生产率(x 千元)变化地回归直线方程为ˆ5080yx =+,下列判断不正确地是( ) A .劳动生产率为1000元时,工资约为130元B.劳动生产率提高1000元时,则工资平均提高80元C.劳动生产率提高1000元时,则工资平均提高130元D.当月工资为210元时,劳动生产率约为2000元7.某城市近10年居民地年收入x 与支出y 之间地关系大致符合0.80.1y x =+(单位:亿元),预计今年该城市居民年收入为15亿元,则年支出估计是.8、在某种产品表面进行腐蚀线试验,得到腐蚀深度y 与腐蚀时间x 之间对应地一组数据:(1)画出散点图;(2)试求腐蚀深度y 对时间t 地回归直线方程.版权申明本文部分内容,包括文字、图片、以及设计等在网上搜集整理.版权为个人所有This article includes some parts, including text, pictures, and design. Copyright is personal ownership.用户可将本文地内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律地规定,不得侵犯本网站及相关权利人地合法权利.除此以外,将本文任何内容或服务用于其他用途时,须征得本人及相关权利人地书面许可,并支付报酬.Users may use the contents or services of this article for personal study, research or appreciation, and othernon-commercial or non-profit purposes, but at the same time, they shall abide by the provisions of copyright law and otherrelevant laws, and shall not infringe upon the legitimate rights of this website and its relevant obligees. In addition, when any content or service of this article is used for other purposes, written permission and remuneration shall be obtained from the person concerned and the relevant obligee.转载或引用本文内容必须是以新闻性或资料性公共免费信息为使用目地地合理、善意引用,不得对本文内容原意进行曲解、修改,并自负版权等法律责任.Reproduction or quotation of the content of this article must be reasonable and good-faith citation for the use of news or informative public free information. It shall not misinterpret or modify the original intention of the content of this article, and shall bear legal liability such as copyright.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3节变量间的相关关系与统计案例【最新考纲】 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用.【高考会这样考】考查回归分析、独立性检验的基本思想和简单应用.要点梳理1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^__,则b^=∑ni=1(x i-x-)(y i-y-)∑ni=1(x i-x-)2=∑ni=1x i y i-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.其中,b^是回归方程的斜率,a^是在y轴上的截距.回归直线一定过样本点的中心(x-,y-).3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(x-,y-)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.(4)相关指数:R2=1-∑ni=1(y i-y^i)2∑ni=1(y i-y-)2.其中∑ni=1(y i-y^i)2是残差平方和,其值越小,则R2越大(接近1),模型的拟合效果越好.4.独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为则随机变量K2=n(ad-bc)(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d为样本容量. [友情提示]1.求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点(x-,y-).2.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.3.根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.基础自测1.思考辨析(在括号内打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)通过回归直线方程y^=b^x+a^可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.()答案(1)√(2)√(3)×(4)√2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如表:x 681012y 235 6则y对x的线性回归直线方程为()A.y^=2.3x-0.7B.y^=2.3x+0.7C.y^=0.7x-2.3D.y^=0.7x+2.3解析易求x-=9,y-=4,样本点中心(9,4)代入验证,满足y^=0.7x-2.3.答案 C3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25解析在两个变量y与x的回归模型中,它们的相关指数R2越近于1,模拟效果越好,在四个选项中A的相关指数最大,所以拟合效果最好的是模型1.答案 A4.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,D不正确.答案 D5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案5%题型分类深度解析考点一相关关系的判断考点一相关关系的判断【例1】(1)已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:m 106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析(1)由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关. (2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性.答案(1)C(2)D规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.2.利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.3.线性回归直线方程中:b^>0时,正相关;b^<0时,负相关.【变式练习1】(1)某公司在2018年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:月份1月份2月份3月份4月份5月份6月份收入x 12.314.515.017.019.820.6支出y 5.63 5.75 5.82 5.89 6.11 6.18根据统计资料,则()A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.①x ,y 是负相关关系;②在该相关关系中,若用y =c 1e c 2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程.解析 (1)从统计图表中看出,月收入的中位数是12(15+17)=16,收入增加,则支出也增加,x 与y 正线性相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =c 1e c 2x 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误. 答案 (1)C (2)①②考点二 线性回归方程及应用【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x -y -w -∑8i =1(x i -x -)2∑8i =1(w i -w -)2∑8i =1(x i -x -)·(y i -y -) ∑8i =1(w i -w -)·(y i -y -) 46.6 5636.8289.81.61 469108.8表中w i =x i ,w -=18∑i =1w i . (1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:β^=∑ni=1(u i-u-)(v i-v-)∑n i=1(u i-u-)2,α^=v--β^u-.解(1)由散点图可以判断,y=c+d x适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程,由于d^=∑8i=1(w i-w-)·(y i-y-)∑8i=1(w i-w-)2=108.81.6=68,c^=y--d^w-=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.规律方法 1.(1)正确理解计算b^,a^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y^=b^x+a^必过样本点中心(x-,y-).2.(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.(2)本例中y与x不具有线性相关,先作变换,转化为y与w具有线性相关,求出y关于w的线性回归方程,然后进一步求解.【变式练习2】某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:表1为了研究计算的方便,工作人员将上表的数据进行了处理,t =x -2 012,z =y -5得到下表2:表2(1)求z 关于t 的线性回归方程;(2)通过(1)中的方程,求出y 关于x 的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?(附:对于线性回归方程y ^=b ^x +a ^,其中b ^=∑ni =1x i y i -nx -·y-∑ni =1x 2i -nx-2,a ^=y --b ^x -)解 (1)t -=3,z -=2.2,∑5i =1t i z i =45,∑5i =1t 2i =55, b ^=45-5×3×2.255-5×9=1.2,a ^=z --b ^t -=2.2-3×1.2=-1.4, 所以z ^=1.2t -1.4.(2)将t =x -2 012,z =y -5,代入z ^=1.2t -1.4, 得y -5=1.2(x -2 012)-1.4,即y ^=1.2x -2 410.8. (3)因为y ^=1.2×2 022-2 410.8=15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元. 考点三 独立性检验【例3】 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解 (1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表:箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466K 2的观测值为k =200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高.因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.规律方法 1.在2×2列联表中,如果两个变量没有关系,则应满足ad -bc ≈0.|ad -bc |越小,说明两个变量之间关系越弱;|ad -bc |越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值k ;(3)比较观测值k 与临界值的大小关系,作统计推断.【变式练习3】某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查. 现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.(1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?(2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:K 2=(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)从高一年级学生中随机抽取1人,抽到男生的概率约为105180=712.(2)根据统计数据,可得2×2列联表如下:则K 2的观测值为k =180×(60×45-30×45)2105×75×90×90=367≈5.142 9>5.024,所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.课后练习A组(时间:40分钟)一、选择题1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是()A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”解析依题意K2的观测值为k=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y”有关系.答案 A2.下列说法错误的是()A.回归直线过样本点的中心(x-,y-)B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程y^=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位解析根据相关定义分析知A,B,D正确,C中对分类变量X与Y的随机变量K2的观测值k来说,k越大,判断“X与Y有关系”的把握程度越大,故C错误.答案 C3.已知两个随机变量x,y之间的相关关系如表所示:根据上述数据得到的回归方程为y^=b^x+a^,则大致可以判断()A.a^>0,b^>0B.a^>0,b^<0C.a ^<0,b ^>0D.a ^<0,b ^<0 解析 作出散点图,画出回归直线直观判定b ^>0,a ^<0.答案 C4.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:由K 2=n ((a +b )(c +d )(a +c )(b +d )算得,K 2的观测值为k =110×(40×30-20×20)260×50×60×50≈7.8.附表:参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析 根据独立性检验的定义,由K 2的观测值为k ≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”. 答案 A5.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A .160B .163C .166D .170解析 由已知得x -=22.5,y -=160,∵回归直线方程过样本点中心(x -,y -),且b ^=4,∴160=4×22.5+a ^,解得a ^=70.∴回归直线方程为y ^=4x +70,当x =24时,y ^=166.答案 C 二、填空题6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9.零件数x (个) 10 2030 40 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________. 解析 由x -=30,得y -=0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68. 答案 687.心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)几何题 代数题 总计 男同学 22 8 30 女同学 8 12 20 总计302050根据上述数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过________. 附表:P (K 2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828解析 由列联表计算K 2的观测值k =50(22×12-8×8)230×20×20×30≈5.556>5.024.∴推断犯错误的概率不超过0.025. 答案 0.0258.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y^=b^x+a^中的b^=-2,预测当气温为-4 ℃时,用电量约为________度.解析根据题意知x-=18+13+10+(-1)4=10,y-=24+34+38+644=40.所以a^=40-(-2)×10=60,y^=-2x+60,所以当x=-4时,y=(-2)×(-4)+60=68,所以用电量约为68度.答案68三、解答题9.某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:(1)根据上表,现用分层抽样的方法抽取对产品满意的用户5人,在这5人中任选2人,求被选中的恰好是男、女用户各1人的概率;(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由.注:K2=(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.解(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为550=110.所以在满意产品的用户中应抽取女用户20×110=2(人),男用户30×110=3(人).抽取的5人中,三名男用户记为a,b,c,两名女用户记为r,s,则从这5人中任选2人,共有10种情况:ab,ac,ar,as,bc,br,bs,cr,cs,rs.其中恰好是男、女用户各1人的有6种情况:ar,as,br,bs,cr,cs.故所求的概率为P =610=0.6.(2)由题意,得K 2的观测值为k =80(30×20-20×10)2(30+20)(10+20)(30+10)(20+20) =163≈5.333>5.024. 又P (K 2≥5.024)=0.025.故有97.5%的把握认为“产品用户是否满意与性别有关”.10.某市春节期间7家超市广告费支出x i (万元)和销售额y i (万元)数据如下表:(1)若用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)若用二次函数回归模型拟合y 与x 的关系,可得回归方程:y ^=-0.17x 2+5x +20,经计算,二次函数回归模型和线性回归模型的R 2分别约为0.93和0.75,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出3万元时的销售额.参考数据:x -=8,y -=42,∑7i =1x i y i =2 794,∑7i =1x 2i =708. 参考公式:b ^=∑ni =1x i y i -nx - y-∑ni =1x 2i -nx-2,a ^=y --b ^x -.解 (1) b ^=∑7i =1x i y i -7x - y-∑7i =1x 2i -7x-2=2 794-7×8×42708-7×82=1.7. ∴a ^=y --vx -=42-1.7×8=28.4,故y 关于x 的线性回归方程是y ^=1.7x +28.4.(2)∵0.75<0.93,∴二次函数回归模型更合适.当x =3时,y ^=33.47.故选择二次函数回归模型更合适,并且用此模型预测A 超市广告费支出3万元时的销售额为33.47万元.B 组(时间:20分钟)11.济南市地铁R 1线预计2019年年底开通运营,地铁时代的到来能否缓解济南的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:则下列结论正确的是( )附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关” B .有95%的把握认为“对能否缓解交通拥堵的认识与性别无关” C .有99%的把握认为“对能否缓解交通拥堵的认识与性别有关” D .有99%的把握认为“对能否缓解交通拥堵的认识与性别无关” 解析 由2×2列联表,可求K 2的观测值, k =(48+30+12+20)(20×48-12×30)2(48+30)(48+12)(12+20)(30+20) ≈5.288>3.841.由统计表P (K 2≥3.841)=0.05,∴有95%的把握认为“能否缓解交通拥堵的认识与性别有关”. 答案 A12.在2018年3月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =________. 解析 x -=9+9.5+m +10.5+115=8+m5,y -=11+n +8+6+55=6+n5.回归直线一定经过样本中心(x -,y -),即6+n5=-3.2⎝⎛⎭⎫8+m 5+40,即3.2m +n =42.又因为m +n =20,即⎩⎨⎧3.2m +n =42,m +n =20,解得⎩⎨⎧m =10,n =10,故n =10.答案 1013.已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高? (2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利润.月份1 2 3 4 利润y (单位:百万元)4466相关公式:b ^=∑ni =1(x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i -nx - y -∑ni =1x 2i -nx-2,a ^=y --b ^x -.解 (1)由折线图可知5月和6月的平均利润最高.(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元), 第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元). 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元), 所以这3年的前7个月的总利润呈上升趋势.(3)∵x -=2.5,y -=5,12+22+32+42=30,1×4+2×4+3×6+4×6=54, ∴b ^=54-4×2.5×530-4×2.52=0.8,∴a ^=5-2.5×0.8=3.因此线性回归方程为y^=0.8x+3.当x=8时,y^=0.8×8+3=9.4.∴估计第3年8月份的利润为9.4百万元.。

相关文档
最新文档