北师大版选修(1-2)第一章《统计案例》word教案
数学北师大版高中选修1-2第一章 统计案例 §1.1.2相关系数 探究案
探究案学始于疑----我思考,我收获二、合作探究(大约15分钟,包括小组讨论与展示)探究一:相关性检验例1:假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如右上表的统计资料。
用散点图及相关系数两种方法判断y 与x 的相关性(参考数据:5521190,112.3i i i i i xx y ====∑∑)探究二:线性回归分析例2:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据。
(1)试对x 与Y 是否线性相关进行相关性检验; (2)求出线性回归直线方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 x 3 4 5 6 y 2.5 3 4 4.5改前降低多少吨标准煤?【探究小结】.利用散点图可粗略判断两个变量是否具有相关关系,但在作图时,由于存在误差,有时又很难说这些点是不是分布在一条直线附近,此时就必须利用样本相关系数对其进行相关性检验。
【当堂检测】(大约10分钟)1. 变量X 与Y 相对应的一组数据为(10,1)(11.3,2)(11.8,3)(12.5,4)(13,5);变量U 与V 相对应的一组数据为(10,5)(11.3,4)(11.8,3)(12.5,2)(13,1),1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量U 与V 之间的线性相关系数,则( )A.012<<r r B.120r r << C.120r r <<D.12r r = ★★2某商店经营一批进价为每件4元的商品,在市场调查时得到,此商品的销售价格x 与日销售量y 之间的一组数据满足:5522116.57()5()26i i i i X Y X X Y Y ====-=-=∑∑,,,,()51()11i i i X X Y Y =--=-∑ 则x,y 之间的相关系数为 ;当销售价格x 定为(取整数) 时,日利润最大。
数学北师大版高中选修1-2选修1-2第一章 统计案例 §1.1.1回归分析导学案
word 格式整理参考资料 学习帮手 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。
2. 了解回归分析的意义。
3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。
【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。
一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。
2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。
北师大选修(1-2)第一章《统计案例》word教案
选修1-2 第一章 统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)假设检验:了解假设检验的基本思想、方法及其简单应用. (3)聚类分析:了解聚类分析的基本思想、方法及其简单应用. (4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。
其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。
考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。
本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。
但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。
如卡方检验中,若26.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。
第一讲 回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。
2.线性回是模型y bx a e =++(e 为 ),因变量y 的值是自变量x 和随机误差e 共同确定的,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为 ,因变量y 称为 。
3.模型中的参数a 和b 用 估计,其计算公式如下:121()()ˆ()niii nii x x y y bx x ==--=-∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,1nii y y ==∑(,)x y称为,回归直线一定经过样本中心点。
高中数学 复习课(一)统计案例教案(含解析)北师大版选修1-2-北师大版高二选修1-2数学教案
复习课(一) 统计案例回归分析(1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现.(2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题.[考点精要]1.一个重要方程对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =bx +a .其中b =∑i =1nx i -xy i -y∑i =1nx i -x2,a =y -b x .2.重要参数相关系数r 是用来刻画回归模型的回归效果的,其绝对值越大,模型的拟合效果越好. 3.两种重要图形[典例] (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.9610.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x =116∑i =116x i =9.97,s =116∑i =116x i -x 2=116⎝⎛⎭⎪⎪⎫∑i =116x 2i -16x2≈0.212,∑i =116i -8.52≈18.439,∑i =116(x i -x )(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2,0.008≈0.09.[解] (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数为r =∑i =116x i -xi -8.5∑i =116x i -x2∑i =116i -8.52=-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02,所以这条生产线当天生产的零件尺寸的均值的估计值为10.02,∑i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 所以这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.[类题通法]求线性回归方程的基本步骤[注意] 对非线性回归问题应利用变量代换,把问题化为线性回归分析问题,使之得到解决.[题组训练]1.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的回归系数为b ,回归截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反解析:选A 正相关时,b >0,r >0;负相关时,b <0,r <0.2.为研究某种图书每册的成本费y (元)与印刷数x (千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.x y u∑i =18(x i -x )2∑i =18(x i -x )(y i -y )∑i =18(u i -u )2∑i =18(u i -u )(y i -y )15.253.630.269 2 085.5-230.30.7877.049表中u i =1x i ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +dx哪一个更适宜作为每册成本费y (元)与印刷数x (千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01);(3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)(附:对于一组数据(ω1,v 1),(ω2,v 2),…,(ωn ,v n ),其回归直线v =a +βω的斜率和截距的最小二乘估计分别为β=∑i =1nωi -ωv i -v∑i =1nωi -ω2,α=v -βω)解:(1)由散点图判断,y =c +d x适宜作为每册成本费y (元)与印刷册数x (千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d =∑i =18u i -uy i -y∑i =18u i -u2=7.0490.787≈8.957≈8.96, ∴c =y -d ·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y =1.22+8.96u , 从而y 关于x 的回归方程为y =1.22+8.96x.(3)假设印刷x 千册,依题意:10x -⎝ ⎛⎭⎪⎫1.22+8.96x ·x ≥78.840.即8.78x ≥87.8,解得x ≥10,∴至少印刷10千册才能使销售利润不低于78 840元.独立性检验(1)为容易题,多与概率、统计等内容综合命题.(2)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系” 成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥6.635)≈0.01来评价该假设不合理的程度,由实际计算出的k>6.635,说明该假设不合理的程度约为99%,即“两个分类变量有关系” 这一结论成立的可信程度约为99%.[考点精要]独立性判断的方法(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.[典例] (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)附:P (χ2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828,χ2=n ad -bc 2a +bc +d a +cb +d.[解] (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466根据表中数据及χ2的计算公式得, χ2=200×62×66-34×382100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[类题通法]独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性.(2)χ2统计量法:通过公式χ2=n ad -bc 2a +bc +d a +cb +d先计算χ2,再与临界值表作比较,最后得出结论.[题组训练]1.如果有99%的把握认为变量A 和B 有关系,那么χ2( ) A .χ2≥3.841 B .χ2<3.841 C .χ2≥6.635D .χ2<6.635解析:选C 将χ2的值与临界值比较,可知若有99%的把握认为变量A 和B 有关系,则χ2≥6.635.故选C.2.下表是某地区的一种传染病与饮用水的调查表:得病 不得病 总计 干净水 52 466 518 不干净水 94 218 312 总计146684830(1)能否有99%的把握认为这种传染病与饮用水的卫生程度有关,请说明理由. (2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析能否有95%的把握认为这种疾病与饮用水有关.解:(1)把表中的数据代入公式得 χ2=830×52×218-466×942146×684×518×312≈54.21.∵54.21>6.635,所以有99%的把握认为该地区这种传染病与饮用水不干净有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×5×22-50×9214×72×55×31≈5.785.因为5.785>3.841,所以有95%的把握认为该种疾病与饮用水不干净有关.1.为了研究气温对某种饮料销售的影响,经过统计,得到一个卖出饮料数与当天气温的对比表:摄氏温度 -1 3 8 13 17 饮料瓶数3405273122( ) A .140 B .190 C .210D .240解析:选B 依题意得x =15×(-1+3+8+13+17)=8,y =15×(3+40+52+73+122)=58,则回归直线必经过点(8,58),于是有a =58-6×8=10.当x =30时,y =6×30+10=190,故选B.2.下列说法中正确的有:( ) ①若r >0,则x 增大时,y 也相应增大; ②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.A .①②B .②③C .①③D .①②③解析:选C 若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确.r <0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故③正确.3.有下列数据:A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:选A 分别把x =1,2,3,代入求值,求最接近y 的值.即为模拟效果最好,故选A.4.某产品的广告费用x 与销售额y 的统计数据如下表:6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元解析:选B x =4+2+3+54=3.5,y =49+26+39+544=42,∵数据的样本中心点(3.5,42)在线性回归直线上,回归方程y =bx +a =9.4x +a ,∴42=a +9.4×3.5,∴a =9.1,∴线性回归方程是y =9.4x +9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5(万元).5.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为该栏目优秀B .有99%的人认为该栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有理由认为电视栏目是否优秀与改革有关系解析:选 D 只有χ2>6.635时才能有99%的把握认为电视栏目是否优秀与改革有关系.而即使χ2>6.635也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,故选D.6.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )优、良、中差总计实验班48250对比班381250总计8614100A.有关B.无关C.关系不明确D.以上都不正确解析:选A 随机变量χ2=100×48×12-38×2250×50×86×14≈8.306>6.635,则有99%的把握认为“实验效果与教学措施有关”.7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程y=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189 现发现表中有一个数据看不清,请你推断出该数据的值为________.解析:由表格知x=30,得y=0.67×30+54.9=75.设表中的“模糊数字”为a.则a+62+75+81+89=75×5,所以a=68.答案:688.某学校对课程《人与自然》的选修情况进行了统计,得到如下数据:选未选总计男40545450女230220450总计635265900那么,认为选修《人与自然》与性别有关的把握是______.解析:χ2=n ad-bc2a+b c+d a+c b+d=163.794>6.635,即有99%的把握认为选修《人与自然》与性别有关.答案:99%9.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则r 1,r 2的大小关系为________.解析:对于变量X 与Y 而言,Y 随X 的增大而增大,故变量Y 与X 正相关,即r 1>0;对于变量U 与V 而言,V 随U 的增大而减小,故变量V 与U 负相关,即r 2<0.故r 2<0<r 1.答案:r 2<r 110.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?总成绩情况数学成绩情况总成绩好 总成绩不好总计 数学成绩好 478 12 490 数学成绩不好399 24 423 总计87736913解:根据题意,χ2=913×478×24-399×122490×423×877×36≈6.233>3.841,因此有95%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.11.某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:积极参加 班级工作 不太主动 参加班级工作总计 学习积极性高 18学习积极性一般19总计50(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是25,请完成上面的2×2列联表.(2)在(1)的条件下,试运用独立性检验的思想方法分析:能否有99%的把握认为学生的学习积极性与对待班级工作的态度有关?并说明理由.P (χ2≥k )0.010 0.005 0.001 k6.6357.87910.828解:(1)如果随机抽查这个班的一名学生,抽到积极参加班级工作的学生的概率是1225,所以积极参加班级工作的学生有24人,由此可以算出学习积极性一般且积极参加班级工作的人数为6,不太主动参加班级工作的人数为26,学习积极性高但不太主动参加班级工作的人数为7,学习积极性高的人数为25,学习积极性一般的人数为25,得到:积极参加 班级工作 不太主动 参加班级工作总计 学习积极性高 18 7 25 学习积极性一般6 19 25 总计 242650(2)χ2=50×18×19-6×7225×25×24×26≈11.538,因为11.538>6.635,所以有99%的把握可以认为学习积极性与对待班级工作的态度有关系.12.如图是我国2012年到2018年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2020年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17y i -y2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2020年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2020年我国生活垃圾无害化处理量将约为1.82亿吨.。
选修1-2统计案例简介(北师大李勇)1
总偏差平方和:偏差平回方归和平方分和解:公式残差平方和:
预报变量的变化 解释变量引起的 残差变量的变化
可以程直度 接由相关指变数化程的度定义理解其程含度义
⑦ 使学生了解残差图的制作及作用。 • 坐标纵轴为残差变量,横轴可以有不同的选择; • 若模型选择的正确,残差图中的点应该分布在以 横轴为心的带形区域; • 对于远离横轴的点,要特别注意。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例. 数学家庞加莱每天都从一家面包店买一块1000g 的面包,
并记录下买回的面包的实际质量。一年后,这位数学家发现,所 记录数据的均值为950g。于是庞加莱推断这家面包店的面包分 量不足。
推断过程:
• 用线性回归模型近似真实模型所引起的误差; • 身高 y 的观测误差。
⑥ 使学生正确理解相关指数的含义,他是度量模型拟 合效果的一种指标。在线性模型中,他代表自变量 刻画预报变量的能力。
在线性模型中,
n
n
n
i1 ( yi y并)2不 要i1 求( yˆi学 生y)2掌 握i1 ( yi yˆi )2
400
500
600
700
800
900
1000
1100
1200
1300
温度平方
散点并不集中在一条直线的附近,因此用线性 回归模型拟合他们的效果不是最好的。
④ 教师在此处可以引导学生体会应用统计方法 解决实际问题需要注意的问题:
对于同样的数据,有不同的统计方法进行分析, 要用最有效的方法分析数据。
现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他 们分别是:
数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析
庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。
2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。
3、情感态度与价值观:(1)进一步树立数形结合的思想。
(2)进一步体会构建模型的作用。
教学重点:散点图的画法,回归直线方程的求解方法。
教学难点:回归直线方程的求解方法。
使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。
2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。
3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。
(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。
假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。
2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。
为了简化表示,我们引进求和符号,记作 。
3、1()n ii x x =-=∑ 。
1()ni i y y =-=∑ 。
4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。
北师大版选修1-2高中数学第1章《统计案例》word章末复习学案
陕西省榆林育才中学高中数学 第1章《统计案例》第一章(无答案)北师大版选修1-2一、选择题1、散点图在回归分析中的作用是 ( )A .查找个体数目B .比较个体数据关系C .探究个体分类D .粗略判断变量是否呈线性关系4、下列说法正确的是 ( )A .任何两个变量都具有相关系B .球的体积与球的半径具有相关关系C .农作物的产量与施肥量是一种确定性关系D .某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的( )A. 预报变量在x 轴上,解释变量在 y 轴上B. 解释变量在x 轴上,预报变量在 y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可以选择两个变量中任意一个变量在 y 轴上6、回归直线y bx a =+必过 ( )A .(0,0)B .(,0)xC .(0,)yD .(,)x y7、三维柱形图中,主、副对角线上两个柱形高度的 相差越大,要推断的论述成立的可能性就越大 ( )A .和B .差C .积D .商8、两个变量 y 与x 的回归模型中,求得回归方程为0.232x y e -=,当预报变量10x = ( )A. 解释变量30y e -=B. 解释变量y 大于30e -C. 解释变量y 小于30e -D. 解释变量y 在30e -左右9、在回归分析中,求得相关指数20.89R =,则( )A. 解释变量解对总效应的贡献是11%B. 解释变量解对总效应的贡献是89%C. 随机误差的贡献是89%C. 随机误差的贡献是0.89%10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )A .若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C .若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D .以上三种说法都不对.11、3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为( )A .回归分析B .独立性检验分析C .残差分析 D. 散点图分析12、在独立性检验时计算的2K 的观测值k =3.99,那么我们有 的把握认为这两个分类变量有关系 ( )A .90%B .95%C .99%D .以上都不对二、填空题13、已知回归直线方程0.50.81y x =-,则25x =时,y 的估计值为 .14、如下表所示:计算2K = . 15、下列关系中: (1)玉米产量与施肥量的关系; (2)等边三角形的边长和周长; (3)电脑的销售量和利润的关系; (4)日光灯的产量和单位生产成本的关系.不是函数关系的是 .16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的2K =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的.(填“有关”“无关”) 三、解答题18、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表 33能以97.5%的把握认为药物有效吗?为什么?。
高中数学第一章统计案例1回归分析教案含解析北师大版选修1_2
1回归分析回归分析1.线性回归方程设样本点为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程为y =a +bx . 则l xx =∑i =1n(x i -x -)2=∑i =1nx 2i -n x 2,l xy =∑i =1n (x i -x -)(y i -y -)=∑i =1nx i y i -n x - y -,l yy =∑i =1n (y i -y -)2=∑i =1ny 2i -n y -2,b =l xy l xx=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -.2.相关系数计算r =l xyl xx l yy=∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2=∑i=1nx iy i -n x y∑i=1nx2i-n x2∑i=1ny2i-n y2性质范围r∈[-1,1]线性相关程度(1)|r|越大,线性相关程度越高;(2)|r|越接近于0,线性相关程度越低;(3)当r>0时,两个变量正相关;(4)当r<0时,两个变量负相关;(5)当r=0时,两个变量线性不相关1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.2.回归直线y=a+bx过点(x,y),其中x=1n∑i=1nx i,y=1n∑i=1ny i.3.相关系数的绝对值越接近于1,相关性越强;相关系数越接近于0,相关性越弱.线性回归方程[例1] )有如下的统计资料:使用年限x/年2345 6维修费用y/万元 2.2 3.8 5.5 6.57.0若y对x(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程;(3)预测使用年限为10年时,维修费用是多少.[思路点拨] 先利用散点图分析设备使用年限与所支出的维修费用是否线性相关,若相关再利用线性回归模型求解.[精解详析] (1)作出散点图如图所示.(2)由表知,x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+75=5,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,∑i =15x 2i =22+32+42+52+62=90, 所以b =∑i =15x i y i -n x y∑i =15x 2i -n x 2=112.3-5×4×590-5×42=1.23, a =y -b x =5-1.23×4=0.08.所以线性回归方程为y =1.23x +0.08.(3)根据(2)中的线性回归方程,可预测使用年限为10年时,维修费用约为y =1.23×10+0.08=12.38万元.[一点通] 求回归直线方程的基本步骤:1.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能为( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.2.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.2543.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据x 681012y 235 6(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.解:(1)散点图如图:(2)∑i=1nx i y i=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑i=1nx2i=62+82+102+122=344.b=158-4×9×4344-4×92=1420=0.7,a=y-b^x=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=9时,y=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.相关系数[例2] 关于两个变量x和y的7组数据如下表所示:x 21232527293235y 711212466115325试判断x与y之间是否有线性相关关系.[思路点拨] 首先求出r的值,再判断相关关系.[精解详析] x-=17×(21+23+25+27+29+32+35)≈27.4,y-=17×(7+11+21+24+66+115+325)≈81.3,∑i=17x2i=212+232+252+272+292+322+352=5 414,∑i=17x i y i=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,∑i=17y2i=72+112+212+242+662+1152+3252=124 393,∴r=∑i=17x i y i-7x-y-∑i=17x2i-7x-2∑i=17y2i-7y-2=18 542-7×27.4×81.35 414-7×27.42×124 393-7×81.32≈0.837 5.由于r≈0.837 5与1比较接近,∴x与y具有线性相关关系.[一点通] 回归分析是定义在具有相关关系的两个变量的基础上的,对于相关关系不明确的两个变量,可先作散点图,由图粗略地分析它们是否具有相关关系,在此基础上,求其回归方程,并作回归分析.4.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2; ③n =17,r =0.499 1;④n =3,r =0.995 0. 则变量y 和x 线性相关程度最高的两组是( ) A .①和② B .①和④ C .②和④D .③和④解析:选B 相关系数r 的绝对值越大,变量x ,y 的线性相关程度越高,故选B. 5.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3解析:选A 观察散点图可知r 1>0,r 3>0,r 2<0,r 4<0,根据散点的分散程度反映出的相关性的强弱,可知r 2<r 4<0<r 3<r 1.6.在研究硝酸钠的可溶性程度时,在不同的温度(单位:℃)下观测它在水中的溶解度,得观测结果如下:温度x 0 10 20 50 70 溶解度y66.776.085.0112.3128.0解:∑5i =1x i =150,∑5i =1y i =468,∑5i =1x 2i =7 900,∑5i =1y 2i =46 445.18, x =30,y =93.6,∑5i =1x i y i =17 035, r =∑5i =1x i y i -5x y∑5i =1x 2i -5x 2∑5i =1y 2i -5y2=17 035-5×30×93.67 900-5×302×46 445.18-5×93.62≈0.999 6.可线性化的回归分析问题[例3] 为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:时间x/天12345 6繁殖个数y 612254995190(1)作出这些数据的散点图;(2)求y与x之间的回归方程.[思路点拨] 作出数据的散点图,选择合适的函数模型转化为线性模型.[精解详析] (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y=c1e c2x图像的周围,于是令z=ln y,则x 12345 6z 1.79 2.48 3.22 3.89 4.55 5.25则有y=e0.69x+1.112.[一点通] 可线性化的回归方程的求解步骤:7.下列数据x,y符合哪一种函数模型( )x 12345678910y 2 2.693 3.38 3.6 3.84 4.08 4.2 4.3x B.y=2e xA.y=2+3。
北师大版高中数学选修1-2课件第一章统计案例2第1课时
(2)甲地为雨天时乙地也为雨天的概率是
P(B|A)=PPA∩AB=00..1220=0.60.
『规律方法』 1.条件概率的判断 题目中出现已知“在……前提下(条件下)”等字眼时,一般为求条件概率.题 目中没有出现上述明显字眼,但事件 B 的发生受事件 A 发生的影响时,也是条件 概率. 2.求条件概率的方法: (1)用公式 P(B|A)=PPAAB; (2)用 P(B|A)=nnAAB.
(1)甲、乙都未击中的概率; (2)敌机被击中的概率. [思路分析] (1)直接利用相互独立事件同时发生的概率公式计算即可;(2)从 正面分析较麻烦,可考虑求其对立事件的概率.
[解析] 记 A=“甲击中”,B=“乙击中”,C=“甲、乙都没有击中”, D=“敌机被击中”.由题意,甲击中与否并不影响乙击中与否,由此可认为 A
P(A)][1-P(B)][1-P(C)]=1-(1-12)(1-13)(1-14)=34. ∴目标被击中的概率为34.
命题方向3 ⇨综合应用
10 张奖券中有 3 张有奖,甲、乙两人从中各抽 1 张,甲先抽、乙 后抽,求:
(1)甲中奖的概率; (2)乙中奖的概率; (3)在甲未中奖的情况下,乙中奖的概率.
P(B|A)
_____________P_P_A∩B_B____________,记为
_____________P_A_∩_B.
• (3)条件概率计算P公A 式
• 当P(B)>0时,P(A|B)=P(A_)·_P(_B)___________;
• 当P(A)>0时,P(B|A)=______________. • 2.独立事件
可以证明:如果事件 A 与 B 相互独立,那么 A 与 B 、 A 与 B、 A 与 B 也都相 互独立.
北师大版选修1-2--第一章-统计案例-本章整合----课件(54张)
=1
=
154 675-20×107×71
232 728-20×1072 × 103 526-20×712
≈0.86.
所以智商与成绩有较强的线性相关关系,
故建立回归模型是有意义的.
20
b=
∑ xi yi -20x y
=1
20
∑ 2 -20
i=1
2
≈0.73,a= − ≈-7.11.
()
=
()
()
()
()
=
()
, 其中
()
为一次试验可能出现
的全部结果数, 是事件所包含的结果数, 为事件与
同时发生时所包含的结果数.
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
应用一个口袋中,有6个红球,4个白球,这些球除颜色差异外,其他
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
专题二 回归分析及相关系数
两个变量之间是否具有线性相关关系,可以通过作散点图或计算
线性相关系数来判断.若两个变量之间存在线性相关关系,可用最
小二乘法求出线性回归方程.设线性回归方程为y=a+bx,
则 b=
∑ xi yi -x
=1
n
∑
i=1
2
2 -
所以P(A|B)=
()
()
=
1
3
3
5
5
= 9.
综合应用
专题一
专题二
专题三
专题四
专题五
专题六
专题五 相互独立事件
1.相互独立事件的判定方法
高中数学选修1-2教案:第一章统计案例的综合性应用(一)
教学方案精美句子1、善思则能“从无字句处读书”。
读沙漠,读出了它坦荡豪放的胸怀;读太阳,读出了它普照万物的无私;读春雨,读出了它润物无声的柔情。
读大海,读出了它气势磅礴的豪情。
读石灰,读出了它粉身碎骨不变色的清白。
2、幸福幸福是“临行密密缝,意恐迟迟归”的牵挂;幸福是“春种一粒粟,秋收千颗子”的收获. 幸福是“采菊东篱下,悠然见南山”的闲适;幸福是“奇闻共欣赏,疑义相与析”的愉悦。
幸福是“随风潜入夜,润物细无声”的奉献;幸福是“夜来风雨声,花落知多少”的恬淡。
幸福是“零落成泥碾作尘,只有香如故”的圣洁。
幸福是“壮志饥餐胡虏肉,笑谈渴饮匈奴血”的豪壮。
幸福是“先天下之忧而忧,后天下之乐而乐”的胸怀。
幸福是“人生自古谁无死,留取丹心照汗青”的气节。
3、大自然的语言丰富多彩:从秋叶的飘零中,我们读出了季节的变换;从归雁的行列中,我读出了集体的力量;从冰雪的消融中,我们读出了春天的脚步;从穿石的滴水中,我们读出了坚持的可贵;从蜂蜜的浓香中,我们读出了勤劳的甜美。
4、成功与失败种子,如果害怕埋没,那它永远不能发芽。
鲜花,如果害怕凋谢,那它永远不能开放。
矿石,如果害怕焚烧(熔炉),那它永远不能成钢(炼成金子)。
蜡烛,如果害怕熄灭(燃烧),那它永远不能发光。
航船,如果害怕风浪,那它永远不能到达彼岸。
5、墙角的花,当你孤芳自赏时,天地便小了。
井底的蛙,当你自我欢唱时,视野便窄了。
笼中的鸟,当你安于供养时,自由便没了。
山中的石!当你背靠群峰时,意志就坚了。
水中的萍!当你随波逐流后,根基就没了。
空中的鸟!当你展翅蓝天中,宇宙就大了。
空中的雁!当你离开队伍时,危险就大了。
地下的煤!你燃烧自己后,贡献就大了6、朋友是什么?朋友是快乐日子里的一把吉它,尽情地为你弹奏生活的愉悦;朋友是忧伤日子里的一股春风,轻轻地为你拂去心中的愁云。
朋友是成功道路上的一位良师,热情的将你引向阳光的地带;朋友是失败苦闷中的一盏明灯,默默地为你驱赶心灵的阴霾。
第一章 统计案例 章末归纳总结 课件(北师大版选修1-2)
(2014·广东省深圳市调研)2013年3月14日,CCTV财经频 道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为 了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实 验室随机抽取了60个样本,得到了相关数据如下表:
混凝土耐久性达标 混凝土耐久性不达标 合计
使用淡化海砂
D.12
第一章 章末归纳总结
[解析] 由题意易知:x =34,y =38,代入回归直线方程得: a=18.
第一章 章末归纳总结
2.已知两个分类变量X与Y,它们的可能取值分别为{x1, x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35, 若“X与Y有关系”的可信程度为90%,则c等于( )
第一章 章末归纳总结
b=-4×-21+42-+222×+2-2+114+ 2 2×19+4×29 =24600=6.5, a= y -b x =3.2. 由上述计算结果,知所求回归直线方程为 y-257=b(x-2 006)+a=6.5(x-2 006)+3.2,即 y=6.5(x -2 006)+260.2.即^y=6.5x-12778.8.① (2)利用直线方程①,可预测 2012 年的粮食需求量为 6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).
分组 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]
合计
频数 10 20 50 20 100
频率
第一章 章末归纳总结
(1)请在上表中补充完成频率分布表(结果保留两位小数), 并在上图中画出频率分布直方图;
第一章 章末归纳总结
(2)若以上述频率作为概率 ,已知标准乒乓球的直径为 40.00 mm,试求这批乒乓球的直径误差不超过0.03 mm的概 率;
高中数学(北师大版)选修1-2精品学案:第一章 统计案例 第1课时 回归分析
第1课时回归分析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(x i,y i)(i=1,2,…,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于0 时,表明两个变量之间越不存在线性相关关系.问题4:线性回归分析的步骤对于一组具有线性相关关系的数据:(x1,y1),(x2,y2),…,(x n,y n).(1) 画散点图:看散点图是否呈条状分布.(2) 求回归直线方程(最小二乘法):b=, =x i,=y i,其中(,)为样本中心点,回归直线方程必经过样本中心点(,),得a=-b ;(3) 得出相关结论:回归直线方程为y=a+bx ,利用回归直线方程进行预测.“一只蝴蝶在巴西扇动翅膀,有可能会在美国的德克萨斯州引起一场龙卷风.”这就是洛伦兹1979年12月在华盛顿的“美国科学促进会”上的一次演讲中提出的“蝴蝶效应”.这次演讲给人们留下了极其深刻的印象.从此以后,所谓“蝴蝶效应”之说就不胫而走,名声远扬.“蝴蝶效应”之所以令人着迷、令人激动、发人深省,不但在于其大胆的想象力和迷人的美学色彩,而且在于其深刻的科学内涵和内在的哲学魅力.1.下列关系不属于相关关系的是( ).A.父母的身高与子女的身高B.人的身高与体重C.居民的收入与消费D.正方体的表面积和体积【解析】相关关系是一种非确定性关系,而D项是确定的关系,为函数关系,故选D.【答案】D2.设两个变量x与y之间具有线性相关关系,相关系数是r,回归方程为y=a+bx,那么必有( ).A.b与r符号相同B.a与r符号相同C.b与r符号相反D.a与r符号相反【解析】因为b与r的分母均为正,且分子相同,所以b与r同号.【答案】A3.某医院用光电比色检验尿汞时,得到尿汞含量x(毫克/升)与消化系数y的一组数据如下表:。
高中数学 第一章 统计案例章末小结教案(含解析)北师大版选修1-2-北师大版高二选修1-2数学教案
第一章 统计案例章末小结一、回归分析1.线性回归分析设样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为 y =a +bx ,其中b =l xy l xx =∑i =1n x i -xy i -y ∑i =1n x i -x 2=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2, a =y -b x .2.相关系数r =l xy l xx l yy =∑i =1nx i -xy i -y ∑i =1n x i -x2∑i =1ny i -y 2=∑i =1n x i y i -n x y∑i =1nx 2i -n x 2∑i =1ny 2i -n y 2. |r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.二、条件概率1.条件概率的计算公式P (B |A )=P AB P A =n AB n A. 2.计算条件概率时,必须搞清楚欲求的条件概率是在哪一个事件发生的条件下的概率,从而选择合适的条件概率公式.三、独立事件1.独立事件的判断方法(1)定义法:对两个事件A ,B ,如果P (AB )=P (A )P (B ),则称A ,B 相互独立.若A ,B相互独立,则A与B,A与B,A与B也相互独立.(2)事件A是否发生对事件B发生的概率无影响.2.相互独立事件同时发生的概率的求法P(AB)=P(A)P(B).3.相互独立事件往往与互斥事件、对立事件在题目中综合考查,要注意正确运用公式.四、独立性检验独立性检验的一般步骤(1)列出2×2列联表;(2)代入公式计算χ2=n ad-bc2a+b c+d a+c b+d;(3)根据χ2的值的大小作出判断.。
高中数学选修1-2教案 第一章统计案例1
宁县五中导学案课题第一章统计案例1 授课时间课型复习二次修改意见课时1 授课人科目数学主备任树峰教学目标知识与技能通过典型案例的探究,了解回归分析的基本思想、方法及初步应用,明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。
过程与方法对章节知识点进行归纳整理,通过典型例题对本节知识的应用,提高学生对本章知识的掌握程度;情感态度价值观培养学生探究意识,合作意识,应用用所学知识解决生活中的实际问题。
教材分析重难点章节知识点进行归纳整理,典型例题的解决思路及变式训练。
教学设想教法引导归纳,三主互位导学法学法归纳训练教具多媒体, 刻度尺课堂设计一、章节知识网络二、归纳专题专题一回归分析问题回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是:其中第三步“选择函数模型去拟合样本点”是该部分知识的难点,限于难度及现阶段学习的需要,在学习时,我们重点把握线性回归模型的思想方法便可.例 1 以下是某地搜集到的新房屋的销售价格y和房屋面积x的数据:房屋面积x(m2) 115 110 80 135 105销售价格y(万元) 248 216 184 292 220(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中画出回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.【思路点拨】画散点图―→求参数值―→写出回归方程―→画出回归直线―→估计销售价格.【规范解答】(1)数据对应的散点图如图所示:(2)x=15∑i=15x i=109,l xx=∑i=15(x i-x)2=1 570,y=232,l xy=∑i=15(x i-x)(y i-y)=3 080.设所求回归直线方程为y^=b^x+a^,则b^=l xyl xx=3 0801 570≈1.962,a^=y-b^x=232-109×3 0801 570≈18.166,故所求线性回归方程为y^=1.962x+18.166.回归直线如图所示.(3)据(2),当x=150 m2时,销售价格的估计值为y^=1.962×150+18.166=312.466(万元).板书设计第一章统计案例章节知识网络专题一回归分析问题例1 分析专题二独立性检验例2 分析教学反思。
北师大版数学选修1-2同步教学课件:第1章统计案例章末复习
12345
解析 答案
3.某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告 费用x与销售利润y的统计数据如下表:
广告费用x(万元)
2
3
5
6
销售利润y(万元)
5
7
9 11
由表中数据,得线性回归方程l:y=bx+a,则下列结论正确的是
A.b<0
√C.直线l过点(4,8)
B.a<0 D.直线l过点(2,5)
第一章 统计案例
章末复习
学习目标
1.会求线性回归方程,并用回归直线进行预报. 2.理解独立性检验的基本思想及实施步骤.
内容索引
知识梳理 题型探究 达标检测
知识梳理
一、线性回归分析
1.线性回归方程
n
n
∑ xi- x yi- y ∑xiyi-n x y
i=1
i=1
n
n
在线性回归方程y=a+bx中,b=
a+bc+da+cb+d
χ2=
.
3.独立性检验 当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A, B是没有关联的. 当χ2>2.706时,有90%的把握判定变量A,B有关联. 当χ2>3.841时,有95%的把握判定变量A,B有关联. 当χ2>6.635时,有99%的把握判定变量A,B有关联.
跟踪训练2 若某种动物由诞生算起活到20岁的概率为0.8,活到25岁的概 率为0.4,现有一只20岁的这种动物,则它能活到25岁的概率是_0_._5__. 解析 设“动物活到20岁”为事件A,“活到25岁”为事件B, 则P(A)=0.8,P(B)=0.4, 由于AB=B,所以P(AB)=P(B)=0.4. 所以 20 岁的动物活到 25 岁的概率为 P(B|A)=PPAAB=PPBA=00..48=0.5.
北师大高中数学选修1-2第一章统计案例全章教案
第一章统计案例教材整体分析回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位。
本章是在《数学3(必修)》的统计知识的基础上,通过对典型案例的讨论,进一步学习线性回归分析模型及其应用,并初步了解独立性检验的基本思想,认识统计思想的应用价值。
一、教学目标学习统计最好通过活动和案例来进行,抛开实际意义的作图和计算是不能帮助学生理解好统计内容的. 因此,应该通过统计活动的过程对典型案例进行探究,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。
1.通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用。
2.通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用。
二、主要内容与设计思路统计是用以“收集数据、整理数据、分析数据、由数据得出结论”的一组概念、法则和方法。
统计学最关心的问题是数据能给我们提供哪些信息。
具体地说,面对一个实际问题时,我们关心如何抽取数据、如何从数据中提取信息、所得结论是否可靠等。
本章的教学内容主要由回归分析(§1)和独立性检验(§2)这两个部分组成,在章末安排有一个统计活动即“学习成绩与视力之间的关系”。
在“回归分析”的内容中,教科书首先通过真实的例子,对用最小二乘法建立变量之间线性回归方程的一般原则和方法进行了复习;接着介绍了刻画变量之间线性相关程度的另一种方法—计算线性相关系数,并通过一个具体例子引导学生进一步体会引入线性相关系数的必要性;最后介绍了可以化成线性回归的非线性回归模型,让学生通过具体的问题进一步了解回归的基本思想和应用。
在“独立性检验”的内容中,教科书首先通过实例介绍了条件概率与独立事件;接着通过对“吸烟与肺癌是否相关”的分析介绍了独立性检验的方法;然后通过引入统计量初步感受独立性检验的基本思想;最后介绍独立性检验的应用解决了一些实际问题。
当然,统计的学习离不开实践。
因此,教科书还设计了一个统计活动:学习成绩与视力之间的关系,希望通过这个统计活动,使学生经历较为系统的数据处理过程,并在此过程中综合运用前面所学的知识和统计方法去解决实际问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选修1-2 第一章 统计案例[课标研读][课标要求]了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)假设检验:了解假设检验的基本思想、方法及其简单应用. (3)聚类分析:了解聚类分析的基本思想、方法及其简单应用. (4)回归分析:了解回归的基本思想、方法及其简单应用.[命题展望]本章所涉及到的知识点均要进行大量的数据计算,而这些计算如果仅仅靠笔算往往是比较困难的,需要借助于计算机或计算器。
其实在新课标中提到“……应鼓励学生使用计算器、计算机等现代技术手段来处理数据……”,而我们目前的高考还不允许使用计算器,所以本章的更看重统计思想。
考虑到本章内容是新增内容,在高考中应该有所体现,但在高考试题中不会出现过于繁琐的计算题,相信会出现一道填空试题或填空题,出现解答题的可能性较小,即使出现,所涉及的计算应该不会很繁琐。
本章的疑点是用这种方法检验可靠吗?实际上这种方法仍然是用样本估计总体,由于抽样的随机性,结果并不唯一,所以用部分推断全体,推断可能正确,也有可能错误。
但我们只要科学合理地去抽样,那么犯错误的可能性就很小了。
如卡方检验中,若26.635χ>,则说明我们犯错误的概率仅为1%,这也是统计方法的魅力所在。
第一讲 回归分析的基本思想及其初步应用[知识梳理][知识盘点]1.相关关系是一种非确定的关系, 是对具有相关关系的两个变量进行统计分析的一种方法。
2.线性回是模型y bx a e =++(e 为 ),因变量y 的值是自变量x 和随机误差e 共同确定的,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为 ,因变量y 称为 。
3.模型中的参数a 和b 用 估计,其计算公式如下:121()()ˆ()niii nii x x y y bx x ==--=-∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,1nii y y ==∑ (,)x y 称为 ,回归直线一定经过样本中心点。
4.用 来描述线性相关关系的强弱。
当0r >时,表明两个变量 ; 当0r <,表示两个变量 ;r 的绝对值越接近于1,表明两个变量的线性相关性越 ;r 的绝对值越接近于0,表明两个变量的线性相关性越 。
通常而言,当r 大于 时,认为两个变量具有很强的线性相关关系。
5.我们也可以用相关指数2R 来刻划回归效果,其计算公式为:22121ˆ()1()niii nii y yRy y ==-=--∑∑,2R 的值越大,说明残差平方和越小,也就是说模型的拟合效果越 。
在线性回归模型中,2R 表示解释变量对预报变量的 ,2R 越接近于1,说明回归效果越好。
[特别提醒]1.对于相关关系的理解应注意:相关关系与函数关系不同,函数关系是一种确定的关系,而相关关系是一种非确定的关系,它包括了两种情况:(1)两个变量中,一个为可控制变量,另一个为随机变量,例如化肥的施肥量与农作物的产量之间的关系就是相关关系,其中施肥量是可控变量,而农作物的产量是随机变量;(2)两个变量均为随机变量。
而函数关系可以看成两个随机变量之间的关系,是一种确定性的关系。
不能把相关关系等同于函数关系。
对于相关性性检验中相关系数的取值范围及其对相关关系的影响需熟记。
2.本章内容为新课程标准中新添加的知识点. 回归分析的侧重点应先求回归直线方程,并进行相应的估计预测,但这类的题数据的处理与计算量可能很大,学习中应谨慎把握. 对于独立新检验问题,应以K²的计算与临界值的比较来判断分类变量的相关与无关为主.3.线性回归分析是统计中额定一个重要内容,随着新课标的实施和新课程高考改革的不断深入,这部分的内容也将回越来越受到重视. 非线性回归问题有时并不给出经验公式,这时候我们可以画出已时数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象比较,挑选一种跟这些点拟合最好成的函数,然后采取适当的置换,把问题化为线性回归问题,使其得到解决。
4.回归直线方程求解需要复杂的运算,随着新课程标准的继续实施和新课程高考改革的不断深入,考查同学们数据处理能力,特别是运用计算器等现代技术工具对进行数据处理的能力,将是改革的方向之一. 有关理论要求同学们理解,但公式也不需要死记硬背.[基础闯关]1.下列说法正确的是( )A .任何两个变量都具有相关关系;B .球的体积与该球的半径具有相关关系;C .农作物的产量与施化肥量之间是一种确定性关系;D .一个学生的数学成绩与物理成绩之间是一种非确定性的关系。
2.在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上(D)可以选择两个变量中任意一个变量在y 轴上3.由一组样本数据1122(,),(,),,(,)n n x y x y x y ,得到回归直线方程ˆybx a =+,那么下面说法不正确的是( )A .直线ˆybx a =+必经过(,)x y ; B .直线ˆybx a =+至少经过1122(,),(,),,(,)n n x y x y x y 中的一个点; C .直线ˆybx a =+的斜率为22i i i x y nx yx nx -⋅-∑∑;D .直线ˆybx a =+的纵截距为.y bx - 4.对四对变量y 和x 进行相关性检验,已知n 是观测值组数,且已知①7,0.9533n r ==;②15,0.3012n r ==;③17,0.4991n r ==;④3,0.9950.n r ==(已知3n =时,0.050.997r =;7n =时,0.050.754r =;0.0515,0.514n r ==;17n =时,0.050.482.r =)则有95%的把握说变量y 与x 具有线性相关关系的是( )A .①和②B .①和③C .②和④D .③和④5.已知一个回归直线方程为ˆ 2.53yx =-,则当变量x 增加一个单位时,变量y 的变化情况是 。
6.同一资料,如果将x 作自变量,y 作为因变量,得到回归系数b ;若将y 作为变量,x 作为因变量,得到回归系数b ';则相关系数r 与,b b '的关系是 。
[典例精析]例1.(2006年广东佛山)19世纪未,德国统计学家恩格尔根据统计资料,对消费结构变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出会下降。
推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占的比例就越大,随着国家的富裕,这个比例呈下降趋势。
恩格尔系数是根据恩格尔定律得出的比例系数,是表示生活水平高低的一个指标,其计算公式为:食物支出金额恩格尔系数=总支出金额。
在我国,判定生活发展阶段的标准是:贫困>60%,温饱50%~60%,小康40%~50%,富裕<40%.根据国家统计局统计显示,随着中国经济的不断增长,城镇居民家庭的恩格尔系数不断下降,居民消费已从温饱型向享受型、发展型转变。
如下表所示:(2)预报2007年的恩格尔系数; (3)求相关指数; (4)作出残差图。
[剖析]由于问题中要求根据年份预报恩格尔系数,因此选取年份为自变量x ,恩格尔系数为因变量y ,作出散点图,并根据散点判断是否,x y 是否具有相关关系,从而利用最小二乘法求出回归直线方程。
[解](1)散点图如下图所示:并由最小二乘法求得线性回归方程为:ˆ0.90181845.9.yx =-+ (2)由线性回归方程可知,2007年的恩格尔系数为:0.901820071845.935.9874.-⨯+=(3)22121ˆ()84.6110.82.468.1()niii nii y yRy y ==-=-=-=-∑∑比较适合,这样的带状区域越窄,说明所选用的模型的拟合精度越高,因归方程的预报精度也越高。
如果残差分布不均匀,应首先确认采集的样本点是否有误,如果有误,就予以纠正,然后再重新利用线性回归模型来拟合数据,如果数据采集没有错误,则需要寻找其它原因。
[变式训练]:1.某地大气中氰化物测定结果如下:(1(2)求出相关指数;(3)作出残差图,并求出残差平方和。
(2) 描述解释变量与预报变量之间的关系,计算残差、相关指数R 2.[剖析]由题间知先作出散点图,判断采用哪种函数模型对样本数据进行拟合,再计算残差与相关指数进行回归分析。
[解](1)散点图如下图:(2)由散点图看出样本点分布在一条指数函数y=2C xeC 的周围,于是令Z=lny,则由计数器算得Z=0.69X 1.112+ 则有0.69x 1.112ˆy=e +2i i=1ˆe∑=2ii i=1ˆ(y y)-∑=3.1643 2i i i=1ˆ(y y )-∑=22i i=1y ny -∑=25553.3 R 2=1-3.164325553.3=0.9999.即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.[警示]从散点图中我们可以看到,样本点分布在某一直线的附近,而不是在一条直线上,所以不能用一次函数来描述它们之间的关系,这时我们把天数与繁殖个数的关系用下面的线性回归模型来表示:y=bx+a+e,其中a,b 为待定的未知参数,e 称为随机误差. 在回归分析中,通过模型由解释变量计算预报变量时,应注意:(1)回归模型只适用于所研究的总体。
(2)回归方程具有时效性。
(3)样本的取值范围影响回归方程的适用范围。
(4)预报值是预报变量可能取值的平均值。
在线性回归模型中,R 2表示解析变量对预报变量的贡献率,R 2越接近1时,表示线性回归的效果越好;R 2越接近0时,线性效果越差. [变式训练]2.某城市理论预测2000年到2005年人口总数与年份的关系如下表所示(1) 画出散点图,试建立y与x之间的回归方程.(2) 据此估计2006年人口总数.(3) 计算相关指数2R 、残差、残差平方和.(1)判断y 与x 是否具有相关关系;(2)如果y 与x 是相关关系,求回归直线方程.[剖析]先利用线性相关系数r 或散点图判断y 与x 是否具有相关性,再利用最小二乘法求回归直线方程。
[解](1)由已知表格中的数据,利用计算器进行计算得710101=∑=i ix,723101=∑=i i y ,71=x ,3.72=y ,51476101=∑=i i i y x ,505201012=∑=i i x ,525411012=∑=i iy.=r ∑∑∑===---101101222210110)(10(10i i i i ii i y y x x yx yx )=)3.721052541)(711050520(103.72715146722⨯-⨯-⨯⨯-≈0.780297由于780297.0≈r ,由0.780297>0.75知,有很大的把握认为x 与y 之间具有线性相关关系. (2) y 与x 具有线性相关关系,设回归直线方程a bx y +=,则22.17110505203.727110514671010210122101≈⨯-⨯⨯-=-⋅-=∑∑==i ii ii x xyx yx b 32.147122.13.72-=⨯-=-=x b y a∴ y 关于x 的回归直线方程为32.1422.1-=x y.[警示]能从散点图直观的判断相关关系,但散点图不明显时,我们就要进行相关性检验,根据相关系数r 进行判断。