高二数学独立性检验与回归分析人教实验版(B)知识精讲.doc
高中选修1-2回归分析和独立性检验知识总结与联系

高中选修1-2回归分析和独立性检验知识总结与联系-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN1122211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑选修1-2第一部分 变量间的相关关系与统计案例【基础知识】一、回归分析1.两个变量的线性相关:判断是否线性相关 ①用散点图(1)正相关:在散点图中,点散布在从左下角到右上角的区域.对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. ②用相关系数r(3)除用散点图外,还可用样本相关系数r 来衡量两个变量x ,y 相关关系的强弱,ni ix y nx yr -•=∑当r >0,表明两个变量正相关,当r <0,表明两个变量负相关,r 的绝对值越接近于1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r |0.75>时,认为这两个变量具有很强的线性相关关系. 2.回归方程:两个变量具有线性相关关系,数据收集如下:可用最小二乘法得到回归方程ˆy bx a =+,其中3.回归分析的基本思想及其初步应用(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报.(2)对n 个样本数据(x 1,y 1)、(x 2,y 2)、…、(xn ,yn ),(,)x y 称为样本点的中心.样本点中心一定落在回归直线上。
4、回归效果的刻画:用相关指数2R来刻画回归的效果,公式是2 2121()1()ni iiniiy yRy y==-=--∑∑2R的值越大,说明残差平方和越小,也就是说模型拟合效果好二.独立性检验的基本思想及其初步应用题型一相关关系的判断【例1】对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()A.r2<r4<0<r3<r1B. r4<r2<0<r 1<r3C. r4<r2<0<r3<r1D. r2<r4<0<r1<r3【变式1】 根据两个变量x ,y 之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).题型二 线性回归方程【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一价格x 9 9.5 10 10.5 11销售量y11 10 8 6 5 y 关于商品的价格x 的线性回归方程为________.(参考公式:b ^= ,a ^=y -b ^x )【变式3】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x /cm 174 176 176 176 178儿子身高y /cm175 175 176 177 177则y 对x 的线性回归方程为( ). A .y =x -1 B .y =x +1C .y =88+12x D .y =176题型三 独立性检验【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线由K 2=n (ad -dc )(a +b )(c +d)(a +c )(b +d ),算得K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A. 有99%以上的把握认为“选择过马路的方式与性别有关”B. 有99%以上的把握认为“选择过马路的方式与性别无关”C. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分附 K 2巩固提高1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系;其中错误的个数是( )A. 0B. 1C. 2D. 32.已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为( ) A. y ^=1.23x +4 B. y ^=1.23x +5 C. y ^=1.23x +0.08 D. y ^=0.08x +1.23 3.从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a =( ) A. 1.30 B. 1.45 C. 1.65 D. 1.804.根据上表可得回归直线方程:y =0.56x +a ,据此模型预报身高为172 cm 的高三男生的体重为( )A. 70.09 kgB. 70.12 kgC. 70.55 kgD. 71.05 kg5.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y ^=0.254x +0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.6.利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A 和B 有关系,则具体计算出的数据应该是( )A .k≥6.635B .k <6.635C .k≥7.879D .k <7.8797.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:非统计专业统计专业男13 10女7 20为了判断主修统计专业是否与性别有关系,根据表中数据得到,k=50(13×20-10×7)220×30×23×27≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.与销售额(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求线性回归方程;(3)试预测广告费支出为百万元时,销售额多大?9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前吨甲产品的生产能耗为吨标准煤,试根据(2)求出的线性回归方程,预测生产吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:)9.某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生60 20 80北方学生10 10 20合计70 30 100(1)甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系学生,其中2名习惯甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、乙两个班(人数均为人,入学数学平均分和优秀率都相同,勤奋程度和自觉性都一样)。
回归分析与独立性检验

建构数学
• 1.计算公式
相关系数
r=
(x
i=1 n i=1
n
i
- x)(yi - y)
n
x y
i1
n
i i
nxy
_ _
(xi - x)2 (yi - y)2
i=1
_ 2 n _ 2 n 2 2 xi n x yi n y i1 i1
y a bx
其中a+bx是确定性函数, 是随机误差
注: 产生的主要原因:
(1)所用确定性函数不恰当; (2)忽略了某些因素的影响; (3)观测误差。
正相关
负相关
散点图只是形象地描述点的分布情况,它的“线性”是否 明显只能通过观察,要想把握其特征,必须进行定量的研究
问题:有时散点图的各点并不集中在一条 直线的附近,仍然可以按照求回归直线方 程的步骤求回归直线,显然这样的回归直 线没有实际意义。在怎样的情况下求得的 回归直线方程才有实际意义? 即建立的线性回归模型是否合理? 如何对一组数据之间的线性相关程 度作出定量分析?
1
1 5.54 5.54 1
2
2 7.52 15.04 4
3
3 10.02 30.06 9
4
4 11.73 46.92 16
5
5 15.69 78.45 25
6
6 16.12 96.72 36
7
7 16.98 118.9 49
8
8 4.50 21.06 13.08 168.5 64 560.1 204
2
K2 即在 H 0 成立的情况下, 大于6.635概率非常小, 近似为0.010 K2 现在的 =56.632的观测值远大于6.635,
回归分析与独立性检验

回归分析与独立性检验知识要点及解析1.函数关系与相关关系的区别?函数关系是一种确定性关系,而相关关系是一种非确定性关系.2.回归公式∑∑∑∑====--=---=ni ini ii ni ini iix n xy x n yx x x y yx x b1221121)())((ˆ x b y a ˆˆ-= a x b yˆˆˆ+= 3.回归分析的步骤?回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.4.回归直线的性质 a x by ˆˆ+= ⑴回归直线 过样本点的中心()y x , 其中解释变量x 的平均数为: ∑==n i i x n x 11 预报变量y 的平均数为: ∑==ni i y n y 11⑵回归直线的斜率的估计值bˆ的意义:解释变量x 每增加一个单位,预报变量y 就增加bˆ个单位. 5.求线性回归方程的五个步骤: ⑴计算y x x y x 、、、2⑵计算∑=ni ii yx 1⑶计算∑=ni ix12⑷代入系数公式求bˆ⑸代入公式计算a ˆ 例题1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的能耗y (吨标准煤)的几组数据:⑴画出散点图;⑵求出线性回归方程a x b yˆˆˆ+= ⑶已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)问求出的线性回归方程预测(估计)生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?a xb yˆˆˆ+=例题2:从某大学中随机选取8名女大学生,其身高和体重数据如表所示:⑴画出散点图;⑵求出根据身高预报体重的回归方程a x b yˆˆˆ+= ⑶根据以上回归方程预测一名身高为172cm 的女大学生的体重.例题3:下表是某厂1~4月份用水量(单位:百吨)的一组数据,由散点图可知:用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程为a x yˆ7.0ˆ+-=, 请你预测该厂5月份的用水量大约为多少百吨?6.线性回归模型y=bx+a+e 中随机误差e 产生的原因?⑴选用的函数模型不恰当引起的误差 ⑵忽略了某些因素的影响 ⑶存在观测误差 7.如何发现数据中的错误?先分别计算出残差a x b y y y e ii i i ˆˆˆˆ--=-=然后选取横坐标为编号或解释变量x 或预报变量y,纵坐标为残差,作出残差图;最后观察:如果样本点的残差较大(落在带状区域外),说明数据的采集有可能错误。
高二数学独立性检验与回归分析人教实验版(B)知识精讲

高二数学独立性检验与回归分析人教实验版(B )【本讲教育信息】一 教学内容:独立性检验与回归分析二 学习目标了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;了解回归的基本思想、方法及其简单应用。
三 考点分析1、一般地,对于两个事件A ,B ,如果有22⨯a b a b +c d c d +a c +b d + a bcd +++22()()()()()n ad bc a b c d a c b d χ-=++++n a b c d =+++()()()()()d b c a d c b a bc ad n ++++-=22χ χy bx a=+11n i i x x n ==∑11ni i y y n ==∑(,)x y 1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅1r ≤r r0.05r r >0.05r r ≤250(1320107) 4.84423272030χ⨯⨯-⨯=≈⨯⨯⨯2 3.841χ≥2χ2P k χ≥()k3.841≥2P k χ≥()k2300(371438535) 4.514χ⨯⨯-⨯=≈2 3.841χ≥2χx y∴=⨯==⨯=x y 101696169610993993.....,∑∑∑======∴101i 2i 101i 2i 101i i i .79.1822y 4.5968x 9.3174y x ,,∴==⎧⎨⎩∴=+b a y x 048175048175...^...,^∴==x y 261583...,∴-=-=--====∑∑∑().().()()..x x y y x x y y i i i i i i 110211021101502553229098,,∴=r 0998.. b a ==606007..,∴y x ^...=+007606x 045055=+=..y ^....=+⨯=00760653037试对与进行一元线性回归分析,并预测当母亲身高为161cm 时女儿的身高为多少 解:由以上分析,先对与作相关性检验 1、作统计假设:与不具有线性相关关系2、由小概率与n-2=8在附表中查得0.050.632r =3、8.158)157160159(101=+⋅⋅⋅++=x , 1.159)156159158(101=+⋅⋅⋅++=y ,6.478.15810)157160159(10222222=⨯-+⋅⋅⋅++=-∑x x i,2.371.1598.15810)156157159160158159(10=⨯⨯-⨯+⋅⋅⋅+⨯+⨯=-∑y x y x i i9.561.15910)156159158(10222222=⨯-+⋅⋅⋅++=-∑y y i ,因此71.09.566.472.37=⨯=r4、0.710.632,r =>即0.05r r >,从而有95%的把握认为与之间具有线性相关关系,因而求回归直线方程是有意义的。
高二数学回归分析与独立性检验

3.1回归分析的基本思想及其初步应用例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx +a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5 ∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -∙-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -b ˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x +0.35. (3)现在生产100吨甲产品用煤 y =0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.3.某企业上半年产品产量与单位成本资料如下:月份 产量(千件)单位成本(元)1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6568(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n =6,∑=61i ix=21,∑=61i iy=426,x =3.5,y =71,∑=612i i x =79,∑=61i ii yx =1 481,bˆ=26126166x x yx yx i i i ii -∙-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y -b ˆx =71+1.82×3.5=77.37. 回归方程为yˆ=a ˆ+b ˆx =77.37-1.82x . (2)因为单位成本平均变动bˆ=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入回归方程: yˆ=77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元.12.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 x i 2 4 5 6 8 y i 30 40 60 50 70 x i y i60160300300560因此,x =525=5, y =5250=50,∑=512i i x =145,∑=512i i y =13 500,∑=51i i iy x=1 380.于是可得:bˆ=25125155x xyx yx i ii ii -∙-∑∑===55514550553801⨯⨯-⨯⨯-=6.5; a ˆ=y -b ˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x +17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.3.2独立性检验的基本思想及其初步应用例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎总计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关?(2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到 χ2=))()()(()(2c d b d c a b a bc ad n ++++- 2分=13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分 (2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A ={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%. 14分12.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效? 解 根据题目所给的数据作出如下的列联表:色盲 不色盲 合计 男 38 442 480 女 6 514 520 合计449561 000根据列联表作出相应的二维条形图:从二维条形图来看,在男人中患色盲的比例为48038,要比女人中患色盲的比例5206大. 其差值为520648038-≈0.068,差值较大. 因而,我们可以认为“患色盲与性别是有关的”. 根据列联表所给的数据可以有a =38,b =442,c =6,d =514,a +b =480,c +d =520, a +c =44,b +d =956,n =1 000, 由2χ=))()()(()(2d b c a d c b a bc ad n ++++-=95644520480)442651438(00012⨯⨯⨯⨯-⨯⨯≈27.1.由27.1>10.828,所以我们有99.9%的把握认为患色盲与性别有关系,这个结论只对所调查的480名男人和520名女人有效.7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (2χ≥3.841)≈0.05,P (2χ≥5.024)≈0.025.根据表中数据,得到2χ=30202723)7102013(502⨯⨯⨯⨯-⨯⨯≈4.844.则认为选修文科与性别有关系出错的可能性为 . 答案 5%。
方法技巧专题25回归分析与独立性检验

方法技巧专题25回归分析与独立性检验回归分析与独立性检验是统计学中常用的两种方法技巧。
本文将从基本概念、执行步骤、解析方法和实际应用等方面详细介绍回归分析与独立性检验。
一、回归分析回归分析是一种用来描述和解释变量之间相互关系的统计方法。
在回归分析中,一个或多个自变量被用来预测或解释一个或多个因变量。
基本概念包括以下几点:1. 自变量(independent variable):研究者控制和操作的变量,用来预测因变量。
2. 因变量(dependent variable):研究者感兴趣的变量,也是我们希望预测或解释的变量。
3. 简单线性回归(simple linear regression):只有一个自变量和一个因变量之间的关系。
4. 多元回归(multiple regression):有两个或两个以上自变量和一个因变量之间的关系。
执行步骤如下:1.收集数据:收集自变量和因变量的数据。
2.绘制散点图:绘制自变量和因变量之间的散点图,观察两个变量之间的关系。
3.拟合回归线:通过回归线拟合数据,找到自变量和因变量之间的最佳关系。
4.计算回归方程:根据回归线的拟合情况,计算出回归方程,用来预测或解释因变量。
常用解析方法有以下几种:1.最小二乘法:通过最小化实际观测值与回归方程预测值之间的误差平方和,来确定回归方程的参数。
2. 相关系数(correlation coefficient):用来衡量自变量和因变量之间的线性相关性强弱,常用Pearson相关系数进行计算。
3.回归方程显著性检验:用来判断回归方程是否显著,即自变量是否对因变量有显著影响。
二、独立性检验独立性检验是用来检验两个或多个分类变量之间是否存在相关性的统计方法。
基本概念包括以下几点:1. 分类变量(categorical variable):变量的取值只能是一些有限的标称级别,而不能用具体的数值表示。
2. 单变量独立性检验(univariate independence test):只包括一个分类变量和一个因变量的关系。
人教版高中数学选修2-3第7讲:独立性检验与回归分析(教师版)

10
女
7
20
已知 P(K 2≥ 3.841) ≈0.05,P(K 2≥ 5.024) ≈0.025.
2
根据表中数据,得到 K2= 50×( 13×20-10×7) ≈ 4.844. 23× 27× 20× 30
则认为选修文科与性别有关系出错的可能性为 ________.
[答案 ] 5% 8.某数学老师身高 176cm,他爷爷、父亲和儿子的身高分别是
, 得 r≈ 0.992704 ,查表可知 r0.05 8(y )2 )
0.707 ,
而 r r0.05, 故 y 与 x 之间存在显著的线性相关关系 .
(3) 作出预报:由上述分析可知,我们可用回归方程
y? 1.0415 x- 0.00386 作为该运动员成绩的预
测值,将 x=47 和 x=55 分别代入该方程得 y? 49 和 y? 57. 故预测该运动员训练 47 次和 55 次成绩
i1 8 2
(xi x)
i1
8
xi yi 8x y
i1
8 2
xi
i=1
2
8( x)
1.0415,
a? y b?x 0.00386,
所以回归直线方程为 y? 1.0415 x 0.00386.
(2) 计算相关系数
将上述数据代入 r
8
( xi2
i =1
8
xi yi 8x y
i1
8
8(x)2)( yi2
i1
n
x )2 ( yi
i=1
,
y)2
即 r=
n
( xi2
i1
n
xi yi nx y
i1
n
n( x )2 )( yi2
高二数学(选修2-3人教B版)-回归分析

672
705
807
909
975 1035 1107 1177 1246
探究一 回归直线方程
为了简化数据,先将年份减去1949,并将所得值用x表 示,对应的人口数用y表示,得到下面的数据表:
x 0 5 10 15 20 25 30 35 40 45 50 y 542 603 672 705 807 909 975 1035 1107 1177 1246
在统计学中,回归分析是一种统计方 法,它是通过分析判断来确定相关变量之 间的内在关系的,也就是寻找相关关系中 的非确定性关系的某种确定性.
复习回顾
4、回归直线方程的一般形式是什么? 设样本点为(x1,y1),(x2,y2),···, (xn,yn),
由最小二乘法求得的线性回归方程为 y a bx.
n
n
(xi - x)( yi - y)
xi yi - nx y
b i1 n
(xi - x)2
i 1 n
xi 2
-
2
nx
,
i 1
i 1
复习回顾
4、回归直线方程的一般形式是什么? 设样本点为(x1,y1),(x2,y2),···, (xn,yn),
由最小二乘法求得的线性回归方程为 y a bx.
反映出的是两变量线性相关关系的强弱不同.
◇[初始化] ◇[网格线] ◇[刻度线] ◇[等单位长] ◇[控制台]
y
6 5
◇[初始化] ◇[网格线] ◇[刻度线] ◇[等单位长] ◇[控制台]
4
3
2
1
x O 123456
y
6
5
4
3 2
1
x O 123456
【高考数学总复习】:回归性分析与独立性检验(知识点讲解+真题演练+详细解答)

量,例如某同学的数学成绩与化学成绩。
2.线性回归分析 (1) 散点图:将样本中的各对数据在直角坐标系中描点而得到的图形叫做散点图,它直观地 描述了两个变量之间是否有相关关系,是判断两个变量相关性的重要依据。 (2) 回归直线:散点图中点的整体分布在一条直线左右,则称这两个变量之间具有线性相关
(a b)(c d)(a c)(b d )
通过对统计量 K2 的研究,一般情况下认为:
①当 K 2 ≤3.841 时,认为变量 X 与 Y 是无关的。
②当 K 2 >3.841 时,有 95%的把握说变量 X 与 Y 有关;
④ 当 K 2 >6.635 时,有 99%的把握说变量 X 与 Y 有关;
定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.分类变量的理解: 分类变量是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变 量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售 业”,说明 X 与 Y 无关的把握越小
6. 右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )
A. K 2 9.564 B. K 2 3.564 C. K 2 2.706 D. K 2 3.841
7. 对两个分类变量 A、B 的下列说法中正确的个数为( ). ①A 与 B 无关,即 A 与 B 互不影响;②A 与 B 关系越密切,则 K2 的值就越大;③K2
x yw
46.6 563 6.8
8
(xi x )2
i 1
(完整版)回归方程和独立性检验知识点讲解

回归分析和独立性检验一、回归分析1、回归直线方程 a x b yˆˆˆ+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=ni ini i ix xy y x xb121)())((ˆ=∑∑==--ni ini ii x n xyx n yx 1221(由最小二乘法得出,考试时给出此公式中的一个)x b y aˆˆ-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。
) 2、几条结论:(1)回归直线过样本的中心点)(y x ,。
(2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。
(3)斜率b 的含义(举例):如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。
(4)相关系数r 表示变量的相关程度。
范围:1≤r ,即 11≤≤-rr 越大.,相关性越强.。
0>r 时,y 与x 正相关;0<r 时,y 与x 负相关。
(5)相关指数2R 表示模型的拟合效果。
范围:]10[2,∈R 2R 越大.,拟合效果越好.,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀, 带状区域宽度越窄,拟合精度越高)。
2R 表示解释变量x 对于预报变量y 变化的贡献率。
例如:64.02≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。
(6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。
(y 是由x 和e 共同确定的。
)二、独立性检验1、原理:假设性检验(类似反证法原理)。
一般情况下:假设分类变量X 和Y 之间没有关系,通过计算2K 值,然后查表对照相应的概率P , 发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P), 也就是“X 和Y 有关系”。
高二数学独立性检验与回归分析人教实验版(B)知识精讲

用心用心 爱心爱心 专心专心高二数学独立性检验与回归分析人教实验版(B )【本讲教育信息】一. 教学内容:教学内容:独立性检验与回归分析独立性检验与回归分析二. 学习目标学习目标了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题:了解独立性检验(只要求2×2×22列联表)的基本思想、方法及其简单应用;了解回归的基本思想、方法及其简单应用。
简单应用。
三. 考点分析考点分析1、一般地,对于两个事件A ,B ,如果有P (AB )=P (A )P (B ),就称事件A 与B 相互独立,简称A 与B 独立。
独立。
2、列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个值,这样的列联表称为22´.3、研究:两个对象Ⅰ和Ⅱ是否有关系。
、研究:两个对象Ⅰ和Ⅱ是否有关系。
Ⅰ有两类取值:类A 和类B ; Ⅱ有两类取值:类1和类2Ⅱ类1类2 合计合计 Ⅰ类A aba b +类B cd c d + 合计合计a c +b d + a bcd +++卡方统计量:22()()()()()n ad bc a b c d a c b d c -=++++ ,其中n a b c d =+++为样本量。
为样本量。
用用卡方统计量研究两随机事件是否有关的问题的方法称为独立性检验。
卡方统计量研究两随机事件是否有关的问题的方法称为独立性检验。
4、独立性检验的解题步骤;、独立性检验的解题步骤; 第一步:提出假设检验问题第一步:提出假设检验问题第二步:选择检验的指标第二步:选择检验的指标 ()()()()()d b c a d c b a b c a d n ++++-=22c第三步:查表得出结论第三步:查表得出结论 P (c 2>k ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83 5、定义: 自变量取值一定时,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。
高二数学独立性检验知识点

高二数学独立性检验知识点独立性检验是高中数学中的重要概念之一,用于判断两个或多个事件是否相互独立。
在数学考试中,独立性检验经常被应用于概率统计等相关题目。
本文将详细介绍高二数学中的独立性检验知识点,帮助同学们更好地理解和应用。
一、独立性的定义和特性在进行独立性检验之前,我们首先需要了解独立性的定义和特性。
在概率统计中,两个事件A和B的独立性表示事件A的发生与事件B的发生是互相独立的,即A的发生不影响B的发生,反之亦然。
独立性的特性包括以下几个方面:1. 互斥性:如果A和B互斥(即A和B不能同时发生),则A和B是相互独立的。
2. 互不影响性:如果A和B是相互独立的,那么A和B的补事件也是相互独立的。
即P(A) = 1 - P(A'),P(B) = 1 - P(B')。
3. 乘法法则:如果A和B是相互独立的,那么P(A∩B) = P(A) × P(B)。
二、独立性检验方法在实际应用中,我们需要通过数据分析或实验来判断两个事件是否独立。
针对不同情况,有不同的独立性检验方法。
1. 经验法:当数据较少或不能进行大样本实验时,我们可以使用经验法来判断独立性。
经验法主要是通过观察、比较和思考来判断两个事件是否独立。
2. 理论法:当数据比较充足并且满足一定的条件时,我们可以使用理论法来进行独立性检验。
理论法主要是基于概率计算和统计推断来判断独立性。
三、常见的独立性检验方法在高二数学中,常见的独立性检验方法包括以下几种:1. 卡方检验:卡方检验是一种针对频数资料的检验方法,用于检验两个事件是否独立。
通过计算观察频数和期望频数之间的差异来判断独立性。
2. 相关系数检验:相关系数检验可以用于判断两个事件之间是否存在线性相关性。
当两个事件呈现出线性相关性时,它们往往是不独立的。
3. 二项分布检验:二项分布检验可以用于判断两个事件的独立性。
当事件满足二项分布的条件时,可以通过计算观察值与理论值之间的差异来判断独立性。
2020-2021学年高二下学期数学人教B版选修1-2第一章1.1独立性检验+说课课件

五.课后反思
我想主要原因还是在于脱离了假设检验的理论知识,而独立性检验作为假设检验的一种特例单独拿出来学习就会感觉缺少许多理论支持.如何能让学生在高中的知识背景下了解独立性检验的思想,我想需要教师自己对于假设检验的思想有一个正确的理解,并且能够结合教材,正确的传达给学生.作为一名青年教师,自己一定要努力提高自己的专业素养,同时研读教材,做一名关注学生思维发展的数学教师.
一.教学内容解析
一.教学内容解析
独立性检验是考察两个变量是否独立的统计学方法,具体做法是:首先对两个变量的关系作假设,然后选取合适的统计量,并根据实测样本计算出该统计量的观测值,最后根据预先设定的显著性水平进行检验,做出接受或拒绝原假设的判断,其本质就是运用假设检验原理的一种特例.在现有的有关独立性检验(大学)教材看,都是先介绍假设检验知识,然后介绍独立性检验,即通过假设检验的原理来理解独立性检验的思想. (2)教学重点:通过典型案例的探究体会独立性检验的思想方法.
三.学生学情分析:
考虑到文科学生的知识储备及课标的要求,本节课尽量用生活中的实际例子去引导学生,让学生感受到卡方统计量构造的必要性及独立性检验思想的重要性。 (2)教学难点:独立性检验的思想。
三.学生学情分析:
小概率事件的发生?
四.教学过程
通过自习课被老师发现说话这种常见现象引题,然后通过分析学生教师的通常表现来实现以下两个目的:1.引起学生兴趣,同时初步了解对于“反证法”的思想。 2.了解小概率事件发生的可能性与否定假设把握程度之间的关系,即为独立性检验结果的概率统计含义的理解做铺垫。
高中课程标准中,要求通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用,课时安排为三课时.在高考中基本以考察操作规则,套用卡方公式进行计算为主,根据以往经验,应用公式对于学生来说较为简单,所以作为本节课的第一课时教学目标设置如下: (1)知识与技能:解两个事件相互独立的含义,通过对典型案例的探究,理清不同的样本,数据不同,比例不同,数据所体现的差异性不同,怎样针对不同样本数据设置统一的评判标准?
新教材人教B版高中数学选择性必修第二册课件-独立性检验

非优秀的学生中,物理、化学也为优秀的人数如下表所示,则我们
能否在犯错误的概率不超过0.001 的前提下认为数学成绩优秀与
物理、化学优秀有关系?
物理优秀
化学优秀
数学优秀
228
225
数学非优秀
143
156
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.
分析首先分别列出数学成绩与物理、化学的2×2列联表,再正确计
探究一
探究二
素养形成
当堂检测
课堂篇探究学习
解:根据题目所给的数据得到如下列联表:
理科
文科
有兴趣
138
73
无兴趣
98
52
总计
236
125
总计 211 150 361
根据列联表中数据由公式计算得随机变量的观测值
χ2=36211×1(×113580××5223-763××19285)2≈1.871×10-4.
代入公式可得χ2≈270.114.
按照上述方法列出数学与化学优秀的2×2列联表如下:
课堂篇探究学习
探究一
探究二
素养形成
当堂检测
课堂篇探究学习
化学优秀
化学非优秀 总计
数学优秀
225
b2
360
数学非优秀 156
d2
880
总计
381
b2+d2
1 240
∴b2=360-225=135,d2=880-156=724,b2+d2=135+724=859.
激趣诱思
知识点拨
课前篇自主预习
2.任意给定一个α(称为显著性水平,通常取为0.05,0.01等),可以找到 满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).χ2是一 个随机变量,其分布能够求出,上面的概率是可以计算的.因此,如果 根据样本数据算出χ2的值后,发现χ2≥k成立,就称在犯错误的概率 不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有 1-α的把握认为A与B有关.若χ2<k成立,就称不能得到前述结论.这一 过程通常称为独立性检验. 3.A与B独立时,也称为A与B无关.当χ2<k成立时,一般不直接说A与B 无关,也就是说,独立性检验通常得到的结果,或者是有1-α的把握认 为A与B有关,或者没有1-α的把握认为A与B有关.
高二数学(选修2-3人教B版)-独立性检验

足跟痛经久不愈,分享方剂“跟痛方”,外洗解烦忧!
跟痛方由海桐皮、桑白皮、大腹皮、陈皮、五加皮、透骨草、威灵仙、制乳香、制没药、红花、白芷、川椒组成。
上药加入水中,煎水熏洗患足,每次30分钟,每天 2次,用一小锤或小木棒,在每次蒸气熏后,以痛点为俞穴,轻轻锤击足跟,锤击的力量以患者感到舒适为宜,水温降低后,再泡洗患足。
本方用海桐皮、桑白皮、陈皮、大腹皮、透骨草、五加皮、白芷袪风除湿,舒筋活络;用制乳香、制没药、红花、川椒活血化瘀通络;局部熏洗可借助温度的升高,使局部皮肤的血管舒张,血流加快,使药物可直接作用于病变的局部。
达到活血化瘀,消肿止痛,降低跟骨的骨内压的目的,击打跟骨有利于使炎性介质及致痛性氢离子的吸收,使疼痛得以缓解。
此方为外洗方,直接作用于患病的局部,通过局部皮肤对药物的吸收,从而达到治病的目的。
有这样一位患者,男,57岁,右足跟部偏后外侧疼痛3个月,行走时加重,休息时疼痛减轻,到多家医院就诊,口服过西药,行过局部封闭治疗,效果欠佳。
检査见右足跟部广泛压痛,尤以右后外侧足跟压痛明显。
X线检査提示:右跟骨骨质增生,后外侧有一小骨刺。
给予跟痛方。
5天后,右足跟疼痛明显减轻,,仅在行走较长时间才觉疼痛,继续用上方熏洗,15天后右足跟无疼痛。
随诊2年无复发。
独立性检验课件高二下学期数学人教B版选择性

跟踪训练3 某学生兴趣小组随机调查了某市100天中每天的空气质 量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级 1(优) 2(良)
3(轻度污染) 4(中度污染)
[0,200] (200,400] (400,600]
2
16
25
5
10
12
6
7
8
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该 组区间的中点值为代表);
解析:将本例2×2列联表中的数据代入可得 |ad-bc|=|43×33-21×27|=852. 相差较大,可在某种程度上认为饮食习惯与年龄有关系.
使用血清 未使用血清
合计
未感冒 258 216 474
感冒 242 284 526
合计 500 500 1 000
α=P(χ2>k) k
0.05 3.841
人次≤400 人次>400 空气质量好 空气质量不好
α=P(χ2≥k) k
0.05 0.01 0.001 3.841 6.635 10.828
教材反思
爱好 不爱好 合计
男
女
40
20
20
30
60
50
合计 60 50 110
答案:C
3.考察棉花种子是否经过处理与是否生病之间的关系,得到下表中的数 据:
得病 不得病 合计
种子处理 32 61 93
种子未处理 101 213 314
合计 133 274 407
根据以上数据可得出( ) A.种子是否经过处理与是否生病有关 B.种子是否经过处理与是否生病无关 C.种子是否经过处理决定是否生病 D.有90%的把握认为种子经过处理与生病有关
4.3.2 独立性检验课件-2024-2025学年高二上学期数学人教B版(2019)选择性必修第二册

男
2
3
5
15
18
12
女
0
5
10
10
7
13
若规定问卷得分不低于70分的市民为“环保关注者”,根据以上数据写出一个 2 × 2列联表.
课中探究
解:根据题中数据可得2 × 2列联表如下.
非“环保关注者”
男
10
“环保关注者” 45
女
15
30
总计
25
75
总计 55 45 100
课中探究
变式 已知下表是一个2 × 2列联表,则表中a,b的值分别为( B )
生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就是否使用
手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下
2 × 2列联表,则下列说法正确的是( )
不用手机 使用手机
总计
成绩优秀 40 5 45
成绩不优秀 10 45 55
总计 50 50 100
(参考公式:χ2 =
立(也称A与B有关),或者说有1 − α 的把握认为A与B有关;若χ2 < k,则说
没有1 − α 的把握认为A与B有关.
备用习题
例1 读书可以使人保持思想活力,让人得到
智慧启发,让人滋养浩然正气.书籍是文化的 重要载体,读书是承继文化的重要方式.某地 区为了解学生课余时间的读书情况,随机抽 取了n名学生进行调查,根据调查得到的学生 日均课余读书时间绘制成如图所示的频率分 布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书 时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于 10分钟的有10人.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高二数学独立性检验与回归分析人教实验版(B )【本讲教育信息】一. 教学内容:独立性检验与回归分析二. 学习目标了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;了解回归的基本思想、方法及其简单应用。
三. 考点分析1、一般地,对于两个事件A ,B ,如果有P (AB )=P (A )P (B ),就称事件A 与B 相互独立,简称A 与B 独立。
2、列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个值,这样的列联表称为22⨯.3、研究:两个对象Ⅰ和Ⅱ是否有关系。
Ⅰ有两类取值:类A 和类B ; Ⅱ有两类取值:类1卡方统计量:2()()()()()n ad bc a b c d a c b d χ-=++++ ,其中n a b c d =+++为样本量。
用卡方统计量研究两随机事件是否有关的问题的方法称为独立性检验。
4、独立性检验的解题步骤; 第一步:提出假设检验问题第二步:选择检验的指标 ()()()()()d b c a d c b a bc ad n ++++-=22χ5、定义: 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。
注;(1)相关关系是一种不确定性关系;(2)对具有相关关系的两个变量进行统计分析的方法叫回归分析。
6、回归直线方程:直线方程 y bxa =+ 叫做回归直线方程,相应的直线叫做回归直线, 其中11n i i x x n ==∑ , 11ni i y y n ==∑,(,)x y 称为样本点的中心7、对两个变量进行的线性分析叫做线性回归分析。
8、对于变量x 与y 随机抽取到的n 对数据,1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,检验统 计量是样本相关系数r 具有以下性质:1r ≤,并且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱。
9、检验的步骤如下:(1)做统计假设:x 与y 不具有线性相关关系。
(2)根据小概率005⋅与n-2在附表中查出r 的一个临界值005r ⋅(3)根据样本相关系数计算公式算出r 的值 (4)统计推断,如果0.05r r >,表明有95%把握认为x 与y 之间具有线性相关关系;如果0.05r r ≤,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的【典型例题】例1、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到2250(1320107) 4.84423272030χ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841χ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为___.分析:题中已算出卡方统计量2χ的值,只要通过卡方临界值表查询即可得到答案.因为 3.841≥,因此有95%的把握认为主修统计专业与性别有关系,故这种判断出错的可能性为5%。
例2、在对人们的休闲方式的一次调查中,共调查了300人,其中女性178人,男性122人。
女性中有143人主要的休闲方式是看电视,另外35人主要的休闲方式是运动;男性中有85人主要的休闲方式是看电视,另外37人主要的休闲方式是运动。
(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系。
分析:先建立一个2×2的列联表,再运用卡方统计量2χ的计算结果与卡方临界值表进行比较.(2)假设“休闲方式与性别无关” 计算22300(371438535) 4.51417822812272χ⨯⨯-⨯=≈⨯⨯⨯因为23.841χ≥,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有95%的把握认为“休闲方式与性别有关” 评注: 独立性检验的基本思想:(1)假设该结论不成立,即假设结论“两个分类变量没有关系”成立; (2)在假设下,计算卡方统计量2χ;(3)根据卡方观测值的大小判断假设的合理程度; (4)得到原结论成立的可信程度.例3、随机调查了某地区10个商店的建筑面积x (千平方米)与年销售额y (百万元)(2)若线性关系存在,那么对于一个拥有一万平方米的商店来说,它的年销售额为多少?∴=⨯==⨯=101696169610993993.....,∑∑∑======∴101i 2i 101i 2i 101i ii .79.1822y 4.5968x 9.3174yx ,,∴==⎧⎨⎩∴=+b a y x 048175048175...^...,∴==x y 10655,^..所以年销售额约为655万元。
(1)画出散点图;(2)检验是否线性相关; (3)求回归方程; (4)若该市政府计划下一步再扩大5千户煤气用户,试预测该市煤气耗量将达到多少?解:(1)x∴-=-=--====∑∑∑().().()()..xx y y x x y y ii i i i i 110211021101502553229098,,∴=r 0998.. 线性相关。
(3) b a ==606007..,, ∴y x ^...=+007606(4)将x 045055=+=..代入可得y ^....=+⨯=00760653037答:煤气耗量将达3037万米3。
例5、为了了解某地母亲身高x 与女儿身高 y 的相关关系,随机测得10对母女的身高如试对x 与y 进行一元线性回归分析,并预测当母亲身高为161cm 时女儿的身高为多少? 解:由以上分析,先对x 与y 作相关性检验 1、作统计假设:x 与y 不具有线性相关关系2、由小概率0.05与n-2=8在附表中查得0.050.632r =3、8.158)157160159(101=+⋅⋅⋅++=x , 1.159)156159158(101=+⋅⋅⋅++=y ,6.478.15810)157160159(10222222=⨯-+⋅⋅⋅++=-∑x x i,2.371.1598.15810)156157159160158159(10=⨯⨯-⨯+⋅⋅⋅+⨯+⨯=-∑y x y x i i9.561.15910)156159158(10222222=⨯-+⋅⋅⋅++=-∑y y i ,因此71.09.566.472.37=⨯=r .4、0.710.632,r =>即0.05r r >,从而有95%的把握认为x 与y 之间具有线性相关关系,因而求回归直线方程是有意义的。
回归系数 37.20.7847.6159.10.78158.835.2ba===-⨯= 因此y 对x 的回归直线方程是 35.20.78y x =+ 当x=161时, 35.20.78161160.78y =+⨯=就是说当母亲身高为161cm 时女儿的身高大致也接近161 cm 。
【模拟试题】一、选择题(本大题共6小题,每小题5分,共30分)1. 独立性检验中,假设0H :变量X 与变量Y 没有关系. 则在0H 成立的情况下,估算概率()01.0635.6k P 2≈≥表示的意义是( )A. 变量X 与变量Y 有关系的概率为1%B. 变量X 与变量Y 有关系的概率为99%C. 变量X 与变量Y 没有关系的概率为99%D. 变量X 与变量Y 没有关系的概率为99.9%2. 在画两个变量的散点图时,下面叙述正确的是( ) A. 预报变量在x 轴上,解释变量在y 轴上 B. 解释变量在x 轴上,预报变量在y 轴上 C. 可以选择两个变量中任意一个变量在x 轴上 D. 可以选择两个变量中任意一个变量在y 轴上3. 年龄(岁)3456789身高(㎝) 94.8 104.2 108.7 117.8 124.3 130.8 139.0 10岁时的身高,则下列的叙述正确的是( ) A. 她儿子10岁时的身高一定是145.83㎝ B. 她儿子10岁时的身高在145.83㎝以上 C. 她儿子10岁时的身高在145.83㎝左右 D. 她儿子10岁时的身高在145.83㎝以下4. 在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型是( )A. 模型1的相关指数R 2为0.98B. 模型2的相关指数R 2为0.80C. 模型3的相关指数R 2为0.50D. 模型4的相关指数R 2为0.25 5. 设有一个直线回归方程为^^2 1.5y x =- ,则变量x 增加一个单位时 ( ) A. y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位6. 某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程562.166.0ˆ+=x y (单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为( )A. 66%B. 72.3%C. 67.3%D. 83%二、填空题(本题共4小题,每小题5分,共20分) 7. x 0 1 2 3 y 1 3 5 7则y 与x 的线性回归方程为y =bx +a 必过点 .8. 某班主任对全班40名学生进行了作业量的调查,数据如下表:据22⨯列联表数据,求得2χ=_______________.9. 有下列关系:(1)名师出高徒;(2)球的体积与该球的半径之间的关系; (3)苹果的产量与气候之间的关系;(4)森林中的同一种树,其断面直径与高度之间的关系; (5)学生与他(她)的学号之间的关系; (6)乌鸦叫,没好兆;其中,具有相关关系的是______________ 10. 已知样本容量为11,计算得36750x 214y 510x111i 2i 111i i 111i i===∑∑∑===,,,yii 21115422=∑=,x yi ii =∑=11113910,则y 对x 的回归方程为____________.三、解答题(本大题共4题,共50分) 11. 在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人。
(1)根据以上数据建立一个2×2的列联表;(2)判断是否在恶劣气候飞行中,男人比女人更容易晕机.x 2 4 5 6 8 y3040605070为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:甲: 6.517.5y x =+,乙: 717y x =+,试比较哪一个模型拟合的效果更好.编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重.14. 某饭馆对人们饮食习惯的一次调查情况,具体数据如下表:为了判断人的饮食习惯是否与年龄有关,根据表中的数据,得到22100(35301025)10.7760554540χ⨯-⨯=≈⨯⨯⨯因为27.879χ>,所以判断人的饮食习惯与年龄有关,那么这种判断正确的可能性为多少?试题答案1. B2. B3. C4. A5. C6. D7. 答案:(1.5,4)简解:1(0123) 1.54x =+++=,()4753141=+++=y ,回归直线必过样本点中心(1.5,4).8. 解:根据22⨯列联表中的数据,可以求得: 2240(101578)0.024317231822χ⨯-⨯=≈⨯⨯⨯9. (1),(3),(4) 10. y x ^..=+5340311. 解:(1)根据题意,列出22⨯列联表如下:(2)提出统计假设,0H :在恶劣气候飞行中男人与女人一样容易晕机则2289(2426318) 3.68955343257χ⨯-⨯==⨯⨯⨯2 2.706χ> ,故我们有90%的把握认为在这次航程中男人比女人更容易晕机. 12. 分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.(答案:()()845.010001551y yy y1R 51i 2i51i 2i i21=-=---=∑∑==, ()()82.010001801y yy y1R 251i i51i 2i i22=-=---=∑∑==,84.5%>82%,所以甲选用的模型拟合效果较好.)13. 解:因为7.879>,因此有99.5%的把握认为饮食习惯与年龄有关系.。