变量间的相关关系、独立性检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节变量间的相关关系、独立性检验
1、相关性
2、最小二乘法
3、回归分析
4、独立性检验
1、有关线性回归的说法,不正确的是()
A.相关关系的两个变量是非确定关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.散点图中的点越集中,两个变量的相关性越强
2、设有一个回归直线方程为^2 1.5
=-,则变量x增加一个单位()
y x
A. y平均增加1.5个单位
B. y平均增加2个单位
C. y平均减少1.5个单位
D. y平均减少2个单位
3、对于事件A和事件B,通过计算得到2K的观测值 4.514
k≈,下列说法正确的是()
A. 在犯错误的概率不超过0.01的前提下认为事件A和事件B有关
B. 在犯错误的概率不超过0.05的前提下认为事件A和事件B有关
C. 在犯错误的概率不超过0.01的前提下认为事件A和事件B无关
D. 在犯错误的概率不超过0.05的前提下认为事件A和事件B无关
4、下列关于线性回归,有以下说法:
①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到的表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归直线方程最能代表观测值,x y之间的线性相关关系;④任何一组观测值都能得到具有代表意义的回归直线方程.
其中正确的说法是_________.
5在一项打鼾与心脏病的调查中,共调查了1671人,经过计算227.63
K ,根据这一数据分析,我们有理由认为打鼾与心脏病是_________的(有关,无关)
1、5个学生的数学和物理成绩如下表:
画出散点图,判断它们是否有相关关系.
2、在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.
3、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
(1)请画出上表数据的散点图;
(2)请根据上述表提供的数据,用最小二乘法求出y关于x的线性回归方程^y bx a
=+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值3 2.543546 4.566.5
⨯+⨯+⨯+⨯=)
4、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时。钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如表所示:
(1)作出散点图,你能从散点图中发现含碳量与冶炼时间的一半规律吗?
(2)求回归方程;
(3)预测当钢水含碳量为160时,应冶炼多少分钟?
5、在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?
6、在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.
(1)根据以上数据建立一个22
⨯列联表;
(2)画出等高条形图;
(3)检验休闲方式是否与性别有关,可靠性有多大.
1、某商店销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()
A.^10200
=+
y x
y x
=-+ B. ^10200
C. ^10200
y x
y x
=-
=-- D. ^10200
2、某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
根据统计资料,居民家庭年平均收入的中位数是_________,家庭年平均收入与年平均支出有_________线性相关关系.
3、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
(1) 估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2) 能否有99%的把握认为该地区的老年人是否需要志愿者提供帮
助与性别有关?
(3) 根据(2)的结论,能否提出更好的调查方法来估计该地区的
老年人中,需要志愿者提供帮助的老年人的比例?说明理由. 附:
22
()()()()()
n ad bc K a b c d a c b d -=++++
4、为了考察两个变量x 和y 之间的线性相关性,甲、乙两同学各自独立地做100次和150次试验,并且利用线性回归方法,求得回归直线分别为1t 和2t ,已知两个人在试验中发现对变量x 的观测值得平均值
都是s ,对变量y 的观测值得平均值都是t ,那么下列说法正确的是() A. 1t 和2t 有交点(,)s t
B .1t 和2t 相交,但交点不是(,)s t C. 1t 和2t 平行 D .1t 和2t 必定重合
5、x 和y 的散点图如图,则下列说法中所有正确命题的序号为_________.
y
①x ,y 是负相关关系;
②在该相关关系中,若用2
1c x y c e =拟合时的相关指数为21R ,用y bx a
=+拟合时的相关指数为22R ,则2212R R >; ③x ,y 之间不能建立回归直线方程.
6、某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设0H :“这种血清不能起到预防感冒的作用”,利用22⨯列联表计算得2 3.918K ≈,经查对临界值表知2( 3.841)0.05P K ≥≈.
p :有95%的把握认为“这种血清能起到预防感冒的作用”
; :q 若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
r :这种血清预防感冒的有效率为95%;