统计案例练习习题(答案已做)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
欢迎阅读
③线性回归方程: y bx a (最小二乘法)
n
x i y i nxy
i1
b n
x i 2 nx 2
i1
a y bx
注意:线性回归直线经过定点 (x,y ) 。
2. 相关系数(判定两个变量线性相关性): r
n
(x i x)(y i y)
i1 nn
(x i x)2 (y i y) 2 i 1 i 1
注: ⑴r >0时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;
2)|r | 越接近于 1,两个变量的线性相关性越强; |r| 接近于 0时,两个变量之间几乎
不存在线性相关关系。 3.回归分析中归效果的判定:
n
1)回归平方和:
(y i y )2
i1
n
n (y i y i )
(yi yi)2 相关指数 R 2 1 i n 1
i 1
(y i y i )
i1
注: ① R 2得知越大,说明残差平方和越小,则模型拟合效果越好;
② R 2 越接近于 1,,则回归效果越好。
、选择题
统计案例专题练习(高二文)
、知识点归纳 1.线性回归方程
①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系
4.独立性检验(分类变量关系): 随机变量 K 2 越大,说明两个分类变量,关系越强,反之, 越
弱。
K=
欢迎阅读
1.下列属于相关现象的是()
A.利息与利率B.居民收入与储蓄存款
C.电视机产量与苹果产量D.某种商品的销售额与销售价格
2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()
2 2 2 2
A.K2 3.841 B.K2 3.841 C.K2 6.635 D.K2 6.635 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()
A.0 个B.1 个C.2 个D.3 个
4.当K2 3.841时,认为事件 A 与事件 B ()
A.有95%的把握有关B.有99%的把握有关
C.没有理由说它们有关D.不确定
5.已知回归直线方程y bx a ,其中 a 3且样本点中心为(1,2),则回归直线方程为()
A.y x 3 B.y 2x 3 C.y x 3 D.y x 3 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300 名学生,得到如下列联表:
你认为性别与是否喜欢数学课程之间有关系的把握有()
A.0 B.95% C.99% D.100%
8.在回归直线方程y a bx 中,回归系数 b 表示()
A.当x 0时,y的平均值B.x变动一个单位时,y 的实际变动量
C.y 变动一个单位时,x的平均变动量D.x 变动一个单位时,y的平均变动量9.对于回归分析,下列说法错误的是()
A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的
C.回归分析中,如果r 2 1,说明x 与y 之间完全相关D.样本相关系数r ( 1,1)
10. 在画两个变量的散点图时,下面哪个叙述是正确的()
(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x 轴上,预报变量在y轴上
(C)可以选择两个变量中任意一个变量在x轴上(D)选择两个变量中任意一个变量在y 轴上
11、一位母亲记录了儿子3~9 岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10 岁时的身高,则正确的叙述是()
A. 身高一定是145.83cm;
B.身高在145.83cm 以上;
C.身高在145.83cm以下;
D. 身高在145.83cm 左右.
12、两个变量y 与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()
A.模型1的相关指数R2为0.98
B. 模型2的相关指数R2为0.80
C.模型3的相关指数R2为0.50
D. 模型4的相关指数R2为0.25
14、工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为y? 60 90x ,下列判断正确的是()
A.劳动生产率为1000元时,工资为50 元
B. 劳动生产率提高1000元时,工资提高150元
C.劳动生产率提高1000元时,工资提高90 元
D. 劳动生产率为1000元时,工资为90元
15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()
A. 越大
B.越小
C.无法判断
D.以上都不对
16、对分类变量X 与Y 的随机变量K 2的观测值K ,说法正确的是()
A . k 越大," X 与Y 有关系”可信程度越小;
B . k 越小," X 与Y 有关系”可信程度越小;
C . k 越接近于0," X 与Y 无关”程度越小
D . k 越大," X 与Y 无关”程度越大
17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()
A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100 个吸烟的人中必有99人患有肺病;
B. 从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;
C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;
D. 以上三种说法都不正确.
18、设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y 关于x 的回归直线的斜率是b,纵截距是a ,那么必有()
A. b 与r 的符号相同
B. a 与r 的符号相同
C. b 与r 的相反
D. a 与r 的符号相反
则与的线性回归方程为必过()
A.(2,2)点
B. (1.5 ,0)点
C. (1,2)点
D. (1.5 ,4)点
20、已知回归直线的斜率的估计值是1.23 ,样本点的中心为(4 ,5),则回归直线的方程是()