UIC SPSS选修作业答案3
SPSS应用(山东联盟)智慧树知到课后章节答案2023年下临沂大学
SPSS应用(山东联盟)智慧树知到课后章节答案2023年下临沂大学临沂大学绪论单元测试1.学习《SPSS应用》可以有效提高你的统计思维能力。
答案:对第一章测试1.SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。
答案:斯坦福大学2.()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。
答案:sav3.Spss输出结果保存时的文件扩展名是()。
答案:spv4.下列选项不属于数据编辑窗口的功能的有()。
答案:结果输出5.数据编辑窗口中的一行称为一个()。
答案:个案第二章测试1.SPSS中无效的变量名有()。
答案:*home;1@a2.SPSS软件的编辑窗口能打开的文件类型有()。
答案:*.xls3.变量的起名规则一般:变量名的字符个数不多于()。
答案:84.SPSS默认的字符型变量的对齐方式是()。
答案:左对齐5.SPSS的主要变量类型不包括()。
答案:英镑型第三章测试1.关于利用Sort by对数据排序的描述错误的有()。
答案:排序变量最多一个2.在合并变量时,两个数据文件都必须事先按关键变量值()。
答案:升序排序3.通过()可以达到将数据编辑窗口中的计数数据还原为原始数据的目的。
答案:加权处理4.SPSS中进行数据的排序应选择()主窗口菜单。
答案:数据5.SPSS中生成新变量应选择()主窗口菜单。
答案:转换第四章测试1.下列统计量中不属于描述样本数据离散程度的是()。
答案:众数2.在交叉列联表分析中,SPSS提供的相关系数的检验方法不包括()。
答案:S系数3.方差和标准差的换算公式为:方差等于标准差的算术平方根。
答案:错4.下面偏度系数的值表明数据分布形态是正态分布的是()。
答案:5.在高考志愿调查中,问你的报考志愿是哪些大学,可以用()分析。
答案:多选项分析第五章测试1.SPSS作图中,下列不属于条形图的有()。
答案:差异区域图2.在SPSS操作中,绘制()可以很好地呈现出数据的分布特征,是图形分析的基本功。
SPSS16实用教程课后答案
1-1答:SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。
1-2答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(V ariable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。
2-1答:SPSS中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。
2-2答:选择“Transform”菜单的Replace Missing Values命令,弹出Replace Missing Values对话框。
先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“New Variable(s)”框中,这时系统自动产生用于替代缺失值的新变量。
最后选择合适的替代方式即可。
2-3答:选择“Data”菜单中的Weight Cases命令,出现如图2-22所示的Weight Cases对话框。
其中,Do not weight cases项表示不做加权,这可用于取消加权;Weight cases by项表示选择1个变量做加权。
2-4答:变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。
具体操作的过程如下:选择“Transform”菜单中的Automatic Recode命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable -> New Name框中,然后在下面New Name右边的文本框中输入新的变量名称,单击New Name按钮,将新的变量名添加到上面的框中。
高中数学苏教版选修2-3练习:3.2 回归分析2 Word版含答案
回归分析一.选择题:本大题共5小题,每小题5分,共25分.1. 在画两个变量的散点图时,下面叙述正确的是 ( B ) A.预报变量在x 轴上,解释变量在y 轴上 B.解释变量在x 轴上,预报变量在y 轴上 C.可以选择两个变量中任意一个变量在x 轴上 D.可以选择两个变量中任意一个变量在y 轴上2. 一位母亲记录了她儿子3到9岁的身高,数据如下表:由此她建立了身高与年龄的回归模型x y 19.793.73+=,她用这个模型预测儿子10岁时的身高,则下列的叙述正确的是 ( C ) A.她儿子10岁时的身高一定是145.83㎝ B.她儿子10岁时的身高在145.83㎝以上 C.她儿子10岁时的身高在145.83㎝左右 D.她儿子10岁时的身高在145.83㎝以下 3. 在建立两个变量Y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型是 ( A ) A.模型1的相关指数R 2为0.98 B.模型2的相关指数R 2为0.80 C.模型3的相关指数R 2为0.50 D.模型4的相关指数R 2为0.254. 下列说法正确的有 ( B ) ①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A. ①② B. ②③ C. ③④ D. ①③5. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( B )A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R 2二.填空题(本大题共4小题,每小题5分,共20分)6. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题 (1) ; (2) ; (3) ; (4) .7. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比()和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比()和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数 (填充“大于0”或“小于0”)8.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是9.线性回归模型y=bx+a+e中,b=_____________,a=______________e称为_________ .三.解答题:本大题共5小题,共55分.解答应写出文字说明,证明过程或演算步骤.10. (本小题10分) 为了决定在白鼠中血糖的减少量和注射胰岛素A的剂量间的关系,将同样条件下繁殖的7只白鼠注射不同剂量的胰岛素A.所得数据如下:(1)求出y对x的线性回归方程;(2)x与y之间的线性相关关系有无统计意义(可靠性不低于95%)(1)求年推销金额y与工作年限x之间的相关系数;(2)求年推销金额y关于工作年限x的线性回归方程;(3)分别估计工作年限为7年和11年时的年推销金额.12. (本小题11分) 在7块大小及条件相同的试验田上施肥,做肥量对小麦产量影响的试验,(1)画出散点图;(2)对x与y进行线性回归分析,并预测施肥量30时小麦的产量为多少?13. (本小题12分) 适当饮用葡萄酒可以预防心脏病,下表中的信包是19个发达国家一年中平均每人喝葡萄酒摄取酒精的升数z 以及一年中每10万人因心脏病死亡的人数,(1)画出散点图,说明相关关系的方向、形式及强度;(2)求出每10万人中心脏病死亡人数,与平均每人从葡萄酒得到的酒精x(L)之间的线性回归方程.(3)用(2)中求出的方程来预测以下两个国家的心脏病死亡率,其中一个国家的成人每年平均从葡萄酒中摄取1L 的酒精,另一国则是8 L.14. (本小题12分) 在某化学实验中,测得如下表所示的6组数据,其中x(min)表示化学反应进行的时,y(mg)表示未转化物质的量(1)设x 与z 之问具有关系xy cd ,试根据测量数据估计c 和d 的值; (2)估计化学反应进行到10 min 时未转化物质的量.参考答案一、选择题:1. B2. C3. A4. B5. B 二、填空题:6. 【答案】 (1)回归模型只适用于所研究的总体(2)回归方程具有时效性(3)样本的取值范围影响回归方程的适用范围(4)预报值是预报变量可能取值的平均值.7. 【答案】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右;大于0 . 8. 【答案】y ∧=1.23x+0.089. 【答案】b =nii i=1n 2ii=1(xx)(y y)(xx)---∑∑ , a =ˆy bx-,e 称为随机误差 三、解答题:10. 【 解】 (1) 5.814110.54y x ∧=+ (2)由r=0. 9301>0.754.即0.05r r >,故x ,y 之间的线性相关关系有统计意义.11. 【 解】12. 【 解】 (1) 画出散点图如图:(2)根据已知数据表得拓展表如下:由表易得210279530,,399.377x y ====代人线性相关系数公式得770.9733i ix y x yr -=≈∑因此y 与x 有紧密的线性相关关系, 回归系数711722211()()7 4.75()7niii ii i niii i x x y y x y x yb x x xx∧====---==≈--∑∑∑∑所以回归直线方程为:256.8 4.75y x ∧=+当x=50时,256.8 4.7550494.3y ∧=+⨯=也自是说当施化肥量为50时,小麦的产量大致接近494.3. 回归系数=4.75反映出当化肥施加量增加1个单位,小麦的产量将增加4.75,而256.8是不受施化肥量影响的部分 13. 【 解】 (1) 散点图负相关,中等强度,线性或者稍微有些弯曲(2) 260.5622.969y x ∧=-(3)这两个国家的心脏率死亡率分别为每10万人238人和77人 14. 【 解】 (1)在xy cd =的两边取自然对数,可得lny=ln c+xlnd ,设lny=z ,ln c=a, lnd=b ,则z=a+bx ,由已知数据有由公式得a ≈3.905 5,b ≈0. 221 9,线性回归方程为z ∧=3.9055+ 0.221 9x ,即lnc ≈3.905 5,lad ≈0.221 9,故c ≈49.675,d ≈0.801 0,所以c ,d 的估计值分别为 49. 675,0. 801 0. (2)54mg。
高中生物选修三教材答案(适合打印)
高中生物选修三《现代生物科技专题》课后题答案和提示专题一基因工程1.1 DNA重组技术的基本工具(一)思考与探究1.限制酶在DNA的任何部位都能将DNA切开吗?以下是四种不同限制酶切割形成的DNA片段:(1) …CTGCA (2) …AC (3) GC……G …TG CG…(4)…G (5) G… (6) …GC…CTTAA ACGTC……CG(7) GT…(8)AATTC…CA… G…你是否能用DNA连接酶将它们连接起来?答:2和7能连接形成…ACGT……TGCA…;4和8能连接形成…GAATTC……CTTAAG…;3和6能连接形成…GCGC……CGCG…;1和5能连接形成…CTGCAG……GACGTC…。
2.联系你已有的知识,想一想,为什么细菌中限制酶不剪切细菌本身的DNA?提示:迄今为止,基因工程中使用的限制酶绝大部分都是从细菌或霉菌中提取出来的,它们各自可以识别和切断DNA上特定的碱基序列。
细菌中限制酶之所以不切断自身DNA,是因为微生物在长期的进化过程中形成了一套完善的防御机制,对于外源入侵的DNA可以降解掉。
生物在长期演化过程中,含有某种限制酶的细胞,其DNA分子中或者不具备这种限制酶的识别切割序列,或者通过甲基化酶将甲基转移到所识别序列的碱基上,使限制酶不能将其切开。
这样,尽管细菌中含有某种限制酶也不会使自身的DNA被切断,并且可以防止外源DNA的入侵。
3.天然的DNA分子可以直接用做基因工程载体吗?为什么?提示:基因工程中作为载体使用的DNA分子很多都是质粒(plasmid),即独立于细菌拟核处染色体DNA之外的一种可以自我复制、双链闭环的裸露的DNA分子。
是否任何质粒都可以作为基因工程载体使用呢?其实不然,作为基因工程使用的载体必需满足以下条件。
(1)载体DNA必需有一个或多个限制酶的切割位点,以便目的基因可以插入到载体上去。
这些供目的基因插入的限制酶的切点所处的位置,还必须是在质粒本身需要的基因片段之外,这样才不至于因目的基因的插入而失活。
SPSS选修作业完整版
1、现有我国31个省、市、自治区2021年的GDP统计数据,数据中包括“省份〞、“GDP〞、“人口〞三个变量,数据见1.sav,试计算出人均GDP(人均GDP=GDP/人口)作为新变量保存。
解:如下列图:图1:数据1.sav2.数据2.sav显示了2021年我国各个地区制造业的就业人数,利用频数分析对不同地区的就业情况进行分析,显示四分位数、均值、标准差和偏度,绘制频率分布直方图和正态曲线,并判断分布形态。
图2:数据2.sav解:制造业万频率百分比有效百分比累积百分比有效.8 1111111111111111111111111111111 合计31统计量制造业万N有效31缺失0 均值标准差偏度偏度的标准误.421百分位数25 50 75分析:如上图所示,其分布形态为偏左分布,说明大多数地区在制造业就业的人数集中在100万左右,说明我国还有很大一局部地区在制造业行业还是比拟欠缺的,如果加强那么可以在很大一定程度上提高就业率。
3、数据3.sav记录了两个班级学生的数学和语文成绩,利用探索性分析该数据数学和语文成绩的最大值、最小值、众数和平均数,并检验样本数据的正态性。
图3:数据解:描述统计量标准误数学均值均值的 95% 置信区间下限上限5% 修整均值中值方差标准差极小值46极大值99范围53四分位距15偏度.269 峰度.228 .532语文均值均值的 95% 置信区间下限上限5% 修整均值中值方差标准差极小值47极大值99范围52四分位距14偏度.269 峰度.405 .5324、某地区水样中某种元素的含量为72毫克/升,现从某化工厂下游水域中抽取了20个水样,数据见4.sav,对样本数据进行单样本T检验,判断化工厂是否造成了下游水域水质的变化。
图4:数据:解:单个样本统计量N 均值标准差均值的标准误水样中某元素含量20 .647分析:在上图中,P值为0.000<0.05因此拒绝原假设,认为样本均值与总体均值有所不同,即判定化工厂造成了下游水域水质的变化。
(北师大版)苏州市高中数学选修2-3第三章《统计案例》测试(含答案解析)
一、选择题1.下列命题中正确的个数( )①“0x ∀>,2sin x x >”的否定是“00x ∃≤,002sin x x ≤”;②用相关系数r 可以刻画回归的拟合效果,2r 值越小说明模型的拟合效果越好;③命题“若0a b >>,则330a b >>”的逆命题为真命题;④若()22130mx m x m -+++≥的解集为R ,则m 1≥.A .0B .1C .2D .32.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表: 售价x (元/千克) 18 20 22 26 28 30月销售量y (千克)180 168 166 160 150 136由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0 B .1.4C .2D .2.13.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由 列联表算得7.8k ≈参照附表,得到的正确结论是( ).A .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”4.给出下列说法:①用()()221211ˆn i i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个5.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归直线y bx a =+必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079.则其两个变量间有关系的可能性是90%. 其中错误的个数是( ) A .1 B .2 C .3D .46.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0017.某班主任对全班50名学生进行了作业量的调查,数据如下表:( )附:()()()()()22n ad bcKa b c d a c b d-=++++P(K2>k0)0.150.100.050.0250.010.001k0 2.072 2.706 3.841 5.024 6.63510.828A.0.01 B.0.025 C.0.10 D.0.058.若在区间[-5,5]内任取一个实数a,则使直线x+y+a=0与圆(x-1)2+(y+2)2=2有公共点的概率为()A.25B.25C.35D.32109.已知样本789x y、、、、的平均数是8,标准差是2,则xy值为A.8 B.32 C.60 D.8010.为了增强环保意识,某校从男生中随机抽取60人,从女生中随机抽取50人,参加环保知识测试,统计数据如下表所示:(参考数据:()211221221 21212n n n n nn n n nχ++++-=)则认为环保知识测试成绩是否优秀与性别有关的把握为A.90% B.95% C.99% D.99.9%11.已知变量x,y的一组观测数据如表所示:x34567y 4.0 2.5-0.50.5-2.0据此得到的回归方程为y bx a=+,若a =7.9,则x每增加1个单位,y的预测值就()A.增加1.4个单位B.减少1.2个单位C.增加1.2个单位D.减少1.4个单位12.下列说法:①分类变量A与B的随机变量2K越大,说明“A与B有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.14.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如表根据列联表数据,求得K 2≈__________.15.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 16.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.17.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.18.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程x b a yˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .19.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:参考公式: ()()()()()22n ad bc K a b c d a c b d -=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”. 20.下列命题中:①已知点(3,0),(3,0)A B -,动点P 满足||2||PA PB =,则点P 的轨迹是一个圆; ②已知(2,0),(2,0),||||3M N PM PN --=,则动点P 的轨迹是双曲线; ③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1;④在平面直角坐标系内,到点(1,1)和直线23x y +=的距离相等的点的轨迹是抛物线; 正确的命题是_________.三、解答题21.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差);②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.22.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.1000.0500.0100.001k2.7033.8416.63510.82823.为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人;在45名女性驾驶员中,平均车速不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为X,若每次抽取的结果是相互独立的,求X的分布列和数学期望.参考公式与数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++24.受新冠肺炎疫情影响,本学期同学们在家上网课时间达三个多月,电脑屏幕代替了黑板,对同学们的视力造成了很大的损伤.某学校为了了解同学们现阶段的视力情况,对全校高三1000名学生的视力情况进行了调查,从中随机抽取了100名学生的体检表,绘制了频率分布直方图如图:(1)求a的值,并估计这1000名学生视力的中位数(精确到0.01);(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前50名与后50名的学生进行了调查,得到如下数据:前50名后50名近视4232不近视818根据表中数据,能否有95%把握认为视力与学习成绩有关?(3)若报考某高校某专业的资格为:视力不低于5.0,以该样本数据来估计全市高三学生的视力,现从全市视力在4.8以上的同学中随机抽取4名同学,这4名同学中有资格报该校该专业的人数为X,求X的分布列及数学期望.()2≥0.100.050.0250.0100.005P K kk 2.706 3.841 5.024 6.6357.87925.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A的研发费用x(百万元)和销量y(万盒)的统计数据如下:研发费用x(百万236101314元)销量y(万盒)112 2.54 4.5(1)根据上表中的数据,建立y关于x的线性回归方程y bx a=+(用分数表示);(2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211n niii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.26.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(Ⅰ)求a 的值;(Ⅱ)记A 表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A 的概率;(Ⅲ)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请在答题卡上将22⨯列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】写出全称命题的否定判断①;由相关指数的大小与拟合效果的关系判断②;由不等式的性质判断③;由22(1)30mx m x m -+++的解集为R 求得m 的范围判断④. 【详解】解:对于①,“0x ∀>,2sin x x >”的否定是“00x ∃>,002sin x x ”,故①错误;对于②,用相关指数r 可以刻画回归的拟合效果,2r 值越大说明模型的拟合效果越好,故②错误;对于③,命题“若0a b >>0>>”的逆命题为“0>,则0a b >>”,是真命题,故③正确;对于④,当0m =时,22(1)30mx m x m -+++化为230x -+,解得32x,不合题意; 当0m ≠时,要使22(1)30mx m x m -+++的解集为R ,则24(1)4(3)0m m m m >⎧⎨+-+⎩,解得1m .∴若22(1)30mx m x m -+++的解集为R ,则1m .故④为真命题. ∴正确命题的个数是2个.故选:C . 【点睛】本题考查命题的真假判断与应用,考查命题的真假判断与命题的否定,训练了一元二次不等式的解法,属于中档题.2.B解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+, 把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.3.A解析:A 【解析】 【分析】由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】由独立性检验的结论,观测值7.8k ≈,结合临界值表:7.8 6.635>,据此可给出结论:在犯错误的概率不超过0.01的前提下认为“爱好该项运动与性别有关”. 本题选择A 选项. 【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.4.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.5.C解析:C 【解析】对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;对于②,一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均减小5个单位,故不正确;对于③,线性回归直线ˆˆˆy bx a =+必过样本中心点(),x y ,故正确;对于④,曲线上的点与该点的坐标之间具有一一对应关系,故不正确;对于⑤,有一个2×2列联表中,由计算得213.079K =,则其两个变量间有关系的可能性是99.9%,故不正确. 故选C.6.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.B解析:B 【解析】 K 2=≈5.059>5.024,因为P(K 2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.选B8.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴1222a-+≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.9.C解析:C 【解析】由22222789821[(78)(88)(98)(8)(8)]25x yx y ++++⎧=⎪⎨⎪-+-+-+-+-=⎪⎩得=60xy ,故选C.10.C解析:C 【解析】由题意得:()221104030202060505060χ⨯-⨯=≈⨯⨯⨯7.8>6.635,所以认为环保知识测试成绩是否优秀与性别有关的把握为99%. 本题选择C 选项.11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
2023年雨课堂(统计学与SPSS软件应用)答案
第1章课程习题---选择题第 1 题实验设计的基本原则不包括【】。
A 随机性原则B 对照原则C 重复原则D 多样性原则第 2 题要观察两种药物联合应用是否具有更好的治疗效果,在实验设计时应该设计【】个组。
A 2B 3C 4D 8第 3 题下列变量中,属于分类变量的是【】。
A 白细胞计数B 民族C 怀孕次数D 体重第 4 题要减小抽样误差,实际中可行的办法是【】。
A 减小系统误差B 适当增加样本量C 控制个体变异D 精选观察对象第 5 题标准正态分布曲线下横轴从 0 到 2 的曲线下面积大约是【】。
A 0.28B 0.48C 0.68D 0.88第 6 题最小组段无下限或最大组段无上限的频数分布资料可用【】描述集中趋势。
A 均数B 中位数C 标准差D 标准误第 7 题抽样误差是指【】。
A 不同样本指标之间的差别B 样本中每个个体之间的差别C 由于抽样产生的观测值之间的差别D 样本指标与总体指标之间由于抽样产生的差别第 8 题随机变量 X 的值同时乘以一个大于零的常数,则【】会改变。
A 均数B 标准差C 方差D 变异系数正确答案:ABC第 9 题以下指标中,一般用来描述定量资料离散趋势的是【】。
A 四分位数间距B P90-P10C P75-P25D 极差正确答案:ACD第 10 题当一组数据中有一个观察数值为零时,仍能计算【】。
A 算术均数B 几何均数C 中位数D 众数正确答案:ACD第1章课程习题---判断题第 1题当样本含量固定时,标准误大则样本均数作为总体均数的代表性差;反之,标准误小则样本均数作为总体均数的代表性好。
第 2题,在试验设计阶段估计样本量时,检验效能是一个重要的考虑因素,一般要求小于0.2。
第 3题在无效假设的假设检验中,第一类错误是指拒绝了一个正确的无效假设。
第2章课程习题---选择题第 1 题t 分布曲线是一簇曲线,这些曲线形状的差别取决于【】。
A 自由度B 均数C 标准差D 标准误第 2 题进行两个样本均数比较的 t 检验,差别有统计学意义,则P 值越小说明【】。
智慧树答案SPSS软件与应用知到课后答案章节测试2022年
第一章1.下列属于SPSS运行窗口的是()。
答案:数据窗口 ;结果窗口;脚本窗口2.SPSS处理实际问题的一般步骤包括()。
答案:结果的解释和表达;数据的准备;数据的加工整理;数据的统计分析3.进行数据编码的过程中,需要考虑变量的()。
答案:赋值;类型;名称;个数4.在某调查问卷中,有这样一个问题:“请问您来自哪个省?”从问题类型来看,这个问题属于()。
答案:一般字符型问题5.在某调查问卷中,有这样一个问题:“在淘宝、拼多多、京东、网易严选中,请问您最经常使用的购物网站是什么?(限选2项)”要对这个问题进行编码,需要设置()个变量。
答案:26.对于量表中反向计分的题目,其赋值最常通过()完成。
答案:变量重新编码7.学习了SPSS软件,就可以不必学习统计学方法了。
()答案:错8.数据视图中,一行代表一个个案,即一个研究对象的全部资料都体现在这一行之中。
()答案:对9.字符型变量也可以进行算术和比较运算。
()答案:错10.SPSS数据文件的纵向合并就是添加个案的过程。
()答案:对第二章1.下列可用于计数资料的描述性分析的是()。
答案:条形图;饼图2.下列属于计量资料离散趋势指标的是()。
答案:方差;标准差;变异系数3.已知某小学二年级共有500名学生,现已完成对其身高的测量。
若要按某个区间标准绘制其分组频数分布表和分组频数分布图,可能需要用到()主菜单。
答案:转换;分析4.要描述对数正态分布资料的集中趋势,应选择()。
答案:几何均数5.对于多项选择题的描述分析,可通过()完成。
答案:多重响应6.在对统计分组后的数据资料进行集中趋势描述时,可使用加权平均数。
()答案:对7.在一组观测值中,众数可能不止一个,也可能不存在。
()答案:对8.“交叉频数分布表”可通过“分析”——“描述统计”——“频率”完成。
()答案:错9.在对限定多选题进行“多选题变量集”定义时,编码方式应选择“类别”。
()答案:对10.在P-P图中,如果数据服从正态分布,那么数据点应和对角线基本重合。
2019-2020北师大版高中数学选修2-3练习:3.1回归分析.1 Word版含解析
10.875
(2)由 y≤10,即-0.875+0.73x≤10,得 x≤ 0.73 ≈15,即机器速度不得超过 15 转/秒.
x3 2
y .5
456 4
34 .5
(1)请根据上表提供的数据,求出 y 关于 x 的线性回归方程; (2)试根据(1)求出的线性回归方程,预测使用年限为 10 年时,维修费用是多少?
4
解:(1) ∑ xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
������ = 1
3+4+5+6
������ = 4 =4.5,
2222 y .25 .37 .40 .55
A.(0,0)
B.(1.167 5,0)
C.(0,2.392 5) D.(1.167 5,2.392 5)
解析:由 a=������-b������,知������=a+b������,
回归直线 y=a+bx 一定过点(������,������),即经过点(1.167 5,2.392 5).
8 + 12 + 14 + 16
则������ =
4
=12.5,
5 + 8 + 9 + 11
������ = 4 =8.25,
4
4
∑ ������2������=660, ∑ xiyi=438,
������ = 1
������ = 1
பைடு நூலகம்
4
∑ ������������������������ - 4������ ������
2.5 + 3 + 4 + 4.5
苏州外国语血虚爱选修三第三单元《成对数据的统计分析》检测题(有答案解析)
一、选择题1.一组数据如下表所示:已知变量y 关于x 的回归方程为+0.5ˆbx ye =,若5x =,则预测y 的值可能为( ) A .5eB .112eC .132eD .7e2.下列说法正确的是( )A .若残差平方和越小,则相关指数2R 越小B .将一组数据中每一个数据都加上或减去同一常数,方差不变C .若2K 的观测值越大,则判断两个分类变量有关系的把握程度越小D .若所有样本点均落在回归直线上,则相关系数1r = 3.根据最小二乘法由一组样本点(),i i x y (其中1,2,,300i =),求得的回归方程是ˆˆˆybx a =+,则下列说法正确的是( ) A .至少有一个样本点落在回归直线ˆˆˆy bx a =+上B .若所有样本点都在回归直线ˆˆˆy bx a =+上,则变量同的相关系数为1C .对所有的解释变量i x (1,2,,300i =),ˆˆibx a +的值一定与i y 有误差 D .若回归直线ˆˆˆy bx a =+的斜率ˆ0b>,则变量x 与y 正相关 4.已知变量x ,y 之间的线性回归方程为0.47.6ˆyx =-+,且变量x ,y 之间的一组相关数据如下表所示,则下列说法中错误的是( )A .变量x ,y 之间呈现负相关关系B .m 的值等于5C .变量x ,y 之间的相关系数0.4r =-D .由表格数据知,该回归直线必过点(9,4)5.已知x 与y 之间的一组数据:若y 关于x 的线性回归方程为ˆ 2.1 1.25yx =-,则m 的值为( ).A .1B .0.85C .0.7D .0.56.下列有关命题的说法错误的是( )A .已知12,F F 是椭圆22421x y +=的两个焦点,过点1F 的直线与椭圆交于A ,B 两点,则2ABF ∆的周长为22B .若“p q ∨”为假命题,则p 与q 均为假命题C .若命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥D .两个随机变量的线性相关性越强,相关系数的绝对值越接近于07.有一散点图如图所示,在5个()x y ,数据中去掉D (3,10)后,下列说法正确的是( )A .残差平方和变小B .方差变大C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱8.从某大学中随机选取8名女大学生,其身高x (单位:cm )与体重y (单位:kg )数据如下表:x165 165 157 170 175 165 155 170 y 4857505464614359若已知y 与x 的线性回归方程为ˆ0.8585.71yx =-,那么选取的女大学生身高为175cm 时,相应的残差为( ) A .0.96-B .0. 96C .63. 04D . 4.04-9.下列有关线性回归分析的六个命题: ①线性回归直线必过样本数据的中心点(),x y ;②回归直线就是散点图中经过样本数据点最多的那条直线; ③当相关性系数0r >时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数r 就越接近于1;⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高; ⑥甲、乙两个模型的2R 分别约为0.88和0.80,则模型乙的拟合效果更好. 其中真命题的个数为( ) A .1个B .2个C .3个D .4个10.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:()()()()()1122334455,,,,,,,,,x y x y x y x y x y ,据收集到的数据可知12345100x x x x x ++++=,由最小二乘法求得回归直线方程为ˆ0.6754.8yx =+,则12345y y y y y ++++的值为( )A .68.2B .341C .355D .366.211.由变量x 与y 相对应的一组数据()12,y 、()24,y 、()3 6,y 、()48,y 、()5 10,y 得到的线性回归方程为ˆ 1.212yx =+,则12345y y y y y ++++等于( ) A .88B .90C .92D .9612.有下列说法:①若某商品的销售量y (件)关于销售价格x (元/件)的线性回归方程为5350y x =-+,当销售价格为10元时,销售量一定为300件;②线性回归直线y bx a =+一定过样本点中心(,)x y ;③若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;⑤在线性回归模型中,相关指数2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A .1B .2C .3D .413.下列说法中正确的是()A .若数列{}n a 为常数列,则{}n a 既是等差数列也是等比数列;B .若函数()f x 为奇函数,则(0)0f =;C .在ABC ∆中,A B >是sin sin A B >的充要条件;D .若两个变量,x y 的相关系数为r ,则r 越大,x 与y 之间的相关性越强.二、解答题14.新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.累计确诊人数y .4 816 31 51 71 97 122为了分析该国累计感染人数的变化趋势,小王同学分别用两个模型:①ybx a =+,②ˆydx c =+对变量x 和y 的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差ˆˆi i i ey y =-):经过计算得()()81728iii x x y y =--=∑,()82142i i x x =-=∑,()()816868i i i z z y y =--=∑,()8213570i i z z =-=∑,其中2i i z x =,8118i i z z ==∑.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()81821ˆiii i i x x y y bx x ==--=-∑∑,ˆˆay bx =- 15.近年来,“双11”网购的观念逐渐深入人心.某人统计了近5年某网站“双11”当天的交易额,统计结果如下表: 年份 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 交易额y /百亿元912172126y x留三位小数.(统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (1i n ≤≤),则两个变量的相关系数的计算公式为:()()niix x y y r --=∑.统计学认为,对于变量,x y ,如果[]1,0.75r ∈--,那么负相关很强;如果[]0.751r ∈,,那么正相关很强;如果(]0.75,0.30r ∈--或[)0.30,0.75r ∈,那么相关性一般;如果[]0.25,0.25r ∈-,那么相关性较弱);(2)求出y 关于x 的线性回归方程,并预测2020年该网站“双11”当天的交易额.参考公式:121()()()ˆniii ni i x x y y bx x ==--=-∑∑,ˆˆay bx =-43.1≈. 16.近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.(1)完成下面22⨯列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?2.072(2()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++)(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.17.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2018级的1000名学生进行调查,收集到相关数据如下:(1)根据以上提供的信息,完成22⨯列联表,并完善等高条形图;选物理 不选物理 总计数学成绩优秀数学成绩不优秀260 总计6001000(2)能否在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关?附:22()()()()()n ad bc K a b c d a c b d -=++++临界值表:()20P K k0.10 0.05 0.010 0.005 0.001 0k2.7063.8416.6357.87910.82818.某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x (单位:千万元)对年销售量y (单位:千万件)的影响,统计了近10年投入的年研发费用i x 与年销售量()1210i y i =⋯,,的数据,得到散点图如图所示.(1)利用散点图判断y a bx =+和·d y c x =(其中c d ,均为大于0的常数)哪一个更适合作为年销售量y 和年研发费用x 的回归方程类型(只要给出判断即可,不必说明理由) (2)对数据作出如下处理,令,i i i i u lnx v lny ==,得到相关统计量的值如下表:根据第(1)问的判断结果及表中数据,求y 关于x 的回归方程;101i i v =∑101i i u =∑()()101i i i u u v v =--∑()1021i i u u =-∑15 15 28.25 56.5(3)已知企业年利润z (单位:千万元)与x y ,的关系为349182z ey x =--(其中271828e ≈.),根据第(2)问的结果判断,要使得该企业下一年的年利润最大,预计下一年应投入多少研发费用?附:对于一组数据()()()1122,,,n n u v u v u v ⋯,,,,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为()()()121niii nii u u v v u u β==--=-∑∑,ˆav u β=- 19.忽如一夜春风来,翘首以盼的5G 时代,已然在全球“多点开花”,一个万物互联的新时代,即将呈现在我们的面前.为更好的满足消费者对流量的需求,中国电信在某地区推出六款不同价位的流量套餐,每款套餐的月资费x (单位:元)与购买人数y (单位:万人)的数据如表: 套餐 A B C D E F 月资费x (元) 384858687888购买人数y (万人)16.8 18.8 20.7 22.4 24.0 25.5对数据作初步的处理,相关统计量的值如表:其中ln i i v x =,ln i i y ω=,且绘图发现,散点(),i i v ω(6l i ≤≤)集中在一条直线附近. (1)根据所给数据,求y 关于x 的回归方程;(2)按照某项指标测定,当购买人数y 与月资费x 的比在区间,97e e ⎛⎫⎪⎝⎭内,该流量套餐受大众的欢迎程度更高,被指定为“主打套餐”,现有一家三口从这六款套餐中,购买不同的三款各自使用.记三人中使用“主打套餐”的人数为X ,求随机变量X 的分布列和期望. 附:对于一组数据()11,v ω,()22,v ω,…,()33,v ω,其回归直线bv a ω=+的斜率和截距的最小二乘估计值分别为1221ni ii nii v nv b vnvωω==-=-∑∑,a bv ω=-.20.随着手机的发展,“微信”逐渐成为人们支付购物的一种形式.某机构对“使用微信支付”的态度进行调查,随机抽取了50人,他们年龄的频数分布及对“使用微信支付”赞成人数如下表.(1)若以“年龄45岁为分界点”,由以上统计数据完成下面22⨯列联表,并判断是否有99%的把握认为“使用微信支付”的态度与人的年龄有关;(2)若从年龄在[55,65)的被调查人中随机选取2人进行追踪调查,求2人中至少有1人不赞成使用微信交流的概率. 参考数据:22()()()()()n ad bc Ka b c d a c b d -=++++,其中n a b c d =+++.21.某种产品的广告费支出x 与销售额y (单位:万元)之间有对应数据:(1)求回归直线方程;(2)试预测广告费支出为10万元时,销售额多大?线性回归方程的系数公式为()()()1122211nni iiii i nniii i x y nx y x x y y b xnxx x ====---==--∑∑∑∑,a y bx =-.22.根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x (千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y 与x 的关系,请计算相关系数r 并加以说明(若0.75r >,则线性相关程度很高,可用线性回归模型拟合);(2)求y 关于x 的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()()()212222221111nnii i ii i nnnniiiii i i i xxy y x ynx yr xxy y xnxyny======---==----∑∑∑∑∑∑归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()111222111ˆnnii ii i nnii i xxy y x y nx ybxxxnx====---==--∑∑∑∑,a y bx =-.23.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料: 使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?24.某品牌新款夏装即将上市,为了对新款夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据: 连锁店 A 店 B 店 C 店 售价x (元) 808682888490销量y (元)88 78 85 75 82 66(1)分别以三家连锁店的平均售价与平均销量为散点,如A 店对应的散点为(83,83),求出售价与销量的回归直线方程y bx a =+;(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)附:121()()()niii ni i x x y y b x x ==--=-∑∑,a y bx =-.25.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积m (单位:平方米,60130m ≤≤)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价y (单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)(1)试估计该市市民的平均购房面积m (同一组中的数据用该组区间的中点值为代表);(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X ,求X 的分布列与数学期望;(3)根据散点图选择ˆˆya x =+ˆˆˆln y c d x =+两个模型讲行拟合,经过数据处理得到两个回归方程,分别为ˆ0.93690.0285yx =+ˆ0.95540.0306ln y x =+,并得到一些统计量的值,如表所示:ˆ0.93690.0285yx =+ ˆ0.95540.0306ln yx =+ ()()1niii x x y y =--∑0.0054590.005886()()2211nniii i x x y y ==--∑∑ 0.006050请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).参考数据:ln 20.69≈,ln3 1.10≈,ln15 2.71≈1.73≈3.87≈,4.12≈参考公式:()()niix x y y r --=∑26.高一学年结束后,要对某班的50名学生进行文理分班,为了解数学对学生选择文理科是否有影响,有人对该班的分科情况做了如下的数据统计:(Ⅰ)根据数据关系,完成22⨯列联表;(Ⅱ)通过计算判断能否在犯错误的概率不超过2.5%的前提下认为数学对学生选择文理科有影响.附:22()()()()()nad bc K a b c d a c b d -=++++参考答案【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C【分析】令ln z y ,求得,x z 之间的数据对照表,结合样本中心点的坐标满足回归直线方程,即可求得b ;再令5x =,即可求得预测值y .【详解】将式子两边取对数,得到ln 0.5y bx =+,令ln zy ,得到0.5z bx =+,根据已知表格数据,得到,x z 的取值对照表如下:12342.54x +++==,1346 3.54z +++==, 利用回归直线过样本中心点,即可得3.5 2.50.5b =+, 求得 1.2b =,则 1.20.5z x =+, 进而得到 1.2+0.5x y e =,将5x =代入, 解得136.52y e e ==. 故选:C. 【点睛】本题考查利用样本中心点坐标满足回归直线方程求参数值,以及由回归方程进行预测值得求解,属中档题.2.B解析:B 【分析】由残差平方和越小,模型的拟合效果越好,可判断A ;由方差的性质可判断B ;由的随机变量2K 的观测值的大小可判断C ;由相关系数r 的绝对值趋近于1,相关性越强,可判断D .【详解】对于A ,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,相关指数2R 越大,故A 错误;对于B ,将一组数据的每一个数据都加上或减去同一常数后,由方差的性质可得方差不变,故B 正确;对于C ,对分类变量X 与Y ,它们的随机变量2K 的观测值越大,“X 与Y 有关系”的把握程度越大,故C 错误;对于D ,若所有样本点均落在回归直线上,则相关系数1r =,故D 错误. 故选:B. 【点睛】本题考查命题的真假判断,主要是线性回归直线的特点和线性相关性的强弱、样本数据的特征值和模型的拟合度,考查判断能力,属于基础题.3.D解析:D 【分析】对每一个选项逐一分析判断得解. 【详解】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A 错误;所有样本点都在回归直线ˆˆˆybx a =+上,则变量间的相关系数为1±,故B 错误; 若所有的样本点都在回归直线ˆˆˆy bx a =+上,则ˆˆbx a +的值与y i 相等,故C 错误; 相关系数r 与ˆb符号相同,若回归直线ˆˆˆy bx a =+的斜率ˆ0b >,则0r >,样本点分布应从左到右是上升的,则变量x 与y 正相关,故D 正确. 故选D . 【点睛】本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析推理能力.4.C解析:C 【解析】分析:根据平均数的计算公式,求得样本中心为11(9,)4m+,代入回归直线的方程,即可求解5m =,得到样本中心(9,4),再根据,x y 之间的变化趋势,可得其负相关关系,即可得到答案.详解:由题意,根据上表可知681012632119,444m mx y +++++++====,即数据的样本中心为11(9,)4m+, 把样本中心代入回归直线的方程,可得110.497.64m+=-⨯+,解得5m =, 则11115444m ++==,即数据的样本中心为(9,4), 由上表中的数据可判定,变量,x y 之间随着x 的增大,y 值变小,所以呈现负相关关系,由于回归方程可知,回归系数ˆ0.4b=-,而不是0.4r =,所以C 是错误的,故选C. 点睛:本题主要考查了数据的平均数的计算公式,回归直线方程的特点,以及相关关系的判定等基础知识的应用,其中熟记回归分析的基本知识点是解答的关键,着重考查了分析问题和解答问题的能力.5.D解析:D由表格可知 2.5x =, 15.54my +=,由线性回归方程必过样本中心点可得: 4y =,则0.5m =,故选D.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .6.D解析:D 【分析】由椭圆定义,复合命题的真假,命题的否定,相关系数的概念进行判断. 【详解】椭圆22421x y +=的标准方程是2211142x y +=,21,22a a ==,2ABF ∆的周长为442a =⨯=A 正确; 若“p q ∨”为假命题,则,p q 都是假命题,,p q 只要有一个为真,则p q ∨为真,B 正确; 命题00:,ln 1p x R x ∃∈<,则命题:,ln 1p x R x ⌝∀∈≥,C 正确; 两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,D 错. 故选:D . 【点睛】本题考查命题的真假判断,解题关键是掌握相关概念,如椭圆标准方程中长轴长的确定,复合命题的真值表,含有一个题词的命题的否定,相关系数与相关性的判断.7.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,且为正相关, 所以r 变大,2R 变大,残差平方和变小, 故选A. 【点睛】该题考查的是有关线性相关性强弱的问题,涉及到的知识点有相关系数,相关指数,以及残差平方和与相关性的关系,属于简单题目.8.B解析:B将175代入线性回归方程计算理论值,实际数值减去理论数值得到答案. 【详解】已知y 与x 的线性回归方程为ˆ0.8585.71yx =- 当175x =时:63.04y = 相应的残差为:6463.040.96-= 故答案选B 【点睛】本题考查了残差的计算,意在考查学生的计算能力.9.B解析:B 【解析】分析:根据线性回归方程的几何体特征及残差,相关指数的概论,逐一分析四个选项的正误,可得结论.详解:①线性回归直线必过样本数据中心点(),x y ,故①正确; ②回归直线方程在散点图中可能不经过任意样本数据点,故②错误; ③当相关性系数0r >时,则两个变量正相关,故③正确;④如果两个变量的相关性越强,则相关性系数r 就越接近于1或1-,故④错误; ⑤残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,故⑤错误; ⑥甲、乙两个模型的2R 分别约为0.88和0.80,则模型甲的拟合效果更好,故⑥错误, 真命题的个数为2,故选B.点睛:本题以命题的真假判断为截体,考查了相关关系,回归分析、残差、相关指数等知识点,意在考查对基本概念掌握的熟练程度,难度不大,属于基础题.10.B解析:B 【分析】计算20x =,则0.6754.868.2y x =+=,计算得到答案. 【详解】12345100x x x x x ++++=,故20x =,则0.6754.868.2y x =+=,故123455341y y y y y y =+=+++. 故选:B. 【点睛】本题考查了回归方程的中心点,意在考查学生的计算能力和应用能力.11.D解析:D 【分析】求出x ,代入ˆ 1.212yx =+,可得y ,则12345y y y y y ++++可求解. 【详解】由题中所给的点,可以求得24681065x ++++==,代入ˆ 1.212yx =+,可得 1.261219.2y =⨯+=, 所以12345519.296y y y y y ++++=⨯=, 故选:D. 【点睛】该题考查的是有关回归直线方程的应用,涉及到的知识点有回归直线过样本中心点,属于简单题目.12.B解析:B 【分析】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系数r 越接近1-,③错误;残差图中带状区域越窄,拟合度越高,④错误;2R 越接近1,模型拟合度越高,⑤正确;由此可得结果. 【详解】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线必过(),x y ,②正确;③若两个随机变量为负相关,若线性相关性越强,相关系数r 越接近1-,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数2R 越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个 本题正确选项:B 【点睛】本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.13.C解析:C 【分析】对于选项A ,B 给出反例可说明命题错误,C 由正弦定理可知命题正确,D 由相关系数的定义确定其真伪即可. 【详解】逐一考查所给的说法:A . 若0n a =,则数列{}n a 为常数列,则{}n a 是等差数列但不是等比数列,该说法错误;B . 函数()f x 1x=为奇函数,但是不满足()00f =,该说法错误; C . 由正弦定理可得在ABC ∆中,A B >是sinA sinB >的充要条件,该说法正确; D . 两个随机变量相关性越强,则相关系数r 的绝对值越接近于1,题中说法错误. 本题选择C 选项. 【点睛】本题主要考查奇函数的性质,正弦定理的应用,相关系数的含义,常数列与等差数列、等比数列的关系等知识,意在考查学生的转化能力和计算求解能力.二、解答题14.(1)选择模型①,理由见解析;(2)2ˆ 1.92 1.04yx =+;(3)157人. 【分析】(1)根据残差图,估计值和真实值越接近,拟合效果越好,即可得解;(2)令2z x =,分别计算,z y 的平均数,根据公式求得,b a ,即可求出模型①对应点回归方程;(3)将9x =代入回归方程,即可得解. 【详解】(1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好(2)由(1),知y 关于x 的回归方程为2ˆybx a =+,令2 z x =,则ˆy bz a =+. 由所给数据得:1(1491625364964)25.58z =+++++++=, 1(481631517197122)508y =+++++++= ()()()818216868ˆ 1.923570iii ii z z y y bz z ==--==≈-∑∑. ˆˆ50 1.9225.5 1.04ay bz =-≈-⨯=, ∴y 关于x 的回归方程为2ˆ 1.92 1.04yx =+ (3)将9x =代入上式,得2ˆ 1.929 1.04156.56157y=⨯+=≈(人) 所以预测该地区第9天新型冠状病毒感染确诊的累计人数为157人. 【点睛】方法点睛:本题考查残差图的应用,考查回归直线的求法和应用,考查了学生的计算能力,求解线性回归直线的具体步骤为: 由已知数据求出平均数,x y ;由公式()121ˆi nii bx x ===-∑计算出ˆb的值; 将ˆb代入ˆˆa y bx =-求出ˆa ; 得出方程ˆˆˆybx a =+. 15.(1)0.998;变量y 与x 的线性相关程度很强;(2)ˆ 4.3 4.1yx =+;29.9百亿元. 【分析】(1)根据表中数据可得x 、y ,再计算出1()()niii x x y y =--∑和1()()niii x x y y =--∑,代入()()niix x y y r --=∑,得到数据与所给r 比较可得答案;(2)由(1)可得x ,y ,1()()niii x x y y =--∑,计算出21()ni i x x =-∑,代入121()()()ˆniii ni i x x y y bx x ==--=-∑∑和ˆˆay bx =-可得答案. 【详解】(1)由题意,根据表格中的数据, 可得:1(12345)35x =++++=,1(912172126)175y =++++=, 则1()()(13)(917)(53)(2617)43niii x x y y =--=--++--=∑,43.1=≈,所以()()430.99843.1niix x y y r --==≈∑, 所以变量y 与x 的线性相关程度很强. (2)由(1)可得3x =,17y =,1()()43niii x x y y =--=∑,又由2221222(13)(23)(3(3)(43)(53)1)0nii x x ==-+-+-+-+-=-∑,所以12143 4.30)ˆ1(i ni i bx x =====-∑,则ˆˆ17 4.33 4.1a y bx=-=-⨯=, 可得y 关于x 的线性回归方程为ˆ 4.3 4.1y x =+, 令6x =,可得ˆ 4.36 4.129.9y=⨯+=, 即2020年该网站“双11”当天的交易额29.9百亿元. 【点睛】本题考查了变量的相关性以及回归直线方程的求解,回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果接近真实值,要求认真计算各个数值. 16.(1)列联表见解析,可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关;(2)①分布列见解析;②()2E X =,() 1.2D X =. 【分析】(1)根据题中数据即可完善列联表,计算出卡方值,和10.828比较,即可判断; (2)①可得X 的取值可以是0,1,2,3,4,5,且()5,0.4X B ,计算出X 取不同值的概率,即可得出分布列; ②利用期望和方差公式即可求出. 【详解】(1)由题可得22⨯列联表如下:所以22200(80104070)11.11110.8281505012080K ⨯⨯-⨯=≈>⨯⨯⨯,所以可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关; (2)①每次购物时,对商品和服务全好评的概率为800.4200=,且X 的取值可以是0,1,2,3,4,5,()5,0.4XB则()500.6P X ==,()14510.40.6P X C ==⨯⨯,()223520.40.6P X C ==⨯⨯,()332530.40.6P X C ==⨯⨯,()44540.40.6P X C ==⨯⨯,()550.4P X ==,则分布列如下:P50.6 1450.40.6C ⨯⨯ 22350.40.6C ⨯⨯ 33250.40.6C ⨯⨯ 4450.40.6C ⨯⨯ 50.4②5,0.4XB ,()50.42E X ∴=⨯=,()50.40.6 1.2D X =⨯⨯=.【点睛】关键点睛:本题考查分布列的求解,解题的关键是判断出变量服从二项分布,知道二项分布的概率求法以及期望方差公式.17.(1)填表见解析,作图见解析(2)能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关 【分析】(1)由题意计算出各组人数后即可完成列联表,进而可补全等高条形图; (2)代入公式计算出2K ,与3.841比较即可得出结论. 【详解】(1)根据题意填写列联表如下,选物理 不选物理 总计 数学成绩优秀 420 320 740 数学成绩不优秀 180 80 260 总计6004001000(2)计算222()1000(42080180320)()()()()600400740260n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯12.474 3.841≈>,所以能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关.【点睛】本题考查了独立性检验的应用,考查了计算能力,属于中档题. 18.(1) 选择d y c x =⋅更合适;(2) y =. (3) 要使年利润取最大值,预计下一年应投入4千万元的研发费用 【分析】(1)根据散点图分布,可知更符合指数型模型,可得结果;(2)对dy c x =⋅两边取倒数,得到ln v c du =+,采用最小二乘法可求得d 和ln c ,从而得到结果;(3)由(2)可得()92z x x =,利用导数可判断出()z x 单调性,可知当4x =时,()z x 取最大值,从而得到结果. 【详解】(1)由散点图知,选择dy c x =⋅更合适(2)对dy c x =⋅两边取对数,得ln ln ln y c d x =+,即:ln v c du =+由表中数据得32u v ==28.25156.52d ∴== 令ln c m =,则31332224m v du =-=-⨯=,即34c e = ∴年销售y 和年研发费用x的回归方程为:y =(3)由(2)知,()92z x x =,则()92z x =' 令()0z x '=,得4x =当()0,4x ∈时,()0z x '>;当()4,x ∈+∞时,()0z x '<()z x ∴在()0,4上单调递增;在()4,+∞上单调递减∴当4x =千万元时,年利润z 取得最大值,且最大值为:()418z =千万元 1.8=亿元 ∴要使年利润取最大值,预计下一年应投入4千万元的研发费用【点睛】本题考查统计中的数据的相关性的问题,涉及到非线性回归模型方程的求解、利用导数求解函数的最值的问题;解题关键是能够将非线性回归模型转化为线性回归模型,从而利用最小二乘法求得回归模型.19.(1)12y ex =;(2)分布列见解析,32.【分析】(1)设回归直线方程为bv a ω=+,由61 4.16i i v v ==∑,611 3.056i i ωω===∑,则。
北京博克图中学选修三第三单元《成对数据的统计分析》测试卷(含答案解析)
一、选择题1.某校对学生进行心理障碍测试,得到的数据如下表:根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A .焦虑 B .说谎C .懒惰D .以上都不对2.已知变量,x y 之间满足线性相关关系ˆ 1.31yx =-,且,x y 之间的相关数据如下表所示:则实数m =( ) A .0.8B .0.6C .1.6D .1.83.下列说法正确的是( )A .在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B .线性回归方程对应的直线y b x a ∧∧∧=+至少经过其样本数据点中的()11,x y ,()22,x y ,()33,x y(),n n x y 一个点C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果差 4.下列说法中正确的是( )A .“a b >”是“22a b >”成立的充分不必要条件B .命题:,20x p x R ∀∈>,则00:,20xp x R ⌝∃∈<C .为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为40D .已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为^1.230.08y x =+.5.已知具有线性相关的变量x ,y ,设其样本点为(),(1,2,,6)i i i P x y i =,回归直线方程为2y x a =+,若126(12,18)OP OP OP +++=(O 为坐标原点),则a =( )A .-1B .-6C .1D .66.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),甲图为选取的15名志愿者身高与臂展的折线图,乙图为身高与臂展所对应的散点图,并求得其回归方程为 1.160.5ˆ37yx =-,以下结论中不正确的为( )A .15名志愿者身高的极差小于臂展的极差B .15名志愿者身高和臂展成正相关关系,C .身高相差10厘米的两人臂展都相差11.6厘米,D .可估计身高为190厘米的人臂展大约为189.65厘米 7.在下列命题中,下列选项正确的是( )A .在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.B .两个变量相关性越强,则相关系数r 就越接近于1.C .在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.D .若,a b 是两个相等的非零实数,则()()a b a b i -++是纯虚数. 8.下列说法中正确的是 ( )①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ;③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A .①② B .③④C .①④D .②③9.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个线性回归方程35y x =-,变量x 增加1个单位时,y 平均增加5个单位; ③设具有相关关系的两个变量x ,y 的相关系数为r ,则|r|越接近于0,x 和y 之间的线性相关程度越强;④在一个2×2列联表中,由计算得K 2的值,则K 2的值越大,判断两个变量间有关联的把握就越大.以上错误结论的个数为( ) A .0B .1C .2D .310.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:()()()()()1122334455,,,,,,,,,x y x y x y x y x y ,据收集到的数据可知12345100x x x x x ++++=,由最小二乘法求得回归直线方程为ˆ0.6754.8yx =+,则12345y y y y y ++++的值为( )A .68.2B .341C .355D .366.211.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是( ) A .样本中的男生数量多于女生数量 B .样本中喜欢手机支付的数量多于现金支付的数量C .样本中多数男生喜欢手机支付D .样本中多数女生喜欢现金支付12.已知x ,y 之间的一组数据:x2 4 6 8 y1537则y 与的线性回归方程A .(20,16)B .(16,20)C .(4,5)D .(5,4)13.下列说法中错误的是( )A .先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +的学生,这样的抽样方法是系统抽样法.B .正态分布()1,9N 在区间()1,0-和()2,3上取值的概率相等C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1D .若一组数据123a 、、、的平均数是2,则这组数据的众数和中位数都是2二、解答题14.新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数. 日期代码x 12345678累计确诊人数y .4 8 16 31 51 71 97 122为了分析该国累计感染人数的变化趋势,小王同学分别用两个模型:①,②ˆydx c =+对变量x 和y 的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差ˆˆi i i ey y =-):经过计算得()()81728iii x x y y =--=∑,()82142i i x x =-=∑,()()816868i i i z z y y =--=∑,()8213570i i z z =-=∑,其中2i i z x =,8118i i z z ==∑.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()81821ˆiii i i x x y y bx x ==--=-∑∑,ˆˆay bx =- 15.2018年至2020年,第六届全国文明城市创建工作即将开始.在2017年9月7日召开的攀枝花市创文工作推进会上,攀枝花市委明确提出“力保新一轮提名城市资格、确保2020年创建成功”的目标.为了确保创文工作,今年初市交警大队在辖区开展“机动车不礼让行人整治行动” .下表是我市一主干路口监控设备抓拍的5个月内 “驾驶员不礼让斑马线”行为统计数据:(1)请利用所给数据求违章人数与月份之间的回归直线方程ˆˆybx a =+; (2)预测该路口7月份不“礼让斑马线”违章驾驶员的人数;(3)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查“驾驶员不礼让斑马线”行为与驾龄的关系,得到如下22⨯列联表:能否据此判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关?参考公式:1221ˆni i i n i i x y nxy bx nx==-=-∑∑,ˆˆay bx =- 16.为了研究某种菜籽在特定环境下,随时间变化发芽情况,得如下实验数据:(2)利用(1)中的回归直线方程,预测当10t =时,菜籽发芽个数.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121ˆnii i nii tty y btt==--=-∑∑,ˆˆay bt =- 17.艾滋病是一种危害性极大的传染病,由感染艾滋病病毒(HIV 病毒)引起,它把人体免疫系统中最重要的CD 4T 淋巴细胞作为主要攻击目标,使人体丧失免疫功能.下表是近八年来我国艾滋病病毒感染人数统计表:年份代码x12345678感染者人数(y单位:万人)34.338.343.353.857.765.471.885()1请根据该统计表,画出这八年我国艾滋病病毒感染人数的折线图;()2请用相关系数说明:能用线性回归模型拟合y 与x的关系;()3建立y关于x的回归方程(系数精确到0.01),预测2019年我国艾滋病病毒感染人数.42 6.48≈;81449.6iiy==∑,812319.5i iix y==∑821()46.2iiy y=-=∑,参考公式:相关系数()12211()()()nin ni ii ix x y yrx x y y===--=--∑∑∑,回归方程y bx a=+中,b()121()()ni iiniix x y yx x==--=-∑∑,a y bx=-.18.某电脑公司有5名产品推销员,其工作年限与年推销金额的数据如表:推销员编号12345工作年限x年35679推销金额y万元23345(1)求年推销金额y关于工作年限x的线性回归方程;(2)判断变量x与y之间是正相关还是负相关;(3)若第6名推销员的工作年限是11年,试估计他的年推销金额.参考公式:线性回归方程y bx a =+中,a y bx =-,其中,x y 为样本平均数,1221ni ii nii x ynx y b xnx==-=-∑∑)19.某大学生参加社会实践活动,对某公司1月份至6月份销售某种配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如下表所示:(1)根据1至5月份的数据,求出y 关于x 的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.5元,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想? (3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多少元才能获得最大利润?(注:利润=销售收入-成本).参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni i i n i i x y nxy b x nx==-=-∑∑,55211392,502.5,i ii i i x yx ====∑∑20.某连锁经营公司所属5个零售店某月的销售额和利润额如下表: (2)用最小二乘法计算利润额y 对销售额x 的线性回归方程; (3)当销售额为4千万元时,估计利润额的大小.(参考公式:1221ˆni ii nii x y nxybxnx ==-=-∑∑,ˆˆay bx =-) 21.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,计算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720ii x==∑.(1)求家庭的月储蓄y 关于月收入x 的线性回归方程y bx a =+,并判断变量x 与y 之间是正相关还是负相关;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.(注:线性回归方程y bx a =+中,1221ni ii nii x y nx yb xnx==-⋅=-∑∑,其中x ,y 为样本平均值.)22.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.23.如图是某公司一种产品的日销售量y(单位:百件)关于日最高气温x(单位:C︒)的散点图.数据:x1315192021 y2628301836(1)请剔除一组数据,使得剩余数据的线性相关性最强,并用剩余数据求日销售量y关于日最高气温x的线性回归方程y bx a=+;(2)根据现行《重庆市防暑降温措施管理办法》.若气温超过36度,职工可享受高温补贴.已知某日该产品的销售量为53.1,请用(1)中求出的线性回归方程判断该公司员工当天是否可享受高温补贴?附:()()()121ni iiniix x y ybx x==--=-∑∑,a y bx=-.24.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y 2.2 3.8 5.5 6.57.0若由资料知y对x呈线性相关关系.(1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆy bx a=+的回归系数a,b;(3)估计使用年限为10年时,维修费用是多少?25.某书店销售刚刚上市的某高二数学单元测试卷,按事先拟定的价格进行5天试销,每种单价试销1天,得到如下数据:单价x/元1819202122销量y/册6156504845(1)求试销5天的销量的方差和y 关于 x 的回归直线方程;附: 1122211()(ˆˆ,(ˆ))n niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑. (2)预计以后的销售中,销量与单价服从上题中的回归直线方程,已知每册单元测试卷的成本是10元,为了获得最大利润,该单元测试卷的单价应定为多少元?26.“工资条里显红利,个税新政人民心”,随着2019年新年钟声的敲响,我国自1980年以来,力度最大的一次个人所得税(简称个税)改革迎来了全面实施的阶段,某IT 从业者为了解自己在个税新政下能享受多少税收红利,绘制了他在26岁~35岁(2009年~2018年)之间各月的月平均收入y (单位:千元)的散点图:(1)由散点图知,可用回归模型ˆˆˆln yb x a =+拟合y 与x 的关系,试根据有关数据建立y 关于x 的回归方程;(2)如果该IT 从业者在个税新政下的专项附加扣除为3000元/月,试利用(1)的结果,将月平均收入为月收入,根据新旧个税政策,估计他36岁时每个月少缴交的个人所得税. 附注: 参考数据10155ii x==∑,101155.5i i y ==∑,1021-)82.5i i x x ==∑(,101-))94.9i i i x x y y =-=∑((,10115.1ii t==∑,1021-) 4.84i i t t ==∑(,101-))24.2i i i t t y y =-=∑((,其中ln i i t x =;取ln11 2.4=,ln36 3.6=参考公式:回归方程v bu a =+中斜率和截距的最小二乘估计分别为121-))-)ˆniii nii u u v v bu u ==-=∑∑(((,ˆˆa v bu=- 新旧个税政策下每月应纳税所得额(含税)计算方法及税率表如下:旧个税税率表(个税起征点3500新个税税率表(个税起征点5000元)【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】分别求出三种关系的观测值,比较后可得结论. 【详解】解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为123,,K K K , 由表中数据可得:()2111056025200.86330802585K ⨯⨯-⨯=≈⨯⨯⨯,()2211010702010 6.36630802090K ⨯⨯-⨯=≈⨯⨯⨯,()2311015301550 1.41030806545K ⨯⨯-⨯=≈⨯⨯⨯,因为2K 的值最大,所以说谎与性别关系最大.故选:B. 【点睛】本题考查独立性检验的应用,考查理解能力和计算能力.2.D解析:D 【解析】分析:由题意结合线性回归方程的性质整理计算即可求得最终结果. 详解:由题意可得:12345 2.542x +++===,0.1 3.14 1.844m my +++==+, 线性回归方程过样本中心点,则:1.8 1.3 2.514m+=⨯-, 解得: 1.8m =. 本题选择D 选项.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.3.C解析:C 【解析】分析:首先对每个选项一一进行分析,需要明确独立性检验是检验两个分类变量是否有关系的一种统计方法,回归直线可能不过任何一个样本数据点,残差图中,残差点分布的带状区域的宽度越狭窄,其模拟精度越高,相关指数越大,拟合效果越好的结论,就可以正确选出结果.详解:对于A ,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A 错;对于B ,线性回归方程对应的直线y b x a ∧∧∧=+可能不过任何一个样本数据点,所以B 错误;对于C ,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C 正确;对于D ,回归分析中,相关指数2R 为0.98的模型比相关指数2R 为0.80的模型拟合的效果好,所以D 错误. 故选C.点睛:根据概率统计中变量间的相关关系,线性回归方程以及残差图与相关指数2R 的概念,对选项中的命题进行分析、判断正误即可.4.D解析:D 【解析】对于A ,取1a =-,2b =时,不能推出22a b >,故错误;对于B ,命题:,20x p x R ∀∈>的否定为00,20xx R ∃∈≤,故错误;对于C ,为了了解800名学生对学校某项教改试验的意见,用系统抽样的方法从中抽取一个容量为40的样本,则分组的组距为8004020÷=,故错误;对于D ,因为回归直线的斜率的估计值为1.23,所以回归直线方程可写成 1.23y x a =+,根据回归直线方程过样本点的中心()4,5,则0.08a =,所以回归直线方程为 1.2308ˆ.0yx =+,故正确. 故选D.5.A解析:A 【分析】根据向量相等的坐标表示,由此即可计算平均数 ,x y ,得到样本点的中心的坐标(),x y ,代入回归直线方程求出结果. 【详解】因为样本点为(),(1,2,,6)i i i P x y i =且126(12,18)OP OP OP +++=,所以1261261218x x x y y y ++⋯+=⎧⎨++⋯+=⎩ 所以()123456112266x x x x x x x =+++++== , ()126118366y y y y =++⋯+==; 又回归直线方程为2y x a =+过(),x y , ∴322a =⨯+,解得1a =-, 故选:A . 【点睛】本题主要考查了线性回归方程必过样本中心、向量相等的坐标表示等基础知识,属于基础题.6.C解析:C 【分析】对于A ,身高极差大约是25,臂展极差大于等于30,故A 正确; 对于B ,很明显根据散点图以及回归方程得到,故B 正确;对于C ,身高相差10厘米的两人展臂的估计值相差11.6厘米,但不是准确值,故C 错误;对于D ,身高为190厘米,代入回归方程可得展臂等于189.65厘米,但不是准确值,故D 正确.【详解】对于A ,身高极差大约是25,臂展极差大于等于30,故A 正确;对于B ,很明显根据散点图以及回归方程得到,身高矮展臂就会短一些,身高高一些,展臂就会长一些,故B 正确;对于C ,身高相差10厘米的两人展臂的估计值相差11.6厘米,但不是准确值,回归方程上的点并不都是准确的样本点,故C 错误;对于D ,身高为190厘米,代入回归方程可得展臂等于189.65厘米,但不是准确值,故D 正确.故选:C . 【点睛】本题主要考查相关关系,考查回归方程及其应用,意在考查学生对这些知识的理解掌握水平.7.D解析:D 【分析】根据回归方程的定义判断A ;根据相关系数的定义判断B ;根据残差图的性质判断C ;根据纯虚数的定义判断D . 【详解】在回归直线0.585y x =-中,变量200x =时,得到15只是变量y 的一个预测值,故A 不正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,故B 不正确;在残差图中,残差点比较均匀落在水平的带状区域中,带状区域的宽度越小,拟合效果越好,故C 不正确;若,a b 是两个相等的非零实数,则()()2a b a b i ai -++=,且20a ≠,符合纯虚数的定义,D 正确,故选D. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.8.D解析:D 【分析】运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可 【详解】①相关系数r 用来衡量两个变量之间线性关系的强弱,r 越接近于1,相关性越强,故错误②回归直线y bx a =+一定经过样本点的中心()x y ,,故正确③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度,故正确 ④相关指数2R 用来刻画回归的效果,2R 越大,说明模型的拟合效果越好,故错误综上,说法正确的是②③ 故选D 【点睛】本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题9.C解析:C 【解析】方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;在线性回归方程=3-5x 中,变量x 增加1个单位时,y 平均减小5个单位,故②不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,|r|越接近于1,相关程度越强,故③不正确;对分类变量x 与y 的随机变量的观测值K 2来说,K 2越大,“x 与y 有关系”的可信程度越大,故④正确.综上所述,错误结论的个数为2,故选C.10.B解析:B 【分析】计算20x =,则0.6754.868.2y x =+=,计算得到答案. 【详解】12345100x x x x x ++++=,故20x =,则0.6754.868.2y x =+=,故123455341y y y y y y =+=+++. 故选:B. 【点睛】本题考查了回归方程的中心点,意在考查学生的计算能力和应用能力.11.D解析:D 【详解】由右边条形图知,男生女生喜欢手机支付的比例都高于现金支付的比例,所以男生女生都喜欢手机支付,故C 对,D 错,由左边条形图知,男生女生手机支付都比现金支付比例相同,B 对,结合两个条形图可知,样本中的男生数量多于女生数量,A 对,故选D.12.D解析:D 【解析】本题考查线性回归方程的性质. 由线性回归方程必过点,可知线性回归方程ˆybx a =+必过点(5,4)选D . 13.C解析:C 【分析】对于A ,根据系统抽样的定义可判断;对于B ,根据正态分布的对称性可判断在两个区间上的概率;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,可进行判断;对于D ,根据一组数据123a 、、、的平均数是2,得2a =,求得该组数据的众数和中位数,可判断D. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A 正确;对于B ,正态分布()19N ,的曲线关于1x =对称,区间()10-,和()23,与对称轴距离相等,所以在两个区间上的概率相等,B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数r 的值越接近于1,C 错误; 对于D ,一组数据123a 、、、的平均数是2,2a ∴=;所以该组数据的众数和中位数均为2,D 正确.. 【点睛】本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.二、解答题14.(1)选择模型①,理由见解析;(2)2ˆ 1.92 1.04yx =+;(3)157人. 【分析】(1)根据残差图,估计值和真实值越接近,拟合效果越好,即可得解;(2)令2z x =,分别计算,z y 的平均数,根据公式求得,b a ,即可求出模型①对应点回归方程;(3)将9x =代入回归方程,即可得解. 【详解】(1)选择模型①.理由如下:根据残差图可以看出,模型①的估计值和真实值相对比较接近,模型②的残差相对较大一些,所以模型①的拟合效果相对较好(2)由(1),知y 关于x 的回归方程为2ˆybx a =+,令2 z x =,则ˆy bz a =+. 由所给数据得:1(1491625364964)25.58z =+++++++=, 1(481631517197122)508y =+++++++= ()()()818216868ˆ 1.923570iii i i z z y y bz z ==--==≈-∑∑. ˆˆ50 1.9225.5 1.04ay bz =-≈-⨯=, ∴y 关于x 的回归方程为2ˆ 1.92 1.04yx =+(3)将9x =代入上式,得2ˆ 1.929 1.04156.56157y=⨯+=≈(人) 所以预测该地区第9天新型冠状病毒感染确诊的累计人数为157人. 【点睛】方法点睛:本题考查残差图的应用,考查回归直线的求法和应用,考查了学生的计算能力,求解线性回归直线的具体步骤为: 由已知数据求出平均数,x y ;由公式()()()121ˆniii nii x x y y bx x ==--=-∑∑计算出ˆb的值; 将ˆb代入ˆˆa y bx =-求出ˆa ; 得出方程ˆˆˆybx a =+. 15.(1)ˆ8.5125.5yx =-+;(2)66人;(3)能判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【分析】(1)利用所给数据求回归直线方程的相关数据,根据代入公式即可得违章人数y 与月份x之间的回归直线方程ˆˆˆybx a =+; (2)代入7x =即可判断7月份不“礼让斑马线”违章驾驶员的人数;(3)求出2k ,即可判断判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【详解】解:(1)由表中数据知:3,100x y ==∴122114151500ˆ8.55545ni ii nii x ynx ybxnx ==--===---∑∑,ˆ125.ˆ5a y bx =-=, ∴所求回归直线方程为ˆ8.5125.5yx =-+. (2)由(1)知,令7x =,则ˆ8.57125.566y=-⨯+=人. (3)由表中数据得2250(221288)505.556 5.024*********K ⨯⨯-⨯==≈>⨯⨯⨯,根据统计有97.5%的把握认为“礼让斑马线”行为与驾龄有关. 【点睛】本题考查回归直线方程的应用,独立检验的应用,是基本知识的考查.16.(1)ˆ 1.1 2.6yt =-;(2)8.4千个. 【分析】(1)利用已知数据先求出t 和y 的平均数,代入到b ∧中,得到b ∧后,再代入到a ∧中,而线性回归方程为y b x a ∧∧∧=+,代入所有数据即可得到;(2)将8t =代入回归直线中即可得到所求. 【详解】(1)由表中数据计算得6t =,ˆ4y=, ()()5111i i i t t y y =--=∑,()52110i i t t =-=∑,()()()121ˆ 1.1nii i ni i tty y bt t ==--==-∑∑,ˆˆ 2.6a y bt=-=-. 所以,回归方程为ˆ 1.1 2.6yt =-. (2)将10t =代入(1)的回归方程中得ˆ11 2.68.4y=-=. 故预测10t =时,菜籽发芽个数约为8.4千个. 【点睛】该题主要考查线性回归方程等基础知识,意在考查考生的分析问题解决问题的能力、运算求解能力,属于简单题目.17.(1)见解析;(2)见解析;(3)预测2019年我国艾滋病感染累积人数为87.93万人 【分析】(1)由所给的数据绘制折线图即可;(2)由题意计算相关系数来说明变量之间的相关关系即可;(3)首先求得回归方程,然后利用回归方程的预测作用进行预测即可. 【详解】解:(1)我国艾滋病病毒感染人数的折线图如图所示()92,56.22x y ==,()1188()8296.3i i i i i i x x y y x y xy ==∴∑--=∑-=,112288()()4246.2299.376i i i i x x y y ==∑-∑-==,2211()0.99()()n nn i i i i x x y y r x x y y ==∑--∴=≈∑-∑-.故具有强线性相关关系.()()121()296.337.05()42n i i i n i i x x y y b x x ==∑--==≈∑-,56.27.05 4.524.48a y b x =-=-⨯≈, 7.0524.48y x ∴=+.当9x =时,7.05924.4887.93y =⨯+=.故预测2019年我国艾滋病感染累积人数为87.93万人. 【点睛】本题主要考查线性回归方程的求解与预测作用,相关系数的计算与含义等知识,意在考查学生的转化能力和计算求解能力.18.(1)0.50.4y x =+;(2)正相关;(3)5.9万元. 【分析】(1)首先求出x ,y 的平均数,利用最小二乘法做出b 的值,再利用样本中心点满足线性回归方程和前面做出的横标和纵标的平均值,求出a 的值,写出线性回归方程. (2)根据0.50b =>,即可得出结论;(3)第6名推销员的工作年限为11年,即当11x =时,把自变量的值代入线性回归方程,得到y 的预报值,即估计出第6名推销员的年推销金额为5.9万元. 【详解】(1)由题意知:6x =, 3.4y =于是:211256 3.40.520056b -⨯⨯==-⨯, 3.40.560.4a =-⨯=,故:所求回归方程为0.50.4y x =+;(2)由于变量y 的值随着x 的值增加而增加(0.50)b =>,故变量x 与y 之间是正相关 (3)将11x =带入回归方程可以估计他的年推销金额为0.5110.4 5.9y =⨯+=万元. 【点睛】本题考查回归分析的初步应用,考查利用最小二乘法求线性回归方程,是一个综合题目.19.(1)ˆ3240yx =-+.. (2) 可以认为所得到的回归直线方程是理想的.(3) 该产品的销售单价定为7.5元/件时,获得的利润最大. 【解析】分析:(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 详解: (1)因为()()11995101051110,1110865855x =++++==++++=..,所以23925108325025510ˆb-⨯⨯==--⨯..,则()ˆ8321040a =--⨯=., 于是y 关于x 的回归直线方程为ˆ3240y x =-+.; (2)当8x =时, 32840144ˆy=-⨯+=..,则14414045ˆ0y y -=-=<..., 所以可以认为所得到的回归直线方程是理想的; (3)令销售利润为W ,则()()22532403248100(25125)W x x x x x =--+=-+-<<.....,因为()215321510032100802x x W x x -+⎛⎫=-+-≤⨯-= ⎪⎝⎭..,当且仅当15x x =-+,即75x =.时, W 取最大值. 所以该产品的销售单价定为7.5元/件时,获得的利润最大. 点睛:本题考查了线性回归方程的求法与应用问题,属中档题.20.(1)图见解析,变量,x y 线性相关;(2)0.50.4y x =+;(3)2.4百万元 【分析】(1)根据题中数据在直角坐标系中作出这五个点,即可得到散点图,并由图观察这些点是否在一条直线附近,即可判断; (2)根据公式分别求出55211,,,i iii i x y x y x==∑∑,即可求出;(3)由(2)中求出的回归方程,将4x =代入,即可估计利润额的大小. 【详解】解:(1)散点图如图所示.由散点图可以看出变量,x y 线性相关.(2)设线性回归方程是ˆˆy bxa =+. 因为552113.4,6,112,200i iii i y x x yx======∑∑,所以5152215ˆ0.55i ii ii x y xybxx ==-==-∑∑,ˆˆ 3.460.50.4ay bx =-=-⨯=, 即利润额y 对销售额x 的线性回归方程为0.50.4y x =+.(3)当销售额为4千万元时,利润额约为0.540.4 2.4y =⨯+=(百万元). 【点睛】。
青岛市选修三第三单元《成对数据的统计分析》检测(有答案解析)
一、选择题1.某校对学生进行心理障碍测试,得到的数据如下表:根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A .焦虑B .说谎C .懒惰D .以上都不对2.给出下列结论:在回归分析中(1)可用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好; (2)可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好; (4)可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,不.正确的是( ) A .(1)(3) B .(2)(3) C .(1)(4)D .(3)(4)3.给出如下列联表2(10.828)0.001P K ≥≈,2( 6.635)0.010P K ≥≈参照公式()()()()()2n ad bc k a b c d a c b d -=++++,得到的正确结论是( )A .有99%以上的把握认为“高血压与患心脏病无关”B .有99%以上的把握认为“高血压与患心脏病有关”C .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”4.已知具有线性相关的变量x ,y ,设其样本点为(),(1,2,,6)i i i P x y i =,回归直线方程为2y x a =+,若126(12,18)OP OP OP +++=(O 为坐标原点),则a =( )A .-1B .-6C .1D .65.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费x 和销售额y 进行统计,得到统计数据如表(单位:万元):由上表可得回归方程为10.2y x a =+,又已知生产该商品的成本(不含广告费)为2325x x+(单位:万元),据此模型预测最大的纯利润为( ) A .30.15万元B .21.00万元C .19.00万元D .10.50万元6.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58kg 、64kg 、58kg 、60kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量y 的回归方程为y bx a =+,其中0.5b =,据此模型预测他的孙子的体重约为( )A .58kgB .61kgC .65kgD .68kg7.已知()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢数学文化的人数占男生人数的16,女生喜欢数学文化的人数占女生人数23,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人B .22人C .20人D .18人8.小明同学在做一项市场调查时的如下样本数据:他由此样本得到回归直线的方程为 2.115.5y x =-+,则下列说法正确的是( ) A .变量x 与y 线性正相关 B .x 的值为2时,y 的值为11.3 C .6a =D .变量x 与y 之间是函数关系9.下列关于独立性检验的叙述:①常用等高条形图展示列联表数据的频率特征; ②独立性检验依据小概率原理;③样本不同,独立性检验的结论可能有差异;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,X 与Y 有关系的把握程度就越大.其中正确的个数为( ) A .1B .2C .3D .410.已知具有线性相关关系的五个样本点A 1(0,0),A 2(2,2),A 3(3,2),A 4(4,2)A 5(6,4),用最小二乘法得到回归直线方程l 1:y=bx+a ,过点A 1,A 2的直线方程l 2:y=mx+n 那么下列4个命题中(1) ,m b a n >>;(2)直线1l 过点3A ; (3)()()552211iiiii i y bx a y mx n ==--≥--∑∑; (4)5511iiiii i y bx a y mx n ==--≥--∑∑.(参考公式()()55115522211()i i i i i i iii i x y nxy x x y y b x nxx x ====---==--∑∑∑∑,a y bx =-)正确命题的个数有( ) A .1个B .2个C .3个D .4个11.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,线性相关,线性回归方程为0.7y x a =+,则以下判断正确的是( ) A .x 增加1个单位长度,则y 一定增加0.7个单位长度 B .x 减少1个单位长度,则y 必减少0.7个单位长 C .当6x =时,y 的预测值为8.1万盒 D .线性回归直线0.7y x a =+,经过点()2,612.已知呈线性相关的变量x 与y 的部分数据如表所示:y34.5m7.5 9若其回归直线方程是,则m =( )A .5.5B .6C .6.5D .713.已知,x y 的对应值表为:x0 1 3 4 5 6 y 1y 2y 3y 4y5y6y且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.5二、解答题14.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率分布直方图:(1)估计该景区每天游客数的中位数和平均数;(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8、3.7、5.1、5.6、6.8,已知这5天的最高气温(℃)依次为8、18、22、24、28.(ⅰ)根据以上数据,求游客数y 关于当天最高气温x 的线性回归方程(系数保留一位小数);(ⅱ)根据(ⅰ)中的回归方程,估计该景区这100天中最高气温在20℃~26℃内的天数(保留整数).参考公式:由最小二乘法所得回归直线的方程是ˆˆˆybx a =+;其中,()()()1122211ˆn niii ii i nni ii i x x y y x y nx ybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 本题参考数据:()()5170iii x x y y =--=∑,()521232ii x x =-=∑.15.近年来我国电子商务行业迎来蓬勃发展的新机遇,2016年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.(1)完成下面22⨯列联表,并通过计算说明是否可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关?2.072(2()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++)(2)若将频率视为概率,某人在该购物平台上进行的5次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列(概率用组合数算式表示); ②求X 的数学期望和方差.16.为初步了解学生家长对艺术素质评价的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下:(1)将学生家长对艺术素质评价的了解程度分为“比较了解”(得分不低于60分)和“不太了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99.9%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.附:()()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.17.某城市的公交公司为了方便市民出行,科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x 与乘客等候人数y 之间的关系,经过调查得到如下数据:调查小组先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检验.检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数y ,再求y 与实际等候人数y 的差,若差值的绝对值不超过1,则称所求方程是“恰当回归方程”.(1)若选取的是后面4组数据,求y 关于x 的线性回归方程y bx a =+,并判断此方程是否是“恰当回归方程”;(2)为了使等候的乘客不超过35人,试用(1)中方程估计间隔时间最多可以设置为多少(精确到整数)分钟?附:对于一组数据()11,x y ,()22,x y ,……,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:()()()11122211nni iii i nniii i x ynx y x x y y b xnxx x ====---==--∑∑∑∑,a y bx =-18.某大学生参加社会实践活动,对某公司1月份至6月份销售某种配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如下表所示:(1)根据1至5月份的数据,求出y 关于x 的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.5元,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想? (3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多少元才能获得最大利润?(注:利润=销售收入-成本).参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni i i n i i x y nxy b x nx==-=-∑∑,55211392,502.5,i ii i i x yx ====∑∑19.某中学研究性学习小组为了考察高中学生的作文水平与爱看课外书的关系,在本校高三年级随机调查了50名学生.调查结果表明,在爱看课外书的24人中有18人作文水平好,另6人作文水平一般;在不爱看课外书的26人中有7人作文水平好,另19人作文水平一般.(1)试根据以上数据完成以下2×2列联表,并运用独立性检验思想,指出有多大把握认为中学生的作文水平与爱看课外书有关系? 高中学生的作文水平与爱看课外书的2×2列联表(2)将其中某4名爱看课外书且作文水平好的学生分别编号为1、2、3、4,某4名爱看课外书且作文水平一般的学生也分别编号为1、2、3、4,从这两组学生中各任选1人进行学习交流,求被选取的两名学生的编号之和为2的倍数或3的倍数的概率.参考公22()()()()()n ad bc K a bc d a c b d -=++++其中n a b c d =+++·参考数据:0k2.7063.841 5.024 6.635 7.879 10.82820.某中学一名数学老师对全班50名学生某次考试成绩分男女生进行了统计,其中120分(含120分)以上为优秀,绘制了如下的两个频率分布直方图:(1)根据以上两个直方图完成下面的22⨯列联表: 成绩 性别 优秀不优秀合计男生 女生 总计(2)根据(1)中表格的数据计算,你有多大把握认为学生的数学成绩与性别之间有关系?0k2.072 2.7063.841 5.024 6.635 7.879 10.828()20P K k ≥ 0.150.100.050.025 0.010 0.0050.001(3)若从成绩在[130,140]的学生中任取2人,求取到的2人中至少有1名女生的概率. 21.我市今年参加高考的考生是首次取消文理科后的新高考考生,新高考实行“321++”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在[)15,45称为中青年,年龄在[)45,75称为中老年),并把调查结果制成下表: 年龄(岁) [)15,25[)25,35[)35,45[)45,55[)55,65[)65,75频数 5 15 10 10 5 5 了解4126521(1)请根据上表完成下面22⨯列联表,并判断是否有95%的把握认为对新高考的了解与年龄(中青年、中老年)有关?附:()()()()()22n ad bcKa b c d a c b d-=++++.(2)现采用分层抽样的方法从中老年人中抽取8人,再从这8人中随机抽取2人进行深入调查,求事件A:“恰有一人年龄在[)45,55”发生的概率.22.为了解某班学生喜欢数学是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表,已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3 5 .(1)请将上面的列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.005的前提下认为喜欢数学与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜欢数学的女生人数为ξ,求ξ的分布列与期望.下面的临界表供参考:(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)23.近期,某学校举行了一次体育知识竞赛,并对竞赛成绩进行分组:成绩不低于80分的学生为甲组,成绩低于80分的学生为乙组.为了分析竞赛成绩与性别是否有关,现随机抽取了60名学生的成绩进行分析,数据如下图所示的22⨯列联表.(1)将22⨯列联表补充完整,判断是否有90%的把握认为学生按成绩分组与性别有关? (2)如果用分层抽样的方法从甲组和乙组中抽取6人,再从这6人中随机抽取2人,求至少有1人在甲组的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.参考数据及公式:24.一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:经计算得:61()()557iii x x y y =--=∑,621()84ii x x =-=∑,621()3930i i y y =-=∑线性回归模型的残差平方和621()236.64iii y y =-=∑,8.06053167e ≈,其中,i i x y 分别为观测数据中的温度和产卵数,1,2,3,4,5,6i =(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程为0.2303ˆ0.06x ye =,且相关指数20.9522R =.①试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好.②用拟合效果好的模型预测温度为35℃时该用哪种药用昆虫的产卵数(结果取整数) 附:一组数据1122(,),(,)(,)n n x y x y x y 其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计为121()()ˆ()niii nii x x yy bx x ==--=-∑∑,ˆˆay bx =-;相关指数22121ˆ()1()niii nii y yR y y ==-=--∑∑.25.假设关于某设备的使用年限x (年)和所支出的维修费用y 万元有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0(1)画出散点图并判断是否线性相关; (2)如果线性相关,求线性回归方程; (3)估计使用年限为10年时,维修费用是多少?附注:①参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计分别为()()()1122211ˆˆˆ,n niii ii i nni ii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑; ②参考数据:55552111120,25,90,112.3ii ii i i i i i xy x x y ========∑∑∑∑26.随着智能手机的普及,各类手机娱乐软件也如雨后春笋般涌现. 如表中统计的是某手机娱乐软件自2018年8月初推出后至2019年4月底的月新注册用户数,记月份代码为t (如1t =对应于2018年8月份,2t =对应于2018年9月份,…,9t =对应于2019年4月份),月新注册用户数为y (单位:百万人)(1)请依据上表的统计数据,判断月新注册用户与月份线性相关性的强弱;(2)求出月新注册用户关于月份的线性回归方程,并预测2019年5月份的新注册用户总数. 参考数据:91318.5i ii t y==∑,921364.2i i y ==∑8.2≈.回归直线的斜率和截距公式:()()()1122211ˆn niii ii i nni i i i t t y y t y ntybt t t nt ====---==--∑∑∑∑,ˆˆay bt =-. 相关系数()()niit t y y r --=∑(当||0.75r >时,认为两相关变量相关性很强. )注意:两问的计算结果均保留两位小数【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】分别求出三种关系的观测值,比较后可得结论. 【详解】解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为123,,K K K , 由表中数据可得:()2111056025200.86330802585K ⨯⨯-⨯=≈⨯⨯⨯,()2211010702010 6.36630802090K ⨯⨯-⨯=≈⨯⨯⨯,()2311015301550 1.41030806545K ⨯⨯-⨯=≈⨯⨯⨯,因为2K 的值最大,所以说谎与性别关系最大. 故选:B. 【点睛】本题考查独立性检验的应用,考查理解能力和计算能力.2.B解析:B由2R 越大,模型的拟合效果越好,2R 越大,模型的拟合效果越好,相关系数r 越大,模型的拟合效果越好,带状区域的宽度越窄,说明模型的拟合精度越高,作出判断即可. 【详解】用相关指数2R 的值判断模型的拟合效果,2R 越大,模型的拟合效果越好,故(1)正确; 用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确;可用相关系数r 的值判断模型的拟合效果,r 越大,模型的拟合效果越好,故(3)不正确;用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确; 故选:B 【点睛】本题主要考查了相关系数和相关指数的性质,属于中档题.3.B解析:B 【分析】根据所给的列联表,利用公式求出这组数据的观测值,把观测值同临界值进行比较,即可得到结果. 【详解】由列联表中的数据可得2K 的观测值,()22110205010307.486 6.63530805060K ⨯-⨯==≥⨯⨯⨯,根据参考数据:2 6.6350.01p K ≥=,∴有10.0199%-=的把握认为高血压与患心脏病有关,即有99%的把握认为高血压与患心脏病有关,故选B. 【点睛】本题考查独立性检验的应用,属于基础题. 独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.4.A【分析】根据向量相等的坐标表示,由此即可计算平均数 ,x y ,得到样本点的中心的坐标(),x y ,代入回归直线方程求出结果. 【详解】因为样本点为(),(1,2,,6)i i i P x y i =且126(12,18)OP OP OP +++=,所以1261261218x x x y y y ++⋯+=⎧⎨++⋯+=⎩ 所以()123456112266x x x x x x x =+++++== , ()126118366y y y y =++⋯+==; 又回归直线方程为2y x a =+过(),x y , ∴322a =⨯+,解得1a =-, 故选:A . 【点睛】本题主要考查了线性回归方程必过样本中心、向量相等的坐标表示等基础知识,属于基础题.5.C解析:C 【分析】首先计算ˆa,然后根据条件写出纯利润的函数()22321410.29.29.2555x x x x x x ⎛⎫++-+=-++ ⎪⎝⎭,再求其最大值.【详解】2345645x ++++==,2941505971505y ++++==,ˆ5010.24a∴=⨯+,解得:ˆ9.2a =, ∴回归方程为ˆ10.29.2y x =+, 纯利润为()()2223214110.29.29.27195555x x x x x x x ⎛⎫++-+=-++=--+ ⎪⎝⎭, 当且仅当7x =时,纯利润取得最大值19. 故选:C 【点睛】本题考查回归直线方程,数学建模,二次函数求最值,重点考查理解题意,并能抽象概括出函数,属于基础题型.6.B解析:B 【分析】由已知得出数据,()58,58,()64,62,()58,60,根据回归直线过样本中心点,可求得(),x y ,计算求得a ,代入62x =,即可得出结果.【详解】由已知,体重是隔代遗传,且呈线性相关,得出数据,()58,58,()64,62,()58,60, 所以()(),=60,60x y ,代入y bx a =+,其中0.5b =,求得=30a , 即0.530y x =+.62x =时, 0.56230y =⨯+=61.故选:B 【点睛】本题主要考查线性回归方程的相关计算,考查学生分析问题的能力,属于中档题.7.D解析:D 【分析】设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.【详解】设男生至少有x 人,根据题意,可列出如下22⨯联表:则23111532663611822x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即36.6358x , 解得17.693x ,由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】本题考查独立性检验,属于基础题.8.C解析:C 【分析】计算样本中线点,根据线性回归方程恒过样本中心点,列出方程,求解即可得到结论. 【详解】由题意,136********,444a ax y +++++++====, 因为y 关于x 的线性回归方程为: 2.115.ˆ5yx =-+, 所以得到14 2.1515.54a+=-⨯+,解得6a =, 根据题意可得变量x 与y 线性负相关,所以A 错, x 的值为2时,y 的值大约为11.3,所以B 错,变量x 与y 之间是相关关系,所以D 错,只有C 是正确的,故选C. 【点睛】该题考查的是有关线性回归的问题,涉及到的知识点有回归直线恒过样本中心点,两个变量之间的正负相关的判断,属于简单题目.9.C解析:C 【解析】分析:根据独立性检验的定义及思想,可得结论.详解:①常用等高条形图展示列联表数据的频率特征;正确; ②独立性检验依据小概率原理;正确;③样本不同,独立性检验的结论可能有差异;正确;④对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越大,X 与Y 有关系的把握程度就越大.故④错误. 故选C.点睛:本题考查了独立性检验的原理,考查了推理能力,属于基础题.10.B解析:B 【解析】分析:先求均值,再代公式求b,a ,再根据最小二乘法定义判断命题真假. 详解:因为023*******3,255x y ++++++++==== ,所以直线1l 过点3A ;因为515221i i i i i x y nxy b x nx==-=-∑∑,所以0.6b =因为a y bx =-,所以0.2a =,因为过点A 1,A 2的直线方程,所以2:l y x = ,即,m b a n >>; 根据最小二乘法定义得()()552211ii i i i i ybx a y mx n ==----∑∑; (4)5511iiiii i y bx a y mx n ==----∑∑.因此只有(1)(2)正确,选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .11.C解析:C 【分析】通过线性回归方程可以进行预测而不能做出确定的判断,排除A ,B 选项;线性回归方程一定过样本中心点(,)x y ,排除D 选项;令6x =,代入方程求y ,可得C 正确. 【详解】由ˆˆ0.7yx a =+,得x 每增(减)一个单位长度,y 不一定增加(减少)0.7,而是大约增加(减少)0.7个单位长度,故选项A,B 错误;由已知表中的数据,可知12345556683,655x y +++=++++====,则回归直线必过点(3,6),故D 错误;代入回归直线ˆˆ0.7y x a =+,解得ˆ 3.9a =,即ˆ0.7 3.9y x =+,令6x =,解得ˆy=0.76 3.98.1⨯+=万盒, 故选:C 【点睛】本题考查了线性回归方程的性质,正确掌握线性回归方程的性质是解题的关键.12.C解析:C 【分析】 先求出5x =,245m y +=,再根据回归方程过样本中心,可求出参数m 的值. 【详解】 由题意可得2456855x ++++==,3 4.57.592455m m y +++++==,则241.0550.855m +=⨯+,解得 6.5m =. 故选:C. 【点睛】本题考查根据回归方程过样本中心求原始数据,注意不能将5x =代入回归方程求m 的值 ,属于中档题.13.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.二、解答题14.(1)3750人,3820人;(2)(ⅰ)ˆ0.3 1.6yx =-;(ⅱ)26天. 【分析】(1)直接利用频率分布直方图求中位数和平均数;(2)(ⅰ)利用最小二乘法求y 关于当天最高气温x 的线性回归方程;(ⅱ)先求出最高气温在20℃~26℃内的频率,再求估计该景区这100天中最高气温在20℃~26℃内的天数.. 【详解】(1)左边三个矩形的面积之和为0.32,左边四个矩形的面积之和大于0.5,故中位数在第四个矩形中, 所以中位数为:0.1831 3.750.24+⨯=. 平均数为:0.50.07 1.50.09 2.50.16 3.50.24 4.50.18⨯+⨯+⨯+⨯+⨯5.50.146.50.077.50.05 3.82+⨯+⨯+⨯=,所以,该景区这一百天中每天游客数的中位数约为3750人,平均数约为3820人. (2)(ⅰ)20x =, 4.4y =,70ˆ0.3232b =≈,ˆˆ 4.40.320 1.6a y bx =-=-⨯=-, ˆ0.3 1.6yx ∴=-. (ⅱ)当最高气温在20℃~26℃内时,当20x时,ˆ0.320 1.6=4.4y=⨯-; 当26x =时,ˆ0.326 1.6=6.2y=⨯-; 根据ˆ0.3 1.6yx =-得游客数在4.4~6.2内, 直方图中这个范围内方块的面积为:()()5 4.40.180.14 6.260.070.262-⨯++-⨯=, 天数为0.26210026⨯≈,所以,这100天中最高气温在20℃~26℃内的天数约为26天. 【点睛】关键点睛:解答本题的关键是通过频率分布直方图求出最高气温在20℃~26℃内的频率,再求频数得解.15.(1)列联表见解析,可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关;(2)①分布列见解析;②()2E X =,() 1.2D X =. 【分析】(1)根据题中数据即可完善列联表,计算出卡方值,和10.828比较,即可判断; (2)①可得X 的取值可以是0,1,2,3,4,5,且()5,0.4X B ,计算出X 取不同值的概率,即可得出分布列; ②利用期望和方差公式即可求出. 【详解】(1)由题可得22⨯列联表如下:所以2200(80104070)11.11110.8281505012080K ⨯⨯-⨯=≈>⨯⨯⨯,所以可以在犯错误概率不超0.1%的前提下,认为商品好评与服务好评有关; (2)①每次购物时,对商品和服务全好评的概率为800.4200=,且X 的取值可以是0,1,2,3,4,5,()5,0.4XB则()500.6P X ==,()14510.40.6P X C ==⨯⨯,()223520.40.6P X C ==⨯⨯,()332530.40.6P X C ==⨯⨯,()44540.40.6P X C ==⨯⨯,()550.4P X ==,则分布列如下:②5,0.4XB ,()50.42E X ∴=⨯=,()50.40.6 1.2D X =⨯⨯=.【点睛】关键点睛:本题考查分布列的求解,解题的关键是判断出变量服从二项分布,知道二项分布的概率求法以及期望方差公式.16.(1)有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)分布列见解析,21()10E X = 【分析】(1)完成列联表,求出211.2910.828X ≈>,从而有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)推导出7~3,10X B ⎛⎫⎪⎝⎭,由此能求出X 的概率分布和数学期望. 【详解】解:(1)由题意得到列联表如下:2()100(2537335)11.29()()()()30704258n ad bc K a b c d a c b d -⨯-⨯==≈++++⨯⨯⨯.11.2910.828>,∴有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关.(2)由题意得该校1名学生家长“比较了解”的概率为70710010=,且7~(3,)10X B ,033327(0)()101000P X C ===,12373189(1)()()10101000P X C ===,22373441(2)()()10101000P X C ===,3337343(3)()101000P X C ===,X ∴的分布列为:()0123100010001000100010E X =⨯+⨯+⨯+⨯=. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. 17.(1) 1.49.6y x =+,是;(2)18分钟. 【分析】(1)由题意求出x 、y 、41i ii x y =∑、421ii x=∑,代入公式求得b 、a 即可求得线性回归方程;根据“恰当回归方程”的概念直接判断即可得解; (2)令1.49.635x +≤,解出1187x ≤后,即可得解. 【详解】(1)由后面四组数据求得1213141513.54x +++==,2629283128.54y +++==,411546i ii x y==∑,421734i i x ==∑,∴4142221275741546422 1.427473442i ii i i x y x yb x x==--⨯⨯===⎛⎫--⨯ ⎪⎝⎭∑∑, 28.5 1.413.59.6a y bx =-=-⨯=.∴ 1.49.6y x =+.当10x =时, 1.4109.623.6y =⨯+=,而23.6230.61-=<; 当11x =时, 1.4119.625y =⨯+=,而252501-=<. ∴求出的线性回归方程是“恰当回归方程”;(2)由1.49.635x +≤,得1187x ≤,故间隔时间最多可设置为18分钟. 【点睛】本题考查了线性回归方程的求解及应用,考查了运算能力及对于新概念的理解,属于中档题.18.(1)ˆ3240yx =-+.. (2) 可以认为所得到的回归直线方程是理想的.(3) 该产品的销售单价定为7.5元/件时,获得的利润最大. 【解析】分析:(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 详解: (1)因为()()11995101051110,1110865855x =++++==++++=.., 所以23925108325025510ˆb-⨯⨯==--⨯..,则()ˆ8321040a =--⨯=., 于是y 关于x 的回归直线方程为ˆ3240y x =-+.; (2)当8x =时, 32840144ˆy=-⨯+=..,则14414045ˆ0y y -=-=<..., 所以可以认为所得到的回归直线方程是理想的; (3)令销售利润为W ,则()()22532403248100(25125)W x x x x x =--+=-+-<<.....,因为()215321510032100802x x W x x -+⎛⎫=-+-≤⨯-= ⎪⎝⎭..,当且仅当15x x =-+,即75x =.时, W 取最大值. 所以该产品的销售单价定为7.5元/件时,获得的利润最大. 点睛:本题考查了线性回归方程的求法与应用问题,属中档题.19.(1)列联表见解析;有99.9%的把握认为中学生的作文水平与爱看课外书有关系;(2)58. 【分析】(1)先根据题意完成列联表,再计算2K ,进而根据独立性检验的思想即可得答案. (2)先写出所有的基本事件总数,再写出两名学生的编号之和为2的倍数或3的倍数的基本事件,进而根据古典概型计算即可得答案. 【详解】解:(1)根据题意得列联表如下:所以()22250181967()15011.5310.828()()()()2525242613n ad bc K a b c d a c b d ⨯⨯-⨯-===≈>++++⨯⨯⨯由表知,()210.8280.001P K ≥≈所以有99.9%的把握认为中学生的作文水平与爱看课外书有关系. (2)设两名学生的编号之和为2的倍数或3的倍数的事件为A , 根据题意得,选取的学生编号的所有可能有:()()()()1,1,1,2,1,3,1,4,()()()()2,1,2,2,2,3,2,4,()()()()3,1,3,2,3,3,3,4,()()()()4,1,4,2,4,3,4,4,共16种可能结果,其中两名学生的编号之和为2的倍数或3的倍数的有:()()()1,1,1,2,1,3,()()()2,1,2,2,2,4,()()3,1,3,3,()()4,2,4,4共10种可能结果,故()105168P A ==, 【点睛】本题考查独立性检验的思想,古典概型,考查运算能力,是中档题.20.(1)详见解析;(2)有95%的把握认为学生的数学成绩与性别之间有关系;(3)35. 【分析】(1)根据表格数据填写好22⨯联表;(2)计算出2K 的数值,由此判断出所以有95%的把握认为学生的数学成绩与性别之间有关系.(3)先计算出男生、女生分别有多少人,然后用1减去全部都是男生的概率,求得所求的概率. 【详解】 (1)(2)由(1)中表格的数据知, 4.844K ≈.因为2 4.844 3.841K ≈>,所以有95%的把握认为学生的数学成绩与性别之间有关系.。
数据分析课后答案spss
习题1.3統計資料全国居民N有效22遺漏0平均數1117.00中位數727.50標準偏差1015.717變異數1031680.286偏斜度 1.025偏斜度標準誤.491峰度-.457峰度標準誤.953百分位數25304.25 50727.50 751893.50(1).由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为1117.00、1031680.286、1015.717、1.025、-0.457。
变异系数有公式计算得90.9325。
(2)中位数为727.50,上四分位数304.35,下四分位数为1893.50。
四分位极差由公式得到1579.15三均值由公式得到913.1857。
(3)直方图(4)茎叶图全国居民 Stem -and -Leaf PlotFrequency Stem & Leaf9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1(%)*100cv _x s=131Q Q R -=31412141Q M Q M ++=∧Stem width: 1000Each leaf: 1 case(s)(5)由箱图可以看出并不异常点。
統計資料农村居民N有效22遺漏0平均數747.86中位數530.50標準偏差632.198變異數399673.838偏斜度 1.013偏斜度標準誤.491峰度-.451峰度標準誤.953百分位數25239.7550530.50751197.00(1).由图可知农村居民的平均数、方差、标准差、偏度、峰度分别为747.86、399673.838、632.198、1.013、-0.451。
由公式可以算得变异系数为84.5342。
(2)中位数530.50,上四分位数239.75,下四分位数1197.00。
由公式可得四分位极差为957.25,三均值为624.4375。
spss统计练习题及答案
s p s s统计练习题及答案(共4页) -本页仅作为预览文档封面,使用时请删除本页-SPSS统计练习题及答案一、选择题(选择类)(A)1、在数据中插入变量的操作要用到的菜单是:A Insert Variable;B Insert Case;C Go to Case;D Weight Cases(C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是:A Sort Cases;B Select Cases;C Compute;D Categorize Variables(C)3、Transpose菜单的功能是:A 对数据进行分类汇总;B 对数据进行加权处理;C 对数据进行行列转置;D 按某变量分割数据(A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明:,说明三种城市的平均身高有差别;A. 按照显著性水平,拒绝HB. 三种城市身高没有差别的可能性是;C. 三种城市身高有差别的可能性是;D. 说明城市不是身高的一个影响因素(B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异;B 服用某种药物前后病情的改变情况;C 服用药物和没有服用药物的病人身体状况的差异;D性别和年龄对雇员薪水的影响二、填空题(填空类)6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。
7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。
8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。
三、名词解释(问答类)9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
选修3-4章综合及模块试题及答案(26份-第13章光单元001
第十三章光单元检测本卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分100分,时间90分钟.第Ⅰ卷(选择题共40分)一、选择题(共10小题,每小题4分,共40分,在每小题给出的四个选项中,有的小题只有一个选项符合题目要求,有些小题有多个选项符合题目要求,全部选对的得4分,选不全的得2分,有选错或不答的得0分)1.检查视力时人与视力表之间的距离应为5m,现因屋子太小而使用一个平面镜,视力表到镜子的距离为3m,如图所示,那么人到镜中的视力表的距离和人到镜子的距离分别为()A.5m,2m B.6m,2mC.4.5m,1.5m D.4m,1m答案:A2.表面附有油膜的透明玻璃片,当有白光照射时,可在照射面及玻璃片的边缘分别看到彩色图样,则这两者()A.都是色散现象B.都是干涉现象C.前者是干涉,后者是色散D.前者是色散,后者是干涉答案:C解析:光线照射到透明玻璃片的表面时,光线在油膜的前后表面分别反射,形成薄膜干涉,可在照射面前边看到彩色的条纹;同时,部分光线进入玻璃在玻璃中反射,有部分光线从边缘出来,玻璃片的边缘相当于棱镜,发生色散,可从玻璃片的旁边看到彩色图样,选项C正确.3.下图所示的4种明暗相间的条纹,分别是红光、蓝光各自通过同一个双缝干涉仪器形成的干涉图样以及黄光、紫光各自通过同一个单缝形成的衍射图样(灰黑色部分表示亮纹).则在下面的四个图中从左往右排列,亮条纹的颜色依次是()A.红黄蓝紫B.红紫蓝黄C.蓝紫红黄D.蓝黄红紫答案:B4.下面是四种与光有关的事实,其中与光的全反射有关的是()①用光导纤维传播信号②用透明的标准样板和单色光检查平面的平整度③一束白光通过三棱镜形成彩色光带④水面上的油膜呈现彩色A.①B.②④C.③④D.②③答案:A解析:光导纤维利用光的全反射来传播信号,白光通过三棱镜是光的色散,平面平整度的检查和水面上的彩色油膜是光的干涉现象,则选项A正确.5.高层建筑物外墙大量使用的幕墙玻璃,在白天时外面的人看不清室内的物体,而室内的人却能较清楚地看见外面的景物,其原因是()A.在玻璃的外表面涂有增透膜B.在玻璃的外表面涂有高反膜(对光的反射率远大于透射的物质)C.在玻璃的外表面涂有能大量吸收光的物质D.在玻璃的外表面涂有不透光的彩色薄膜答案:B6.a、b两种单色光以相同的入射角从空气中射入介质中时,如图所示发现b的折射线更靠近法线,由此可判定()A.a比b更容易发生衍射现象B.当光从介质射向空气中,a、b要发生全反射的临界角分别为C a、C b,则C a<C b C.在介质中b的速度较大D.单色光b的频率较低答案:A解析:如图,由sin θ1sin θ2=n 可知b 的折射率大于a 的折射率.所以b 的频率较大,a 的频率较小,D 错误.由频率大小进一步可知,a 频率较小更容易发生衍射现象,A 正确.由n =c v 可知介质中v a >b b ,C 项错误.由sin C =1n可知C a >C b ,B 错误.7.如图,一束单色光射入一玻璃球体,入射角为60°,已知光线在玻璃球内经一次反射后,再次折射回到空气中时与入射光线平行,此玻璃的折射率为( )A. 2 B .1.5 C. 3D .2答案:C解析:其光路图如下图所示,由几何关系知r =30°,折射率n =sin60°sin30°=3,故C 正确.8.根据图中的漫画,判断下列说法中正确的是( )A .人看到的是鱼的实像,位置变浅了些B .人看到的是鱼的虚像,位置变浅了些C .鱼看到的是人的实像,位置偏低了些D .鱼看到的是人的虚像,位置偏高了些 答案:BD解析:人看鱼的光路如图甲所示,因入射角i 小于折射角r ,则人将看到鱼的虚像,且位置比实际情况变浅了些,B 正确;鱼看到人的光路如图乙所示,因入射角i 大于折射角r ,则鱼将看到人的虚像,且比实际位置要高,D 正确.9.如图是一个14圆柱体棱镜的截面图,图中E 、F 、G 、H 将半径OM 分成5等份,虚线EE 1、FF 1、GG 1、HH 1平行于半径ON ,ON 边可吸收到达其上的所有光线.已知该棱镜的折射率n =53,若平行光束垂直入射并覆盖OM ,则光线( )答案:B10.如图所示,有一束平行于等边三棱镜截面ABC 的单色光从空气射向E 点,并偏折到F 点.已知入射方向与边AB 的夹角为θ=30°,E 、F 分别为边AB 、BC 的中点,则( )A .该棱镜的折射率为 3B .光在F 点发生全反射 C.光从空气进入棱镜,波长变小D .从F 点出射的光束与入射到E 点的光束平行 答案:AC解析:由几何关系可知,入射角θ1=60°,折射角θ2=30°.由折射定律n =sin θ1sin θ2=3212=3,A 选项正确;在BC 界面上,入射角为30°,临界角的正弦值为sin C =1n =33>sin30°,即C >30°,所以在F 点,不会发生全反射,B 选项错误;光从空气进入棱镜,频率f 不变,波速v 减小,所以λ=vf减小,C 选项正确;由上述计算结果,作出光路图,可知D 选项错误.第Ⅱ卷(非选择题 共60分)二、填空题(共3小题,每小题5分,共15分.把答案直接填在横线上) 11.“用双缝干涉测光的波长”的实验中,实验装置如图甲所示.(1)某同学以线状白炽灯为光源,对实验装置进行调节并观察了实验现象后,总结出以下几点a .灯丝与单缝和双缝必须平行放置b .干涉条纹与双缝垂直c .干涉条纹的疏密程度与单缝宽度有关d .干涉条纹的间距与光的波长有关 以上几点中,你认为正确的是__________.(2)当测量头中的分划板中心刻度对准某条纹的中心时,手轮上的示数如图乙所示,该读数为________mm.(3)如果测量头中的分划板中心刻度线与干涉条纹不在同一方向上,如图丙所示.则在这种情况下来测量干涉条纹的间距Δx时,测量值__________实际值.(填“大于”、“小于”或“等于”)答案:(1)ad(2)0.702(0.701-0.703均算对)(3)大于12.如图所示,是利用插针法测定玻璃砖的折射率的实验得到的光路图.玻璃砖的入射面AB和出射面CD并不平行,则(1)出射光线与入射光线__________.(填仍平行或不再平行)(2)以入射点O为圆心,以R=5cm长度为半径画圆,与入射线PO交于M点,与折射线的延长线OQ交于F点,过M、F点分别向法线作垂线,量得MN=1.68cm,FE=1.12cm,则该玻璃砖的折射率n=__________.答案:(1)不再平行(2)1.513.登山运动员在登雪山时要注意防止紫外线的过度照射,尤其是眼睛更不能长时间被紫外线照射,否则将会严重地损伤视力.有人想利用薄膜干涉的原理设计一种能大大减小紫外线对眼睛伤害的眼镜.他选用的薄膜材料的折射率为n=1.5,所要消除的紫外线的频率为γ=8.1×1014Hz.(1)他设计的这种“增反膜”所依据的原理是__________________________.(2)这种“增反膜”的厚度是______________.(3)请判断以下有关薄膜干涉的说法正确的是()A.薄膜干涉说明光具有波动性B.如果薄膜的厚度不同,产生的干涉条纹一定不平行C.干涉条纹一定是彩色的D.利用薄膜干涉也可以“增透”答案:(1)两反射光叠加后加强(2)1.23×10-7m(3)A、D解析:为了减少进入眼睛的紫外线,应使入射光分别从该膜的前后两个表面反射出来形成的光叠加后加强,则光程差(大小等于薄膜厚度d的2倍)应等于光在薄膜中的波长λ′的整数倍,即2d =Nλ′(N =1,2,…),因此,膜的厚度至少是紫外线在膜中波长的12.紫外线在真空中的波长是λ=c /γ=3.7×10-7m.在膜中的波长是λ′=λ/n =2.47×10-7m ,故膜的厚度至少是1.23×10-7m.干涉和衍射都证明光具有波动性,如果薄膜厚度均匀变化,则干涉条纹一定平行,白光的干涉为彩色条纹,单色光的干涉则为该色光颜色,当膜的厚度为四分之一波长时,两反射光叠加后减弱则会“增透”.三、论述·计算题(共5小题,共45分.解答应写出必要的文字说明、方程式和重要演算步骤,只写出最后答案不能得分,有数值计算的题,答案中必须明确写出数值和单位)14.(8分)空中有一只小鸟,距水面3m ,其正下方距水面4m 深处的水中有一条鱼.已知水的折射率为4/3.(1)鸟从空中看到水中的鱼离它的距离是多少? (2)鱼在水中看空中的鸟离它的距离是多少? 答案:(1)6m (2)8m解析:(1)首先作出鸟看鱼的光路图,如图所示.由于是在竖直方向上看,所以入射角很小,即图中的i 和r 均很小,故有tan i =sin i ,tan r =sin r .由图可得:h 1tan r =h ′tan i ,h ′=h 1tan r /tan i =h 1sin r /sin i =h 1n =4×34m =3m则鸟看水中的鱼离它:H 1=(3+3)m =6m (2)同理可得鱼看鸟时:h ″=nh 2=3×43m =4m则H 2=(4+4)m =8m15.(8分)为了减少光在透镜表面由于反射带来的损失,可在透镜表面涂上一层增透膜,一般用折射率为1.38的氟化镁,为了使波长为5.52×10-7m 的绿光在垂直表面入射时使反射光干涉相消,求所涂的这种增透膜的厚度.答案:1×10-7m解析:由于人眼对绿光最敏感,所以通常所用的光学仪器其镜头表面所涂的增透膜的厚度只使反射的绿光干涉相消,但薄膜的厚度不宜过大,只需使其厚度为绿光在膜中波长的14,使绿光在增透膜的前、后两个表面上的反射光互相抵消.而光从真空进入某种介质后,其波长会发生变化.若绿光在真空中波长为λ0,在增透膜中的波长为λ,由折射率与光速的光系和光速与波长及频率的关系得:n =c v =λ0f λf ,得λ=λ0n ,那么增透膜厚度d =14λ=λ04n =5.52×10-74×1.38m =1×10-7m.16.(9分)(2009·高考江苏物理,12)下图是北京奥运会期间安置在游泳池底部的照相机拍摄的一张照片,相机的镜头竖直向上.照片中,水立方运动馆的景象呈现在半径r =11cm 的圆形范围内,水面上的运动员手到脚的长度l =10cm.若已知水的折射率n =43,请根据运动员的实际身高估算该游泳池的水深h .(结果保留两位有效数字)答案:2.1m解析:设照片圆形区域的实际半径为R ,运动员的实际长为L ,由折射定律n sin α=sin90°由几何关系sin α=R R 2+h 2,R r =Ll得h =n 2-1·L lr取L =2.2m ,解得h =2.1(m)(1.6~2.6m 都算对)17.(10分)为从军事工事内部观察到外面的目标,在工事壁上开一长方形孔.设工事壁厚d =34.64cm ,孔的宽度L =20cm ,孔内嵌入折射率n =3的玻璃砖如图所示,试问:(1)嵌入玻璃砖后,工事内部人员观察到外界的视野的最大张角为多少? (2)要想使外界180°范围内景物全被观察到,应嵌入多大折射率的玻璃砖?答案:(1)120° (2)2解析:当人眼处于底端左边呈对角线向外看时,视野最大,光路如图所示,又d =34.64cm ,L =20cm ,则tan β=2034.64=13,所以β=30° (1)折射定律sin αsin β=3,所以α=60°(2)要使视野的张角为180°,即α′=90°,由折射定律得sin90°sin β=n ,所以n =218.(10分)单色细光束射到折射率n =2的透明球面,光束在过球心的平面内,入射角i =45°,研究经折射进入球内后,又经内表面反射一次,再经球面折射后射出的光线,如下图所示(图上已画出入射光和出射光).(1)在图上大致画出光线在球内的路径和方向. (2)求入射光与出射光之间的夹角α(3)如果入射光是一束白光,透明球的色散情况与玻璃相仿,问哪种颜色光的α角最大,哪种颜色光的α角最小?答案:(1)参看解析;(2)30°;(3)红光的α最大,紫光的α最小解析:(1)光线从入射到出射的光路如下图所示.入射光线AB 经玻璃折射后,折射光线为BC ,又经球内壁反射后,反射光线为CD ,再经折射后,折射出的光线为DE .OB 、OD 为球的半球,即为法线.(2)由折射定律sin i sin r =n ,得sin r =sin i n =2/22=12∴r =30°由几何关系及对称性,有α2=r -(i -r )=2r -i∴α=4r -2i ,把r =30°,i =45°代入得α=30°(3)由(2)问解答可知,i =45°,n 越小,sin r 越大,r 角越大,同时α=2r -i . ∴红光的α最大,紫光的α最小.。
(苏教版)选修3课时作业:专题1-揭示物质结构的(含答案)
1.最早提出科学的分子概念的科学家是( )A.道尔顿B.阿伏加德罗C.门捷列夫 D.卢瑟福【解析】道尔顿、门捷列夫、卢瑟福和阿伏加德罗的主要贡献分别是提出原子学说、元素周期律、原子的有核模型和分子的概念,B项正确。
【答案】 B2.门捷列夫的突出贡献是( )A.提出原子学说 B.提出分子学说C.发现元素周期律 D.发现能量守恒定律【解析】门捷列夫的贡献是发现了元素周期律并绘制出第一张元素周期表。
A、B两项分别为道尔顿和阿伏加德罗的贡献。
【答案】 C3.(2018·杭州高二质检)科学家已成功合成了少量O4(OOOO),有关O4的说法正确的是( )A.O4与O3、O2互为同素异形体B.O4比O2稳定C.相同质量的O4与O3所含原子个数比为4∶3D.O4的摩尔质量是64 g【解析】O4是一种新的氧分子,A正确;能在自然界稳定存在的物质,化学性质较稳定,故O2稳定,B错误;相同质量时,O原子个数比为1∶1,C错误;摩尔质量的单位是g·mol-1,D错误。
【答案】 A4.科学研究发现铂的两种化合物(短线表示化学键)有不同的特性,其中a具有抗癌作用,而b没有。
下列正确的说法是( )A.a、b分子中,Pt原子与2个Cl原子、2个N原子间形成的结构与CH2Cl2相似B.a、b是不同物质C.a、b互为同素异形体D.a、b是同一物质【解析】a、b两种分子的结构都是四边形,但它们中的—Cl与—NH2所处位置不同,前者是顺式,后者是反式,互为顺反异构体;a、b结构不同,化学性质不同,不是同一物质;同素异形体是对于单质而言的,不能用于化合物。
【答案】 B5.用化学方法不能实现的是( )A.生成一种新分子 B.生成一种新离子C.生成一种新原子 D.生成一种新单质【解析】化学反应中,元素的种类不变,不会有新原子生成。
A生成一种新分子,如:H2+Cl2―→HCl,正确;B生成一种新离子,如:Na+H2O―→NaOH+H2↑,正确;D生成一种新单质,如:Al+Fe2O3―→Fe+Al2O3,正确。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Assignment 3
Please download the Dataset: gss.sav in Data sets file from the ISPace
Q1. Consider the variable age and vote96 for the following a, b and c questions.
a. Obtain a stem-and-leaf plot of age for people who were ineligible.
How many people are 22 years old? More than 32 years old? And describe the distribution.
Age of respondent Stem-and-Leaf Plot for
vote96= INELIGIBLE
Frequency Stem & Leaf
30.00 1 . 888889999999999999999999999999
39.00 2 . 000000000000001111111111111111111122223
2.00 2 . 58
1.00 3 . 1
20.00 Extremes (>=35)
Stem width: 10
Each leaf: 1 case(s)
4 people are 22 years old and 20 people are more than 32 years old. The distribution is right skewed. More younger people were ineligible in 1996 election. There’s a peak ranging from 20 to 23.
b. Obtain side-by-side box plots (arrange two box plots in one picture) of age for
people who voted and those who did not. Summarize your findings.
Form the above figure, we can see that the variabilities of ages are almost the same for people who voted and those who did not according to the interquartile ranges or range. And the distributions of ages are right skewed in these two groups. But there are some mild outliers in the “did not vote” group. But the typical age for people who voted is higher than those who did no t according to the median. So the old people have more political consciousness than the young.
c. Find out the ages of five oldest people who were ineligible using the
appropriate table.
Q2. Consider the variables netcat,age and sex. Calculate the average age of men and women in each of the categories of Internet use. Summarize your findings including appropriate table and plot.
From the above table and graph, we can see that for the categories that people use the internet for 1+ to 4 hours and 4+ to 10 hours, the average age of men is less than that of women. For the other categories, they don’t differ much.。