《统计分析帮你做预测》习题
2015年暨南大学统计学考研样题讲解及分析

专业课的复习和应考有着与公共课不同的策略和技巧, 虽然每个考生的专业不同, 但是在总 体上都有一个既定的规律可以探寻。 以下就是针对考研专业课的一些十分重要的复习方法和 技巧。 一、 专业课考试的方法论对于报考本专业的考生来说, 由于已经有了本科阶段的专业基 础和知识储备, 相对会比较容易进入状态。 但是,
试形式和内容,因此复习也应该有相应的方法和节奏。认真研究历年试题,分析出题方向和 特点,这是专业课备考的关键。这里强调两点:一是分析试题这项工作要提早,因为这对你 看各种考研书籍和资料有重要的指导意义;另外不仅要思考,还要动笔,要认认真真把每一 道考研题落实到字面上,你会发现很多原来没有想到过的东西。同时,这种训练可以避免真 正考试时因时间仓促和心理压力带来的表达上的不成熟。 有些学校的部分专业没有指定的参考书目, 这样真题就更为重要了。 真题不是拿来做完 了事的,要从命题人的角度、命题者的思路去推测出题偏好,推测这个院系的教学风格。 考 生复习时, 每复习一遍或每过一段时间, 就应该拿出真题研究一下, 结合年内的行业热点 (无 论是文科还是理科, 其核心期刊总会反映年度热点问题) 和近期理论界的研究争论焦点进行 分析。事实证明,考生对专业真题的钻研确实可以让考生猜到那么几十分的题目。专业课的 真题,要训练对分析题的解答,把自己的答案切切实实写在纸上,不要打腹稿(这样有时候 感觉自己给分点都答到了, 实际上却相差很远) , 再反复对照自己和参考答案 (如果有的话) 的差别,分析答题角度,揣摩命题人意图,并用同一道题在相隔一定时间后反复训练,慢慢 完善自己此类题型的解答方法。 历年题是专业课的关键, 而融会贯通则是关键中的关键。 考研的专业课考题大体有两种 类型,一种是认知性质的考题,另一种是理解与应用型的,而且以后一种居多。因此,同学 们在复习时绝不能死记硬背条条框框, 而应该看清条条框框背后所包含的东西, 并且加以灵 活运用。在复习时,首先要把基本概念、基本理论弄懂,然后要把它们串起来,多角度、 多 层次地进行思维和理解。 由于专业的各门功课之间有着内在的相关性, 如果能够做到融会贯 通,无论对于理解还是记忆,都有事半功倍的效果。考生完全可以根据历年的考题,在专业 课本中划出历年涉及的重点,有针对性、有侧重点地进行复习。 针对笔记、 真题以及热点问题, 下面的提纲可能会比较快速地让考生朋友掌握以上的内 容:1 专业课笔记一般来说,大部分高校的专业课都是不开设专业课辅导班的,这一点在 05年的招生简章中再次明确。因此对于外校考生,尤其是外地区考生,也就是那些几乎不可 能来某高校听课的考生,专业课笔记尤为重要。可以说,笔记是对指定参考书最好的补充。 如果条件允许,这个法宝一定要志在必得。在具体操作上,应先复习书本,后复习笔记, 再 结合笔记来充实参考书。笔记的搜集方法,一般来说,有的专业比较热门,可以在市面上买 到它的出版物;有的专业笔记在网上也可能搜集到,这需要考生多花一些时间;还有的专业 由于相对冷门,那么考生就需要和该专业的同学建立联系,想办法把笔记弄到手。 2 专业课历年真题真题是以前的考试题,是专业课的第一手资料,它更是法宝中的法
《金融计量学》题集

《金融计量学》题集一、选择题(每题10分,共100分)1.金融计量学主要应用于以下哪些领域?A. 金融市场预测B. 风险管理评估C. 文学作品分析D. 宏观经济政策制定2.在时间序列分析中,AR模型主要描述的是?A. 自回归过程B. 移动平均过程C. 季节性变动D. 长期趋势3.以下哪个统计量常用于衡量时间序列的平稳性?A. 均值B. 方差C. 自相关系数D. 偏度4.对金融数据进行对数变换的主要目的是?A. 简化计算B. 消除异方差性C. 提高数据的正态性D. 增加数据的波动性5.GARCH模型主要用于分析金融时间序列的哪种特性?A. 平稳性B. 季节性C. 波动性D. 趋势性6.VaR(Value at Risk)模型的核心思想是什么?A. 用历史数据来预测未来风险B. 用数学模型来量化潜在损失C. 用专家判断来评估风险D. 用模拟方法来估计风险7.在多元回归分析中,如果解释变量之间存在高度相关性,会导致什么问题?A. 模型拟合度提高B. 参数估计不稳定C. 残差增大D. 模型解释能力增强8.以下哪个不是金融计量模型的常见检验方法?A. 残差检验B. 稳定性检验C. 显著性检验D. 一致性检验9.在金融时间序列分析中,ADF检验主要用于检验什么?A. 序列的平稳性B. 序列的自相关性C. 序列的异方差性D. 序列的周期性10.以下哪个软件不是常用的金融计量学分析工具?A. EViewsB. R语言C. PythonD. Excel(基本功能)二、填空题(每题10分,共50分)1.金融计量学是研究__________________的学科,它运用统计和数学方法来分析和预测金融市场行为。
2.在进行时间序列分析时,如果序列不平稳,通常需要进行__________________处理,以使其满足建模要求。
3.GARCH模型中的“G”代表__________________,它用于描述时间序列的波动性聚集现象。
《多元统计分析》第三版例题习题数据文件..

何晓群《多元统计分析》第三版(2012)数据下载第2章[例2-1] 1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。
其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。
下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,以下数据为35家上市公司2008年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。
习题3.今选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省份。
选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口的比例等五项能够较好的说明各地区社会经济发展水平的指标。
验证一下边远及少数民族聚居区的社会经济水平与全国平均水平有无显著差异。
数据来源:《中国统计年鉴》(1998)。
5项指标的全国平均水平μ0=(6212.01 32.87 2972 9.5 15.78)/第3章例3-1 若我们需要将下列11户城镇居民按户主个人的收入进行分类,对每户作了如下的统计,结果列于表3-1。
在表中,“标准工资收入”、“职工奖金”、“职工津贴”、“性别”、“就业身份”等称为指标,每户称为样品。
若对户主进行分类,还可以采用其他指标,如“子女个数”、“政治面貌”等,指标如何选择取决于聚类的目的。
表3-1 某市2001年城镇居民户主个人收入数据X1 职工标准工资收入 X5 单位得到的其他收入X2 职工奖金收入 X6 其他收入X3 职工津贴收入 X7 性别X4 其他工资性收入 X8 就业身份X1 X2 X3 X4 X5 X6 X7 X8540.00 0.0 0.0 0.0 0.0 6.00 男国有1137.00 125.00 96.00 0.0 109.00 812.00 女集体1236.00 300.00 270.00 0.0 102.00 318.00 女国有1008.00 0.0 96.00 0.0 86.0 246.00 男集体1723.00 419.00 400.00 0.0 122.00 312.00 男国有1080.00 569.00 147.00 156.00 210.00 318.00 男集体1326.00 0.0 300.00 0.0 148.00 312.00 女国有1110.00 110.00 96.00 0.0 80.00 193.00 女集体1012.00 88.00 298.00 0.0 79.00 278.00 女国有1209.00 102.00 179.00 67.00 198.00 514.00 男集体1101.00 215.00 201.00 39.00 146.00 477.00 男集体例3-3English Norwegian Danish Dutch German FrenchOne En en een ein unTwo To to twee zwei deuxThree Tre tre drie drei troisFour Fire fire vier vier quatreFive Fem fem vijf funf einqSix Seks seks zes sechs sixseven Sju syv zeven siebcn septEight Ate otte acht acht huitNine Ni ni negen neun neufTen Ti ti tien zehn dixSpanish Italian Polish Hungarian FinnishUno uno jeden egy yksiDos due dwa ketto kaksiTres tre trzy harom kolmecuatro quattro cztery negy neuaCinco cinque piec ot viisiSeix sei szesc hat kuusiSiete sette siedem het seitsemanOcho otto osiem nyolc kahdeksaunueve nove dziewiec kilenc yhdeksanDiez dieci dziesiec tiz kymmenen例3-4X1 食品支出(元/人)X5 交通和通讯支出(元/人)X2 衣着支出(元/人)X6 娱乐、教育和文化服务支出(元/人)X3 家庭设备、用品及服务支出(元/人)X7 居住支出(元/人)X4 医疗保健支出(元/人)X8 杂项商品和服务支出(元/人)X1 X2 X3 X4 X5 X6 X7 X8 辽宁1772.14 568.25 298.66 352.20 307.21 490.83 364.28 202.50 浙江2752.25 569.95 662.31 541.06 623.05 917.23 599.98 354.39 河南1386.76 460.99 312.97 280.78 246.24 407.26 547.19 188.52 甘肃1552.77 517.16 402.03 272.44 265.29 563.10 302.27 251.41 青海1711.03 458.57 334.91 307.24 297.72 495.34 274.48 306.45例3-5x1 人均粮食支出(元/人) x5 人均衣着支出(元/人)x2 人均副食支出(元/人)x6 人均日用杂品支出(元/人)x3 人均烟、酒、饮料支出(元/人)x7 人均水电燃料支出(元/人)x4 人均其他副食支出(元/人)x8 人均其他非商品支出(元/人)第4章[例4-1] 判别分析的一个重要应用是用于动植物的分类当中,最著名的一个例子是1936年Fisher的鸢尾花数据(Iris Data)。
理解统计表的分析的练习题

理解统计表的分析的练习题统计表是一种有效的数据展示方式,能够直观地呈现大量的数据信息,帮助人们理解和分析数据。
在进行统计表的分析时,需要运用一些相关的理论和方法,以确保对数据的准确理解和合理判断。
下面将介绍一些统计表分析的练习题,并提供相应的解答和分析方法。
1. 统计表中的主要数据特征是什么?如何利用这些特征分析数据?答:主要数据特征包括数据的总和、平均值、最大值、最小值等。
可以通过计算这些统计指标,了解数据的集中趋势、离散程度和分布情况。
对于数据的总和和平均值,可以帮助我们衡量整体情况;而最大值和最小值,则可以揭示出数据中的最高点和最低点,以寻找异常值或重要节点。
2. 如何进行对比分析和占比分析?答:对比分析是将不同部分或不同时间段的数据进行对比,并观察它们之间的差异和趋势。
可以通过绘制折线图、柱状图或饼图等方式直观地表现对比关系。
占比分析是计算不同部分在整体中所占的比例,并观察它们的相对重要性。
可以通过饼图或堆叠柱状图等图表来展示占比情况。
3. 如何进行趋势分析?答:趋势分析是观察数据的变化趋势,以及预测未来的发展方向。
可以使用折线图或曲线图来展示数据随时间的变化,并运用移动平均法、指数平滑法等方法来识别趋势线。
通过趋势分析,可以了解数据的发展趋势和周期性变化,以便做出相应的决策或预测。
4. 如何进行分类分析和关联分析?答:分类分析是将数据按特定的分类维度进行划分,并比较不同类别之间的差异和相似性。
可以使用柱状图、散点图等图表进行分类呈现,并计算不同类别的统计指标进行比较。
关联分析是探索不同变量之间的关系和相关性。
可以使用散点图、相关系数等方法来评估变量之间的相关程度,并运用回归分析等方法进行预测和建模。
5. 如何进行统计表的解读和总结?答:在进行统计表的解读和总结时,首先要了解统计表涉及的数据内容和目的。
其次,通过综合分析和对比分析,提取数据的关键信息和规律,并运用适当的量化指标进行评估和比较。
二年级数学2条形统计图教案及练习题

二年级数学2条形统计图教案及练习题m2.8.2条形统计图课型新授使用人教科书第109--111页的基准2。
1.使学生体验数据的收集、整理、描述和分析的过程,了解统计的意义,会用简单的方法收集和表现数据。
2.并使学生重新认识条形统计图,明晰用1格则表示5个单位的表现形式,能够根据统计图明确提出问题,并初步展开直观的预测。
3.在学习过程中培养学生的实践能力与合作意识。
提高统计能力,进一步发展学生的统计观念。
1.重新认识并绘制条形统计图,能对条形统计图分析。
2.能根据数据的大小确定1格表示几个单位,制作条形统计图。
1.课前以小组为单位非政府积极开展套圈游戏。
2.格子图,套圈得分统计表,水彩笔,尺子。
教学过程一、创设情境,激发兴趣1.交流信息,谈话引题:同学们,课前我们以小组为单位开展了套圈游戏。
现在请大家在小组内说说自己套中几个圈,得几分,并在得分统计表里作好记录。
2.顺利完成套圈罚球统计表:套圈游戏得分统计表()组3.各小组长展现罚球统计表,汇报罚球情况。
二、分析数据,设计统计图1.观测数据:(出示现场收集的各组总得分统计表)瞧,老师也收集了一张统计表,从表中你知道了什么?组别一组二组三组四组罚球452035302.能把这张表制成统计图吗?(媒体出示统计图)谁来说说你准备怎样画?3.引起思索:如果用以前“一格代表1”的方法去制作统计图,一组罚球必须涂抹几个格?这样便利吗?怎么办?4.学生小组内讨论。
(师巡回发现问题)5.学生汇报自己小组的见解。
让学生明确:一格不仅可以表示“1”分,,还可以表示“2”分,或表示“5”分,甚至表示“10”分……只要每格表示的数量多一些,那么格子不够的问题也就迎刃而解了。
6.出具顺利完成的统计图。
(1)观察一格代表几分。
(2)比较统计表和统计图,你指出统计图的优势在哪里?(3)小结:用条形统计图表示数据,可以从条形的长短直接看出数量的多少,非常的具体形象,便于比较。
三、小组合作,顺利完成统计图1.出示统计图,让各组填写纵轴(一格代表5)。
(易错题)高中数学必修三第一章《统计》检测卷(含答案解析)(2)

一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元6. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 7.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.16.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.17.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.18.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x(2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.某地级市共有200000中学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加%n ,一般困难的学生中有3%n 会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生有2%n 转为一般困难学生,特别困难的学生中有%n 转为很困难学生.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 取14时代表2014年,……依此类推,且x 与y (单位:万元)近似满足关系式y x βα=+.(2013年至2019年该市中学生人数大致保持不变)y521()ii yy =-∑51()()iii x x y y =--∑0.8 3.11(1)估计该市2018年人均可支配年收入为多少万元?(2)试问该市2018年的“专项教育基金”的财政预算大约为多少万元?附:对于一组具有线性相关关系的数据11(,)u υ,22(,)u υ,…,(,)n n u υ,其回归直线方程u υβα=+的斜率和截距的最小二乘估计分别为121()()()niii nii u u uu υυβ==--=-∑∑,u αυβ=-.23.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 24.学校为了了解高三学生每天自主学习中国古典文学的时间,随机抽取了高三男生和女生各50名进行问卷调查,其中每天自主学习中国古典文学的时间超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如表:(Ⅰ)根据表中数据能否判断有60%的把握认为“古文迷”与性别有关?(Ⅱ)现从调查的女生中按分层抽样的方法抽出5人进行调查,求所抽取的5人中“古文迷”和“非古文迷”的人数;(Ⅲ)现从(Ⅱ)中所抽取的5人中再随机抽取3人进行调查,记这3人中“古文迷”的人数为ξ,求随机变量ξ的分布列与数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.50 0.40 0.25 0.05 0.025 0.010 0k0.4550.7081.3213.8415.0246.63525.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。
2023年春学期苏科版初中数学九年级下册教学进度表

6.4 探索三角形相似的条件
平行线分线段成比例定理及应用
5
8
3.20——3.24
“两角相等”
“两边成比例且夹角相等”
“三边成比例”
5
9
3.20——3.24
综合
6.5 相似三角形的性质
6.6 图形的位似
5
10
3.27——3.31
6.7 用相似三角形解决问题
数学活动 测量两地间的距离
小结与思考
5
11
4.03,4.04,4.06,4.07
期中复习
4
4.05
清明节
12
4.10——4.14
期中测试
5
13
4.17——4.21
第7章 锐角三角函数
7.1 正切
7.2 正弦、余弦
7.3 特殊角的三角函数
5
14
4.24——4.28
7.4 由三角函数值求锐角
7.5 解直角三角形
7.6 用锐角三角函数解决问题
y=ax^2+bx+c的图像
5
4
2.20——2.24
5.3 用待定系数法确定二次函数表达式
5.4 二次函数与一元二次方程
5
5
2.27——3.03
5.5 用二次函数解决问题
数学活动 校园景观设计
小结与思考
5
6
3.06——3.10
第6章 图形的相似
6.1 图上距离与实际距离
活动 香烟浸出液对种子发芽的影响
小结与思考
课题学习 制作“动画片”
5
19
5.29——6.02
专题复习
5
20
6.05——6.09
习题及参考答案

习题参考答案第1章绪论数据挖掘处理的对象有哪些请从实际生活中举出至少三种。
答:数据挖掘处理的对象是某一专业领域中积累的数据,对象既可以来自社会科学,又可以来自自然科学产生的数据,还可以是卫星观测得到的数据。
数据形式和结构也各不相同,可以是传统的关系数据库,可以是面向对象的高级数据库系统,也可以是面向特殊应用的数据库,如空间数据库、时序数据库、文本数据库和多媒体数据库等,还可以是Web数据信息。
实际生活的例子:①电信行业中利用数据挖掘技术进行客户行为分析,包含客户通话记录、通话时间、所开通的服务等,据此进行客户群体划分以及客户流失性分析。
②天文领域中利用决策树等数据挖掘方法对上百万天体数据进行分类与分析,帮助天文学家发现其他未知星体。
③制造业中应用数据挖掘技术进行零部件故障诊断、资源优化、生产过程分析等。
④市场业中应用数据挖掘技术进行市场定位、消费者分析、辅助制定市场营销策略等。
<给出一个例子,说明数据挖掘对商务的成功是至关重要的。
该商务需要什么样的数据挖掘功能它们能够由数据查询处理或简单的统计分析来实现吗答:例如,数据挖掘在电子商务中的客户关系管理起到了非常重要的作用。
随着各个电子商务网站的建立,企业纷纷地从“产品导向”转向“客户导向”,如何在保持现有的客户同时吸引更多的客户、如何在客户群中发现潜在价值,一直都是电子商务企业重要任务。
但是,传统的数据分析处理,如数据查询处理或简单的统计分析,只能在数据库中进行一些简单的数据查询和更新以及一些简单的数据计算操作,却无法从现有的大量数据中挖掘潜在的价值。
而数据挖掘技术却能使用如聚类、关联分析、决策树和神经网络等多种方法,对数据库中庞大的数据进行挖掘分析,然后可以进行客户细分而提供个性化服务、可以利用挖掘到的历史流失客户的特征来防止客户流失、可以进行产品捆绑推荐等,从而使电子商务更好地进行客户关系管理,提高客户的忠诚度和满意度。
假定你是Big-University 的软件工程师,任务是设计一个数据挖掘系统,分析学校课程数据库。
最新市场调查与预测习题集答案资料

2015年市场调查与预测复习资料第一章练习题单项选择1.从市场的基本关系角度理解,市场是(B.商品供求双方相互作用的总和)。
2.从商品买方角度理解,市场是(C.某种商品或某类商品的需求量)。
3.市场是某种商品或某类商品的需求量,这是从(B.买方)角度来理解市场的。
4.(B.市场调查)是人们对市场的过去和现在的认识。
5.(D.市场预测)是人们对市场的未来的认识,它能帮助经营者制定适应市场的行动方案,使自己在市场竞争中处于有利地位。
6.(A.有效需求)是有支付能力的需求。
7.(B.无效需求)是暂无支付能力的需求。
8.我国的市场调查与预测是在(C.20世纪80年代)兴起的。
9. (A.短期市场预测)的预测期限一般在1~2个月。
10. (C.长期市场预测)的预测期限一般在1年以上。
11. (B.中期市场预测)的预测期限一般在1~2个月到1年之间。
12. 市场预测可以分为短期预测、中期预测和长期预测,这是按(A.预测期限)划分的。
13. 市场预测可以分为定性预测和定量预测,这是按(B.预测性质)划分的。
14. 市场调查的(A.时效性)表现为应及时捕捉和抓住市场上任何有用的情报、信息,及时分析、反馈,为企业在经营过程中适时地制定和调整策略创造条件。
15.(C.产品调查)是市场调查的核心内容。
多项选择1.市场调查和市场预测的联系表现在(D.从时间连续性来看,二者是一项连贯的工作 E.从方法论的角度看,市场预测有赖于市场调查)2.下面关于市场的涵义的理解正确的是(A.市场是商品交换关系的总和。
B.市场是商品供求双方相互作用的总和。
D.市场是商品交换的场所。
E.市场是商品的需求量)3.消费者需求的影响因素有 (A.商品价格 B.替代品和互补品价格 D.消费者预期和偏好 E.消费者收入 )4.信息的属性主要包括(A.事实性 B.等级性 C.不完全性 D.时效性 E.共享性)5.从市场调查和市场预测的关系来看,市场调查是市场预测的(C.基础 E.保证)6.从市场调查和市场预测的关系来看,市场预测是市场调查的(B.应用 D.延伸)7.按商品交换的内容,市场可以分为 (A.有形市场B.无形市场 )8.按企业营销的角度,市场可以分为(D.现有市场E.潜在市场 )9.按流通环节的不同,市场可以分为(D.批发市场E.零售市场 )10.按地域的不同,市场可以分为(B.国内市场C.国际市场 )11.市场调查与预测的意义在于( A.为企业决策提供依据。
第4章SPSS基本统计分析报告材料课后练习参考

第三章1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市〞且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用习题二第6题数据,将其按常住地〔升序〕、收入水平〔升序〕、存款金额〔降序〕进展多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量与目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用习题二第4题的完整数据,计算每个学生课程的平均分以与标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称与标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、〔创建只包含汇总变量的新数据集并命名〕——确定5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进展组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称与标签——设定旧值和新值.6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加〞且“预计未来一两年收入仍会增加〞的人是对自己收入比拟满意和乐观的人,请利用SPSS 的计数和数据筛选功能找到这些人。
《统计学》课后练习题答案

3.4统计图的规范
3.5如何用Excel做统计图
习题
一、单项选择题
1.统计表的结构从形式上看包括()、横行标题、纵栏标题、数字资料四个部分。(知识点3.1答案:D)
A.计量单位B.附录C.指标注释D.总标题
2.如果统计表中数据的单位都一致,我们可以把单位填写在()。(知识点3.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
9.()表示事物的质的特征,是不能以数值表示的。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标
10.在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个()。(知识点:1.7答案:B)
1.统计调查方案的主要内容是( )( )( )( )( )。(知识点2.2答案:ABCDE)
A.调查的目的B.调查对象C.调查单位D.调查时间E.调查项目
2.全国工业普查中( )( )( )( )( )。(知识点2.2答案:ABCE)
A.所有工业企业是调查对象B.每一个工业企业是调查单位C.每一个工业企业是报告单位
频数f
(棵)
频率
(%)
向上累积
向下累积
频数(棵)
频率(%)
频数(棵)
频率(%)
80-90
8
7.3
8
7.3
110
100.0
90-100
9
8.2
17
15.5
102
92.7
100-110
2018年国考面试模拟预测题:国家统计局调查队近十年面试真题汇编

国家统计局调查队近十年面试真题汇编(一)2016年度国家统计局调查队面试真题汇编2016年2月26日国家统计局调查队面试真题材料:带薪休假权成为节后劳保投诉热点新华报业网讯:每年节后都是职工离职或跳槽高峰,一些在岗时不敢提,或是被用人单位忽视的劳动权益,也在此时被一些离职员工秋后算账。
这不,节后刚开始上班,就有不少离职者到劳动监察部门咨询或投诉,其中,带薪休假权成为一个热点。
年假应休未休可拿3倍工资今年41岁的李女士在一家媒体从事校对工作,本与单位协商好去年11月份休假,由于同事突然生病工作安排不过来放弃了假期,节后上班第一天,李女士就向南京市劳动监察部门咨询,今年能否把去年失去的假期补回来。
对此,南京市劳动监察支队的金浩科长表示,根据《职工带薪年休假条例》第五条和《企业职工带薪年休假实施办法》第9条规定,年休假在1个年度内可以集中安排,也可以分段安排,一般不跨年度安排。
但单位因生产、工作特点确有必要跨年度安排职工年休假的,可以跨1个年度安排。
如果单位确因工作需要不能安排职工休年休假的,经职工本人同意,可以不安排职工休年休假。
对职工应休未休的年假天数,单位应当按照该职工日工资收入的300%支付年休假工资报酬。
需要提醒的是,这里的日工资收入的300%包含了当月必须支付的工资,也就是说,如果企业已经支付了劳动者当月工资,只需要额外支付200%的应休未休天数薪资。
多年未休假能否追溯有争议2月17日,在南京一家企业给老板开车的李师傅向南京市劳动监察部门反映,称自己工作了6年,周末出车从来没有加班工资,也从未休过年休假,希望劳动监察部门帮助维权。
对此,南京市劳动监察部门相关人士表示,目前南京市尚未遇到劳动者专门为带薪休假权打官司的案例,劳动者大多是将带薪休假与工资、社会保险诉求等捆绑投诉。
应休未休的假期是否存在追溯期,在司法实践中存在一定的争议。
一种观点认为,年休假工资报酬属于劳动报酬,应当适用特殊时效,即用人单位与劳动者解除或终止劳动合同后一年内,劳动者可以追诉他所有在职期间未休年假工资。
东北财经大学出版社《会计理论》章后习题参考答案 (1)

章后习题参考答案及提示第 1 章□ 知识题1) 在会计发展的历史长河中,人们大致经历了古代会计、近代会计和现代会计三个主要阶段,我们应重点关注现代会计的特征。
2)关于会计理论的含义,大致有 5 种看法:美国会计学会的看法、莫斯特在其《会计理论》中的看法、亨德里克森在其《会计理论》中的看法、美国财务会计准则委员会的看法及《韦氏新国际辞典》中对会计理论的定义(如有个人看法可以各抒己见) 。
3) 会计理论服务于三个基本方面,具有三种基本功能:信息传递和经验总结功能;解释和评价功能;预见和实践功能。
4)关键要把握这三个概念,以及会计规范和会计基本理论是两个不同层次的理论。
5)会计规范就是会计实践活动中应当遵循的法规、规则、典范、范例或惯例。
按其功能的不同,会计规范的内容也可分为两大部分:目的性规范和方法程序性规范。
公认会计规范则是得到重大权威支持,既有权威性又有公认性的会计规范。
6) 重点是比较会计准则和会计制度。
会计准则是一个常与会计原则、会计标准等混同使用的术语,会计准则在形式上要求由一定权威的机构(组织)来颁布,并应当具有成文(即书面)的内容。
会计制度可以是由政府有关部门制定的行政法规,也可以是企业制定的主要规范财务会计账务处理程序和各项业务处理的规定。
7) 会计基本理论是一套以会计目标为中心,相互关联、协调一致的概念体系。
它们之所以是基本的,是因为会计的其他一系列概念和理论都由这些概念引申出来,它起着基础性的作用。
8)会计的定义取自不同的学术观点。
信息系统论认为:会计是为了提高微观经济效益,加强经济管理而在企业(单位)范围内建立的一个以提供财务信息为主的经济信息系统。
9)会计的职能包括以下方面:第一,反映经济活动,评价经营业绩。
第二,预测经营前景,参与管理决策。
第三,控制经济过程,监督经济业务。
其中,反映职能是最基本的,会计的职能通常还应根据不同组织的性质和特点进行细分。
10)企业经营资金运动是会计予以反映和控制的对象,即人们通常所说的会计对象。
市场调查与预测习题集.doc

《市场调查与预测》习题集第一章导论一、单选题1.在市场调研活动屮市场调研的主体是_______ 。
A.企业B.消费者C.内部部门D、夕卜部部门2.在市场调研活动屮市场调研对象是_________ oA.企业B.消费者C.内部部门D、外部部门3.在市场调研活动屮市场调研目的是_________ oA.企业正确决策B. 了解消费需求C.掌握内部信息D.掌握外部信息4.在市场调研活动屮市场调研的结果_______ 。
A.信息准确率很高B.消费者非常需要C.帮助企业内部管理D.难免有误差5._________________________________________ 调研课题要解决的是为了做出正确的抉择丿垃该________________________________________________ oA.说明事物的表现B.揭銘问题的本质C.关注备种事物的状态D.掌握什么样的信息二、多项选择题1.市场调研工作的内容主要包括________ 。
A.收集资料B.整理资料C.分析资料D.撰写调研报告2.市场调研的特点主要有_______ 。
A.服务性B.科学性C.应用性D.不确定性3.市场调研的必要性主要有________ 。
A.获得初步信息B.留住现有顾客的重要性C.管理人员必须了解持续变化的市场D.对质量和顾客满意的不懈追求4.市场调研的局限性主要有________ 。
A.要求更多的专业知识B.结果难免带有谋差D.为营销决策提供宝贵的参考资料和信息,但并不能代替决策三、简答题1.简述市场调研的重要性。
2.评述市场调查的发展丿力程,将来的展望?3.阐述市场调查与市场预测Z间的关系。
第二章市场调查基本原理一、简答题I.怎样理解市场调杏的概念和特征?2・市场调杏的功能和作用有哪些?3.市场调杏必须冋答和解决哪些基木问题?4.市场研究的基木方法有哪些?5.简述市场调查的目的、任务、对彖、内容的一般界定。
新人教版高中数学选修三第三单元《成对数据的统计分析》测试(含答案解析)(2)

一、选择题1.某车间加工零件的数量x 与加工时间y 的统计数据如表:该车间的负责人作出散点图,发现x ,y 是线性相关的,并求出y 关于x 的线性回归方程23517=+y bx (其中b 是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为( ) A .45分钟 B .46分钟 C .47分钟 D .48分钟2.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62kg ,他的曾祖父、祖父、父亲、儿子的体重分别为58kg 、64kg 、58kg 、60kg .如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x 与预报变量y 的回归方程为y bx a =+,其中0.5b =,据此模型预测他的孙子的体重约为( )A .58kgB .61kgC .65kgD .68kg3.已知()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.在“数学文化大讲堂”活动中,某老师对“学生性别和喜欢数学文化是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢数学文化的人数占男生人数的16,女生喜欢数学文化的人数占女生人数23,若有99%的把握认为是否喜欢数学文化和性别有关,则男生至少有( ) A .24人 B .22人C .20人D .18人4.某公司在2014~2018年的收入与支出情况如下表所示:支出y (亿元)0.2 1.5 2.0 2.5 3.8根据表中数据可得回归直线方程为0.7y x a =+,依此估计如果2019年该公司收入为8亿元时的支出为( ) A .4.502亿元 B .4.404亿元 C .4.358亿元D .4.856亿元5.下列命题不正确的是( )A .研究两个变量相关关系时,相关系数r 为负数,说明两个变量线性负相关B .研究两个变量相关关系时,相关指数R 2越大,说明回归方程拟合效果越好.C .命题“∀x ∈R ,cos x ≤1”的否定命题为“∃x 0∈R ,cos x 0>1”D .实数a ,b ,a >b 成立的一个充分不必要条件是a 3>b 3 6.已知具有线性相关的两个变量,x y 之间的一组数据如下表所示:x0 1 2 3 4 y 2.24.34.54.86.7若,x y 满足回归方程 1.5ˆˆyx a =+,则以下为真命题的是( ) A .x 每增加1个单位长度,则y 一定增加1.5个单位长度 B .x 每增加1个单位长度,y 就减少1.5个单位长度 C .所有样本点的中心为(1,4.5) D .当8x =时,y 的预测值为13.57.为预测某种产品的回收率y ,需要研究它和原料有效成分的含量x 之间的相关关系,现取了8组观察值.计算得8152ii x==∑,81228i i y ==∑,821478ii x ==∑,811849i i i x y ==∑,则y对x 的回归方程是( ) A .y =11.47+2.62x B .y =-11.47+2.62x C .y =2.62+11.47x D .y =11.47-2.62x8.一个车间为了规定工时定额,需要确定加工零件所花费的时间,由此进行了5次实验,收集数据如下: 零件数:个 10 20 30 40 50 加工时间:分钟5971758189由以上数据的线性回归方程估计加工100个零件所花费的时间为( ) 附:回归直线的斜率和截距的最小二乘估计公式分别为1122211()(),()nniii ii i nni ii i x x y y x y nxyb a y bx x x xnx ====---===---∑∑∑∑A .124分钟B .150分钟C .162分钟D .178分钟9.下列有关统计知识的四个命题正确的是( )A .衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切B .在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差C .线性回归方程对应的直线ˆˆˆy bx a =+至少经过其样本数据点中的一个点D .线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位 10.已知,x y 的对应值表为:且,x y 线性相关,由于表格污损,y 的对应值看不到了,若6119.2ii y==∑,且线性回归直线方程为0.6y x a =+,则8x =时,y 的预报值为( ) A .6.1B .22.1C .12.6D .3.511.陕西关中的秦腔表演朴实,粗犷,细腻,深刻,再有电子布景的独有特效,深得观众喜爱.戏曲相关部门特意进行了“喜爱看秦腔”调查,发现年龄段与爱看秦腔的人数比存在较好的线性相关关系,年龄在[]40,44,[]45,49,[]50,54,[]55,59的爱看人数比分别是0.10,0.18,0.20,0.30.现用各年龄段的中间值代表年龄段,如42代表[]40,44.由此求得爱看人数比y 关于年龄段x 的线性回归方程为0.4188y kx =-.那么,年龄在[]60,64的爱看人数比为( ) A .0.42B .0.39C .0.37D .0.3512.在某次试验中,实数x ,y 的取值如下表:若x 与y 之间具有较好的线性相关关系,且求得线性回归方程为1y x =+,则实数m 的值为()A .1.6B .1.7C .1.8D .1.913.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱二、解答题14.某省即将实行新高考,不再实行文理分科.某校为了研究数学成绩优秀是否对选择物理有影响,对该校2018级的1000名学生进行调查,收集到相关数据如下: (1)根据以上提供的信息,完成22⨯列联表,并完善等高条形图;选物理 不选物理 总计数学成绩优秀数学成绩不优秀260 总计6001000(2)能否在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关?附:22()()()()()n ad bc K a b c d a c b d -=++++临界值表:()20P K k0.10 0.05 0.010 0.005 0.00115.“每天锻炼一小时,健康工作五十年,幸福生活一辈子.”一科研单位为了解员工爱好运动是否与性别有关,从单位随机抽取30名员工进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到爱好运动的员工的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有把握认为爱好运动与性别有关? (2)若从这30人中的女性员工中随机抽取2人参加一活动,记爱好运动的人数为X ,求X 的分布列、数学期望.16.某电脑公司有5名产品推销员,其工作年限与年推销金额的数据如表:(1)求年推销金额y 关于工作年限x 的线性回归方程; (2)判断变量x 与y 之间是正相关还是负相关;(3)若第6名推销员的工作年限是11年,试估计他的年推销金额.参考公式:线性回归方程y bx a =+中,a y bx =-,其中,x y 为样本平均数,1221ni ii nii x ynx y b xnx==-=-∑∑)17.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:利用22⨯列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?随机量变22()()()()()n ad bcKa b c d a c b d-=++++(其中n a b c d=+++)临界值表18.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由.19.某车间为了规定工时额定,需要确定加工零件所花费的时间,为此作了6次试验,得到数据如下:(1)试对上述变量x 与y 的关系进行相关性检验,如果x 与y 具有线性相关关系,求出y 对x 的回归直线方程;(2)根据(1)的结论,你认为每小时加工零件的数量额定为多少(四舍五入为整数)比较合理?附:相关性检验的临界值表()()nniii ix x y y x y nx yr---==∑∑()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,y a bx =+42.0≈27.5≈20.一只药用昆虫的产卵数y 与一定范围内的温度x 有关,现收集了该种药用昆虫的6组观测数据如下表:经计算得:61()()557iii x x y y =--=∑,621()84ii x x =-=∑,621()3930i i y y =-=∑线性回归模型的残差平方和621()236.64iii y y =-=∑,8.06053167e ≈,其中,i i x y 分别为观测数据中的温度和产卵数,1,2,3,4,5,6i =(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程为0.2303ˆ0.06x ye =,且相关指数20.9522R =.①试与1中的回归模型相比,用2R 说明哪种模型的拟合效果更好.②用拟合效果好的模型预测温度为35℃时该用哪种药用昆虫的产卵数(结果取整数) 附:一组数据1122(,),(,)(,)n n x y x y x y 其回归直线ˆˆˆy bx a =+的斜率和截距的最小二乘估计为121()()ˆ()ni i i nii x x y y bx x ==--=-∑∑,ˆˆay bx =-;相关指数22121ˆ()1()niii nii y yR y y ==-=--∑∑.21.根据教育部高考改革指导意见,广东省从2021年正式实施“312++”新的高考考试方案.为尽快了解学生的选科需求,及时调整学校人力资源配备.某校从高一学生中抽样调查了100名同学,在模拟分科选择中,一半同学(其中男生38人)选择了物理,另一半(其中男生14人)选择了历史.请完成以下22⨯列联表,并判断能否有99.9%的把握说选科与性别有关?参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.22.某种产品的广告费支出x (百万元)与销售额y (百万元)之间有如下对应数据:(1)画出散点图;(2)求出线性回归方程,并预测广告费支出为1千万时销售额为多少万.(参考公式):1122211()()()nni i ii i i nni ii i x y nxy xx y y x nx xx a y b====⎧---⎪⎪⎪⎨--⎪⎪=-⎪⎩∑∑∑∑23.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:若由资料知y 对x 呈线性相关关系. (1)请画出上表数据的散点图;(2)请根据最小二乘法求出线性回归方程ˆybx a =+的回归系数a ,b ; (3)估计使用年限为10年时,维修费用是多少?24.某地区不同身高()x cm 的未成年男孩的体重平均值()y kg 如下表:已知ln y 与x 之间存在很强的线性相关性, (1)据此建立y 与x 之间的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高150cm 体重为45kg 的在校男生的体重是否正常? 参考数据:()51ln 940iii x y =⋅=∑,51ln 11.5ii y==∑, 3.740.5e ≈附:对于一组数据()11,v μ,()22,v μ,…,(),n n v μ,其回归直线v bx a =+中的斜率和截距的最小二乘估计分别为1221ˆni i i nii v n vbn μμμμ==-=-∑∑,ˆˆav b μ=-. 25.随着人们经济收入的不断增加,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1)求线性回归方程ˆˆˆybx a =+; (2)估计使用年限为12年时,使用该款车的总费用是多少万元?线性回归方程ˆˆˆya bx =+中斜率和截距用最小二乘法估计计算公式如下:()()()1122211ˆn niii ii i nni ii i x x y y x y nxybx x xnx ====---==--∑∑∑∑,ˆa y bx=- 26.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】求出样本数据的中心坐标(,)x y ,代入回归直线方程,求出ˆb,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得1(911141516)135x =++++=, 1(3032364042)365y =++++=,即样本中心点为(13,36),将样本中心点为(13,36)代入回归方程,可得235361317b =⨯+,解得2917b =, 所以回归方程为292351717y x =+, 当20x时,292358152047.9848171717y =⨯+=≈≈(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力.2.B解析:B 【分析】由已知得出数据,()58,58,()64,62,()58,60,根据回归直线过样本中心点,可求得(),x y ,计算求得a ,代入62x =,即可得出结果.【详解】由已知,体重是隔代遗传,且呈线性相关,得出数据,()58,58,()64,62,()58,60, 所以()(),=60,60x y ,代入y bx a =+,其中0.5b =,求得=30a , 即0.530y x =+.62x =时, 0.56230y =⨯+=61.故选:B 【点睛】本题主要考查线性回归方程的相关计算,考查学生分析问题的能力,属于中档题.3.D解析:D 【分析】设男生至少有x 人,根据条件,列出22⨯联表,计算出2K ,令2K 6.635,即可求出.【详解】设男生至少有x 人,根据题意,可列出如下22⨯联表:则23111532663611822x x x x x K x x x x x , 若有99%的把握认为是否喜欢数学文化和性别有关, 则2 6.635K >,即36.6358x , 解得17.693x ,由于表中人数都为整数,所以18x =, 即男生至少有18人. 故选:D. 【点睛】本题考查独立性检验,属于基础题.4.D解析:D 【分析】先求 3.92x =,2y =,根据0.7a y x =-,求解0.744a =-,将8x =代入回归直线方程为0.7y x a =+,求解即可. 【详解】 2.2 2.4 3.8 5.2 6.03.925x ++++==,0.2 1.5 2.0 2.5 3.825y ++++==0.720.7 3.920.744a y x =-=-⨯=-即0.70.744y x =-令8x =,则0.780.744 4.856y =⨯-= 故选:D 【点睛】本题考查回归分析,样本中心点(),x y 满足回归直线方程,是解决本题的关键.属于中档题.5.D解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.6.D解析:D 【分析】利用回归直线过样本点中心可求回归方程,根据该方程可得正确的选项. 【详解】由 1.5y x a =+,得x 每增一个单位长度,y 不一定增加1.5,而是大约增加1.5个单位长度,故选项,A B 错误; 由已知表格中的数据,可知0123425x ++++==,2.2 4.3 4.5 4.8 6.74.55y ++++==,回归直线必过样本的中心点()2,4.5,故C 错误; 又4.5 1.52 1.5ˆˆaa =⨯+⇒=,∴回归方程为 1.5 1.5y x =+, 当8x =时,y 的预测值为1.58 1.513.5⨯+=,故D 正确, 故选:D. 【点睛】本题考查线性回归方程的性质及应用,注意回归直线过(),x y ,本题属于基础题.7.A解析:A【解析】分析:根据公式计算ˆb ≈2.62,ˆa ≈11.47,即得结果. 详解:由1221,()ˆˆˆni ii nii x y nxyba y bx xn x ==-==--∑∑,直接计算得ˆb ≈2.62,ˆa ≈11.47,所以ˆy=2.62x +11.47.选A.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .8.A解析:A 【解析】分析:先求出,x y ,再求出ˆˆ,ba 得到回归直线方程,再令x=100得到加工100个零件所花费的时间.详解:由题得30,75,x y ==121()()(20)(16)(10)(4)70074001000100400100010()niii ni i x x y y b x x ==---⨯-+-⨯-====++++-∑∑,所以775ˆ3054,10ay bx =-=-⨯= 所以754,10y x =+当x=100时,y=124.故答案为A 点睛:本题主要考查回归分析和回归方程的求法,意在考查学生对这些基础知识的掌握水平和基本的计算能力,考查学生解决实际问题的能力.9.A解析:A 【解析】分析:利用“卡方”的意义、相关指数的意义及回归分析的适用范围,逐一分析四个答案的真假,可得答案.详解:A. 衡量两变量之间线性相关关系的相关系数r 越接近1,说明两变量间线性关系越密切,正确;B. 在回归分析中,可以用卡方2x 来刻画回归的效果,2x 越大,模型的拟合效果越差,错误对分类变量X 与Y 的随机变量的2x 观测值来说, 2x 越大,“X 与Y 有关系”可信程度越大; 故B 错误;C. 线性回归方程对应的直线y bx a =+至少经过其样本数据点中的一个点,错误,回归直线y bx a =+可能不经过其样本数据点中的任何一个点;D. 线性回归方程0.51y x =+中,变量x 每增加一个单位时,变量y 平均增加1个单位,错误,由回归方程可知变量x 每增加一个单位时,变量y 平均增加0.5个单位. 故选A.点睛:本题考查回归分析的意义以及注意的问题.是对回归分析的思想、方法小结.要结合实例进行掌握.10.A解析:A 【分析】求出,x y ,由线性回归方程必经过点(,x y )即得a ,代入8x =求解即可. 【详解】 由表格知,196x =, 6119.2ii y==∑3.2y ∴=,代入0.6y x a =+得:193.20.66a =⨯+, 1.3a ∴=,则回归方程为0.6 1.3y x =+, 当8x =时,0.68 1.3 6.1y =⨯+=, 故选:A . 【点睛】本题主要考查了线性回归方程,线性回归方程的性质、应用, 属于中档题.11.D解析:D 【分析】根据题意,可列出y 关于x 的表格,求出,x y ,代入0.4188y kx =-,求出k ,即可求解 【详解】由题,对数据进行处理,得出如下表格: 求得49.5x =,0.195y =,因样本中心(,x y 过线性回归方程,将(,x y 代入0.4188y kx =-,得0.0124k =,即0.01240.4188y x =-,年龄在[]60,64对应的x 为62,将62x =代入0.01240.4188y x =-得:0.0124620.41880.35y =⨯-=,对应的爱看人数比为:0.35 故选:D 【点睛】本题考查线性回归方程的应用,样本中心(),x y 过线性回归方程是一个重要特征,属于中档题12.D解析:D 【分析】根据线性回归方程必过点(),x y ,可求出m 的值. 【详解】 因为14.333,5mx y +== 所以14.333145m+=+=,解得 1.9m = 故选D. 【点睛】本题主要考查了线性回归方程,样本中心点,属于容易题.13.A解析:A 【分析】由散点图可知,去掉(3,10)D 后,y 与x 的线性相关性加强,由相关系数r ,相关指数2R 及残差平方和与相关性的关系得出选项. 【详解】∵从散点图可分析得出:只有D 点偏离直线远,去掉D 点,变量x 与变量y 的线性相关性变强, ∴相关系数变大,相关指数变大,残差的平方和变小,故选A. 【点睛】该题考查的是有关三点图的问题,涉及到的知识点有利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况,属于简单题目.二、解答题14.(1)填表见解析,作图见解析(2)能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关【分析】(1)由题意计算出各组人数后即可完成列联表,进而可补全等高条形图;(2)代入公式计算出2K,与3.841比较即可得出结论.【详解】(1)根据题意填写列联表如下,选物理不选物理总计数学成绩优秀420320740数学成绩不优秀18080260总计6004001000(2)计算22 2()1000(42080180320) ()()()()600400740260n ad bcKa b c d a c b d-⨯⨯-⨯==++++⨯⨯⨯12.474 3.841≈>,所以能在犯错误的概率不超过0.05的前提下认为数学成绩优秀与选物理有关.【点睛】本题考查了独立性检验的应用,考查了计算能力,属于中档题.15.(1)没有把握认为爱好运动与性别有关;(2)6 7 .【分析】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815,故爱好运动的员工共有16人,即可补充完整,再根据独立性检验的临界值表,即可判断;(2)利用排列组合求出X 各个取值的概率,求出分布列,代入期望公式,即可得解. 【详解】(1)由30人中随机抽取1人抽到爱好运动的员工的概率是815, 故爱好运动的员工共有16人,由表中男爱好运动的员工为10人, 可得女爱好运动的员工有6人, 故列联表补充如下:230(10866) 1.158 3.84116141614k ⨯⨯-⨯=≈<⨯⨯⨯,所以没有把握认为爱好运动与性别有关; (2)X 的可能取值为0,1,2.282144(0)13C P X C ===,118621448(1)91C C P X C ===,2621415(2)=91C P X C ==,所以X 的分布列为: 448156()0121391917E X =⨯+⨯+⨯=. 【点睛】本题考查了独立性检验和超几何分布,考查了离散型随机变量概率和期望的计算,有一定的计算量,是常规题,属于中档题.16.(1)0.50.4y x =+;(2)正相关;(3)5.9万元. 【分析】(1)首先求出x ,y 的平均数,利用最小二乘法做出b 的值,再利用样本中心点满足线性回归方程和前面做出的横标和纵标的平均值,求出a 的值,写出线性回归方程. (2)根据0.50b =>,即可得出结论;(3)第6名推销员的工作年限为11年,即当11x =时,把自变量的值代入线性回归方程,得到y 的预报值,即估计出第6名推销员的年推销金额为5.9万元. 【详解】(1)由题意知:6x =, 3.4y =于是:211256 3.40.520056b -⨯⨯==-⨯, 3.40.560.4a =-⨯=,故:所求回归方程为0.50.4y x =+;(2)由于变量y 的值随着x 的值增加而增加(0.50)b =>,故变量x 与y 之间是正相关 (3)将11x =带入回归方程可以估计他的年推销金额为0.5110.4 5.9y =⨯+=万元. 【点睛】本题考查回归分析的初步应用,考查利用最小二乘法求线性回归方程,是一个综合题目. 17.有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【分析】本题先求合计的4个值,再根据公式计算随机变量,接着比较数值大小,判断即可. 【详解】1112212218,12,5,78n n n n ====,所以121230,83,23,90,113n n n n n ++++=====. 所以()21122122121212n n n n n n n n n χ++++-=2113(1878512)39.6 6.63530832390⨯⨯-⨯=≈>⨯⨯⨯.所以有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【点睛】本题考查独立性检验,是基础题18.(1)14%;(2)有;(3)能,理由见解析 【分析】(1) 由500位老年人中有40+30=70位需要志愿者提供帮助,即可求出需要志愿者提供帮助的老年人的比例;(2)通过列联表计算29.967K =,即可得出结论;(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,应该采用分层抽样的方法. 【详解】解:(1)∵调查的500位老年人中有40+30=70位需要志愿者提供帮助, ∴该地区老年人中需要帮助的老年人的比例的估算值为14%=.(2)根据列联表所给的数据,代入随机变量的观测值公式,29.967K =.∵9.967 6.635>,∴有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好. 【点睛】本题主要考查列联表,考查独立性检验的应用,同时考查了运算求解的能力,分析问题和解决问题的能力,难度一般. 19.(1)答案见解析.(2)96 【分析】(1)根据表中所给数据,计算出||r ,即可求得答案.(2)每小时加工零件的数量,即60x =,将60x =代入ˆ0.65757yx =+,即可求得答案. 【详解】(1)由表中数据得:6117950i ii x y==∑,6219100i i x ==∑,62139158i i y ==∑,35,80x y ==∴0.05||0.997r r ==>从而有95%的把握认为x 与y 之间具有线性相关关系,∴此求回归直线方程是有意义的.计算得:ˆˆ0.657,57ba== ∴ˆ0.65757yx =+ (2)每小时加工零件的数量,即60x =将60x =代入ˆ0.65757y x =+ ˆ96.42y= 故每小时加工零件的数量额定为96比较合理 【点睛】本题考查回归直线方程以及应用,考查基本分析与求解能力,属基本题.20.(1)ˆ 6.6138.6yx =- (2)①用非线性回归模型拟合效果更好;②190个 【分析】(1)求出x 、y 后代入公式直接计算得ˆb、ˆa ,即可得解; (2)求出线性回归模型的相关指数,与0.9522比较即可得解;(3)直接把35x =代入0.2303ˆ0.06x ye =,计算即可得解. 【详解】(1)由题意6n =,则611266i i x x ===∑,611336i i y x ===∑,61621()()557ˆ 6.684()iii ii x x y y bx x ==--==≈-∑∑,ˆ33 6.626138.6a =-⨯=-, y 关于x 的线性回归方程为ˆ 6.6138.6yx =-. (2)①对于线性回归模型,621()3930ii y y =-=∑,621()236.64i i i y y =-=∑,相关指数为621621()1()iii ii y y y y ==---∑∑236.6413930=-10.06020.9398≈-= 因为0.93980.9522<,所以用非线性回归模型拟合效果更好.②当35x =,时0.230335ˆ0.06ye ⨯=8.06050.06e =⨯0.063167190.02190=⨯=≈(个) 所以温度为35C ︒时,该种药用昆虫的产卵数估计为190个. 【点睛】本题考查了线性回归方程的求解、相关指数的应用以及非线性回归方程的应用,考查了计算能力,属于中档题.21.列联表见解析,有99.9%的把握说选科与性别有关. 【分析】选物理的男生38人,则女士12人,选历史的男生14人,则女士36人,即可完成22⨯列联表,做出假设0H :选科与性别没有关系,再由表中数据计算2K 的观测值,可得观测值大于10.828,所以在犯错误的概率不超过0.001的前提下认为选科与性别有关系,即有99.9%的把握有关系. 【详解】列出22⨯列联表如下:提出假设0:选科与性别没有关系. 根据列联表中的数据计算2K的观测值2100(38361412)30023.0775248505013k ⨯⨯-⨯==≈⨯⨯⨯.因为10.828k ≥,所以有99.9%的把握说选科与性别有关. 【点睛】本题考查独立性检验的基本应用,属于中档题.22.(1)作图见解析(2)线性回归方程为:^6.517.5y x =+,预测当广告费支出为1千万时销售额为8250万 【分析】(1)根据表格中的数据,描点作图即可;(2)根据求线性回归方程的公式,得到回归方程为 6.517.5y x =+,再根据数据预测即可. 【详解】 (1)散点图如下:(2)1(24568)55x =++++=,1(3040605070)505y =++++=, 512304405606508701380i ii x y==⨯+⨯+⨯+⨯+⨯=∑,521416253664145ii x==++++=∑,138055506.5145525b -⨯⨯==-⨯所以505 6.517.5a y bx =-=-⨯=, 故线性回归方程为: 6.517.5y x =+,当10x =时,82.5y =.故当广告费支出为1千万时销售额为8250万. 【点睛】本题考查了线性回归方程的求解及预测问题,考查了学生实际应用,数学运算的能力,属于中档题.23.(1)散点图见解析(2)1.23,0.08(3)12.38 【分析】(1)根据统计表,在平面直角坐标系中以x 为横坐标,以y 为纵坐标,作出点()()()()()2,2.2,3,3.8,4,5.5,5,6.5,6,7 可得散点图.(2)由表中数据先出x ,y ,51i ii x y =∑,521ii x =∑,然后根据公式求出b ,a .(3)由(2)知回归直线方程是 1.2308ˆ.0yx =+,再将10x =代入回归方程求解. 【详解】(1)根据统计表,在平面直角坐标系中以x 为横坐标,以y 为纵坐标,作出点()()()()()2,2.2,3,3.8,4,5.5,5,6.5,6,7 得散点图如下:(2)由上表知:2345645x ++++==,2.23.8 5.5 6.5755y ++++==512 2.23 3.83 5.54 6.567112.3i i ix y ==⨯+⨯+⨯+⨯+⨯=∑ 522222212345690i ix ==++++=∑51522215112.35451.2390545()i i i i ix y xyb x x ==--⨯⨯∴===-⨯-∑∑0.08a y bx ∴=-=(3)由(2)得 1.2308ˆ.0yx =+ 所以 1.23100.0812.3ˆ8y=⨯+= 所以估计使用年限为10年时,维修费用是12.38万元. 【点睛】本题主要考查散点图的画法和线性回归方程,还考查了数据处理的能力,属于难题. 24.(1) 0.020.7x y e +=. (2) 正常的. 【分析】 (1)先求得x 及521ii x=∑,即可求得52215i i xx =-∑.代入线性回归方程中即可求得ˆb.再由ˆˆav b μ=-即可求得ˆa ,进而得回归方程. (2)根据回归方程及参考数据,即可求得该男生的体重,进而判断该体重是否位于平均值的1.2倍与0.8倍之间. 【详解】 (1)由已知可得80x =,()522221100671033000i i x ==⨯+++=∑∴5221533000320001000i i xx =-=-=∑又()51ln 940iii x y =⋅=∑,11.52.35v == ∴9405 2.380ˆ0.021000b-⨯⨯== ˆ 2.30.02800.7a=-⨯= 所以ln 0.020.7y x =+ ∴回归方程为:0.020.7x y e +=(2)当150x =时, 3.7ˆ40.5ye =≈, 而40.5 1.248.645⨯=>,40.50.832.445⨯=<,∴这一在校男生的体重是正常的. 【点睛】本题考查了非线性回归方程在实际问题中的应用,计算量较为复杂,需要耐心计算,属于中档题.25.(1) 1.2308ˆ.0yx =+ (2) 14.84万元 【分析】(1)由已知表格中的数据求得,x y 进而求得b 与a 的值,则线性回归方程可求; (2)在(1)中求得的线性回归方程中,取x =12求得y 值即可. 【详解】 (1)由表可得1(23456)45x =++++=,1(2.2 3.8 5.5 6.57.0)55y =++++= 51112.3i i i x y ==∑,52190i i x ==∑,5152215112.3545ˆ 1.23905165i ii ii x yx ybxx =-=-⋅-⨯⨯===-⨯-∑∑ˆˆ5 1.2340.08ay bx =-=-⨯=,所求线性回归方程为 1.2308ˆ.0y x =+ (2)当12x =时,ˆ 1.23120.0814.84y=⨯+=,即使用12年的车的总费用大概为14.84万元.【点睛】本题考查线性回归方程的求法,考查计算能力,是基础题.26.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.。
最新[理学]应用多元统计分析课后习题答案详解北大高惠璇第六章习题解答课件PPT
![最新[理学]应用多元统计分析课后习题答案详解北大高惠璇第六章习题解答课件PPT](https://img.taocdn.com/s3/m/021cb26ef121dd36a22d820f.png)
xi)2
n
t1
xt2i
nxi2
abnab2 n
(ab)[n(ab)]1(ab)(cd)
n
n
8
第六章 聚类分析
n (xtj
t1
xj)2
n
t1
xt2j
nx2j
acnac2 n
(ac)[n(ac)]1(ac)(bd)
n
n
故二值变量的相关系数为:
n
Cij(7)
(xtixi)x(tjxj)
t1
dik dkj,对一i切 ,k, j.
(2) 设d是距离,a >0为正常数.令d*=ad,显然有
① di*jcd ij0,且仅 X(i)当 X(j)时 di*j0; ② di*jcd ijcdjid*ji,对一 i,j;切
3
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余
并类距离 D1=1.
D(2)
0 9 3 7
0 5 10
0 8
X(2)
X
(3)
0
X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0CCXL(L334)
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100 0CX(3L2)
n
(xti xi)(xtj xj )
rij
t1 n
n
(xti xi)2
(xtj xj )2
t1
t1
7
第六章 聚类分析
n
(xti xi)(xtj
最新多元统计分析模拟考题及答案

一、判断题( 对 )112(,,,)p X X X X '=的协差阵一定是对称的半正定阵( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。
( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。
( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。
( 错)5),(~),,,(21∑'=μp p N X X X X ,,X S 分别是样本均值和样本离差阵,则,SX n分别是,μ∑的无偏估计。
( 对)6),(~),,,(21∑'=μp p N X X X X ,X 作为样本均值μ的估计,是无偏的、有效的、一致的。
( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。
( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等价。
(对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。
二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵.2、设∑是总体1(,,)m X X X =的协方差阵,∑的特征根(1,,)i i m λ=与相应的单位正交化特征向量12(,,,)i i i im a a a α=,则第一主成分的表达式是11111221m my a X a X a X =+++,方差为1λ。
3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别为:'112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- '221.024(0.9544,0.0984,0.2695,0.0824)U λ==-'330.049(0.2516,0.7733,0.5589,0.1624)U λ==--'440.007(0.0612,0.2519,0.5513,0.7930)U λ==--,则其第二个主成分的表达式是212340.95440.09840.26950.0824y X X X X =-++,方差为1.0244. 若),(~)(∑μαp N X ,(n ,,2,1 =α)且相互独立,则样本均值向量X 服从的分布是(,)p N nμ∑.5.设(,),1,2,,16i p X N i μ∑=,X 和A 分别是正态总体的样本均值和样本离差阵,则2115[4()][4()]T X A X μμ-'=--服从 215(15,)(,)16p T p F p n p p--或6设3(,),1,2,,10i X N i μ∑=,则101()()i i i W X X μμ='=--∑服从3(10,)W ∑7.设随机向量123(,,)X X X X '=,且协差阵4434923216-⎛⎫ ⎪∑=-- ⎪ ⎪-⎝⎭,则其相关矩阵R =231382113631186⎛⎫-⎪ ⎪ ⎪-- ⎪ ⎪ ⎪- ⎪⎝⎭8. 设122(,)(,),X X X N μ=∑,其中212(,),ρμμμσρ⎛⎫=∑=⎪⎝⎭11,则1212,)X X X X +-=Cov(09设X,Y 是来自均值向量为μ,协差阵为∑的总体G 的两个样品,则X ,Y 间的马氏平方距离2(,)d X Y =1()()X Y X Y -'-∑-10设X,Y 是来自均值向量为μ,协差阵为∑的总体G 的两个样品,则X 与总体G 的马氏平方距离2(,)d X G =1()()X X μμ-'-∑-11设随机向量123(,,)X X X X '=的相关系数矩阵通过因子分析分解为121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭则1X 的共性方差21h = 0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。
“统计和概率的简单应用”那些事儿

“统计和概率的简单应用”那些事儿作者:杨广清王小琪来源:《初中生世界·九年级》2020年第02期数据是蕴涵信息的,收集、整理、描述、分析数据有助于我们从数据中获取信息。
而生活中的数据是海量的,因此我们有必要从中选取具有代表性的信息,帮助我们做出正确的估计、推断、决策,解决日常生活中的一些问题。
本章内容共有6节,前3节是统计部分的应用,后3节是概率方面的应用。
我们之前已经了解了统计和概率的相关知识,然后便可以运用所学的知识来解决生活中的问题,从而更好地认识世界。
统计调查是数据的采集过程,统计整理是对统计调查获得的资料进行加工整理、汇总列表,使之符合当前统计研究目的的需要。
这不仅仅是对统计数据进行整理、描述、分析,还需要我们做一些简单的估计推算工作。
下面就按照每一节的内容来说说“统计和概率的简单应用”那些事儿。
一、中学生的视力情况调查这一节知识我们需要掌握两项内容:一是要知道普查的局限性和抽样调查的必要性,抽样调查的样本要有代表性和普遍性;二是学会用抽样调查的结果即样本来估计总体的情况,正因为需要用样本估计总体,进而影响决策,因此要求抽样调查的样本具有代表性。
例1为确定本市七、八、九年级校服的尺寸,有关部门准备对8000名初中男生的身高做调查,现有3种方案:(1)测量体校中200名男子篮球、排球队员的身高;(2)查阅有关外地200名男生身高的统计资料;(3)在市区和郊区各选4所初中,在这8所学校的所有年级(1)班中,用抽签的办法选出15名男生,然后测量他们的身高。
为了达到估计本市初中3个年级男生身高分布的目的,你认为上述哪种调查方案合理。
【解析】本题中,方案(1)体校男子篮球、排球队员身高往往高于一般学生,样本选取比较特殊,不具有代表性;方案(2)外地学生的身高由于地域或生活条件的差异,也不能准确反映本地学生的身高情况;方案(3)的抽样方法符合随机的原则,而且考虑到了年级、城郊的区别,样本中个体的数目比较合适,样本具有代表性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计分析帮你做预测》习题
1、地表以下的岩层温度y 随着所处深度x 的变化而变化,在某个地点y 与x 的关系可以由公式2035+=x y 来表示,则y 随x 的增大而( ) A 、增大 B 、减小 C 、不变 D 、以上答案都不对
2、如图所示,OA 、BA 分别表示甲、乙两名学生运动的路程与时间的关系图象,图中S 和t 分别表示运动路程和时间,根据图象判断快者的速度比慢者的速度每秒快( )
A 、2.5m
B 、2m
C 、1.5m
D 、1m
3、某城市大剧院地面的一部分为扇形,观众席的座位按下列方式设置:
_________个座位. 4、声音在空气中传播的速度y (m /s )与气温x (ºC )之间在如下关系:3315
3
+=x y (1)当气温x =15º
C 时,声音的速度y =_______m /s . (2)当气温x =22ºC 时,某人看到烟花燃放5s 后才听到声音响,则此人与燃放的烟花所在地相距___________m .
5、拖拉机工作时,油箱中的余油量Q (升)与工作时间t (时)的关系式为406Q t =-.当4t =时,Q =_________,从关系式可知道这台拖拉机最多可工作_________小时.
6、洪山县从2000年开始实施退耕还休,每年退耕还休的面积如下表:
②从2000年到2005年底,洪山县已完成退耕还林面积多少亩?
7、弹簧挂上物体后会伸长,已知一弹簧的长度(cm )与所挂物体的质量(kg )之间的关系如下表:
(1)当物体的质量为3kg时,弹簧的长度怎样变化?
(2)当物体的质量逐渐增加时,弹簧的长度怎样变化?
(3)如果物体的质量为x kg,弹簧的长度为y cm,根据上表写出y与x的关系式; (4)当物体的质量为2.5kg时,根据(3)的关系式,求弹簧的长度.。