数据分析期末题

合集下载

数据分析期末复习0115

数据分析期末复习0115

数据分析期末复习一、基本概念(填空题)1.SPSS是(Statistical Product and Service Solutions)的缩写,其中文解释为统计产品和服务解决方案。

2.统计分析软件是基于数据库基础之上实现深层次定量分析并辅助决策的有效工具。

3.SPSS软件的两个最基本窗口是数据编辑窗口和结果输出窗口。

4.SPSS数据文件的扩展名为.sav ,输出文件的扩展名为.spo 。

5.数据分析一般经过收集数据、加工和整理数据、分析数据等三个主要阶段。

6.数据分析的出发点是明确数据分析目标。

7.正确收集数据是指应从分析目标出发,排除干扰因素,正确收集服务于即定分析目标的数据。

8.通过数据的加工整理,能够大致掌握数据的总体分布特征,这是进一步深入分析和建模的基础。

9.选择几种统计分析方法对数据进行探索性的反复分析是极为重要的,因为每一种统计分析方法都有自己的特点和局限性。

10.数据分析的直接结果是统计指标和统计参数。

11.方差分析的一个比较严格的前提要求是不同水平下的各总体应服从方差相同的正态分布。

因此,方差分析问题就转换成研究不同水平下的各总体的均值有无显著差异的问题。

其中对于方差相同的要求很严格。

12.SPSS单因素方差分析中的方差相等检验的方法是:Levene F方法。

13.SPSS独立样本t检验中的方差相等检验的方法是:Levene F方法。

14.使用《居民储蓄调查数据》分析城镇储户和农村储户的一次平均存(取)款金额是否有显著差异可以使用分类汇总进行初步分析。

操作时在下表Break Variable(s)中填入户口[a13] ,Summaries of Variable(s)中填入存(取)款金额[a5] 。

15.使用《居民储蓄调查数据》分析“城镇和农村储户对“储蓄是否合算”的认同是否一致?”可以采用交叉分组下的频数分析。

16.将学生的成绩按分数分成优、良、中、及格和不及格五个等级可以采用数据分组。

期末复习(五) 数据的分析

期末复习(五) 数据的分析
解:从平均数看,两班平均数相同,所以甲、乙两班的成绩一样好;从中位数看,甲班的中位数大,所以甲班的成绩更好;从众数看,乙班的众数大,所以乙班的成绩更好;从方差看,甲班的方差小,所以甲班的成绩更稳定.
03 复习自测
一、选择题(每小题4分,共32分)
1.为了了解学生线上学习情况,老师抽查某组10名学生的单元测试成绩如下: , , , , , , , , , ,这组数据的平均数和中位数分别为( )
(2)请算出捐书册数的平均数、中位数和众数,并判断其中哪些统计量不能反映该班同学捐书册数的一般情况,说明理由.
[答案] 平均数是10,中位数是6,众数是6.其中平均数10不能反映该班同学捐书册数的一般情况,因为40名同学中有38名同学的捐书册数都没有达到10册,平均数主要受到捐献90册的2位同学的捐书册数的影响,故不能反映该5.张大叔有一片果林,共有80棵果树.某日,张大叔开始采摘今年第一批成熟的果子,他随机选取1棵果树上的10个果子,称得质量(单位: )分别为: , , , , , , , , 如果一棵树平均结有120个果子,以此估算,张大叔收获的这批果子的单个质量和总质量分别约为( )
【解答】 小宇的分析是从第二步开始出现错误的.
②请你帮他计算正确的平均数,并估计这260名学生共植树多少棵.
【解答】 (棵),估计260名学生共植树 (棵).
3.某果园有果树200棵,从中随机地抽取5棵,每棵果树的产量(单位:千克)如下: , , , , .这5棵树的平均产量为_____千克,估计这200棵果树的总产量为________千克.
(2)求这20条鱼的平均质量.
解: .答:这20条鱼的平均质量为 .
(3)经了解,近期市场上这种鱼的售价为每千克18元.请利用这个样本的平均数,估计李大伯近期售完鱼塘里的这种鱼可收入多少元?

第六章数据分析期末复习专练答案解析

第六章数据分析期末复习专练答案解析

数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。

在每小题给出的选项中,只有一项是符合题目要求的。

1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。

数据分析期末考试试卷

数据分析期末考试试卷

数据分析期末考试试卷一、选择题(每题2分,共20分)1. 在数据分析中,以下哪项不是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 增加无关数据D. 标准化数据格式2. 描述性统计分析中,以下哪个指标不能反映数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差3. 以下哪种图形最适合展示时间序列数据的变化趋势?A. 柱状图B. 饼图C. 折线图D. 散点图4. 假设检验中,如果P值小于显著性水平α,我们通常会得出什么结论?A. 拒绝原假设B. 接受原假设C. 无法得出结论D. 需要更多的数据5. 以下哪种分析方法主要用于探索数据的潜在结构?A. 回归分析B. 因子分析C. 描述性统计D. 假设检验二、简答题(每题10分,共30分)6. 请简述数据可视化的重要性及其在数据分析中的应用场景。

7. 描述一下什么是相关性分析,并举例说明其在实际问题中的应用。

8. 解释什么是数据挖掘,并简述其在商业智能中的作用。

三、计算题(每题15分,共30分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。

请计算这组数据的平均数、中位数、众数和标准差。

10. 假设你正在进行一项研究,研究的目的是检验某种新药是否比传统药物更有效。

你已经收集了两组数据,一组是使用新药的患者,另一组是使用传统药物的患者。

请描述你将如何使用假设检验来分析这些数据。

四、案例分析题(每题20分,共20分)11. 假设你是一家电子商务公司的数据分析员,公司最近推出了一款新产品。

你被要求分析销售数据,以确定产品是否成功。

请描述你将如何收集和分析数据,以及你将使用哪些关键指标来评估产品的表现。

五、论述题(共10分)12. 论述大数据时代下,数据分析对于企业决策的重要性,并举例说明数据分析如何帮助企业实现更精准的市场定位。

试卷结束语:请同学们认真审题,仔细作答。

数据分析是一门实践性很强的学科,希望本次考试能够检验你们对数据分析理论知识的掌握和应用能力。

《第20章数据的分析》期末复习综合提升训练2套(附答案)-人教版八年级数学下册

《第20章数据的分析》期末复习综合提升训练2套(附答案)-人教版八年级数学下册

人教版八年级数学下册《第20章数据的分析》期末复习综合提升训练1(附答案)1.女子排球队6名场上队员的身高(单位:cm)是:170,174,178,180,180,184.现用身高178cm的队员替换场上身高174cm的队员,与换人前相比,场上队员的身高()A.平均数变大,中位数不变B.平均数变大,中位数变大C.平均数变小,中位数不变D.平均数变小,中位数变大2.甲、乙、丙、丁四人各进行10次射击测试,它们的平均成绩相同,方差分别是S甲2=1,S乙2=1.1,S丙2=0.6,S丁2=0.9,则射击成绩最稳定的是()A.甲B.乙C.丙D.丁3.已知两组数据:x1、x2、x3、x4、x5和x1+2、x2+2、x3+2、x4+2、x5+2,下列有关这两组数据的说法中,正确的是()A.平均数相等B.中位数相等C.众数相等D.方差相等4.在一次体育测试中,小明记录了本班10名同学一分钟跳绳的成绩,如表:成绩150160170180190人数23221对于这10名学生的跳绳成绩,下列说法错误的是()A.众数是160B.中位数是165C.平均数是167D.方差是104.55.李明参加某单位招聘测试,他的笔试、面试、技能操作得分分别为86分、80分、90分,若依次按照2:3:5的比例确定成绩,则李明的成绩是()A.256分B.86分C.86.2分D.88分6.学校举行演讲比赛,共有13名同学进入决赛,比赛将评出金奖1名,银奖2名,铜奖3名,某选手知道自己的分数后,要判断自己能否获奖,他应当关注有关成绩的()A.平均数B.中位数C.众数D.方差7.一组数据3,5,5,7,若添加一个数据5,则发生变化的统计量是()A.平均数B.中位数C.方差D.众数8.为筹备班级联欢会,班长对全班同学爱吃哪几种水果做了民意调查,然后决定买什么水果,最值得关注的应该是统计调查数据的()A.中位数B.平均数C.众数D.方差9.若x1,x2,x3,x4的平均数为4,x5,x6,x7,…,x10的平均数为6,则x1,x2,…,x10的平均数为()A.5B.4.8C.5.2D.810.数据201,202,198,199,200的方差与极差分别是()A.1,4B.2,2C.2,4D.4,211.在防治新型冠状病毒知识问答中10名参赛选手得分情况如表:人数1342分数80859095那么这10名选手所得分数的中位数.12.某班40位同学参加“慈善一日捐”活动,具体捐款情况如下表:捐款/元51015202530人数4510786则捐款的平均数为元.13.小芳同学10周的综合素质评价成绩统计如下:成绩(分)94959798100周数12241这10周的综合素质评价成绩的中位数、众数和方差分别为:、、.14.样本数据1,5,n,6,8的众数是1,则这组数的中位数是.15.某地教育局拟招聘一批数学教师,现有一名应聘者笔试成绩88分、面试成绩90分,综合成绩按照笔试占40%、面试占60%进行计算,该应聘者的综合成绩为分.16.一组数1、2、3、4、5的方差是S12与另一组数3、4、5、6、7的方差S22的大小比较S12S22(填写:大于、等于、小于).17.若5个正数a1,a2,a3,a4,a5的平均数是a,则a1,a2,0,a3,a4,a5的平均数是.18.若一组数据x1,x2,…,x n的方差为9,则数据2x1+3,2x2+3,…,2x n+3的方差为.19.小明用s2=[(x1﹣6)2+(x2﹣6)2+…+(x10﹣6)2]计算一组数据的方差,那么x1+x2+x3+…+x10=.20.若一组数据3,4,5,x的极差是5,则x=.21.某校为了解学生对防疫知识的掌握情况,进行了一次“防疫知识测试”,随机抽取了部分学生的成绩,整理并绘制出如下不完整的统计表和统计图,请根据图表所提供的信息,解答下列问题:组别分数/分频数A80≤x<85aB85≤x<908C90≤x<9516D95≤x<100b (1)本次调查一共随机抽取了名学生的成绩,表格中的a=,b=;(2)本次调查中,学生成绩的中位数落在组内(填字母);(3)该校共有3000名学生,估计成绩达到90分以上(含90分)的学生人数约有多少人?22.2020年是全面建设小康社会实现之年,是脱贫攻坚战收关之年.某县政府派出调查小组对农村地区经济情况进行摸底,以便出台更精准的扶贫政策.调查小组开展了一次调查研究,请将下面的过程补全.[收集数据]调查小组计划选取A、B两村各20户上一年度家庭收入作为样本,下面的取样方法中,合理的是______(填字母);A.随机抽取A、B两村各20户上一年度家庭收入组成样本B.抽取A、B两村各20户上一年度家庭收入较好的组成样本C.抽取A、B两村各20户上一年度家庭收入较差的组成样本[整理数据]抽样方法确定后,调查小组获得的数据(单位:万元)如下:A村:1.8,1.5,2.2,2.4,2.4,2.2,2.6,2.0,1.8,2.1,1.6,2.0,2.4,2.4,2.1,3.0,3.2,2.8,2.7,2.8B村:1.6,1.7,2.2,2.2,2.1,2.2,2.2,3.0,2.8,2.2,1.5,1.8,2.0,2.2,2.6,2.8,3.1,3.0,2.8,2.0[描述数据]按如下分段整理,描述这两组样本数据:1.5≤x<22≤x<2.5 2.5≤x<33≤x<3.5上一年度家庭收入(单位:万元)A村4a4bB村4943 [分析数据]两组样本数据的平均数、中位数、众数如下表所示:平均数中位数众数A村 2.3c 2.4B村 2.3 2.2 2.2 [得出结论]请根据以上数据,回答下列问题:(1)在[收集数据]阶段,取样方法合理的是(填字母);(2)填空:a=,b=,c=;(3)若A村有300户人家,请估计A村上一年度家庭收入不少于2.5万元的户数;(4)结合这两组样本数据的平均数、中位数和众数,你认为A村和B村中哪个经济比较好?请至少从两个方面说明理由.23.某集团旗下有两家酒店A,B,2020年下半年的月营业额统计如下:[信息一]A,B两家酒店2020年下半年月营业额(单位:百万元)统计图如下[信息二]A,B两家酒店2020年下半年月营业额的相关数据统计如下:酒店平均数中位数众数方差A 2.5 2.2 2.20.73B 2.3 1.9△0.59(1)已知A酒店2020年11月份月营业额为3百万元,求A酒店2020年下半年的营业总额;(2)求B酒店2020年8月份的月营业额,并补全[信息二]中缺失数据;(3)结合数据分析,2020年下半年A,B两家酒店哪家经营状况较好,请说明理由.24.小明本学期的数学成绩如表所示:测验类别平时成绩1平时成绩2平时成绩3平时成绩4平时平均数期中考试期末考试成绩108103101108a110114(1)六次测试成绩的中位数和众数分别是什么?(2)请计算出小明该学期的平时成绩平均分a的值;(3)如果学期的数学总评成绩是根据一定的权重计算所得,其中平时成绩a所占权重为20%,已知小明该学期的总评成绩为111分,请计算出期中考试和期末考试各自所占权重.25.某市举行知识大赛,A校、B校各派出5名选手组成代表队参加比赛.两校派出选手的比赛成绩如图所示.根据以上信息.整理分析数据:平均数/分中位数/分众数/分A校858585B校85a b(1)a=;b=;(2)填空:(填“A校”或“B校”)①从两校比赛成绩的平均数和中位数的角度来比较,成绩较好的是;②从两校比赛成绩的平均数和众数的角度来比较,成绩较好的是;③从两校比赛成绩的方差的角度来比较,代表队选手成绩的方差较大.参考答案1.解:用身高为178cm的队员替换场上身高为174cm的队员,使总身高增加,进而平均数身高变大,但换人后,从小到大排列的顺序不变,因此中位数不变,故选:A.2.解:∵S甲2=1,S乙2=1.1,S丙2=0.6,S丁2=0.9,∴S丙2<S丁2<S甲2<S乙2,∴射击成绩最稳定的是丙,故选:C.3.解:因为新数据是在原数据的基础上每个加2,∴这两组数据的波动幅度不变,故选:D.4.解:A.这组数据中160出现3次,次数最多,所以这组数据的众数为160,此选项正确,不符合题意;B.这组数据的中位数为=165,此选项正确,不符合题意;C.这组数据的平均数为×(2×150+3×160+2×170+2×180+190)=167,此选项正确,不符合题意;D.这组数据的方差为×[2×(150﹣167)2+3×(160﹣167)2+2×(170﹣167)2+2×(180﹣167)2+(190﹣167)2]=161,此选项错误,符合题意;故选:D.5.解:=86.2(分),即李明的成绩是86.2分.故选:C.6.解:∵进入决赛的13名学生所得分数互不相同,共有1+2+3=6个奖项,∴这13名学生所得分数的中位数即是获奖的学生中的最低分,∴某学生知道自己的分数后,要判断自己能否获奖,他应该关注的统计量是中位数,如果这名学生的分数大于或等于中位数,则他能获奖,如果这名学生的分数小于中位数,则他不能获奖.故选:B.7.解:原数据的3,5,5,7的平均数为=5,中位数为5,众数为5,方差为×[(3﹣5)2+(5﹣5)2×2+(7﹣5)2]=2;新数据3,5,5,5,7的平均数为=5,中位数为5,众数为5,方差为×[(3﹣5)2+(5﹣5)2×3+(7﹣5)2]=1.6;所以添加一个数据5,方差发生变化,故选:C.8.解:由于众数是数据中出现次数最多的数,故班长最值得关注的应该是统计调查数据的众数.故选:C.9.解:由题意可得,x1,x2,…,x10的平均数为:===5.2,故选:C.10.解:极差为202﹣198=4,∵平均数为=200,∴方差为×[(201﹣200)2+(202﹣200)2+(198﹣200)2+(199﹣200)2+(200﹣200)2]=2,故选:C.11.解:将这10名参赛选手的得分从小到大排列处在中间位置的两个数都是90分,因此中位数是90分,故答案为:90.12.解:捐款的平均数为×(5×4+10×5+15×10+20×7+25×8+30×6)=18.5(元),13.解:这组数据中98出现次数最多,有4次,所以这组数据的众数为98分,由于一共有10个数据,其中位数是第5、6个数据的平均数,所以中位数为=97.5(分),∵这组数据的平均数为=97(分),方差为×[(94﹣97)2+2×(95﹣97)2+2×(97﹣97)2+4×(98﹣97)2+(100﹣97)2]=3,故答案为:97.5分、98分、3.14.解:∵数据1,5,n,6,8的众数是1,∴n=1,则这组数据为1、1、5、6、8,∴这组数据的中位数为5,故答案为:5.15.解:该应聘者的综合成绩为88×40%+90×60%=89.2(分),故答案为:89.2.16.解:由题意知,第2组数据是在第1组数据的基础上每个数据都加上2的,∴第2组数据的波动性与第1组数据的波动性相同,即S12=S22,故答案为:等于.17.解:∵正数a1,a2,a3,a4,a5的平均数是a,∴a1+a2+a3+a4+a5=5a,∴(a1+a2+0+a3+a4+a5)=a;故答案为:a.18.解:设一组数据x1,x2…x n的方差S2=9,则另一组数据2x1+3,2x2+3…2x n+3的S′2=22S2=36,故答案为:36.19.解:由s2=[(x1﹣6)2+(x2﹣6)2+…+(x10﹣6)2]知这10个数据的平均数为6,所以x1+x2+x3+…+x10=6×10=60,20.解:①x是最小的数时,5﹣x=5,解得x=0,②x是最大的数时,x﹣3=5,解得x=8,所以,x的值为0或8.故答案为:0或8.21.解:(1)8÷20%=40(人),b=40×35%=14(人),a=40﹣14﹣8﹣16=2(人),故答案为:40,2,14;(2)将这40名学生的成绩从小到大排列处在中间位置的两个数都在C组,故答案为:C;(3)1000×=750(人),答:该校共有3000名学生中成绩达到90分以上(含90分)的有750人.22.解:(1)根据样本的广泛性和代表性可知,取样方法中,合理的是:A.随机抽取A、B两村各20户上一年度家庭收入组成样本,故选:A;(2)由统计频数的方法可得,a=10,b=2,A村家庭收入出现次数最多的是2.4万元,因此众数是2.4万元,即c=2.4,故答案为:10,2,2.4;(3)300×=90(户),答:A村有300户人家中一年度家庭收入不少于2.5万元的大约有90户;(4)A村的比较好,理由为:由于A村、B村的平均数相同,而A村的中位数、众数都比B村的高,所以A村的紧急情况比较好.23.解:(1)2.5×6=15(百万元),答:A酒店2020年下半年的营业总额为15百万元;(2)B酒店下半年的总营业额为2.3×6=13.8(百万元),因此B酒店8月份的营业额为13.8﹣1.5﹣1.7﹣2.3﹣1.7﹣3.6=3(百万元),补全条形统计图如图所示:(3)A酒店的经营状况较好,理由:A酒店经营营业额的平均数、中位数、众数均比B 酒店的高.24.解:(1)六次数据依次为:101、103、108、108、110、114,则中位数为:108,众数为:108;(2)a==105;(3)设期中考试所占权重是x,期末考试所占权重是y,由题意得,解得:.答:期中考试所占权重是30%,期末考试所占权重是50%.25.解:(1)将B校5名选手的成绩重新排列为:70、75、80、100、100,所以其中位数a=80、众数b=100,故答案为:80、100;(2)①从两校比赛成绩的平均数和中位数的角度来比较,成绩较好的是A校;②从两校比赛成绩的平均数和众数的角度来比较,成绩较好的是B校;③=×[(75﹣85)2+(80﹣85)2+2×(85﹣85)2+(100﹣85)2]=70,=×[(70﹣85)2+(75﹣85)2+(80﹣85)2+2×(100﹣85)2]=160,∴从两校比赛成绩的方差的角度来比较,B校代表队选手成绩的方差较大.故答案为:A校、B校、B校.人教版八年级数学下册《第20章数据的分析》期末复习综合提升训练2(附答案)1.已知一组数据1,0,3,﹣1,x,2,3的平均数是1,则这组数据的中位数是()A.﹣1B.1C.3D.﹣1或者3 2.某中学开展“读书伴我成长”活动,为了解八年级学生四月份的读书册数,对从中随机抽取的20名学生的读书册数进行调查,结果如右表:根据统计表中的数据,这20名同学读书册数的众数,中位数分别是()册数/册12345人数/人25742A.3,3B.3,7C.2,7D.7,33.某家书店对上季度该店中国古代四大名著的销售量统计如表:书名《西游记》《水浒传》《三国演义》《红楼梦》销售量/本180********依据统计数据,为了更好地满足读者需求,该书店决定本季度购进中国古代四大名著时多购进一些《西游记》,你认为最影响该书店决策的统计量是()A.平均数B.众数C.中位数D.方差4.参加第六届京津冀羽毛球冠军挑战赛的一个代表队的年龄分别是49,20,20,25,31,40,46,20,44,25,这组数据的平均数,众数,中位数分别是()A.33,21,27B.32,20,28C.33,49,27D.32,21,22 5.测试五位学生的“1000米”跑成绩,得到五个各不相同的数据,在统计时,出现了一处错误:将跑的最快一名学生成绩写得更快了,则计算结果不受影响的是()A.总成绩B.方差C.中位数D.平均数6.某校七年级学生的平均年龄为13岁,年龄的方差为3,若学生人数没有变动,则两年后的同一批学生,对其年龄的说法正确的是()A.平均年龄为13岁,方差改变B.平均年龄为15岁,方差不变C.平均年龄为15岁,方差改变D.平均年龄为13岁,方差不变7.已知样本数据2,3,5,3,7,下列说法不正确的是()A.平均数是4B.众数是3C.中位数是5D.方差是3.28.在样本方差的计算式s2=[(x1﹣10)2+(x2﹣10)2+…+(x5﹣10)2]中,数字5和10分别表示样本的()A.容量,方差B.平均数,众数C.标准差,平均数D.容量,平均数9.已知一组数据a1,a2,a3,a4,a5的方差是S1,另一组数据a1﹣6,a2﹣6,a3﹣6,a4﹣6,a5﹣6的方差是S2,则S1与S2的大小关系是S1S2(填写“>”“<”或“=”).10.已知a,b,c,d的平均数是3,则2a﹣1,2b﹣1,2c﹣1,2d﹣1的平均数是.11.已知一组数据x1,x2,x3的平均数是15,方差是2,那么另一组数据2x1﹣4,2x2﹣4,2x3﹣4的平均数是.12.甲、乙、丙、丁四人进行射击测试,每人测试10次,平均成绩均为9.2环,方差如表所示:则在这四个选手中,成绩最稳定的是.选手甲乙丙丁方差0.560.600.500.4513.一组数据1,1,x,2,4,5的平均数是3,则这组数据的中位数是.14.一组数据4,7,x,6,9众数是9,则这5个数据的平均数为.15.小明在跳绳考核中,前4次跳绳成绩(次数/分钟)记录为:180,178,180,177,若要使5次跳绳成绩的平均数与众数相同,则小明第5次跳绳成绩是.16.需要对一批排球的质量是否符合标准进行检测,其中质量超过标准的克数记为正数,不足标准的克数记为负数,现抽取8个排球,通过检测所得数据如下(单位:克):+1,﹣2,+1,0,+2,﹣3,0,+1,则这组数据的方差是.17.某班40位同学参加“慈善一日捐”活动,具体捐款情况如下表:捐款/元51015202530人数4510786则捐款的平均数为元.18.小芳同学10周的综合素质评价成绩统计如下:成绩(分)94959798100周数12241这10周的综合素质评价成绩的中位数、众数和方差分别为:、、.19.一组从小到大排列的数据:2,5,x,y,2x,11的平均数与中位数都是7,则x﹣y=.20.如果一组数据5、8、a、7、4的平均数是a,那么这组数据的方差为.21.某快餐店某天销售3种盒饭的有关数据如图所示,则3种盒饭的价格平均数是元.22.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为,.23.某地农业科技部门积极助力家乡农产品的改良与推广,为了解甲、乙两种新品橙子的质量,进行了抽样调查在相同条件下,随机抽取了甲、乙各25份样品,对大小甜度等各方面进行了综合测评,并对数据进行收集、整理、描述和分析,下面给出了部分信息.a.测评分数(百分制)如下:甲:77,79,80,80,85,86,86,87,88,89,89,90,91,91,91,91,91,92,93,95,95,96,97,98,98乙:69,79,79,79,86,87,87,89,89,90,90,90,90,90,91,92,92,92,94,95,96,96,97,98,98b.按如下分组整理、描述这两组样本数据:60≤x<7070≤x<8080≤x<9090≤x≤100甲02914乙13516 c.甲、乙两种橙子测评分数的平均数、众数、中位数如下表所示:品种平均数众数中位数甲89.4m91乙89.490n 根据以上信息,回答下列问题(1)写出表中m,n的值(2)记甲种橙子测评分数的方差为s12,乙种橙子测评分数的方差为s22,则s12,s22的大小关系为;(3)根据抽样调查情况,可以推断种橙子的质量较好,理由为.(至少从两个不同的角度说明推断的合理性)24.张老师对李华和刘强两位同学从数学运算、逻辑推理、直观想象和数据分析四个方面考核他们的数学素养,单项检测成绩(百分制)列表如下:姓名数学运算逻辑推理直观想象数据分析李华86858085刘强74878784(1)分别对两个人的检测成绩进行数据计算,补全下表:姓名平均分中位数众数方差李华848585刘强838722.8(2)你认为李华和刘强谁的数学素养更好?结合数据,从两个角度进行分析.(3)若将数学运算、逻辑推理、直观想象、数据分析四个检测成绩分别按权重30%,40%,20%,10%的比例计算最终考核得分,请分别计算李华和刘强的最终得分.25.杭州市建兰中学开展防疫知识线上竞赛活动,九年级(1)、(2)班各选出5名选手参加竞赛,两个班选出的5名选手的竞赛成绩(满分为100分)如图所示.(1)求九(1)班的众数和九(2)班的中位数;(2)计算两个班竞赛成绩的方差,并说明哪个班的成绩较为整齐.26.某商店1~6周销售甲、乙两种品牌冰箱的数量如表(表Ⅰ)所示(单位:台):第1周第2周第3周第4周第5周第6周甲9101091210乙1312711107现根据表Ⅰ数据进行统计得到表Ⅱ:平均数中位数众数甲10乙107(1)填空:根据表Ⅰ的数据补全表Ⅱ;(2)老师计算了乙品牌冰箱销量的方差:S乙2=[(13﹣10)2+(12﹣10)2+(7﹣10)2+(11﹣10)2+(10﹣10)2+(7﹣10)2]=(台2).请你计算甲品牌冰箱销量的方差,根据计算结果,建议商家可多采购哪一种品牌冰箱?为什么?27.甲、乙两班各选派10名学生参加“文明城市创建”知识问答.各参赛选手的成绩如下:甲班:93,98,89,93,95,96,93,96,98,99;乙班:93,95,88,100,92,93,100,98,98,93;通过整理,得到数据分析表如下:班级最高分平均分中位数众数方差甲班999595.5a b乙班10095c9313.8(1)填空:a=,b=,c=;(2)根据上述数据,你认为哪个班的成绩好一些?请简要说明理由.28.九年级(1)班的小华和小红两名学生10次数学测试成绩如下表(表Ⅰ)所示:小华708090807090801006080小红908010060908090606090现根据上表数据进行统计得到下表(表Ⅱ):姓名平均成绩中位数众数小华80小红8090(1)填空:根据表Ⅰ的数据完成表Ⅱ中所缺的数据;(2)老师计算了小红的方差[4×(90﹣80)2+3×(60﹣80)2+(100﹣80)2]=200,请你计算小华的方差并说明哪名学生的成绩较为稳定.参考答案1.解:∵一组数据1,0,3,﹣1,x,2,3的平均数是1,∴[1+0+3+(﹣1)+x+2+3]÷7=1,解得x=﹣1,∴这组数据按照从小到大排列是:﹣1,﹣1,0,1,2,3,3,∴这组数据的中位数是1,故选:B.2.解:因为共有20个数据,所以中位数为第10、11个数据的平均数,即中位数为=3,由表格知数据3出现了7次,次数最多,所以众数为3.故选:A.3.解:由于众数是数据中出现次数最多的数,故应最关心这组数据中的众数.故选:B.4.解:这组数据的平均数是:(49+20+20+25+31+40+46+20+44+25)÷10=32(岁),这组数据出现最多的数是20,所以这组数据的众数是20岁;把这些数按从小到大的顺序排列为:20,20,20,25,25,31,40,44,46,49,则这组数据的中位数是:(25+31)÷2=28(岁).故选:B.5.解:因为中位数是将数据按照大小顺序重新排列,代表了这组数据值大小的“中点”,不受极端值影响,所以将最高成绩写得更高了,计算结果不受影响的是中位数.故选:C.6.解:两年后的同一批学生的年龄均增加2岁,其年龄的波动幅度不变,所以平均年龄为15岁,方差不变,故选:B.7.解:样本数据2,3,5,3,7中平均数是4,中位数是3,众数是3,方差是S2=[(2﹣4)2+(3﹣4)2+(5﹣4)2+(3﹣4)2+(7﹣4)2]=3.2.故选:C.8.解:在方差的计算公式中,n代表容量,代表平均数.故选:D.9.解:根据题意知,数据a1﹣6,a2﹣6,a3﹣6,a4﹣6,a5﹣6是将数据a1,a2,a3,a4,a5分别减去6所得,所以两组数据的波动幅度相同,∴S1=S2,故答案为:=.10.解:∵a,b,c,d的平均数是3,∴a+b+c+d=12,∴[(2a﹣1)+(2b﹣1)+(2c﹣1)+(2d﹣1)]÷4=(2a﹣1+2b﹣1+2c﹣1+2d﹣1)÷4=[2(a+b+c+d)﹣4]×=﹣1=﹣1=6﹣1=5,故答案为:5.11.解:∵数据x1,x2,x3的平均数是15,∴数据2x1﹣4,2x2﹣4,2x3﹣4的平均数是2×15﹣4=26;故答案为:26.12.解:∵0.60>0.56>0.50>0.45,∴丁的方差最小,∴成绩最稳定的是丁,故答案为:丁.13.解:∵数据1,1,x,2,4,5的平均数是3,∴=3,解得x=5,所以这组数据为1,1,2,4,5,5,则这组数据的中位数为=3,故答案为:3.14.解:∵数据4,7,x,6,9众数是9,∴x=9,∴这组数据的平均数是(4+7+9+6+9)÷5=7;故答案为:7.15.解:设小明第5次跳绳成绩是x次数/分钟,根据题意得,(180+178+180+177+x)=180,解得,x=185.故答案为:185.16.解:平均数=,方差==2.5,故答案为:2.517.解:捐款的平均数为×(5×4+10×5+15×10+20×7+25×8+30×6)=18.5(元),故答案为:18.5.18.解:这组数据中98出现次数最多,有4次,所以这组数据的众数为98分,由于一共有10个数据,其中位数是第5、6个数据的平均数,所以中位数为=97.5(分),∵这组数据的平均数为=97(分),方差为×[(94﹣97)2+2×(95﹣97)2+2×(97﹣97)2+4×(98﹣97)2+(100﹣97)2]=3,故答案为:97.5分、98分、3.19.解:∵一组从小到大排列的数据:2,5,x,y,2x,11的平均数与中位数都是7,∴(2+5+x+y+2x+11)=(x+y)=7,解得y=9,x=5,∴x﹣y=5﹣9=﹣4,故答案为﹣4.20.解:根据题意知=a,解得a=6,所以这组数据为5、8、6、7、4,则这组数据的方差为×[(5﹣6)2+(8﹣6)2+(6﹣6)2+(7﹣6)2+(4﹣6)2]=2,故答案为:2.21.解:3种盒饭的价格平均数是6×25%+8×15%+10×60%=8.7(元),故答案为:8.7.22.解:∵共有22个数据,其中位数是第11、12个数据的平均数,而第11、12个数据分别为8环、8环,∴射中环数的中位数为=8(环),∵这组数据中8环次数最多,∴众数为8环,故答案为:8环,8环.23.解:(1)甲品种橙子测评成绩出现次数最多的是91分,所以众数是91,即m=91,将乙品种橙子的测评成绩从小到大排列处在中间位置的一个数是90,因此中位数是90,即n=90,答:m=91,n=90;(2)由甲、乙两种橙子的测评成绩的大小波动情况,直观可得s12<s22,故答案为:<;(3)甲品种较好,理由为:甲品种橙子的中位数、众数均比乙品种的高.故答案为:甲,甲品种橙子的中位数、众数均比乙品种的高.24.解:(1)李华成绩的方差为×[(86﹣84)2+2×(85﹣84)2+(80﹣84)2]=5.5,刘强成绩的中位数为=85.5,补全表格如下:姓名平均分中位数众数方差李华848585 5.5刘强8385.58722.8故答案为:5.5、85.5;(2)李华的数学素养更好,从平均数看,李华的平均分高于刘强,所以李华的平均成绩更好;从方差看,李华的方差小于刘强,所以李华的成绩更加稳定(答案不唯一,合理均可);(3)李华的最终成绩为86×30%+85×40%+80×20%+85×10%=84.3(分),刘强的最终成绩为74×30%+87×40%+87×20%+84×10%=82.8(分).25.解:(1)由图知,九(1)班成绩为80、80、80、90、100,九(2)班成绩为70、80、85、95、100,所以九(1)班成绩的众数为80分,九(2)班成绩的中位数为85分;(2)九(1)班成绩的平均数为=86(分),九(2)班成绩的平均数为=86(分),∴九(1)班成绩的方差为×[3×(80﹣86)2+(90﹣86)2+(100﹣86)2]=64,九(2)班成绩的方差为×[(70﹣86)2+(80﹣86)2+(85﹣86)2+(95﹣86)2+(100﹣86)2]=114,∴九(1)班成绩较为整齐.26.解:(1)甲品牌销售数量从小到大排列为:9、9、10、10、10、12,所以甲品牌销售数量的平均数为=10(台),众数为10台,乙品牌销售数量从小到大排列为7、7、10、11、12、13,所以乙品牌销售数量的中位数为=10.5(台),补全表格如下:平均数中位数众数甲101010乙1010.57故答案为:10、10、10.5;(2)建议商家可多采购甲品牌冰箱,∵甲品牌冰箱销量的方差=×[(9﹣10)2×2+(10﹣10)2×3+(12﹣10)2]=1,S乙2=,∴<S乙2,∴甲品牌冰箱的销售量比较稳定,建议商家可多采购甲品牌冰箱.27.解:(1)甲班成绩出现次数最多的是93,所以甲班成绩的众数a=93,方差b=×[(89﹣95)2+3×(93﹣95)2+(95﹣95)2+2×(96﹣95)2+2×(98﹣95)2+(99﹣95)2]=8.4,乙班成绩重新排列为:88,92,93,93,93,95,98,98,100,100;所以乙班成绩的中位数c==94,故答案为:93、8.4、94;(2)∵甲班的方差是8.4,乙班的方差是12,甲的方差小于乙的方差,∵甲班代表队成绩稳定;∵甲班的中位数是95,乙班的中位数是94,∴甲班的高分人数多于乙班的平均数,∴综上甲班代表队成绩好.28.解:(1)小华的平均成绩为=80,众数为80,小红的成绩重新排列为60、60、60、80、80、90、90、90、90、100,所以小红成绩的中位数为=85,补全表格如下:姓名平均成绩中位数众数小华808080小红808590(2)小华的方差为×[(60﹣80)2+2×(70﹣80)2+4×(80﹣80)2+2×(90﹣80)2+(100﹣80)2]=120,∵120<200,∴小华成绩稳定。

数据的分析期末复习

数据的分析期末复习

数据的分析一、平均数1.算术平均数,对于n个数x1,x2,…,x n,我们把叫做这组数据的算术平均数,简称,记为.2. 加权平均数:如果有n个数x1,x2,…,x n,x1出现f1次,x2出现f2次,x3出现f3次,…,x k出现f k次(其中f+f2+…+f k=n),那么x=叫做x1,x2,…,x k这k1个数的加权平均数,其中f1,f2,…,f k分别叫做x1,x2,…,x k的,f1+f2+f3+…+f k=二、众数在一组数据中,出现次数的数叫做这组数据的众数(说明:一组数据的众数有时有几个) 三、中位数①将一组数据按依次排列,把处在的一个数据(或两个数据的平均数)叫做这组数据的中位数.②有n个数据,若n为奇数时,中位数在第位上;当n为偶数时,中位数在第位上。

四、方差在一组数据x1,x2,x3,…,x n中,各数据与它们的平均数x的差的的平均数叫做这组数据的方差,即s2=.五、标准差一组数据的方差的叫做这组数据的标准差,即s=. 六.极差一组数据中与的差,叫做这组数据的极差。

1.已知一组数据8,9,7,7,8,7,则这组数据的众数为.2.某班50名学生的一次英语听力测试成绩分布如下表所示:这次听力测试成绩的众数是( ).成绩(分)012345678910人数(人)0001013561519 A.5分B.6分C.9分D.10分3.某班一个小组七名同学在地震灾区“爱心捐助”活动中,捐款数额分别为10,30,40,50,15,20,50(单位:元).这组数据的中位数是(元).4.某射击小组有20人,教练根据他们某次射击的数据绘制成如图所示的统计图,则这组数据的众数和中位数分别是( ).A.7,7 B.8,7.5C.7,7.5 D.8,64.16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,其他15位同学成绩的下列数据中,能使他得出结论的是( ).A .平均数B .极差C .中位数D .方差5.某居民小区开展节约用电活动,对该小区100户家庭的节电量情况进行统计,4月份与3月份相比,节电情况如下表:则4月份这100户节电量的平均数、中位数、众数分别是( ). A .35、35、30 B .25、30、20C .36、35、30D .36、30、306.为了考察甲、乙两种小麦的长势,分别从中抽出20株测得其高度,并求得它们的方差分别为s 2甲=3.6,s 2乙=15.8,则 种小麦的长势比较整齐.7.某市广播电视局欲招聘播音员一名,对A 、B 两名候选人进行了两项素质测试.两人的两项测试成绩如下表所示.根据实际需要,广播电视局将面试、综合知识测试的得分按3∶2的比例计算两人的总成绩,那么 (填“A ”或“B ”)将被录用. 8.孔明同学在庆祝建党90周年的演讲比赛中,6位评委给他的打分如下表:则孔明得分的众数 为 分,平均数为 分9.数据5,7,5,8,6,13,5的中位数是( ). A .5 B .6 C .7 D .810.甲、乙两学生在军训打靶训练中,打靶的总次数相同,且所中环数的平均数也相同,但甲的成绩比乙的成绩稳定,那么两者的方差的大小关系是( ).A .s 甲2<s 乙2B .s 甲2>s 乙2C .s 甲2=s 乙2D .不能确定 11.北京市今年6月某日部分区县的最高气温如下表:区县 大兴 通州 平谷 顺义 怀柔 门头沟 延庆 昌平 密云 房山 最高气温(℃) 32 32 30 32 30 32 29 32 30 32 则这10个区县该日最高气温的众数和中位数分别是( ).A .32,32B .32,30C .30,32D .32,3112.一个样本为1,3,2,2,a ,b ,c .已知这个样本的众数为3,平均数为2,那么这个样本的方差为 .13.一方有难,八方支援.2011年6月江西修水县遭遇了罕见特大暴雨的侵袭,,给修水人民造成了巨大的损失﹒灾难发生后,实验中学举行了爱心捐款活动,全校同学纷纷拿出自己的零花钱,踊跃捐款支援灾区人民﹒小慧对捐款情况进行了抽样调查,抽取了40名同学的捐款数据,把数据进行分组、列频数分布表后,绘制了频数分布直方图.图中从左到右各长方形高度之比为3∶4∶5∶7∶1(如图).40名同学捐款数据的中位数是 ;14.某班体育委员记录了第一小组七位同学定点投篮(每人投10个)的情况,投进篮框的个数为6,10,5,3,4,8,4,这组数据的中位数和极差分别是 ( ).A 4 7B 7 5C 5 7D 3 7节电量(千瓦时) 20 30 40 50 户数 10 40 30 20 测试项目 测试成绩A B 面试 90 95 综合知识测试 85 80评委代号 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ 评分 85 90 80 93 90 9015.甲、乙、丙三个家电厂家在广告中都声称,他们的某种电子产品在正常情况下的使用寿命都是8年,经质量检测部门对这三家销售的产品的使用寿命进行跟踪调查,统计结果如下:(单位:年)甲厂:4,5,5,5,5,7,9,12,13,15乙厂:6,6,8,8,8,9,10,12,14,15丙厂:4,4,4,6,7,9,13,15,16,16请回答下列问题:(1)分别求出以上三组数据的平均数、众数、中位数;(2)这三个厂家的推销广告分别利用哪一种表示集中趋势的特征数?(3)如果你是位顾客,宜选购哪家工厂的产品?为什么?16.某校学生会干部对校学生会倡导的“助残”自愿捐款活动进行抽样调查,得到一组学生捐款情况的数据,下图是根据这组数据绘制的统计图,图中从左到右各长方形高度之比为3∶4∶5∶8∶2,又知此次调查中捐15元和20元的人数共39人.(1)他们一共抽查了多少人?捐款数大于20元的概率是多少?(2)这组数据的众数、中位数各是多少?(3)若该校共有2310名学生,请估算全校学生共捐款多少元17.一次学科测验,学生得分均为整数,满分10分,成绩达到6分以上(包括6分)为合格.成绩达到9分为优秀.这次测验中甲乙两组学生成绩分布的条形统计图如下:(1)请补充完成下面的成绩统计分析表:(2)甲组学生说他们的合格率、优秀率均高于乙组,所以他们的成绩好于乙组.但乙组学生不同意甲组学生的说法,认为他们组的成绩要高于甲组.请你给出三条支持乙组学生观点的理由.19.新星公司从应届毕业生中招聘公司新职员,对应聘者的专业知识、英语水平均分方差 中位数 合格率 优秀率 甲组 6.9 2.4 91.7% 16.7% 乙组 1.3 83.3% 8.3%平、参加社会实践与社团活动三项进行测试或成果认定,三项的得分满分都为100分,三项的分数分别按5∶3∶2的比例记入最后总分,有4位应聘者的得分如下表所示:(1)写出4位应聘者的总分;(2)就表中专业知识、英语水平、参加社会实践与社团活动三项的得分,分别求出三项中4人所得分数的方差;(3)由(1)和(2),你对应聘者有何建议?。

自-期末复习(五)数据的分析

自-期末复习(五)数据的分析

期末复习(五) 数据的分析考点一平均数、中位数、众数【例1】为了大力宣传节约用电,某小区随机抽查了10户家庭的月用电量情况,统计如下表.关于这10户家庭的月用电量说法正确的是()月用电量(度) 25 3040 50 60户数 1 2 4 2 1A.中位数是40B.众数是4 C.平均数是20.5 D.平均数是41 【分析】由题意可知排序后第5,6户的用电量都是40度,故中位数是40;用电量40度的户数有4户,故众数是40;平均数=253024045026010+⨯+⨯+⨯+=40.5.【解答】A【方法归纳】正确理解平均数、中位数与众数的定义是解题的关键.1.(2014·锦州)某销售公司有营销人员15人,销售部为了制定某种商品的月销售量定额,统计了这15人某月的销售量,如下表所示:那么这15位销售人员该月销售量的平均数、众数、中位数分别是()A.320,210,230 B.320,210,210C.206,210,210D.206,210,2302.(2014·德阳)如图是某位射击选手5次射击成绩的折线图,根据图示信息,这5次成绩的众数、中位数分别是()A.7、8 B.7、9 C.8、9 D.8、10考点二方差【例2】(2014·丽水)有一组数据:3,a,4,6,7.它们的平均数是5,那么这组数据的方差是__________.【分析】由数据的平均数是5,可求出a值,再根据方差的计算公式计算即可.【解答】2【方法归纳】计算方差:“先平均、再作差、平方后、再平均”,也就是说,先求出一组数据的平均数,再将每一个数据都与平均数作差,然后将这些差进行平方,最后求这些差的平方的平均数,其结果就是这组数据的方差.3.(2014·厦门)已知一组数据是:6,6,6,6,6,6,则这组数据的方差是__________.4.(2014·朝阳)六箱救灾物资的质量(单位:千克)分别是17,20,18,17,18,18,则这组数据的平均数、众数、方差依次是( )A.18,18,3B.18,18,1C.18,17.5,3D.17.5,18,1考点三用样本估计总体【例3】(2014·湘西)据省环保网发布的消息,吉首市空气质量评价连续两年居全省14个省辖市城市之首,下表是吉首市2014年5月份前10天的空气质量指数统计表.(一)2014年5月1日~10日空气质量指数(AQI)情况(二)空气质量污染指数标准(AQI)(1)请你计算这10天吉首市空气质量指数的平均数,并据此判断这10天吉首市空气质量平均状况属于哪个等级;(结果保留整数)(2)按规定,当空气质量指数AQI≤100时,空气质量才算“达标”,请你根据表(一)和表(二)所提供的信息,估计今年(365天)吉首市空气质量“达标”的天数.(结果保留整数)【分析】(1)算出10天空气质量指数的平均数并根据对应表作出判断即可;(2)先统计出样本中“达标”的天数并算出达标率,再算出今年(365天)吉首市空气质量“达标”的天数即可.【解答】(1)∵x=110×(28+38+94+53+63+149+53+90+84+35)=68.7≈69,∴这10天空气质量平均状况属于良. (2)∵这10天中达标的天数为9天,∴365×910=328.5≈329(天).答:今年吉首市空气质量“达标”的天数约为329天.【方法归纳】用样本估计总体是统计的核心思想.具体的有用样本平均数估计总体平均数,用样本百分率估计总体百分率,用样本方差估计总体方差等.5.某果园有果树200棵,从中随机地抽取5棵,每棵果树的产量如下(单位:千克):98、102、97、103、105,这5棵树的平均产量为__________千克;估计这200棵果树的总产量约为__________千克.考点四分析数据作决策【例4】(2014·金华)九(3)班为了组队参加学校举行的“五水共治”知识竞赛,在班里选取了若干名学生,分成人数相同的甲乙两组,进行了四次“五水共治”模拟竞赛,成绩优秀的人数和优秀率分别绘制成如下统计图.根据统计图,回答下列问题:(1)第三次成绩的优秀率是多少?并将条形统计图补充完整; (2)已求得甲组成绩优秀人数的平均数x 甲组=7,方差s2甲组=1.5,请通过计算说明,哪一组成绩优秀的人数较稳定?【分析】(1)先根据第一次成绩优秀人数与优秀率求出总人数,再求第三次的优秀率,根据第四次的优秀率乘以总人数可求出第四次乙组优秀的人数,再补全统计图;(2)根据平均数相同时,方差越小越稳定作判断. 【解答】(1)11÷55%=20(人),8520+×100%=65%. 答:第三次成绩的优秀率是65%.(2)x 乙组=68594+++=7,s2乙组=14[(6-7)2+(8-7)2+(5-7)2+(9-7)2]=2.5,∵x 甲组=x 乙组,s 2甲组<s2乙组,∴甲组成绩优秀的人数较稳定.【方法归纳】分析数据作出决策,取决于对数据分析的角度.平均数相同的情况下,方差越小的那组数据越稳定.6.在甲乙两名学生中选拔一人参加国家数学冬令营集训.经统计,两人近期的8次测试成绩分别制作成统计图、表如下.如果让你选拔,打算让谁参加?统计图、表中,哪一种较能直观地反映出两者的差异?一、选择题(每小题3分,共30分)1.甲、乙两名学生进行射击练习,两人在相同条件下各射靶5次.射击成绩统计如下:从射击成绩的平均数评价甲、乙两人的射击水平,则()A.甲比乙高B.甲、乙一样 C.乙比甲高 D.不能确定2.(2014·江西)某市6月份某周气温(单位:℃)为:23,25,28,25,28,31,28,则这组数据的众数和中位数分别是( )A.25,25 B.28,28 C.25,28D.28,313.(2014·茂名)甲、乙两个同学在四次模拟测试中,数学的平均成绩都是112分,方差分别是s2甲=5,s2乙=12,则成绩比较稳定的是( )A.甲B.乙C.甲和乙一样 D.无法确定4.已知数据:-4、1、2、-1、2,则下列结论错误的是()A.中位数为1 B.方差为26C.众数为2 D.平均数为05.对于数据组3,3,2,3,6,3,8,3,6,3,4.①这组数据的众数是3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确的结论有()A.4个B.3个C.2个 D.1个6.某校四个绿化小组一天植树的棵数如下:10,x,10,8.已知这组数据的众数与平均数相等,则这组数据的中位数是()A.8B.9C.10D.127.张大叔有一片果林,共有80棵果树.某日,张大叔开始采摘今年第一批成熟的果子,他随机选取1棵果树的10个果子,称得质量分别为(单位:kg):0.28,0.26,0.24,0.23,0.25,0.24,0.26,0.26,0.25,0.23.如果一棵树平均结有120个果子,以此估算,张大叔收获的这批果子的单个质量和总质量分别约为( )A.0.25 kg,2400 kg B.2.5 kg,2 400kgC.0.25 kg,4800kgD.2.5kg,4800kg8.(2014·厦门)已知某校女子田径队23人年龄的平均数和中位数都是13岁,但是后来发现其中有一位同学的年龄登记错误,将14岁写成15岁.经重新计算后,正确的平均数为a岁,中位数为b岁,则下列结论中正确的是( ) A.a<13,b=13B.a<13,b<13C.a>13,b<13D.a>13,b=139.(2014·兰州)期中考试后,班里有两位同学议论他们所在小组同学的数学成绩,小明说:“我们组成绩是86分的同学最多”,小英说:“我们组的7位同学成绩排在最中间的恰好也是86分”,上面两位同学的话能反映的统计量是( )A.众数和平均数B.平均数和中位数C.众数和方差D.众数和中位数10.(2014·通辽)一次“我的青春,我的梦”演讲比赛,有五名同学的成绩如下表所示,有两个数据被遮盖,那么被遮盖的两个数据依次是()A.80,2B.802C.78,2 D.782二、填空题(每小题3分,共18分)11.某招聘考试分笔试和面试两种,其中笔试按60%、面试按40%计算加权平均数,作为总成绩.孔明笔试成绩90分,面试成绩85分,那么孔明的总成绩是__________分.12.(2014·呼和浩特)某校五个绿化小组一天的植树的棵数如下:10,10,12,x,8.已知这组数据的平均数是10,那么这组数据的方差是__________.13.小李和小林练习射箭,射完10箭后两人的成绩如图所示,通常新手的成绩不太稳定.根据图中的信息,估计这两人中的新手是__________.14.为了发展农业经济,致富奔小康,李伯伯家2013年养了4 000条鲤鱼,现在准备打捞出售,为了估计鱼塘中鲤鱼的总质量,从鱼塘中捕捞了三次进行统计,得到的数据如下表所示:那么,估计鱼塘中鲤鱼的总质量为__________千克.15.(2014·牡丹江)一组数据2,3,x,y,12中,唯一众数是12,平均数是6,这组数据的中位数是__________.16.已知2,3,5,m,n五个数据的方差是2,那么3,4,6,m+1,n+1五个数据的方差是__________.三、解答题(共52分)17.(12分)(2013·黄冈)为了倡导“节约用水,从我做起”,黄冈市政府决定对市直机关500户家庭的用水情况做一次调查,市政府调查小组随机抽查了其中100户家庭一年的月平均用水量(单位:吨).并将调查结果制成了如图所示的条形统计图.(1)请将条形统计图补充完整;(2)求这100个样本数据的平均数,众数和中位数;(3)根据样本数据,估计黄冈市直机关500户家庭中月平均用水量不超过12吨的约有多少户?18.(8分)(2014·咸宁)我市民营经济持续发展,2013年城镇民营企业就业人数突破20万.为了解城镇民营企业员工每月的收入状况,统计局对全市城镇民营企业员工2013年月平均收入随机抽样调查,将抽样的数据按“2000元以内”、“2 000元~4 000元”、“4000元~6 000元”和“6 000元以上”分为四组,进行整理,分别用A,B,C,D表示,得到下列两幅不完整的统计图.由图中所给出的信息解答下列问题:(1)本次抽样调查的员工有__________人,在扇形统计图中x的值为__________,表示“月平均收入在2000元以内”的部分所对应扇形的圆心角的度数是__________;(2)将不完整的条形图补充完整,并估计我市2013年城镇民营企业20万员工中,每月的收入在“2000元~4000元”的约多少人?(3)统计局根据抽样数据计算得到,2013年我市城镇民营企业员工月平均收入为4872元,请你结合上述统计的数据,谈一谈用平均数反映月收入情况是否合理?19.(10分)(2014·山西)某公司招聘人才,对应聘者分别进行阅读能力、思维能力和表达能力三项测试,其中甲、乙两人的成绩如下表:(1)若根据三项测试的平均成绩在甲、乙两人中录用一人,那么谁将被录用?(2)根据实际需要,公司将阅读、思维和表达能力三项测试得分按3∶5∶2的比确定每人的最后成绩,若按此成绩在甲、乙两人中录用一人,谁将被录用?(3)公司按照(2)中的成绩计算方法,将每位应聘者的最后成绩绘制成如图所示的频数分布直方图(每组分数段均包含左端数值,不包含右端数值,如最右边一组分数x为:85≤x<90),并决定由高分到低分录用8名员工,甲、乙两人能否被录用?请说明理由,并求出本次招聘人才的录用率.20.(10分)甲、乙两名同学进入初四后,某科6次考试成绩如图所示:(1)请根据统计图填写下表平均数方差中位数众数甲75 75乙33.3(2)①从平均数和方差相结合看:②从折线图上两名同学分数的走势上看,你认为反映出什么问题?21.(12分)今有两人跳高成绩按先后次序记录如下:甲:1.91.61.71.61.21.71.71.91.81.9乙:1.21.41.61.81.71.71.81.91.92.0请你运用你学过的统计知识回答下列问题:(1)请写出两人跳高成绩的相同点和不同点;(2)裁判根据他们的成绩最后评判甲获胜,你能说出裁判评判甲获胜的理由吗?(3)教练根据他们的成绩最后选择乙去参加比赛,你能不能说出教练让乙去比赛的理由?参考答案变式练习1.B2.A3.0 4.B 5.101 20 200 6.由发展趋势一般宜选拔乙参加,折线图反映两者差异比较明显.复习测试1.B 2.B 3.A 4.B 5.D 6.C7.A8.A 9.D 10.C11.8812.1.613.小李14.6 800 15.3 16.217.(1)根据条形图可得出:平均用水11吨的用户为:100-20-10-20-10=40(户).图略;(2)平均数为:1100×(10×20+11×40+12×10+13×20+14×10)=11.6(吨),根据11出现次数最多,故众数为:11,根据100个数据的最中间为第50和第51个数据,按大小排列后第50,51个数据都是11,故中位数为:11;(3)样本中不超过12吨的有20+40+10=70(户),∴黄冈市直机关500户家庭中月平均用水量不超过12吨的约有:500×70100=350(户).18.(1)500;14;21.6°.(2)图略;估计我市2013年城镇民营企业20万员工中,每月的收入在“2 000元~4000元”的约:20×60%=12(万人).(3)用平均数反映月收入情况不合理.理由如下:从统计的数据来看,月收入在2000元~4 000元的员工,占60%,而在4 000元~6 000元的员工仅占20%,6 000元以上的员工占14%,因此,少数员工的月收入将平均数抬高到了4872元.因此,用平均数反映月收入情况不太合理.19.(1)∵x甲=93+86+733=84(分),x乙=95+81+793=85(分),∴x甲<x乙.∴乙将被录用.(2)∵x甲′=93×3+86×5+73×23+5+2=85.5(分),x乙′=95×3+81×5+79×23+5+2=84.8(分),∴x乙′<x甲′.∴甲将被录用.(3)甲一定被录用,而乙不一定能被录用.理由如下:由直方图可知成绩最高一组分数段85≤x<90中有7人,公司招聘8人,又x甲′=85.5分,显然甲在该组,所以甲一定能被录用;在80≤x<85这一组内有10人,仅有1人能被录用, 而x乙=84.8分在这一组内不一定是最高分,所以乙不一定能被录用.由直方图知,应聘人数共有50人,录用人数为8人,所以本次招聘人才的录用率为:850=16%.20.(1)125;75;75;72.5;70.(2)①从平均数和方差相结合看:甲乙两名同学的平均数相同,但甲成绩的方差为125,乙同学成绩的方差为33.3,因此乙同学的成绩更为稳定;②从折线图中甲、乙两名同学的走势上看,乙同学的6次成绩有时进步,有时退步,而甲的成绩一直是进步的. 21.(1)平均数相同(都是1.7).方差不同,甲的方差是0.04,乙的方差是0.054;中位数也不同,甲的中位数是1.7,乙的中位数是1.75.(2)裁判最后评判说甲获胜,其理由是因为甲的方差较乙的方差小,表明甲的成绩较乙的成绩稳定,所以甲获胜.(3)教练最后选择乙去参加比赛,是因为乙的最后两次成绩较甲的最后两次成绩好,表明乙潜力大,所以教练最后选择乙去参加比赛.。

python数据分析期末考试题及答案

python数据分析期末考试题及答案

python数据分析期末考试题及答案一、单项选择题(每题2分,共20分)1. 在Python中,用于数据科学计算的库是:A. NumPyB. MatplotlibC. PandasD. SciPy答案:A2. 下列哪个函数用于计算数组的均值?A. mean()B. median()C. sum()D. count()答案:A3. Pandas中,哪个函数用于读取CSV文件?A. read_csv()B. read_excel()C. read_sql()D. read_html()答案:A4. 在Pandas中,DataFrame的列可以被重新命名,使用的方法是什么?A. rename()B. rename_axis()C. set_axis()D. set_index()答案:A5. 如果要将一个Pandas DataFrame的列转换为行,应该使用哪个方法?A. transpose()B. pivot()C. melt()D. reshape()答案:A二、多项选择题(每题3分,共15分)1. 下列哪些函数可以用来创建NumPy数组?A. array()B. zeros()C. ones()D. linspace()答案:ABCD2. Pandas中,哪些方法可以用来删除DataFrame中的行?A. drop()B. remove()C. delete()D. pop()答案:AD3. 在Python数据分析中,哪些库常用于数据可视化?A. MatplotlibB. SeabornC. PlotlyD. Bokeh答案:ABCD三、简答题(每题5分,共30分)1. 请解释Python中列表推导式的作用。

答案:列表推导式是一种简洁的构建列表的方法,它允许开发者通过一个表达式来创建列表,这个表达式可以包含条件语句和循环语句。

2. 描述Pandas中DataFrame和Series的主要区别。

答案:DataFrame是一个二维标签化数据结构,可以看作是由多个Series组成的,每个Series可以看作是DataFrame的一列。

数据分析与可视化技术期末考试试卷及答案

数据分析与可视化技术期末考试试卷及答案

数据分析与可视化技术期末考试试卷及答案一、单项选择题(以下各题只有一项为正确答案,每小题2分,共40分)(1)使用python3命令在当前路径创建虚环境“prjVenv”,正确的命令是()。

A.python3 prjVenvB.python3 -m theVenvC.python3 -m venvprjVenvD.python3 -m venv@prjVenv(2)以下哪一项不是现代主流的云服务计算模型。

()A.基础设施即服务(IaaS,Infrastructure as a Service)B. 硬件即服务(HaaS,Hardware as a Service)C.平台即服务(PaaS,Platform as a Service)D.软件即服务(SaaS,Software as a Service)(3)运行如下flask代码后,使用浏览器访问“localhost:5000/index”页面输出结果是()。

from flask import Flaskapp = Flask(__name__)@app.route('/index')def index():return 'Hello World!'A.app.routeC.Hello World!D.'Hello World!'(4)需要在代码中引入pyecharts包的options成员,应该使用()命令实现。

A.import pyecharts and optionsB.frompyechartsimport optionsC.import pyecharts’ optionsD.import options from pyecharts(5)开发人员可以远程访问运行在aws平台linux2虚机上的jupyter-notebook服务。

访问jupyter-notebook服务默认的网络端口是()。

国开期末考试《大数据分析》机考满分试题(第6套)

国开期末考试《大数据分析》机考满分试题(第6套)

国开期末考试《大数据分析》机考满分试题(第6套)一、选择题(每题5分,共计25分)1. 以下哪个工具不属于大数据分析工具?A. HadoopB. RC. MongoDBD. Microsoft Excel2. 以下哪个技术主要用于数据清洗?A. 机器B. 自然语言处理C. 数据挖掘D. 数据可视化3. 在大数据分析中,以下哪个指标用于评估模型的好坏?A. AUCB. ROCC. F1 ScoreD. All of the above4. 以下哪个算法属于无监督?A. 决策树B. 支持向量机C. K-均值聚类D. 逻辑回归5. 以下哪个技术主要用于大数据的存储?A. HDFSB. HBaseC. MongoDBD. All of the above二、填空题(每题5分,共计25分)1. 在大数据分析中,常用的数据处理框架是________。

2. ________是一种常用的数据预处理技术,用于处理缺失值、异常值等问题。

3. ________算法是一种无监督算法,用于将数据分为若干个类别。

4. ________是一种常用的评估分类模型好坏的指标,其值越接近1表示模型效果越好。

5. ________是一种常用的数据挖掘技术,用于从大量数据中发现规律和趋势。

三、简答题(每题10分,共计30分)1. 请简要介绍大数据分析的主要任务和应用场景。

2. ce编程模型的工作原理。

3. 请简要介绍K-均值聚类算法的原理和步骤。

4. 请简要介绍如何评估分类模型的好坏,并列举常用的评估指标。

5. 请简要介绍大数据可视化的作用和常用工具。

四、案例分析题(35分)假设你是一家电商公司的数据分析师,公司希望了解用户在网站上的行为,以便优化用户体验和提高销售额。

你获得了以下数据集:- 用户行为数据:包含用户ID、访问时间、页面浏览量、购买行为等信息。

- 商品信息数据:包含商品ID、商品名称、商品类别、商品价格等信息。

请根据以上数据集,完成以下任务:1. 描述用户在网站上的行为特点,包括访问时间、页面浏览量、购买行为等。

期末复习(六) 数据的分析

期末复习(六) 数据的分析

是(A )
A.10
B.9
C.8
D.7
MING XIAO KE TANG
4.(铁岭中考)在某市举办的垂钓比赛上,5 名垂钓爱好者参加了比
赛,比赛结束后,统计了他们各自的钓鱼条数,成绩如下:4,5,10,
6,10.则这组数据的中位数是( B )
A.5
B.6
C.7
D.10
MING XIAO KE TANG
的两班女生的身高如下(单位:厘米):
九(一)班:168 167 170 165 168 166 171 168 167 170
九(二)班:165 167 169 170 165 168 170 171 168 167
(1)补充完成下面的统计分析表;
班级 平均数 方差 中位数
(一)班 168 3.2
168
方差是刻画数据离散程度的统计量.方差越小,说明这组数据越 稳定,反之越不稳定.但并不是方差越小越好,要具体问题具体分析.
MING XIAO KE TANG
4.(梧州中考)某校九年级模拟考试中,1 班的六名学生的数学成绩
如下:96,108,102,110,108,82.下列关于这组数据的描述不正确
5.某住宅小区六月份 1 日至 5 日每天用水量变化情况如图所示.那 么这 5 天平均每天的用水量是( C )
A.30 吨 B.31 吨 C.32 吨 D.33 吨
MING XIAO KE TANG
6.某校在一次学生演讲比赛中共有 11 个评委,统计每位选手得分
时,采用了去掉一个最高分和一个最低分,然后再计算其余给分的平
得分的平均数如下(单位:分).
三项得分 服装统一 队形整齐 动作规范
平均分

数据分析期末考试试卷(附带答案)

数据分析期末考试试卷(附带答案)

数据分析期末考试试卷(附带答案)请注意以下说明:- 本试卷共分为两部分:选择题和解答题。

- 所有答案均应在答题纸上写出,并标明题号。

- 每道选择题只有一个正确答案,请选出最恰当的答案。

- 解答题应尽量简洁明了,如有计算过程,请写清楚。

- 考试时间为120分钟,试卷满分为100分。

- 祝你好运!选择题1. 数据分析的目的是:A. 收集数据B. 组织数据C. 提取信息D. 分享结果2. 下面哪个不是数据分析常用的可视化工具:A. 折线图B. 饼图C. 柱状图D. 线性回归模型3. 数据清洗是指:A. 删除不需要的数据B. 处理数据中的缺失值和异常值C. 将数据转换为可视化形式D. 对数据进行统计分析4. 数据挖掘是从大量的数据中发现:A. 数据的类型B. 数据的来源C. 数据的模式和关联性D. 数据的质量5. 在回归分析中,用于预测的变量称为:A. 因变量B. 自变量C. 联合变量D. 相关变量解答题1. 简述数据分析的步骤。

2. 举例说明数据清洗的过程。

3. 什么是数据可视化?简要介绍一种常用的数据可视化工具。

4. 解释线性回归模型的概念和作用。

5. 什么是关联分析?举例说明如何进行关联分析。

答案选择题:1. C2. D3. B4. C5. B解答题:1. 数据分析的步骤包括:收集数据、清洗数据、探索数据、分析数据、可视化数据和得出结论。

2. 数据清洗的过程可以举例为以下步骤:- 删除含有缺失值的观测数据- 填充缺失值- 删除异常值- 校验数据是否符合预设规则3. 数据可视化是通过图表、图形等方式将数据转化为可视形式以便更好地理解和分析数据的过程。

一种常用的数据可视化工具是柱状图,它可以直观地展示不同类别或变量之间的比较情况。

4. 线性回归模型是一种用于建立因变量与一个或多个自变量之间关系的统计模型。

它的作用是通过对自变量与因变量的关系进行建模和分析,来预测因变量的数值。

5. 关联分析是对数据集中项之间的关联性进行探索和分析的过程。

期末复习之七(数据的分析)

期末复习之七(数据的分析)
若 s 0 , 则 x1 , x 2 , x n 应 满 足 的 条 件
2

x1 x 2 x n
13、现有A、B两个班级,每个班级各有45个学生 参加一次测验,每名参加者可获得 0,1,2, …,9分这几种不同分值中的一种,A班的成 绩如下表所示,B班的成绩如图所示。
分数 0 人数 1
2
x只 能 是 0或 7
当 x=0时 :s 4 s 当 x=7时 :s 10 s
2 2
s
2
2
2
s

10
16、八年级三班分甲、乙两组各10名学生参加答题比赛,共10道 选择题,答对8题(含8题)以上为优秀,各选手答对题数如下:
答对题数 5 6 7 8 9 10 平均数 中位数 众数 方差 优秀率
石油特别收益金征收比率 石油特别收益金计算举例
解 :x 18 15 20 16 7 14 18 20 7 15(个 )
15、一组数据,-3,-2,-1,1,2,3, x, 其中x是小于10的整数,且数据的方差 是整数,求该组数据的方差和标准差。 2 x 6x 2 解: x ,s 4 7 49
又 s 是 整 数 ,x是 小 于 是 10的 整 数
一、知识要点
平均数 中位数 众 数 极 差 方 差
数据的代表
数据的波动
用 样 本 估 计 总 体
用样本平均数 估计总体平均数
用样本方差 估计总体方差
请写出相关公式
二、例题
例1、某工厂对一个生产小组的零件进行抽样 检查,在10天中,这个生产小组每天的 次品数如下:(单位:个)0,2,0,2, 3,0,2,3,1,2在这10天中,该生产 小组生产的零件的次品数的( D ) A、平均数是2 C、中位数是1.5 B、众数是3 D、方差是1.25

《数据分析》期末复习题

《数据分析》期末复习题

《数据分析》期末复习题1. 在电子商务领域,商务数据可以分为两大类:_______和_____。

[填空题] *空1答案:前端行为数据空2答案:后端商业数据2. 场景营销是基于___、_____、_____等三大场景之一的一种新营销理念。

[填空题] *空1答案:输入场景空2答案:搜索场景空3答案:浏览场景3. 电商的基础数据主要有_____、____、会员数据、___和_____。

[填空题] *空1答案:营销数据空2答案:流量数据空3答案:交易及服务数据空4答案:行业数据4. 一般平台商都不支持____个月以上的交易数据下载。

[填空题] *_________________________________(答案:3)5. ____是电商运营的核心指标。

[填空题] *_________________________________(答案:转化率)6. 通常我们提到的转化率是____。

[填空题] *_________________________________(答案:成交转化率)7. ____是指为了达到某个目标进行多个方案并行测试,每个方案仅有一个变量不同,最后以某种规则选择最优的方案。

[填空题] *_________________________________(答案:A/B测试)8. ____用高亮颜色展示用户的访问偏好,对用户的体验数据进行可视化展示。

[填空题] *_________________________________(答案:热图|热力图)9. 下列不属于流量数据的是()。

[单选题] *A.人均费用(正确答案)B.浏览量C.访客数D.在线时长10. 下列属于第三方数据网站的是()。

[单选题] *A.百度统计B.数据魔方C.量子恒道(正确答案)D.谷歌分析11. 下列属于数据收集内部渠道的是()。

①客户调查②专家与客户访谈③专业调研机构④内部数据库 [单选题] *A.①、②、④(正确答案)B.①、③、④C.①、②、③D.全部12. 下列不属于数据分析工具的是() [单选题] *A.SPSSB.RC.PowerPoint(正确答案)D.Python13. ()是电商运营中采购与销售的中转站。

八年级数学下期期末复习专题5(数据的分析 1)

八年级数学下期期末复习专题5(数据的分析 1)

教师姓名学生姓名填写时间学科数学年级八年级教材版本人教版课题名称期末复习专题五(数据的分析1)本人课时统计共()课时上课时间一、选择题(每题3分,共30分)1、已知数据2,3,2,3,5,x的众数是2,则x的值是()A.3 B.2C.2.5D.32、小明五次跳远的成绩(单位:米)是:3.6,3.8,4.2,4.0,3.9,这组数据的中位数是()A.3.9米 B.3.8米 C.4.2米 D.4.0米3、2007年5月份,某市市区一周空气质量报告中某项污染指数的数据是:31 35 31 34 30 32 31,这组数据的中位数、众数分别是()A.32,31 B.31,32 C.31,31 D.32,354、要比较两位同学在五次数学测验中谁的成绩比较稳定,应选用的统计量是()A.平均数B.中位数C.众数D.方差5、筹建中的安徽芜湖核电站芭茅山厂址位于长江南岸繁昌县狄港镇,距离繁昌县县城约17km,距离芜湖市区约35km,距离无为县城约18km,距离巢湖市区约50km,距离铜陵市区约36km,距离合肥市区约99km.以上这组数据17、35、18、50、36、99的中位数为().A.18 B.50 C.35 D.35.56、我市某一周的最高气温统计如下表:最高气温(℃)25 26 27 28天数 1 1 2 3则这组数据的中位数与众数分别是()A.27,28 B.27.5,28 C.28,27 D.26.5,277、某学习小组5位同学参加初中毕业生实验操作考试(满分20分)的平均成绩是16分.其中三位男生的方差为6(分2),两位女生的成绩分别为17分,15分.则这个学习小组5位同学考试分数的标准差为()A.3B.2C.6D.68、某地统计部门公布最近5年国民消费指数增长率分别为8.5%、9.2%、9.9%、10.2%、9.8%,业内人士评论说:“这五年消费指数增长率之间相当平稳”,从统计角度看,“增长率之间相当平稳”说明这组数据( A )比较小A、方差B、平均数C、众数D、中位数9、一家鞋店在一段时间内销售了某种女鞋30双,各种尺码的销售量如下表:尺码/厘米22 22.5 23 23.5 24 24.5 25销售量/双 1 2 5 12 6 3 1如果鞋店要购进100双这种女鞋,那么购进24厘米、24.5厘米和25厘米三种女鞋数量之和最.合适..的是( B ).(A)20双(B)30双(C)50双(D)80双10、甲、乙、丙、丁四位选手各10次射击成绩的平均数都是8环,众数和方差如表,则这四人中水平发挥最稳定的是( B )选手甲I 乙丙丁众数(环) 9 8 8 10方差(环2) 0.035 0.O15 0.025 0.27(A)甲 (B)乙 (C)丙 (D)丁二、填空题:(每小题3分,共30分)11、一组数据35,35,36,36,37,38,38,38,39,40的极差是________。

电子商务数据分析 期末试题(一)含答案

电子商务数据分析 期末试题(一)含答案

电子商务数据分析期末试题(一)含答案1.数据分析是数据分析报告写作的前提和基础。

2.订单满足率的计算公式为(单位时间内已完成订单数量/单位时间内已经接收的订单总数量)*100%。

3.点击率的计算公式为点击量/展现量×100%。

4.图表在数据分析报告中的目的是通过直观的表现形式,更有利于人们对数据的洞察。

5.数据分析报告常见的标题不包括排比型标题。

6.根据统计数据,11月份该女装网店的复购率为0.2.7.下单转化率是指确认订单客户数/该商品的总访问数×100%。

8.产品交易指数是产品在平台交易热度的体现,是衡量店铺、产品受欢迎程度的一个重要指标,它越高该产品越受消费者欢迎。

9.删除明显有问题的段落。

17.关于数据清洗,正确的说法是去重、补漏、纠错。

18.函数COUNTIF(range,criteria)的功能是计算某个区域中满足给定条件的单元格个数。

19.漏斗图分析数据分析方法适合分析业务周期长、流程规范且环节多的指标,比如网站转化率、销售转化率等。

20.这组价格中的众数和中位数分别是70、70元。

21.EXCEL描述统计结果中不包括加权算术平均数指标。

22.线性趋势线适用于增长或降低的速度比较平稳、关系稳定的数据集合。

23.2020年的预测销售量为57万件。

24.不考虑数据和时间之间的关系不属于时间序列预测法基本特点。

A、可以发现潜在的商机和市场需求B、可以优化产品和服务的设计和推广C、可以提高客户满意度和忠诚度D、可以帮助企业降低风险和避免经营错误25.在用来衡量离散程度的指标中,正确的说法是方差是标准差的平方。

26.图表的数据墨水比并不需要严格的搭配比例,只是一个观念,要求我们尽可能将墨水用在数据元素上,而不是非数据元素上。

因此选项C是错误的。

27.对于某销售水果的网店计划对其店中5个品种的橙子从甜度、个头、色泽、气味这4个维度进行综合分析,选用雷达图较为合适。

28.在电商企业日常运营报表中,无需体现行业发展数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析方法课程设计
题目概述:
3、调查美国50个州7种犯罪率,得结果列于表1,其中给出的是美国50个州每100 000
个人中七种犯罪的比率数据。

这七种犯罪是:murder(杀人罪),rape(强奸罪),robbery(抢劫罪),assault(斗殴罪),burglary(夜盗罪),larceny(偷盗罪),auto(汽车犯罪)。

1)基于变量()的观测值,求样本协
方差矩阵S和样本相关系数矩阵R;
2)分别从S和R。

出发做主成分分析:
(1)求样本主成分的贡献率、累计贡献率和各个样本主成分;
(2)在两种情况下,你认为应该保留几个主成分,其意义如何解释?(提示:要求累计贡献率达到80%以上)就此题而言,你认为基于S和R的分析结果哪个更
合理?
(3)按第一主成分得分将美国50个州排序,结果如何?
(4)作以第一主成分得分为横坐标,第二主成分得分为纵坐标的散点图。

L快速聚类和类平均距离谱系聚3)对表1的美国50个州七种犯罪的比率数据,分别试用
2.5
类法将美国50个州分4类,并对聚类结果进行分析和比较。

从聚类结果看,你认为哪种分类方法好?
问题一
采用sas得到样本协方差矩阵S:
样本相关系数矩阵R:
问题二
1、从R进行主成分分析:
(1)、求样本主成分的贡献率、累计贡献率和各个样本主成分。

贡献率:
(2)累计贡献率到达80%以上,需保留三个主成分,前三个成分的累计贡献率已达到86.9%。

由此三个主成分:
PRIN1=0.300279murder+ 0.431759 rape+0.396875 robbery+0.396652assault+
0.440157 burglary +0.357360arceny +0.295177auto
PRIN2=-0.629174muder-0.169435rape+0.042247robbery-0.343528asault+0.203341bur glary+ 0.402319larceny+0.502421auto
PRIN3=0.178245muder-0.2442rape+0.495861robbery-0.06951asault- 0.2099burglary-
0.5392larceny+0.568auto
从S进行主成分分析:
贡献率:
特征向量:
累计贡献率:第一个成分贡献率已达到87.36%。

主成分表达式:
PRIN1=0.000864muder+0.008773rape+0.056993robbery+0.059196asault+
0.465346burglary+0.872863larceny+0.121384auto
分析:
由于第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。

第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。

可以认为,这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。

第三主成分很难给出明显的解释。

在依PRIN1排序的结果表中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTH DAKOTA(PRIN1= -3.96408)州犯罪率最低,PRIN1值较大的州,犯罪率较高,即内华达NEV ADA(PRIN1= 5.26699)州犯罪率最高。

在依PRIN2排序的结果表35.4中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大。

由此得出采用基于R的主成分分析更合理,不仅能从总体度量犯罪率还能得到不同犯罪率组合的比重,更能突显地区不同犯罪率的高低。

(3)按第一主成分将50个州排序:
(4)作图
问题三
1、快速聚类
由SAS处理得到:
(1)、初始聚点
(2)、分类结果:
4个类的距离矩阵如下:
从聚类结果看出第一类是以盗窃罪为主;第二类是以强奸、抢劫、斗殴罪为主,且所属城市较多,说明该类犯罪是较普片的;第三类是以汽车犯罪为主;第四类是以杀人、斗殴罪为主。

由距离矩阵可以看出各类之间的差异较小,说明分类比较合理。

2、类平均谱系聚类法
聚类结果:
谱系图:
首先第一层在最短水平为0.0268时,将MONTANA和WYOMING聚为一类,得到CL49,其它同理;第二层在最短水平为0.139时,将CL42和MAINE聚为一类,得到CL35,此时分为35个类别。

以此类推,最后将CL2和CL4聚为一类,得到整体分类。

由上面两种方法可以看出,快速聚类根据最短距离将样本划分为明确的类别,谱系聚类能细致地看出由小类聚到大类的过程,由合并时的距离水平可以看出样品之间的亲疏程度。

所以如果只是想得到明确的分类,快速聚类具有优越性,如果想观察由局部到整体的状况,谱系聚类更好。

相关文档
最新文档