数据分析试题
数学《数据分析》测试题
![数学《数据分析》测试题](https://img.taocdn.com/s3/m/cdaf7e1f7cd184254b3535cc.png)
第四章数据的分析练习题一、选择题:1、将一组数据中的每一个数减去40后,所得新的一组数据的平均数是2,•则原来那组数据的平均数是()A.40 B.42 C.38 D.22.一城市准备选购一千株高度大约为2m的某种风景树来进行街道绿化,•有四个苗圃生产基地投标(单株树的价格都一样).•采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下:树苗平均高度(单位:m)标准差甲苗圃 1.8 0.2乙苗圃 1.8 0.6丙苗圃 2.0 0.6丁苗圃 2.0 0.2请你帮采购小组出谋划策,应选购()A.甲苗圃的树苗 B.乙苗圃的树苗; C.丙苗圃的树苗 D.丁苗圃的树苗3.衡量样本和总体的波动大小的特征数是()A.平均数 B.方差 C.众数 D.中位数4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为()A.8,9 B.8,8 C.8.5,8 D.8.5,95.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等,其中正确的结论有()A.1个 B.2个 C.3个 D.4个6.甲、乙两班举行电脑汉字输入速度比赛,•参赛学生每分钟输入汉字的个数经统计计算后结果如下表:班级参加人数中位数方差平均数甲 55 149 191 135乙 55 151 110 135某同学根据上表分析得出如下结论:(1)甲、乙两班学生成绩的平均水平相同;(2)甲班成绩的波动情况比乙班成绩的波动小(3)乙班优秀的人数多于甲班优秀的人数;(每分钟输入汉字≥150个为优秀)上述结论中正确的是()A.(1)(2)(3) B.(1)(2) C.(1)(3) D.(2)(3)7.某校把学生的纸笔测试、实践能力、成长纪录三项成绩分别按50%、20%•、•30%的比例计入学期总评成绩,90分以上为优秀.甲、乙、•丙三人的各项成绩如下表(单位:分),学期总评成绩优秀的是( )纸笔测试 实践能力 成长记录甲 90 83 95 乙 98 90 95 丙 808890A .甲B .乙丙C .甲乙D .甲丙8.人数相同的八年级甲、乙两班学生在同一次数学单元测试中,班级平均分和方差如下:80==乙甲x x ,2402=甲s ,1802=乙s ,则成绩较为稳定的班级是( ) A.甲班 B.乙班 C.两班成绩一样稳定 D.无法确定9.期中考试后,学习小组长算出全组5位同学数学成绩的平均分为M ,如果把M•当成另一个同学的分数,与原来的5个分数一起,算出这6个分数的平均值为N ,那么M :•N 为( ) A .56 B .1 C .65D .2 10、下列说法错误的是( )A .一组数据的平均数、众数、中位数可能是同一个数;B .一组数据中中位数可能不唯一确定C .一组数据中平均数、众数、中位数是从不同角度描述了一组数据的集中趋势D .一组数据中众数可能有多个11、数据5、3、2、1、4的平均数是( )A : 2B : 5C : 4D : 312、中学人数相等的甲、乙两班学生参加了同一次数学测验,班平均分和方差分别为=甲x 82分,=乙x 82分,=2甲s 245分2,=2乙s 190分2。
业务数据分析试题
![业务数据分析试题](https://img.taocdn.com/s3/m/ea50496f86c24028915f804d2b160b4e777f817a.png)
业务数据分析试题
1.数据分析的要求是? *
A理解数据指标分类及含义(正确答案)
B优化指标更健康
C掌握数据指标间的业务逻辑(正确答案)
D掌握工具的使用(正确答案)
2.对比法可以划分为? *
A横向对比(正确答案)
B纵向对比(正确答案)
C月度对比
D商家对比
3.下列哪些属于横向对比? *
A 目标对比(正确答案)
B 时间对比
C 同级对比(正确答案)
D 同行对比(正确答案)
4.用于查找首列满足条件的元素的公式是? [单选题] *
A IF
B VLOOKUP(正确答案)
C COUNTIFS
D SUMIFS
5.数据分析的思路是 [单选题] *
A背景了解→思路分析→数据确认→策略制定→结论提炼
B背景了解→数据确认→思路分析→策略制定→结论提炼
C背景了解→思路分析→数据确认→结论提炼→策略制定(正确答案)
D思路分析→策略制定→数据确认→背景了解→结论提炼
6.对比法的提点是将两个数据进行比较,分析其中的差异,从而揭示这些事物所代表的发展变化情况和规律性。
[单选题] *
A正确
B错误(正确答案)
7.全量代补率就是用所以商家的求平均值 [单选题] *
A正确
B错误(正确答案)
8.如果要分析否个商家在不同季度的数据变化,应该使用纵向对比 [单选题] *
A正确(正确答案)
B错误
9.效果对比属于横向对比 [单选题] *
A正确
B错误(正确答案)
10.漏斗分析法的目的是关注某事件在重要环节上的环比 [单选题] *
A正确
B错误(正确答案)。
智能数据分析考试试题
![智能数据分析考试试题](https://img.taocdn.com/s3/m/e84c9888162ded630b1c59eef8c75fbfc77d94bf.png)
智能数据分析考试试题一、单选题(每题 5 分,共 25 分)1、以下哪种数据类型在智能数据分析中最常见?()A 结构化数据B 半结构化数据C 非结构化数据D 以上都是2、数据清洗的主要目的是()A 去除重复数据B 纠正错误数据C 使数据格式标准化D 以上都是3、在进行数据分析时,发现数据存在异常值,应该首先()A 直接删除异常值B 分析异常值产生的原因C 用平均值替代异常值D 忽略异常值4、以下哪个指标不属于描述数据集中趋势的指标?()A 均值B 中位数C 众数D 方差5、聚类分析属于哪种数据分析方法?()A 描述性分析B 预测性分析C 诊断性分析D 规范性分析二、多选题(每题 8 分,共 40 分)1、智能数据分析的流程包括()A 数据收集B 数据预处理C 数据分析D 结果可视化E 报告撰写2、数据预处理的方法有()A 数据清洗B 数据集成C 数据变换D 数据归约3、以下哪些是常见的数据分析工具?()A ExcelB SPSSC PythonD R4、回归分析可以用于()A 预测未来值B 分析变量之间的关系C 评估模型的准确性D 进行分类任务5、决策树算法的优点包括()A 易于理解和解释B 能够处理数值型和类别型数据C 对缺失值不敏感D 可以进行特征选择三、简答题(每题 15 分,共 30 分)1、请简要说明数据挖掘与智能数据分析的关系。
答:数据挖掘是智能数据分析的一个重要组成部分。
智能数据分析是一个更广泛的概念,它涵盖了从数据收集、预处理、分析到结果解释和应用的整个过程。
数据挖掘侧重于从大量数据中发现潜在的模式、关系和知识,通常使用机器学习、统计分析等技术。
而智能数据分析不仅包括数据挖掘的这些活动,还注重对数据的深入理解、问题的定义、合适分析方法的选择以及结果的有效应用,以支持决策制定和业务优化。
2、描述一下在智能数据分析中如何进行数据可视化,以及数据可视化的重要性。
答:在智能数据分析中,数据可视化是通过图表、图形、地图等直观的形式来展示数据。
数据分析测试题完整版
![数据分析测试题完整版](https://img.taocdn.com/s3/m/55915237a98271fe910ef9fe.png)
数据分析测试题HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】数据分析测试题一、选择题(每小题3分,共30分)1.有19位同学参加歌咏比赛,所得的分数互不相同,取前10位同学进入决赛.某同学知道自己的分数后,要判断自己能否进入决赛,他只需知道这19位同学成绩的()A.平均数B.中位数C.众数D.方差2.某特警部队为了选拔“神枪手”,举行了1 000米射击比赛,最后由甲、乙两名战士进入决赛,在相同条件下,两人各射靶10次,经过统计计算,甲、乙两名战士的总成绩都是环,甲的方差是,乙的方差是,则下列说法中,正确的是()A.甲的成绩比乙的成绩稳定B.乙的成绩比甲的成绩稳定C.甲、乙两人成绩的稳定性相同D.无法确定谁的成绩更稳定3.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()4.综合实践活动中,同学们做泥塑工艺制作.小明将活动组各同学的作品完成情况绘成了下面的条形统计图.根据图表,我们可以知道平均每个学生完成作品()件.5.某公司员工的月工资如下表:A. B.C. D.6.下列说法中正确的有()①描述一组数据的平均数只有一个;②描述一组数据的中位数只有一个;③描述一组数据的众数只有一个;④描述一组数据的平均数、中位数和众数都一定是这组数据里的数;⑤一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数、众数和中位数.个个个个7.某同学在本学期的前四次数学测验中得分依次是95,82,76,88,马上要进行第五次测验了,他希望五次成绩的平均分能达到85分,那么这次测验他应得()分.8.样本方差的计算公式中,数字20和30分别表示样本的()A.众数、中位数B.方差、偏差C.数据个数、平均数D.数据个数、中位数9.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么所求出的平均数与实际平均数的差是()10.某赛季甲、乙两名篮球运动员12场比赛得分情况用图表示如下:对这两名运动员的成绩进行比较,下列四个结论中,不正确...的是()A.甲运动员得分的方差大于乙运动员得分的方差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员得分的平均数大于乙运动员得分的平均数D.甲运动员的成绩比乙运动员的成绩稳定二、填空题(每小题3分,共24分)11.某果园有果树200棵,从中随机抽取5棵,每棵果树的产量如下:(单位:kg)98 102 97 103 105这棵果树的平均产量为 kg,估计这棵果树的总产量为 kg. 12.在航天知识竞赛中,包括甲同学在内的6•名同学的平均分为74分,其中甲同学考了89分,则除甲以外的5名同学的平均分为_______分.13.已知一组数据它们的中位数是,则______.14.有个数由小到大依次排列,其平均数是,如果这组数的前个数的平均数是,后个数的平均数是,则这个数的中位数是_______.15.若已知数据的平均数为,则数据的平均数(用含的表达式表示)为_______.16.某超市招聘收银员一名,对三名应聘者进行了三项素质测试.下面是三名应聘者的素质测试成绩:测试成绩素质测试小李小张小赵计算机70 90 65商品知识50 75 55语言80 35 804,3,2,则这三人中将被录用.年南京青奥会某项目6名礼仪小姐的身高如下(单位:cm):168,166,168,167,169,168,则她们身高的众数是_____cm.18.某校八年级甲、乙两班举行电脑汉字输入比赛,两个班参加比赛的学生每分钟输入汉字的个数经统计和计算后结果如下表:班级参加人数平均字数中位数方差甲55 135 149 191乙55 135 151 110①甲、乙两班学生的平均水平相同;②乙班优秀人数比甲班优秀人数多(每分钟输入汉字达150个以上为优秀);③甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大.上述结论正确的是___________(填序号).三、解答题(共46分)19.(6分)某乡镇企业生产部有技术工人15人,生产部为了合理制定产品的每月生产定额,统计了15人某月的加工零件数如下:加工零件数/件540 450 300 240 210 120人数 1 1 2 6 3 2(1(2)假如生产部负责人把每位工人的月加工零件数定为260件,你认为这个定额是否合理?为什么?20.(6分)为调查八年级某班学生每天完成家庭作业所需时间,在该班随机抽查了8名学生,他们每天完成作业所需时间(单位:)分别为60,55,75,55,55,43,65,40.(1)求这组数据的众数、中位数.(2)求这8名学生每天完成家庭作业的平均时间;如果按照学校要求,学生每天完成家庭作业时间不能超过,问该班学生每天完成家庭作业的平均时间是否符合学校的要求?21.(6分)某校260名学生参加植树活动,要求每人植4~7棵,活动结束后随机抽查了20名学生每人的植树量,并分为四种类型,A :4棵;B :5棵;C :6棵;D :7棵.将各类型的人数绘制成扇形统计图(如图①)和条形统计图(如图②),经确认扇形统计图是正确的,而条形统计图尚有一处错误. 回答下列问题:(1)写出条形统计图中存在的错误,并说明理由. (2)写出这20名学生每人植树量的众数、中位数.(3)在求这20名学生每人植树量的平均数时,小宇是这样分析的:第一步:求平均数的公式是12nx x x x n+++=;第二步:在该问题中,n =4,x 1=4,x 2=5,x 3=6,x 4=7; 第三步:4567554x .+++==(棵). ②请你帮他计算出正确的平均数,并估计这260名学生共植树多少棵? 22.(7分)某校在一次数学检测中,八年级甲、乙两班学生的数学成绩统计如下表:分数 50 60 70 80 90 100 人数 甲班1 6 12 11 15 5 乙班351531311(1)甲班的众数是多少分,乙班的众数是多少分,从众数看成绩较好的是哪个班?(2)甲班的中位数是多少分,乙班的中位数是多少分,甲班成绩在中位数以上(包括中位数)的学生所占的百分比是多少,乙班成绩在中位数以上(包括中位数)的学生所占的百分比是多少,从中位数看成绩较好的是哪个班?(3)甲班的平均成绩是多少分,乙班的平均成绩是多少分,从平均成绩看成绩较好的是哪个班?23.(7分)某单位欲从内部招聘管理人员一名,对甲、乙、丙三名候选人进行了笔试和面试两项测试,三人的测试成绩如下表所示:测试成绩(分)测试项目甲乙丙笔试75 80 90面试93 70 68进行民主评议,三人得票率(没有弃权票,每位职工只能推荐1人)如图所示,每得一票记作1分.(1)请算出三人的民主评议得分.(2)如果根据三项测试的平均成绩确定录用人选,那么谁将被录用(精确到)?(3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的比例确定个人成绩,那么谁将被录用?24.(7分)我们约定:如果身高在选定标准的±2%范围之内都称为“普通身高”.为了解某校九年级男生中具有“普通身高”的人数,我们从该校九年级男生中随机选出10名男生,分别测量出他们的身高(单位:cm)收集并整理男生序号①②③④⑤⑥⑦⑧⑨⑩身高163 171 173 159 161 174 164 166 169 164(1)计算这组数据的三个统计量:平均数、中位数和众数;(2)请你选择一个统计量作为选定标准,找出这10名具有“普通身高”的是哪几位男生?并说明理由;(3)若该年级共有280名男生,按(2)中选定标准,请你估算出该年级男生中“普通身高”的人数约有多少名?25.(7分)某校八年级学生开展踢毽子比赛活动,每班派5名学生参加,按团体总分多少排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是成绩最好的甲班和乙班5名学生的比赛数据(单位:个):为参考.请你回答下列问题:(1)计算两班的优秀率.(2)求两班比赛成绩的中位数.(3)估计两班比赛数据的方差哪一个小.(4)根据以上三条信息,你认为应该把冠军奖杯发给哪一个班级?简述你的理由.九年级数学数据分析专题检测试卷参考答案解析:19位同学参加歌咏比赛,所得的分数互不相同,取前10位同学进入决赛,中位数就是第10位同学的成绩,因而要判断自己能否进入决赛,他只需知道这19位同学成绩的中位数就可以.故选B .解析:本题考查了方差的意义,方差越小,数据越稳定.在甲、乙两名战士总成绩相同的条件下,∵ >,∴ 乙的成绩比甲的成绩稳定.解析:将这组数据从小到大排列为:2,2,3,3,3,3,3,3,6,6,10,共11个数,所以第6个数据是中位数,即中位数为3.因为数据3的个数为6,所以众数为3.平均数为,由此可知①正确,②③④均错误,故选A. 解析:625.862412610692481276=+++⨯+⨯+⨯+⨯.解析:元出现了次,出现的次数最多,所以这组数据的众数为元;将这 组数据按从大到小的顺序排列,中间的(第5个)数是元,即其中位数为元; ,即平均数为2 200元.解析:一组数据的中位数和平均数只有一个,但出现次数最多的数即众数,可以有多个,所以①②对,③错;由于一组数据的平均数是取各数的平均值,中位数是将原数据按由小到大顺序排列后,进行计算得来的,所以平均数与中位数不一定是原数据里的数,故④错; 一组数据中的一个数大小发生了变化,它的平均数一定发生变化,众数、中位数可能发生改变,也可能不发生改变,所以⑤错.解析:利用求平均数的公式解决.设第五次测验得分,则588768295x++++, 解得.解析:设其他29个数据的和为,则实际的平均数为,而所求出的平均数为,故.11. 解析:抽取的5棵果树的平均产量为; 估计这棵果树的总产量为. 解析:13. 解析:将除外的五个数从小到大重新排列后为中间的数是,由于中位数是,所以应在20和23中间,且21220=+x,解得. 14. 解析:设中间的一个数即中位数为,则,所以中位数为. 15. 解析:设的平均数为,则31)(21)(21)(2321+++++x x x 13233)2(321321+++⨯=+++=xx x x x x .又因为3321x x x ++=x ,于是y . 16.小张 解析:∵ 小李的成绩是:9565234280350470=++⨯+⨯+⨯,小张的成绩是:9772234235375490=++⨯+⨯+⨯,小赵的成绩是:65234280355465=++⨯+⨯+⨯,∴ 小张将被录用.解析:众数是在一组数据中,出现次数最多的数据,这组数据中168出现了3次,出现的次数最多,故这组数据的众数为168.18. ①②③ 解析:由于乙班学生每分钟输入汉字的中位数为151,说明有一半以上的学生都达到每分钟150个及以上,而甲班学生的中位数为149,说明不到一半的学生达到150个及以上,说明乙班优秀人数比甲班优秀人数多,故②正确;由平均数和方差的意义可知①③也正确. 19.解:(1)平均数:540450300224062103120226015++⨯+⨯+⨯+⨯=(件);中位数:240件,众数:240件.(2)不合理,因为表中数据显示,每月能完成件以上的一共是4人,还有11人不能达到此定额,尽管是平均数,但不利于调动多数员工的积极性.因为既是中位数,又是众数,是大多数人能达到的定额,故定额为件较为合理.20.解:(1)在这8个数据中,55出现了3次,出现的次数最多,即这组数据的众数是55;将这8个数据按从小到大的顺序排列为40,43,55,55,55,60,65,75,其中最中间的两个数据都是55,即这组数据的中位数是55. (2)这8个数据的平均数是,所以这8名学生完成家庭作业的平均时间为.因为,所以估计该班学生每天完成家庭作业的平均时间符合学校的要求.21.分析:(1)A 类型人数为20×20%=4,B 类型人数为20×40%=8,C 类型人数为20×30%=6,D 类型人数为20×10%=2,所以条形统计图中D 类型数据有错.(2)这20个数据中,有4个4,8个5,6个6,2个7,所以每人植树量的众数是5棵,中位数是5棵.(3)小宇的分析是从第一步出现错误的,公式不正确,应该使用4458667220x ⨯+⨯+⨯+⨯=计算出正确的平均数.把这个平均数乘260可以估计这260名学生共植树的棵数. 解:(1)D 有错. 理由:10%×20=2≠3. (2)众数为5棵. 中位数为5棵. (3)①第一步. ②4458667220x ⨯+⨯+⨯+⨯==(棵).估计这260名学生共植树:×260=1 378(棵).点拨:(1)众数是一组数据中出现次数最多的数据.(2)求一组数据的中位数时,一定要先把这组数据按照大小顺序排列.(3)在求一组数据的平均数时,如果各个数据都重复出现若干次,应选用加权平均数公式112212(=)k kk x w x w x w x n w w w n+++=+++求出平均数.22.解:(1)甲班中分出现的次数最多,故甲班的众数是分; 乙班中分出现的次数最多,故乙班的众数是分. 从众数看,甲班成绩好.(2)两个班都是人,甲班中的第名的分数都是分,故甲班的中位数是分; 乙班中的第名的分数都是分,故乙班的中位数是分.甲班成绩在中位数以上(包括中位数)的学生所占的百分比为 ;乙班成绩在中位数以上(包括中位数)的学生所占的百分比为 .从中位数看,成绩较好的是甲班. (3)甲班的平均成绩为 ;乙班的平均成绩为 . 从平均成绩看,成绩较好的是乙班. 23.分析:通过阅读表格获取信息,再根据题目要求进行平均数与加权平均数的计算.解:(1)甲、乙、丙的民主评议得分分别为:50分、80分、70分.(2)甲的平均成绩为:75935021872.6733++=≈(分), 乙的平均成绩为:80708023076.6733++=≈(分),丙的平均成绩为:90687022876.0033++==(分).由于76.677672.67>>,所以乙将被录用.(3)如果将笔试、面试、民主评议三项测试得分按的比例确定个人成绩,那么 甲的个人成绩为:472.9433⨯75+3⨯93+3⨯50=++(分), 乙的个人成绩为:477433⨯80+3⨯70+3⨯80=++(分), 丙的个人成绩为:477.4433⨯90+3⨯68+3⨯70=++(分), 由于丙的个人成绩最高,所以丙将被录用.24.解:(1)平均数为()163171173159161174164166169164166.4cm 10+++++++++=, 中位数为166164165cm 2+=(), 众数为164cm ().(2)选平均数作为标准:身高x 满足166.412%166.412%x ⨯-⨯+()≤≤(),即163.072169.728x ≤≤时为“普通身高”,此时⑦、⑧、⑨、⑩男生的身高为“普通身高”.(3)以平均数作为标准,估计全年级男生中“普通身高”的人数约为428011210⨯=.25.解:(1)甲班的优秀率:52, 乙班的优秀率:53. (2)甲班5名学生比赛成绩的中位数是97个;乙班5名学生比赛成绩的中位数是100个.(3)甲班的平均数=100597+118+96+100+89=(个), 甲班的方差;乙班的平均数=1005104+91+110+95+100 (个), 乙班的方差.∴ .即乙班比赛数据的方差小.(4)冠军奖杯应发给乙班.因为乙班5名学生的比赛成绩的优秀率比甲班高,中位数比甲班大,方差比甲班小,综合评定乙班踢毽子水平较好.。
数据分析试题及答案
![数据分析试题及答案](https://img.taocdn.com/s3/m/9dccb2e1f424ccbff121dd36a32d7375a517c64d.png)
数据分析试题及答案题目一:某电商平台收集了一年内用户的购物数据,数据包括用户ID、购买金额、购买时间等。
请你根据下面的数据,回答以下问题:(数据表格)用户ID 购买金额(元)购买时间001 100 2020-01-02002 200 2020-01-03003 300 2020-01-03004 150 2020-01-04005 250 2020-01-051. 请计算2020年1月份的总销售额和平均销售额。
2. 请统计2020年1月份每天的订单量。
3. 请找出购买金额最高的用户ID及其购买金额。
4. 请找出购买时间距离2020年1月2日最近的用户ID及其购买时间。
答案:1. 总销售额计算:2020年1月份的总销售额 = 100 + 200 + 300 + 150 + 250 = 1000元平均销售额计算:2020年1月份的平均销售额 = 1000 / 5 = 200元2. 每天的订单量统计:2020年1月2日订单量:12020年1月3日订单量:22020年1月4日订单量:12020年1月5日订单量:13. 购买金额最高的用户ID及其购买金额:购买金额最高的用户ID:003购买金额:300元4. 购买时间距离2020年1月2日最近的用户ID及其购买时间:购买时间距离2020年1月2日最近的用户ID:001购买时间:2020-01-02题目二:某汽车公司的销售数据如下所示,请根据下面的数据,回答以下问题:(数据表格)销售日期销售数量(辆)销售额(万元)2020-01-01 10 1002020-01-02 15 1502020-01-03 20 2002020-01-04 25 2502020-01-05 30 3001. 请计算2020年1月份的总销售数量和总销售额。
2. 请计算2020年1月份的平均销售数量和平均销售额。
3. 请找出销售数量最高和最低的日期。
4. 请计算销售数量和销售额之间的相关系数。
数据分析及应用试题库及答案
![数据分析及应用试题库及答案](https://img.taocdn.com/s3/m/1843885ebb1aa8114431b90d6c85ec3a87c28bb8.png)
数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。
A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。
A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。
数据分析经典测试题附解析
![数据分析经典测试题附解析](https://img.taocdn.com/s3/m/b26d7a4aad51f01dc281f19a.png)
数据分析经典测试题附解析一、选择题1.下列说法正确的是 ()A.要调查现在人们在数学化时代的生活方式,宜采用普查方式B.一组数据3,4,4,6,8,5的中位数是4C.必然事件的概率是100%,随机事件的概率大于0而小于1D.若甲组数据的方差2s甲=0.128,乙组数据的方差2s乙=0.036,则甲组数据更稳定【答案】C【解析】【分析】直接利用概率的意义以及全面调查和抽样调查的意义、中位数、方差的意义分别分析得出答案.【详解】A、要调查现在人们在数学化时代的生活方式,宜采用抽查的方式,故原说法错误;B、一组数据3,4,4,6,8,5的中位数是4.5,故此选项错误;C、必然事件的概率是100%,随机事件的概率大于0而小于1,正确;D、若甲组数据的方差s甲2=0.128,乙组数据的方差s乙2=0.036,则乙组数据更稳定,故原说法错误;故选:C.【点睛】此题考查概率的意义,全面调查和抽样调查的意义、中位数、方差的意义,正确掌握相关定义是解题关键.2.一组数据2,x,6,3,3,5的众数是3和5,则这组数据的中位数是()A.3 B.4 C.5 D.6【答案】B【解析】【分析】由众数的定义求出x=5,再根据中位数的定义即可解答.【详解】解:∵数据2,x,3,3,5的众数是3和5,∴x=5,则数据为2、3、3、5、5、6,这组数据为352=4.故答案为B.【点睛】本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键.3.多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()A.极差是47 B.众数是42C.中位数是58 D.每月阅读数量超过40的有4个月【答案】C【解析】【分析】根据统计图可得出最大值和最小值,即可求得极差;出现次数最多的数据是众数;将这8个数按大小顺序排列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月.【详解】A、极差为:83-28=55,故本选项错误;B、∵58出现的次数最多,是2次,∴众数为:58,故本选项错误;C、中位数为:(58+58)÷2=58,故本选项正确;D、每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误;故选C.4.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:决赛成绩/分95908580人数4682那么20名学生决赛成绩的众数和中位数分别是( )A.85,90 B.85,87.5 C.90,85 D.95,90【答案】B【解析】试题解析:85分的有8人,人数最多,故众数为85分;处于中间位置的数为第10、11两个数,为85分,90分,中位数为87.5分. 故选B .考点:1.众数;2.中位数5.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于本次训练,有如下结论:①22s s >甲乙;②22s s <甲乙;③甲的射击成绩比乙稳定;④乙的射击成绩比甲稳定.由统计图可知正确的结论是( )A .①③B .①④C .②③D .②④【答案】C 【解析】 【分析】从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案. 【详解】由图中知,甲的成绩为7,7,8,9,8,9,10,9,9,9, 乙的成绩为8,9,7,8,10,7,9,10,7,10,x 甲=(7+7+8+9+8+9+10+9+9+9)÷10=8.5, x 乙=(8+9+7+8+10+7+9+10+7+10)÷10=8.5,甲的方差S 甲2=[2×(7-8.5)2+2×(8-8.5)2+(10-8.5)2+5×(9-8.5)2]÷10=0.85, 乙的方差S 乙2=[3×(7-8.5)2+2×(8-8.5)2+2×(9-8.5)2+3×(10-8.5)2]÷10=1.45, ∴S 2甲<S 2乙,∴甲的射击成绩比乙稳定; 故选:C . 【点睛】本题考查方差的定义与意义:一般地设n 个数据,x 1,x 2,…x n 的平均数为x ,则方差S 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.6.对于一组统计数据:1,1,4,1,3,下列说法中错误的是( ) A .中位数是1 B .众数是1 C .平均数是1.5D .方差是1.6【答案】C【解析】【分析】将数据从小到大排列,再根据中位数、众数、平均数及方差的定义依次计算可得答案.【详解】解:将数据重新排列为:1、1、1、3、4,则这组数据的中位数1,A选项正确;众数是1,B选项正确;平均数为111345++++=2,C选项错误;方差为15×[(1﹣2)2×3+(3﹣2)2+(4﹣2)2]=1.6,D选项正确;故选:C.【点睛】本题主要考查中位数、众数、平均数及方差,解题的关键是掌握中位数、众数、平均数及方差的定义与计算公式.7.某青年排球队12名队员的年龄情况如下:则12名队员的年龄()A.众数是20岁,中位数是19岁B.众数是19岁,中位数是19岁C.众数是19岁,中位数是20.5岁D.众数是19岁,中位数是20岁【答案】D【解析】【分析】中位数是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数;众数是指在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个).【详解】解:在这一组数据中19岁是出现次数最多的,故众数是19岁;将这组数据从小到大的顺序排列后,处于中间位置的数是20岁,那么由中位数的定义可知,这组数据中的中位数是20岁.故选:D.【点睛】理解中位数和众数的定义是解题的关键.8.某校共有200名学生,为了解本学期学生参加公益劳动的情况,收集了他们参加公益劳动时间(单位:小时)等数据,以下是根据数据绘制的统计图表的一部分.学生类型人数时间010t≤<1020t≤<2030t≤<3040t≤<40t≥性别男73125304女82926328学段初中25364411高中下面有四个推断:①这200名学生参加公益劳动时间的平均数一定在24.5-25.5之间②这200名学生参加公益劳动时间的中位数在20-30之间③这200名学生中的初中生参加公益劳动时间的中位数一定在20-30之间④这200名学生中的高中生参加公益劳动时间的中位数可能在20-30之间所有合理推断的序号是()A.①③B.②④C.①②③D.①②③④【答案】C【解析】【分析】根据中位数与平均数的意义对每个选项逐一判断即可.【详解】解:①解这200名学生参加公益劳动时间的平均数:①(24.5×97+25.5×103)÷200=25.015,一定在24.5-25.5之间,正确;②由统计表类别栏计算可得,各时间段人数分别为15,60,51,62,12,则中位数在20~30之间,故②正确.③由统计表计算可得,初中学段栏0≤t<10的人数在0~15之间,当人数为0时,中位数在20~30之间;当人数为15时,中位数在20~30之间,故③正确.④由统计表计算可得,高中学段栏各时间段人数分别为0~15,35,15,18,1.当0≤t<10时间段人数为0时,中位数在10~20之间;当0≤t<10时间段人数为15时,中位数在10~20之间,故④错误【点睛】本题考查了中位数与平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.9.已知一组数据:6,2,8,x,7,它们的平均数是6.则这组数据的中位数是()A.7 B.6 C.5 D.4【答案】A【解析】分析:首先根据平均数为6求出x的值,然后根据中位数的概念求解.详解:由题意得:6+2+8+x+7=6×5,解得:x=7,这组数据按照从小到大的顺序排列为:2,6,7,7,8,则中位数为7.故选A.点睛:本题考查了中位数和平均数的知识,将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数;平均数是指在一组数据中所有数据之和再除以数据的个数.10.某校九年级数学模拟测试中,六名学生的数学成绩如下表所示,下列关于这组数据描述正确的是()A.众数是110 B.方差是16C.平均数是109.5 D.中位数是109【答案】A【解析】【分析】根据众数、中位数的概念求出众数和中位数,根据平均数和方差的计算公式求出平均数和方差.【详解】解:这组数据的众数是110,A正确;16x=×(110+106+109+111+108+110)=109,C错误;21S6= [(110﹣109)2+(106﹣109)2+(109﹣109)2+(111﹣109)2+(108﹣109)2+(110﹣109)2]=83,B错误;中位数是109.5,D错误;故选A.【点睛】本题考查的是众数、平均数、方差、中位数,掌握它们的概念和计算公式是解题的关键.11.下列说法正确的是( )A.打开电视机,正在播放“张家界新闻”是必然事件B.天气预报说“明天的降水概率为65%”,意味着明天一定下雨C.两组数据平均数相同,则方差大的更稳定D.数据5,6,7,7,8的中位数与众数均为7【答案】D【解析】【分析】根据必然事件的意义、概率的意义、方差的意义、中位数和众数的概念逐一进行判断即可.【详解】A.打开电视机,正在播放“张家界新闻”是随机事件,故A选项错误;B.天气预报说“明天的降水概率为65%”,意味着明天可能下雨,故B选项错误;C.两组数据平均数相同,则方差大的更不稳定,故C选项错误;D,数据5,6,7,7,8的中位数与众数均为7,正确,故选D.【点睛】本题考查了概率、方差、众数和中位数等知识,熟练掌握相关知识的概念、意义以及求解方法是解题的关键.12.某地区汉字听写大赛中,10名学生得分情况如下表:那么这10名学生所得分数的中位数和众数分别是()A.85和85 B.85.5和85 C.85和82.5 D.85.5和80【答案】A【解析】【分析】找中位数要把数据按从小到大的顺序排列,位于最中间的一个数(或两个数的平均数)为中位数;众数是一组数据中出现次数最多的数据,可得答案.【详解】把这组数据从小到大排列,处于中间位置的两个数都是85,那么由中位数的定义可知,这组数据的中位数是85;在这一组数据中85出现的次数最多,则众数是85;故选:A.【点睛】此题考查众数与中位数的意义.解题关键在于掌握众数是一组数据中出现次数最多的数据;中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数),叫做这组数据的中位数.如果中位数的概念掌握得不好,不把数据按要求重新排列,就会出错.13.某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:该店主决定本周进货时,增加一些41码的衬衫,影响该店主决策的统计量是( )A.平均数B.方差C.中位数D.众数【答案】D【解析】【分析】平均数、中位数、众数是描述一组数据集中程度的统计量;方差、标准差是描述一组数据离散程度的统计量.销量大的尺码就是这组数据的众数.【详解】由于众数是数据中出现次数最多的数,故影响该店主决策的统计量是众数.故选D.【点睛】此题主要考查统计的有关知识,主要包括平均数、中位数、众数、方差的意义.14.在一次数学答题比赛中,五位同学答对题目的个数分别为7,5,3,5,10,则关于这组数据的说法不正确的是()A.众数是5 B.中位数是5 C.平均数是6 D.方差是3.6【答案】D【解析】【分析】根据平均数、中位数、众数以及方差的定义判断各选项正误即可.【详解】A、数据中5出现2次,所以众数为5,此选项正确;B、数据重新排列为3、5、5、7、10,则中位数为5,此选项正确;C、平均数为(7+5+3+5+10)÷5=6,此选项正确;D、方差为15×[(7﹣6)2+(5﹣6)2×2+(3﹣6)2+(10﹣6)2]=5.6,此选项错误;故选:D.【点睛】本题主要考查了方差、平均数、中位数以及众数的知识,解答本题的关键是熟练掌握各个知识点的定义以及计算公式,此题难度不大.15.在一次体检中,甲、乙、丙、丁四位同学的平均身高为1.65米,而甲、乙、丙三位同学的平均身高为1.63米,下列说法一定正确的是()A.四位同学身高的中位数一定是其中一位同学的身高B.丁同学的身高一定高于其他三位同学的身高C.丁同学的身高为1.71米D.四位同学身高的众数一定是1.65【答案】C【解析】【分析】根据平均数,中位数,众数的定义求解即可.【详解】解:A、四位同学身高的中位数可能是某两个同学身高的平均数,故错误;B、丁同学的身高一定高于其他三位同学的身高,错误;C、丁同学的身高为1.654 1.633 1.71⨯-⨯=米,正确;D.四位同学身高的众数一定是1.65,错误.故选:C.【点睛】本题考查的是平均数,中位数和众数,熟练掌握平均数,中位数和众数是解题的关键.16.为参加学校举办的“诗意校园•致远方”朗诵艺术大赛,八年级“屈原读书社”组织了五次选拔赛,这五次选拔赛中,小明五次成绩的平均数是90,方差是2;小强五次成绩的平均数也是90,方差是14.8.下列说法正确的是()A.小明的成绩比小强稳定B.小明、小强两人成绩一样稳定C.小强的成绩比小明稳定D.无法确定小明、小强的成绩谁更稳定【答案】A【解析】【分析】方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.【详解】∵小明五次成绩的平均数是90,方差是2;小强五次成绩的平均数也是90,方差是14.8.平均成绩一样,小明的方差小,成绩稳定,故选A.【点睛】本题考查方差、平均数的定义,解题的关键是熟练掌握基本知识,属于中考基础题.错因分析容易题.失分原因是方差的意义掌握不牢.17.5、2.4、2.4、2.4、2.3的中位数是2.4,选项C不符合题意.15×[(2.3﹣2.4)2+(2.4﹣2.4)2+(2.5﹣2.4)2+(2.4﹣2.4)2+(2.4﹣2.4)2]=15×(0.01+0+0.01+0+0)=15×0.02=0.004∴这组数据的方差是0.004,∴选项D不符合题意.故选B.【点睛】此题主要考查了中位数、众数、算术平均数、方差的含义和求法,要熟练掌握.18.数据2、5、6、0、6、1、8的中位数是()A.8 B.6 C.5 D.0【答案】C【解析】【分析】将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.【详解】将数据从小到大排列为:0,1,2,5,6,6,8∵这组数据的个数是奇数∴最中间的那个数是中位数即中位数为5故选C .【点睛】此题考查了平均数与中位数的意义,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.19.某班统计一次数学测验成绩的平均分与方差,计算完毕以后才发现有位同学的分数还未登记,只好重新算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x <,221s s =B .1x x =,221s s >C .1x x =,221s s <D .1x x =,221s s = 【答案】B【解析】【分析】根据平均数和方差的公式计算比较即可.【详解】设这个班有n 个同学,数据分别是a 1,a 2,…a i …,a n ,第i 个同学没登录,第一次计算时总分是(n−1)x ,方差是s 2=11n -[(a 1−x)2+…(a i−1−x)2+(a i+1−x)2+…+(a n −x)2] 第二次计算时, x =()1n x x n -+=x , 方差s 12=1n [(a 1−x)2+…(a i−1−x)2+(a i −x)2+(a i+1−x)2+…+(a n −x)2]=1n n -s 2, 故221s s >,故选B .【点睛】此题主要考查平均数和方差的计算,解题的关键是熟知其计算方法.20.某班有40人,一次体能测试后,老师对测试成绩进行了统计.由于小亮没有参加本次集体测试,因此计算其他39人的平均分为90分,方差239s =.后来小亮进行了补测,成绩为90分,关于该班40人的测试成绩,下列说法正确的是( )A .平均分不变,方差变大B .平均分不变,方差变小C .平均分和方差都不变D .平均分和方差都改变【答案】B【解析】【分析】根据平均数,方差的定义计算即可.【详解】解:∵小亮的成绩和其他39人的平均数相同,都是90分,∴该班40人的测试成绩的平均分为90分,方差变小,故选:B.【点睛】本题考查方差,算术平均数等知识,解题的关键是理解题意,灵活运用所学知识解决问题,属于中考常考题型.。
数据分析经典测试题附答案
![数据分析经典测试题附答案](https://img.taocdn.com/s3/m/cb2c63b1192e45361066f59a.png)
数据分析经典测试题附答案一、选择题1.某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:该店主决定本周进货时,增加一些41码的衬衫,影响该店主决策的统计量是( )A.平均数B.方差C.中位数D.众数【答案】D【解析】【分析】平均数、中位数、众数是描述一组数据集中程度的统计量;方差、标准差是描述一组数据离散程度的统计量.销量大的尺码就是这组数据的众数.【详解】由于众数是数据中出现次数最多的数,故影响该店主决策的统计量是众数.故选D.【点睛】此题主要考查统计的有关知识,主要包括平均数、中位数、众数、方差的意义.2.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:那么20名学生决赛成绩的众数和中位数分别是( )A.85,90 B.85,87.5 C.90,85 D.95,90【答案】B【解析】试题解析:85分的有8人,人数最多,故众数为85分;处于中间位置的数为第10、11两个数,为85分,90分,中位数为87.5分.故选B.考点:1.众数;2.中位数3.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于本次训练,有如下结论:①22s s >甲乙;②22s s <甲乙;③甲的射击成绩比乙稳定;④乙的射击成绩比甲稳定.由统计图可知正确的结论是( )A .①③B .①④C .②③D .②④【答案】C 【解析】 【分析】从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案. 【详解】由图中知,甲的成绩为7,7,8,9,8,9,10,9,9,9, 乙的成绩为8,9,7,8,10,7,9,10,7,10,x 甲=(7+7+8+9+8+9+10+9+9+9)÷10=8.5, x 乙=(8+9+7+8+10+7+9+10+7+10)÷10=8.5,甲的方差S 甲2=[2×(7-8.5)2+2×(8-8.5)2+(10-8.5)2+5×(9-8.5)2]÷10=0.85, 乙的方差S 乙2=[3×(7-8.5)2+2×(8-8.5)2+2×(9-8.5)2+3×(10-8.5)2]÷10=1.45, ∴S 2甲<S 2乙,∴甲的射击成绩比乙稳定; 故选:C . 【点睛】本题考查方差的定义与意义:一般地设n 个数据,x 1,x 2,…x n 的平均数为x ,则方差S 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.4.有甲、乙两种糖果,原价分别为每千克a 元和b 元.根据调查,将两种糖果按甲种糖果x 千克与乙种糖果y 千克的比例混合,取得了较好的销售效果.现在糖果价格有了调整:甲种糖果单价下降15%,乙种糖果单价上涨20%,但按原比例混合的糖果单价恰好不变,则xy等于( ) A .34a b B .43a bC .34b aD .43b a【答案】D【解析】【分析】根据已知条件表示出价格变化前后两种糖果的平均价格,进而得出等式求出即可.【详解】解:∵甲、乙两种糖果,原价分别为每千克a元和b元,两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,∴两种糖果的平均价格为:ax byx y++,∵甲种糖果单价下降15%,乙种糖果单价上涨20%,∴两种糖果的平均价格为:1520 (1)(1)100100a xb yx y-•+++,∵按原比例混合的糖果单价恰好不变,∴ax byx y++=1520(1)(1)100100a xb yx y-•+++,整理,得15ax=20by∴43x by a =,故选:D.【点睛】本题考查了加权平均数,解决本题的关键是表示出价格变化前后两种糖果的平均价格.5.为全力抗战疫情,响应政府“停课不停学”号召,东营市教育局发布关于疫情防控期间开展在线课程教学的通知:从2月10日开始,全市中小学按照教学计划,开展在线课程教学和答疑.据互联网后台数据显示,某中学九年级七科老师2月10日在线答疑问题总个数如下表所示则2月10日该中学九年级七科老师在线答疑问题总个数的平均数是()A.22 B.24 C.25 D.26【答案】C【解析】【分析】把7个数相加再除以7即可求得其平均数.【详解】由题意得,九年级七科老师在线答疑问题总个数的平均数是1(26282826242122)257++++++=,故选:C【点睛】此题考查了平均数的计算,掌握计算方法是解答此题的关键.6.某小组长统计组内6人一天在课堂上的发言次数分別为3,3,4,6,5,0.则这组数据的众数是()A.3 B.3.5 C.4 D.5【答案】A【解析】【分析】根据众数的定义,找数据中出现次数最多的数据即可.【详解】在3,3,4,6,5,0这组数据中,数字3出现了2次,为出现次数最多的数,故众数为3.故选A.【点睛】本题考查了众数的概念.众数是一组数据中出现次数最多的数据.7.在创建平安校园活动中,九年级一班举行了一次“安全知识竞赛”活动,第一小组6名同学的成绩(单位:分)分别是:87,91,93,87,97,96,下列关于这组数据说正确的是()A.中位数是90 B.平均数是90 C.众数是87 D.极差是9【答案】C【解析】【分析】根据中位数、平均数、众数、极差的概念求解.【详解】解:这组数据按照从小到大的顺序排列为:87,87,91,93,96,97,则中位数是(91+93)÷2=92,平均数是(87+87+91+93+96+97)÷6=9156,众数是87,极差是97﹣87=10.故选C.【点睛】本题考查了中位数、平均数、众数、极差的知识,掌握各知识点的概念是解答本题的关键.8.某校在中国学生核心素养知识竞赛中,通过激烈角逐,甲、乙、丙、丁四名同学胜出,他们的成绩如表:如果要选出一个成绩较好且状态稳定的同学去参加市级比赛,应选()A.丁B.丙C.乙D.甲【答案】B【解析】【分析】先比较平均数得到甲和丙成绩较好,然后比较方差得到丙的状态稳定,即可决定选丙去参赛.【详解】∵甲、丙的平均数比乙、丁大,∴甲和丙成绩较好,∵丙的方差比甲的小,∴丙的成绩比较稳定,∴丙的成绩较好且状态稳定,应选的是丙,故选:B.【点睛】本题考查了方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差;方差是反映一组数据的波动大小的一个量,方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.也考查了平均数的意义.9.多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()A.极差是47 B.众数是42C.中位数是58 D.每月阅读数量超过40的有4个月【答案】C【解析】【分析】根据统计图可得出最大值和最小值,即可求得极差;出现次数最多的数据是众数;将这8个数按大小顺序排列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月.【详解】A、极差为:83-28=55,故本选项错误;B、∵58出现的次数最多,是2次,∴众数为:58,故本选项错误;C、中位数为:(58+58)÷2=58,故本选项正确;D、每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误;故选C.10.某兴趣小组为了解我市气温变化情况,记录了今年月份连续6天的最低气温(单----,关于这组数据,下列结论不正确的是()位:℃):7,4,2,1,2,2A.平均数是B.中位数是C.众数是D.方差是【答案】D【解析】【分析】一组数据中出现次数最多的数据叫做这组数据的众数.将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.平均数是指在一组数据中所有数据之和再除以数据的个数.一般地设n个数据,x1,x2,…x n的平均数为,则方差S2= [(x1﹣)2+(x2﹣)2+…+(x n﹣)2].【详解】解:有题意可得,这组数据的众数为-2,中位数为-2,平均数为-2,方差是9故选D.11.某鞋店一天卖出运动鞋12双,其中各种尺码的鞋的销售量如下表:则这12双鞋的尺码组成的一组数据中,众数和中位数分别是()A.25,25 B.24.5,25 C.25,24.5 D.24.5,24.5【答案】A【解析】试题分析:根据众数和中位数的定义求解可得.解:由表可知25出现次数最多,故众数为25;12个数据的中位数为第6、7个数据的平均数,故中位数为25252=25,故选:A.12.校团委组织开展“医助武汉捐款”活动,小慧所在的九年级(1)班共40名同学进行了捐款,已知该班同学捐款的平均金额为10元,二小慧捐款11元,下列说法错误的是( ) A.10元是该班同学捐款金额的平均水平B.班上比小慧捐款金额多的人数可能超过20人C.班上捐款金额的中位数一定是10元D.班上捐款金额数据的众数不一定是10元【答案】C【解析】【分析】根据平均数,中位数及众数的定义依次判断.【详解】∵该班同学捐款的平均金额为10元,∴10元是该班同学捐款金额的平均水平,故A正确;∵九年级(1)班共40名同学进行了捐款,捐款的平均金额为10元,∴班上比小慧捐款金额多的人数可能超过20人,故B正确;班上捐款金额的中位数不一定是10元,故C错误;班上捐款金额数据的众数不一定是10元,故D正确,故选:C.【点睛】此题考查数据统计中的平均数,中位数及众数的定义,正确理解定义是解题的关键.13.在一次数学答题比赛中,五位同学答对题目的个数分别为7,5,3,5,10,则关于这组数据的说法不正确的是()A.众数是5 B.中位数是5 C.平均数是6 D.方差是3.6【答案】D【解析】【分析】根据平均数、中位数、众数以及方差的定义判断各选项正误即可.【详解】A、数据中5出现2次,所以众数为5,此选项正确;B、数据重新排列为3、5、5、7、10,则中位数为5,此选项正确;C、平均数为(7+5+3+5+10)÷5=6,此选项正确;D、方差为15×[(7﹣6)2+(5﹣6)2×2+(3﹣6)2+(10﹣6)2]=5.6,此选项错误;故选:D.【点睛】本题主要考查了方差、平均数、中位数以及众数的知识,解答本题的关键是熟练掌握各个知识点的定义以及计算公式,此题难度不大.14.郑州某中学在备考2018河南中考体育的过程中抽取该校九年级20名男生进行立定跳远测试,以便知道下一阶段的体育训练,成绩如下所示:则下列叙述正确的是()A.这些运动员成绩的众数是 5B.这些运动员成绩的中位数是 2.30C.这些运动员的平均成绩是 2.25D.这些运动员成绩的方差是 0.0725【答案】B【解析】【分析】根据方差、平均数、中位数和众数的计算公式和定义分别对每一项进行分析,即可得出答案.【详解】由表格中数据可得:A、这些运动员成绩的众数是2.35,错误;B、这些运动员成绩的中位数是2.30,正确;C、这些运动员的平均成绩是 2.30,错误;D、这些运动员成绩的方差不是0.0725,错误;故选B.【点睛】考查了方差、平均数、中位数和众数,熟练掌握定义和计算公式是本题的关键,平均数平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.15.关于数据-4,1,2,-1,2,下面结果中,错误的是( ) A .中位数为1 B .方差为26C .众数为2D .平均数为0【答案】B 【解析】 【分析】 【详解】A .∵从小到大排序为-4,-1,,1,2,2,∴中位数为1 ,故正确;B .4121205x -++-+== ,()()()()222224010102022655s --+--+-+-⨯==,故不正确;C .∵众数是2,故正确;D .4121205x -++-+==,故正确;故选B.16.为考察两名实习工人的工作情况,质检部将他们工作第一周每天生产合格产品的个数整理成甲,乙两组数据,如下表:关于以上数据,说法正确的是( ) A .甲、乙的众数相同 B .甲、乙的中位数相同 C .甲的平均数小于乙的平均数 D .甲的方差小于乙的方差【答案】D 【解析】 【分析】分别根据众数、中位数、平均数、方差的定义进行求解后进行判断即可得. 【详解】甲:数据7出现了2次,次数最多,所以众数为7, 排序后最中间的数是7,所以中位数是7,26778==65x ++++甲,()()()()()2222221S =26666767865⎡⎤⨯-+-+-+-+-⎣⎦甲=4.4,乙:数据8出现了2次,次数最多,所以众数为8, 排序后最中间的数是4,所以中位数是4,23488==55x 乙++++,()()()()()2222221S =25354585855乙⎡⎤⨯-+-+-+-+-⎣⎦=6.4,所以只有D 选项正确, 故选D. 【点睛】本题考查了众数、中位数、平均数、方差,熟练掌握相关定义及求解方法是解题的关键.17.在光明中学组织的全校师生迎“五四”诗词大赛中,来自不同年级的25名参赛同学的得分情况如图所示.这些成绩的中位数和众数分别是( )A .96分,98分B .97分,98分C .98分,96分D .97分,96分【答案】A 【解析】 【分析】利用众数和中位数的定义求解. 【详解】98出现了9次,出现次数最多,所以数据的众数为98分;共有25个数,最中间的数为第13个数,是96,所以数据的中位数为96分. 故选A . 【点睛】本题考查了众数:一组数据中出现次数最多的数据叫做众数.也考查了中位数.18.在“童心向党,阳光下成长”合唱比赛中,30个参赛队的决赛成绩如下表: 比赛成绩/分9.59.69.79.89.9参赛队个数98643则这30个参赛队决赛成绩的中位数和众数分别是()A.9.7,9.5 B.9.7,9.9 C.9.6,9.5 D.9.6,9.6【答案】C【解析】【分析】根据众数和中位数的定义求解可得.【详解】解:由表知,众数为9.5分,中位数为=9.6(分),故选:C.【点睛】考查了众数和中位数的定义,一组数据中出现次数最多的数据叫做众数;找中位数要把数据按从小到大的顺序排列,位于最中间的一个数(或两个数的平均数)为中位数;众数是一组数据中出现次数最多的数据,注意众数可以不止一个.19.下列说法正确的是()A.对角线相等的四边形一定是矩形B.任意掷一枚质地均匀的硬币10次,一定有5次正面向上C.如果有一组数据为5,3,6,4,2,那么它的中位数是6D.“用长分别为5cm、12cm、6cm的三条线段可以围成三角形”这一事件是不可能事件【答案】D【解析】【分析】根据矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义依次判断即可.【详解】A.对角线相等的平行四边形是矩形,故该项错误;B. 任意掷一枚质地均匀的硬币10次,不一定有5次正面向上,故该项错误;C. 一组数据为5,3,6,4,2,它的中位数是4,故该项错误;D. “用长分别为5cm、12cm、6cm的三条线段可以围成三角形” 这一事件是不可能事件,正确,故选:D.【点睛】此题矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义,综合掌握各知识点是解题的关键.20.下面的统计图表示某体校射击队甲、乙两名队员射击比赛的成绩,根据统计图中的信息,下列结论正确的是()A.甲队员成绩的平均数比乙队员的大B.乙队员成绩的平均数比甲队员的大C.甲队员成绩的中位数比乙队员的大D.甲队员成绩的方差比乙队员的大【答案】D【解析】【分析】根据平均数、中位数和方差的计算公式分别对每一项进行分析,即可得出答案.【详解】甲队员10次射击的成绩分别为6,7,7,7,8,8,9,9,9,10,则中位数882=8,甲10次射击成绩的平均数=(6+3×7+2×8+3×9+10)÷10=8(环),乙队员10次射击的成绩分别为6,7,7,8,8,8,8,9,9,10,则中位数是8,乙10次射击成绩的平均数=(6+2×7+4×8+2×9+10)÷9=8(环),甲队员成绩的方差=110×[(6-8)2+3×(7-8)2+2×(8-8)3+3×(9-8)2+(10-8)2]=1.4;乙队员成绩的方差=110×[(6-8)2+2×(7-8)2+4×(8-8)3+2×(9-8)2+(10-8)2]=1.2,综上可知甲、乙的中位数相同,平均数相同,甲的方差大于乙的方差,故选D.【点睛】本题考查了平均数、中位数和方差的定义和公式,熟练掌握平均数、中位数、方差的计算是解题的关键.。
大数据分析考试试题
![大数据分析考试试题](https://img.taocdn.com/s3/m/2ea90db4185f312b3169a45177232f60dccce749.png)
大数据分析考试试题大数据分析如今在各个领域都发挥着至关重要的作用,为了检验对于大数据分析知识的掌握程度,以下是一套全面且具有一定深度和广度的考试试题。
一、单选题(每题 3 分,共 30 分)1、以下哪项不是大数据的特点?()A 数据量大B 数据类型多样C 数据处理速度快D 数据价值密度高2、以下哪种数据存储方式最适合大规模的结构化数据?()A 关系型数据库B NoSQL 数据库C 数据仓库D 分布式文件系统3、在数据清洗过程中,处理缺失值的常见方法不包括()A 删除包含缺失值的记录B 用平均值填充C 用随机值填充D 不做处理4、数据挖掘中的关联规则挖掘,常用的算法是()A Apriori 算法B KMeans 算法C 决策树算法D 朴素贝叶斯算法5、以下哪种可视化方式最适合展示数据的分布情况?()A 柱状图B 折线图C 饼图D 箱线图6、以下关于数据仓库的说法,错误的是()A 数据仓库的数据是面向主题的B 数据仓库的数据是随时间变化的 C 数据仓库的数据是不可更新的 D 数据仓库的数据是集成的7、以下哪种数据预处理技术可以用于减少数据维度?()A 数据标准化B 主成分分析C 数据归一化D 数据离散化8、以下哪种聚类算法是基于层次的?()A KMeans 算法B BIRCH 算法C DBSCAN 算法D 以上都不是9、以下哪个指标不是用于评估分类模型的性能?()A 准确率B 召回率C F1 值D 均方误差10、在大数据分析中,以下哪种语言常用于数据处理和分析?()A JavaB PythonC C++D C二、多选题(每题 5 分,共 25 分)1、大数据分析的流程包括()A 数据采集B 数据存储C 数据预处理D 数据分析E 数据可视化2、以下哪些是常见的大数据处理框架?()A HadoopB SparkC StormD FlinkE Kafka3、数据挖掘的任务包括()A 分类B 聚类C 关联分析D 预测E 异常检测4、以下哪些是数据可视化的原则?()A 准确性B 简洁性C 一致性D 有效性E 美观性5、以下关于机器学习的说法,正确的是()A 监督学习需要有标记的训练数据B 无监督学习不需要有标记的训练数据 C 强化学习通过与环境的交互来学习 D 深度学习是机器学习的一个分支 E 机器学习可以用于解决大数据分析中的问题三、简答题(每题 10 分,共 30 分)1、请简要说明数据预处理的主要步骤及目的。
数据分析经典测试题附答案
![数据分析经典测试题附答案](https://img.taocdn.com/s3/m/6d66021f0622192e453610661ed9ad51f01d54f8.png)
数据分析经典测试题附答案一、选择题1.某专卖店专营某品牌的衬衫,店主对上一周中不同尺码的衬衫销售情况统计如下:衬衫尺码3940414243平均每天销售件1012201212数该店主决定本周进货时,增加一些41码的衬衫,影响该店主决策的统计量是( )A.平均数B.方差C.中位数D.众数【答案】D【解析】【分析】平均数、中位数、众数是描述一组数据集中程度的统计量;方差、标准差是描述一组数据离散程度的统计量.销量大的尺码就是这组数据的众数.【详解】由于众数是数据中浮现次数最多的数,故影响该店主决策的统计量是众数.故选D.【点睛】此题主要考查统计的有关知识,主要包括平均数、中位数、众数、方差的意义.2.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:决赛成绩/分95908580人数4682那末20名学生决赛成绩的众数和中位数分别是( )A.85,90 B.85,87.5 C.90,85 D.95,90【答案】B【解析】试题解析:85分的有8人,人数最多,故众数为85分;处于中间位置的数为第10、11两个数,为85分,90分,中位数为87.5分.故选B.考点:1.众数;2.中位数3.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于本次训练,有如下结论:①22s s >甲乙;②22s s <甲乙;③甲的射击成绩比乙稳定;④乙的射击成绩比甲稳定.由统计图可知正确的结论是( )A .①③B .①④C .②③D .②④【答案】C 【解析】 【分析】从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案. 【详解】由图中知,甲的成绩为7,7,8,9,8,9,10,9,9,9, 乙的成绩为8,9,7,8,10,7,9,10,7,10,x 甲=(7+7+8+9+8+9+10+9+9+9)÷10=8.5,x 乙=(8+9+7+8+10+7+9+10+7+10)÷10=8.5,甲的方差S 甲2=[2×(7-8.5)2+2×(8-8.5)2+(10-8.5)2+5×(9-8.5)2]÷10=0.85, 乙的方差S 乙2=[3×(7-8.5)2+2×(8-8.5)2+2×(9-8.5)2+3×(10-8.5)2]÷10=1.45, ∴S 2甲<S 2乙,∴甲的射击成绩比乙稳定; 故选:C . 【点睛】本题考查方差的定义与意义:普通地设n 个数据,x 1,x 2,…x n 的平均数为x ,则方差S 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.4.有甲、乙两种糖果,原价分别为每千克a 元和b 元.根据调查,将两种糖果按甲种糖果x 千克与乙种糖果y 千克的比例混合,取得了较好的销售效果.现在糖果价格有了调整:甲种糖果单价下降15%,乙种糖果单价上涨20%,但按原比例混合的糖果单价恰好不变,则xy等于( )A .34a bB .43a bC .34b aD .43b a【答案】D【解析】【分析】根据已知条件表示出价格变化先后两种糖果的平均价格,进而得出等式求出即可.【详解】解:∵甲、乙两种糖果,原价分别为每千克a元和b元,两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,∴两种糖果的平均价格为:ax byx y++,∵甲种糖果单价下降15%,乙种糖果单价上涨20%,∴两种糖果的平均价格为:1520 (1)(1)100100a xb yx y-•+++,∵按原比例混合的糖果单价恰好不变,∴ax byx y++=1520(1)(1)100100a xb yx y-•+++,整理,得15ax=20by∴43x by a =,故选:D.【点睛】本题考查了加权平均数,解决本题的关键是表示出价格变化先后两种糖果的平均价格.5.为全力抗战疫情,响应政府“停课不停学”号召,东营市教育局发布关于疫情防控期间开展在线课程教学的通知:从2月10日开始,全市中小学按照教学计划,开展在线课程教学和答疑.据互联网后台数据显示,某中学九年级七科老师2月10日在线答疑问题总个数如下表所示则2月10日该中学九年级七科老师在线答疑问题总个数的平均数是()A.22 B.24 C.25 D.26【答案】C【解析】【分析】把7个数相加再除以7即可求得其平均数.【详解】由题意得,九年级七科老师在线答疑问题总个数的平均数是1(26282826242122)257++++++=,故选:C【点睛】此题考查了平均数的计算,掌握计算方法是解答此题的关键.6.某小组长统计组内6人一天在课堂上的发言次数分別为3,3,4,6,5,0.则这组数据的众数是()A.3 B.3.5 C.4 D.5【答案】A【解析】【分析】根据众数的定义,找数据中浮现次数最多的数据即可.【详解】在3,3,4,6,5,0这组数据中,数字3浮现了2次,为浮现次数最多的数,故众数为3.故选A.【点睛】本题考查了众数的概念.众数是一组数据中浮现次数最多的数据.7.在创建安全校园活动中,九年级一班举行了一次“安全知识竞赛”活动,第一小组6名同学的成绩(单位:分)分别是:87,91,93,87,97,96,下列关于这组数据说正确的是( )A.中位数是90 B.平均数是90 C.众数是87 D.极差是9【答案】C【解析】【分析】根据中位数、平均数、众数、极差的概念求解.【详解】解:这组数据按照从小到大的顺序罗列为:87,87,91,93,96,97,则中位数是(91+93)÷2=92,平均数是(87+87+91+93+96+97)÷6=9156,众数是87,极差是97﹣87=10.故选C.【点睛】本题考查了中位数、平均数、众数、极差的知识,掌握各知识点的概念是解答本题的关键.8.某校在中国学生核心素质知识竞赛中,通过激烈角逐,甲、乙、丙、丁四名同学胜出,他们的成绩如表:甲乙丙丁平均分8.58.28.58.2方差 1.8 1.2 1.2 1.1最高分9.89.89.89.7如果要选出一个成绩较好且状态稳定的同学去参加市级比赛,应选()A.丁B.丙C.乙D.甲【答案】B【解析】【分析】先比较平均数得到甲和丙成绩较好,然后比较方差得到丙的状态稳定,即可决定选丙去参赛.【详解】∵甲、丙的平均数比乙、丁大,∴甲和丙成绩较好,∵丙的方差比甲的小,∴丙的成绩比较稳定,∴丙的成绩较好且状态稳定,应选的是丙,故选:B.【点睛】本题考查了方差:一组数据中各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差;方差是反映一组数据的波动大小的一个量,方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.也考查了平均数的意义.9.多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()A .极差是47B .众数是42C .中位数是58D .每月阅读数量超过40的有4个月【答案】C 【解析】 【分析】根据统计图可得出最大值和最小值,即可求得极差;浮现次数最多的数据是众数;将这8个数按大小顺序罗列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月. 【详解】A 、极差为:83-28=55,故本选项错误;B 、∵58浮现的次数最多,是2次, ∴众数为:58,故本选项错误;C 、中位数为:(58+58)÷2=58,故本选项正确;D 、每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误; 故选C .10.某兴趣小组为了解我市气温变化情况,记录了今年月份连续6天的最低气温(单位:℃):7,4,2,1,2,2----,关于这组数据,下列结论不正确的是( ) A .平均数是B .中位数是C .众数是D .方差是【答案】D 【解析】 【分析】一组数据中浮现次数最多的数据叫做这组数据的众数.将一组数据按照从小到大(或者从大到小)的顺序罗列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.平均数是指在一组数据中所有数据之和再除以数据的个数.普通地设n 个数据,x 1,x 2,…x n 的平均数为,则方差S 2= [(x 1﹣)2+(x 2﹣)2+…+(x n ﹣)2]. 【详解】解:有题意可得,这组数据的众数为-2,中位数为-2,平均数为-2,方差是9 故选D .11.某鞋店一天卖出运动鞋12双,其中各种尺码的鞋的销售量如下表:则这12双鞋的尺码组成的一组数据中,众数和中位数分别是( )码(cm)23.52424.52525.5销售量(双)12252A.25,25 B.24.5,25 C.25,24.5 D.24.5,24.5【答案】A【解析】试题分析:根据众数和中位数的定义求解可得.解:由表可知25浮现次数最多,故众数为25;12个数据的中位数为第6、7个数据的平均数,故中位数为25252=25,故选:A.12.校团委组织开展“医助武汉捐款”活动,小慧所在的九年级(1)班共40名同学进行了捐款,已知该班同学捐款的平均金额为10元,二小慧捐款11元,下列说法错误的是( ) A.10元是该班同学捐款金额的平均水平B.班上比小慧捐款金额多的人数可能超过20人C.班上捐款金额的中位数一定是10元D.班上捐款金额数据的众数不一定是10元【答案】C【解析】【分析】根据平均数,中位数及众数的定义挨次判断.【详解】∵该班同学捐款的平均金额为10元,∴10元是该班同学捐款金额的平均水平,故A正确;∵九年级(1)班共40名同学进行了捐款,捐款的平均金额为10元,∴班上比小慧捐款金额多的人数可能超过20人,故B正确;班上捐款金额的中位数不一定是10元,故C错误;班上捐款金额数据的众数不一定是10元,故D正确,故选:C.【点睛】此题考查数据统计中的平均数,中位数及众数的定义,正确理解定义是解题的关键.13.在一次数学答题比赛中,五位同学答对题目的个数分别为7,5,3,5,10,则关于这组数据的说法不正确的是( )A.众数是5 B.中位数是5 C.平均数是6 D.方差是3.6【答案】D【解析】【分析】根据平均数、中位数、众数以及方差的定义判断各选项正误即可.【详解】A、数据中5浮现2次,所以众数为5,此选项正确;B、数据重新罗列为3、5、5、7、10,则中位数为5,此选项正确;C、平均数为(7+5+3+5+10)÷5=6,此选项正确;D、方差为15×[(7﹣6)2+(5﹣6)2×2+(3﹣6)2+(10﹣6)2]=5.6,此选项错误;故选:D.【点睛】本题主要考查了方差、平均数、中位数以及众数的知识,解答本题的关键是熟练掌握各个知识点的定义以及计算公式,此题难度不大.14.郑州某中学在备考2022河南中考体育的过程中抽取该校九年级20名男生进行立定跳远测试,以便知道下一阶段的体育训练,成绩如下所示:成绩(单位:米) 2.10 2.20 2.25 2.30 2.35 2.40 2.45 2.50人数23245211则下列叙述正确的是( )A.这些运动员成绩的众数是 5B.这些运动员成绩的中位数是 2.30C.这些运动员的平均成绩是 2.25D.这些运动员成绩的方差是 0.0725【答案】B【解析】【分析】根据方差、平均数、中位数和众数的计算公式和定义分别对每一项进行分析,即可得出答案.【详解】由表格中数据可得:A、这些运动员成绩的众数是2.35,错误;B、这些运动员成绩的中位数是2.30,正确;C、这些运动员的平均成绩是 2.30,错误;D、这些运动员成绩的方差不是0.0725,错误;故选B.【点睛】考查了方差、平均数、中位数和众数,熟练掌握定义和计算公式是本题的关键,平均数平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或者从大到小)重新罗列后,最中间的那个数(或者最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.15.关于数据-4,1,2,-1,2,下面结果中,错误的是( )A.中位数为1 B.方差为26 C.众数为2 D.平均数为0【答案】B【解析】【分析】【详解】A.∵从小到大排序为-4,-1,,1,2,2,∴中位数为1 ,故正确;B.412125x-++-+==,()()()() 222224010102022655s--+--+-+-⨯==,故不正确;C.∵众数是2,故正确;D.412125x-++-+==,故正确;故选B.16.为考察两名实习工人的工作情况,质检部将他们工作第一周每天生产合格产品的个数整理成甲,乙两组数据,如下表:甲26778乙23488关于以上数据,说法正确的是()A.甲、乙的众数相同B.甲、乙的中位数相同C.甲的平均数小于乙的平均数D.甲的方差小于乙的方差【答案】D【解析】【分析】分别根据众数、中位数、平均数、方差的定义进行求解后进行判断即可得.【详解】甲:数据7浮现了2次,次数最多,所以众数为7,排序后最中间的数是7,所以中位数是7,26778==65x ++++甲, ()()()()()2222221S =26666767865⎡⎤⨯-+-+-+-+-⎣⎦甲=4.4,乙:数据8浮现了2次,次数最多,所以众数为8, 排序后最中间的数是4,所以中位数是4,23488==55x 乙++++, ()()()()()2222221S =25354585855乙⎡⎤⨯-+-+-+-+-⎣⎦=6.4,所以惟独D 选项正确, 故选D. 【点睛】本题考查了众数、中位数、平均数、方差,熟练掌握相关定义及求解方法是解题的关键.17.在光明中学组织的全校师生迎“五四”诗词大赛中,来自不同年级的25名参赛同学的得分情况如图所示.这些成绩的中位数和众数分别是( )A .96分,98分B .97分,98分C .98分,96分D .97分,96分【答案】A 【解析】 【分析】利用众数和中位数的定义求解. 【详解】98浮现了9次,浮现次数最多,所以数据的众数为98分;共有25个数,最中间的数为第13个数,是96,所以数据的中位数为96分. 故选A . 【点睛】本题考查了众数:一组数据中浮现次数最多的数据叫做众数.也考查了中位数.18.在“童心向党,阳光下成长”合唱比赛中,30个参赛队的决赛成绩如下表: 比赛成绩/分9.59.69.79.89.9参赛队个数98643则这30个参赛队决赛成绩的中位数和众数分别是( )A.9.7,9.5 B.9.7,9.9 C.9.6,9.5 D.9.6,9.6【答案】C【解析】【分析】根据众数和中位数的定义求解可得.【详解】解:由表知,众数为9.5分,中位数为=9.6(分),故选:C.【点睛】考查了众数和中位数的定义,一组数据中浮现次数最多的数据叫做众数;找中位数要把数据按从小到大的顺序罗列,位于最中间的一个数(或者两个数的平均数)为中位数;众数是一组数据中浮现次数最多的数据,注意众数可以不止一个.19.下列说法正确的是()A.对角线相等的四边形一定是矩形B.任意掷一枚质地均匀的硬币10次,一定有5次正面向上C.如果有一组数据为5,3,6,4,2,那末它的中位数是6D.“用长分别为5cm、12cm、6cm的三条线段可以围成三角形”这一事件是不可能事件【答案】D【解析】【分析】根据矩形的判定定理,数据浮现的可能性的大小,中位数的计算方法,不可能事件的定义挨次判断即可.【详解】A.对角线相等的平行四边形是矩形,故该项错误;B. 任意掷一枚质地均匀的硬币10次,不一定有5次正面向上,故该项错误;C. 一组数据为5,3,6,4,2,它的中位数是4,故该项错误;D. “用长分别为5cm、12cm、6cm的三条线段可以围成三角形” 这一事件是不可能事件,正确,故选:D.【点睛】此题矩形的判定定理,数据浮现的可能性的大小,中位数的计算方法,不可能事件的定义,综合掌握各知识点是解题的关键.20.下面的统计图表示某体校射击队甲、乙两名队员射击比赛的成绩,根据统计图中的信息,下列结论正确的是( )A.甲队员成绩的平均数比乙队员的大B.乙队员成绩的平均数比甲队员的大C.甲队员成绩的中位数比乙队员的大D.甲队员成绩的方差比乙队员的大【答案】D【解析】【分析】根据平均数、中位数和方差的计算公式分别对每一项进行分析,即可得出答案.【详解】甲队员10次射击的成绩分别为6,7,7,7,8,8,9,9,9,10,则中位数882=8,甲10次射击成绩的平均数=(6+3×7+2×8+3×9+10)÷10=8(环),乙队员10次射击的成绩分别为6,7,7,8,8,8,8,9,9,10,则中位数是8,乙10次射击成绩的平均数=(6+2×7+4×8+2×9+10)÷9=8(环),甲队员成绩的方差=110×[(6-8)2+3×(7-8)2+2×(8-8)3+3×(9-8)2+(10-8)2]=1.4;乙队员成绩的方差=110×[(6-8)2+2×(7-8)2+4×(8-8)3+2×(9-8)2+(10-8)2]=1.2,综上可知甲、乙的中位数相同,平均数相同,甲的方差大于乙的方差,故选D.【点睛】本题考查了平均数、中位数和方差的定义和公式,熟练掌握平均数、中位数、方差的计算是解题的关键.。
数据分析测试题
![数据分析测试题](https://img.taocdn.com/s3/m/b2d2e0b84bfe04a1b0717fd5360cba1aa8118ca3.png)
数据分析测试题1. 您需要从员工信息表中筛选出所有在“市场部”工作并且年龄超过30岁的员工,应该1. 使用以下哪种Excel功能? [单选题] *A. 使用“排序”功能,先按部门排序,再按年龄排序B. 使用“查找重复项”功能C. 使用“高级筛选”功能,设置条件为“部门=市场部”和“年龄>30”(正确答案)D. 手动浏览表格,找到符合条件的员工2. 您需要从员工信息表中筛选出所有在“市场部”工作并且年龄超过30岁的员工,应该1. 使用以下哪种Excel功能? [单选题] *A. 使用“排序”功能,先按部门排序,再按年龄排序B. 使用“查找重复项”功能C. 使用“高级筛选”功能,设置条件为“部门=市场部”和“年龄>30”(正确答案)D. 手动浏览表格,找到符合条件的员工3. 为了找出客户订单表中重复录入的订单号,你应该使用以下哪个Excel功能? [单选题] *A. “条件格式”中的“突出显示单元格规则”B. “查找和选择”中的“替换”C. “查找和选择”中的“定位条件”选择“重复项”(正确答案)D. “数据”选项卡中的“合并单元格”4. 你发现一个销售数据表中所有的“折扣”字段都错误地使用了“Discount”作为标题,你需要将所有单元格中的“Discount”替换为“折扣”,以下哪个操作是正确的? [单选题] *A. 使用“查找和选择”中的“查找”,然后逐个手动更改B. 使用“查找和选择”中的“替换”,查找“Discount”,替换为“折扣”(正确答案)C. 重新输入正确的标题“折扣”,然后复制粘贴到所有需要的单元格D. 使用“条件格式”标记出“Discount”,然后手动更改5. 在一个包含多个产品名称的Excel表格中,有些产品名称由于录入错误而重复出现了多次。
为了删除这些重复项,你应该使用以下哪个功能? [单选题] *A. “数据”选项卡中的“排序”和“筛选”B. “数据”选项卡中的“删除重复项”(正确答案)C. “查找和选择”中的“替换”D. “查找和选择”中的“转到特定条件”并删除6. 你想要对销售数据表按“产品类别”进行汇总,计算每个类别的总销售额,应该使用以下哪个Excel功能? [单选题] *A. 分类汇总(正确答案)B. 高级筛选C. 数据透视表D. VLOOKUP函数7. 如果你需要快速查看特定地区的销售数据,而不希望看到其他地区的数据,你应该使用以下哪个功能? [单选题] *A. 分类汇总B. 筛选功能(正确答案)C. 高级筛选D. 数据透视表8. 当你在Excel中滚动数据时,想要保持表头始终可见,以便清楚地看到每列代表的数据,你应该使用以下哪个功能? [单选题] *A. 视图冻结窗口(正确答案)B. 条件格式C. 名称管理器D. VLOOKUP函数9. 在Excel中,如果你经常需要引用某些特定的单元格范围,并且想要给这个范围一个更易记的名字,你应该使用以下哪个功能? [单选题] *A. 名称管理器(正确答案)B. 条件格式C. VLOOKUP函数D. 数据透视表10. 假设你有一个包含员工信息的表格,需要根据员工的工号查找其对应的部门名称,你应该使用以下哪个函数? [单选题] *A. SUM函数B. VLOOKUP函数(正确答案)C. INDEX-MATCH函数组合D. AVERAGE函数11. 如果你需要根据单元格中的数据自动改变单元格的格式,比如将销售额超过平均值的单元格背景设为黄色,你应该使用以下哪个功能? [单选题] *A. 条件格式(正确答案)B. 格式刷C. 单元格样式D. 排序12. 当你在编辑一个较长的单元格数据时,为了换行而又不实际输入换行符,你可以使用以下哪个快捷键? [单选题] *A. Alt+Enter(正确答案)B. Ctrl+EnterC. Shift+EnterD. Tab。
数据分析及应用试题库与答案
![数据分析及应用试题库与答案](https://img.taocdn.com/s3/m/01b6bcac710abb68a98271fe910ef12d2bf9a954.png)
数据分析及应用试题库与答案一、单选题(共30题,每题1分,共30分)1、python源程序执行的方式A、A 编译执行B、B 解析执行C、C 直接执行D、D 边编译边执行正确答案:B2、实现最长公共子序列利用的算法是()A、A 分治策略B、B 动态规划法C、C 贪心法D、D 回溯法正确答案:B3、以下哪些选项为真?A、A O(log(n))B、B O(n)C、C O(nlog(n))D、D O(n^2)正确答案:B4、for i in range(10,-1,)循环如果自然结束将执行循环内语句(?)次。
A、A 10B、B 9C、C 1D、D 0正确答案:D5、在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是______。
A、A 可行性分析B、B 需求分析C、C 详细设计D、D 程序编码正确答案:B6、已知df为DataFrame对象,提取Pulse列中值大于100并且Calories列中值小于400的行,代码是:()A、A print(df[df( Calories )>300] & (df[ Calories ]B、B print(df[(df[ Pulse ]>100) &&(df[ Calories ]C、C print(df[(df[ Pulse ]>100) and (df[ Calories ]D、D print(df[(df[ Pulse ]>100) &(df[ Calories ]正确答案:D7、pow(2,2,3)返回值为()。
A、A 64B、B 64.0C、C 1D、D 1.0正确答案:C8、下列哪种说法是错误的A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A9、时间复杂度不受数据初始状态影响而恒为的是()。
数据分析精选专项试题(50题)
![数据分析精选专项试题(50题)](https://img.taocdn.com/s3/m/06fb438651e79b89680226a9.png)
数据分析精选测试试题(50题)1、某商场对今年端午节这天销售A 、B 、C 三种品牌粽子的情况进行了统计,绘制如图6和图7所示的统计图.根据图中信息解答下列问题:写出A 品牌粽子在图7中所对应的圆心角的度数.2、甲学完统计知识后,随机调查了她所在辖区若干名居民的年龄,将调查数据绘制成如下扇形和条形统计图:请根据以上不完整的统计图提供的信息,解答下列问题:(1)甲同学共调查了 名居民的年龄,扇形统计图中a = ,b = ;(2)若该辖区年龄在0~14岁的居民约有3500人,请估计年龄在15~59岁的居民的人数.3、为了了解学生课业负担情况,某初中在本校随机抽取50名学生进行问卷调查,发现被抽查的学生中,每天完成课外作业时间,最长不足120分钟,没有低于40分钟的,并将抽查结果绘制成了一个不完整的频数分布直方图,如图10所示若该校共有1200名学生,请估计该校大约有__________名学生每天完成课外作业时间在80分钟以上(包括80分钟)图 7图 60~14 15~40 41~59 60岁以上 年龄(每组数据含最低值,不含最高值) 时间(分钟)4、为了解某校九年级学生体育测试成绩情况,现从中随机抽取部分学生的体育成绩统计如下,其中右侧扇形统计图中的圆心角 为36.体育成绩统计图已知该校九年级共有500名学生,如果体育成绩达28分以上(含28分)为优秀,请估计该校九年级学生体育成绩达到优秀的总人数. 5、为了解九年级学生每周的课外阅读情况,某校语文组调查了该校九年级部分学生某周的课外阅读量(精确到千字),将调查数据经过统计整理后,得到如下频数分布直方图,回答下列问题: (1)填空:①该校语文组调查了 名学生的课外阅读量;②左边第一组的频数= ,频率= 。
(2)求阅读量在14千字及以上的人数。
(3)估计被调查学生在这一周的平均阅读量(精确到千字)。
6.为了解某品牌A ,B 两种型号冰箱的销售状况,王明对其专卖店开业以来连续七个月的销售情况进行了7.某校九年级一班的暑假活动安排中,有一项是小制作评比.作品上交时限为8月1日至30日,班委会把同学们交来的作品按时间顺序每5天组成一组,对每一组的件数进行统计,绘制成如图所示的统计图.已知从左到右各矩形的高度比为2:3:4:6:4:1.第三组的频数是12.请回答:(1)本次活动共有 件作品参赛; (2)上交作品最多的组有作品 件;(3)经评比,第四组和第六组分别有10件和2件作品获奖,那么你认为这两组中哪个组获奖率较高?为什么?(4)对参赛的每一件作品进行编号并制作成背面完全一致的卡片,背面朝上的放置,随机抽出一张卡片,抽到第四组作品的概率是多少?8.为保护环境,节约资源,从今年6月1日起国家禁止超市、商场、药店为顾客提供免费塑料袋,为解决顾客购物包装问题,心连心超市提供了A .自带购物袋;B .租借购物篮;C .购买环保袋;D .徒手携带,四种方式供顾客选择.该超市把6月1日、2日两天的统计结果绘成如下的统计图和6月1日的扇形统计图,请你根据图形解答下列问题: (1)请将6月1日的扇形统计图补充完整.(2)根据统计图求6月1日在该超市购物总人次和6月1日自带购物袋的人次.9.某县七年级有15000名学生参加安全应急预案知识竞赛活动,为了了解本次知识竞赛的成绩分布情况,从中抽取了400名学生的得分(得分取正整数,满分100分)进行统计:根据不完整的频率分布表. 解答下列问题:若将得分转化为等级,规定得分低于59.5分评为“D ”,59.5~69.5分评为“C ”,69.5~89.5分评为“B ”,89.5~100.5分评为“A ”,这次15000名学生中约有多少人评为“D ”?如果随机抽取一名参赛学生的成绩等级,则这名学生的成绩评为“A ”、“B ”、“C ”、“D ”哪一个等级的可能性大?请说明理由.成绩(分)49.5 59.5 79.510.某市体委为了解市民参加体育锻炼的情况,采取随机抽样方法抽查了部分市民每天参加体育锻炼的情况,分成A B C ,,三类进行统计:A .每天锻炼2小时以上;B .每天锻炼1~2小时(包括1小时和2小时);C .每天锻炼1小时以下.图一、图二是根据调查结果绘制的两幅不完整的统计图,请根据统计图提供的信息,答下列问题: (1)这次抽查中,一共抽查了多少名市民? (2)求“类型A ”在扇形图中所占的圆心角.11. 某校300名优秀学生,中考数学得分范围是70—119(得分都是整数),为了解该校这300名学生的中考数学成绩,从中抽查了一部分学生的数学分数,通过数据处理,得到如下频率分布表和频率分布直方图.请你根据给出的图标解答:(1)填写频率分布表中未完成部分的数据; (2)指出在这个问题中的总体和样本容量;(3)求出在频率分布直方图中直角梯形ABCD 的面积;12.某百货商场经理对新进某一品牌几种号码的男式跑步鞋的销售情况进行了一周的统计,得到一组数据后,绘制了频数(双)频率统计表与频数分布直方图如下:请你根据图表中提供的信息,解答以下问题: (1)写出表中a b c ,,的值;B50%C 15% A39 40 41 42 43 44 号(2)根据市场实际情况,该商场计划再进1000双这种跑步鞋,请你帮助商场经理估计一下需要进多少双41号的跑步鞋?13.为了增强环境保护意识,6月5日“世界环境日”当天,在环保局工作人员指导下,若干名“环保小卫士”组成的“控制噪声污染”课题学习研究小组,抽样调查了全市40个噪声测量点在某时刻的噪声声级(单位:dB ),将调查的数据进行处理(设所测数据是正整数),得频数分布表如下:根据表中提供的信息解答下列问题:(1)频数分布表中的a =________,b =________,c =_________;(2)如果全市共有200个测量点,那么在这一时刻噪声声级小于75dB 的测量点约有多少个?14.某校从14000名学生中随机抽取了200名学生就安全知识的了解情况进行问卷调查,然后按“很好”、“较好”、“一般”、“较差”四类汇总分析,并绘制了扇形统计图(如图)。
数据分析与应用试题(附参考答案)
![数据分析与应用试题(附参考答案)](https://img.taocdn.com/s3/m/8a5970290a1c59eef8c75fbfc77da26925c596ee.png)
数据分析与应用试题(附参考答案)一、单选题(共60题,每题1分,共60分)1、()是对商品为店铺销售或利润贡献能力的衡量,主要指标包括客单价、毛利率、成本费用利润率等。
A、商品获客能力B、商品盈利能力C、商品运营能力D、商品研发能力正确答案:B2、数据采集遵循的原则不包括()oA、最大数据原则B、数据安全原则C、目的限制原则D、D.合法、公开原则正确答案:A3、EXCE1描述统计结果中,不包括()指标。
A、峰度、偏度B、平均数、标准差C、加权算术平均数D、最大值、最小值正确答案:C4、下列方法中,不是数据规范化方法的是()oA、最大-最小规范化B、零-均值规范化C、平均值规范化D、小数定标规范化正确答案:C5、在网店内的客户交易订单详情表中,以下字段中可作为度量使用的字段是()oA、商品类别B、购买数量C、省份D、客户名称正确答案:D6、以下内容中,不可衡量产品竞争能力的是()。
A、成本优势B、质量优势C、管理人员创新能力D、技术优势正确答案:C7、迷你图与正常的图表功能相似,下列说法正确的是()oA、迷你图可以设置数据标记B、迷你图可以设置图例C、迷你图也有坐标轴D、迷你图占用空间小正确答案:D8、某食品网店3天的成交总额为12880元,这3天的成交商品数量分别为256、468、320件,其件单价为()。
A、17.5B、12.3C、15D、18正确答案:B9、系列关于数据分析流程的说法,错误的是()oA、需求分析是数据分析最重要的一部分B、模型评价能够评价模型的优劣C、分析与建模时只能够使用数值型数据D、数据预处理是能够数据建模的前提正确答案:C10、完成数据采集后对数据进行复查或计算,将其和历史数据进行比较。
同时还要检查字段的完整性,保证核心指标数据完整,属于()检查。
A、完整性检查B、B、准确性检查C、规范性检查D、D、以上都不是正确答案:AIK以下指标中,可以实时反映出账户的竞争力的是()oA、展现量B、点击率C、留存量D、转化率正确答案:A12、从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()oA、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A13、以下关于数据可视化说法错误的是()oA、数据可视化能够化繁为简,增加信息可读性和趣味性B、战略地图是对企业战略要素及其之间因果关系的可视化表示方法C、数据可视化是指通过图形、动画等更加形象、清晰的方法对数据大小进行体现,同时阐释数据间的关系和趋势,使数据分析后得出的结果更加容易使用和理解D、数据可视化由于要实现其功能用途,因此会令人感到枯燥乏味正确答案:D14、以下关于平均数的说法错误的是()oA、平均数一般是指算术平均数B、平均数是非常重要的基础性指标C、能代表总体的一般水平D、体现了总体内各单位的差异正确答案:D15、网站流量数据分析方法有数据清洗、数据提取、数据转化和()oA、数据计算B、数据核对C、数据检查D、数据评估正确答案:A16、从竞争对手分析的角度来看,不包括哪个步骤()oA、从网店整体情况分析B、不需要从评论分析C、从商品信息分析D、从详情页分析正确答案:B17、()是指通过统计、数学或计算的方法对现象进行系统的实证研究。
数据分析及应用试题库及答案
![数据分析及应用试题库及答案](https://img.taocdn.com/s3/m/d5b20d5a6fdb6f1aff00bed5b9f3f90f76c64d99.png)
数据分析及应用试题库及答案一、单选题(共40题,每题1分,共40分)1、Matplotlib中的绘制散点图scatter()方法,表示点的透明度的参数是()A、A markerB、B sC、C cD、D alpha正确答案:D2、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C3、求解斐波那契数列第n项的算法最小的时间复杂度为()。
A、A O(N!)B、B O(N^N)C、C O(N)D、D O(LogN)正确答案:D4、神经网络模型训练时,依赖于以下哪一种法则进行参数计算?A、A 最大值法则B、B 最小值法则C、C 链式求导法则D、D 平均求导法则正确答案:C5、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D6、一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。
则年级属性的众数是: ()A、A 一年级B、B 二年级C、C 三年级D、D 四年级正确答案:A7、直接插入排序在最好情况下的时间复杂度为A、A 问题规模是n2B、B 执⾏时间等于n2C、C 执⾏时间与n2成正⾏D、D 问题规模与n2成正⾏正确答案:C8、Python文件的后缀名是()。
A、A .docB、B .vbpC、C .pyD、D .exe正确答案:C9、软件按功能可以分为应用软件、系统软件和支撑软件(或工具软件)。
下面属于应用软件的是______。
A、A 学生成绩管理系统B、B C语言编译程序C、C UNIX操作系统D、D 数据库管理系统正确答案:A10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?A、A 0.9991B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、设某汽车站在某一时间区间内的候车人数服从参数为5的泊松分布,候车人数多于10人的概率A、A 0.2B、B 0.05C、C 0.013695D、D 0.28正确答案:C12、循环队列的存储空间为Q(1:100),初始状态为front=rear=100。
数据分析技术试题库与参考答案
![数据分析技术试题库与参考答案](https://img.taocdn.com/s3/m/ad664b00842458fb770bf78a6529647d26283450.png)
数据分析技术试题库与参考答案一、单选题(共50题,每题1分,共50分)1、请阅读下面一段程序: roll_window = ser_obj.rolling(window=10) 有关上述程序,下面描述错误的是()。
A、窗口的标签为非居中B、窗口的大小为10C、roll_window是一个Period类对象D、默认对一列的数据进行计算正确答案:C2、关于数据重塑的说法中,下列选项描述错误的是()。
A、数据重塑可以将DataFrame转换为SeriesB、stack()方法可以将列索引转换为行索引C、对一个DataFrame使用stack()方法后返回的一定是一个SeriesD、unstack()方法可以将行索引转换为列索引正确答案:C3、当使用resample()方法重新采样时,下列哪个参数可以确定采样的闭合区间?()A、closedB、howC、labelD、fill_method正确答案:A4、关于Series结构,下列描述正确的是()。
A、Series是一个类似于二维数组的对象B、Series由一组数据和与之相关的索引两部分构成C、Series只能保存整数和字符串类型的数据D、Series的索引默认是从1开始正确答案:B5、下列图表中,适用于比较跨类别数据的是()。
A、饼图B、直方图C、散点图D、折线图正确答案:C6、下列pyplot模块的函数中,可以绘制散点图的是()。
A、scatter()B、bar()C、pie()D、hist()正确答案:A7、下列函数中,用于计算整数的绝对值的是()。
A、square()B、sqrt()C、abs()D、floor()E、Abstract正确答案:C8、下列选项中,不属于groupby()方法分组方式的是()。
A、列表或数组B、DataFrame中某列的名称C、字典或SeriesD、集合正确答案:D9、关于agg()方法的使用中,下列描述错误的是()。
数据分析与统计考试试题
![数据分析与统计考试试题](https://img.taocdn.com/s3/m/5d8b80a488eb172ded630b1c59eef8c75ebf9554.png)
数据分析与统计考试试题一、选择题(每题 3 分,共 30 分)1、下列属于描述数据集中趋势的统计量是()A 方差B 标准差C 中位数D 极差2、在一组数据中,如果最大值与最小值的差是 25,组距为 5,那么这组数据应分为()组。
A 4B 5C 6D 73、为了了解某校八年级学生的体重情况,从中抽取了 80 名学生的体重进行统计分析。
在这个问题中,样本是()A 80B 80 名学生C 80 名学生的体重D 该校八年级学生的体重4、对于数据 3,3,2,3,6,3,10,3,6,3,2。
①这组数据的众数是 3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等。
其中正确的结论有()A 1 个B 2 个C 3 个D 4 个5、已知一组数据:12,5,9,5,14,下列说法不正确的是()A 平均数是 9B 中位数是 9C 众数是 5D 极差是 56、某班有 48 人,在一次数学测验中,全班平均分为 81 分,已知不及格人数为 6 人,他们的平均分为 46 分,则及格学生的平均分是()A 78 分B 80 分C 82 分D 86 分7、甲、乙、丙、丁四人进行射击测试,每人 10 次射击成绩的平均数均是 92 环,方差分别为,,,,则成绩最稳定的是()A 甲B 乙C 丙D 丁8、一个容量为 80 的样本最大值为 143,最小值为 50,取组距为10,则可以分成()A 10 组B 9 组C 8 组D 7 组9、为了考察某种小麦的长势,从中抽取了 10 株麦苗,测得苗高(单位:cm)为:16,9,14,11,12,10,16,8,17,19。
则这组数据的中位数和极差分别是()A 13,11B 14,11C 12,11D 13,1610、对某班 60 名同学的一次数学测验成绩进行统计,如果 805~905 分这一组的频数是 18,那么这个班的学生这次数学测验成绩在805~905 分之间的频率是()A 18B 04C 03D 035二、填空题(每题 3 分,共 30 分)1、一组数据 2,4,6,a,8 的平均数是 5,则 a =。
数据分析经典测试题含答案
![数据分析经典测试题含答案](https://img.taocdn.com/s3/m/3d64658fa300a6c30c229f9a.png)
数据分析经典测试题含答案一、选择题1.样本数据3,a,4,b,8的平均数是5,众数是3,则这组数据的中位数是()A.2 B.3 C.4 D.8【答案】C【解析】【分析】先根据平均数为5得出a b10+=,由众数是3知a、b中一个数据为3、另一个数据为7,再根据中位数的定义求解可得.【详解】解:数据3,a,4,b,8的平均数是5,3a4b825∴++++=,即a b10+=,又众数是3,a∴、b中一个数据为3、另一个数据为7,则数据从小到大为3、3、4、7、8,∴这组数据的中位数为4,故选C.【点睛】此题考查了平均数、众数和中位数,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,众数是一组数据中出现次数最多的数.2.一组数据3、2、1、2、2的众数,中位数,方差分别是:()A.2,1,2 B.3,2,0.2 C.2,1,0.4 D.2,2,0.4【答案】D【解析】【分析】根据众数,中位数,方差的定义计算即可.【详解】将这组数据重新由小到大排列为:12223、、、、平均数为:1222325++++=2出现的次数最多,众数为:2中位数为:2方差为:()()()()()22222212222222320.45s-+-+-+-=+-=故选:D 【点睛】本题考查了确定数据众数,中位数,方差的能力,解题的关键是熟悉它们的定义和计算方法.3.某校组织“国学经典”诵读比赛,参赛10名选手的得分情况如表所示:分数/分80859095人数/人3421那么,这10名选手得分的中位数和众数分别是()A.85.5和80 B.85.5和85 C.85和82.5 D.85和85【答案】D【解析】【分析】众数是一组数据中出现次数最多的数据,注意众数可以不只一个;找中位数要把数据按从小到大的顺序排列,位于最中间的一个数(或两个数的平均数)为中位数.【详解】数据85出现了4次,最多,故为众数;按大小排列第5和第6个数均是85,所以中位数是85.故选:D.【点睛】本题主要考查了确定一组数据的中位数和众数的能力.一些学生往往对这个概念掌握不清楚,计算方法不明确而误选其它选项.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个则找中间两位数的平均数.4.多多班长统计去年1~8月“书香校园”活动中全班同学的课外阅读数量(单位:本),绘制了如图折线统计图,下列说法正确的是()A.极差是47 B.众数是42C.中位数是58 D.每月阅读数量超过40的有4个月【答案】C【解析】【分析】根据统计图可得出最大值和最小值,即可求得极差;出现次数最多的数据是众数;将这8个数按大小顺序排列,中间两个数的平均数为中位数;每月阅读数量超过40的有2、3、4、5、7、8,共六个月.【详解】A、极差为:83-28=55,故本选项错误;B、∵58出现的次数最多,是2次,∴众数为:58,故本选项错误;C、中位数为:(58+58)÷2=58,故本选项正确;D、每月阅读数量超过40本的有2月、3月、4月、5月、7月、8月,共六个月,故本选项错误;故选C.5.某单位招考技术人员,考试分笔试和面试两部分,笔试成绩与面试成绩按6:4记入总成绩,若小李笔试成绩为80分,面试成绩为90分,则他的总成绩为()A.84分B.85分C.86分D.87分【答案】A【解析】【分析】按照笔试与面试所占比例求出总成绩即可.【详解】根据题意,按照笔试与面试所占比例求出总成绩:64⨯+⨯=(分)8090841010故选A【点睛】本题主要考查了加权平均数的计算,解题关键是正确理解题目含义.6.2022年将在北京﹣﹣张家口举办冬季奥运会,很多学校为此开设了相关的课程,下表记录了某校4名同学短道速滑成绩的平均数x和方差S2,根据表中数据,要选一名成绩好又发挥稳定的运动员参加比赛,应选择()A .队员1B .队员2C .队员3D .队员4【答案】B 【解析】 【分析】根据方差的意义先比较出4名同学短道速滑成绩的稳定性,再根据平均数的意义即可求出答案. 【详解】解:因为队员1和2的方差最小,所以这俩人的成绩较稳定, 但队员2平均数最小,所以成绩好,即队员2成绩好又发挥稳定. 故选B . 【点睛】本题考查方差的意义.方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.7.某校九年级模拟考试中,1班的六名学生的数学成绩如下:96,108,102,110,108,82.下列关于这组数据的描述不正确的是( ) A .众数是108 B .中位数是105 C .平均数是101 D .方差是93【答案】D 【解析】 【分析】把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110,求出众数、中位数、平均数和方差,即可得出结论. 【详解】解:把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110, ∴众数是108,中位数为1021081052+=,平均数为82961021081081101016+++++=,方差为()()()()()()222222182101961011021011081011081011101016⎡⎤-+-+-+-+-+-⎣⎦ 94.393≈≠;故选:D . 【点睛】考核知识点:众数、中位数、平均数和方差;理解定义,记住公式是关键.8.某班40名同学一周参加体育锻炼时间统计如表所示:那么该班40名同学一周参加体育锻炼时间的众数、中位数分别是()A.17,8.5 B.17,9 C.8,9 D.8,8.5【答案】D【解析】【分析】根据中位数、众数的概念分别求得这组数据的中位数、众数.【详解】解:众数是一组数据中出现次数最多的数,即8;由统计表可知,处于20,21两个数的平均数就是中位数,∴这组数据的中位数为898.5 2+=;故选:D.【点睛】考查了中位数、众数的概念.本题为统计题,考查众数与中位数的意义,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.9.一组数据5,4,2,5,6的中位数是()A.5 B.4 C.2 D.6【答案】A【解析】试题分析:将题目中数据按照从小到大排列是: 2,4,5,5,6,故这组数据的中位数是5,故选A.考点:中位数;统计与概率.10.某鞋店一天中卖出运动鞋11双,其中各种尺码的鞋的销售量如下表:则这11双鞋的尺码组成的一组数据中,众数和中位数分别是( ) A .25,25 B .24.5,25C .25,24.5D .24.5,24.5【答案】A 【解析】 【分析】 【详解】解:从小到大排列此数据为:23.5、24、24、24.5、24.5、25、25、25、25、25、26, 数据25出现了五次最多为众数.25处在第6位为中位数.所以中位数是25,众数是25. 故选:A .11.为了迎接2022年的冬奥会,中小学都积极开展冰上运动,小乙和小丁进行500米短道速滑比赛,他们的五次成绩(单位:秒)如表所示:设两人的五次成绩的平均数依次为x 乙,x 丁,成绩的方差一次为2S 乙,2S 丁,则下列判断中正确的是( )A .x x =乙丁,22S S <乙丁B .x x =乙丁,22S S >乙丁 C .x x >乙丁,22S S >乙丁D .x x <乙丁,22S S <乙丁【答案】B 【解析】 【分析】根据平均数的计算公式先求出甲和乙的平均数,再根据方差的意义即可得出答案. 【详解】4563555260555x ++++==乙,则()()()()()2222221455563555555525560555S ⎡⎤=⨯-+-+-+-+-⎣⎦乙39.6=,5153585657555x ++++==丁,则()()()()()2222221515553555855565557555S ⎡⎤=⨯-+-+-+-+-⎣⎦丁 6.8=,所以x x =乙丁,22S S >乙丁,故选B . 【点睛】本题考查方差的定义与意义:一般地设n 个数据,1x ,2x ,…n x 的平均数为x ,则方差()()()2222121n S x x x x x x n ⎡⎤=-+-+⋅⋅⋅+-⎢⎥⎣⎦,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.12.在5轮“中国汉字听写大赛”选拔赛中,甲、乙两位同学的平均分都是90分,甲的成绩方差是15,乙的成绩的方差是3,下列说法正确的是( ) A .甲的成绩比乙的成绩稳定 B .乙的成绩比甲的成绩稳定 C .甲、乙两人的成绩一样稳定 D .无法确定甲、乙的成绩谁更稳定【答案】B 【解析】 【分析】根据方差的意义求解可得. 【详解】∵乙的成绩方差<甲成绩的方差, ∴乙的成绩比甲的成绩稳定, 故选B. 【点睛】本题主要考查方差,方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.13.已知一组数据2a -,42a +,6,83a -,9,其中a 为任意实数,若增加一个数据5,则该组数据的方差一定() A .减小 B .不变C .增大D .不确定【答案】A 【解析】 【分析】先把原来数据的平均数算出来,再把方差算出来,接着把增加数据5以后的平均数算出来,从而可以算出方差,再把两数进行比较可得到答案. 【详解】解:原来数据的平均数=242683925555a a a -++++-+==,原来数据的方差=222222(25)(45)(265)(835)(95)5a a a S --+-++-+--+-=,增加数据5后的平均数=2426839530565a a a -++++-++==(平均数没变化),增加数据5后的方差=22222221(25)(45)(265)(835)(95)(55)6a a a S --+-++-+--+-+-=, 比较2S ,21S 发现两式子分子相同,因此2S >21S (两个正数分子相同,分母大的反而小), 故答案为A. 【点睛】本题主要考查了方差的基本概念,熟记方差的公式是解本题的关键,要比较增加数据后的方差的变化,可分别求出原来的方差和改变数据后的方差,再进行比较.14.郑州某中学在备考2018河南中考体育的过程中抽取该校九年级20名男生进行立定跳远测试,以便知道下一阶段的体育训练,成绩如下所示:则下列叙述正确的是( ) A .这些运动员成绩的众数是 5 B .这些运动员成绩的中位数是 2.30 C .这些运动员的平均成绩是 2.25 D .这些运动员成绩的方差是 0.0725 【答案】B 【解析】 【分析】根据方差、平均数、中位数和众数的计算公式和定义分别对每一项进行分析,即可得出答案. 【详解】由表格中数据可得:A 、这些运动员成绩的众数是2.35,错误;B 、这些运动员成绩的中位数是2.30,正确;C 、这些运动员的平均成绩是 2.30,错误;D 、这些运动员成绩的方差不是0.0725,错误; 故选B . 【点睛】考查了方差、平均数、中位数和众数,熟练掌握定义和计算公式是本题的关键,平均数平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.15.5、2.4、2.4、2.4、2.3的中位数是2.4,选项C不符合题意.15×[(2.3﹣2.4)2+(2.4﹣2.4)2+(2.5﹣2.4)2+(2.4﹣2.4)2+(2.4﹣2.4)2]=15×(0.01+0+0.01+0+0)=15×0.02=0.004∴这组数据的方差是0.004,∴选项D不符合题意.故选B.【点睛】此题主要考查了中位数、众数、算术平均数、方差的含义和求法,要熟练掌握.16.甲、乙两班举行电脑汉字输入比赛,参赛学生每分输入汉字的个数统计结果如下表:某同学分析上表后得到如下结论:①甲、乙两班学生平均成绩相同;②乙班优秀的人数多于甲班优秀的人数(每分输入汉字个数150为优秀)③甲班成绩的波动比乙班大.上述结论中正确的是()A.①②③B.①②C.①③D.②③【答案】A【解析】【分析】平均水平的判断主要分析平均数;优秀人数的判断从中位数不同可以得到;波动大小比较方差的大小.【详解】从表中可知,平均字数都是135,①正确;甲班的中位数是149,乙班的中位数是151,比甲的多,而平均数都要为135,说明乙的优秀人数多于甲班的,②正确;甲班的方差大于乙班的,又说明甲班的波动情况大,所以③也正确.①②③都正确.故选:A.【点睛】此题考查平均数,中位数,方差的意义.解题关键在于掌握平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.17.数据2、5、6、0、6、1、8的中位数是()A.8 B.6 C.5 D.0【答案】C【解析】【分析】将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.【详解】将数据从小到大排列为:0,1,2,5,6,6,8∵这组数据的个数是奇数∴最中间的那个数是中位数即中位数为5故选C.【点睛】此题考查了平均数与中位数的意义,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.18.在光明中学组织的全校师生迎“五四”诗词大赛中,来自不同年级的25名参赛同学的得分情况如图所示.这些成绩的中位数和众数分别是()A.96分,98分B.97分,98分C.98分,96分D.97分,96分【答案】A【解析】【分析】利用众数和中位数的定义求解.【详解】98出现了9次,出现次数最多,所以数据的众数为98分;共有25个数,最中间的数为第13个数,是96,所以数据的中位数为96分.故选A.【点睛】本题考查了众数:一组数据中出现次数最多的数据叫做众数.也考查了中位数.19.有一组数据如下:3,a,4,6,7,它们的平均数是5,那么这组数据的方差是()A.10 B C D.2【答案】D【解析】【分析】【详解】∵3、a、4、6、7,它们的平均数是5,∴15(3+a+4+6+7)=5,解得,a=5S2=15[(3-5)2+(5-5)2+(4-5)2+(6-5)2+(7-5)2]=2,故选D.20.分析题中数据,将15名运动员的成绩按从小到大的顺序依次排列,处在中间位置的一个数即为运动员跳高成绩的中位数;。
数据分析本科试题及答案
![数据分析本科试题及答案](https://img.taocdn.com/s3/m/91f362bfac51f01dc281e53a580216fc700a53aa.png)
数据分析本科试题及答案一、单项选择题(每题2分,共20分)1. 数据分析中,用于描述数据集中趋势的统计量是()。
A. 方差B. 标准差C. 平均值D. 极差答案:C2. 以下哪个选项不是数据清洗的目的()。
A. 去除重复数据B. 纠正错误数据C. 增加数据量D. 识别并处理缺失值答案:C3. 在数据分析中,相关系数的取值范围是()。
A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A4. 以下哪个算法不是监督学习算法()。
A. 决策树B. 支持向量机C. K-均值聚类D. 逻辑回归答案:C5. 数据可视化中,用于展示数据分布情况的图表是()。
A. 散点图B. 折线图C. 柱状图D. 直方图答案:D6. 以下哪个选项是时间序列分析中常用的模型()。
A. 线性回归模型B. 逻辑回归模型C. ARIMA模型D. 神经网络模型答案:C7. 在数据分析中,用于识别异常值的方法是()。
A. 箱线图B. 相关系数C. 回归分析D. 聚类分析答案:A8. 以下哪个选项是描述性统计分析的内容()。
A. 预测未来趋势B. 识别数据模式C. 建立因果关系D. 计算数据的平均值答案:D9. 在数据分析中,用于评估分类模型性能的指标是()。
A. 均方误差B. 精确率C. 召回率D. 以上都是答案:D10. 以下哪个选项不是数据预处理的步骤()。
A. 数据清洗B. 特征选择C. 数据转换D. 模型训练答案:D二、多项选择题(每题3分,共15分)11. 数据分析中,以下哪些是数据转换的常见方法()。
A. 归一化B. 标准化C. 离散化D. 数据清洗答案:ABC12. 在数据分析中,以下哪些是特征选择的目的()。
A. 提高模型的准确性B. 减少计算复杂度C. 降低模型过拟合的风险D. 增加数据量答案:ABC13. 以下哪些是数据可视化中常用的图表类型()。
A. 散点图B. 热力图C. 树状图D. 饼图答案:ABCD14. 在数据分析中,以下哪些是数据挖掘的常见任务()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、数据库知识单项选择题1. 数据库系统的核心是(B)A、数据模型B、数据库管理系统C、软件工具D、数据库2. 下列叙述中正确的是(C)。
A、数据库是一个独立的系统,不需要操作系统的支持B、数据库设计是指设计数据库管理系统C、数据库技术的根本目标是要解决数据共享的问题D、数据库系统中,数据的物理结构必须与逻辑结构一致3. 下列模式中,能够给出数据库物理存储结构与物理存取方法的是( A )。
A、内模式B、外模式C、概念模式D、逻辑模式4. SQL语句中修改表结构的命令是(C )。
A、MODIFY TABLEB、MODIFY STRUCTUREC、ALTER TABLED、ALTER STRUCTURE5. SELECT-SQL语句是(B ) 。
A、选择工作区语句B、数据查询语句C、选择标准语句D、数据修改语句6. SQL语言是( C )语言。
A、层次数据库B、网络数据库C、关系数据库D、非数据库7. 如果要创建一个数据组分组报表,第一个分组表达式是"部门",第二个分组表达式是"性别",第三个分组表达式是"基本工资",当前索引的索引表达式应当是( B )。
A、部门+性别+基本工资B、部门+性别+STR(基本工资)C、STR(基本工资)+性别+部门D、性别+部门+STR(基本工资)8. 数据库DB、数据库系统DBS、数据库管理系统DBMS三者之间的关系是( A )。
A、DBS包括DB和BMSB、DBMS包括DB和DBSC、DB包括DBS和DBMSD、DBS就是DB,也就是DBMS9. 下列有关数据库的描述,正确的是( C )。
A、数据库是一个DBF文件B、数据库是一个关系C、数据库是一个结构化的数据集合D、数据库是一组文件10. 下列说法中,不属于数据模型所描述的内容的是( C )。
A、数据结构B、数据操作C、数据查询D、数据约束11. 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为( C ) 。
A.数据定义功能 B.数据管理功能C.数据操纵功能 D.数据控制功能12. 数据库管理系统是( B ) 。
A.操作系统的一部分B.在操作系统支持下的系统软件C.一种编译程序D.一种操作系统13.数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( D )A.外模式 B.内模式 C.存储模式 D.模式14、数据库系统的数据独立性是指 ( B )。
A.不会因为数据的变化而影响应用程序B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序C.不会因为存储策略的变化而影响存储结构D.不会因为某些存储结构的变化而影响其他的存储结构15、能够统计表中记录行数的函数是( A )。
A.COUNTB.TO_NUMBERC.AVGD.SUBSTR第 16 到第 17 题基于这样的三个表即学生表 S 、课程表C 和学生选课表 SC ,它们的结构如下:S(S# ,SN ,SEX ,AGE ,DEPT)C(C# ,CN)SC(S# , C# ,GRADE)其中: S# 为学号, SN 为姓名,SEX 为性别,AGE 为年龄,DEPT 为系别,C# 为课程号,CN 为课程名,GRADE 为成绩。
16 .检索所有比“王华”年龄大的学生姓名、年龄和性别。
正确的 SELECT 语句是 ( A ) 。
A.Select SN,AGE,SEX from Swhere AGE > (Select AGE from S where SN= ‘王华’) B. Select SN,AGE,SEX from SWhere SN =‘王华’C. Select SN,AGE,SEX from SWhere AGE > (Select AGE where SN = ‘王华’ )D Where AGE = 王华. AGE17 .检索选修课程“ C2 ”的学生中成绩最高的学生的学号。
正确的 SELECT 语句是 (D ) 。
A.Select S# from SC where C# = ‘C2’and GRADE >= (select GRADE from SC where C# = ‘C2’)B. Select S# from SC where C# = ‘C2’And GRADE in (select GRADE from SC where C# = ‘C2’)C. Select S# from SC where C# = ‘C2’and GRADE not in (select GRADE from SC where C# = ‘C2’)D. Select S# from SC where C# = ‘C2’And GRADE >= All (select GRADE from SC where C# = ‘C2’)18、安装oracle数据库过程中SID指的是什么:( A )A.系统标识号B.数据库名C.用户名D.用户口令19、关闭数据库,那种是等待所有用户退出才关闭的。
( D )A.shutdown immediateB.shutdown abortC.shutdown transactionalD.shutdown normal20、在Oracle中,一个用户拥有的所有数据库对象统称为( B )A. 数据库B. 模式C. 表空间D. 实例多项选择题1、随着计算机应用在民用领域的推广以及计算机硬件、软件技术的迅速发展,数据管理技术不断发展,主要经历了(ABC)。
A.人工管理阶段B.文件系统阶段C.数据库系统阶段D.人工智能阶段1. 在SELECT语句中需要对分组情况应满足的条件进行判断时应使用(BD)。
A WHEREB GROUP BYC ORDER BYD HAVING2. 对于下列语句正确的描述是 (BC) 。
ATLER TABLE ProductAdd Year DATETIME DEFAULT ‘1985-01-01’A向Product表中增加一个名为“DATETIME”的属性B该属性有一个默认的值是“1985-01-01”C该属性的数据类型是日期时间型D该属性可以被指定为码3. 现有学生关系Student属性包括学号Sno姓名Sname所在系Sdept系主任姓名Mname课程名Cname和成绩Grade。
这些属性之间存在如下联系一个学号只对应一个学生一个学生只对应一个系一个系只对应一个系主任一个学生的一门课只对应一个成绩学生名可以重复系名不重复课程名不重复。
则以下不正确的函数依赖是(CD) 。
A Sno→SdeptB Sno→MnameC Sname→SdeptD Sname Cname→Grade5、下面关于数据库设计的说法中正确的有(AB )A信息需求表示一个组织所需要的数据及其结构B处理需求表示一个组织所需要经常进行的数据处理C信息需求表达了对数据库内容及结构的要求是动态需求D处理需求表达了基于数据库的数据处理要求是静态需求6、关系模型提供了几类完整性规则( ABC )A. 实体完整性规则B. 参照完整性规则C. 用户定义完整性规则D. 结构完整性规则7、Oracle内存结构可以分为( BC )A、备份区B、程序全局区C、系统全局区D、还原区E、调度区8、在oracle环境下,以下说法中正确的是:(ABC )A. <> 表示不等于B. _ 代表一个字符C. % 代表0个或者多个字符D. * 代表0个或者多个字符9、在下面有关子查询ANY运算符的描述中,哪一项是正确的?(BC )A、<any 表示小于最小值B、<any表示小于最大值C、>any表示大于最小值D、都不对10、表命名时需要遵循的规则中选择正确的是:(ABCD )A、表明的首字符应该为字母B、不能使用保留字C、可以使用下划线、数字、字母、但不能使用空格和单引号D、同一用户下表名不能重复判断题:1、oracle数据库系统中,启动数据库的第一步是启动一个数据库实例。
( T )2、Oracle服务器端的监听程序是驻留在服务器上的单独进程,专门负责响应客户机的连接请求。
( F)3、oracle数据库中实例和数据库是一一对应的(非ORACLE并行服务,非集群)。
(T)4、系统全局区SGA 是针对某一服务器进程而保留的内存区域,它是不可以共享的。
( F )5、表空间是oracle 最大的逻辑组成部分。
Oracle数据库由一个或多个表空间组成。
一个表空间由一个或多个数据文件组成,但一个数据文件只能属于一个表空间。
(T )6、表空间分为永久表空间和临时表空间两种类型。
(T )7、数据备份可以全库备份,也可以对单个表进行备份。
(T )8、信息是数据的符号表示,而数据是具有特定释义和意义的信息。
(F)9、数据模型是用来描述数据、组织数据和对数据进行操作的现实世界数据特征的抽象。
(T)10、实体完整性规则和参照完整性规则是关系模型必须满足的完整性约束条件。
(T)填空题:1、数据模型是由数据结构、数据操作和完整性约束三部分组成的。
2、数据结构是对数据系统的静态特性的描述,数据操作是对数据库系统的动态特性的描述。
3、数据库体系结构按照模式、外模式和内模式三级结构进行组织。
4、SQL是结构化查询语言。
5、视图是一个虚表,它是从一个或几个基本表中导出的表。
在数据库中,只存放视图的定义,不存放视图的视图对应的数据。
6、Oracle实例(Instance)是访问Oracle数据库所需的一部分计算机内存和辅助处理后台进程。
7、网络配置工具(ONCA)可以帮助用户配置网络的基本元素,包括命名方法、监听程序、本地网络服务名和目录服务。
8、数据库从存储结构上可以分为物理存储结构和逻辑存储结构。
9、表空间是oracle数据库中最大的逻辑存储单位,同时也是直接与数据库物理存储结构相关联的逻辑单位。
10、数据字典是oracle数据库的核心组件,它由一系列只读的数据字典表和数据字典视图组成。
简单题:1、视图和表的本质区别是什么?视图和表有本质的区别是:视图在数据库中存储的是视图的定义,而不是查询的数据。
当DBMS处理视图的操作时,它会在数据库中找到视图的定义,然后把对视图的查询转化为对基本表的查询。
2、DBMS一般具备哪些功能?(1)提供数据定义语言(Data Definition Language, DDL)进行数据库的定义和建立。
(2)提供数据操作语言(data manipulation language,DML)进行数据处理工作。
(3)维护数据库的运行,提供完整性、安全性和并发性方面的控制能力。
3、随着计算机应用在民用领域的推广以及计算机硬件、软件技术的迅速发展,数据管理技术不断发展,主要经历了人工管理、文件系统和数据库系统三个阶段,其中文件系统阶段具有哪些特点?(1)由于外部存储器的出现,数据可以长期保存,使得对它的重复使用变为可能。