考试模拟样题—数据分析算法与模型(附答案)
数据分析及应用模拟练习题
数据分析及应用模拟练习题一、单选题(共40题,每题1分,共40分)1、以下叙述中正确的是()。
A、A Python 3.x与Python 2.x兼容B、B Python语句只能以程序方式执行C、C Python是解释型语言D、D Python语言出现得晚,具有其他高级语言的一切优点正确答案:C2、记事件A:王工131600本周全程在湛江出差;事件B:王工131600周三在成都游玩。
如下描述准确的是(?)。
A、A 1B、B 11C、C 2D、D 12正确答案:C3、下面哪种不属于数据预处理的方法? ()A、A 变量代换B、B 离散化C、C 聚集D、D 估计遗漏值正确答案:D4、下面哪个不是Python合法的标识符A、A int32B、B 40XLC、C selfD、D __name__正确答案:B5、在长度为n的顺序表中查找一个元素,假设需要查找的元素有一半的机会在表中,并且如果元素在表中,则出现在表中每个位置上的可能性是相同的。
则在平均情况下需要比较的次数大约为______。
A、A 3n/4B、B nC、C n/2D、D n/4正确答案:A6、请找出数列11,18,38,83…的下一项()A、A 146B、B 168C、C 171D、D 203正确答案:C7、文件写操作时,writelines方法的参数不可以是( )A、A 列表B、B 元组C、C 字典D、D 整数正确答案:D8、程序测试的目的是______。
A、A 为被测程序设计正确的测试用例B、B 发现并改正程序中的错误C、C 发现程序中的错误D、D 改正程序中的错误正确答案:C9、设循环队列存储空间为Q(1:50)。
初始状态为front=rear=50。
经过一系列入队和退队操作后,front=14,rear=19,则该循环队列中的元素个数为______。
A、A 46B、B 45C、C 6D、D 5正确答案:D10、归并排序算法的时间复杂度是()。
大数据算法与模型考试 选择题 60题
1. 在大数据处理中,MapReduce是一种常用的计算模型,它主要由哪两个阶段组成?A. Map和FilterB. Reduce和SortC. Map和ReduceD. Filter和Reduce2. 下列哪个不是大数据的5V特征之一?A. VolumeB. VelocityC. VarietyD. Visibility3. 在数据挖掘中,K-means算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法4. 下列哪个工具不是用于大数据处理的?A. HadoopB. SparkC. ExcelD. Hive5. 在机器学习中,过拟合是指模型在训练数据上表现良好,但在新数据上表现不佳。
下列哪个方法可以减少过拟合?A. 增加数据量B. 减少特征数量C. 增加模型复杂度D. 减少训练次数6. 下列哪个算法是基于决策树的集成学习方法?A. K-NNB. Random ForestC. SVMD. Naive Bayes7. 在大数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Encode, Test, LoadC. Extract, Transfer, LinkD. Encode, Transform, Link8. 下列哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库9. 在数据预处理中,数据清洗的主要目的是什么?A. 增加数据量B. 减少数据量C. 提高数据质量D. 降低数据质量10. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means11. 在大数据环境中,HDFS是哪个框架的文件系统?A. HadoopB. SparkC. HiveD. MongoDB12. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析13. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 是否有标签数据B. 是否使用神经网络C. 是否使用决策树D. 是否使用回归分析14. 下列哪个算法是用于异常检测的?A. PCAB. SVMC. K-NND. DBSCAN15. 在大数据处理中,流处理与批处理的主要区别是什么?A. 数据处理的速度B. 数据处理的量C. 数据处理的类型D. 数据处理的频率16. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力17. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据18. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性19. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing20. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest21. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具22. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop23. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量24. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest25. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型26. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐27. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型28. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性29. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型30. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest31. 在大数据环境中,数据脱敏的主要目的是什么?A. 提高数据质量B. 保护数据隐私C. 增加数据量32. 下列哪个不是大数据分析的工具?A. RB. PythonC. JavaD. Excel33. 在机器学习中,交叉验证的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量34. 下列哪个算法是用于序列挖掘的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means35. 在大数据处理中,数据集成的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型36. 下列哪个不是大数据技术的应用场景?A. 智能推荐B. 风险管理C. 数据加密D. 预测分析37. 在数据挖掘中,频繁项集挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据38. 下列哪个不是数据仓库的设计原则?A. 面向主题B. 集成性C. 时变性D. 实时性39. 在大数据分析中,数据湖的主要优势是什么?A. 数据存储方式C. 数据分析工具D. 数据处理模型40. 下列哪个算法是用于社交网络分析的?A. PageRankB. K-meansC. SVMD. Random Forest41. 在大数据环境中,数据质量管理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型42. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析43. 在机器学习中,模型评估的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量44. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means45. 在大数据处理中,数据清洗的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型46. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力47. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据48. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性49. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing50. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest51. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具52. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop53. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量54. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest55. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型56. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐57. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型58. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性59. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型60. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest答案部分1. C2. D3. B4. C5. B6. B7. A9. C10. C11. A12. C13. A14. A15. D16. C17. A18. D19. A20. A21. A22. D23. C24. A25. A26. D27. A28. D29. A30. A31. B32. C33. A34. A35. A36. C37. A38. D39. A40. A41. A42. C43. A44. C45. A46. C47. A48. D49. A50. A51. A52. D53. C54. A55. A56. D57. A59. A60. A。
数据分析及应用模拟题含答案
数据分析及应用模拟题含答案一、单选题(共30题,每题1分,共30分)1、下列函数中,用于沿着轴方向堆叠Pandas对象的是A、A 五分之一B、B 六分之一C、C 七分之一D、D 七分之五正确答案:D2、Numpy.random模块中用于对一个序列进行随机排序的函数是()。
A、A uniformB、B shuffleC、C permutationD、D normal正确答案:B3、将一个从大到小的数组,用以下排序方法排序成从小到大的,()最快。
A、A 插入排序B、B 冒泡排序C、C 快速排序D、D 堆排序正确答案:D4、代码if ‘p’ in ‘pip python’: print(‘pip python’.replace(‘p’, ‘P’))的执行结果是()A、A PiP pythonB、B pip PythonC、C PiP PythonD、D Pip Python正确答案:C5、以下程序的不可能输出结果是:from random import * print(round(random(),2))A、A 0.47B、B 0.54C、C 0.27D、D 1.87正确答案:D6、人患癌症的概率为1/1000.假设有一台癌症诊断仪S1,通过对它以往的诊断记录的分析,如果患者确实患有癌症它的确诊率为90%,如果患者没有癌症,被诊断成癌症的概率是10%。
某人在被诊断为癌症后,他真正患癌症的概率为()A、A 9/1000B、B 1/1000C、C 1/112D、D 9/10正确答案:C7、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C8、matpltlib中绘制图形,可以通过传递参数设置当前绘图区的标题及位置。
若标题是s,以下设置绘图区标题写法对的是:()A、A plt.text(x,y, s")"B、B plt.title(x,y, s")"C、C plt.text(s",loc= center )"D、D plt.title(s",loc= center )"正确答案:D9、import pandas as pd df=pd.DataFrame({ a :list(""opq""),b :[3,2,1]},index=[ e , f , g ]) 以下说法错误的是: ()A、A df[0:1]返回第0行的数据B、B df[0:1]返回第0列的数据C、C df[0]会报错D、D df[ e ]会报错正确答案:B10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、python语言中""A、A 按位取反B、B 按位异或C、C 按位与D、D 左移一位正确答案:D12、在软件开发中,下面任务不属于设计阶段的是______。
(完整版)数学建模模拟试题及答案
数学建模模拟试题及答案一、填空题(每题 5 分,共 20 分)1.一个连通图能够一笔画出的充分必要条件是.2. 设银行的年利率为 0.2,则五年后的一百万元相当于现在的万元.3. 在夏季博览会上,商人预测每天冰淇淋销量N 将和下列因素有关:(1) 参加展览会的人数n; (2)气温T 超过10o C;(3)冰淇淋的售价p .由此建立的冰淇淋销量的比例模型应为 .4. 如图一是一个邮路,邮递员从邮局 A 出发走遍所有 A长方形街路后再返回邮局 .若每个小长方形街路的边长横向均为 1km,纵向均为 2km,则他至少要走 km .二、分析判断题(每题 10 分,共 20 分)1. 有一大堆油腻的盘子和一盆热的洗涤剂水。
为尽量图一多洗干净盘子,有哪些因素应予以考虑?试至少列出四种。
2. 某种疾病每年新发生 1000 例,患者中有一半当年可治愈 .若 2000 年底时有1200 个病人,到 2005 年将会出现什么结果?有人说,无论多少年过去,患者人数只是趋向 2000 人,但不会达到 2000 人,试判断这个说法的正确性 .三、计算题(每题 20 分,共 40 分)1. 某工厂计划用两种原材料A, B 生产甲、乙两种产品,两种原材料的最高供应量依次为 22 和 20 个单位;每单位产品甲需用两种原材料依次为 1 、1 个单位,产值为 3 (百元);乙的需要量依次为 3、1 个单位,产值为 9 (百元);又根据市场预测,产品乙的市场需求量最多为 6 个单位,而甲、乙两种产品的需求比不超过 5: 2,试建立线性规划模型以求一个生产方案,使得总产值达到最大,并由此回答:(1) 最优生产方案是否具有可选择余地?若有请至少给出两个,否则说明理由 .(2) 原材料的利用情况 .2. 两个水厂A1 , A2将自来水供应三个小区B1 , B2 , B3 , 每天各水厂的供应量与各小区的需求量以及各水厂调运到各小区的供水单价见下表 .试安排供水方案,使总供水费最小?四、 综合应用题(本题 20 分)某水库建有 10 个泄洪闸,现在水库的水位已经超过安全线,上游河水还在不断地流入 水库.为了防洪,须调节泄洪速度 .经测算,若打开一个泄洪闸, 30 个小时水位降至安全线, 若打开两个泄洪闸, 10 个小时水位降落至安全线 .现在,抗洪指挥部要求在 3 个小时内将水 位降至安全线以下,问至少要同时打开几个闸门?试组建数学模型给予解决 .注:本题要求按照五步建模法给出全过程 .小区 单价/元水厂A1A供应量 / t170B34B11 07 1B26数学建模 06 春试题模拟试题参考解答一、填空题(每题 5 分,共 20 分)1. 奇数顶点个数是 0 或 2;2. 约 40.1876 ;3. N = Kn(T10) / p, (T > 10 0 C), K 是比例常数; 4. 42.二、分析判断题(每题 10 分,共 20 分)1. 解: 问题与盘子、水和温度等因素直接相关,故有相关因素:盘子的油腻程度,盘子的温度,盘子的尺寸大小;洗涤剂水的温度、浓度; 刷洗地点 的温度等.注:列出的因素不足四个,每缺一个扣 2.5 分。
数据分析算法与模型模拟题(附答案)
、计算题(共4题,10。
分)K通过分析关于二手车的相关变量,研究这些变量怎么影响二手车的交易价格。
吐手车抽样-预处理.CSV收集的数据包含:对数据进行预处理,分析应采用的模型,写出详细的思路和数据分析过程,用多种方法检验和解释模型,说明模型的实际意义。
答案解析:因变量采用车•辆报价数据,白变量选择除车辆报价数据之外的其他变最,进行线性回归分析可以看到删除了三个变呈,R方和调整R方都接近1,模型拟合度很好。
由于自变量中真皮座椅、外观缺陷、车身类型未通过t检验,因此需要将这三个变最删除后再做线性回归分析,可得:Y二I. 1036-0. 0646ShangPaiShijian-0. 10641iCheng-0. 4235biansu+0. 8482z houju-1.0036Pa i I i ang+0. 0154ma I i -0. 1729t i anchuang I +0. 75811 i anChllan2+0. 3974daochey i ngx i ang-0.5061GPS-0. 2864WaigUan_XiUfU+0. 5156yuanjia+0. 166 5paifang^0. 0199ChangShang模型拟合效果很好,且通过了F检验和t检验,(常数项的t检验可以不通过)可以根据此模型对二手车进行价格评估2、利用APriori算法,写出下列购物篮数据的频繁项集和强关联规则(设定支若此购物篮数据为某超市随机选取的7位顾客的交易数据,请结合之前得到的结果为该超市提一些建议。
答奉解析:先将给定的数据整理成datahoop关联分析町识别的格式,导入datahoop平台.对变屋牛肉、鸡肉、牛奶、奶酪、牠子、衣服进行关联分析。
设置就小支持度为2/7=0. 286,就小置信度为0,可以得到频繁项集(別除重复)•设垃最小支持数为2/7=0. 286、昴小过信度二0. 7・可以得到提升度〉1的冇效强关联规则(删除单项)解答:TT先对原数据进行预处理至然后再处理至A AB JCD E1 b c Cl e2F F T T3T T F T4 T F T T5F T T T6T T F T7T F T T8F F T T F9T T T F F10 T F F T T11 Tr T F F T1213导入datahoop ¥台,设置支持度为0. 286,置信度为0支持度排名项目1顶目210>克持度置彳言度提升度120> f )0.130>771—项的频蠻集40■90.1>61}■90.8翻 1.0714seUU*>0。
数据分析及应用模拟练习题含答案
数据分析及应用模拟练习题含答案一、单选题(共30题,每题1分,共30分)1、蒙特卡罗算法是()的一种A、A 分支界限法B、B 概率算法C、C 贪心算法D、D 回溯算法正确答案:B2、下面属于良好程序设计风格的是______。
A、A 源程序文档化B、B 程序效率第一C、C 随意使用无条件转移语句D、D 程序输入输出的随意性正确答案:A3、假设有命令(P)import numpy as np bArray = np.array([[1,2,3],[4,5,6]])则,bArray.ndim的结果是A、A 逻辑覆盖法B、B 等价类划分C、C 边界值分析D、D 功能图法正确答案:A4、若实体A和B是一对多的联系,实体B和C是一对一的联系,则实体A和C的联系是______。
A、A 一对一B、B 一对多C、C 多对一D、D 多对多正确答案:B5、DataFrame对象df返回第一行以及返回最后一行的代码是:()A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A6、np.arange(1,10,1).reshape([3,3])[1:,2:]=(?)。
A、A [8 9]B、B [6 9]C、C [[6][9]]D、D 抛异常正确答案:C7、某二叉树共有150个结点,其中有50个度为1的结点,则______。
A、A 不存在这样的二叉树B、B 该二叉树有49个叶子结点C、C 该二叉树有50个叶子结点D、D 该二叉树有51个叶子结点正确答案:A8、x=np.arange(1,10,1).reshape([3,3]) y=np.arange(10,19,1).reshape(3,3) np.r_[x,y].shape==()A、A (6,3)B、B (3,6)C、C (3,3)D、D (6,6)正确答案:A9、在进行算术运算时,如果希望一次性输出多个统计指标可以使用()方法A、A statistics()B、B describe()C、C all()D、D results()正确答案:B10、关于哑变量的说法中,下列选项描述错误的是A、A 哑变量是人为虚设的变量B、B 哑变量在转换成指标矩阵后,其值通常为0或1C、C Pnadas中get_dummies()函数可以对类别进行哑变量处理D、D 哑变量的使用没有实际意义正确答案:D11、请找出数列11,18,38,83…的下一项()A、A 146B、B 168C、C 171D、D 203正确答案:C12、用import matplotlib.pyplot as pt引入pyplot模块后,下面可以对执行的代码是()A、A plt.plot([1,2,3])B、B pt.plot([1,2,3])C、C plt.plot[1,2,3]D、D pt.plot[1,2,3]正确答案:B13、pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A、A CSV文件B、B 文本文件C、C 工作簿文件D、D EXE文件正确答案:D14、在下述论述中,正确的是()。
大数据CPDA考试模拟样题—数据分析算法与模型
⼤数据CPDA考试模拟样题—数据分析算法与模型考试模拟样题—数据分析算法与模型⼀.计算题 (共4题,100.0分)1.下⾯是7个地区2000年的⼈均国内⽣产总值(GDP)和⼈均消费⽔平的统计数据:⼀元线性回归.xlsx⼀元线性回归预测.xlsx要求:(1)绘制散点图,并计算相关系数,说明⼆者之间的关系;(2)⼈均GDP作⾃变量,⼈均消费⽔平作因变量,利⽤最⼩⼆乘法求出估计的回归⽅程,并解释回归系数的实际意义;(3)计算判定系数,并解释其意义;(4)检验回归⽅程线性关系的显著性(a=0.05);(5)如果某地区的⼈均GDP为5000元,预测其⼈均消费⽔平;(6)求⼈均GDP为5000元时,⼈均消费⽔平95%的置信区间和预测区间。
(所有结果均保留三位⼩数)正确答案:(1)以⼈均GDP为x,⼈均消费⽔平为y绘制散点图,如下:⽤相关系数矩阵分析可求得相关系数为0.9981。
从图和相关系数都可以看出⼈均消费⽔平和⼈均国内⽣产总值(GDP)有⽐较强的正相关关系。
(2)以⼈均GDP作⾃变量,⼈均消费⽔平作因变量,做线性回归分析,得到回归⽅程如下:y = 0.3087x + 734.6928回归系数0.3087表⽰⼈均GDP每增加⼀个单位,⼈均消费⽔平⼤致增加0.3087个单位,⼈均GDP对⼈均消费⽔平的影响是正向的,⼈均GDP越⾼⼈均消费⽔平也越⾼。
(3)判定系数R⽅为0.9963,说明模型拟合效果很好。
(4)T检验和F检验的P值都⼩于0.05,线性关系显著。
(5)做预测分析可得,如果某地区的⼈均GDP为5000元,则其⼈均消费⽔平为2278.1066元。
(6)⼈均GDP为5000元时,由预测分析的结果可知,⼈均消费⽔平95%的置信区间为[1990.7491,2565.4640],预测区间为[1580.4632,2975.7500]。
2.根据以下给出的数据进⾏分析,本次给出鸢尾花数据,其中包含萼⽚长、萼⽚宽、花瓣长、花瓣宽、以及花的类型数据,请根据以下问题进⾏回答。
数据分析真题汇编附答案解析
数据分析真题汇编附答案解析一、选择题1.回忆位中数和众数的概念;2.在只有15人参加的演讲比赛中,参赛选手的成绩各不相同,若选手要想知道自己是否进入前8名,只需要了解自己的成绩以及全部成绩的( )A.平均数B.中位数C.众数D.以上都不对【答案】B【解析】【分析】此题是中位数在生活中的运用,知道自己的成绩以及全部成绩的中位数就可知道自己是否进入前8名.【详解】15名参赛选手的成绩各不相同,第8名的成绩就是这组数据的中位数,所以选手知道自己的成绩和中位数就可知道自己是否进入前8名.故选B.【点睛】理解平均数,中位数,众数的意义.3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是()A.平均数是6B.中位数是6.5C.众数是7D.平均每周锻炼超过6小时的人数占该班人数的一半【答案】A【解析】【分析】根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否.【详解】A、平均数为150×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意;B、∵一共有50个数据,∴按从小到大排列,第25,26个数据的平均值是中位数,∴中位数是6.5,故此选项正确,不合题意;C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意;D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意;故选A.【点睛】此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.4.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:决赛成绩/分95908580人数4682那么20名学生决赛成绩的众数和中位数分别是( )A.85,90 B.85,87.5 C.90,85 D.95,90【答案】B【解析】试题解析:85分的有8人,人数最多,故众数为85分;处于中间位置的数为第10、11两个数,为85分,90分,中位数为87.5分.故选B.考点:1.众数;2.中位数5.小明参加射击比赛,10次射击的成绩如表:若小明再射击2次,分别命中7环、9环,与前10次相比,小明12次射击的成绩()A.平均数变大,方差不变B.平均数不变,方差不变C.平均数不变,方差变大D.平均数不变,方差变小【答案】D【解析】【分析】首先利用计算出前10次射击的平均数,再计算出方差,然后计算出再射击2次后的平均数和方差,进而可得答案.【详解】前10次平均数:(6×3+7×1+8×2+9×1+10×3)÷10=8,方差:S2=110[(6﹣8)2×3+(7﹣8)2+(8﹣8)2×2+(9﹣8)2+3×(10﹣8)2]=2.6,再射击2次后的平均数::(6×3+7×1+8×2+9×1+10×3+7+9)÷12=8,方差:S2=112[(6﹣8)2×3+(7﹣8)2×2+(8﹣8)2×2+(9﹣8)2×2+3×(10﹣8)2]=73,平均数不变,方差变小,故选:D.【点睛】此题主要考查了方差和平均数,关键是掌握方差计算公式:S2=1n[(x1﹣x)2+(x2﹣x)2+…+(x n﹣x)2].6.甲、乙两名同学分别进行6次射击训练,训练成绩(单位:环)如下表对他们的训练成绩作如下分析,其中说法正确的是()A.他们训练成绩的平均数相同B.他们训练成绩的中位数不同C.他们训练成绩的众数不同D.他们训练成绩的方差不同【答案】D【解析】【分析】利用方差的定义、以及众数和中位数的定义分别计算即可得出答案.【详解】∵甲6次射击的成绩从小到大排列为6、7、8、8、9、10,∴甲成绩的平均数为67889106+++++=8,中位数为882+=8、众数为8,方差为16×[(6﹣8)2+(7﹣8)2+2×(8﹣8)2+(9﹣8)2+(10﹣8)2]=53,∵乙6次射击的成绩从小到大排列为:7、7、8、8、8、9,∴乙成绩的平均数为7788896+++++=476,中位数为882+=8、众数为8,方差为16×[2×(7﹣476)2+3×(8﹣476)2+(9﹣476)2]=1736,则甲、乙两人的平均成绩不相同、中位数和众数均相同,而方差不相同,故选D.【点睛】本题考查了中位数、方差以及众数的定义等知识,熟练掌握相关定义以及求解方法是解题的关键.7.下列说法:①一组对边平行,另一组对边相等的四边形是平行四边形;②经过有交通信号灯的路口,遇到红灯是必然事件;③若甲组数据的方差是0.3,乙组数据的方差是0.1,则甲数据比乙组数据稳定;④圆内接正六边形的边长等于这个圆的半径,其中正确说法的个数是()A.1个B.2个C.3个D.4个【答案】A【解析】【分析】根据平行四边形的判定去判断①;根据必然事件的定义去判断②;根据方差的意义去判断③;根据圆内接正多边形的相关角度去计算④.【详解】一组对边平行,另一组对边相等的四边形也有可能是等腰梯形,①错误;必然事件是一定会发生的事件,遇到红灯是随机事件,②错误;方差越大越不稳定,越小越稳定,乙比甲更稳定,③错误;正六边形的边所对的圆心角是60︒,所以构成等边三角形,④结论正确.所以正确1个,答案选A.【点睛】本题涉及的知识点较多,要熟悉平行四边形的常见判定;随机事件、必然事件、不可能事件等的区分;掌握方差的意义;会计算圆内接正多边形相关.8.某校九年级模拟考试中,1班的六名学生的数学成绩如下:96,108,102,110,108,82.下列关于这组数据的描述不正确的是()A.众数是108 B.中位数是105C.平均数是101 D.方差是93【答案】D【解析】【分析】把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110,求出众数、中位数、平均数和方差,即可得出结论.【详解】解:把六名学生的数学成绩从小到大排列为:82,96,102,108,108,110,∴众数是108,中位数为1021081052+=,平均数为82961021081081101016+++++=,方差为()()()()()()222222182101961011021011081011081011101016⎡⎤-+-+-+-+-+-⎣⎦ 94.393≈≠;故选:D . 【点睛】考核知识点:众数、中位数、平均数和方差;理解定义,记住公式是关键.9.一组数据3、2、1、2、2的众数,中位数,方差分别是:( ) A .2,1,2 B .3,2,0.2C .2,1,0.4D .2,2,0.4【答案】D 【解析】 【分析】根据众数,中位数,方差的定义计算即可. 【详解】将这组数据重新由小到大排列为:12223、、、、平均数为:1222325++++=2出现的次数最多,众数为:2 中位数为:2方差为:()()()()()22222212222222320.45s -+-+-+-=+-=故选:D 【点睛】本题考查了确定数据众数,中位数,方差的能力,解题的关键是熟悉它们的定义和计算方法.10.2018年国务院机构改革不再保留国家卫生和计划生育委员会,组建国家卫生健康委员会,在修正人口普查数据中的低龄人口漏登后,我们估计了1982-2030年育龄妇女情况.1982年中国15-49岁育龄妇女规模为2.5亿,到2011年达3.8亿人的峰值,2017年降至3.5亿,预计到2030年将降至3.0亿.则数据2.5亿、3.8亿、3.5亿、3.0亿的中位数、平均数、方差分别是( ) A .3.25亿、3.2亿、0.245 B .3.65亿、3.2亿、0.98 C .3.25亿、3.2亿、0.98 D .3.65亿、3亿、0.245【答案】A 【解析】 【分析】根据中位数、平均数的定义和方差公式分别进行解答即可.【详解】把数据2.5亿、3.8亿、3.5亿、3.0亿按从小到大的顺序排列为:2.5亿,3.亿,3.5亿,3.8亿,最中间的两个数是3.0亿和3.5亿,所以,这组数据的中位数为:3.0+3.5=3.252亿 平均数为:2.5+3.8+3.5+3.0=3.24亿;方差为:S 2=14×[(2.5-3.2)2+(3.8-3.2)2+(3.5-3.2)2+(3.0-3.2)2]= 14×(0.49+0.36+0.09+0.04)=0.245 故选A. 【点睛】本题考查了中位数、平均数和方差,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);一般地设n 个数据,x 1,x 2,…x n 的平均数为x ,则方差S 2=()()()222121n x x x x x x n ⎡⎤-+-+⋯+-⎣⎦.11.为了迎接2022年的冬奥会,中小学都积极开展冰上运动,小乙和小丁进行500米短道速滑比赛,他们的五次成绩(单位:秒)如表所示:设两人的五次成绩的平均数依次为x 乙,x 丁,成绩的方差一次为2S 乙,2S 丁,则下列判断中正确的是( )A .x x =乙丁,22S S <乙丁B .x x =乙丁,22S S >乙丁C .x x >乙丁,22S S >乙丁 D .x x <乙丁,22S S <乙丁【答案】B 【解析】 【分析】根据平均数的计算公式先求出甲和乙的平均数,再根据方差的意义即可得出答案. 【详解】4563555260555x ++++==乙,则()()()()()2222221455563555555525560555S ⎡⎤=⨯-+-+-+-+-⎣⎦乙39.6=,5153585657555x ++++==丁,则()()()()()2222221515553555855565557555S ⎡⎤=⨯-+-+-+-+-⎣⎦丁 6.8=,所以x x =乙丁,22S S >乙丁,故选B . 【点睛】本题考查方差的定义与意义:一般地设n 个数据,1x ,2x ,…n x 的平均数为x ,则方差()()()2222121n S x x x x x x n ⎡⎤=-+-+⋅⋅⋅+-⎢⎥⎣⎦,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.12.某班有40人,一次体能测试后,老师对测试成绩进行了统计.由于小亮没有参加本次集体测试,因此计算其他39人的平均分为90分,方差239s =.后来小亮进行了补测,成绩为90分,关于该班40人的测试成绩,下列说法正确的是( ) A .平均分不变,方差变大 B .平均分不变,方差变小 C .平均分和方差都不变 D .平均分和方差都改变【答案】B 【解析】 【分析】根据平均数,方差的定义计算即可. 【详解】解:∵小亮的成绩和其他39人的平均数相同,都是90分, ∴该班40人的测试成绩的平均分为90分,方差变小, 故选:B . 【点睛】本题考查方差,算术平均数等知识,解题的关键是理解题意,灵活运用所学知识解决问题,属于中考常考题型.13.下面的统计图表示某体校射击队甲、乙两名队员射击比赛的成绩,根据统计图中的信息,下列结论正确的是( )A .甲队员成绩的平均数比乙队员的大B .乙队员成绩的平均数比甲队员的大C .甲队员成绩的中位数比乙队员的大D .甲队员成绩的方差比乙队员的大 【答案】D 【解析】 【分析】根据平均数、中位数和方差的计算公式分别对每一项进行分析,即可得出答案. 【详解】甲队员10次射击的成绩分别为6,7,7,7,8,8,9,9,9,10,则中位数882+=8, 甲10次射击成绩的平均数=(6+3×7+2×8+3×9+10)÷10=8(环),乙队员10次射击的成绩分别为6,7,7,8,8,8,8,9,9,10,则中位数是8, 乙10次射击成绩的平均数=(6+2×7+4×8+2×9+10)÷9=8(环), 甲队员成绩的方差=110×[(6-8)2+3×(7-8)2+2×(8-8)3+3×(9-8)2+(10-8)2]=1.4; 乙队员成绩的方差=110×[(6-8)2+2×(7-8)2+4×(8-8)3+2×(9-8)2+(10-8)2]=1.2, 综上可知甲、乙的中位数相同,平均数相同,甲的方差大于乙的方差, 故选D . 【点睛】本题考查了平均数、中位数和方差的定义和公式,熟练掌握平均数、中位数、方差的计算是解题的关键.14.某校男子足球队的年龄分布如图所示,则根据图中信息可知这些队员年龄的平均数,中位数分别是( )A .15.5,15.5B .15.5,15C .15,15.5D .15,15【答案】D 【解析】 【分析】 【详解】根据图中信息可知这些队员年龄的平均数为:132146158163172181268321⨯+⨯+⨯+⨯+⨯+⨯+++++=15岁,该足球队共有队员2+6+8+3+2+1=22人,则第11名和第12名的平均年龄即为年龄的中位数,即中位数为15岁,故选D.15.在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如下表所示:则这些运动员成绩的中位数、众数分别为()A.1.70,1.75 B.1.70,1.70 C.1.65,1.75 D.1.65,1.70【答案】A【解析】分析:找中位数要把数据按从小到大的顺序排列,位于最中间的一个数或两个数的平均数为中位数;众数是一组数据中出现次数最多的数据,注意众数可以不止一个.详解:共15名学生,中位数落在第8名学生处,第8名学生的跳高成绩为1.70m,故中位数为1.70;跳高成绩为1.75m的人数最多,故跳高成绩的众数为1.75;故选A.点睛:本题为统计题,考查众数与中位数的意义.众数是一组数据中出现次数最多的数.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.16.一组数据-2,3,0,2,3的中位数和众数分别是()A.0,3 B.2,2 C.3,3 D.2,3【答案】D【解析】【分析】根据中位数和众数的定义解答即可.【详解】将这组数据从小到大的顺序排列为:﹣2,0,2,3,3,最中间的数是2,则中位数是2;在这一组数据中3是出现次数最多的,故众数是3.故选D.【点睛】本题考查了众数与中位数的意义.将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数)叫做这组数据的中位数;如果中位数的概念掌握得不好,不把数据按要求重新排列,就会出错.17.某班统计一次数学测验成绩的平均分与方差,计算完毕以后才发现有位同学的分数还未登记,只好重新算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( ) A .1x x <,221s s = B .1x x =,221s s > C .1x x =,221s s < D .1x x =,221s s =【答案】B 【解析】 【分析】根据平均数和方差的公式计算比较即可. 【详解】设这个班有n 个同学,数据分别是a 1,a 2,…a i …,a n , 第i 个同学没登录, 第一次计算时总分是(n−1)x , 方差是s 2=11n -[(a 1−x)2+…(a i−1−x)2+(a i+1−x)2+…+(a n −x)2] 第二次计算时, x =()1n x x n-+=x ,方差s 12=1n [(a 1−x)2+…(a i−1−x)2+(a i −x)2+(a i+1−x)2+…+(a n −x)2]=1n n-s 2, 故221s s >, 故选B . 【点睛】此题主要考查平均数和方差的计算,解题的关键是熟知其计算方法.18.据统计,某住宅楼30户居民五月份最后一周每天实行垃圾分类的户数依次是:27,30,29,25,26,28,29,那么这组数据的中位数和众数分别是( ) A .25和30 B .25和29C .28和30D .28和29【答案】D 【解析】【分析】根据中位数和众数的定义进行求解即可得答案.【详解】对这组数据重新排列顺序得,25,26,27,28,29,29,30, 处于最中间是数是28, ∴这组数据的中位数是28, 在这组数据中,29出现的次数最多, ∴这组数据的众数是29, 故选D .【点睛】本题考查了中位数和众数的概念,熟练掌握众数和中位数的概念是解题的关键.一组数据中出现次数最多的数据叫做众数,一组数据按从小到大(或从大到小)排序后,位于最中间的数(或中间两数的平均数)是这组数据的中位数.19.下列说法正确的是()A.对角线相等的四边形一定是矩形B.任意掷一枚质地均匀的硬币10次,一定有5次正面向上C.如果有一组数据为5,3,6,4,2,那么它的中位数是6D.“用长分别为5cm、12cm、6cm的三条线段可以围成三角形”这一事件是不可能事件【答案】D【解析】【分析】根据矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义依次判断即可.【详解】A.对角线相等的平行四边形是矩形,故该项错误;B. 任意掷一枚质地均匀的硬币10次,不一定有5次正面向上,故该项错误;C. 一组数据为5,3,6,4,2,它的中位数是4,故该项错误;D. “用长分别为5cm、12cm、6cm的三条线段可以围成三角形” 这一事件是不可能事件,正确,故选:D.【点睛】此题矩形的判定定理,数据出现的可能性的大小,中位数的计算方法,不可能事件的定义,综合掌握各知识点是解题的关键.20.某小组长统计组内6人一天在课堂上的发言次数分別为3,3,4,6,5,0.则这组数据的众数是()A.3 B.3.5 C.4 D.5【答案】A【解析】【分析】根据众数的定义,找数据中出现次数最多的数据即可.【详解】在3,3,4,6,5,0这组数据中,数字3出现了2次,为出现次数最多的数,故众数为3.故选A.【点睛】本题考查了众数的概念.众数是一组数据中出现次数最多的数据.。
八年级数学下册第二十章数据的分析知识总结例题(带答案)
八年级数学下册第二十章数据的分析知识总结例题单选题1、某汽车评测机构对市面上多款新能源汽车的0~100km/h的加速时间和满电续航里程进行了性能评测,评测结果绘制如下,每个点都对应一款新能源汽车的评测数据.已知0~100km/h的加速时间的中位数是ms,满电续航里程的中位数是nkm,相应的直线将平面分成了①、②、③、④四个区域(直线不属于任何区域).欲将最新上市的两款新能源汽车的评测数据对应的点绘制到平面内,若以上两组数据的中位数均保持不变,则这两个点可能分别落在()A.区域①、②B.区域①、③C.区域①、④D.区域③、④答案:B分析:根据中位数的性质即可作答.在添加了两款新能源汽车的测评数据之后,0~100km/h的加速时间的中位数m s,满电续航里程的中位数n km,这两组中位数的值不变,即可知这两款新能源汽车的0~100km/h的加速时间的数值分别处于直线m的上方和下方,满电续航里程的数值分别位于直线n的左侧和右侧,据此逐项判断即可:A项,两款车的0~100km/h的加速时间均在直线m下方,不符合要求,故A项错误;B项,可知这两款新能源汽车的0~100km/h的加速时间的数值分别处于直线m的上方和下方,满电续航里程的数值分别位于直线n的左侧和右侧,符合要求;C项,两款车的满电续航里程的数值均在直线n的左侧,不符合要求,故C项错误;D项,两款车的0~100km/h的加速时间均在直线m上方,不符合要求,故D项错误;故选:B.小提示:本题考查了中位数的概念,根据中位数的值不变可知新添加的一组数据分别处在中位数的左右两侧或刚好都等于该中位数,理解这一点是解答本题的关键.2、一组数据x、0、1、-2、3的平均数是1,则x的值是()A.3B.1C.2.5D.0答案:A分析:根据题意,得x+0+1-2+3=5,求得x的值即可.∵x、0、1、-2、3的平均数是1,∴x+0+1-2+3=5,解得x=3,故选A.,正确进行公式变形计算是解题的关键.小提示:本题考查了算术平均数的定义即x̅=x1+x2+x3+⋯+x n−1+x nn3、生活垃圾分类回收是实现垃圾减量化和资源化的重要途径和手段.为了解2019年某市第二季度日均可回收物回收量情况,随机抽取该市2019年第二季度的m天数据,整理后绘制成统计表进行分析.表中3≤x4组的频率a满足0.20≤a≤0.30.下面有四个推断:①表中m的值为20;②表中b的值可以为7;③这m天的日均可回收物回收量的中位数在4≤x<5组;④这m天的日均可回收物回收量的平均数不低于3.所有合理推断的序号是()A.①②B.①③C.②③④D.①③④答案:D分析:①根据数据总和=频数÷频率,列式计算即可得出m的值;②根据3≤x<4的频率a满足0.20≤a≤0.30,可求出该范围的频数,进一步得出b的值的范围,从而求解;③根据中位数的定义即可求解;④根据加权平均数的计算公式即可求解.解:①日均可回收物回收量(千吨)为1≤x<2时,频数为1,频率为0.05,所以总数m=1÷0.05=20,推断合理;②20×0.2=4,20×0.3=6,1+2+6+3=12,故表中b的值可以为7,是不合理的推断;③1+2+6=9,故这m天的日均可回收物回收量的中位数在4≤x<5组,是合理推断;④(1+5)÷2=3,0.05+0.10=0.15,这m天的日均可回收物回收量的平均数不低于3,是合理推断.故选:D小提示:本题考查频数(率)分布表,从表中获取数量及数量之间的关系是解题问题的关键.4、河南省旅游资源丰富,2013~2017年旅游收入不断增长,同比增速分别为:15.3%,12.7%,15.3%,14.5%,17.1%.关于这组数据,下列说法正确的是()A.中位数是12.7%B.众数是15.3%C.平均数是15.98%D.方差是0答案:B分析:直接利用方差的意义以及平均数的求法和中位数、众数的定义分别分析得出答案.详解:A、按大小顺序排序为:12.7%,14.5%,15.3%,15.3%,17.1%,故中位数是:15.3%,故此选项错误;B、众数是15.3%,正确;(15.3%+12.7%+15.3%+14.5%+17.1%)=14.98%,故选项C错误;C、15D、∵5个数据不完全相同,∴方差不可能为零,故此选项错误.故选B.点睛:此题主要考查了方差的意义以及平均数的求法和中位数、众数的定义,正确把握相关定义是解题关键.5、某次射击比赛,甲队员的成绩如图,根据此统计图,下列结论中错误的是()A.最高成绩是9.4环B.平均成绩是9环C.这组成绩的众数是9环D.这组成绩的方差是8.7答案:D分析:根据统计图即可判断选项A,根据统计图可求出平均成绩,即可判断选项B,根据统计图即可判断选项C,根据所给数据进行计算即可判断选项D.解:A、由统计图得,最高成绩是9.4环,选项说法正确,不符合题意;B、平均成绩:1×(9.4+8.4+9.2+9.2+8.8+9+8.6+9+9+9.4)=9,选项说法正确,符合题意;10C、由统计图得,9出现了3次,出现的次数最多,选项说法正确,不符合题意;×[(9.4−9)2+(8.4−9)2+(9.2−9)2+(9.2−9)2+(8.8−9)2+(9−9)2+(8.6−9)2+D、方差:110(9−9)2+(9−9)2+(9.4−9)2]=0.096,选项说法错误,符合题意;故选D.小提示:本题考查了平均数,众数,方差,解题的关键是理解题意掌握平均数,众数和方差的计算方法.6、某班级共有41人,在一次体质测试中,有1人未参加集体测试,老师对集体测试的成绩按40人进行了统计,得到测试成绩分数的平均数是88,中位数是85.缺席集体测试的同学后面进行了补测,成绩为88分,关于该班级41人的体质测试成绩,下列说法正确的是()A.平均数不变,中位数变大B.平均数不变,中位数无法确定C.平均数变大,中位数变大D.平均数不变,中位数变小答案:B分析:平均数是指在一组数据中所有数据之和再除以数据的个数,将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数,依此计算即可求解.解:∵缺席集体测试的同学的成绩和其他40人的平均数相同,都是88分,∴该班41人的测试成绩的平均分为88分不变,中位数是从小到大第21个人的成绩,原来是第20个和第21个人成绩的平均数,中位数可能不变,可能变大,故中位数无法确定.故选:B.小提示:本题考查中位数,算术平均数等知识,解题的关键是理解题意,灵活运用所学知识解决问题,属于中考常考题型.7、小楠所在社会实践活动小组的同学们响应“垃圾分类,从我做起”的号召,主动到附近的7个社区宣传垃圾分类.她们记录的各社区参加活动的人数如图所示,那么这组数据的众数和中位数分别是()A.42,40B.42,38C.2,40D.2,38答案:A分析:根据众数和中位数的定义分别进行解答啊即可.解:在这一组数据中42是出现次数最多的,故众数是42 ;而将这组数据从小到大的顺序排列后,处于中间位置的那个数是40,由中位数的定义可知,这组数据的中位数是40.故选:A.小提示:本题考查统计的有关知识,找中位数要把数据按从小到大的顺序排列,位于最中间的一个数(或两个数的平均数)为中位数;众数是一组数据中出现次数最多的数据,注意众数可以不只一个,正确理解众数及中位数的定义是解题的关键.8、某4S店今年1~5月新能源汽车的销量(辆数)分别如下:25,33,36,31,40,这组数据的平均数是()A.34B.33C.32.5D.31答案:B分析:根据算术平均数的计算方法进行计算即可.=33(辆),解:这组数据的平均数为:25+33+36+31+405故选:B.小提示:本题考查平均数,掌握算术平均数的计算方法是正确计算的关键.9、12名射击运动员一轮射击成绩绘制如图所示的条形统计图,则下列错误的是()A.中位数是8环B.平均数是8环C.众数是8环D.极差是4环答案:C分析:中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可;对于众数可由条形统计图中出现频数最大或条形最高的数据写出;极差=最大值-最小值.解:A.由于共有12个数据,排在第6和第7的数均为8,所以中位数为8环,故本选项不合题意;B.平均数为:(6+7×4+8×2+9×4+10)÷12=8(环),故本选项不合题意;C.众数是7环和9环,故本选项符合题意;D.极差为:10-6=4(环),故本选项不合题意;故选:C.小提示:本题主要考查了确定一组数据的中位数,极差,众数以及平均数.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个则找中间两位数的平均数.10、为落实“双减”政策,学校随机调查了部分学生一周平均每天的睡眠时间,统计结果如表,则这些被调查学生睡眠时间的众数和中位数分别是()答案:A分析:根据中位数、众数的意义求解即可.解:抽查学生的人数为:7+9+11+3=30(人),这30名学生的睡眠时间出现次数最多的是9小时,共出现11次,因此众数是9小时,将这30名学生的睡眠时间从小到大排列,处在中间位置的两个数的平均数为8+8=8,因此中位数是8小时.2故选:A.小提示:本题考查中位数、众数,理解中位数、众数的意义,掌握中位数、众数的计算方法是解决问题的关键.填空题11、东门某商场试销一种新款衬衫,一周内销售情况如下表所示:________.(填“平均数”或“中位数”或“众数”)答案:众数分析:根据众数的概念进行求解即可;解:对商场经理来说,知道哪一种型号的销售量最多,是最有意义的;∴对商场经理来说最有意义的是众数;所以答案是:众数.小提示:本题主要考查众数的概念,掌握众数的概念是解题的关键.12、数据-1,0,1的方差为_______.答案:23 分析:先求出3个数的平均数,再根据方差公式计算.解:数据-1,0,1的平均数:13(−1+0+1)=0, 方差S 2=13[(−1−0)2+(0−0)2+(1−0)2] =23,所以答案是:23. 小提示:本题考查方差的计算,方差S 2=1n [(x 1−x̅)2+(x 2−x̅)2+⋯+(x n −x̅)2],熟记方差公式是解题的关键.13、甲、乙两台机床在相同的条件下,同时生产一种直径为10mm 的滚珠.现在从中各抽取100个进行检测,结果这两台机床生产的滚珠平均直径均为10mm ,但s 甲2=0.288,s 乙2=0.024,则______机床生产这种滚珠的质量更稳定.答案:乙分析:根据甲的方差大于乙的方差,即可得出乙机床生产这种滚珠的质量更稳定.解:∵这两台机床生产的滚珠平均直径均为10mm ,S 2甲>S2乙,∴乙机床生产这种滚珠的质量更稳定.所以答案是:乙.小提示:本题主要考查方差,方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法.本题考查方差的定义与意义,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.14、某校招聘教师,规定综合成绩由笔试成绩和面试成绩构成,其中笔试占60%,面试占40%,有一名应聘者的综合成绩为84分,笔试成绩是80分,则面试成绩为______分.答案:90分析:根据综合成绩笔试占60%,面试占40%,即综合成绩等于笔试成绩乘以60%,加上面试成绩乘以40%,即可求解;解:设面试成绩为x分,根据题意知,该名老师的综合成绩为80×60%+40%⋅x=84(分)解得x=90所以答案是:90.小提示:本题考查一元一次方程实际问题和加权平均数及其计算,是中考的常考知识点,熟练掌握其计算方法是解题的关键.15、八(1)班一组女生的体重(单位:kg)分别是:35,36,38,40,42,42,45.则这组数据的众数为 _____.答案:42分析:根据众数的定义即可求得.解:在这组数据中42出现了2次,出现的次数最多,故这组数据的众数是42.所以答案是:42.小提示:本题考查了众数的定义,熟练掌握和运用众数的定义是解决本题的关键.解答题16、近年来,共享单车逐渐成为高校学生喜爱的“绿色出行”方式之一,自2016年国庆后,许多高校均投放了使用手机支付就可随取随用的共享单车.某高校为了解本校学生出行使用共享单车的情况,随机调查了某天部分出行学生使用共享单车的情况,并整理成如下统计表.)这天部分出行学生使用共享单车次数的中位数是,众数是,该中位数的意义是;(2)这天部分出行学生平均每人使用共享单车约多少次?(结果保留整数)(3)若该校某天有1500名学生出行,请你估计这天使用共享单车次数在3次以上(含3次)的学生有多少人?答案:(1)3、3、表示这部分出行学生这天约有一半使用共享单车的次数在3次以上(或3次);(2)这天部分出行学生平均每人使用共享单车约2次;(3)估计这天使用共享单车次数在3次以上(含3次)的学生有765人.分析:(1)根据中位数和众数的定义进行求解即可得;(2)根据加权平均数的公式列式计算即可;(3)用总人数乘以样本中使用共享单车次数在3次以上(含3次)的学生所占比例即可得.(1)∵总人数为11+15+23+28+18+5=100,∴中位数为第50、51个数据的平均数,即中位数为3+3=3次,众数为3次,2其中中位数表示这部分出行学生这天约有一半使用共享单车的次数在3次以上(或3次),故答案为3、3、表示这部分出行学生这天约有一半使用共享单车的次数在3次以上(或3次);(2)x=0×11+1×15+2×23+3×28+4×18+5×5≈2(次),100答:这天部分出行学生平均每人使用共享单车约2次;=765(人),(3)1500×28+18+5100答:估计这天使用共享单车次数在3次以上(含3次)的学生有765人.小提示:本题考查了中位数、众数、平均数、用样本估计总体等,熟练掌握中位数、众数、平均数的定义以及求解方法是解题的关键.17、某校举办“歌唱祖国”演唱比赛,十位评委对每位同学的演唱进行现场打分,对参加比赛的甲、乙、丙三位同学得分的数据进行整理、描述和分析,下面给出了部分信息.a.甲、乙两位同学得分的折线图:b.丙同学得分:10 ,10,10,9,9,8,3,9,8,10c.甲、乙、丙三位同学得分的平均数:(1)求表中m的值;(2)在参加比赛的同学中,如果某同学得分的10个数据的方差越小,则认为评委对该同学演唱的评价越一致.据此推断:甲、乙两位同学中,评委对_________的评价更一致(填“甲”或“乙”);(3)如果每位同学的最后得分为去掉十位评委打分中的一个最高分和一个最低分后的平均分,最后得分越高,则认为该同学表现越优秀.据此推断:在甲、乙、丙三位同学中,表现最优秀的是_________(填“甲”“乙”或“丙”).答案:(1)8.6(2)甲(3)丙分析:(1)根据平均数的定义求出丙的平均数即可求解.(2)根据方差的计算方法先算出甲、乙的方差,再进行比较即可求解.(3)按去掉一个最高分和一个最低分后分别计算出甲、乙、丙的平均分,再进行比较即可求解.(1)=8.6,解:丙的平均数:10+10+10+9+9+8+3+9+8+1010则m =8.6.(2)s 甲2=110[2×(8.6−8)2+4×(8.6−9)2+2×(8.6−7)2+2×(8.6−10)2]=1.04, s 乙2=110[4×(8.6−7)2+4×(8.6−10)2+2×(8.6−9)2]=1.84,∵s 甲2<s 乙2,∴甲、乙两位同学中,评委对甲的评价更一致,所以答案是:甲.(3)由题意得,去掉一个最高分和一个最低分后的平均分为:甲:8+8+9+7+9+9+9+108=8.625, 乙:7+7+7+9+9+10+10+108=8.625, 丙:10+10+9+9+8+9+8+108=9.125, ∵去掉一个最高分和一个最低分后丙的平均分最高,因此最优秀的是丙,所以答案是:丙.小提示:本题考查了折线统计图、中位数、方差及平均数,理解折线统计图,从图中获取信息,掌握中位数、方差及去掉一个最高分和一个最低分后的平均分的求法是解题的关键.18、如图,直角坐标系xOy 中,一次函数y =﹣12x +5的图象l 1分别与x ,y 轴交于A ,B 两点,正比例函数的图象l 2与l 1交于点C (m ,4).(1)求m 的值及l 2的解析式;(2)求S △AOC ﹣S △BOC 的值;(3)一次函数y =kx +1的图象为l 3,且11,l 2,l 3不能围成三角形,直接写出k 的值.答案:(1)m =2,l 2的解析式为y =2x ;(2)S △AOC ﹣S △BOC =15;(3)k 的值为32或2或﹣12.分析:(1)先求得点C 的坐标,再运用待定系数法即可得到l 2的解析式;(2)过C 作CD ⊥AO 于D ,CE ⊥BO 于E ,则CD =4,CE =2,再根据A (10,0),B (0,5),可得AO =10,BO =5,进而得出S △AOC ﹣S △BOC 的值;(3)分三种情况:当l 3经过点C (2,4)时,k =32;当l 2,l 3平行时,k =2;当11,l 3平行时,k =﹣12;故k 的值为32或2或﹣12.解:(1)把C (m ,4)代入一次函数y =﹣12x +5,可得 4=﹣12m +5,解得m =2,∴C (2,4),设l 2的解析式为y =ax ,则4=2a ,解得a =2,∴l 2的解析式为y =2x ;(2)如图,过C 作CD ⊥AO 于D ,CE ⊥BO 于E ,则CD =4,CE =2, y =﹣12x +5,令x =0,则y =5;令y =0,则x =10,∴A (10,0),B (0,5),∴AO =10,BO =5,∴S △AOC ﹣S △BOC =12×10×4﹣12×5×2=20﹣5=15;(3)一次函数y =kx +1的图象为l 3,且11,l 2,l 3不能围成三角形,∴当l 3经过点C (2,4)时,k =32; 当l 2,l 3平行时,k =2;当11,l 3平行时,k =﹣12;故k 的值为32或2或﹣12.小提示:本题主要考查一次函数的综合应用,解决问题的关键是掌握待定系数法求函数解析式、等腰直角三形的性质、全等三角形的判定和性质、勾股定理及分类讨论思想等.。
数学模型试题及答案解析
数学模型试题及答案解析一、单项选择题(每题3分,共30分)1. 以下哪个不是数学模型的特征?A. 抽象性B. 精确性C. 可验证性D. 复杂性答案:D2. 数学模型的建立通常不包括以下哪个步骤?A. 定义问题B. 收集数据C. 建立假设D. 验证结果答案:D3. 在数学建模中,以下哪个不是模型分析的方法?A. 定性分析B. 数值分析C. 图形分析D. 统计分析答案:D4. 数学模型的验证不包括以下哪项?A. 内部一致性检验B. 与已知结果比较C. 与实验数据比较D. 模型的优化答案:D5. 在数学建模中,以下哪个不是模型的类型?A. 确定性模型B. 随机模型C. 动态模型D. 静态模型答案:D6. 以下哪个是数学模型的典型应用领域?A. 经济学B. 物理学C. 生物学D. 所有以上答案:D7. 数学模型的建立过程中,以下哪个步骤是不必要的?A. 问题定义B. 假设建立C. 模型求解D. 模型展示答案:D8. 数学模型的分析中,以下哪个不是常用的工具?A. 微分方程B. 线性代数C. 概率论D. 量子力学答案:D9. 在数学建模中,以下哪个不是模型的评估标准?A. 准确性B. 可解释性C. 简洁性D. 复杂性答案:D10. 数学模型的建立过程中,以下哪个步骤是至关重要的?A. 问题定义B. 数据收集C. 模型求解D. 模型验证答案:A二、多项选择题(每题5分,共20分)11. 数学模型的建立过程中,以下哪些步骤是必要的?A. 问题定义B. 数据收集C. 模型求解D. 模型验证答案:ABCD12. 数学模型的类型包括以下哪些?A. 确定性模型B. 随机模型C. 动态模型D. 静态模型答案:ABCD13. 数学模型的分析方法包括以下哪些?A. 定性分析B. 数值分析C. 图形分析D. 统计分析答案:ABCD14. 数学模型的验证包括以下哪些?A. 内部一致性检验B. 与已知结果比较C. 与实验数据比较D. 模型的优化答案:ABC三、填空题(每题4分,共20分)15. 数学模型的建立通常包括定义问题、______、建立假设和模型求解四个步骤。
商务数据分析模拟试题附答案
商务数据分析模拟试题附答案1.下面哪项不属于资源有限性()A、传统零售店铺陈列空间的局限性B、资金的局限性C、顾客需求局限性D、人力管理的局限性【正确答案】:C2.创新学习是一种以()为基础,采取创造性方法,积极追求创造性成果的学习。
A、封闭蛮干B、奇思妙想C、求真务实D、瞬间顿悟【正确答案】:C3.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()A、根据内容检索B、建模描述C、预测建模D、寻找模式和规则【正确答案】:C4.流失会员是指最近()个月内均没有消费的会员群体。
A、3B、6C、9D、12【正确答案】:D5.下列关于数据库的说法错误的是()A、数据库存在于计算机系统中B、数据库中的数据因为独立而没有联系C、数据结构化D、数据以文件方式存储【正确答案】:B6.已知A1、B1单元格中的数据为33、35,C1中公式为“=A1+B1”,其他单元格均为空,若把C1中的公式自动填充到C2,则C2显示为()A、#NAME?B、0C、=A1+B1D、68【正确答案】:B7.在Excel中工作表中单击B1,按住鼠标左键,拖至D4,这个操作选取的区域是()A、B1:D6B1:C4C、D1:D4D、B1:D4【正确答案】:D8.列表达式的值为True的是()。
A、3>2>1B、(3,2)<(‘a’, ‘b’)C、5+4j>2-3jD、‘ abc’>‘xyz ’【正确答案】:A9.Excel 中A1、B1、C1单元格值分别为20、30、15,则SUM(A1:C1)-MAX(A1:C1)结果为()。
A、65B、50C、45D、35【正确答案】:D10.数据统计分析的基本步骤是()A、确定问题、收集数据、处理数据、制作数据图表、依据数据及图表分析得出结论B、收集数据、处理数据、制作数据图表C、确定问题、收集数据、处理数据、制作数据图表D、确定问题、处理数据、制作数据图表、依据数据及图表分析得出结论【正确答案】:A11.活跃会员比率周期的确定和()有关。
2021项目数据分析师理论考试真题模拟及答案(3)
2021项目数据分析师理论考试真题模拟及答案(3)共501道题1、数据挖掘技术包括三个主要的部分()(单选题)A. 数据、模型、技术B. 算法、技术、领域知识C. 数据、建模能力、算法与技术D. 建模能力、算法与技术、领域知识试题答案:C2、下面有关HAVING子句的说法中正确的是()(多选题)A. HAVING子句必须与GROUP BY子句同时使用,不能单独使用B. 使用HAVING子句的同时不能使用WHERE子句C. 使用HAVING子句的同时可以使用WHERE子句D. 使用HAVING子句的作用是限定分组的条件试题答案:A,C,D3、如下表student中,如何筛选type为包含数学或语文的记录?()ID type score:A01数学78;A02语文76;A03英语90;A04数学68;A05英语84。
(多选题)A. select*from student where type=”数学”and type=”语文”B. select*from student where type=”数学”or type=”语文”C. select*from student where type in(”数学”,”语文”)D. select*from student where type in(”数学”、”语文”)试题答案:B,C4、以下哪个变量可以反映客户的忠诚度?()(单选题)A. 购买频次B. 购买金额C. 最后一次购买时间D. 购买金额波动率试题答案:A5、下列有关Apriori算法的说法中不正确的是()(单选题)A. Apriori算法是关联分析中最常用的算法之一B. 应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值C. 应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据D. Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量试题答案:C6、关于产销量的盈亏平衡点正确的公式是()(单选题)A. 年总变动成本/(产品销售单价×(1-销售税率)-单位固定成本)B. 年总固定成本/(产品销售单价+单位变动成本+单位产品销售税额)C. 年总固定成本/(产品销售单价×(1-销售税率)+单位变动成本)D. 年总固定成本/(产品销售单价-单位变动成本-单位产品销售税额)试题答案:D7、Naive Bayes是属于数据挖掘中的什么方法?()(单选题)A. 聚类B. 分类C. 时间序列D. 关联规则试题答案:B8、当贴现率与内部收益率相等时()(多选题)A. 净现值等于0B. 现值指数等于0C. 净现值等于1D. 现值指数等于1试题答案:A,D9、ROC曲线凸向哪个角,代表模型越理想?()(单选题)A. 左上角B. 右上角C. 左下角D. 右下角试题答案:A10、在假设检验中,犯一类错误的概率和犯第二类错误的概率的关系是()(多选题)A. 只能直接控制,不能直接控制B. 和不可能同时减小C. 在其他条件不变的情况下,增大,必然后减小D. 在其他条件不变的情况下,增大,必然后增大E. 增加样本容量可以同时减小和试题答案:A,C,E11、下列度量不具有反演性的是()(单选题)A. 系数B. 几率C. Cohen度量D. 兴趣因子试题答案:D12、等年值法需要将参与比较的方案的收益现值按约定计算期折算为均匀序列的()(单选题)A. 永续年金B. 预付年金C. 普通年金D. 递延年金试题答案:C13、相关分析的任务有()。
Python数据分析案例教程5套自测卷带答案模拟试卷
自测试卷1一、选择题1.下面关于数据分析说法正确的是()。
A.数据分析是数学、统计学理论结合科学的统计分析方法B.数据分析是一种数学分析方法C.数据分析是统计学分析方法D.数据分析是大数据分析方法2.下面不是数据分析方法的是()。
A.同比分析B.环比分析C.大数据D.帕累托法则3. 下面哪个是同比分析公式()。
A.同比增长速度=(本期-同期)/同期×100%B.同比增长速度=(上期-下期)/上期×100%C.同比增长速度=上期-下期D.同比增长速度=本期-下期4.下面哪个是环比分析公式()。
A.环比增长速度=(本期-下期)/下期×100%B.环比增长速度=本期-上期C.环比增长速度=(本期-上期)/上期×100%D.环比增长速度=(本期-上期)/上期5.关于80/20分析说法不正确的是()。
A.二八法则B.帕累托法则C.帕累托定律D.不规则定律6.类比到头条的收益,头条投放广告预测收益,你选择用哪种方法预测()A.聚类B.一元线性回归C.时间序列D.多元线性回归7.分析客户价值一般使用哪种分析方法?()A.聚类B.一元线性回归C.时间序列D.多元线性回归8.分析股票你选择用哪种分析方法()A.聚类B.一元线性回归C.时间序列D.多元线性回归9.在现实世界的数据中,缺失值是常有的,一般的处理方法有(多选):A.忽略B.删除C.平均值填充D.最大值填充10.Pandas模块用于做什么?(多选)()A.数据挖掘B.数据处理C.数据分析D.数据可视化二、填空题1.数据分析方法一般分为_________、__________、__________。
2.聚类分析多用于_________、__________。
3.数据分析的一般流程是_________、__________、_________、___________、__________、__________、__________。
数据分析师理论知识测试题(含答案)
数据分析师理论知识测试题(含答案)问题一:请解释什么是数据分析。
答案一:数据分析是一种通过收集、整理和解释数据来推断出有价值信息的过程。
它涉及使用统计方法和适当的工具来识别和分析数据中的模式、趋势和关联性,以支持决策制定和问题解决。
问题二:请列举一些常用的数据分析方法。
答案二:常用的数据分析方法包括:- 描述性统计分析:通过计算和总结数据的基本统计特征,如平均值、中位数、标准差等来描述数据。
- 相关性分析:用于确定不同变量之间的关系,并衡量它们之间的相关程度。
- 预测分析:通过使用历史数据来建立模型,预测未来的趋势和结果。
- 分类分析:用于将数据分类到不同的类别中,以便更好地理解不同类别之间的差异。
- 聚类分析:用于将数据分组成相似的子集,以发现潜在的模式和关联。
- 时间序列分析:针对时间数据中的趋势和周期性进行分析,以便预测未来的数值。
问题三:数据清洗在数据分析过程中起着什么样的作用?答案三:数据清洗是数据分析过程中至关重要的一步。
它涉及检测和纠正数据中的错误、缺失、重复或不完整的部分。
通过数据清洗,可以确保分析所使用的数据准确、完整,并且符合分析目的。
数据清洗还可以帮助减少偏差和噪声,提高分析结果的可靠性和准确性。
问题四:请解释什么是数据可视化,并说明其重要性。
答案四:数据可视化是使用图表、图形和其他视觉元素来呈现数据的过程。
它通过将数据转化为易于理解和解释的形式,帮助人们更好地理解数据的模式、趋势和关系。
数据可视化还能够使复杂数据更加直观和易于理解,帮助分享和传达分析结果,以支持决策制定和问题解决。
问题五:请解释什么是假设检验,并说明其在数据分析中的应用。
答案五:假设检验是通过收集和分析样本数据,以帮助得出关于总体参数的推断性结论的统计方法。
它通常涉及建立一个或多个假设(零假设和备择假设),并根据样本数据的结果进行推断和判断。
在数据分析中,假设检验可用于检测统计推断的差异和显著性,以验证或拒绝某种假设,并支持决策制定。
数学模型期末考试试题及答案
数学模型期末考试试题及答案一、选择题(每题5分,共25分)1. 以下哪个选项不属于数学模型的分类?A. 确定性模型B. 随机性模型C. 动态模型D. 实验模型答案:D2. 在线性规划中,目标函数的系数矩阵称为?A. 约束矩阵B. 目标矩阵C. 价值系数矩阵D. 转置矩阵答案:C3. 在微分方程模型中,描述物体运动的微分方程是?A. 牛顿第二定律B. 柯西-黎曼方程C. 热传导方程D. 波动方程答案:A4. 以下哪个模型属于连续模型?A. 马尔可夫链B. 确定性人口模型C. 蒙特卡洛模拟D. 非线性规划答案:B5. 在排队论中,以下哪个参数表示服务强度?A. λB. μC. ρD. K答案:C二、填空题(每题5分,共25分)6. 在线性规划中,若目标函数为max z = cx,其中c为价值系数向量,x为决策变量向量,则目标函数的矩阵表示为______。
答案:c^T x7. 在微分方程模型中,描述物体运动的微分方程为m a = F,其中m为物体的质量,a为加速度,F为作用力。
若已知m =2kg,a = 4m/s^2,则作用力F =______。
答案:8N8. 在排队论中,若顾客到达率为λ,服务率为μ,则服务强度ρ =______。
答案:λ/μ9. 在马尔可夫链模型中,状态转移矩阵P的元素P_ij表示从状态i转移到状态j的概率,则状态转移矩阵P满足______。
答案:P_ij ≥ 0 且Σ(P_ij) = 110. 在非线性规划问题中,若目标函数为f(x),约束条件为g_i(x) ≤ 0 (i = 1, 2, ..., m),则该问题可以表示为______。
答案:min f(x) s.t. g_i(x) ≤ 0 (i = 1, 2, ..., m)三、解答题(每题25分,共75分)11. 设某工厂生产甲、乙两种产品,甲产品每件利润为2元,乙产品每件利润为3元。
工厂生产甲产品需要1小时,乙产品需要2小时。
数据分析经典测试题及答案解析
数据分析经典测试题及答案解析一、选择题1.关于数据-4,1,2,-1,2,下面结果中,错误的是( ) A .中位数为1 B .方差为26C .众数为2D .平均数为0【答案】B 【解析】 【分析】 【详解】A .∵从小到大排序为-4,-1,,1,2,2,∴中位数为1 ,故正确;B .4121205x -++-+== ,()()()()222224010102022655s --+--+-+-⨯==,故不正确;C .∵众数是2,故正确;D .4121205x -++-+==,故正确;故选B.2.某射击俱乐部将11名成员在某次射击训练中取得的成绩制成如图所示的条形统计图,由图可知,11名成员射击成绩的众数和中位数分别是( )A .8,9B .8,8C .8,10D .9,8【答案】B 【解析】分析:中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可,本题是最中间的那个数;对于众数可由条形统计图中出现频数最大或条形最高的数据写出.详解:由条形统计图知8环的人数最多, 所以众数为8环, 由于共有11个数据,所以中位数为第6个数据,即中位数为8环, 故选B .点睛:本题主要考查了确定一组数据的中位数和众数的能力.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个,则找中间两个数的平均数.3.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:那么20名学生决赛成绩的众数和中位数分别是( ) A .85,90 B .85,87.5C .90,85D .95,90【答案】B 【解析】试题解析:85分的有8人,人数最多,故众数为85分; 处于中间位置的数为第10、11两个数, 为85分,90分,中位数为87.5分. 故选B .考点:1.众数;2.中位数4.某单位招考技术人员,考试分笔试和面试两部分,笔试成绩与面试成绩按6:4记入总成绩,若小李笔试成绩为80分,面试成绩为90分,则他的总成绩为( ) A .84分 B .85分C .86分D .87分【答案】A 【解析】 【分析】按照笔试与面试所占比例求出总成绩即可. 【详解】根据题意,按照笔试与面试所占比例求出总成绩:648090841010⨯+⨯=(分) 故选A 【点睛】 本题主要考查了加权平均数的计算,解题关键是正确理解题目含义.5.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于本次训练,有如下结论:①22s s >甲乙;②22s s <甲乙;③甲的射击成绩比乙稳定;④乙的射击成绩比甲稳定.由统计图可知正确的结论是( )A.①③B.①④C.②③D.②④【答案】C【解析】【分析】从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案.【详解】由图中知,甲的成绩为7,7,8,9,8,9,10,9,9,9,乙的成绩为8,9,7,8,10,7,9,10,7,10,x甲=(7+7+8+9+8+9+10+9+9+9)÷10=8.5,x乙=(8+9+7+8+10+7+9+10+7+10)÷10=8.5,甲的方差S甲2=[2×(7-8.5)2+2×(8-8.5)2+(10-8.5)2+5×(9-8.5)2]÷10=0.85,乙的方差S乙2=[3×(7-8.5)2+2×(8-8.5)2+2×(9-8.5)2+3×(10-8.5)2]÷10=1.45,∴S2甲<S2乙,∴甲的射击成绩比乙稳定;故选:C.【点睛】本题考查方差的定义与意义:一般地设n个数据,x1,x2,…x n的平均数为x,则方差S2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.6.下面是甲、乙两人10次射击成绩(环数)的条形统计图,则下列说法正确的是()A.甲比乙的成绩稳定B.乙比甲的成绩稳定C.甲、乙两人的成绩一样稳定D.无法确定谁的成绩更稳定【答案】B【解析】【分析】【详解】通过观察条形统计图可知:乙的成绩更整齐,也相对更稳定,故选B.7.回忆位中数和众数的概念;8.一组数据1,5,7,x的众数与中位数相等,则这组数据的平均数是()A.6 B.5 C.4.5 D.3.5【答案】C【解析】若众数为1,则数据为1、1、5、7,此时中位数为3,不符合题意;若众数为5,则数据为1、5、5、7,中位数为5,符合题意,此时平均数为15574+++= 4.5;若众数为7,则数据为1、5、7、7,中位数为6,不符合题意;故选C.9.已知一组数据:6,2,8,x,7,它们的平均数是6.则这组数据的中位数是()A.7 B.6 C.5 D.4【答案】A【解析】分析:首先根据平均数为6求出x的值,然后根据中位数的概念求解.详解:由题意得:6+2+8+x+7=6×5,解得:x=7,这组数据按照从小到大的顺序排列为:2,6,7,7,8,则中位数为7.故选A.点睛:本题考查了中位数和平均数的知识,将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数;平均数是指在一组数据中所有数据之和再除以数据的个数.10.下列说法正确的是 ()A.要调查现在人们在数学化时代的生活方式,宜采用普查方式B.一组数据3,4,4,6,8,5的中位数是4C.必然事件的概率是100%,随机事件的概率大于0而小于1D.若甲组数据的方差2s甲=0.128,乙组数据的方差2s乙=0.036,则甲组数据更稳定【答案】C 【解析】 【分析】直接利用概率的意义以及全面调查和抽样调查的意义、中位数、方差的意义分别分析得出答案. 【详解】A 、要调查现在人们在数学化时代的生活方式,宜采用抽查的方式,故原说法错误;B 、一组数据3,4,4,6,8,5的中位数是4.5,故此选项错误;C 、必然事件的概率是100%,随机事件的概率大于0而小于1,正确;D 、若甲组数据的方差s 甲2=0.128,乙组数据的方差s 乙2=0.036,则乙组数据更稳定,故原说法错误; 故选:C . 【点睛】此题考查概率的意义,全面调查和抽样调查的意义、中位数、方差的意义,正确掌握相关定义是解题关键.11.某班统计一次数学测验成绩的平均分与方差,计算完毕以后才发现有位同学的分数还未登记,只好重新算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( ) A .1x x <,221s s = B .1x x =,221s s > C .1x x =,221s s < D .1x x =,221s s =【答案】B 【解析】 【分析】根据平均数和方差的公式计算比较即可. 【详解】设这个班有n 个同学,数据分别是a 1,a 2,…a i …,a n , 第i 个同学没登录, 第一次计算时总分是(n−1)x , 方差是s 2=11n -[(a 1−x)2+…(a i−1−x)2+(a i+1−x)2+…+(a n −x)2] 第二次计算时, x =()1n x x n-+=x ,方差s 12=1n [(a 1−x)2+…(a i−1−x)2+(a i −x)2+(a i+1−x)2+…+(a n −x)2]=1n n-s 2, 故221s s >, 故选B . 【点睛】此题主要考查平均数和方差的计算,解题的关键是熟知其计算方法.12.5、2.4、2.4、2.4、2.3的中位数是2.4,选项C不符合题意.15×[(2.3﹣2.4)2+(2.4﹣2.4)2+(2.5﹣2.4)2+(2.4﹣2.4)2+(2.4﹣2.4)2]=15×(0.01+0+0.01+0+0)=15×0.02=0.004∴这组数据的方差是0.004,∴选项D不符合题意.故选B.【点睛】此题主要考查了中位数、众数、算术平均数、方差的含义和求法,要熟练掌握.13.小王在清点本班为偏远贫困地区的捐款时发现,全班同学捐款的钞票情况如下:100元的3 张,50元的9张,10元的23张,5元的10张.在这些不同面额的钞票中,众数是()A.10 B.23 C.50 D.100【答案】A【解析】【分析】根据众数就是一组数据中,出现次数最多的数,即可得出答案.【详解】∵100元的有3 张,50元的有9张,10元的有23张,5元的有10张,其中10元的最多,∴众数是10元.故答案为A.【点睛】本题考查众数的概念.,一组数据中出现次数做多的数叫做众数.14.一组数据,6、4、a、3、2的平均数是5,这组数据的方差为()A.8 B.5 C.6 D.3【答案】A【解析】【分析】先由平均数的公式计算出a的值,再根据方差的公式计算即可.【详解】∵数据6、4、a、3、2平均数为5,∴(6+4+2+3+a)÷5=5,解得:a=10,∴这组数据的方差是15[(6-5)2+(4-5)2+(10-5)2+(2-5)2+(3-5)2]=8.故选:A.【点睛】此题考查平均数,方差,解题关键在于掌握它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.15.甲、乙两班举行电脑汉字输入比赛,参赛学生每分输入汉字的个数统计结果如下表:某同学分析上表后得到如下结论:①甲、乙两班学生平均成绩相同;②乙班优秀的人数多于甲班优秀的人数(每分输入汉字个数150为优秀)③甲班成绩的波动比乙班大.上述结论中正确的是()A.①②③B.①②C.①③D.②③【答案】A【解析】【分析】平均水平的判断主要分析平均数;优秀人数的判断从中位数不同可以得到;波动大小比较方差的大小.【详解】从表中可知,平均字数都是135,①正确;甲班的中位数是149,乙班的中位数是151,比甲的多,而平均数都要为135,说明乙的优秀人数多于甲班的,②正确;甲班的方差大于乙班的,又说明甲班的波动情况大,所以③也正确.①②③都正确.故选:A.【点睛】此题考查平均数,中位数,方差的意义.解题关键在于掌握平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.16.某校为了解学生的课外阅读情况,随机抽取了一个班级的学生,对他们一周的读书时间进行了统计,统计数据如下表所示:则该班学生一周读书时间..的中位数和众数分别是( )A .9,8B .9,9C .9.5,9D .9.5,8【答案】A 【解析】 【分析】根据中位数和众数的定义进行解答即可. 【详解】由表格,得该班学生一周读书时间的中位数和众数分别是9,8. 【点睛】本题主要考查了中位数和众数,掌握中位数和众数的定义及求法是解答的关键.17.为考察两名实习工人的工作情况,质检部将他们工作第一周每天生产合格产品的个数整理成甲,乙两组数据,如下表:关于以上数据,说法正确的是( ) A .甲、乙的众数相同 B .甲、乙的中位数相同 C .甲的平均数小于乙的平均数 D .甲的方差小于乙的方差【答案】D 【解析】 【分析】分别根据众数、中位数、平均数、方差的定义进行求解后进行判断即可得. 【详解】甲:数据7出现了2次,次数最多,所以众数为7, 排序后最中间的数是7,所以中位数是7,26778==65x ++++甲,()()()()()2222221S =26666767865⎡⎤⨯-+-+-+-+-⎣⎦甲=4.4,乙:数据8出现了2次,次数最多,所以众数为8, 排序后最中间的数是4,所以中位数是4, 23488==55x 乙++++,()()()()()2222221S =25354585855乙⎡⎤⨯-+-+-+-+-⎣⎦=6.4,所以只有D 选项正确, 故选D. 【点睛】本题考查了众数、中位数、平均数、方差,熟练掌握相关定义及求解方法是解题的关键.18.体育课上,某班两名同学分别进行了5次短跑训练,要判断哪一位同学的成绩比较稳定,通常要比较两名同学成绩的( ) A .平均数 B .方差C .众数D .中位数【答案】B 【解析】 【分析】平均数、众数、中位数反映的是数据的集中趋势,方差反映的是数据的离散程度,方差越大,说明这组数据越不稳定,方差越小,说明这组数据越稳定. 【详解】解:由于方差能反映数据的稳定性,故需要比较这两名同学5次短跑训练成绩的方差.故选B. 【点睛】考核知识点:均数、众数、中位数、方差的意义.19.一组数据0、-1、3、2、1的极差是( ) A .4 B .3C .2D .1【答案】A 【解析】 【分析】根据极差的概念最大值减去最小值即可求解. 【详解】解:这组数据:0、-1、3、2、1的极差是:3-(-1)=4. 故选A . 【点睛】本题考查了极差的知识,极差是指一组数据中最大数据与最小数据的差.20.已知一组数据a ,b ,c 的平均数为5,方差为4,那么数据a ﹣2,b ﹣2,c ﹣2的平均数和方差分别是.()A.3,2 B.3,4 C.5,2 D.5,4【答案】B【解析】试题分析:平均数为(a−2 + b−2 + c−2 )=(3×5-6)=3;原来的方差:;新的方差:,故选B.考点:平均数;方差.。
数据模型与决策练习题含答案
1、某企业目前的损益状况如在下:销售收入(1000件×10元/件) 10 000销售成本:变动成本(1000件×6元/件) 6 000固定成本 2 000销售和管理费(全部固定) 1 000利润 1 000(1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。
为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。
请做出选择,哪一个方案更有利?(2)假设企业欲使利润增加50%,即达到1500元,可以从哪几个方面着手,采取相应的措施。
2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费0.70元,单位变动管理费0.30元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少?如拟实现净利500元,应产销多少件产品?3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元):产品甲乙丙要求:(1)计算各产品的边际贡献;(2)计算加权平均边际贡献率;(3)根据加权平均边际贡献率计算预期税前利润。
4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。
则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少?5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:单价1009095单位变动成本807580销量12000150008000企业编号12345678910合计生产性固定资产价值(万元)3189102004094155023141210102212256525工业总产值(万元)52410196388159139286051516121916249801(1)说明两变量之间的相关方向;(2)建立直线回归方程;(3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。
数据分析算法与模型(一)(附答案)
数据分析算法与模型模拟题(一)一、计算题(共4题,100分)1、影响中国人口自然增长率的因素有很多,据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。
(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。
暂不考虑文化程度及人口分布的影响。
从《中国统计年鉴》收集到以下数据(见表1):表1中国人口增长率及相关数据年份人口自然增长率(%。
)国民总收入(亿元)居民消费价格指数增长率(CPI)%人均GDP(元)1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 78582001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024设定的线性回归模型为:算法1多元线性回归.xlsx(1)求出模型中的各个参数,试从多个角度评价此线性回归模型,并检验模型的经济意义;(2)检验模型中是否存在多重共线性问题(逐步回归),若有,试消除多重共线性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Kano模型
产品不提供此功能
喜欢
理应如此
无所谓
能忍受
不喜欢
产品提供此功能
喜欢
Q
A
A
A
O
理应如此
R
I
I
I
M
无所谓
R
I
I
I
M
能忍受
R
I
I
I
M
不喜欢
R
R
R
R
Q
(4)假设基于对240名受访者的调研,得到下表,请算出这5种功能各自的worse系数和better系数,并基于这两个系数判断这5中功能的属性类别
逻辑回归的方程:In[P(Y)/1- P(Y)]= 0.9922+1.4626X1+1.5556X2-2.1949X3-2.2906X4
将预测结果和原训练集中的实际分类进行对比,得到如下混淆矩阵和计算出相应的准确率、召回率,结果如下:
0.9733
0.9936
0
0.9459
1
0.9722
35
1
1
0.95
->
{e}
0.4
1
1.25
17
{d,e}
->
{a}
0.4
0.8
1.1429
18
{a,e}
->
{d}
0.4
0.6667
1.1111
所有项集:{e},{a},{d},{b},{c},{a,e},{d,e},{b,e},{d,a},{b,a},{a,d,e}
支持度最大的二项频繁项目集:{a,e},支持度为0.6
定时、防干烧属性增加功能后,满意度并未大幅提升,低于平均水平,消除功能后不满意系数较小,属于无差异属性。
(5)请对该燃气灶的这5项功能开发提出建议
a.对于煤气灶的“快速而准确地打火”这种必备属性,公司要保证基本质量特性符合规格,实现满足顾客的基本要求,售后服务应集中在怎样降低故障出现率上;
b.对于煤气灶的“防风”这种期望属性,公司生产和服务部门应关心怎样提高规格。不断提高质量特性,促进顾客满意度的提升;
c. 对于煤气灶的“不粘油”这种魅力属性,公司需要通过满足顾客潜在需求,关注如何在维持前两个质量的基础上,探究顾客需求,创造新产品和增加意想不到的新质量;
d.对于煤气灶的“防干烧”这个属性,介于无关异属性与魅力属性之间,定位的到位,就是魅力属性,定位的不到位,就是无差异属性。公司需要进一步进行客户细分,公司应关注如何在维持前三个质量的基础上,探究顾客在什么样的工作环境下需要防干烧这个功能需求,定位于特殊顾客群体。
0.5
0.8333
1.0417
8
{e}
->
{d}
0.5
0.625
1.0417
9
{b}
->
{e}
0.5
0.8333
1.0417
10
{e}
->
{b}
0.5
0.625
1.0417
13
{a,d}
->
{e}
0.4
1
1.25
14
{d,e}
->
{a}
0.4
0.8
1.1429
15
{a,e}
->
{d}
0.4
0.6667
由混淆矩阵可知Accuracy和准确率召回率都比较大,模型预测效果较好,泛化误差不大,可以用该模型进行预测分析。
(3)给出一组预测数据,根据训练模型结果预测,写出预测结果。
模型预测结果为:y_predict_newDATA:0011000101
正确答案:
解析:提示:
测试数据结果计算.xls
3.下表为购物篮事物数据:
考试模拟样题—数据分析算法与模型
一
1.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:
一元线性回归.xlsx
一元线性回归预测.xlsx
要求:
正确答案:(1)绘制散点图,并计算相关系数,说明二者之间的关系;
解析:(1)数据类型均为数值型数据,没有缺失值,数据展示散点图如下:
鸢尾花训练数据.xlsx
鸢尾花测试数据.xlsx
鸢尾花预测数据.xlsx
(1)根据训练数据,用类型_num作为因变量Y,其他变量作为自变量X,做逻辑回归,写出逻辑回归的方程。
数值类型是数据型,没有缺失值;
根据箱型图进行了异常值分析,占比比较少,可能是数据分类的特征,因此不进行异常值处理;
相关系统矩阵分析,虽然存在相关,但是相关性不是特别强,所以不进行处理。
0.9744
40
由混淆矩阵可知Accuracy和准确率召回率都比较大,模型预测效果较好,训练误差不大。可以用该模型进行预测。
(2) 根据测试数据得到的结果,写出逻辑回归的混淆矩阵,以及准确率和召回率,Accuracy和F1的值(可根据测试数据结果计算表格得到测试数据集的相应的结果)。
将训练数据和测试数据进行预测,对比测试数据的预测结果和实际分类,得到如下混淆矩阵和计算出相应的Accuracy、准确率召回率,结果如下:
人均GDP与人增消费水平正相关,相关系数为0.9981,相关性比较大。
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义;
Y=734.6928+0.3087*X1 人均GDP基数为734.6928,随着人均收入0.3087倍的增长,人均消费水平随之增长。
1.0417
11
{e}
->
{b}
0.5
0.625
1.0417
12
{d}
->
{a}
0.4
0.6667
0.9524
13
{a}
->
{d}
0.4
0.5714
0.9524
14
{b}
->
{a}
0.4
0.6667
0.9524
15
{a}
->
{b}
0.4
0.5714
0.9524
16
{a,d}
(2)描绘通用调查问题
(3)作出属性类别表
(4)计算worse和better系数,并画出象限图
(5)给出开发建议
(3)计算判定系数,并解释其意义;
R方为0.9963,接近于1,模型拟合度很好。
(4)检验回归方程线性关系的显著性(a=0.05);
F检验:p值<0.05,模型整体线性关系显著。
T检验:p值<0.05,所对应的自变量对因变量的影响显著。
(5)如果某地区的人均GDP为5000元,预测其人均消费水平;
人均消费水平为2278.1066。
不粘油属性增加功能后,满意度大幅度提升,但消除此功能后,满意度下降较少,属于魅力属性。
防风属性增加功能后,满意度略高于平均水平,消除功能后不满意系数较高,属于期望属性,属于企业重点开发的产品属性。
快速而准确地打火属性增加功能后,满意度系数较小,低于平均满意度系数水平,但消除后不满意度系数较大,属于必备属性。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。(所有结果均保留三位小数)
置信区间[1990.749,2565.464]和预测区间[1580.463,2975.750]。
2.根据以下给出的数据进行分析,本次给出鸢尾花数据,其中包含萼片长、萼片宽、花瓣长、花瓣宽、以及花的类型数据,请根据以下问题进行回答。(本题数据提供在excel里面,数据分析为三份,一份训练数据,一份测试数据,一份预测数据)
(2)在第一问基础上设minconfidence=60%,找出所有的有效强关联规则。
最小支持度0.4,最小置信度0.6,提升度大于1为有效强关联规则:
支持度排名
项目1
项目2
支持度
置信度
提升度
5
{a}
->
{e}
0.6
0.8571
1.0714
6
{e}
->
{a}
0.6
0.75
1.0714
7
{d}
->
{e}
1.1111
4.某厨卫公司要开发一款燃气灶产品,列举出5个可作为卖点的功能属性:防风、定时、防干烧、不沾油、快速而准确地打火。
该公司的产品设计人员不知道该主要开发哪项功能,分析师小李向公司提出了使用KANO模型对上述五个功能进行调研分类的想法。
并得到了公司的支持。假设你是小李
(1)请你绘制KANO模型图来介绍对功能属性分类的思路
(2)请你对燃气灶的防干烧功能属性设计调查问题
如果燃气灶拥有防干烧功能,你感觉如何?
如果燃气灶没有防干烧功能,你感觉如何?
1.我喜欢
1.我喜欢
2.它理应如此
2.它理应如此
3.无所谓
3.无所谓
4.我能忍受
4.我能忍受
5.我不喜欢
5.我不喜欢
(3)针对燃气灶的防干烧功能,受访者有多少种可能的回答组合,请写出每一种回答组合所对应的属性类别符号(符号见最后一行题注)
{b}
0.6
0.61Biblioteka 7{}->
{c}
0.5
0.5
1
5
{a}
->
{e}
0.6
0.8571
1.0714
6
{e}
->
{a}
0.6