数据分析与处理答案
Excel 数据处理与分析实例教程 第3版)-课后习题答案 第1章 Excel基础[2页]
第1章Excel基础一、选择题二、填空题1.功能相关2.【Ctrl】+【F1】3.单元格地址或名称4.用密码进行加密5.结构三、问答题1.Excel操作界面由哪几部分构成?Excel的操作界面主要由标题栏、快速访问工具栏、功能区、名称框、编辑栏、工作表区域和状态栏等几个部分组成。
2.什么是工作簿?如何保护工作簿?工作簿是一个Excel文件,Excel 2016文件扩展名为.xlsx,主要用于计算和存储数据。
为了防止他人随意使用或更改工作簿的结构和内容,可以对其进行保护,以确保工作簿的安全。
保护工作簿包括两个方面:一是保护工作簿中的结构和窗口;二是保护工作簿文件不被查看和更改。
具体方法见教材。
3.新建工作薄中默认的工作表数是多少?如何增加工作表数?默认的工作表数是1个。
增加工作表数的具体操作步骤见教材。
4.如何将最近打开的工作簿文件固定在“最近使用的工作簿”文档列表中?具体操作步骤见教材。
5.多人协作建立工作簿的优势是什么?如何协作完成?多人协作建立工作簿的优势是:发挥各自优势,实现团队协作,共同处理工作簿,提高工作效率。
可以通过Excel提供的共享工作簿功能,实现创建工作簿的操作。
具体思路是:(1)创建共享工作簿。
在多人同时编辑同一个工作簿之前,首先需要在已连接在网上的某台计算机的特定文件夹下创建一个共享工作簿。
这个文件夹应该是多人均可访问的共享文件夹。
(2)编辑共享工作簿。
创建后将共享工作簿打开,然后可以像使用常规工作簿一样,在其中输入和编辑数据。
(3)停止共享工作簿。
完成协同输入或编辑操作后,停止工作簿的共享。
数据分析笔试题目及答案解析
数据分析笔试题目及答案解析数据分析笔试题目及答案解析——第1题——1. 从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整群抽样答案:A——第2题——2. 一组数据,均值中位数众数,则这组数据A. 左偏B. 右偏C. 钟形D. 对称答案:B「题目解析」分布形状由众数决定,均值大于众数的化,说明峰值在左边,尾巴在右边,所以右偏。
偏态是看尾巴在哪边。
——第3题——3. 对一个特定情形的估计来说,置信水平越低,所对应的置信区间?A. 越小B. 越大C. 不变D. 无法判断答案:A「题目解析」根据公式,Z减小,置信区间减小。
——第4题——4.关于logistic回归算法,以下说法不正确的是?A. logistic回归是当前业界比较常用的算法,用于估计某种事物的可能性B. logistic回归的目标变量可以是离散变量也可以是连续变量C. logistic回归的结果并非数学定义中的概率值D. logistic回归的自变量可以是离散变量也可以是连续变量答案:B「题目解析」逻辑回归是二分类的分类模型,故目标变量是离散变量,B错;logisitc回归的结果为“可能性”,并非数学定义中的概率值,不可以直接当做概率值来用,C对。
——第5题——5.下列关于正态分布,不正确的是?A. 正态分布具有集中性和对称性B. 期望是正态分布的位置参数,描述正态分布的集中趋势位置C. 正态分布是期望为0,标准差为1的分布D. 正态分布的期望、中位数、众数相同答案:C「题目解析」N(0,1)是标准正态分布。
——第6题——6. 以下关于关系的叙述中,正确的是?A. 表中某一列的数据类型可以同时是字符串,也可以是数字B. 关系是一个由行与列组成的、能够表达数据及数据之间联系的二维表C. 表中某一列的值可以取空值null,所谓空值是指安全可靠或零D. 表中必须有一列作为主关键字,用来惟一标识一行E. 以上答案都不对答案:B「题目解析」B. 关系是一张二维表,表的每一行对应一个元组,每一列对应一个域,由于域可以相同,所以必须对每列起一个名字,来加以区分,这个名字称为属性。
《Excel数据处理与分析》习题库
1.在Excel工作表的单元格中,如想输入数字字符串014812(学号),则应输入()。
A.“0014812“B."0014812"C.“014812”D.'0014812正确答案是:D2.在Excel工作表中,对单元格的引用有多种,被称为绝对引用的是()。
A.B$1B.$B$1C.B1D.$B1正确答案是:B3.在Excel工作表中,对单元格的引用有多种,被称为相对引用的是()。
A.D1B.D$1C.$D$1D.$D1正确答案是:A4.若在Excl某工作表的A1、B1单元格中分别填入了6.5和7,并将这2个单元格选中,然后向右拖动填充柄,在C1和D1中分别填入的数据是7.5,8。
A.对B.错正确答案是:A5.Exel单元格中输入字符的格式可以设置为()。
A.左对齐B.右对齐C.居中对齐D.两端对齐正确答案是:A,B,C6.在Excel 2010 中,进行分类汇总之前,我们必须对数据清单进行。
A.筛选B.对齐C.排序D.求和计算正确答案是:C7.关于筛选,叙述不正确的是()。
A.自动筛选可以同时显示数据区域和筛选结果B.高级筛选可以进行更复杂条件的筛选C.高级筛选不需要建立条件区,只有数据区域就可以了D.自动筛选可以将筛选结果放在指定的区域正确答案是:A,C,D8.使用Excel的数据筛选功能,是将()。
A.满足条件的记录显示出来,而删除掉不满足条件的数据B.不满足条件的数据用另外一个工作表来保存起来C.不满足条件的记录暂时隐藏起来,只显示满足条件的数据D.将满足条件的数据突出显示正确答案是:C9.以下哪种方式可在Excel中输入数值-6 ()_。
A.“6B.\\6正确答案是:D10.某单位要统计各科室人员工资情况,按工资从高到低排序,若工资相同,按工龄降序排列,则以下做法正确的是()。
A.主要关键字为"科室",次要关键字为"工资",第二个次要关键字为"工龄"B.主要关键字为"工资",次要关键字为"工龄",第二个次要关键字为"科室"C.主要关键字为"工龄",次要关键字为"工资",第二个次要关键字为"科室"D.主要关键字为"科室",次要关键字为"工龄",第二个次要关键字为"工资"正确答案是:A11.关于Excel区域定义不正确的论述是()。
数据分析及应用试题库及答案
数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。
A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。
A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。
数据分析与信息处理测试 选择题 61题
1题1. 在数据分析中,以下哪个步骤通常是第一步?A. 数据清洗B. 数据收集C. 数据可视化D. 数据建模2. 数据清洗的主要目的是什么?A. 增加数据量B. 删除无关数据C. 提高数据质量D. 加快数据处理速度3. 下列哪个工具最适合用于大数据分析?A. ExcelB. SQLC. HadoopD. Access4. 数据可视化的主要目的是什么?A. 隐藏数据B. 美化数据C. 展示数据D. 压缩数据5. 在数据分析中,描述性统计分析主要关注什么?A. 数据的变化趋势B. 数据的分布和集中趋势C. 数据的因果关系D. 数据的预测模型6. 下列哪个是数据仓库的主要功能?A. 数据加密B. 数据备份C. 数据集成D. 数据销毁7. 数据挖掘的主要目的是什么?A. 发现数据中的模式和关联B. 删除数据中的错误C. 增加数据的存储空间D. 加快数据输入速度8. 在数据分析中,预测性分析主要使用哪种技术?A. 回归分析B. 聚类分析C. 关联规则D. 因子分析9. 下列哪个是数据分析师的主要职责?A. 数据输入B. 数据分析和解释C. 数据存储D. 数据删除10. 数据分析项目中,以下哪个步骤最耗时?A. 数据收集B. 数据清洗C. 数据建模D. 数据可视化11. 在数据分析中,以下哪个工具常用于处理结构化数据?A. PythonB. RC. SQLD. Tableau12. 数据分析中的“数据湖”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据加密技术13. 在数据分析中,以下哪个步骤可以帮助理解数据的内在结构?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘14. 数据分析中的“数据集市”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据加密技术15. 在数据分析中,以下哪个工具常用于数据可视化?A. ExcelB. SQLC. HadoopD. Access16. 数据分析中的“数据治理”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据管理策略17. 在数据分析中,以下哪个步骤可以帮助发现数据中的异常值?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘18. 数据分析中的“数据字典”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据描述文档19. 在数据分析中,以下哪个工具常用于处理非结构化数据?A. PythonB. RC. SQLD. Tableau20. 数据分析中的“数据质量”是什么?A. 数据的准确性和完整性B. 数据的存储空间C. 数据的处理速度D. 数据的加密技术21. 在数据分析中,以下哪个步骤可以帮助提高数据的可解释性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘22. 数据分析中的“数据集成”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据合并技术23. 在数据分析中,以下哪个工具常用于数据挖掘?A. ExcelB. SQLD. Access24. 数据分析中的“数据模型”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据表示方法25. 在数据分析中,以下哪个步骤可以帮助预测未来趋势?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘26. 数据分析中的“数据仓库”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据管理策略27. 在数据分析中,以下哪个工具常用于数据清洗?A. ExcelB. SQLC. HadoopD. Access28. 数据分析中的“数据流”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据处理过程29. 在数据分析中,以下哪个步骤可以帮助发现数据中的模式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘30. 数据分析中的“数据集”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一组数据记录31. 在数据分析中,以下哪个工具常用于数据建模?B. SQLC. HadoopD. Access32. 数据分析中的“数据标签”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分类标识33. 在数据分析中,以下哪个步骤可以帮助提高数据的可用性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘34. 数据分析中的“数据备份”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据复制过程35. 在数据分析中,以下哪个工具常用于数据可视化?A. ExcelB. SQLC. HadoopD. Access36. 数据分析中的“数据加密”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据保护技术37. 在数据分析中,以下哪个步骤可以帮助保护数据安全?A. 数据清洗B. 数据建模C. 数据可视化D. 数据加密38. 数据分析中的“数据压缩”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据减少技术39. 在数据分析中,以下哪个工具常用于数据压缩?A. ExcelB. SQLC. HadoopD. Access40. 数据分析中的“数据恢复”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据还原过程41. 在数据分析中,以下哪个步骤可以帮助恢复丢失的数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据恢复42. 数据分析中的“数据迁移”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据转移过程43. 在数据分析中,以下哪个工具常用于数据迁移?A. ExcelB. SQLC. HadoopD. Access44. 数据分析中的“数据同步”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据更新过程45. 在数据分析中,以下哪个步骤可以帮助保持数据的一致性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据同步46. 数据分析中的“数据审计”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据检查过程47. 在数据分析中,以下哪个步骤可以帮助检查数据的质量?A. 数据清洗B. 数据建模C. 数据可视化D. 数据审计48. 数据分析中的“数据归档”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据存储过程49. 在数据分析中,以下哪个步骤可以帮助长期保存数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据归档50. 数据分析中的“数据共享”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分发过程51. 在数据分析中,以下哪个步骤可以帮助数据在不同系统间流通?A. 数据清洗B. 数据建模C. 数据可视化D. 数据共享52. 数据分析中的“数据权限”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据访问控制53. 在数据分析中,以下哪个步骤可以帮助控制数据的访问?A. 数据清洗B. 数据建模C. 数据可视化D. 数据权限54. 数据分析中的“数据标准化”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据格式统一55. 在数据分析中,以下哪个步骤可以帮助统一数据格式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据标准化56. 数据分析中的“数据分类”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分组过程57. 在数据分析中,以下哪个步骤可以帮助组织数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据分类58. 数据分析中的“数据聚合”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据汇总过程59. 在数据分析中,以下哪个步骤可以帮助汇总数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据聚合60. 数据分析中的“数据转换”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据格式变化61. 在数据分析中,以下哪个步骤可以帮助改变数据格式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据转换答案1. B2. C3. C4. C5. B6. C7. A8. A9. B10. B11. C12. A13. D14. A15. A16. D17. A18. D19. A20. A21. C22. D23. C24. D25. B26. A27. A28. D29. D30. D31. B32. D33. A34. D35. A36. D37. D38. D39. C40. D41. D42. D43. B44. D45. D46. D47. D48. D49. D50. D51. D52. D53. D54. D55. D56. D57. D58. D59. D60. D61. D。
数据分析及应用试题库与答案
数据分析及应用试题库与答案一、单选题(共30题,每题1分,共30分)1、python源程序执行的方式A、A 编译执行B、B 解析执行C、C 直接执行D、D 边编译边执行正确答案:B2、实现最长公共子序列利用的算法是()A、A 分治策略B、B 动态规划法C、C 贪心法D、D 回溯法正确答案:B3、以下哪些选项为真?A、A O(log(n))B、B O(n)C、C O(nlog(n))D、D O(n^2)正确答案:B4、for i in range(10,-1,)循环如果自然结束将执行循环内语句(?)次。
A、A 10B、B 9C、C 1D、D 0正确答案:D5、在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是______。
A、A 可行性分析B、B 需求分析C、C 详细设计D、D 程序编码正确答案:B6、已知df为DataFrame对象,提取Pulse列中值大于100并且Calories列中值小于400的行,代码是:()A、A print(df[df( Calories )>300] & (df[ Calories ]B、B print(df[(df[ Pulse ]>100) &&(df[ Calories ]C、C print(df[(df[ Pulse ]>100) and (df[ Calories ]D、D print(df[(df[ Pulse ]>100) &(df[ Calories ]正确答案:D7、pow(2,2,3)返回值为()。
A、A 64B、B 64.0C、C 1D、D 1.0正确答案:C8、下列哪种说法是错误的A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A9、时间复杂度不受数据初始状态影响而恒为的是()。
大数据处理与分析考试试题及答案
大数据处理与分析考试试题及答案一、选择题1. 大数据的定义是以下哪一项?A. 数据量超过1TB的数据B. 数据量超过100TB的数据C. 数据量超过1PB的数据D. 数据量超过1EB的数据答案:C. 数据量超过1PB的数据2. 大数据处理的特点是以下哪一项?A. 数据量大B. 处理速度快C. 数据种类繁多D. 数据质量高答案:A. 数据量大3. 下列哪项属于大数据处理的挑战?A. 存储问题B. 安全问题C. 隐私问题D. 数据质量问题答案:B. 安全问题4. Hadoop是以下哪一个大数据处理框架的代表?A. Apache SparkB. Apache CassandraC. MapReduceD. Apache Kafka答案:C. MapReduce5. 大数据分析的目的是以下哪一项?A. 提高数据存储能力B. 增加数据处理速度C. 发现潜在的业务机会D. 优化数据传输效率答案:C. 发现潜在的业务机会二、填空题1. 关系数据库一般使用______作为数据查询语言。
(SQL)2. 数据治理是保证数据______、______、______和______的一种管理方式。
(准确性、可用性、完整性、安全性)3. 在大数据处理中,______是指对数据进行有效的汇总和调整,以适应分析或查询的需要。
(数据聚合)4. ______是一种数据存储和访问模式,能够有效地存储和查询大规模分布式数据。
(分布式文件系统)5. 大数据分析的常用技术包括______、______和______等。
(机器学习、数据挖掘、自然语言处理)三、简答题1. 请简述大数据处理的四个V特点。
答:大数据处理的四个V特点分别是:Volume(数据量大)、Velocity(处理速度快)、Variety(数据种类繁多)和Value(价值密度低)。
Volume表示大数据的特点是数据量巨大,超出了传统数据库的处理能力;Velocity表示大数据处理需要在短时间内进行高速处理;Variety表示大数据包括结构化数据、非结构化数据和半结构化数据等多种数据类型;Value表示大数据中包含了大量的背景信息和潜在的商业价值。
数据分析与应用试题(附参考答案)
数据分析与应用试题(附参考答案)一、单选题(共60题,每题1分,共60分)1、()是对商品为店铺销售或利润贡献能力的衡量,主要指标包括客单价、毛利率、成本费用利润率等。
A、商品获客能力B、商品盈利能力C、商品运营能力D、商品研发能力正确答案:B2、数据采集遵循的原则不包括()oA、最大数据原则B、数据安全原则C、目的限制原则D、D.合法、公开原则正确答案:A3、EXCE1描述统计结果中,不包括()指标。
A、峰度、偏度B、平均数、标准差C、加权算术平均数D、最大值、最小值正确答案:C4、下列方法中,不是数据规范化方法的是()oA、最大-最小规范化B、零-均值规范化C、平均值规范化D、小数定标规范化正确答案:C5、在网店内的客户交易订单详情表中,以下字段中可作为度量使用的字段是()oA、商品类别B、购买数量C、省份D、客户名称正确答案:D6、以下内容中,不可衡量产品竞争能力的是()。
A、成本优势B、质量优势C、管理人员创新能力D、技术优势正确答案:C7、迷你图与正常的图表功能相似,下列说法正确的是()oA、迷你图可以设置数据标记B、迷你图可以设置图例C、迷你图也有坐标轴D、迷你图占用空间小正确答案:D8、某食品网店3天的成交总额为12880元,这3天的成交商品数量分别为256、468、320件,其件单价为()。
A、17.5B、12.3C、15D、18正确答案:B9、系列关于数据分析流程的说法,错误的是()oA、需求分析是数据分析最重要的一部分B、模型评价能够评价模型的优劣C、分析与建模时只能够使用数值型数据D、数据预处理是能够数据建模的前提正确答案:C10、完成数据采集后对数据进行复查或计算,将其和历史数据进行比较。
同时还要检查字段的完整性,保证核心指标数据完整,属于()检查。
A、完整性检查B、B、准确性检查C、规范性检查D、D、以上都不是正确答案:AIK以下指标中,可以实时反映出账户的竞争力的是()oA、展现量B、点击率C、留存量D、转化率正确答案:A12、从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()oA、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A13、以下关于数据可视化说法错误的是()oA、数据可视化能够化繁为简,增加信息可读性和趣味性B、战略地图是对企业战略要素及其之间因果关系的可视化表示方法C、数据可视化是指通过图形、动画等更加形象、清晰的方法对数据大小进行体现,同时阐释数据间的关系和趋势,使数据分析后得出的结果更加容易使用和理解D、数据可视化由于要实现其功能用途,因此会令人感到枯燥乏味正确答案:D14、以下关于平均数的说法错误的是()oA、平均数一般是指算术平均数B、平均数是非常重要的基础性指标C、能代表总体的一般水平D、体现了总体内各单位的差异正确答案:D15、网站流量数据分析方法有数据清洗、数据提取、数据转化和()oA、数据计算B、数据核对C、数据检查D、数据评估正确答案:A16、从竞争对手分析的角度来看,不包括哪个步骤()oA、从网店整体情况分析B、不需要从评论分析C、从商品信息分析D、从详情页分析正确答案:B17、()是指通过统计、数学或计算的方法对现象进行系统的实证研究。
《excel数据处理与分析》章节测试题与答案
智慧树知到《excel数据处理与分析》章节测试题与答案第一章单元测试1、在Excel中,一个工作簿就是一个Excel文件,其扩展名为()。
A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案:【.XLSX】2、在Excel中,一个工作簿可以包含()工作表。
A:1个B:2个C:多个D:3个答案:【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()。
A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案:【A1:C5】4、以下单元格引用中,下列哪一项属于混合引用()。
A:E3B:$C$18C:$D$13D:B$20答案:【B$20】5、在Excel中,下面关于单元格的叙述正确的是()。
A:在编辑的过程中,单元格地址在不同的环境中会有所变化B:工作表中单元格是由单元格地址来表示的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“#”间隔D:A4表示第4列第1行的单元格答案:【工作表中单元格是由单元格地址来表示的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。
A:$D6B:D$6C:$6DD:6D答案:【D$6】7、在Excel中,进行公式复制时()发生改变。
A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案:【相对地址中所引用的单元格】8、在下列Excel运算符中,优先级最高的是()。
A:&B:<>C::D:^答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。
A:对B:错答案:【对】10、设在单元格A1中有公式:=B1+B2,若将其复制到单元格C1中则公式为=D1+D2。
A:错B:对答案:【对】第二章单元测试1、在Excel中,给当前单元格输入数值型数据时,默认为()。
A:左对齐B:居中C:随机D:右对齐答案:【右对齐】2、在工作表的单元格内输入数据时,可以使用"自动填充"的方法,填充柄是选定区域()的小黑方块。
初中信息技术《数据处理与分析》训练题 (1)(含答案解析)
初中信息技术《数据处理与分析》训练题 (1)一、选择题(本大题共23小题,共46.0分)1.在工作表中,当删除行或列时,后面的行和列会自动向_____或______移动A. 下右B. 下左C. 上右D. 上左观察图1、图2、图3,回答下列小题;【图1】【图2】【图3】2.如图1--图3所示,表示if…elif…else语句的流程图是()。
A. 图1B. 图2C. 图3D. 以上都不是3.如图1--图3所示,表示while语句运行的流程图是()。
A. 图1B. 图2C. 图3D. 以上都不是4.单元格地址是指()A. 没一个单元格B. 每一个单元格的大小C. 单元格所在的工作表D. 单元格在工作表中的位置5.制作饼图的操作步骤()①单击菜单栏上的“插入”②选中表格中的数据③选择饼图样式A. ①②③B. ②③①C. ②①③D. ③②①6.在Excel工作表中,B3单元格对应工作表中的位置是()。
A. 第3列第2行B. 第2列第3行C. 第3列第3行D. 第2列第2行7.在Excel中,如图所示,若单元格E2 中公式为“=B2+C2 + D2”,将其自动填充到单元格E4,则E4中的公式为“=B4 +C4 +D4", 可以看出,在公式中使用的是单元格______公式复制过程中引用的地址会随位置而改变。
A. 地址的相对引用B. 地址的绝对引用C. 地址的相对和绝对引用D. 工作表8.在excel中,不能设置的日期格式是______。
A. 2017-7-15B. 2017.7.15C. 二〇一七年七月十五日D. 7-159.在Excel中表格可以修饰的内容有()。
A. 设置表格的边线B. 填充表格的颜色C. 合并或拆分表格D. 以上选项都正确10.在Excel的工作表中,每个单元格都有其固定的地址,如“A6”表示________A. “A”代表“A”列,“6”代表第“6”行B. ”A”代表”A”行,“6”代表第“6”列C. “A6”代表单元格中的数据D. “A6" 代表单元格中的公式11.在Excel中,是公式的正确输入格式_______。
数据分析及应用试题库及答案
数据分析及应用试题库及答案一、单选题(共40题,每题1分,共40分)1、Matplotlib中的绘制散点图scatter()方法,表示点的透明度的参数是()A、A markerB、B sC、C cD、D alpha正确答案:D2、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C3、求解斐波那契数列第n项的算法最小的时间复杂度为()。
A、A O(N!)B、B O(N^N)C、C O(N)D、D O(LogN)正确答案:D4、神经网络模型训练时,依赖于以下哪一种法则进行参数计算?A、A 最大值法则B、B 最小值法则C、C 链式求导法则D、D 平均求导法则正确答案:C5、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D6、一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。
则年级属性的众数是: ()A、A 一年级B、B 二年级C、C 三年级D、D 四年级正确答案:A7、直接插入排序在最好情况下的时间复杂度为A、A 问题规模是n2B、B 执⾏时间等于n2C、C 执⾏时间与n2成正⾏D、D 问题规模与n2成正⾏正确答案:C8、Python文件的后缀名是()。
A、A .docB、B .vbpC、C .pyD、D .exe正确答案:C9、软件按功能可以分为应用软件、系统软件和支撑软件(或工具软件)。
下面属于应用软件的是______。
A、A 学生成绩管理系统B、B C语言编译程序C、C UNIX操作系统D、D 数据库管理系统正确答案:A10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?A、A 0.9991B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、设某汽车站在某一时间区间内的候车人数服从参数为5的泊松分布,候车人数多于10人的概率A、A 0.2B、B 0.05C、C 0.013695D、D 0.28正确答案:C12、循环队列的存储空间为Q(1:100),初始状态为front=rear=100。
数据分析技术试题库与参考答案
数据分析技术试题库与参考答案一、单选题(共50题,每题1分,共50分)1、请阅读下面一段程序: roll_window = ser_obj.rolling(window=10) 有关上述程序,下面描述错误的是()。
A、窗口的标签为非居中B、窗口的大小为10C、roll_window是一个Period类对象D、默认对一列的数据进行计算正确答案:C2、关于数据重塑的说法中,下列选项描述错误的是()。
A、数据重塑可以将DataFrame转换为SeriesB、stack()方法可以将列索引转换为行索引C、对一个DataFrame使用stack()方法后返回的一定是一个SeriesD、unstack()方法可以将行索引转换为列索引正确答案:C3、当使用resample()方法重新采样时,下列哪个参数可以确定采样的闭合区间?()A、closedB、howC、labelD、fill_method正确答案:A4、关于Series结构,下列描述正确的是()。
A、Series是一个类似于二维数组的对象B、Series由一组数据和与之相关的索引两部分构成C、Series只能保存整数和字符串类型的数据D、Series的索引默认是从1开始正确答案:B5、下列图表中,适用于比较跨类别数据的是()。
A、饼图B、直方图C、散点图D、折线图正确答案:C6、下列pyplot模块的函数中,可以绘制散点图的是()。
A、scatter()B、bar()C、pie()D、hist()正确答案:A7、下列函数中,用于计算整数的绝对值的是()。
A、square()B、sqrt()C、abs()D、floor()E、Abstract正确答案:C8、下列选项中,不属于groupby()方法分组方式的是()。
A、列表或数组B、DataFrame中某列的名称C、字典或SeriesD、集合正确答案:D9、关于agg()方法的使用中,下列描述错误的是()。
数据分析经典测试题及答案解析
数据分析经典测试题及答案解析一、选择题1.关于数据-4,1,2,-1,2,下面结果中,错误的是( ) A .中位数为1 B .方差为26C .众数为2D .平均数为0【答案】B 【解析】 【分析】 【详解】A .∵从小到大排序为-4,-1,,1,2,2,∴中位数为1 ,故正确;B .4121205x -++-+== ,()()()()222224010102022655s --+--+-+-⨯==,故不正确;C .∵众数是2,故正确;D .4121205x -++-+==,故正确;故选B.2.某射击俱乐部将11名成员在某次射击训练中取得的成绩制成如图所示的条形统计图,由图可知,11名成员射击成绩的众数和中位数分别是( )A .8,9B .8,8C .8,10D .9,8【答案】B 【解析】分析:中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可,本题是最中间的那个数;对于众数可由条形统计图中出现频数最大或条形最高的数据写出.详解:由条形统计图知8环的人数最多, 所以众数为8环, 由于共有11个数据,所以中位数为第6个数据,即中位数为8环, 故选B .点睛:本题主要考查了确定一组数据的中位数和众数的能力.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个,则找中间两个数的平均数.3.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示:那么20名学生决赛成绩的众数和中位数分别是( ) A .85,90 B .85,87.5C .90,85D .95,90【答案】B 【解析】试题解析:85分的有8人,人数最多,故众数为85分; 处于中间位置的数为第10、11两个数, 为85分,90分,中位数为87.5分. 故选B .考点:1.众数;2.中位数4.某单位招考技术人员,考试分笔试和面试两部分,笔试成绩与面试成绩按6:4记入总成绩,若小李笔试成绩为80分,面试成绩为90分,则他的总成绩为( ) A .84分 B .85分C .86分D .87分【答案】A 【解析】 【分析】按照笔试与面试所占比例求出总成绩即可. 【详解】根据题意,按照笔试与面试所占比例求出总成绩:648090841010⨯+⨯=(分) 故选A 【点睛】 本题主要考查了加权平均数的计算,解题关键是正确理解题目含义.5.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于本次训练,有如下结论:①22s s >甲乙;②22s s <甲乙;③甲的射击成绩比乙稳定;④乙的射击成绩比甲稳定.由统计图可知正确的结论是( )A.①③B.①④C.②③D.②④【答案】C【解析】【分析】从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案.【详解】由图中知,甲的成绩为7,7,8,9,8,9,10,9,9,9,乙的成绩为8,9,7,8,10,7,9,10,7,10,x甲=(7+7+8+9+8+9+10+9+9+9)÷10=8.5,x乙=(8+9+7+8+10+7+9+10+7+10)÷10=8.5,甲的方差S甲2=[2×(7-8.5)2+2×(8-8.5)2+(10-8.5)2+5×(9-8.5)2]÷10=0.85,乙的方差S乙2=[3×(7-8.5)2+2×(8-8.5)2+2×(9-8.5)2+3×(10-8.5)2]÷10=1.45,∴S2甲<S2乙,∴甲的射击成绩比乙稳定;故选:C.【点睛】本题考查方差的定义与意义:一般地设n个数据,x1,x2,…x n的平均数为x,则方差S2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.6.下面是甲、乙两人10次射击成绩(环数)的条形统计图,则下列说法正确的是()A.甲比乙的成绩稳定B.乙比甲的成绩稳定C.甲、乙两人的成绩一样稳定D.无法确定谁的成绩更稳定【答案】B【解析】【分析】【详解】通过观察条形统计图可知:乙的成绩更整齐,也相对更稳定,故选B.7.回忆位中数和众数的概念;8.一组数据1,5,7,x的众数与中位数相等,则这组数据的平均数是()A.6 B.5 C.4.5 D.3.5【答案】C【解析】若众数为1,则数据为1、1、5、7,此时中位数为3,不符合题意;若众数为5,则数据为1、5、5、7,中位数为5,符合题意,此时平均数为15574+++= 4.5;若众数为7,则数据为1、5、7、7,中位数为6,不符合题意;故选C.9.已知一组数据:6,2,8,x,7,它们的平均数是6.则这组数据的中位数是()A.7 B.6 C.5 D.4【答案】A【解析】分析:首先根据平均数为6求出x的值,然后根据中位数的概念求解.详解:由题意得:6+2+8+x+7=6×5,解得:x=7,这组数据按照从小到大的顺序排列为:2,6,7,7,8,则中位数为7.故选A.点睛:本题考查了中位数和平均数的知识,将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数;平均数是指在一组数据中所有数据之和再除以数据的个数.10.下列说法正确的是 ()A.要调查现在人们在数学化时代的生活方式,宜采用普查方式B.一组数据3,4,4,6,8,5的中位数是4C.必然事件的概率是100%,随机事件的概率大于0而小于1D.若甲组数据的方差2s甲=0.128,乙组数据的方差2s乙=0.036,则甲组数据更稳定【答案】C 【解析】 【分析】直接利用概率的意义以及全面调查和抽样调查的意义、中位数、方差的意义分别分析得出答案. 【详解】A 、要调查现在人们在数学化时代的生活方式,宜采用抽查的方式,故原说法错误;B 、一组数据3,4,4,6,8,5的中位数是4.5,故此选项错误;C 、必然事件的概率是100%,随机事件的概率大于0而小于1,正确;D 、若甲组数据的方差s 甲2=0.128,乙组数据的方差s 乙2=0.036,则乙组数据更稳定,故原说法错误; 故选:C . 【点睛】此题考查概率的意义,全面调查和抽样调查的意义、中位数、方差的意义,正确掌握相关定义是解题关键.11.某班统计一次数学测验成绩的平均分与方差,计算完毕以后才发现有位同学的分数还未登记,只好重新算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( ) A .1x x <,221s s = B .1x x =,221s s > C .1x x =,221s s < D .1x x =,221s s =【答案】B 【解析】 【分析】根据平均数和方差的公式计算比较即可. 【详解】设这个班有n 个同学,数据分别是a 1,a 2,…a i …,a n , 第i 个同学没登录, 第一次计算时总分是(n−1)x , 方差是s 2=11n -[(a 1−x)2+…(a i−1−x)2+(a i+1−x)2+…+(a n −x)2] 第二次计算时, x =()1n x x n-+=x ,方差s 12=1n [(a 1−x)2+…(a i−1−x)2+(a i −x)2+(a i+1−x)2+…+(a n −x)2]=1n n-s 2, 故221s s >, 故选B . 【点睛】此题主要考查平均数和方差的计算,解题的关键是熟知其计算方法.12.5、2.4、2.4、2.4、2.3的中位数是2.4,选项C不符合题意.15×[(2.3﹣2.4)2+(2.4﹣2.4)2+(2.5﹣2.4)2+(2.4﹣2.4)2+(2.4﹣2.4)2]=15×(0.01+0+0.01+0+0)=15×0.02=0.004∴这组数据的方差是0.004,∴选项D不符合题意.故选B.【点睛】此题主要考查了中位数、众数、算术平均数、方差的含义和求法,要熟练掌握.13.小王在清点本班为偏远贫困地区的捐款时发现,全班同学捐款的钞票情况如下:100元的3 张,50元的9张,10元的23张,5元的10张.在这些不同面额的钞票中,众数是()A.10 B.23 C.50 D.100【答案】A【解析】【分析】根据众数就是一组数据中,出现次数最多的数,即可得出答案.【详解】∵100元的有3 张,50元的有9张,10元的有23张,5元的有10张,其中10元的最多,∴众数是10元.故答案为A.【点睛】本题考查众数的概念.,一组数据中出现次数做多的数叫做众数.14.一组数据,6、4、a、3、2的平均数是5,这组数据的方差为()A.8 B.5 C.6 D.3【答案】A【解析】【分析】先由平均数的公式计算出a的值,再根据方差的公式计算即可.【详解】∵数据6、4、a、3、2平均数为5,∴(6+4+2+3+a)÷5=5,解得:a=10,∴这组数据的方差是15[(6-5)2+(4-5)2+(10-5)2+(2-5)2+(3-5)2]=8.故选:A.【点睛】此题考查平均数,方差,解题关键在于掌握它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.15.甲、乙两班举行电脑汉字输入比赛,参赛学生每分输入汉字的个数统计结果如下表:某同学分析上表后得到如下结论:①甲、乙两班学生平均成绩相同;②乙班优秀的人数多于甲班优秀的人数(每分输入汉字个数150为优秀)③甲班成绩的波动比乙班大.上述结论中正确的是()A.①②③B.①②C.①③D.②③【答案】A【解析】【分析】平均水平的判断主要分析平均数;优秀人数的判断从中位数不同可以得到;波动大小比较方差的大小.【详解】从表中可知,平均字数都是135,①正确;甲班的中位数是149,乙班的中位数是151,比甲的多,而平均数都要为135,说明乙的优秀人数多于甲班的,②正确;甲班的方差大于乙班的,又说明甲班的波动情况大,所以③也正确.①②③都正确.故选:A.【点睛】此题考查平均数,中位数,方差的意义.解题关键在于掌握平均数表示一组数据的平均程度.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);方差是用来衡量一组数据波动大小的量.16.某校为了解学生的课外阅读情况,随机抽取了一个班级的学生,对他们一周的读书时间进行了统计,统计数据如下表所示:则该班学生一周读书时间..的中位数和众数分别是( )A .9,8B .9,9C .9.5,9D .9.5,8【答案】A 【解析】 【分析】根据中位数和众数的定义进行解答即可. 【详解】由表格,得该班学生一周读书时间的中位数和众数分别是9,8. 【点睛】本题主要考查了中位数和众数,掌握中位数和众数的定义及求法是解答的关键.17.为考察两名实习工人的工作情况,质检部将他们工作第一周每天生产合格产品的个数整理成甲,乙两组数据,如下表:关于以上数据,说法正确的是( ) A .甲、乙的众数相同 B .甲、乙的中位数相同 C .甲的平均数小于乙的平均数 D .甲的方差小于乙的方差【答案】D 【解析】 【分析】分别根据众数、中位数、平均数、方差的定义进行求解后进行判断即可得. 【详解】甲:数据7出现了2次,次数最多,所以众数为7, 排序后最中间的数是7,所以中位数是7,26778==65x ++++甲,()()()()()2222221S =26666767865⎡⎤⨯-+-+-+-+-⎣⎦甲=4.4,乙:数据8出现了2次,次数最多,所以众数为8, 排序后最中间的数是4,所以中位数是4, 23488==55x 乙++++,()()()()()2222221S =25354585855乙⎡⎤⨯-+-+-+-+-⎣⎦=6.4,所以只有D 选项正确, 故选D. 【点睛】本题考查了众数、中位数、平均数、方差,熟练掌握相关定义及求解方法是解题的关键.18.体育课上,某班两名同学分别进行了5次短跑训练,要判断哪一位同学的成绩比较稳定,通常要比较两名同学成绩的( ) A .平均数 B .方差C .众数D .中位数【答案】B 【解析】 【分析】平均数、众数、中位数反映的是数据的集中趋势,方差反映的是数据的离散程度,方差越大,说明这组数据越不稳定,方差越小,说明这组数据越稳定. 【详解】解:由于方差能反映数据的稳定性,故需要比较这两名同学5次短跑训练成绩的方差.故选B. 【点睛】考核知识点:均数、众数、中位数、方差的意义.19.一组数据0、-1、3、2、1的极差是( ) A .4 B .3C .2D .1【答案】A 【解析】 【分析】根据极差的概念最大值减去最小值即可求解. 【详解】解:这组数据:0、-1、3、2、1的极差是:3-(-1)=4. 故选A . 【点睛】本题考查了极差的知识,极差是指一组数据中最大数据与最小数据的差.20.已知一组数据a ,b ,c 的平均数为5,方差为4,那么数据a ﹣2,b ﹣2,c ﹣2的平均数和方差分别是.()A.3,2 B.3,4 C.5,2 D.5,4【答案】B【解析】试题分析:平均数为(a−2 + b−2 + c−2 )=(3×5-6)=3;原来的方差:;新的方差:,故选B.考点:平均数;方差.。
数据处理分析课后答案
化工数据分析与处理(课后作业)第一章 误差原理与概率分布1、某催化剂车间用一台包装机包装硅铝小球催化剂,额定标准为每包净重25公斤,设根据长期积累的统计资料,知道包装机称得的包重服从正态分布,又其标准差为σ=0.75公斤,某次开工后,为检验包装机的工作是否正常,随机抽取9包催化剂复核其净重分别为:试问包装机目前的工作状况如何? 解:先做原假设 假设H 0:μ=μ0构造统计量:Z =nx /σμ--~N(0,1)-x =∑x i /n=25.45σ=0.75μ=μ0=25 得:Z =1.8查表得:Φ ( 1.8 ) = 0.9641给出适当的α ,取α=0.05,1- α = 0.95 < 0.9641 落在大概率解范围内接受H 0则 μ=μ0 ,即包装机目前工作正常。
气总平均值的0.95置信区间。
解:因为P =1-α=0.95 所以α=1-0.95=0.05σ不知,所以只能用t 分布 即用S 代替σ S 2=1)(--∑-n x x i =0.048515789 S=0.220263-x =3.21令T =nS x /μ--~t(n-1,2α)则有:P(-At <T <At)=1-α=1-0.05n-1=20-1=192α=0.025 查表得:At (19,0.025)=2.0930估计区间为:P(-x -At(n-1, 2α)*n S <μ<-x +At(n-1, 2α)*nS =0.95所以:3.21-2.0930*200.220263<μ<3.21+2.0930*200.220263即:3.21-0.100425<μ<3.21+0.100425所以:3.109575<μ<3.3104253、某厂化验室用A,B 两种方法测定该厂冷却水中的含氯量(ppm ),每天取样一次,下面是试问:这两种方法测量的结果有无显著的差异?一般可取显著水平α=0.01. 解:因为是用两种方法来测同一个溶液,故把所测氯含量为母体。
excel数据处理与分析章节测试题与答案
智慧树知到《 excel 数据处理与分析》章节测试题与答案第一章单元测试1、在Excel 中,一个工作簿就是一个Excel 文件,其扩展名为()A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案: 【.XLSX】2、在Excel 中,一个工作簿可以包含()工作表。
A:1 个B:2 个C:多个D:3 个答案: 【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案: 【A1:C5】4、以下单元格引用中,下列哪一项属于混合引用()。
A:E3B:$C$18C:$D$13D:B$20答案: 【B$20】5、在Excel 中,下面关于单元格的叙述正确的是()。
A:在编辑的过程中,单元格地址在不同的环境中会有所变化B:工作表中单元格是由单元格地址来表示的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“ #”间隔D:A4表示第4列第1行的单元格答案: 【工作表中单元格是由单元格地址来表示的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。
A:$D6B:D$6C:$6DD:6D答案: 【D$6】7、在Excel 中,进行公式复制时()发生改变。
A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案: 【相对地址中所引用的单元格】8、在下列Excel 运算符中,优先级最高的是()。
A:&B:<>C::D:A答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。
A: 对B:错答案: 【对】10、设在单元格A1中有公式:=B1+B2若将其复制到单元格C1中则公式为=D1+D2A:错B:对答案: 【对】第二章单元测试1 、在Excel 中,给当前单元格输入数值型数据时,默认为()。
数据分析面试题及答案
数据分析面试题及答案数据分析面试题及答案1.问题描述在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。
2.当前解决方案针对top k类问题,通常比较好的方案是【分治+trie树/hash+小顶堆】,即先将数据集按照hash方法分解成多个小数据集,然后使用trie树或者hash统计每个小数据集中的query词频,之后用小顶堆求出每个数据集中出频率最高的前K 个数,最后在所有top K中求出最终的top K。
实际上,最优的解决方案应该是最符合实际设计需求的方案,在实际应用中,可能有足够大的内存,那么直接将数据扔到内存中一次性处理即可,也可能机器有多个核,这样可以采用多线程处理整个数据集。
本文针对不同的应用场景,介绍了适合相应应用场景的解决方案。
3.解决方案3.1 单机+单核+足够大内存设每个查询词平均占8Byte,则10亿个查询词所需的内存大约是10^9*8=8G 内存。
如果你有这么大的内存,直接在内存中对查询词进行排序,顺序遍历找出10个出现频率最大的10个即可。
这种方法简单快速,更加实用。
当然,也可以先用HashMap求出每个词出现的频率,然后求出出现频率最大的10个词。
3.2 单机+多核+足够大内存这时可以直接在内存中实用hash方法将数据划分成n个partition,每个partition交给一个线程处理,线程的处理逻辑是同3.1节类似,最后一个线程将结果归并。
该方法存在一个瓶颈会明显影响效率,即数据倾斜,每个线程的处理速度可能不同,快的线程需要等待慢的线程,最终的处理速度取决于慢的线程。
解决方法是,将数据划分成c*n个partition(c>1),每个线程处理完当前partition后主动取下一个partition继续处理,直到所有数据处理完毕,最后由一个线程进行归并。
数据分析课后答案
1117.00、 习题1.3統計資料(1) .由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为 1031680.286、1015.717、1.025、-0.457。
cv -100* S(%)变异系数有公式 x 计算得90.9325。
(2) 中位数为727.50,上四分位数304.35,下四分位数为1893.50 四分位极差由公式R1 =Q ^Q1得到1579.15A 1 ± 1 ± 1M = —Q 1 +—M +—Q 3三均值由公式 4 2 4得到913.1857。
(3) 直方图(4) 茎叶图全国居民Stem-and-Leaf Plot Freque ncy Stem & Leaf9.00 0 . 1222233445.00 0 . 567882.00 1 . 031.00 1 . 71.00 2 . 33.00 2 . 6891.00 3 . 1Stem width: 1000Each leaf: 1 case(s)4000-3000-1X0-o-(5)由箱图可以看出并不异常点統計資料(1).由图可知农村居民的平均数、方差、标准差、偏度、峰度分别为747.86、399673.838、632.198、1.013、-0.451。
由公式可以算得变异系数为84.5342。
(2)中位数530.50 ,上四分位数239.75 ,下四分位数1197.00。
由公式可得四分位极差为957.25,三均值为624.4375。
(3)茎叶图农村居民Stem-and-Leaf PlotFreque ncy Stem & Leaf10.00 0 . 11112223346.00 0 . 5556782.00 1 . 144.00 1 . 7889Stem width: 1000 Each leaf: 1 case(s)2000-1500- socrQ-农村展民箱图表明了并无异常点統計資料(1) 由表可知城镇居民均值、方差、标准差、偏度、峰度为2336.41、4536136.444、2129.821、0.970、-0.573。
数据分析(第二版)答案
数据分析(第二版)答案第一章数据分析基础什么是数据分析?数据分析是一种通过收集、整理、分析和解释数据来获得有意义信息的过程。
它可以帮助我们了解数据中的模式、趋势和关联,并从中获得洞察力以支持决策和解决问题。
数据分析的步骤和流程数据分析一般可以分为以下步骤和流程:1. 确定分析目标:明确想要从数据中获得什么样的信息或解决什么样的问题。
2. 收集数据:获取和收集相应的数据来源,并将其存储在可访问的位置。
3. 整理数据:对数据进行清洗、去重、格式转换等操作,以确保数据的质量和一致性。
4. 探索数据:使用统计学和可视化工具探索数据的分布、关联和异常情况。
5. 分析数据:应用适当的分析技术来发现模式、趋势或其他有意义的信息。
6. 解释结果:将分析的结果转化为可理解的语言,并解释其意义和推论。
7. 做出决策:基于数据分析的结论和洞察,做出相应的决策和行动计划。
常见的数据分析工具数据分析过程中常用的工具有:- 数据处理和清洗:Excel、Python、R等。
- 数据可视化:Tableau、Power BI、Matplotlib、ggplot等。
- 统计分析:SPSS、SAS、Python等。
- 机器学习:Python、R、TensorFlow等。
数据分析的应用领域数据分析在各行各业有着广泛的应用,包括但不限于: -市场营销:通过数据分析来了解客户需求、市场趋势和竞争对手情况,从而制定更有效的市场策略和推广活动。
- 金融服务:利用数据分析预测市场波动、风险评估和投资决策。
- 健康医疗:通过分析患者数据和大量医疗记录,提供更精确的诊断和治疗方案。
- 社交媒体:通过用户行为、兴趣和社交网络分析,提供个性化内容和推荐系统。
- 网络安全:通过分析网络流量和异常行为来检测和防范网络攻击和欺诈行为。
第二章数据收集和整理数据收集方法常见的数据收集方法包括: - 原始数据收集:通过问卷调查、观察、实验等方式直接收集数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、简答题(5×2分,共10分)
1、请解释质量控制图中三条主要控制线的意义:CL、UCL、LCL
未学,不考
2、请解释正交设计表“L934”这个符号所指代的意义。
如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L1645,L3249
L: 正交;9:9行或9次实验;3:3个水平;4:4列或4个因素
选L3249
二、计算题(90分)
1、某分析人员分别进行4次平行测定,得铅含量分别是60.08、71.26、70.63、71.85、,试
分别用3s法、Dixon法和Grubbs检验法判断60.08是否为离群值。
(G0.95
,4
=1.463,Q0.05,5=0.765)(12分)
x=68.455, s=5.61,
3s法:∣60.08-68.455∣=8.447<3s, 应保留
Dixon :
70.6360.08
0.896
71.8560.08
Q
-
==
-
> Q0.05,5=0.765, 应舍去
Grubbs: G计= 60.0868.455/5.61
-=1.49> G0.95,4,应舍去···
2、4次测定结果为:1.12%、1.15%、1.11%、1.16%,根据这些数据估计此样品中铬的含量范围(P=95%)?(8分)
( 2.353%903,10.0=⇒=t P , 3.182%9530.05=⇒=,t P , 5.841%9930.01=⇒=,t P )
x =1.135%, s=0.0238%
1.135 3.1820.0238/ 1.1350.038μ=±⨯=±
3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数据:34.30、34.32、34.26、34.35、34.38、34.29、34.23、34.28。
标准偏差为0.048%,标准值为34.33%问这种新方法是否可靠(P=95%,t 0.05,7=2.365)(10分)
x =34.30 34.3034.33
1.770.048
t -=
=< t 0.05,7,所以新方法可靠
4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为0.55mg/L ,加入0.05mL 浓度为1000mg/L 的标准样品后,测得样品总浓度为0.98mg/L ,求回收率是多少。
(8分) 没讲,不考
5、两分析人员测定某试样中铁的含量,得到如下结果:
已知A 的标准偏差s 1=0.061,B 的标准偏差s 2=0.034,请比较两个人测定结果的精密度和准确的有无显著性差异。
(12分)
F (0.05,4,4)=6.39, t (0.05,8)=2.305
F=0.0612/0.0342=3.22< F (0.05,4,4),故精密度无显著性差异
t=1.42< t(0.05,8),故准确度无显著性差异
5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响,实验因素
水平表如下表。
请完成下列正交表格,并指出各因素的主次顺序,求出最优水平组合,并做方差分析,填方差分析表,并对实验结果做出讨论(可结合因素指标变化图)。
(25分)
因素主次顺序:B>A>C
优水平:A1B3C1
(要求在以下空白处写下方差分析完整计算过程)
6.利用方差分析法,判断某生物处理中污泥负荷对出水水质的影响。
请完成以下方差分析表。
(要求在以下空白处写下方差分析完整计算过程)
附:公式列表
1、对于有限次测量,总体均值µ
的置信区间为(x x -+) 2、Q 检验法:Q 计=(x n -x n-1)/(x n -x 1)或者(x 2-x 1)/(x n -x 1) 3、Grubbs 检验法:G=(x 异常-x )/s
4、F 检验:F=22
12/s s (s 1>s 2)
5、t 检验:
1)
平均值与标准值比较:t =
2) 独立样本t
检验:1t x =6、单因素方差分析:
2211
111()b
a
b a
T ij
ij i j i j S x x ab =====-∑∑∑∑
2
2111111()()b a b a A ij ij i j i j S x x a ab =====-∑∑∑∑
2211
111()b
a
b a
E ij
ij i j i j S x x a =====-∑∑∑∑
S T =S A +S E
f A =b-1; f E =b(a-1); f T =ab-1;
A A A S S f =
; E E E S S f =; A E
S F S = 7. 正交试验设计方差分析
2
1)(1∑==n z z y n P ,∑==b j ij i K a Q 121,∑==n
z z y W 1
2
S i =Q i -P, S E =S 0, i i i f S S =
; E Ei E f S S = ; E
i i S S
F =; 其中,n ——实验总次数,即正交表中排列的总实验次数;b ——某因素下水平数;a ——某因素下同水平的实验次数;——空列项偏差平方和,y z ——指标,Kij ——水平效应值。