数据分析与处理答案

合集下载

数据分析答案完整版(整理)

数据分析答案完整版(整理)
x x xj x x x 1 1 n n x xi j x x j i n 1 i j n 1 i 1 n 1 n 1 n 1 n 1
x n n x j ( x j x) n 1 n 1 n 1
n2
x j x( j ) x j
服 从 正 态 分 布 。 故 有 E xi x E i


1 n j 0 , n j 1
1 n 1 n n 1 2 D xi x D i j E i j ,故 xi x 服从分 n n n j 1 j 1
N (0, 2 I n ) , (1 , 2 ,
, n ) ,则
,1 .
N (0, 2 ( I n H n )) 。其中:

1
1 1 n 1 , H n n 1, n 1 1
n n 1
n 1 n 2 n n 1 2
——证毕—— 3.条件同第 2 题,证明: (1) x N 0, n
2
(2) N 1 S 2 / 2 x2 n 1 , (4 ) t n
x t n 1
由与此变换为正交变换知, yi 2 xi 2 ,同时 x1 , x2 , , xn 为相互独
i 1 i 1
n
n
立的正态分布。
密度函数 f x1 , x2 ,
xi 1 2 2 i 1 由于正交的雅可比行列 , xn e 2 n
2
1 , n 1 , 1 ,由正交性有 n 1
2 , 3n,
a

《Excel数据处理与分析》习题库

《Excel数据处理与分析》习题库

1.在Excel工作表的单元格中,如想输入数字字符串014812(学号),则应输入()。

A.“0014812“B."0014812"C.“014812”D.'0014812正确答案是:D2.在Excel工作表中,对单元格的引用有多种,被称为绝对引用的是()。

A.B$1B.$B$1C.B1D.$B1正确答案是:B3.在Excel工作表中,对单元格的引用有多种,被称为相对引用的是()。

A.D1B.D$1C.$D$1D.$D1正确答案是:A4.若在Excl某工作表的A1、B1单元格中分别填入了6.5和7,并将这2个单元格选中,然后向右拖动填充柄,在C1和D1中分别填入的数据是7.5,8。

A.对B.错正确答案是:A5.Exel单元格中输入字符的格式可以设置为()。

A.左对齐B.右对齐C.居中对齐D.两端对齐正确答案是:A,B,C6.在Excel 2010 中,进行分类汇总之前,我们必须对数据清单进行。

A.筛选B.对齐C.排序D.求和计算正确答案是:C7.关于筛选,叙述不正确的是()。

A.自动筛选可以同时显示数据区域和筛选结果B.高级筛选可以进行更复杂条件的筛选C.高级筛选不需要建立条件区,只有数据区域就可以了D.自动筛选可以将筛选结果放在指定的区域正确答案是:A,C,D8.使用Excel的数据筛选功能,是将()。

A.满足条件的记录显示出来,而删除掉不满足条件的数据B.不满足条件的数据用另外一个工作表来保存起来C.不满足条件的记录暂时隐藏起来,只显示满足条件的数据D.将满足条件的数据突出显示正确答案是:C9.以下哪种方式可在Excel中输入数值-6 ()_。

A.“6B.\\6正确答案是:D10.某单位要统计各科室人员工资情况,按工资从高到低排序,若工资相同,按工龄降序排列,则以下做法正确的是()。

A.主要关键字为"科室",次要关键字为"工资",第二个次要关键字为"工龄"B.主要关键字为"工资",次要关键字为"工龄",第二个次要关键字为"科室"C.主要关键字为"工龄",次要关键字为"工资",第二个次要关键字为"科室"D.主要关键字为"科室",次要关键字为"工龄",第二个次要关键字为"工资"正确答案是:A11.关于Excel区域定义不正确的论述是()。

数据分析及应用试题库及答案

数据分析及应用试题库及答案

数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。

A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。

A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。

误差和分析数据的处理习题及答案(可编辑)

误差和分析数据的处理习题及答案(可编辑)

误差和分析数据的处理习题及答案误差和分析数据的处理 1.指出在下列情况下,各会引起哪种误差?如果是系统误差,应该采用什么方法减免?(1)砝码被腐蚀;(2)天平的两臂不等长;(3)容量瓶和移液管不配套;试剂中含有微量的被测组分;(5)天平的零点有微小变动;(6)读取滴定体积时最后一位数字估计不准;(7)滴定时不慎从锥形瓶中溅出一滴溶液;(8)标定HCl溶液用的NaOH标准溶液中吸收了CO2。

2.如果分析天平的称量误差为±0.2mg,拟分别称取试样0.1g和1g左右,称量的相对误差各为多少?这些结果说明了什么问题? 3.滴定管的读数误差为±0.02mL。

如果滴定中用去标准溶液的体积分别为2mL和20mL左右,读数的相对误差各是多少?从相对误差的大小说明了什么问题? 4.下列数据各包括了几位有效数字?(1)0.0330 (2) 10.030 (3) 0.01020 (4) 8.7×10-5 (5) pKa=4.74 (6) pH=10.00 5.将0.089g Mg2P2O7沉淀换算为MgO的质量,问计算时在下列换算因数(2MgO/Mg2P2O7)中哪个数值较为合适:0.3623,0.362,0.36?计算结果应以几位有效数字报出。

6.用返滴定法测定软锰矿中MnO2质量分数,其结果按下式进行计算:问测定结果应以几位有效数字报出? 7.用加热挥发法测定BaCl2??2H2O中结晶水的质量分数时,使用万分之一的分析天平称样0.5000g,问测定结果应以几位有效数字报出? 8.两位分析者同时测定某一试样中硫的质量分数,称取试样均为3.5g,分别报告结果如下:甲:0.042%,0.041%;乙:0.04099%,0.04201%。

问哪一份报告是合理的,为什么? 9.标定浓度约为0.1mol??L-1的NaOH,欲消耗NaOH溶液20mL左右,应称取基准物质H2C2O4??2H2O 多少克?其称量的相对误差能否达到0. 1%?若不能,可以用什么方法予以改善?若改用邻苯二甲酸氢钾为基准物,结果又如何? 10.有两位学生使用相同的分析仪器标定某溶液的浓度(mol??L-1),结果如下:甲:0.12,0.12,0.12(相对平均偏差0.00%);乙:0.1243,0.1237,0.1240(相对平均偏差0.16%)。

数据分析与处理答案完整版

数据分析与处理答案完整版

数据分析与处理答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、 简答题(5×2分, 共10分)1、请解释质量控制图中三条主要控制线的意义:CL 、UCL 、LCL 未学,不考2、请解释正交设计表“L 934” 这个符号所指代的意义。

如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L 1645,L 3249 L: 正交; 9:9行或9次实验; 3:3个水平 ; 4:4列或4个因素 选L 3249二、计算题(90分)1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s法、Dixon 法和Grubbs 检验法判断是否为离群值。

(,4=, ,5=)(12分)x =, s=,3s 法:∣ 应保留 Dixon :70.6360.080.89671.8560.08Q -==-> ,5=, 应舍去Grubbs: G 计= 60.0868.455/5.61-=> ,4,应舍去···2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)?(8分)( 2.353%903,10.0=⇒=t P , 3.182%9530.05=⇒=,t P ,5.841%9930.01=⇒=,t P )x =%, s=%3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数据:、、、、、、、。

标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=)(10分)x = 34.3034.331.770.048t -==< ,7,所以新方法可靠4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL样品浓度为L,加入浓度为1000mg/L的标准样品后,测得样品总浓度为L,求回收率是多少。

(8分)没讲,不考5、两分析人员测定某试样中铁的含量,得到如下结果:已知A的标准偏差s1=,B的标准偏差s2=,请比较两个人测定结果的精密度和准确的有无显着性差异。

数据分析及应用试题库与答案

数据分析及应用试题库与答案

数据分析及应用试题库与答案一、单选题(共30题,每题1分,共30分)1、python源程序执行的方式A、A 编译执行B、B 解析执行C、C 直接执行D、D 边编译边执行正确答案:B2、实现最长公共子序列利用的算法是()A、A 分治策略B、B 动态规划法C、C 贪心法D、D 回溯法正确答案:B3、以下哪些选项为真?A、A O(log(n))B、B O(n)C、C O(nlog(n))D、D O(n^2)正确答案:B4、for i in range(10,-1,)循环如果自然结束将执行循环内语句(?)次。

A、A 10B、B 9C、C 1D、D 0正确答案:D5、在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是______。

A、A 可行性分析B、B 需求分析C、C 详细设计D、D 程序编码正确答案:B6、已知df为DataFrame对象,提取Pulse列中值大于100并且Calories列中值小于400的行,代码是:()A、A print(df[df( Calories )>300] & (df[ Calories ]B、B print(df[(df[ Pulse ]>100) &&(df[ Calories ]C、C print(df[(df[ Pulse ]>100) and (df[ Calories ]D、D print(df[(df[ Pulse ]>100) &(df[ Calories ]正确答案:D7、pow(2,2,3)返回值为()。

A、A 64B、B 64.0C、C 1D、D 1.0正确答案:C8、下列哪种说法是错误的A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A9、时间复杂度不受数据初始状态影响而恒为的是()。

物联网数据分析与处理考试

物联网数据分析与处理考试

物联网数据分析与处理考试(答案见尾页)一、选择题1. 在物联网数据分析与处理中,以下哪个技术是常用的数据存储技术?A. 关系型数据库B. 非关系型数据库C. 时间序列数据库D. 分布式文件系统2. 物联网数据分析与处理中,哪种图形化工具可以用来展示数据流和数据关系?A. GephiB. Neo4jC. CytoscapeD. Excel3. 在物联网数据分析与处理中,以下哪个算法可以用来进行异常检测?A. K-均值算法B. 随机森林算法C. 支持向量机(SVM)D. 神经网络算法4. 物联网数据分析与处理中,哪种可视化工具可以帮助用户理解复杂的数据集?A. TableauB. D3.jsC. QlikViewD. Power BI5. 在物联网数据分析与处理中,如何对大量数据进行有效降维?A. 主成分分析(PCA)B. 线性判别分析(LDA)C. t-分布邻域嵌入算法(t-SNE)D. 卡方检验6. 物联网数据分析与处理中,哪个编程语言适合开发实时数据处理应用?A. PythonB. JavaC. C++D. JavaScript7. 在物联网数据分析与处理中,哪种数据挖掘技术可以用来发现隐藏的模式和关联?A. 关联规则学习B. 分类算法C. 聚类算法D. 异常检测8. 物联网数据分析与处理中,哪个工具可以帮助用户分析和可视化时间序列数据?A. InfluxDBB. ElasticsearchC. KibanaD. Grafana9. 在物联网数据分析与处理中,哪种机器学习模型可以用来预测未来事件?A. 决策树B. 随机森林C. 神经网络D. 支持向量机(SVM)10. 物联网数据分析与处理的目的是什么?A. 提高设备效率B. 降低运营成本C. 增强安全性D. 提升用户体验11. 在物联网中,以下哪个参数不是用来测量设备性能的?B. 响应时间C. 连接数量D. 设备体积12. 物联网数据分析中,哪种数据类型最重要?A. 结构化数据B. 非结构化数据C. 半结构化数据D. A和B13. 物联网数据收集的方法有哪些?A. 传感器网络B. 通过互联网进行数据传输C. 手机应用D. 无人机巡检14. 在物联网中,以下哪个技术是用于实现设备间的通信?A. 无线电波B. 红外线C. 微波D. 卫星通信15. 物联网数据分析处理中,哪项技术可以实时分析大量数据?A. 大数据技术B. 机器学习技术C. 数据库技术D. 云计算技术16. 物联网数据分析中,如何确保数据的质量和分析准确性?A. 对数据进行清洗和预处理B. 使用高级算法进行分析C. 选择合适的数据源17. 物联网中,哪种设备负责收集和处理数据?A. 传感器B. 智能设备C. 中央控制器D. 云服务提供商18. 物联网数据分析处理的结果如何应用?A. 优化产品设计B. 提升服务质量C. 降低成本D. A和B19. 在物联网数据分析与处理中,以下哪个领域的技术不是关键技术?A. 传感器技术B. 数据存储技术C. 人工智能技术D. 网络安全技术20. 物联网数据分析与处理的目的是什么?A. 提高设备效率B. 降低运营成本C. 增强安全性D. 优化资源分配21. 物联网数据收集的过程中可能遇到的问题有哪些?A. 设备故障B. 网络安全威胁C. 数据量大且复杂D. 数据隐私保护22. 在物联网数据分析中,常用的数据存储技术有哪些?A. 关系型数据库B. 非关系型数据库C. 数据仓库D. 时间序列数据库23. 物联网数据分析中,哪些数据处理技术是常用的?A. 数据清洗B. 数据可视化C. 特征工程D. 模型训练24. 在物联网数据分析中,如何确保数据的安全性和隐私性?A. 加密技术B. 访问控制C. 数据脱敏D. 安全审计25. 物联网数据分析的流程通常包括哪些步骤?A. 数据采集B. 数据预处理C. 数据分析D. 数据可视化和报告26. 在物联网数据分析中,如何选择合适的数据分析工具?A. 根据数据处理需求选择工具B. 考虑工具的易用性和灵活性C. 了解工具的支持和集成能力D. 评估工具的成本效益27. 物联网数据分析中,如何处理时间序列数据?A. 使用专用时间序列数据库B. 对数据进行聚合和转换C. 使用滑动窗口技术D. 应用统计方法进行分析28. 物联网数据分析中,如何评估模型的性能?A. 使用准确率、召回率等指标B. 通过交叉验证来避免过拟合C. 分析模型的偏差和方差D. 根据业务需求调整模型参数29. 物联网数据分析的未来趋势是什么?A. 大数据和云计算的发展B. 人工智能和机器学习的融合C. 物联网设备的智能化D. 数据安全和隐私保护的加强30. 物联网数据分析与处理的目的是什么?A. 提高设备效率B. 降低运营成本C. 增强安全性D. 优化资源分配31. 在物联网中,以下哪个因素对数据传输稳定性影响最大?A. 信号干扰B. 网络覆盖范围C. 设备性能D. 数据量大小32. 物联网数据分析中,以下哪个步骤不是必须的?A. 数据收集B. 数据清洗C. 数据分析D. 数据可视化33. 物联网数据分析中,常用的数据可视化工具是什么?A. ExcelB. TableauC. Power BID. All of the above34. 在物联网数据分析中,如何优化数据处理速度?A. 使用更强大的服务器B. 数据压缩C. 实时数据处理技术D. 数据备份35. 物联网中,以下哪个网络协议被广泛应用?A. HTTPB. MQTTC. TCP/IPD. HTTPS36. 物联网数据分析中,如何保证数据的安全性?A. 加密技术B. 访问控制C. 安全审计D. 数据备份和恢复37. 在物联网项目中,如何有效地进行问题诊断与解决?A. 建立完善的故障排查流程B. 提供专业的技术支持C. 及时更新设备固件D. 加强设备维护38. 物联网数据分析中,如何处理大量的非结构化数据?A. 使用自然语言处理技术B. 对数据进行预处理C. 将数据存储在云端D. 使用数据挖掘技术39. 在物联网发展趋势中,以下哪个领域预计将会有较大的增长?A. 智能家居B. 工业自动化C. 医疗健康D. 零售业40. 物联网数据分析与处理的基本步骤包括哪些?A. 数据收集B. 数据清洗C. 数据转换D. 数据分析E. 数据可视化41. 在物联网中,数据传输协议通常使用哪种标准?A. HTTPB. HTTPSC. MQTTD. CoAP42. 物联网数据分析中,常用的数据挖掘技术有哪些?A. 关联规则挖掘B. 分类算法C. 聚类算法D. 回归算法E. 时间序列分析43. 在物联网数据分析中,如何评估数据的有效性?A. 数据完整性检查B. 数据准确性验证C. 数据时效性分析D. 数据容量评估E. 数据相关性分析44. 物联网数据分析中,如何处理缺失值?A. 删除含有缺失值的记录B. 对含有缺失值的记录进行填充C. 使用平均值填充缺失值D. 使用中位数填充缺失值E. 使用众数填充缺失值45. 在物联网数据分析中,如何识别异常值?A. 使用统计方法B. 使用机器学习算法C. 使用基于模型的方法D. 使用基于规则的方法E. 使用基于聚类的方法46. 物联网数据分析中,如何对数据进行分类和预测?A. 使用决策树算法B. 使用支持向量机算法C. 使用神经网络算法D. 使用随机森林算法E. 使用K-最近邻算法47. 在物联网数据分析中,如何展示数据分析结果?A. 使用表格展示B. 使用图表展示C. 使用地图展示D. 使用仪表盘展示E. 使用文本描述展示48. 物联网数据分析中,如何优化模型性能?A. 调整模型参数B. 增加训练数据量C. 选择更合适的算法D. 减少特征选择E. 使用集成学习方法49. 物联网数据分析与处理的高级阶段是什么?A. 数据存储B. 数据分析C. 数据可视化D. 数据治理E. 数据安全二、问答题1. 物联网数据分析与处理的定义是什么?2. 物联网数据分析与处理的主要环节有哪些?3. 物联网数据分析与处理的技术框架有哪些?4. 如何选择合适的物联网数据分析工具?5. 物联网数据分析与处理在实际应用中的作用是什么?6. 物联网数据分析与处理中可能遇到的挑战有哪些?7. 如何评估物联网数据分析与处理的效果?8. 未来物联网数据分析与处理的发展趋势是什么?参考答案选择题:1. A2. B3. D4. A5. A6. A7. A8. C9. C 10. D11. D 12. D 13. ABC 14. A 15. A 16. D 17. C 18. D 19. B 20. D21. ABCD 22. ABCD 23. ABCD 24. ABCD 25. ABCD 26. ABCD 27. ABCD 28. ABCD 29. ABCD 30. D31. A 32. D 33. D 34. C 35. B 36. D 37. A 38. A 39. C 40. ABCDE41. ABCD 42. ABCDE 43. ABCDE 44. ABCDE 45. ABCDE 46. ABCDE 47. ABCDE 48. ABCDE 49. D问答题:1. 物联网数据分析与处理的定义是什么?物联网数据分析与处理是指利用大数据技术对物联网设备产生的海量数据进行采集、整合、存储、分析和挖掘,以提供有价值的信息和决策支持的过程。

数据分析方法与技术作业及答案

数据分析方法与技术作业及答案

一、填写题(抄题,写答案)1.数据分析“六步曲”按顺序依次是:明确分析目的和内容、数据收集、数据处理、数据分析、数据展现、报告撰写。

2.定量数据一般可分为计量的、计数的、二种类型。

定性数据一般可分为有序的、名义的、二种类型。

3.数据收集方法总的可分为一手数据、二手数据、两大类。

前一类方法常用的具体方法有调查法、观察法、实验法;后一类方法常用的具体方法有机构查询、书刊查询、网络查询。

4.SPSS中有三种主要的工作窗口,它们是:数据编辑窗口、结果浏览窗口、程序编辑窗口;在进行数据表编辑时,有二种主要视图,它们是:数据视图、变量视图。

5.SPSS中对变量属性进行定义时,对变量的命名在Name 栏中设置,定义变量值标签在Values 栏中设置。

6.根据数据的计量性质,可以将数据分为定量的数据和定性的数据;根据数据获得的直接性,可以将数据分为一手数据和二手数据。

7.统计检验的一种思路是:设定原假设H0,构造相应的统计判断量,当根据实验数据或样本数据计算出的统计判断量落在拒绝区域,则拒绝原假设;反之,则落在接受区域,接受原假设。

在SPSS软件的统计操作中,通过计算样本数据的实际显著性概率Sig.,并将其与给定的显著性概率水平α比较,当Sig. < α时(填“>” 或“<” ),则拒绝原假设。

8.方差分析主要用来判断样本数据之间的差异是由不可控的随机因素造成的还是由研究中施加的对结果形成影响的可控因素造成的。

9.因子分析法是多元统计分析中处理降维的一种,其最主要的工作是降维,即将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。

10.下图所示因子分析结果中,数值6.845的含义是第一主成分特征根,数值84.421的含义是前三个主成分的累计贡献率;在Extraction Sums块中,有三行数据,其含义是根据提取因子条件----特征值大于1,共选出了三个公共因子。

数据处理分析课后答案

数据处理分析课后答案

化工数据分析与处理(课后作业)第一章误差原理与概率分布1、某催化剂车间用一台包装机包装硅铝小球催化剂,额定标准为每包净重25公斤,设根据长期积累的统计资料,知道包装机称得的包重服从正态分布,又其标准差为σ=0.75公斤,某次开工后,为检验包装机的工作是否正常,随机抽取9包催化剂复核其净重分别为:解:先做原假设 假设H 0:μ=μ0构造统计量:Z =nx /σμ--~N(0,1)-x =∑x i /n=25.45σ=0.75 μ=μ0=25 得:Z =1.8查表得:Φ ( 1.8 ) = 0.9641给出适当的α ,取α=0.05,1- α = 0.95 < 0.9641 落在大概率解范围内接受H 0则 μ=μ0 ,即包装机目前工作正常。

均值的0.95置信区间。

解:因为P =1-α=0.95 所以α=1-0.95=0.05σ不知,所以只能用t 分布 即用S 代替σ S 2=1)(--∑-n x x i =0.048515789 S=0.220263-x =3.21令T =nS x /μ--~t(n-1,2α)则有:P(-At <T <At)=1-α=1-0.05 n-1=20-1=192α=0.025 查表得:At (19,0.025)=2.0930估计区间为:P(-x -At(n-1, 2α)*n S <μ<-x +At(n-1, 2α)*nS=0.95所以:3.21-2.0930*200.220263<μ<3.21+2.0930*200.220263即:3.21-0.100425<μ<3.21+0.100425所以:3.109575<μ<3.3104253、某厂化验室用A,B 两种方法测定该厂冷却水中的含氯量(ppm ),每天取样一次,下面是七天的记录:试问:这两种方法测量的结果有无显著的差异?一般可取显著水平α=0.01. 解:因为是用两种方法来测同一个溶液,故把所测氯含量为母体。

检验假设H0:μ1=μ2的问题。

数据分析与应用试题(附参考答案)

数据分析与应用试题(附参考答案)

数据分析与应用试题(附参考答案)一、单选题(共60题,每题1分,共60分)1、()是对商品为店铺销售或利润贡献能力的衡量,主要指标包括客单价、毛利率、成本费用利润率等。

A、商品获客能力B、商品盈利能力C、商品运营能力D、商品研发能力正确答案:B2、数据采集遵循的原则不包括()oA、最大数据原则B、数据安全原则C、目的限制原则D、D.合法、公开原则正确答案:A3、EXCE1描述统计结果中,不包括()指标。

A、峰度、偏度B、平均数、标准差C、加权算术平均数D、最大值、最小值正确答案:C4、下列方法中,不是数据规范化方法的是()oA、最大-最小规范化B、零-均值规范化C、平均值规范化D、小数定标规范化正确答案:C5、在网店内的客户交易订单详情表中,以下字段中可作为度量使用的字段是()oA、商品类别B、购买数量C、省份D、客户名称正确答案:D6、以下内容中,不可衡量产品竞争能力的是()。

A、成本优势B、质量优势C、管理人员创新能力D、技术优势正确答案:C7、迷你图与正常的图表功能相似,下列说法正确的是()oA、迷你图可以设置数据标记B、迷你图可以设置图例C、迷你图也有坐标轴D、迷你图占用空间小正确答案:D8、某食品网店3天的成交总额为12880元,这3天的成交商品数量分别为256、468、320件,其件单价为()。

A、17.5B、12.3C、15D、18正确答案:B9、系列关于数据分析流程的说法,错误的是()oA、需求分析是数据分析最重要的一部分B、模型评价能够评价模型的优劣C、分析与建模时只能够使用数值型数据D、数据预处理是能够数据建模的前提正确答案:C10、完成数据采集后对数据进行复查或计算,将其和历史数据进行比较。

同时还要检查字段的完整性,保证核心指标数据完整,属于()检查。

A、完整性检查B、B、准确性检查C、规范性检查D、D、以上都不是正确答案:AIK以下指标中,可以实时反映出账户的竞争力的是()oA、展现量B、点击率C、留存量D、转化率正确答案:A12、从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()oA、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A13、以下关于数据可视化说法错误的是()oA、数据可视化能够化繁为简,增加信息可读性和趣味性B、战略地图是对企业战略要素及其之间因果关系的可视化表示方法C、数据可视化是指通过图形、动画等更加形象、清晰的方法对数据大小进行体现,同时阐释数据间的关系和趋势,使数据分析后得出的结果更加容易使用和理解D、数据可视化由于要实现其功能用途,因此会令人感到枯燥乏味正确答案:D14、以下关于平均数的说法错误的是()oA、平均数一般是指算术平均数B、平均数是非常重要的基础性指标C、能代表总体的一般水平D、体现了总体内各单位的差异正确答案:D15、网站流量数据分析方法有数据清洗、数据提取、数据转化和()oA、数据计算B、数据核对C、数据检查D、数据评估正确答案:A16、从竞争对手分析的角度来看,不包括哪个步骤()oA、从网店整体情况分析B、不需要从评论分析C、从商品信息分析D、从详情页分析正确答案:B17、()是指通过统计、数学或计算的方法对现象进行系统的实证研究。

《excel数据处理与分析》章节测试题与答案

《excel数据处理与分析》章节测试题与答案

智慧树知到《excel数据处理与分析》章节测试题与答案第一章单元测试1、在Excel中,一个工作簿就是一个Excel文件,其扩展名为()。

A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案:【.XLSX】2、在Excel中,一个工作簿可以包含()工作表。

A:1个B:2个C:多个D:3个答案:【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()。

A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案:【A1:C5】4、以下单元格引用中,下列哪一项属于混合引用()。

A:E3B:$C$18C:$D$13D:B$20答案:【B$20】5、在Excel中,下面关于单元格的叙述正确的是()。

A:在编辑的过程中,单元格地址在不同的环境中会有所变化B:工作表中单元格是由单元格地址来表示的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“#”间隔D:A4表示第4列第1行的单元格答案:【工作表中单元格是由单元格地址来表示的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。

A:$D6B:D$6C:$6DD:6D答案:【D$6】7、在Excel中,进行公式复制时()发生改变。

A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案:【相对地址中所引用的单元格】8、在下列Excel运算符中,优先级最高的是()。

A:&B:<>C::D:^答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。

A:对B:错答案:【对】10、设在单元格A1中有公式:=B1+B2,若将其复制到单元格C1中则公式为=D1+D2。

A:错B:对答案:【对】第二章单元测试1、在Excel中,给当前单元格输入数值型数据时,默认为()。

A:左对齐B:居中C:随机D:右对齐答案:【右对齐】2、在工作表的单元格内输入数据时,可以使用"自动填充"的方法,填充柄是选定区域()的小黑方块。

数据分析及应用试题库及答案

数据分析及应用试题库及答案

数据分析及应用试题库及答案一、单选题(共40题,每题1分,共40分)1、Matplotlib中的绘制散点图scatter()方法,表示点的透明度的参数是()A、A markerB、B sC、C cD、D alpha正确答案:D2、某算法的时间复杂度为,表明该算法的A、A 问题规模是n^2B、B 执行时间等于n^2C、C 执行时间与n^2成正相关D、D 问题规模与n^2成正比正确答案:C3、求解斐波那契数列第n项的算法最小的时间复杂度为()。

A、A O(N!)B、B O(N^N)C、C O(N)D、D O(LogN)正确答案:D4、神经网络模型训练时,依赖于以下哪一种法则进行参数计算?A、A 最大值法则B、B 最小值法则C、C 链式求导法则D、D 平均求导法则正确答案:C5、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D6、一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。

则年级属性的众数是: ()A、A 一年级B、B 二年级C、C 三年级D、D 四年级正确答案:A7、直接插入排序在最好情况下的时间复杂度为A、A 问题规模是n2B、B 执⾏时间等于n2C、C 执⾏时间与n2成正⾏D、D 问题规模与n2成正⾏正确答案:C8、Python文件的后缀名是()。

A、A .docB、B .vbpC、C .pyD、D .exe正确答案:C9、软件按功能可以分为应用软件、系统软件和支撑软件(或工具软件)。

下面属于应用软件的是______。

A、A 学生成绩管理系统B、B C语言编译程序C、C UNIX操作系统D、D 数据库管理系统正确答案:A10、假设在今日头条里面,有很多工作人员检查新闻是不是属于虚假新闻,所有新闻真实率到达了98%,工作人员在检验一个真实的新闻把它检验为一个虚假的新闻的概率为2%,而一个虚假的新闻被检验为真实的新闻的概率为5%.那么,一个被检验为真实的新闻确实是真实的新闻的概率是多大?A、A 0.9991B、B 0.9989C、C 0.9855D、D 0.96正确答案:B11、设某汽车站在某一时间区间内的候车人数服从参数为5的泊松分布,候车人数多于10人的概率A、A 0.2B、B 0.05C、C 0.013695D、D 0.28正确答案:C12、循环队列的存储空间为Q(1:100),初始状态为front=rear=100。

数据的收集整理与分析(含答案)

数据的收集整理与分析(含答案)

第30课时数据的收集整理与分析一、中考导航图数据的表示⎧⎫⎪⎪⎨⎬⎪⎪⎭⎩扇形统计图条形统计图折线统计图数据的整理、分析数据的分析⎧⎫⎪⎪⎨⎬⎪⎪⎭⎩频数分布表频数分布直方图频数分布折线图分布规律二、中考课标要求三、中考知识梳理1.扇形统计图通过扇形统计图可清楚地表示出各部分数量占总量的百分比.•扇形统计图中所有扇形表示的百分比之和为1.2.频数分布当一组数据有n个数时,频数之和=n,频率=频数n,频率之和=1,•小长方形的高代表频数.四、中考题型例析1.基础知识例 1 (2003·安徽)我国近期每日公布非典疫情,•其中有关数据的收集所采用的调查方式是_________.分析:此题主要考查数据的收集方式是普查还是抽样调查,因为国家要了解的是全国到底有多少非典病例,以控制疫情的发展,所以用的是普查方式.答案:普查.2. 实际应用例2 (2003·吉林)如图①是某城市三月份1至10日的最低气温随时间变化的图象.①温度(0C) 日期(日)-3-2-1012310987654321②(1)根据图①提供的信息,在图②中初全直方图;(2)这10天最低气温的众数是_______℃,最低气温的中位数是_______℃,•最低气温的平均数是______℃.分析:本题主要是由图①中的折线图发现信息,然后来求解. 解:(1)图略.(2)众数是2,中位数是0,平均数是0.点评:本题主要考查学生们的读图能力和绘图以及几个主要特征量的定义,明确定义就可以顺利解出.例 3 (2004·济南)某教育部门为了研究城市独生子女人格发展状况,•随机抽取某地区300名中学生和300名学生家长进行了调查.•下面是收集有关数据汇总后绘制的两个统计图:家长表现情况学生表现情况做事缺乏主见,观察统计图,回答下面问题:(1)在被调查的300名学生中,有多少人“缺乏生活自理能力”?(结果取整数)“经常陪着孩子做功课”的家长占被调查的300名家长的百分比是多少?(2)若该地区独生子女家长有10万人,请估计有多少家长“为孩子安排课余学习内容”?(3)从上面的两个统计图中,你还能发现哪些信息,•根据你发现的信息提出一个问题.分析:本题主要考查学生的读图能力,以及简单的百分比计算.解:(1)“缺乏生活自理能力”的学生数为300×20.67%≈62(人).“经常陪着孩子做功课”的家长占被调查的300名家长的百分比为(129÷300)•×100%=43%.(2)估计10万独生子女家长中“为孩子安排课余学习内容”的家长为10×210300=7(万).(3)提出的问题只要合理即可.例4 (2004·贵阳)下面两幅统计图(如图1,图2),反映了某市甲、乙两所中学学生参加课外活动的情况,请你通过图中信息回答下面的问题.(1)通过对图1的分析,写出一条你认为正确的结论;(2)通过对图2的分析,写出一条你认为正确的结论;(3)2003年甲、乙两所中学生参加科技活动的学生人数共有多少?甲、乙两校参加课外活动的学生人数统计图(1997~2003年)2003年甲、乙两校学生参加课外活动情况统计图乙校甲校(1) (2)分析:本题主要考查折线统计图和扇形统计图的有关知识.解:(1)1997年至2003年甲校学生参加课外活动的人数比乙校增长的快;(2)甲校学生参加文体活动的人数比参加科技活动的人数多.(3)2 000×38%+1 105×60%=1 423.基础达标验收卷一、选择题1.近年来国内生产总值年增长率的变化情况如图所示.从图上看,下列结论中不正确的是( ).A.1995~1999年,国内生产总值的年增长率逐年减小;B.2000年国内生产总值的年增长率开始回升;C.这7年中,每年的国内生产总值不断增长;D.这7年中,每年的国内生产总值不断减小.2.武汉市某校在“创新素质实践行”活动中,组织学生进行社会调查,并对学生的调查报告进行了评比.下图是将某年级66篇学生调查报告进行整理,•分成5组画出的频数分布直方图.已知从左到右5个小长方形的高的比为1:3:7:6:3,那么在这次评比中被评为优秀的调查报告有(分别大于或等于80分为优秀,且分数为整数)( ).A.18篇B.24篇C.25篇D.27篇 3.(2003·潍城)星期天晚饭后,小红从家里出去散步,•右图描述了她散步过程中离家的距离s(米)与散步所用时间t(分)之间的函数关系.依据图象,下面描述符合小红散步情景的是( ). A.从家出发,到了一个公共阅报栏,看了一会儿报,就回家了;B.从家出发,到了一个公共阅报栏,看了一会儿报后,继续向前走了一段,然后回家了.篇分数(分)99.589.579.569.559.549.5年增长率(%)年代(年)8.07.17.88.89.610.512.5200019991998199719961995199424681012C.从家出发,一直散步(没有停留),然后回家了;D.从家出发,散了一会儿步,就找同学去了,18分钟后才开始返回.4.(2004·武汉)某校为了了解学生的身体素质情况,对初三(2)班的50•名学生进行了立定跳远、铅球、100米三个项目的测试,每个项目满分为10分.如图,是将该班学生所得的三项成绩(成绩均为整数)之和进行整理后,分成5组画出的频率分布直方图,已知从左到右前4个小组的频率分别为0.02,0.1,0.12,0.46.下列说法:①学生的成绩≥27分的共有15人;②学生成绩的众数在第四小组(22.5~26.5)内;③学生成绩的中位数在第四小组(22.5~26.5)范围内.其中正确的说法是( ).A.①②B.②③C.①③D.①②③5.(2002·武汉)•武汉市某校在“创新素质实践行”活动中组织学生进行社会调查.并对学生的调查报告进行了评比.下面是将某年级60篇学生调查报告进行整理,•分成5组画出的频率分布直方图(如图1-22-9).已知从左至右4•个小组的频率分别是0.05、0.15、0.35、0.30,那么在这次评比中被评为优秀的调查报告有(分数大于或等于80分为优秀,且分数为整数)( ).A.18篇B.24篇C.25篇D.27篇二、填空题1.(2003·黄冈)现有A、B两个班级,每个班级各有45名学生参加一次测验.•每名参加者可获得0,1,2,3,4,5,6,7,8,9分这几种不同的分值中的一种.测试结果A•班的成绩如下表所示,B班的成绩如图所示.A班分数0 1 2 3 4 5 6 7 8 9人数 1 3 5 7 6 8 6 4 3 2(1)由观察所得,_____班的标准差较大;(2)若两班合计共有60人及格,问参加者最少获_______分才可以及格.2.(2004·广州)在相同条件下,对30辆同一型号的汽车进行耗油1•升所走路程的试验,根据测得的数据画出频率分布直方图B班频率组距分数30.526.522.518.514.510.5分数99.589.579.569.559.5频率组距49.5如图.则本次试验中,耗油1升所行走的路程在13.•05•~13.•55km•范围内的汽车共有_____辆.3.(2003·桂林)今年,在我国内地发生了“非典型肺炎”疫情,•在党和政府的正确领导下,目前疫情已得到有效控制,下图是今年5月1日至5月14日的内地新增确诊病例数据走势图(数据来源:卫生部每日疫情通报).中国内地非典新增确诊病例数据走势图(截止到2003年5月14日上午10时)从图中,可知道:(1)5月6日新增确诊病例人数为________人;(2)在5月9日至5月11日三天中,共新增确诊病例人数为______人;(3)从图上可看出,5月上半月新增确诊病例总体呈_______趋势.4.(2003·青岛)在世界环境日到来之际,希望中学开展了“环境与人类生存”主题研讨活动,活动之一是对我们的生存环境进行社会调查,并对学生的调查报告进行评比.初三.(3)班将本班50篇学生调查报告得分进行整理(成绩均为整数),列出了频率分布表,并画出了频率分布直方图(部分)如下:分组频率49.5~59.5 0.0459.5~69.5 0.0469.5~79.5 0.1679.5~89.5 0.3489.5~99.5 0.42合计 1根据以上信息回答下列问题:(1)该班90分以上(含90分)的调查报告共有________篇;(2)该班被评为优秀等级(80分及80分以上)的调查报告占_________%;(3)补全频率分布直方图.5.(2003·长沙)为了了解初三学生身体发育情况,某中学对初三女学生的身高进行了一次测量,所得数据整理后,列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 m 0.40157.5~161.5 15 0.30161.5~165.5 8 n165.6~169.5 2 0.04合计50 1.00(1)表中m和n所表示的数分别是多少?m:________,n:_________.(2)请补全频率分布直方图.(图1-22-14)三、解答题1.(2003·辽宁)为了让学生了解环保知识,增强环保意识,•某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.•请你根据下面尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:频率分布表分组频数频率50.5~60.5 4 0.0860.5~70.5 8 0.1670.5~80.5 10 0.2080.5~90.5 16 0.3290.5~100.5合计(1)填充频率分布表中的空格;(2)初全频率分布直方图;(3)在该问题中的样本容量是多少?答:_________________.(4)全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?(不要求说明理由).答:________________.(5)若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的约为多少人?答:________________.2.(2003·黑龙江)某中学在一次健康知识测试中,抽取部分学生成绩(•分数取整数,满分100分)为样本,绘制成成绩统计图(如图),•请结合统计图回答下列问题:(1)本次测试中抽样的学生有多少人?(2)分数在90.5~100.5这一组的频率是多少?(3)这次测试成绩的众数落在哪个小组内?(4)若这次测试成绩80分以上(含80分)为优秀,则优秀率不低于多少?3.(2004·安徽)新安商厦对销售较大的A、B、C三种品牌的洗衣粉进行了问卷调查,发放问卷270份(问卷由单选和多选题组成).对收回的238份问卷进行了整理,•部分数据如下:一、最近一次购买各品牌洗衣粉用户的比例(如图).二、用户对各品牌洗衣粉满意情况汇总表:内容质量广告价格品牌 A B C A B C A B C满意的户数194 121 117 163 172 107 98 96 100 根据上述信息回答下列问题:(1)A品牌洗衣粉的主要竞争优势是什么?你是怎样看出来的?(2)广告对用户选择品牌有影响吗?请简要说明理由.(3)你对厂家有何建议?4.(2003·济南市)新华社4月3•日发布了一则由国家安全生产监督管理局统计的信息:2003年1月至2月全国共发生了事故17万多起,各类事故发生情况具体统计如下:(1)请你计算出各类事故死亡人数占总死亡人数的百分比,填入上表(•精确到0.01). (2)为了更清楚地表示出问题(1)中的百分比,请你完成如图所示的扇形统计图;(3)请根据你所学的统计知识提出问题(不需要作解答,也不要解释,但所提的问题应是利用表中所提供数据能求解的).能力提高练习实际应用题1.(2004·福州)为了了解学校开展“孝敬父母,•从家务事做起”活动的实施情况,该校抽取初二年级50名学生,调查他们一周(按七天计算)做家务所用时间(单位:小时),得到一组数据,并绘制成下表,请根据表完成下列各题: (1)填写频率分布表中未完成的部分; (2)这组数据的中位数落在_________范围内; (3)由以上信息判断,•每周做家务的时间不超过1.•5•小时的学生所占百分比是________. (4)针对以上情况,写一个20字以内倡导“孝敬父母,热爱劳动”的句子.2.(2003·山东)我省某城镇邮政局对甲、乙两个支局的报刊发行部2002•年度报纸的发行量进行了统计,并绘成统计图如下:请根据上面统计图反映的信息,回答问题: (1)哪个支局发行《齐鲁晚报》的份数多?多多少?(2)分别写出上面两个统计图中提供的6个统计数据的中位数;(3)已知甲、乙两个支局所服务的居民区住户分别是11 280户、8 600户,•哪个居民区平均每户订阅报纸的份数多?试说明理由.甲支局其它报纸参考消息齐鲁晚报大众日报中医青年报人民日报10乙支局其它报纸参考消息齐鲁晚报大众日报中医青年报人民日报103.(2004·重庆)每年6月5日是“世界环境日”,应保护地球生态环境是世界各国政府和人民应尽的义务,下表是我国近几年来废气污染物排放量统计表,请认真阅读该表后,解答后面的问题. 全国近几年废气中主要污染物排放量(单位:万吨)(1)请用不同的虚、实、点线画出:二氧化硫排放总量、烟尘排放总量和工业粉尘排放量的折线走势图.(2)2002年相对于1998年,全国二氧化硫排放总量、烟尘排放总量和工业粉尘排放量的增减率分别为_________、________和________.(精确到1个百分点)(3)简要评价这三种废气污染物排放量的走势.(要求简要说明:总趋势,•增减的相对快慢)排放量(万吨)工业粉尘烟尘二氧化硫)20022001200019991998答案:基础达标验收卷一、1.D 2.D 3.B 4.C 5.D二、1.A,4 2.12 3.138,272,下降 4.21,76 5.20 0.16三、1.(1)频数12,频率0.24.(2)略.(3)50.(4)80.5~90.5 (5)216人.2.(1)2+3+4+41=51人.(2)频率=450频数总数= 0.08.(3)众数落在80.5~90.5这一小组内.(4)这次测试成绩的优秀率不低于90%.3.(1)A品牌洗衣粉主要竞赛优势是质量,可以从下面看出:①对A品牌洗衣粉的质量满意的用户最多;②对A品牌洗衣粉的广告、•价格满意的用户不是最多.(2)广告对用户选择品牌有影响,可从以下看出:①对B、C品牌洗衣粉质量、价格满意的用户数相差不大;②对B品牌洗衣粉的广告满意的用户数多于C品牌,且相差较大;③购买B品牌洗衣粉的用户比例高于C品牌8.45%.(3)①要重视质量;②在保证质量的前提下,要关注广告和价格.4.(1)自上至下依次为:3%,7%,8%,83%.(2)只要能大致反映出比例情况即可.(3)请你计算出道路交通事故占事故总量的百分比等.能力提高练习1.(1)表中频数为2,频率分别为0.14、0.06.(2)1.05~1.55 (3)58%(4)只要健康、教材向上,不脱离主题即可.2.解:(1)甲支局发行《齐鲁晚报》840份,乙支局发行《齐鲁晚报》880份,乙支局比甲支局多发行40份.(2)甲图中6个统计数据的中位数是4.5,乙图中6个统计数据的中位数是3.6.(3)由统计图知,甲支局订阅报纸共2 820份,平均每户订阅报纸的份数是2820÷11 280=0.25.乙支局订阅报纸2 580份,平均每户订阅报纸的份数是2 580÷8 600=0.3.所以乙支局所服务的居民区住户比甲支局服务的居民区住户平均每户多订阅报纸0.05份. 3.(1)画图正确排放量(万吨)工业粉尘烟尘二氧化硫年度)20022001200019991998(2)-8% -30% -29%(3)评价:总体均成下降趋势;二氧化硫排放量下降趋势最小;烟尘排放量下降趋势最大.。

计算机应用技术等级证书数据处理与分析考试 选择题 55题

计算机应用技术等级证书数据处理与分析考试 选择题 55题

计算机应用技术等级证书数据处理与分析考试1. 在Excel中,用于计算平均值的函数是:A. SUMB. AVERAGEC. COUNTD. MAX2. 下列哪个不是数据库管理系统?A. MySQLB. OracleC. Microsoft ExcelD. PostgreSQL3. 在Python中,用于连接字符串的操作符是:A. +B. -C. *D. /4. 下列哪个工具常用于大数据分析?A. Microsoft WordB. TableauC. Adobe PhotoshopD. Google Docs5. 在SQL中,用于选择特定列的语句是:A. INSERTB. SELECTC. UPDATED. DELETE6. 下列哪个编程语言最适合用于数据科学?A. JavaB. C++C. PythonD. Ruby7. 在数据处理中,ETL代表什么?A. Extract, Transform, LoadB. Encode, Transfer, LoadC. Extract, Transfer, LinkD. Encode, Transform, Link8. 下列哪个不是数据可视化工具?A. Power BIB. MatplotlibC. TensorFlowD. D3.js9. 在R语言中,用于创建数据框的函数是:A. data.frame()B. matrix()C. array()D. list()10. 下列哪个是NoSQL数据库的例子?A. MongoDBB. MySQLC. OracleD. SQL Server11. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AlgorithmC. Principal Component AlgorithmD. Primary Component Analysis12. 下列哪个不是机器学习算法?A. K-MeansB. Decision TreeC. Linear RegressionD. SQL Query13. 在Python中,用于数据清洗的常用库是:A. NumPyB. PandasC. MatplotlibD. SciPy14. 下列哪个是云计算平台?A. Microsoft AzureB. Adobe IllustratorC. Autodesk AutoCADD. CorelDRAW15. 在数据仓库中,星型模式是一种:A. 数据存储结构B. 数据处理算法C. 数据可视化工具D. 数据加密技术16. 下列哪个是数据湖的特征?A. 结构化数据存储B. 非结构化数据存储C. 只存储文本数据D. 只存储图像数据17. 在数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing18. 下列哪个不是数据挖掘技术?A. ClusteringB. AssociationC. RegressionD. Sorting19. 在Python中,用于科学计算的库是:A. SciPyB. DjangoC. FlaskD. Pyramid20. 下列哪个是数据治理的关键组成部分?A. 数据质量B. 数据加密C. 数据压缩D. 数据备份21. 在数据处理中,CRM代表什么?A. Customer Relationship ManagementB. Corporate Resource ManagementC. Customer Record ManagementD. Corporate Record Management22. 下列哪个不是数据集成工具?A. InformaticaB. TalendC. SSISD. Photoshop23. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InteractionD. Business Information24. 下列哪个是数据仓库的主要功能?A. 数据存储B. 数据加密C. 数据压缩D. 数据备份25. 在数据处理中,DWH代表什么?A. Data WarehouseB. Data Web HouseC. Data Wide HouseD. Data Work House26. 下列哪个不是数据分析的生命周期阶段?A. 数据收集B. 数据清洗C. 数据加密D. 数据可视化27. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Extensive Data AnalysisD. Experimental Data Analysis28. 下列哪个不是数据科学家的主要技能?A. 编程B. 统计学C. 图形设计D. 机器学习29. 在数据处理中,Hadoop是一个:A. 数据库管理系统B. 数据可视化工具C. 大数据处理框架D. 数据加密技术30. 下列哪个是数据湖的优势?A. 数据结构化B. 数据非结构化C. 数据安全性D. 数据备份31. 在数据分析中,SVM代表什么?A. Support Vector MachineB. System Vector ModelC. Support Variable ModelD. System Variable Machine32. 下列哪个不是数据仓库的组成部分?A. 数据集市B. 数据湖C. 数据集D. 数据模型33. 在数据处理中,MDM代表什么?A. Master Data ManagementB. Model Data ManagementC. Manage Data ManagementD. Master Database Management34. 下列哪个不是数据治理的组成部分?A. 数据质量B. 数据安全C. 数据加密D. 数据政策35. 在数据分析中,RFM代表什么?A. Recency, Frequency, MonetaryB. Recent, Frequent, MonetaryC. Recency, Frequency, MonitorD. Recent, Frequent, Monitor36. 下列哪个不是数据可视化的目的?A. 数据解释B. 数据加密C. 数据探索D. 数据交流37. 在数据处理中,BI工具的主要功能是:A. 数据存储B. 数据分析C. 数据加密D. 数据备份38. 下列哪个是数据科学的主要领域?A. 数据分析B. 数据加密C. 数据压缩D. 数据备份39. 在数据分析中,KPI代表什么?A. Key Performance IndicatorB. Key Process IndicatorC. Key Progress IndicatorD. Key Parameter Indicator40. 下列哪个不是数据仓库的设计模式?A. 星型模式B. 雪花模式C. 星座模式D. 树型模式41. 在数据处理中,OLTP代表什么?A. Online Transaction ProcessingB. Offline Transaction ProcessingC. Online Test ProcessingD. Offline Test Processing42. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 关联D. 排序43. 在数据分析中,NLP代表什么?A. Natural Language ProcessingB. Neural Language ProcessingC. Normal Language ProcessingD. Network Language Processing44. 下列哪个不是数据科学的主要工具?A. RB. PythonC. ExcelD. Photoshop45. 在数据处理中,ETL工具的主要功能是:A. 数据提取B. 数据加密C. 数据压缩D. 数据备份46. 下列哪个是数据仓库的主要用户?A. 数据科学家B. 数据分析师C. 数据管理员D. 数据工程师47. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. System Query LanguageD. Simple Query Language48. 下列哪个不是数据治理的主要目标?A. 数据质量B. 数据安全C. 数据加密D. 数据一致性49. 在数据处理中,BI系统的主要功能是:A. 数据存储B. 数据分析C. 数据加密D. 数据备份50. 下列哪个是数据科学的主要方法?A. 数据分析B. 数据加密C. 数据压缩D. 数据备份51. 在数据分析中,ML代表什么?A. Machine LearningB. Model LearningC. Manage LearningD. Master Learning52. 下列哪个不是数据仓库的主要特点?A. 数据集成B. 数据历史C. 数据加密D. 数据一致性53. 在数据处理中,DW代表什么?A. Data WarehouseB. Data WebC. Data WideD. Data Work54. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据可视化55. 在数据分析中,AI代表什么?A. Artificial IntelligenceB. Advanced IntelligenceC. Applied IntelligenceD. Adaptive Intelligence答案部分:1. B2. C3. A4. B5. B6. C7. A8. C9. A10. A11. A12. D13. B14. A15. A16. B17. A18. D19. A20. A21. A22. D23. A24. A25. A26. C27. A28. C29. C30. B31. A32. B33. A34. C35. A36. B37. B38. A39. A40. D41. A42. D43. A44. D45. A46. B47. A48. C49. B50. A51. A52. C53. A54. C55. A。

数据处理分析课后答案

数据处理分析课后答案

化工数据分析与处理(课后作业)第一章 误差原理与概率分布1、某催化剂车间用一台包装机包装硅铝小球催化剂,额定标准为每包净重25公斤,设根据长期积累的统计资料,知道包装机称得的包重服从正态分布,又其标准差为σ=0.75公斤,某次开工后,为检验包装机的工作是否正常,随机抽取9包催化剂复核其净重分别为:试问包装机目前的工作状况如何? 解:先做原假设 假设H 0:μ=μ0构造统计量:Z =nx /σμ--~N(0,1)-x =∑x i /n=25.45σ=0.75μ=μ0=25 得:Z =1.8查表得:Φ ( 1.8 ) = 0.9641给出适当的α ,取α=0.05,1- α = 0.95 < 0.9641 落在大概率解范围内接受H 0则 μ=μ0 ,即包装机目前工作正常。

气总平均值的0.95置信区间。

解:因为P =1-α=0.95 所以α=1-0.95=0.05σ不知,所以只能用t 分布 即用S 代替σ S 2=1)(--∑-n x x i =0.048515789 S=0.220263-x =3.21令T =nS x /μ--~t(n-1,2α)则有:P(-At <T <At)=1-α=1-0.05n-1=20-1=192α=0.025 查表得:At (19,0.025)=2.0930估计区间为:P(-x -At(n-1, 2α)*n S <μ<-x +At(n-1, 2α)*nS =0.95所以:3.21-2.0930*200.220263<μ<3.21+2.0930*200.220263即:3.21-0.100425<μ<3.21+0.100425所以:3.109575<μ<3.3104253、某厂化验室用A,B 两种方法测定该厂冷却水中的含氯量(ppm ),每天取样一次,下面是试问:这两种方法测量的结果有无显著的差异?一般可取显著水平α=0.01. 解:因为是用两种方法来测同一个溶液,故把所测氯含量为母体。

excel数据处理与分析章节测试题与答案

excel数据处理与分析章节测试题与答案

智慧树知到《 excel 数据处理与分析》章节测试题与答案第一章单元测试1、在Excel 中,一个工作簿就是一个Excel 文件,其扩展名为()A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案: 【.XLSX】2、在Excel 中,一个工作簿可以包含()工作表。

A:1 个B:2 个C:多个D:3 个答案: 【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案: 【A1:C5】4、以下单元格引用中,下列哪一项属于混合引用()。

A:E3B:$C$18C:$D$13D:B$20答案: 【B$20】5、在Excel 中,下面关于单元格的叙述正确的是()。

A:在编辑的过程中,单元格地址在不同的环境中会有所变化B:工作表中单元格是由单元格地址来表示的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“ #”间隔D:A4表示第4列第1行的单元格答案: 【工作表中单元格是由单元格地址来表示的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。

A:$D6B:D$6C:$6DD:6D答案: 【D$6】7、在Excel 中,进行公式复制时()发生改变。

A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案: 【相对地址中所引用的单元格】8、在下列Excel 运算符中,优先级最高的是()。

A:&B:<>C::D:A答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。

A: 对B:错答案: 【对】10、设在单元格A1中有公式:=B1+B2若将其复制到单元格C1中则公式为=D1+D2A:错B:对答案: 【对】第二章单元测试1 、在Excel 中,给当前单元格输入数值型数据时,默认为()。

《Excel数据处理与分析》期末考试卷A

《Excel数据处理与分析》期末考试卷A

《Excel数据处理与分析》期末考试卷A1【单选题】(2分)为了区别"数字"与"数字字符串"数据,Excel要求在输入项前添加( )符号来确认。

A."B.'C.#D.@回答正确B2【单选题】(2分)Excel 2010主界面窗口中编辑栏上的"fx"按钮用来向单元格插入( )。

A.文字B.数字C.公式D.函数正确答案:C3【单选题】(2分)以下能计算出字符串“ISBN-ABC-123人教版”中汉字个数的公式是。

A.Len(("ISBN-ABC-123人教版")+LenB("ISBN-ABC-123人教版")B.LenB ("ISBN-ABC-123人教版")+Len(("ISBN-ABC-123人教版")C.Len(("ISBN-ABC-123人教版")-LenB("ISBN-ABC-123人教版")D.LenB ("ISBN-ABC-123人教版")-Len(("ISBN-ABC-123人教版")回答正确D4【单选题】(2分)在Excel 2010中,若需要将工作表中某列上大于某个值的记录挑选出来,应执行数据菜单中的( )。

A.排序命令按钮B.筛选命令按钮C.分类汇总命令按钮D.合并计算命令按钮正确答案:B5【单选题】(2分)关于模糊查找,以下叙述中正确的是。

A.通配符*表示一个任意符号B.通配符?表示多个任意符号C.可以使用通配符*和#进行模糊查找D.以上都不对回答正确D6【单选题】(2分)企业要最小运输成本问题,最有效的工具是。

A.模拟运算表B.方案分析C.规划求解回答正确C7【单选题】(2分)是一种以工作任务和任务完成时间为依据的图形。

A.直方图B.甘特图C.双轴图D.组合图回答正确B8【单选题】(2分)在Excel2010中,在某单元格内输入“=5>=3”确定后单元格内显示A.#NUMB.#N/AC.TRUED.FALSE回答正确C9【单选题】(2分)在Excel中,若单元格中出现#N/A、这是指在函数或公式中没有。

数据分析技术习题及参考答案

数据分析技术习题及参考答案

数据分析技术习题及参考答案一、单选题(共40题,每题1分,共40分)1、下列的数组统计计算中,用于计算数组中最大值的方法是()。

A、minB、maxC、maximalD、maximum正确答案:B2、在创建Figure对象时,可以指定哪个参数来给画布添加背景颜色?()A、facecolorB、numC、dpiD、figsize正确答案:A3、在NumPy通用函数中,用于计算元素级最大值的函数是()。

A、maxB、maximalC、maximumD、min正确答案:C4、关于异常值的说法,下列选项中描述错误的是()。

A、异常值是指样本中明显偏离其余观测值的个别值B、可以使用3σ原则检测异常值C、可以使用Pandas中的箱线图检测异常值D、异常值可以使用其它的值来替换正确答案:A5、关于分组聚合过程的说法中,下列描述不正确的是()。

A、应用是指将某个函数或方法应用到每个分组B、拆分是指将数据集按照一些标准拆分为若干个组C、只能对纵轴方向上的数据进行分组D、合并是指将产生的新值整合到结果对象中正确答案:C6、请阅读下列一段程序:arr = np.arange(12).reshape(3, 4)arr.shape 运行上述程序,它最终执行的结果为()。

A、(3, 4)B、4C、3D、(1, 2)正确答案:A7、下列关于Pandas库的说法中正确的是()。

A、Pandas中只有两种数据结构B、Pandas不支持读取文本数据C、Pandas是在NumPy基础上建立的新程序库D、Pandas中Series和DataFrame可以解决数据分析中一切的问题正确答案:C8、下列关于数据预处理的说法中,描述不正确的是()。

A、数据清洗的目的是为了提高数据质量B、异常值不一定要删除C、通过drop_duplicates()方法可以删除重复数据D、concat()函数可以根据一个或多个键将不同的DataFrame进行合并正确答案:D9、下列选项中,关于drop_duplicates()方法描述错误的是()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、 简答题(5×2分, 共10分)
1、请解释质量控制图中三条主要控制线的意义:CL 、UCL 、LCL 未学,不考
2、请解释正交设计表“L 934” 这个符号所指代的意义。

如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L 1645,L 3249 L: 正交; 9:9行或9次实验; 3:3个水平 ; 4:4列或4个因素 选L 3249
二、计算题(90分)
1、某分析人员分别进行4次平行测定,得铅含量分别是60.08、71.26、70.63、
71.85、,试分别用3s 法、Dixon 法和Grubbs 检验法判断60.08是否为离群值。

(G 0.95,4=1.463, Q 0.05,5=0.765)(12分)
x =68.455, s=5.61,
3s 法:∣60.08-68.455∣=8.447<3s, 应保留 Dixon :70.6360.08
0.89671.8560.08
Q -=
=-> Q 0.05,5=0.765, 应舍去
Grubbs: G 计= 60.0868.455/5.61-=1.49> G 0.95,4,应舍去·
··
2、4次测定结果为:1.12%、1.15%、1.11%、1.16%,根据这些数据估计此样品中铬的含量范围(P=95%)?(8分)
( 2.353%903,10.0=⇒=t P , 3.182%9530.05=⇒=,t P , 5.841%9930.01=⇒=,t P )
x =1.135%, s=0.0238%
3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数据:34.30、34.32、34.26、34.35、34.38、34.29、34.23、34.28。

标准偏差为0.048%,标准值为34.33%问这种新方法是否可靠(P=95%,t 0.05,7=2.365)(10分)
x =34.30
34.3034.33
1.770.048
t -=
=< t 0.05,7,所以新方法可靠
4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为0.55mg/L ,加入0.05mL 浓度为1000mg/L 的标准样品后,测得样品总浓度为0.98mg/L ,求回收率是多少。

(8分) 没讲,不考
5、两分析人员测定某试样中铁的含量,得到如下结果:
已知A的标准偏差s
1=0.061,B的标准偏差s
2
=0.034,请比较两个人测定结果的精
密度和准确的有无显着性差异。

(12分)
F(0.05,4,4)=6.39, t(0.05,8)=2.305
F=0.0612/0.0342=3.22< F(0.05,4,4),故精密度无显着性差异
t=1.42< t(0.05,8),故准确度无显着性差异
5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影
响,实验因素水平表如下表。

请完成下列正交表格,并指出各因素的主次顺序,求出最优水平组合,并做方差分析,填方差分析表,并对实验结果做出讨论(可结合因素指标变化图)。

(25分)
因素主次顺序:B>A>C 优水平:A 1B 3C 1
(要求在以下空白处写下方差分析完整计算过程)
6.利用方差分析法,判断某生物处理中污泥负荷对出水水质的影响。

请完成以下方差分析表。

(要求在以下空白处写下方差分析完整计算过程)
附:公式列表
1、
对于有限次测量,总体均值μ的置信区间为(x t
x t -+) 2、 Q 检验法:Q 计=(x n -x n-1)/(x n -x 1)或者(x 2-x 1)/(x n -x 1)
3、Grubbs 检验法:G=(x 异常-x )/s
4、F 检验:F=22
12/s s (s 1>s 2)
5、t 检验:
1)
平均值与标准值比较:t =2) 独立样本t
检验:1t x =6、单因素方差分析:
S T =S A +S E
f A =b-1; f E =b(a-1); f T =ab-1;
A A A S S f =
; E E E S S f =; A E
S F S = 7. 正交试验设计方差分析
2
1)(1∑==n z z y n P ,∑==b j ij i K a Q 121,∑==n
z z y W 1
2
S
i =Q
i
-P, S
E
=S
,
i
i
i
f
S
S=;
E
Ei
E
f
S
S= ;
E
i
i S
S
F=; 其中,n——实验总次数,即正交表
中排列的总实验次数;b——某因素下水平数;a——某因素下同水平的实验次数;
——空列项偏差平方和,y
z
——指标,Kij——水平效应值。

相关文档
最新文档