属性数据分析第五章课后答案
第五章 数据采集与处理答案
第五章 数据采集与处理
习题
(一)填空题 1、 在数字信号处理中,为避免频率混叠,应使被采样的模拟信号成为 数字 ,还应使采样 频率满足采样定理即 采样频率大于信号最高频率的 2 倍 。 2、 如果一个信号的最高频率为 50Hz,为了防止在时域采样过程中出现混叠现象,采样频 率应该大于 100 Hz。 3、 在设计数据采集系统时,选择 A/D 转换器所依据的主要技术指标是 分辨率 和 转换 速度 。一般,要求 A/D 转换器的位数至少要比精度要求的分辨力 大 。 4、 A/D 转换器是将 模拟 信号转换为 数字 信号的装置.N 位 D/A 转换器分辨力为 1/2N 。 5、 当多个信号的采样共同使用一个 A/D 转换器时, 必须采用 多路分时 法切换,完成 此切换的器件是 多路模拟开关 。
2、若模/数转换器输出二进制数的位数为 10,最大输入信号为 2.5V,则该转换 器能分辨出的最小输入电压信号为( B ) 。 A. 1.22mV B. 2.44mV ) 。 C. 3.66mV D. 4.88mV 3、A/D 转换器的位数越多,则( C
A.转换精度越低 C.转换精度越高
B 转换速度越快 D.分辨力越低
5、 互相关函数是偶实函数。 ( ×
6、 利用系统输入 x(t) 与输出 y(t)的自功率谱密度函数,可求该系统的频率响应函数。 ( × )
7、 若系统是完全线性的,则输入-输出的相干函数一定为 1。 ( × )
(三) 、单项选择题 1、 在 A/D 转换器中, 若被采样模拟信号的最高频率分量为 f H , 则采样频率 f s 应 ( D ) 。 A.= f H B.> f H C.< f H D.>2 f H
m 14
2、 模数转换时,采样间隔 分别取 1ms,0.5ms,0.25ms 和 0.125ms。按照采样定理,要 求抗频混滤波器的上截止频率分别设定为多少 Hz(设滤波器为理想低通)? 根据采样定理,抗频混滤波器的上截止频率应分别设为 500、1000、2000、4000Hz。 3、某信号 xt 的幅值频谱如下图。试画出当采样频率 fs 分别为 1)2500Hz,2) 2200Hz,3) 1500Hz 时离散信号 xn 在 0~fN 之间的幅值频谱。 A(f) 2 2.8 0 1.8 0
(完整版)数据库课后习题及答案
第一章数据库系统概述选择题1实体-联系模型中,属性是指(C)A.客观存在的事物B.事物的具体描述C.事物的某一特征D.某一具体事件2对于现实世界中事物的特征,在E-R模型中使用(A)A属性描述B关键字描述C二维表格描述D实体描述3假设一个书店用这样一组属性描述图书(书号,书名,作者,出版社,出版日期),可以作为“键”的属性是(A)A书号B书名C作者D出版社4一名作家与他所出版过的书籍之间的联系类型是(B)A一对一B一对多C多对多D都不是5若无法确定哪个属性为某实体的键,则(A)A该实体没有键B必须增加一个属性作为该实体的键C取一个外关键字作为实体的键D该实体的所有属性构成键填空题1对于现实世界中事物的特征在E-R模型中使用属性进行描述2确定属性的两条基本原则是不可分和无关联3在描述实体集的所有属性中,可以唯一的标识每个实体的属性称为键4实体集之间联系的三种类型分别是1:1 、1:n 、和m:n5数据的完整性是指数据的正确性、有效性、相容性、和一致性简答题一、简述数据库的设计步骤答:1需求分析:对需要使用数据库系统来进行管理的现实世界中对象的业务流程、业务规则和所涉及的数据进行调查、分析和研究,充分理解现实世界中的实际问题和需求。
分析的策略:自下而上——静态需求、自上而下——动态需求2数据库概念设计:数据库概念设计是在需求分析的基础上,建立概念数据模型,用概念模型描述实际问题所涉及的数据及数据之间的联系。
3数据库逻辑设计:数据库逻辑设计是根据概念数据模型建立逻辑数据模型,逻辑数据模型是一种面向数据库系统的数据模型。
4数据库实现:依据关系模型,在数据库管理系统环境中建立数据库。
二、数据库的功能答:1提供数据定义语言,允许使用者建立新的数据库并建立数据的逻辑结构2提供数据查询语言3提供数据操纵语言4支持大量数据存储5控制并发访问三、数据库的特点答:1数据结构化。
2数据高度共享、低冗余度、易扩充3数据独立4数据由数据库管理系统统一管理和控制:(1)数据安全性(2)数据完整性(3)并发控制(4)数据库恢复第二章关系模型和关系数据库选择题1把E-R模型转换为关系模型时,A实体(“一”方)和B实体(“多”方)之间一对多联系在关系模型中是通过(A)来实现的A将A关系的关键字放入B关系中B建立新的关键字C建立新的联系D建立新的实体2关系S和关系R集合运算的结果中既包含S中元组也包含R中元组,但不包含重复元组,这种集合运算称为(A)A并运算B交运算C差运算D积运算3设有关系R1和R2,经过关系运算得到结果S,则S是一个(D)A字段B记录C数据库D关系4关系数据操作的基础是关系代数。
数据结构(c语言版)第五章答案
第五章1、设二维数组A【8】【10】是一个按行优先顺序存储在内存中的数组,已知A【0】【0】的起始存储位置为1000,每个数组元素占用4个存储单元,求:(1)A【4】【5】的起始存储位置。
A【4】【5】的起始存储位置为1000+(10*4+5)*4=1180;(2)起始存储位置为1184的数组元素的下标。
起始存储位置为1184的数组元素的下标为4(行下标)、6(列下标)。
2、画出下列广义表D=((c),(e),(a,(b,c,d)))的图形表示和它们的存储表示。
略,参考第5·2节应用题第5题分析与解答。
3、已知A为稀疏矩阵,试从时间和空间角度比较采用两种不同的存储结构(二维数组和三元组表)实现求∑a(i,j)运算的优缺点。
稀疏矩阵A采用二维数组存储时,需要n*n个存储单元,完成求∑ii a(1≤i≤n)时,由于a【i】【i】随机存取,速度快。
但采用三元组表时,若非零元素个数为t,需3t+3个存储单元(t个分量存各非零元素的行值、列值、元素值),同时还需要三个存储单元存储存稀疏矩阵A的行数、列数和非零元素个数,比二维数组节省存储单元;但在求∑ii a(1≤i≤n)时,要扫描整个三元组表,以便找到行列值相等的非零元素求和,其时间性能比采用二维数组时差。
4、利用三元组存储任意稀疏数组时,在什么条件下才能节省存储空间?当m行n列稀疏矩阵中非零元素个数为t,当满足关系3*t<m*n时,利用三元组存储稀疏数组时,才能节省存储空间。
5、求下列各广义表的操作结果。
(1)GetHead((a,(b,c),d))GetHead((a,(b,c),d))=a(2)GetTail((a,(b,c),d))GetTail((a,(b,c),d))=((b,c),d)(3)GetHead(GetTail((a,(b,c),d)))GetHead(GetTail((a,(b,c),d)))=(b,c)(4)GetTail(GetHead((a,(b,c),d)))GetTail(GetHead((a,(b,c),d)))=()第六章1、已知一棵树边的集合为{(i,m),(i,n),(e,i),(b,e),(b,d),(a,b),(g,j),(g,k),(c,g),(c,f),(h,l),(c,h),(a,c)}用树形表示法画出此树,并回答下列问题:(1)哪个是根结点?(2)哪些是叶结点?(3)哪个是g的双亲?(4)哪些是g的祖先?(5)哪些是g的孩子?(6)哪些是e的子孙?(7)哪些是e的兄弟?哪些是f的兄弟?(8)结点b和n的层次号分别是什么?(9)树的深度是多少?(10)以结点c为根的子树的深度是多少?(11)树的度数是多少?略。
(约翰逊版)实用多元统计分析第五章课后答案.doc
5.4经计算可得:<4.64、‘2.8794 10.0100 -1.8091、x = 45.4,S =10.0100 199.7884 -5.64009.965;c 1.8091 -5.6400 3.6277 丿‘0.5862 -0.02210.2580、S'1 = -0.0221 0.0061 -0.0016、0.2580 -0.0016 0.4018 丿S 的特征值和特征向量分别为人=1.3014,q =(—0.8175 0.0249 —0.5754)'& = 4.5316,色=(0.5737 -0.053—0.8173)'入=200.4625心=(0.0508 0.9983 -0.029if由所有(u l9u 2,u 3)组成U 的90%置信椭圆为由于 ^17 (0.1) = 2.44,故有其三个主轴的长度分别为:2列紀 j 如 2xVF^J 鍔X2.44 - 24.8071 2 佝鳩3x19 -—x 2.44 =307.884920x17(b)排汗量XI 的Q ・Q 图:'0.5862 -0.0221 20(4.64一绚,45.4-u 2,9.965一禺)-0.0221 0.0061 ,0.2580 -0.0016 0.2580-0.00160.4018‘4.64 - )45.4 — u 2 W 、9.965 _如丿3x19 1717(0.1)"0.5862 -0.0221 20(4.64 -绚,45.4 一 u 2,9.965 -冷)-0.0221 0.0061、0.2580 -0.0016 0.2580-0.00160.4018孑4.64-普、 45.4 — (9.965-均丿< 8.18123x19 - ------- x 2.44 =46.2911 20x17钠含量X2的Q ・Q 图:QQ Plot of Sample Data X2 versus Standard Normal钾含量的Q-Q 图:70 o o o o6 5 4 3 <D-dlues -ndu- joQQ Plot of Sample Data X1 versus Standard Normal-1.5-0.5 0 0.5 1 Standard Normal Quantiles1.5 29 8 7 6 5 4 3①-dLUBS Indu- jo s ①三UBno-1.5-1-0.5 0 0.5 1 Standard Normal Quantiles1.5 2QQ Plot of Sample Data X3 versus Standard Normal•1.5-105 0 0.5 1 Standard Normal Quantiles1.5 254321098761— 1— XI 和X2的散点图:80 r 70 60 50 40 30 20 XI 和X3的散点图:5 x114—鼻■13*♦12一♦11■ ** *m10■ *♦ ♦98♦ * *« **71 1 1 1 11 ♦2 3 45 678 9X1X2和X3的散点图:14r♦131211co10由排汗量XI 、钠含量X2、钾含量X3数据的Q.Q 都接近于直线,而且各对观察值的散点图 都近似的接近于椭圆,因此可以认为多元正态假定是合理的。
05第五章 定量分析的误差和 分析结果的数据处理习题
应称取样品
A. 0.05g
B. 0.1g
C. 0.15g
D. 0.2g
2-34用减量法称取基准物,扣倒基准物时洒漏掉很微小的一粒,对测
定结果的影响是
A. 正误差
B.负误差
C.对准确度无影响
D.对精密度无影响
E.降低精密度
2-35下列情况中,使分析结果产生负误差的是
A.以盐酸溶液滴定某碱样,所用滴定管未洗净,滴定时内壁挂液珠
慢
2-22可以减小偶然误差的方法是
A.进行量器校正
B.进行空白试验
C.进行对照试验
D.校正分析结果
E.增加平行测定的次数
2-23按Q检验法(n=4时Q0.90=0.76)删除可疑值,下列哪组中有弃去值
A. 3.03, 3.04, 3.05, 3.13
B. 97.50, 98.50, 99.00, 99.50
三大类。 1-8误差的表示方法有两种,一种是准确度与误差,一种是精密度与
偏差。 1-9相对误差小,即表示分析结果的准确度高。 1-10偏差是指测定值与真实值之差。 1-11精密度是指在相同条件下,多次测定值间相互接近的程度。 1-12系统误差影响测定结果的准确度。 1-13测量值的标准偏差越小,其准确度越高。 1-14精密度高不等于准确度好,这是由于可能存在系统误差。控制了 偶然误差,测定的精密度才会有保证,但同时还需要校正系统误差, 才能使测定既精密又准确。 1-15随机误差影响到测定结果的精密度。 1-16对某试样进行三次平行测定,得平均含量25.65%,而真实含量为
2-20在滴定分析法测定中出现下列情况,哪种导致系统误差
A.试样未经充分混匀 B.滴定管的读数读错 C.滴定时有
液滴溅出
国开作业数据库应用-形考任务五(第五章)09参考(含答案)
题目:以一个基本表中的允许有重复属性作为外码同另一个基本表中的主码建立联系,则这种联系为_________的联系。
选项A:1对多
选项B:多对多
选项C:1对1
选项D:多对1
答案:1对多
题目:在数据库中,数据保存在()对象中。
选项A:报表
选项B:查询
选项C:窗体
选项D:表
答案:表
题目:在购物活动中,商品实体同销售实体之间是____________联系。
选项A:1对多
选项B:多对多
选项C:1对1
选项D:多对1
答案:1对多
题目:数据字典是对系统工作流程中数据和________的描述。
选项A:字典
选项B:处理
选项C:分组
答案:处理
题目:数据库概念设计的过程中,视图设计一般有三种设计次序,以下各项中不对的是
____________。
选项A:由内向外
选项B:自顶向下
选项C:由整体到局部
选项D:由底向上
答案:由整体到局部
题目:机器实现阶段的任务是在计算机系统中建立____________,装入数据,针对各种处理要求编写出相应的应用程序。
选项A:外模式
选项B:模式
选项C:数据库模式
选项D:内模式
答案:数据库模式
题目:由概念设计进入逻辑设计时,原来实体被转换为对应的基本表或________。
选项A:流程图 C.二维表
选项B:视图
选项C:逻辑表
答案:视图
题目:由概念设计进入逻辑设计时,原来的多对多联系通常需要被转换为对应的________。
选项A:基本表 C.二维表
选项B:视图。
王静龙定性数据分析 习题五
王静龙定性数据分析习题五1. 问题描述在定性数据分析中,王静龙遇到了一个问题,他想要了解一份调查问卷中的开放性问题的回答情况。
具体而言,他想要回答以下几个问题:1.开放性问题的回答内容的总体情况如何?2.开放性问题的回答内容中是否存在一些常见的关键词或主题?3.开放性问题的回答内容中是否存在一些特定的意见或情感?为了解决这个问题,王静龙希望能够进行数据分析,并得出一些有用的结论。
2. 数据准备首先,王静龙需要准备调查问卷中开放性问题的回答数据。
这些数据可以以文本文件的形式存储,每一行代表一个回答。
例如,以下是一些示例数据:1. 我觉得工作环境很好,同事们相互合作,给了我很多帮助。
2. 公司的培训计划很好,能够提高员工的技能和知识。
3. 我对公司的管理方式有一些不满意,希望能够改进。
4. 薪资待遇不够优厚,希望能够有所提升。
5. 我觉得公司的发展前景很不错,希望能够有更好的发展空间。
3. 数据分析3.1 总体情况分析为了了解开放性问题的回答内容的总体情况,王静龙可以进行以下分析:•回答的总数•回答的平均长度•回答的最长长度•回答的最短长度为了实现这些分析,可以使用Python编程语言中的文本处理库进行操作。
下面是一个示例代码,可以帮助完成上述分析:```python # 导入所需的库 import pandas as pd 读取文本文件data = pd.read_csv(’responses.txt’, header=None)计算回答的总数total_responses = len(data)计算回答的平均长度average_length = data[0].apply(len).mean()计算回答的最长长度max_length = data[0].apply(len).max()计算回答的最短长度min_length = data[0].apply(len).min()输出结果print(。
数据库技术与应用课后习题答案
第一章习题答案1.1 选择题1. A2. C3. C4. B5. C6. A7. C8. B9. D 10. A 11. D 12. A 13. A 1.2 填空题数据数据的逻辑独立性数据的物理独立性层次数据模型,网状数据模型,关系数据模型能按照人们的要求真实地表示和模拟现实世界、容易被人们理解、容易在计算机上实现实体、记录属性、字段码域一对一、一对多、多对多E-R模型E-R模型层次模型、网状模型、关系模型数据操作、完整性约束矩形、菱形、椭圆形层次模型、一对多网状模型关系模型关系外模式、模式、内模式三级模式、两级映像外模式、模式、内模式数据、程序数据逻辑、数据物理DBMS(数据库管理系统)、DBA(数据库管理员)1.4 综合题2.(注:各实体的属性省略了)3.第二章习题答案1.1 单项选择题1. C2. A3. B4. C5. C6. D7. A8. B1.2 填空题集合2. 能唯一标识一个实体的属性系编号,学号,系编号关系,元组,属性关系模型,关系,实体,实体间的联系投影1.4 综合题1. πsno(σcno=’2’(SC))2. πsno(σcname=’信息系统’(SCCOURSE))3. πsno,SNAME,SAGE(STUDENT)第三章习题答案1.1select * from jobs1.2select emp_id,fname+'-'+lname as 'Name' from employee1.3select emp_id,fname+'-'+lname as 'Name',Year(getdate())-Year(hire_date) as 'worke time' from employee order by 'worke time'2.1select * from employee where fname like 'f%'2.2select * from employee where job_id='11'2.3select emp_id,fname+'-'+lname as 'Name', Year(getdate())-Year(hire_date) as worketimefrom employeewhere (Year(getdate())-Year(hire_date)) >5order by worketime2.4select * from employee where cast(job_id as integer)>=5 and cast(job_id as integer)<=82.5select * from employee where fname='Maria'2.6select * from employee where fname like '%sh%' or lname like '%sh%'3.1select * from sales where ord_date <'1993-1-1'4.1select distinct bh, zyh from stu_info wherebh in(select bh from stu_infogroup by (bh)having count(*)>30 and count(*)<40)order by bh或者是select bh,zyh from stu_infogroup by zyh,bhhaving count(bh)>30 and count(bh)<40order by bh4.2select * from gbanwhere bh like '计%'4.3select * from gfiedwhere zym like '%管理%'4.4select xh,xm,zym,stu_info.bh,rxsj from stu_info,gfied,gban where nl>23and stu_info.zyh=gfied.zyh and stu_info.bh=gban.bh4.5select zyh,count(*) from gbanwhere xsh='03'group by zyh第四章习题答案4.1 单项选择题:B2、A3、C4、A5、A6、C7、C8、D9、B10、A11、C(或B,即书上121页例题中from的写法)12、A13、C14、C15、C4.2 填空题:drop tablealter table add <列名或约束条件>with check option基本表基本表distinct group by roder by数据定义数据操纵数据控制distinctlike % _自含式嵌入式10、order by asc desc4.3 综合题1、SELECT XH, XM, ZYM, BH, RXSJFROM STU_INFO, GFIEDWHERE STU_INFO.ZYH = GFIED.ZYH AND NL > 23 AND XBM = '男'2、SELECT ZYM 专业名, count(*) 人数FROM STU_INFO, GFIEDWHERE STU_INFO.XSH = '03' AND STU_INFO.ZYH = GFIED.ZYHGROUP BY ZYM注意:该题目中给出的条件XSH = '03'中的03代表的是“控制科学与工程”学院,信息学院的代码是12,大家可根据具体情况来做该题。
《Python数据分析、挖掘与可视化》课后题答案
《Python数据分析、挖掘与可视化》课后题答案第⼆章课后题答案1.输⼊⼀个包含若⼲⾃然数的列表,输出这些⾃然数的平均值,结果保留3位⼩数。
ls=eval(input())ans=float(sum(ls)/len(ls))print('{:.3f}'.format(ans))2.输⼊⼀个包含若⼲⾃然数的列表,输出这些⾃然数降序排列后的新列表。
ls=eval(input())ls=sorted(ls,reverse=True)print(ls)3.输⼊⼀个包含若⼲⾃然数的列表,输出⼀个新列表,新列表中每个元素为原列表中每个⾃然数的位数。
ls=eval(input())ans=list()for i in ls:st=str(i)ans.append(len(st))print(ans)4.输⼊⼀个包含若⼲数字的列表,输出其中绝对值最⼤的数字。
ls=eval(input())m=ls[0]for i in ls:if abs(i)>m:m=iprint(m)5.输⼊⼀个包含若⼲整数的列表,输出这些整数的乘积。
ls=eval(input())ans=1for i in ls:ans*=iprint(ans)6.输⼊两个包含若⼲整数的等长列表,把这两个列表看作两个向量,输出这两个向量的内积。
ls1=eval(input())ls2=eval(input())ans=0for i in range(min(len(ls1),len(ls2))):ans+=ls1[i]*ls2[i]print(ans)第三章课后题答案1.输⼊⼀个字符串,输出其中每个字符的出现次数。
(⽤Counter类)2.输⼊⼀个字符串,输出其中只出现了⼀次的字符及其下标。
3.输⼊⼀个字符串,输出其中每个唯⼀字符最后⼀次出现的下标。
4.输⼊包含若⼲集合的列表,输出这些集合的并集。
(⽤reduce()函数和operator模块)5.输⼊⼀个字符串,输出加密后的结果字符串。
第五章课后习题答案
5.10 假设对指令Cache 的访问占全部访问的75%;而对数据Cache 的访问占全部访问的25%。
Cache 的命中时间为1个时钟周期,失效开销为50 个时钟周期,在混合Cache 中一次load 或store 操作访问Cache 的命中时间都要增加一个时钟周期,32KB 的指令Cache 的失效率为0.39%,32KB 的数据Cache 的失效率为4.82%,64KB 的混合Cache 的失效率为1.35%。
又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。
试问指令Cache 和数据Cache 容量均为32KB 的分离Cache 和容量为64KB 的混合Cache 相比,哪种Cache 的失效率更低?两种情况下平均访存时间各是多少?解:(1)根据题意,约75%的访存为取指令。
因此,分离Cache 的总体失效率为:(75%×0.15%)+(25%×3.77%)=1.055%;容量为128KB 的混合Cache 的失效率略低一些,只有0.95%。
(2)平均访存时间公式可以分为指令访问和数据访问两部分:平均访存时间=指令所占的百分比×(读命中时间+读失效率×失效开销)+ 数据所占的百分比×(数据命中时间+数据失效率×失效开销)所以,两种结构的平均访存时间分别为:分离Cache 的平均访存时间=75%×(1+0.15%×50)+25%×(1+3.77%×50)=(75%×1.075)+(25%×2.885)=1.5275混合Cache 的平均访存时间=75%×(1+0.95%×50)+25%×(1+1+0.95%×50)=(75%×1.475)+(25%×2.475)=1.725因此,尽管分离Cache 的实际失效率比混合Cache 的高,但其平均访存时间反而较低。
05第五章定量分析的误差和分析结果的数据处理习题
第五章 定量分析的误差和分析结果的数据处理习题1.是非判断题1-1将、、和处理成四位有效数字时,则分别为、、和。
1-2 pH=的有效数字是四位。
1-3 [HgI 4]2-的lg 4θβ=,其标准积累稳定常数4θβ为×1030。
1-4在分析数据中,所有的“0”均为有效数字。
1-5有效数字能反映仪器的精度和测定的准确度。
1-6欲配制·L -1K 2Cr 2O 7(M=·mol -1)溶液,所用分析天平的准确度为+,若相对误差要求为±%,则称取K 2Cr 2O 7时称准至。
1-7从误差的基本性质来分可以分为系统误差,偶然误差和过失误差三大类。
1-8误差的表示方法有两种,一种是准确度与误差,一种是精密度与偏差。
1-9相对误差小,即表示分析结果的准确度高。
1-10偏差是指测定值与真实值之差。
1-11精密度是指在相同条件下,多次测定值间相互接近的程度。
1-12系统误差影响测定结果的准确度。
1-13测量值的标准偏差越小,其准确度越高。
1-14精密度高不等于准确度好,这是由于可能存在系统误差。
控制了偶然误差,测定的精密度才会有保证,但同时还需要校正系统误差,才能使测定既精密又准确。
1-15随机误差影响到测定结果的精密度。
1-16对某试样进行三次平行测定,得平均含量%,而真实含量为%,则其相对误差为%。
1-17随机误差具有单向性。
1-18某学生根据置信度为95%对其分析结果进行处理后,写出报告结果为+%,该报告的结果是合理的。
1-19置信区间是指测量值在一定范围的可能性大小,通常用百分数表示。
1-20在滴定分析时,错误判断两个样液滴定终点时指示剂的颜色的深浅属于工作过失。
2.选择题.2-1下列计算式的计算结果(x)应取几位有效数字:x=[×× A.一位 B.二位C.三位D.四位2-2由计算器算得×÷×的结果为,按有效数字运算规则应得结果修约为2-3由测量所得的计算式0.607030.2545.820.28083000X⨯⨯=⨯中,每一位数据的最后一位都有±1的绝对误差,哪一个数据在计算结果x中引入的相对误差最大2-4用返滴定法测定试样中某组分含量,按式x % =()246.470.100025.000.5221001.00001000⨯-⨯⨯⨯计算,分析结果应以几位有效数字报出A.一位B.二位C.三位D.四位2-5溶液中含有·L-1的氢氧根离子,其pH值为2-6已知某溶液的pH值为,其氢离子浓度的正确值为A. mol·L-1B. mol·L-1C. mol·L-1D. mol·L-12-7某分析人员在以邻苯二甲酸氢钾标定NaOH溶液浓度时,有如下五种记录,请指出其中错误操作的记录2-8某人以差示光度法测定某药物中主成分含量时,称取此药物,最后计算其主成分含量为%,此结果是否正确;若不正确,正确值应为A.正确B.不正确,%C.不正确,98%D.不正确,%2-9下列数据中,有效数字为4位的是A. pH=B. C(Cl-)= mol·L-1C. ()Feω= D.()CaOω=%2-10某人根据置信度为95%对某项分析结果计算后,写出了如下五种报告,哪种是合理的A.±%B.±%C.±%D.±%E.±%2-11定量分析工作要求测定结果的误差A.越小越好B.等于零C.没有要求D.略大于允许误差E.在允许误差范围内2-12分析测定中,偶然误差的特点是A.大小误差出现的几率相等B.正、负误差出现的几率相等C.正误差出现的几率大于负误差D.负误差出现的几率大于正误差E.误差数值固定不变2-13下列叙述中错误的是A.误差是以真值为标准,偏差是以平均值为标准,在实际工作中获得的所谓“误差”,实质上是偏差B.对某项测定来说,它的系统误差大小是可以测量的C.对于偶然误差来说,大小相近的正误差和负误差出现的机会是均等的D.标准误差是用数理统计的方法处理测定数据而获得的E.某测定的精密度越好,则该测定的准确度越好2-14下列叙述错误的是A.方法误差属于系统误差B.系统误差包括操作误差C.系统误差又称可测误差D.系统误差呈正态分布E.系统误差具有单向性2-15对某试样进行多次平行测定,获得试样中硫的平均含量为%,则其中某个测定值(如%)与此平均值之差为该次测定的A.绝对误差B.相等误差C.系统误差D.相等偏差E.绝对偏差2-16用氧化还原法测得某试样中铁的百分含量为:、、、,分析结果的标准偏差为A. %B. %C. %D. %E. %2-17用沉淀滴定法测定某NaCl样品中氯的含量,得到下列结果:、、、、。
应用数值分析(第四版)课后习题答案第5章
第五章习题解答1、给出数据点:013419156i i x y =⎧⎨=⎩(1)用012,,x x x 构造二次Lagrange 插值多项式2()L x ,并计算15.x =的近似值215(.)L 。
(2)用123,,x x x 构造二次Newton 插值多项式2()N x ,并计算15.x =的近似值215(.)N 。
(3)用事后误差估计方法估计215(.)L 、215(.)N 的误差。
解:(1)利用012013,,x x x ===,0121915,,y y y ===作Lagrange 插值函数2202130301191501031013303152933()()()()()()()()()()()()()()i i i x x x x x x L x l x y x x =------==⨯+⨯+⨯-------++=∑代入可得2151175(.).L =。
(2)利用123134,,x x x ===,1239156,,y y y ===构造如下差商表:于是可得插值多项式:229314134196()()()()()N x x x x x x =+-+---=-+-代入可得215135(.).N =。
(3)用事后误差估计的方法可得误差为1501511751350656304.(.)(..).R -=-=-◆ 2、设Lagrange 插值基函数是0012()(,,,,)nj i j i jj ix x l x i n x x =≠-==-∏试证明:①对x ∀,有1()ni i l x ==∑②00110001211()()(,,,)()()nk i i i n n k l x k n x x x k n =⎧=⎪==⎨⎪-=+⎩∑ 其中01,,,n x x x 为互异的插值节点。
证明:①由Lagrange 插值多项式的误差表达式101()()()()()!n ni i f R x x x n ξ+==-+∏知,对于函数1()f x =进行插值,其误差为0,亦即0()()ni ii f x l x f==∑精确成立,亦即1()ni i l x ==∑。
大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院
大数据分析与挖掘智慧树知到课后章节答案2023年下青岛黄海学院青岛黄海学院第一章测试1.下列选项中,用于搭建数据仓库和保证数据质量的是()。
A:数据展现 B:数据分析 C:数据收集 D:数据处理答案:数据处理2.HTML文档属于()。
A:不是数据 B:结构化数据 C:非结构化数据 D:半结构化数据答案:半结构化数据3.数据挖掘的英文缩写()。
A:DM B:DA C:DC D:DB答案:DM4.Hadoop的基础架构是()。
A:ABC都不正确B:分布式系统 C:操作系统 D:同步系统答案:分布式系统5.一般情况下,计算机处理的数据都是()。
A:无结构化的数据 B:非结构化的数据 C:半结构化的数据 D:结构化的数据答案:结构化的数据第二章测试1.在Python中实现多个条件判断需要用到与if语句的组合语句是()A:ABC均不是 B:elif C:pass D:else答案:elif2.Python 语言属于以下哪种语言()A:机器语言 B:ABC都不正确 C:高级语言 D:汇编语言答案:高级语言3.下列选项中,不是Python关键字的是()A:static B:pass C:yield D:from答案:static第三章测试1.已知x= np.array((1,2,3,4,5)),那么表达(x**2).max()的值为()。
A:20 B:25 C:15 D:30答案:252.已知x= np.array((1,2, 3, 4, 5)),那么表达式(x//5).sum()的值()。
A:2 B:3 C:4 D:1答案:13.已知x=np.array((1,2,3), 4, 5),那么表达式sum(x*x)的值()。
A:50 B:55 C:60 D:65答案:554.在Matplotlib中,用于绘制散点图的函数是()。
A:pie() B:scatter() C:bar() D:hist()答案:scatter()5.下列选项中,不属于Seaborn库特点的是()A:多个内置主题及颜色主题 B:基于网格绘制出更加复杂的图像集合 C:可以处理大量的数据流 D:Seaborn是基于Matplotlib的可视化库答案:可以处理大量的数据流第四章测试1.下列不属于HTTP请求过程的是()A:请求重定向 B:超时设置 C:搜索文档 D:生成请求答案:搜索文档2.下列关于Python爬虫库的功能,描述不正确的是()A:通用爬虫库——urllib B:Html/Xml解析器——pycurl C:爬虫库——Scrapy D:通用爬虫库——requests答案:Html/Xml解析器——pycurl3.下列对于Scrapy常用命令及其作用描述错误的是()A:list是一个全局命令,主要用于列出项目中所有可用的爬虫 B:startproject 是一个全局命令,主要用于运行一个独立的爬虫 C:crawl是一个项目命令,主要用于启动爬虫 D:genspider是一个项目命令,主要用于创建爬虫模板答案:startproject是一个全局命令,主要用于运行一个独立的爬虫4.下列请求头中,可以记载用户信息实现模拟登录的是()A:Connection B:User-Agent C:Cookie D:Host答案:Cookie5.下列不属于Scrapy框架的基本组成部分的是()A:下载器与Spiders B:引擎与调度器 C:Item Pipelnes D:解析中间件答案:引擎与调度器第五章测试1.下列关于Pandas数据读/写说法错误的是()A:to_csv函数能够读取数据库的数据写入.csv文件 B:read_csv能够读取所有文本文档的数据 C:to_excel函数能够将结构化数据写入Excel文件D:read_sql能够读取数据库的数据答案:read_csv能够读取所有文本文档的数据2.下列关于时间相关类错误的是()A:Timestamp是存放某个时间点的类 B:两个数值上相同的Period和Timestamp所代表的意义相同 C:Period是存放某个时间段的类D:Timestamp数据可以使用标准的试卷字符串转换得来答案:两个数值上相同的Period和Timestamp所代表的意义相同3.使用pivot_table函数制作透视表设置行分组键的参数为()。
数据库第二版课后习题答案
数据库第二版课后习题答案数据库第二版课后习题答案数据库是计算机科学中重要的概念之一,它提供了一种有效地存储和管理数据的方式。
数据库系统的设计与实现是数据库课程的重要内容之一。
在学习数据库课程时,课后习题是巩固知识和提高能力的重要途径。
本文将为大家提供数据库第二版课后习题的答案,希望对大家的学习有所帮助。
第一章数据库系统概述1. 数据库是什么?答:数据库是一个有组织的、可共享的、可维护的数据集合,它以一定的数据模型为基础,描述了现实世界中某个特定领域的数据和关系。
2. 数据库系统的特点有哪些?答:数据库系统具有以下特点:- 数据的独立性:数据库系统将数据与程序相分离,使得数据的修改不会影响到程序的运行。
- 数据的共享性:多个用户可以同时访问数据库,并且可以共享数据。
- 数据的冗余性小:通过数据库系统的数据一致性和完整性约束,可以减少数据的冗余性。
- 数据的易扩展性:数据库系统可以方便地进行扩展和修改,以满足不同需求。
- 数据的安全性:数据库系统提供了权限管理和数据加密等机制,保证数据的安全性。
第二章关系数据库与SQL1. 什么是关系数据库?答:关系数据库是一种基于关系模型的数据库,它使用表格(关系)来表示和存储数据。
关系数据库中的数据以行和列的形式组织,每个表格代表一个实体集,每一行代表一个实体,每一列代表一个属性。
2. 什么是SQL?答:SQL(Structured Query Language)是一种用于管理关系数据库的语言。
它包含了数据定义语言(DDL)、数据操纵语言(DML)和数据控制语言(DCL)等部分。
通过SQL,用户可以对数据库进行创建、查询、更新和删除等操作。
第三章数据库设计1. 数据库设计的步骤有哪些?答:数据库设计的步骤包括:- 需求分析:确定数据库的需求和目标,了解用户的需求。
- 概念设计:根据需求分析的结果,设计数据库的概念模型,包括实体、属性和关系等。
- 逻辑设计:将概念模型转换为逻辑模型,包括表格的设计、关系的建立和约束的定义等。
《统计分析与SPSS的应用(第五版)》课后练习答案(第5章)
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5 章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。
现从雇员中随机选出11人参加考试,得分如下:80, 81, 72, 60, 78, 65, 56, 79,77,87, 76 请问该经理的宣称是否可信。
原假设:样本均值等于总体均值即u=u0=75步骤:生成spss 数据→分析→比较均值→单样本t 检验→相关设置→输出结果(Analyze->compare means->one-samples T test ;)采用单样本T 检验(原假设H0:u=u0=75, 总体均值与检验值之间不存在显著差异);单个样本统计量N 均值标准差均值的标准误成绩11 73.73 9.551 2.880单个样本检验检验值= 75差分的95% 置信区间t df Sig.( 双侧) 均值差值下限上限成绩-.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在test 后的框中输入检验值(填75),最后ok!分析:N=11 人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean) 为2.87.t 统计量观测值为-4.22,t 统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14), 由此采用双尾检验比较 a 和p。
T 统计量观测值的双尾概率p-值(sig.(2-tailed) )为0.668>a=0.05 所以不能拒绝原假设;且总体均值的95% 的置信区间为(67.31,80.14), 所以均值在67.31~80.14 内,75 包括在置信区间内,所以经理的话是可信的。
2、在某年级随机抽取35 名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS 对上表数据进行描述统计,并绘制相关的图形。
大数据分析与应用知到章节答案智慧树2023年西安理工大学
大数据分析与应用知到章节测试答案智慧树2023年最新西安理工大学第一章测试1.大数据泛指巨量的()。
参考答案:数据集2.数据分析指的是用适当的()对收集来的大量数据进行分析,提取有用信息并形成结论。
参考答案:统计分析方法3.浏览数据这一步骤可以通过对大数据进行()来实现。
参考答案:可视化4.Gartner将大数据定义为是需要新处理模式才能具有更强的()以及高增长率和多样化的信息资产。
参考答案:流程优化能力;决策力;洞察发现力5.我们通常用“4V”来反映大数据的特点,4V是指()。
参考答案:Velocity;Variety6.大数据分析可以应用在那些领域()。
参考答案:医疗卫生领域;农业领域;商业领域;交通运输领域7.大数据分析的过程包括()。
参考答案:数据准备;数据理解8.数据只要有足够的规模就可以称为大数据。
()参考答案:对9.大数据分析是大数据到知识,再到信息的关键步骤。
()参考答案:错10.大数据分析模型用于描述数据之间的关系。
如确定自变量、因变量,进而通过聚类、回归等方法确定其关系。
()参考答案:对第二章测试1.数据仓库的定义于哪一年提出()。
参考答案:19912.符合选择建立数据仓库平台的公认标准的是()。
参考答案:数据库对大数据量的支持能力3.建立数据仓库的首要步骤是()。
参考答案:确认主题4.数据仓库的数据模型进行逻辑建模的分析角度是()。
参考答案:业务分析5.建立数据仓库的选择平台是()。
参考答案:建模工具;分析工具;数据库6.建立数据仓库的步骤是()。
参考答案:确认主题;数据传输;选择平台;数据清洗7.符合多维度数据模型构成的是()。
参考答案:事实表;维度表8.属于衡量业务性能指标的是()。
参考答案:销售额;销售量9.数据仓库的逻辑数据模型是一维结构的数据视图。
()参考答案:错10.元数据是对数据仓库中数据的描述信息。
()参考答案:对第三章测试1.下列哪项属于随机抽样的缺点?()参考答案:样本中个体数量过多,效率低下2.整群抽样中将总体各单位归并成若干个()的集合,成为群,然后以群为单位抽取样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
属性数据分析第五章课后作业
6.为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老年人中作调查。
调查数据如下:
试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?
解:(1)数据压缩分析
首先将上表中不同年龄段的数据合并在一起压缩成二维2×2列联表1.1,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异?
表1.1 “性别×偏好饮料”列联表
二维2×2列联表独立检验的似然比检验统计量Λ
2的值为0.7032,p值
-ln
为05
≥
=
=χ
p,不应拒绝原假设,即认为“偏好类型”
(2>
P
4017
.0
)1(
)
.0
7032
.0
与“性别”无关。
(2)数据分层分析
其次,按年龄段分层,得到如下三维2×2×2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异?
表1.2 三维2×2×2列联表
在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调查,在“年青人”年龄段,男性中偏好饮料A 占58.73%,偏好饮料B 占41.27%;女性中偏好饮料A 占58.73%,偏好饮料B 占41.27%,我们可以得出在这个年龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。
同理,在“老年人”年龄段,也有一定的差异。
(3)条件独立性检验
为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。
即由题意,可令C 表示年龄段,1C 表示年青人,2C 表示老年人;D 表示性别,1D 表示男性,2D 表示女性;E 表示偏好饮料的类型,1E 表示偏好饮料A ,2E 表示偏好饮料B 。
欲检验的原假设为:C 给定后D 和E 条件独立。
按年龄段分层后得到的两个四格表,以及它们的似然比检验统计量Λ-ln 2的值如下:
2C 层
822.11ln 2=Λ-248.6ln 2=Λ-
条件独立性检验问题的似然比检验统计
量是这两个
似然比检验统计量的和,其值为 07.18822.11248.6ln 2=+=Λ- 由于2===t c r ,所以条件独立性检验的似然比检验统计量的渐近2χ分布的自由度为2)1)(1(=--t c r ,也就是上面这2个四格表的渐近2χ分布的自由度的和。
由于p 值50.00011916)07.18)2((2=≥χP 很小,所以认为条件独立性不成立,即在年龄段给定的条件下,男性和女性对两种类型的饮料的偏好是有差异的。
(4)产生偏差的原因
a 、在(1)中,将不同年龄段的数据压缩在一起合起来后分析发现男性和女性在
对两种类型的饮料的偏好上是没有差异的。
但将数据以不同的年龄段分层后并分别分析发现男性和女性在对两种类型的饮料的偏好上是有一定差异的。
合起来看和分开来看的结果不同。
b、由此看来,年龄段在此次调查中属于混杂因素。
由于不同年龄段的人对饮料的选择也会有差异,例如现在的年青人偏好喝一些像可口可乐,美年达等这样的碳酸饮料,而老年人则偏好喝一些红茶,绿茶等这样的非碳酸饮料,在调查中,“老年人”年龄段共有115人,所占比例大,从而使整个结果就倾向于老年人的观点,即使得混杂因素“年龄段”起到一定的干扰作用,从而导致整个调查结果产生了偏差。
8.某工厂有三个车间。
车间主任分别为王、张和李。
过去的一年里,该工厂产品的质量情况总结如下:
王主任将内销和外销产品合并在一起,然后计算各个车间的不合格率。
计算结果如下:
王主任说,我负责的车间生产情况最好,其次是李主任负责的车间,最差的是张主任负责的车间。
这样的比较是不是有偏比较?为什么?
解:不是,有偏比较是指将数据压缩后合起来看与分层后分开来看得出的结果不一致时所产生的偏差,而此题只是将数据压缩起来后相互间比较,因此这样
的比较不是有偏比较。
具体分析如下:
由题知,分析车间主任与产品的质量情况之间的关系,则本题是以产品类别为层,以车间主任为行,产品的质量情况为列进行相关分析。
(1)数据压缩分析
首先将上表中不同产品类别的数据合并在一起压缩成二维3×2列联表2.1,合起来看,分析车间主任与产品的质量情况两者之间的关系?
表2.1 “车间主任×产品质量”列联表
可计算出该表独立性检验的似然比检验统计量Λ
2的值为48.612,p值为
-ln
≥
=χ
p。
应该拒绝原假设,即认为车间主任与产品的质量情P
(2≈
612
)
.
48
)2(
况两者是有一定相关性的。
(2)数据分层分析
其次,按产品类别分层,得到如下三维2×3×2列联表2.2,分开来看,分析车间主任与产品的质量情况两者之间的关系?
表1.2 三维2×2×2列联表
在上述数据中,分别对两个产品类别(即内销和外销)进行分析,在“内
销”类别中,王姓主任车间的产品不合格率最高,即车间生产情况最差,张姓主任车间的不合格率最低,即车间生产情况最好;在“外销”类别中,王姓主任车间的产品不合格率最高,即车间生产情况最差,张姓和李姓主任车间生产情况差不多。
(3)条件独立性检验
为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。
即由题意,可令A 表示产品类别,1A 表示内销,2A 表示外销;B 表示车间主任,
1B 表示王姓主任,2B 表示张姓主任,3B 表示李姓主任;C 表示产品的质量情况,1C 表示合格产品数,2C 表示不合格产品数。
欲检验的原假设为:A 给定后B 和C 条件独立。
按产品类别分层后得到的两张表格,以及它们的似然比检验统计量Λ-ln 2的值如下:
1A 层
289.15ln 2=Λ-
2A 层
684
.51ln 2=Λ-条件独立性检验问题的似然比检验统计量是这两个似然比检验统计量的和,其值为
973.66684.51289.15ln 2=+=Λ-
由于3,2===r t c ,所以条件独立性检验的似然比检验统计量的渐近2χ分布的自由度为3)1)(1(=--t c r ,也就是上面这2个表格的渐近2χ分布的自由度的和。
由于p 值0)973.66)3((2≈≥χP 很小,所以认为条件独立性不成立,即在产品类别给定的条件下,车间主任与产品的质量情况两者是有一定相关性的。
(4)结论
在(1)中,将不同产品类别的数据压缩在一起合起来后分析发现车间主任与产品的质量情况两者是有一定相关性的;在(2)中,将数据以不同的产品类别分层后分析发现车间主任与产品的质量情况两者也是有一定相关性的。
即合起来看和分开来看的结果相同。
据我们所知,有偏比较是指将数据压缩后合起来看与分层后分开来看得出的结果不一致时所产生的偏差,而此题合起来看和分开来看的结果都是相同的。
因此此题若是分析车间主任与产品的质量情况两者之间的相关关系的话,则该题是无偏的,即不均有有偏性,无法进行有偏比较。