浙大远程数据挖掘离线作业答案
浙大远程操作系统原理离线作业及答案

浙⼤远程操作系统原理离线作业及答案操作系统原理离线作业⼀、单选题1.进程P0和P1的共享变量定义及其初值为boolean flag[2];int turn=0;flag[0]=FALSE;flag[1]=FALSE;若进程P0和P1访问临界资源的类C代码实现如下:void P0() //P0进程{ while(TURE){flag[0]=TRUE; turn = 1;while (flag[1] && turn == 1) ;临界区;flag[0] = FALSE;}}void P1() //P1进程{ while(TURE){flag[1]=TRUE; turn = 0;while (flag[0] && turn == 0) ;临界区;flag[1] = FALSE;}}则并发执⾏进程P0和P1时产⽣的情况是:DA.不能保证进程互斥进⼊临界区、会出现“饥饿”现象B.不能保证进程互斥进⼊临界区、不会出现“饥饿”现象C.能保证进程互斥进⼊临界区、会出现“饥饿”现象 D.能保证进程互斥进⼊临界区、不会出现“饥饿”现象2.有两个进程P1和P2描述如下:shared data:int counter = 6;P1 :Computing;counter=counter+1;P2 :counter=counter-2;两个进程并发执⾏,运⾏完成后,counter的值不可能为 C 。
A. 4B. 5C. 6D. 73.某计算机采⽤⼆级页表的分页存储管理⽅式,按字节编址,页⼤⼩为210字节,页表项⼤⼩为2字节,逻辑地址结构为:页⽬录号页号页内偏移量逻辑地址空间⼤⼩为216页,则表⽰整个逻辑地址空间的页⽬录表中包含表项的个数⾄少是BA.64 B.128 C.256 D.5124.在动态分区系统中,有如下空闲块:空闲块块⼤⼩(KB)块的基址1 80 602 75 1503 55 2504 90 350此时,某进程P请求50KB内存,系统从第1个空闲块开始查找,结果把第4个空闲块分配给了P进程,请问是⽤哪⼀种分区分配算法实现这⼀⽅案? CA.⾸次适应B. 最佳适应C. 最差适应D. 下次适应5.在⼀页式存储管理系统中,页表内容如下所⽰。
数据挖掘试题参考答案

大学课程《数据挖掘》试题参考答案范围:∙ 1.什么是数据挖掘?它与传统数据分析有什么区别?定义:数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
区别:(1)数据挖掘的数据源与以前相比有了显著的改变;数据是海量的;数据有噪声;数据可能是非结构化的;(2)传统的数据分析方法一般都是先给出一个假设然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来。
即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。
在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”-里面的数据几乎不再被访问。
也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时还只能凭自己的经验和直觉。
因此改进原有的数据分析方法,使之能够智能地处理海量数据,即演化为数据挖掘。
∙ 2.请根据CRISP-DM(Cross Industry Standard Process for Data Mining)模型,描述数据挖掘包含哪些步骤?CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段.1: business understanding: 即商业理解. 在第一个阶段我们必须从商业的角度上面了解项目的要求和最终目的是什么. 并将这些目的与数据挖掘的定义以及结果结合起来.2.data understanding: 数据的理解以及收集,对可用的数据进行评估.3: data preparation: 数据的准备,对可用的原始数据进行一系列的组织以及清洗,使之达到建模需求.4:modeling: 即应用数据挖掘工具建立模型.5:evaluation: 对建立的模型进行评估,重点具体考虑得出的结果是否符合第一步的商业目的.6: deployment: 部署,即将其发现的结果以及过程组织成为可读文本形式.(数据挖掘报告)∙ 3.请描述未来多媒体挖掘的趋势随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。
数据挖掘习题答案

数据挖掘习题答案数据挖掘习题答案数据挖掘作为一门重要的技术和方法,广泛应用于各个领域。
在学习数据挖掘的过程中,习题是不可或缺的一部分。
通过解答习题,我们可以更好地理解和掌握数据挖掘的原理和应用。
以下是一些常见的数据挖掘习题及其答案,供大家参考。
一、选择题1. 数据挖掘的目标是什么?A. 发现隐藏在大数据中的模式和关联B. 提供数据存储和管理的解决方案C. 分析数据的趋势和变化D. 优化数据的存储和传输速度答案:A. 发现隐藏在大数据中的模式和关联2. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 回归D. 排序答案:D. 排序3. 数据挖掘的过程包括以下几个步骤,哪个是第一步?A. 数据清洗B. 数据集成C. 数据转换D. 数据选择答案:B. 数据集成4. 下列哪个不是数据挖掘中常用的算法?A. 决策树B. 支持向量机C. 朴素贝叶斯D. 深度学习答案:D. 深度学习5. 下列哪个不是数据挖掘的应用领域?A. 金融B. 医疗C. 娱乐D. 政治答案:D. 政治二、填空题1. 数据挖掘是从大量数据中发现________和________。
答案:模式,关联2. 数据挖掘的主要任务包括分类、聚类、回归和________。
答案:预测3. 数据挖掘的过程包括数据集成、数据清洗、数据转换和________。
答案:模式识别4. 决策树是一种常用的________算法。
答案:分类5. 数据挖掘可以应用于金融、医疗、娱乐等多个________。
答案:领域三、简答题1. 请简要介绍数据挖掘的主要任务和应用领域。
答:数据挖掘的主要任务包括分类、聚类、回归和预测。
分类是将数据集划分为不同的类别,聚类是将数据集中相似的样本归为一类,回归是根据已有的数据预测未知数据的值,预测是根据已有的数据预测未来的趋势和变化。
数据挖掘的应用领域非常广泛,包括金融、医疗、娱乐等。
在金融领域,数据挖掘可以用于信用评估、风险管理等方面;在医疗领域,数据挖掘可以用于疾病诊断、药物研发等方面;在娱乐领域,数据挖掘可以用于推荐系统、用户行为分析等方面。
浙江大学数据挖掘在线作业答案

您的本次作业分数为:100分1.【第001章】孤立点挖掘适用于下列哪种场合?A 目标市场分析B 购物篮分析C 模式识别D 信用卡欺诈检测正确答案:D2.【第01章】根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。
A 关联分析B 分类和预测C 演变分析D 概念描述正确答案:B3.【第01章】数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。
A 所涉及的算法的复杂性B 所涉及的数据量C 计算结果的表现形式D 是否使用了人工智能技术正确答案:B4.【第01章】下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:D5.【第01章】下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A6.【第01章】帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 聚类分析D 孤立点分析E 演变分析正确答案:C7.【第01章】下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。
A 选择任务相关的数据B 选择要挖掘的知识类型C 模式的兴趣度度量D 模式的可视化表示正确答案:B8.【第01章】假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 孤立点分析D 演变分析E 概念描述正确答案:E9.【第02章】下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?A 空间填充曲线B 散点图矩阵C 平行坐标D 圆弓分割正确答案:B10.【第02章】计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B11.【第02章】字段Size = {small, medium, large}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:C12.【第02章】字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:A13.【第03章】哪种数据变换的方法将数据沿概念分层向上汇总?A 平滑B 聚集C 数据概化D 规范化正确答案:C14.【第03章】下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A15.【第03章】()通过将属性域划分为区间,从而减少给定连续值的个数。
2015秋浙江大学网络学院《数据挖掘》在线作业及答案

2015秋浙江大学网络学院《数据挖掘》在线作业及答案单选题1.置信度(confidence)是衡量兴趣度度量()的指标。
A 简洁性B 确定性C 实用性D 新颖性正确答案:B 单选题2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?A 上卷B 下钻C 切块D 转轴正确答案:A 单选题3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A 单选题4.下列哪个描述是正确的?A 分类和聚类都是有指导的学习B 分类和聚类都是无指导的学习C 分类是有指导的学习,聚类是无指导的学习D 分类是无指导的学习,聚类是有指导的学习正确答案:C单选题5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B 单选题6.规则:age(X,”19-25”) ∧buys(X, “popcorn”) => buys(X, “coke”)是一个()。
A 单维关联规则B 多维关联规则C 混合维关联规则D 不是一个关联规则正确答案:B 单选题7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。
A 关联分析B 分类和预测C 孤立点分析D 演变分析 E概念描述正确答案:E 单选题8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A 单选题9.进行数据规范化的目的是()。
A 去掉数据中的噪声B 对数据进行汇总和聚集C 使用概念分层,用高层次概念替换低层次“原始”数据D 将属性按比例缩放,使之落入一个小的特定区间正确答案:D 单选题10.平均值函数avg()属于哪种类型的度量?A 分布的B 代数的C 整体的D 混合的正确答案:B 单选题11.下面哪种分类方法是属于统计学的分类方法?A 判定树归纳B 贝叶斯分类C 后向传播分类D 基于案例的推理正确答案:B 单选题12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。
浙大远程-计算机网络基础第1、2章离线作业和答案

第1章概述作业一一.填空题:1.从资源共享的角度来定义计算机网络,计算机网络指的是利用_通信线路__将不同地理位置的多个独立的__自治计算机系统_连接起来以实现资源共享的系统。
2.从传输范围的角度来划分计算机网络,计算机网络可以分为_局域网_、城域网_和_广域网_。
其中,Internet属于_广域网__。
3.在TCP/IP的应用层协议使用的是_客户服务器方式_,在这里,客户是服务请求方,服务器是服务提供方。
美国的IBM公司在1974年宣布了它研制的网络体系结构_ SNA __。
4.通信线路的_带宽__是指通信线路上允许通过的信号频带范围(或通频带) ,单位是HZ。
但在计算机网络中,它又用来表示网络的通信线路所能传送数据的能力。
5.数据通信中的信道传输速率单位用b/s表示,b/s的含义是__每秒比特__。
6.目前,“带宽”常用作描述信道传送数据能力的物理量,其单位是b/s (bit/s),比之大的单位有:_ Kb/s ___、Mb/s、_ Gb/s __等。
7.将计算机网络划分为局域网LAN、城域网MAN、广域网WAN是按_网络的作用范围(或覆盖的范围)_划分的。
8.各节点都与中心节点连接,呈辐射状排列在中心节点周围,这种拓扑结构称为_星型拓扑结构_。
9.假设某用户通过电线部门的ADSL技术以2M(即2Mb/s)带宽接入Internet,在正常情况下其下载速度大约是_ 244KB(大写B表示字节)_。
10.在发送报文之前,先将较长的报文划分成为一个个更小的等长数据段,在每一个数据段前面,加上一些由必要的控制信息组成的首部(header)后,就构成了一个_分组_。
11.在计算机网络中,_各个子层_及其__各子层的协议_的集合称为网络体系结构。
12.开放系统互联,采用分层体系结构的模型称为__ OSI __参考模型。
13.在OSI参考模型中,在对等层次上传送的数据单位,都称为该层的_协议数据单元(PDU)_。
浙大远程-操作系统原理第三次离线作业(第4、5章)

操作系统原理第三次作业(第4、5章)-1问答题1.用户在使用配置UNIX/Linux 操作系统的计算机时不能将用户软盘随便插进和拿出,试从UNIX/Linux子文件系统的使用原理说明它需要一定的操作的依据和操作的步骤。
UNIX系统只有一个安装UNIX操作系统的根设备的文件系统常驻系统,在硬盘上的其它盘区和软盘上的文件系统被安装前UNIX OS不知道,系统要使用其它文件系统,必须先用mount命令将其安装到系统,被安装的子文件系统的根安装到根设备树形目录的某一节点上。
子文件系统在安装时将该子系统的管理块(superblock)和有关目录信息拷贝到系统缓冲区和活动索引节点表,管理块中存放该子文件系统所对应盘区的管理信息,如即将分配的空闲块号和空闲索引节点号等。
子文件系统安装后进行文件读写增删,文件创建和删除等操作,其变化要记录在系统缓冲区中管理块和活动索引节点表中。
子文件系统使用完毕后要使用umount拆卸命令拆卸安装上去的文件系统,在拆卸时系统将内存系统缓冲区中的管理块和活动索引节点表信息拷贝到将拆卸的子文件系统盘中,保证信息的完整性。
软盘的子文件系统,它需按规定使用,步骤如下:(1)插入软盘(2)使用安装命令安装软盘文件系统(3)读/写盘中文件(4)使用拆卸命令拆卸软盘文件系统(5)取出软盘如使用软盘时随便插进和拿出软盘,就可能造成软盘信息的丢失2. 什么是文件共享?试述UNIX系统中文件共享的实现方法和命令的使用。
文件共享是允许不同的用户使用不同的名字名存取同一文件。
UNIX的文件共享方式有二种:(1)基于索引节点的共享方式--文件硬连接UNIX系统将文件控制块FCB中文件名和文件说明分开。
文件说明为索引节点,各文件索引节点集中存放在索引节点区。
而文件名与索引节点号构成目录,同一级目录构成目录文件,在文件区存放。
为了共享文件,只是在二个不同子目录下取了不同的文件名,但它们具有相同的索引节点号。
浙大远程-计算机网络基础第5、6章离线作业和答案

第5章运输层作业五一.填空题:1.从通信和信息处理的角度看,在TCP/IP模型中向其上面的应用层提供通信服务的协议层称为_运输_层。
2.传输层使用了___网络层__提供的服务,并通过执行_传输层协议_,针对最高层屏蔽__通信子网_在技术、设计上的差异与服务不足,向_更高层(或写应用层)_提供了一个标准的完善的通信服务。
3.TCP协议可以为其用户提供_可靠_、面向连接的、全双工的数据流传输服务。
4.UDP协议可以为其用户提供不可靠、__无连接的数据传输服务。
5.人们把将要发送的完整的数据块称为报文,在运输层直接对应用层交下来的报文进行封装的协议是_ UDP _。
6.在运输层,TCP协议传递给网络层IP协议的数据单元称为_报文段_。
7.TCP/IP的运输层有两个不同的协议,它们是TCP和UDP,其中文名分别叫做传输控制协议和_用户数据报协议__。
前者是面向连接的协议,而后者则属于无连接协议。
使用UDP协议,系统资源开销小,UDP报文段的首部只有_8_字节。
而对于TCP来说,其报文段的首部至少有_20_字节,传输开销比较大,TCP开销大的另一个原因是占有CPU的处理时间。
因此,在应用层开发中运输层使用哪个协议要视具体情况而定。
诸如“万维网、电子邮件和文件传输”服务在运输层使用_ TCP_协议封装,而“域名转换协议DNS和IP电话”服务在运输层使用_ UDP协议封装。
8.熟知端口即系统端口号是IANA指派的。
FTP服务使用的熟知端口号是_21_,简单邮件传输协议SMTP使用的熟知端口号是_25_,邮局协议POP3使用的熟知端口号是_110_。
9.在TCP/IP网络中,两个应用进程之间建立的Socket连接是由4个数字确定的,包括双方的IP地址和双方的__端口号__。
10.主机A向主机B发送TCP报文段,首部中的源端口是m而目的端口是n。
当B向A发送回信时,其TCP报文段的首部中的源端口和目的端口分别是_ n 和m __。
浙大远程-操作系统原理第二次离线作业(第3章)

操作系统原理第二次离线作业(第3章)-1应用题1.在一个请求分页系统中,采用FIFO页面置换算法时,假如一个作业的页面访问顺序为4,3,2,1,4,3,5,4,3,2, l,5,当分配给该作业的物理块数M为4时,试试写出页面访问的过程,并计算访问中所发生的缺页次数和缺页率?解:FIFO置换算法用FIFO置换算法产生缺页次数 10 次缺页率83%2.某采用页式存储管理的系统,假如系统分配给一个作业的物理块数为4,作业执行时依次访问的页为: 2,3,2,1,5,2,4,5,3,2,5,2。
采用LRU页面置换算法时,计算出程序访问过程中所发生的缺页过程和缺页次数。
解:LRU算法问答题1.试述在设有快表的分页存贮管理系统的地址变换机构和地址变换过程。
在CPU给出有效地址(逻辑地址)后,系统将有效地址分离为页号和页内地址。
系统将页号与页表长度进行比较,如果页号大于页表寄存器中的页表长度,则访问越界,产生越界中断。
地址变换机构又自动地将页号送入高速缓存,确定所需要的页是否在快表中。
若是,则直接读出该页所对应的物理块号,送入物理地址寄存器;与此同时,将有效地址(逻辑地址)寄存器中页内地址直接装入物理地址寄存器的块内地址字段中,这样便完成了从逻辑地址到物理地址的变换。
若在快表中未找到对应的页表项,则根据页表寄存器中的页表始址和页号计算出该页在页表项中的位置,通过查找页表,得到该页的物理块号,将此物理块号装入物理地址寄存器中,与有效地址寄存器中页内地址组合成物理地址;同时,把从页表中读出的页表项存入快表中的一个寄存器单元中,以取代一个旧的页表项。
2.试述动态分区、分页和分段三种存储管理方案中如何实现信息的存储保护。
1. 越界保护在动态分区的保护的常用方法是由系统提供硬件:一对界限寄存器。
这可以是上界限寄存器、下界限寄存器,或者是基址寄存器、限长寄存器。
基址寄存器存放起始地址,作为重定位(地址映射)使用;限长寄存器存放程序长度,作为存贮保护使用。
浙大远程工程数学离线作业答案(2015年春)

浙江大学远程教育学院《工程数学》课程作业姓名:学号:年级:学习中心:—————————————————————————————《复变函数与积分变换》第一章1.1计算下列各式:(2)、(a-bi)3解(a-bi)3=a3-3a2bi+3a(bi)2-(bi)3=a3-3ab2+i(b3-3a2b) ;(3)、;解====1.2、证明下列关于共轭复数的运算性质:(1);证()-i()==(2)证===--==()()=--即左边=右边,得证。
(3)=(Z2≠0)证==()====1.4、将直线方程ax+by+c=0 (a2+b2≠0)写成复数形式[提示:记x+iy=z]z+A+B=0,其中A=a+ib,B=2C(实数) 。
解由x=,y=代入直线方程,得()+()+c=0,az+-bi()+2c=0,(a-ib)z+( a+ib)+2c=0,故z+A+B=0,其中A=a+ib,B=2C1.5、将圆周方程a(x2+y2)+bx+cy+d=0 (a≠0)写成复数形式(即用z 与来表示,其中z=x+iy)解:x=,y=,x2+y2=z代入圆周方程,得az+()+()+d=0,2az+(b-ic)z+(b+ic)+2d=0故Az++B+C=0,其中A=2a,C=2d均为实数,B=b+ic 。
1.6求下列复数的模与辅角主值:(1)、=2,解arg()=arctan= 。
1.8将下列各复数写成三角表示式:(2)、i;解=1,arg()=arctan()= -a故i=+i。
1.10、解方程:Z3+1=0解方程Z3+1=0,即Z3=-1,它的解是z=,由开方公式计算得Z==+i,k=0,1,2即Z0==+i,Z1==1,Z2=+ i=i 。
1.11指出下列不等式所确定的区域,并指明它是有界的还是无界的?是单连通区域还是多连通区域?(1)、2<<3;解圆环、有界、多连域。
(3)、<arg z<;解圆环的一部分、单连域、有界。
(完整版)数据挖掘离线作业

浙江大学远程教育学院《数据挖掘》课程作业姓名:学号:年级:学习中心:—————————————————————————————第一章引言一、填空题(1)数据库中的知识挖掘(KDD)包括以下七个步骤:数据清理、数据集成、数据选择、数据交换、数据挖掘、模式评估和知识表示(2)数据挖掘的性能问题主要包括:算法的效率、可扩展性和并行处理(3)当前的数据挖掘研究中,最主要的三个研究方向是:统计学、数据库技术和机器学习(4)孤立点是指:一些与数据的一般行为或模型不一致的孤立数据二、简答题(1)什么是数据挖掘?答:数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识。
(2)一个典型的数据挖掘系统应该包括哪些组成部分?答:一个典型的数据挖掘系统应该包括以下部分:1、数据库、数据仓库或其他信息库,2、数据库或数据仓库服务器,3、知识库,4、数据挖掘引擎,5、模式评估魔磕,6图形用户界面。
(3)Web挖掘包括哪些步骤?答:数据清理:(这个可能要占用过程60%的工作量)、数据集成、将数据存入数据仓库、建立数据立方体、选择用来进行数据挖掘的数据、数据挖掘(选择适当的算法来找到感兴趣的模式)、展现挖掘结果、将模式或者知识应用或者存入知识库。
(4)请列举数据挖掘应用常见的数据源。
(或者说,我们都在什么样的数据上进行数据挖掘)答:常见的数据源包括关系数据库、数据仓库、事务数据库和高级数据库系统和信息库。
其中高级数据库系统和信息库包括:空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象——关系数据库、异种数据库和遗产数据库、文本数据库和万维网等。
一、填空题(1)两个文档向量d1和d2的值为:d1= (1, 0, 3, 0, 2),d2 = (3, 2, 0, 0, 1),则它们的余弦相似度为:5/13(2)数据离散度的常用度量包括极差、分位、百分位数、四分位数极差和标准差(3)一种常用的确定离群点的简单方法是:出落在至少高于第三个四份位数或低于第一个四分位数1.5xIQR处的值。
浙大远程数据结构与算法离线答案-最完整版DOC

浙江大学远程教育学院《数据结构与算法》课程离线作业一、填空题:(【序号,章,节】。
)【1,1,2】线性结构中元素之间存在一对一关系,树形结构中元素之间存在一对多关系,图形结构中元素之间存在多对多关系。
【2,1,2】为了最快地存取数据元素,物理结构宜采用序存储结构。
3,1,2】数据结构的三要素是逻辑结构,物理结构,操作。
【3,1,2】存储结构可根据数据元素在机器中的位置是否一定连续分为顺序存储结构,链式存储结构。
【4,1,3】度量算法效率可通过时间复杂度和空间复杂度__来进行。
【5,1,3】设n 为正整数,下面程序段中前置以记号@的语句的频度是n(n+1)/2。
for (i=0; i<n; i++){for (j=0; j<n; j++)if (i+j==n-1)@ a[i][j]=0;}【6,1,3】设n 为正整数,试确定下列各程序段中前置以记号@的语句的频度:(1) i=1; k=0;while (i<=n-1){i++;@ k+=10 * i; // 语句的频度是_____ n-1_______________。
}(2) k=0;for (i=1; i<=n; i++){for (j=i; j<=n; j++)1@ k++; // 语句的频度是_____ n(n+1)/2________________。
}【7,3,2】线性表(a1,a2,…,a n)有两种存储结构:顺序存储结构和链式存储结构,请就这两种存储结构完成下列填充:_顺序存储结构__ 存储密度较大;_顺序存储结构___存储利用率较高;_顺序存储结构___可以随机存取;_链式存储结构____不可以随机存取;__链式存储结构__插入和删除操作比较方便。
【8,3,2】从一个长度为n的顺序表中删除第i个元素(1≤i≤n)时,需向前移动n-i个元素。
【9,3,2】带头结点的单链表Head为空的条件是____ Head->next==null_____【10,3,2】在一个单链表中p所指结点(p所指不是最后结点)之后插入一个由指针s所指结点,应执行s->next=__ p->next___;和p->next=___s _____的操作。
2023年浙大远程英语离线作业答案

Unit OneTranslationDirections: translate each of the following sentences from English to Chinese.1.All things are difficult before they are easy.凡事总是由难而易。
2.Each time history repeats itself, the price goes up.每一次历史重演, 代价都会增长。
3.Even young people with little money do not want to buy cheap furniture that theymay soon dislike.就连手里没多少钱年轻人也不想买廉价家俱, 由于对这些廉价家俱很快就会厌倦。
4.Great writers are those who not only have great thoughts but also express these thoughts in powerful or moving words伟大旳作家不仅拥有伟大旳思想, 还能用有力、感人旳语言体现这些思想。
5.In no other region in the world can you find such rare animals as giant pandas.像大熊猫这样旳珍稀动物在世界其他地区你是找不到旳。
6.Luckily, the planes appear to be quite safe.幸运旳是飞机似乎是非常安全旳。
7.Most of the plants like water and sunshine.大多数植物喜欢水和阳光。
8.Semiconductor chips are small in size and light in weight.半导体芯片体积小并且重量轻。
9.The evolution theory explains the differences in sleep among animals. 进化论解释动物之间旳睡眠差异。
数据挖掘考试题及答案

数据挖掘考试题及答案一、单项选择题(每题2分,共20分)1. 数据挖掘的主要任务不包括以下哪一项?A. 分类B. 聚类C. 预测D. 数据清洗答案:D2. 以下哪个算法不是用于分类的?A. 决策树B. 支持向量机C. K-meansD. 神经网络答案:C3. 在数据挖掘中,关联规则挖掘主要用于发现以下哪种类型的模式?A. 频繁项集B. 异常检测C. 聚类D. 预测答案:A4. 以下哪个指标用于评估分类模型的性能?A. 准确率B. 召回率C. F1分数D. 以上都是答案:D5. 在数据挖掘中,过拟合是指模型:A. 过于复杂,无法泛化到新数据B. 过于简单,无法捕捉数据的复杂性C. 无法处理缺失值D. 无法处理异常值答案:A6. 以下哪个算法是用于异常检测的?A. AprioriB. K-meansC. DBSCAND. ID3答案:C7. 在数据挖掘中,哪个步骤是用于减少数据集中的噪声和不相关特征?A. 数据预处理B. 数据探索C. 数据转换D. 数据整合答案:A8. 以下哪个是时间序列分析中常用的模型?A. 线性回归B. ARIMAC. 决策树D. 神经网络答案:B9. 在数据挖掘中,哪个算法是用于处理高维数据的?A. 主成分分析(PCA)B. 线性回归C. 逻辑回归D. 随机森林答案:A10. 以下哪个是文本挖掘中常用的技术?A. 词袋模型B. 决策树C. 聚类分析D. 以上都是答案:D二、多项选择题(每题3分,共15分)11. 数据挖掘过程中可能涉及的步骤包括哪些?A. 数据清洗B. 数据转换C. 数据探索D. 模型训练答案:ABCD12. 以下哪些是数据挖掘中常用的数据预处理技术?A. 缺失值处理B. 特征选择C. 特征缩放D. 数据离散化答案:ABCD13. 在数据挖掘中,哪些因素可能导致模型过拟合?A. 训练数据量过少B. 模型过于复杂C. 训练数据噪声过多D. 训练数据不具代表性答案:ABCD14. 以下哪些是评估聚类算法性能的指标?A. 轮廓系数B. 戴维斯-邦丁指数C. 兰德指数D. 互信息答案:ABCD15. 在数据挖掘中,哪些是常用的特征工程方法?A. 特征选择B. 特征提取C. 特征构造D. 特征降维答案:ABCD三、简答题(每题10分,共30分)16. 简述数据挖掘中的“挖掘”过程通常包括哪些步骤。
浙江大学远程教育——数据库技术离线作业第2次

浙江大学远程教育——数据库技术离线作业第2次填空题:注:空白下划线处为需要填充的部分。
带下划线部分为考试时可能出题的部分,需要重点注意。
另外,这些填空题也有可能会被改编为选择题出现。
1.事务的隔离性:按任何一个串行顺序依次执行多个事务也是正确的。
事务的交叉执行过程是正确的,当且仅当其与串行执行过程等价,则称事务是可串行化的。
2.并发控制的基本思想是封锁。
封锁的基本思想是:当需要查询或更新数据时,先对数据进行封锁(不允许其他事务使用),以避免来自其他事务的干扰。
封锁——不允许其他事务使用,降低了事务执行的效率;为了既保证隔离又保证效率针对不同的干扰问题采取不同的封锁机制。
封锁机制的目标:保证事务的隔离性,并且允许最大量的并发事务。
分为3种:共享封锁、独占封锁、更新封锁。
3.避免死锁的主要方法有两种:一是相同顺序法,即在设计阶段规定所有的事务都按相同的顺序来封锁表;一是一次封锁法,即在设计阶段规定为了完成一个事务,一次性封锁所需要的全部表。
4.诊断死锁的方法主要有两种:超时法、等待图法。
解决死锁的办法就是破坏事务等待图中的回路。
5.在SQL标准中是通过设置隔离级别来实现并发控制的。
隔离级别由弱到强是:未提交读、提交读、可重复读、可串行化。
6.关系模型设计“不好”导致的问题:数据冗余问题、数据更新问题、数据插入问题、数据删除问题。
7.如果X→Y,但Y不包含于X,则称X→Y是非平凡的函数依赖。
如果X→Y,则X称作决定因素。
如果K是关系模式R(U,F)的任一候选关键字,X是任一属性或属性集,如果X K,则X称为主属性;否则称为非主属性。
8.如果X→Y,并且Y→X,则可记作X←→Y,这时X和Y可以称做函数等价。
9.如果X→Y,并且对于X的一个任意真子集X/,Y都不函数依赖于X/,则称Y完全依赖于X;如果存在X/ →Y,则称Y部分依赖于X。
10.如果X→Y(非平凡函数依赖,并且X不函数依赖于Y)、Y→Z,则称Z传递函数依赖于X。
浙大远程控制理论离线作业答案共62页word资料

浙大远程教育控制理论离线作业第一章1-1 与开环系统相比,闭环系统的最大特点是:检测偏差,纠正偏差。
1-2 分析一个控制系统从以下三方面分析:稳定性、准确性、快速性。
1-3图1-1 (a),(b)所示均为调速系统。
(1) 分别画出图1-3(a)、图(b)所示系统的方框图。
给出图1-1(a) 所示系统正确的反馈连线方式。
(2) 指出在恒值输入条件下,图1-1(a),(b) 所示系统中哪个是有差系统,哪个是无差系统,说明其道理。
图1-1 调速系统工作原理图解图1-1(a)正确的反馈连接方式如图1-1 (a)中虚线所示。
(1) 系统方框图如图解1-2所示。
(2) 图1-1 (a) 所示的系统是有差系统,图1-1 (b) 所示的系统是无差系统。
图1-1 (a)中,当给定恒值电压信号,系统运行达到稳态时,电动机转速的恒定是以发电机提供恒定电压为条件,对应发电机激磁绕组中电流一定是恒定值。
这意味着放大器前端电压是非零的常值。
因此,常值偏差电压存在是系统稳定工作的前提,故系统有差。
图1-1 (b)中,给定恒定电压,电动机达到稳定转速时,对应发电机激磁绕组中的励磁电流恒定,这意味着执行电动机处于停转状态,放大器前端电压必然为0,故系统无差。
1-4图1-3 (a),(b)所示的系统均为电压调节系统。
假设空载时两系统发电机端电压均为110V,试问带上负载后,图1-3(a),(b)中哪个能保持110V不变,哪个电压会低于110V?为什么?图1-3 电压调节系统工作原理图解带上负载后,开始由于负载的影响,图1-3(a)与(b)系统的端电压都要下降,但图(a)中所示系统能恢复到110V,而图(b) 所示系统却不能。
理由如下:图(a)系统,当u低于给定电压时,其偏差电压经放大器K放大后,驱动电机D转动,I增大,发电机的输出电压会升高,从而使偏经减速器带动电刷,使发电机F的激磁电流j差电压减小,直至偏差电压为零时,电机才停止转动。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(5)根据规则中所处理的值类型,关联规则可分为:布尔关联规则和量化关联规则
(6)Apriori性质是指:频繁项集的所有非空子集也必须是频繁的
(7)在多维关联规则挖掘中,我们搜索的不是频繁项集,而是频繁谓词集
二、简答题
(4)简述数据分类的两步过程。
答:第一步建立模型,建立描述预先定义的数据类或概念集的分类器;第二步,在独立测试集上评估模型的预测准确率,通过测试后再使用模型,对新的数据进行分类。
三、算法题
(1)使用判定树归纳算法,根据顾客年龄age(分为3个年龄段:<18,18...23,>23),收入income(取值为high,medium,low),是否为student(取值为yes和no),信用credit_rating等级(取值为fair和excellent)来判定用户是否会购买PC Game,即构建判定树buys_PCGame,假设现有的数据经过第一次划分之后得到如下图所示结果,并根据该结果对每一个划分中的各个属性计算信息增益
请根据以上结果绘制出判定树buys_PCGame,来判定用户是否会购买PC Game。
age
<1818…23 >23
income
student
credit_rating
class
Income
student
credit_rating
class
high
no
fair
no
high
no
fair
no
medium
答:常用的数值属性概念分层的方法有分箱、直方图分析、聚类分析、基于熵的离散化和通过自然划分分段。
(2)请描述主成份分析(PCA)算法步骤
答:1)规范化输入的数据:所有属性落在相同区间内;2)计算k个标准正交向量,即主成分;3)每个输入数据的向量都是这k个主成分向量的线性组合;4)主成分按照重要程度降序排列。
答:可以使用以下几个思路提升Apriori算法有效性:减少对数据的扫描次数;缩小产生的候选项集;改进对候选项集的支持度计算方法。常见方法包括:a、基于hash表的项集计数;b、事务压缩(压缩进一步迭代的事务数)c、划分;d、选样(在给定数据的一个子集挖掘);e、动态项集计数。
第八章分类
一、填空题
(1)数据分类模型的常用表示形式包括分类规则、决策树和数学公式等。
第三章数据预处理
一、填空题
(1)进行数据预处理时所使用的主要方法包括:数据清理、数据集成、
数据变换和数据规约
(2)数据概化是指:沿概念分层向上概化
(3)数据压缩可分为:有损压缩和无损压缩两种类型。
(4)进行数值归约时,三种常用的有参方法是:线性回归方法、多元回归
和对数线性模型
二、简答题
(1)常用的数值属性概念分层的方法有哪些?
划分准测是同一个聚类中的对象尽可能地接近或相关,不同聚类中的对象尽可能的原理或不同。
(2)列举离群点挖掘的常见应用。
答:离群点检测应用有:1、欺诈检测;2、网络入侵;3、故障诊断;4、可疑金融交易监控等等。
第四章数据仓库和OLAP技术
一、填空题
(1)数据仓库的多维数据模型可以有三种不同的形式,分别是:星形模式、雪花模式和事实星座模式
(1)简述在多层关联规则挖掘中,在不同的层使用一致的支持度的优缺点。
答:优点:搜索时容易采用优化策略,即一个项如果不满足最小支持度,它的所有子项都可以不用搜索。缺点:最小支持度值设置困难,太高则将丢掉出现在较低抽象层中有意义的关联规则;太低则会在较高层产生太多的无兴趣的规则。
(2)如何提高Apriori算法的有效性?有哪些常见方法?
答:一个典型的数据挖掘系统应该包括以下部分:数据库、数据仓库或其他信息库、数据库或数据仓库服务器、知识库、数据挖掘引擎、模式评估模块、图形用户界面。
(3)Web挖掘包括哪些步骤?
答:数据清理:(这个可能要占全过程60%的工作量);数据集成(数据存入数据仓库建立数据立方体,选择用来进行数据挖掘的数据);数据挖掘(选择适当的算法来找到感兴趣的模式);展现挖掘结果(将模式或者知识应用或者存入知识库)。
(3)当前的数据挖掘研究中,最主要的三个研究方向是:统计学、数据库技术和机器学习
(4)孤立点是指:一些与数据的一般行为或模型不一致的孤立数据
二、简答题
(1)什么是数据挖掘?
答:数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识。
(2)一个典型的数据挖掘系统应该包括哪些组成部分?
答:对于一个m维数据集,基于像素的可视化技术在屏幕上创建m个窗口,每维一个。记录的m个维值映射到这些窗口对应位置上的m个像素。像素的颜色反映对应的值。基于像素的可视化技术特点:难以呈现多维空间的数据分布,不显示数据子空间中是否存在稠密区域。
(2)对称的和不对称的二元属性有什么区别?
答:对称的二元属性指变量的两个状态具有同等价值或相同权重;而不对称的二元属性中,变量的两个状态的重要性是不同的。对称的二元属性可以使用简单匹配系统评估它们的相异度;不对称的二元属性使用Jaccard系数评估它们的相异度。
yes
fair
no
high
yes
excellent
yes
high
no
fair
no
medium
yes
fair
yes
medium
yes
excellent
yes
low
yes
fair
yes
low
no
excellent
yes
low
no
excellent
no
income
student
credit_r有三种选择:不物化、部分物化和
全物化
(3)著名的数据仓库系统设计师W. H. Inmon认为,数据仓库与其他数据存储系统的区别
的四个特征是:面向主题、数据集成、随时间而变化 和 数据不易丢失
(4)在数据访问模式上,数据仓库以事务操作为主,而日常应用数据库则以只读查询为主。
对age<18的顾客:Gain(income)=0.022,Gain(student)=0.162,Gain(credit_rating)=0.323
对age>23的顾客:Gain(income)=0.042,Gain(student)=0.462,Gain(credit_rating)=0.155
第二章认识数据
一、填空题
(1)两个文档向量d1和d2的值为:d1=(1, 0, 3, 0, 2),d2=(3,2,0, 0, 1),则它们的余弦相似度为:5/13
(2)数据离散度的常用度量包括极差、分位数、四分位数、
百分位数 四分位数极差和标准差
(3)一种常用的确定离群点的简单方法是:出落在至少高于第三个四分卫数或低于第一个四分卫数1.5×IQR处的值。
(8)求和函数sum()是一个分布的函数。
(9)方体计算的主要挑战是海量数据和有限的内存和时间之间的矛盾。
二、简答题
(1)为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行。
答:使用一个独立的数据仓库进行OLAP处理是为了以下目的:1、提高两个系统的性能:操作数据库是为OLTP而设计的,没有为OLAP操作优化,同时在操作数据库上处理OLAP查询,会大大降低操作任务的性能;而数据库是为OLAP而设计,为复杂的OLAP查询,多维视图,汇总等OLAP功能提供了优化。2、两者有着不同的功能:操作数据库支持多事务的并行处理,而数据仓库往往只是对数据记录进行只读访问;这是如果将事务处理的并行机制和恢复机制用于这种OLAP操作,就会显著降低OLAP的性能。3、两者有着不同的数据:数据仓库中存放历史数据;日常操作数据库中存放的往往只是最新的数据。
二、单选题
(1)对于下图所示的正倾斜数据,中位数、平均值、众数三者之间的关系是:
A、中位数=平均值=众数;B中位数>平均值>众数;
C、平均值>中位数>众数;D;众数>中位数>平均值
答:C。
(2)下面的散点图显示哪种属性相关性?
A不相关;B正相关;C负相关;D先正相关然后负相关;
答:C。
三、简答题
(1)什么是基于像素的可视化技术?它有什么缺点?
high
no
fair
yes
medium
yes
fair
yes
high
no
fair
yes
medium
yes
excellent
yes
答:
第十章聚类分析
一、填空题
(1)在数据挖掘中,常用的聚类算法包括:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。
(2)聚类分析常作为一个独立的工具来获得数据分布的情况
(5)数据立方体度量可以根据其所使用的聚集函数分为三类,分别是:分布的、
代数的和整体的
(6)关于数据仓库的设计,四种不同的视图必须考虑,分别是:自顶向下视图、数据源视图、数据仓库视图、商务查询视图
(7)OLAP服务器的类型主要包括:关系OLAP服务器(ROLAP)、多维OLAP服务器(MOLAP)和混合OLAP服务器(HOLAP)
浙江大学远程教育学院
《数据挖掘》课程作业
姓名:
学号:
年级:
学习中心:
—————————————————————————————
第一章引言
一、填空题
(1)数据库中的知识挖掘(KDD)包括以下七个步骤:数据清理、数据集成、
数据选择、数据变换、数据挖掘、模式评估和知识表示