大数据采集与爬虫习题答案完整

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、判断题
1、以下选项不属于程序设计语言类别的是()
A..机器语言
B..汇编语言
C..高级语言
D..解释语言
2、下列Python语句正确的是()
A、min = x if x < y else y
B、max = x > y ? x : y
C、if (x > y) print x
D、while True : pass
3、以下不能创建一个字典的语句是()
A、dict1 = {}
B、dict2 = { 3 : 5 }
C、dict3 = {[1,2,3]: “uestc”}
D、dict4 = {(1,2,3): “uestc”}
二、判断题
4、模块文件的扩展名不一定是 .py。

()
5、字符和列表均支持成员关系操作符(in)和长度计算函数(len())。

()答案:1、D 2、D 3、C 4、错5、对
一、选择题
1、以下哪些是爬虫技术可能存在风险()
A、大量占用爬去网站的资源
B、网站敏感信息的获取造成的不良后果
C、违背网站爬去设置
D、以上都是
2、下面表示一个文本类型的是()
A、<head>
B、<html>
C、<meta>
D、<title>
3、Tag有很多方法和属性,下列哪个属性不是Tag中最重要的属性()
A、name
B、attributes
C、string
D、type
二、判断题
4、纵向爬虫主要面向大范围精确信息的爬取。

()
5、URL包含的信息指出文件的位置以及浏览器应该怎么处理它,所
有互联网上的每个文件都有一个唯一的URL。

()
答案:1、D 2、B 3、D 4、错5、对
一、选择题
1、下列四项中,不属于数据库系统特点的是()
A、数据共享
B、数据完整性
C、数据冗余度高
D、数据独立性高
2、数据库系统的数据独立性体现在( )
A、不会因为数据的变化而影响到应用程序
B、不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序
C、不会因为存储策略的变化而影响存储结构
D、不会因为某些存储结构的变化而影响其他的存储结构
3、.在数据结构中,从逻辑上可以把数据结构分成()
A、动态结构和静态结构
B、紧凑结构和非紧凑结构
C、线性结构和非线性结构
D、内部结构和外部结构
二、判断题
4、数据存储反映的是系统中静止的数据,表现出静态数据的特征。

()
5、.每种数据结构都具备3个基本运算:插入、删除和查找。

()
答案:1、C 2、B 3、C 4、对5、错
一、选择题
1、对字符串的说法正确的是( )
A、字符串是基本数据类型
B、字符串值存储在栈内存中
C、字符串值初始化后可以被改变
D、字符串值一旦初始化就不会被改变
2、能切割字符串的方法是( )
A、indexOf( )
B、substring( )
C、split( )
D、trim( )
3、1.String类中的getBytes()方法的作用是( )
A、将整数变成字符串
B、将字符串变成字符数组
C、将字符串变成字节数组
D、获取中字符串中字符的个数
二、判断题
4、WEB API最主要的功能是实现构建基于HTTP的面向各种客户端的服务框架。

()5、GitHub能够快速,高效地处理各种大小项目的版本控制和管理。

( )
答案:1、D 2、C 3、C 4、对5、对
一、选择题
1、ajax中基本请求方式是什么()
A、get
B、post
C、request
D、kill
2、以下哪个技术不是Ajax技术体系的组成部分()
A、XMLHttpRequest
B、DHTML
C、CSS
D、DOM
3、下列哪个工具不能用来调试浏览器中的JavaScript ( )
A、MS Visual InterDev
B、Eclipse
C、MS Script Debugger
D、Mozilla Venkman
二、判断题
4、动态数据的准备和系统切换的时间没有直接关系。

()
5、ajax的get请求和post请求基本无区别。

()
答案:1、A 2、B 3、B 4、错5、错
一、选择题
1、目前验证码的类型有()
A、单击式验证码
B、图形验证码
C、滑动验证码
D、以上都是
2、以下关于加大验证码破解难度说法错误的是( )
A.现在大部分主流网站的验证码都进行了扭曲、粘连、加干扰线等设计
B.那些数字加字母的组合,特别是字母中还要区分大小写的,字符集就会大很多
C.使用中文字符
D.字符中间加空格
3、在Web页面中增加验证码功能后,下面说法正确的是()
A、可以增加账号破解等自动化软件的攻击难度
B、可以防止文件包含漏洞
C、可以防止缓冲溢出
D、可以i防止浏览
二、判断题
4、验证码是一种用来区分计算机行为和人类行为的测试程序。

()
5、“参数说明”表示该API可以接收和发送的参数名称和类型。

()
答案:1、D 2、D 3、A 4、对5、对
一、选择题
1、Web容器在收到浏览器请求时,会如何处理请求()
A、使用单一执行绪处理所有请求
B、一个请求就建立一个执行绪来处理请求
C、一个请求就建立一个行程来处理请求
D、一个请求就执行一个容器来处理请求
2、以下哪个选项不使用POST请求来发送()
A、使用者名称、密码
B、档案上传
C、搜寻引擎的结果画面
D、BLOG文件
3、【多选】GET请求和POST请求的区别有哪些()
A、安全
B、信息获取一致性
C、获取数据的长度一致
D、数据承载大小的不同
二、判断题
4、在HTTP超文本传输协议中规定了四种与服务器进行交互的方式:GET,POST,PUT和DELETE。

()
5、Session是以数组的形式通过Sessionid进行检索的在服务器端存储的数据。

答案:1、B 2、C 3、ABD 4、对5、错
一、选择题
1、下列哪项不是Scrapy的组件()
A、Selector
B、Spider
C、namenode
D、Downloader Middleware
2、HTML的缩写是()
A、Hybrid Text Multipurpose Language
B、High Texture Modular Language
C、Hyper Text Markup Language
D、Hyper Text Middleware Language
3、【多选】下列哪些是Spider中重要的属性()
A、logger
B、name
C、settings
D、test
二、判断题
4、Scrapy在某些请求失败或在处理它时发生错误,也可以继续运行其他请求。

()
5、lxml是一个基于ElementTree的python API的XML解析库。

()
答案:1、C 2、C 3、ABC 4、对5、对。

相关文档
最新文档