数据采集与处理-题库带答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A、文本
B、图片
C、视频
D、音频
答案:
34、配置一种采集任务可以采集多个数据源。
33、防采集措施有()
A、封IP
B、验证码识别
C、登录
D、不允许打开网页
答案:
36、常见的采集方法包括Web爬虫采集和APl接口采集。
答案:正确
37、Web爬虫主要分为通用网络爬虫和聚焦网络爬虫。
答案:正确
38、通用网络爬虫基本工作流程包含()
答案:正确
12、商务数据包括()
A、电子商务平台的基础数据
B、电子商务专业网站的研究数据
C、电子商务媒体报道
D、评论数据
13、商品数据一般包括()
A、商品分类
B、商品价格
C、商品展ZF
D、商品评价
答案:
14、采集交易数据主要是为了通过数据分析评估客户价值.将潜在客户变为价值客户。
答案:正确
13、评价数据主要以图片的形式出现。
答案:
25、常见的C2C平台有()
A、阿里巴巴
B、咸鱼
C、淘宝
D
答案:
26、社交电商指基于社交关系、利用互联网社交媒介实现电子商务中的流量获取、商品推
广和交易等其中一个或多个环节,产生间接或直接交易行为的在线经营活动。
答案:正确
27、抖音属于社交内容电商。
答案:正确
28、社交分享电商主要包括()
A、拼多多
数据采集与处理-题库带答案
1、()是指对客观事件记录的符号,是对客观事物的性质、状态及相互关系等进行记载 的物理符号或这些物理符号的组合。
A、数据
B、字段
C、记录
D、大数据
答案:A
2、在数据表中,表的“列”称为()
A、数据
B、字段
C、记录
D、大数据
答案:B
3、在数据表中,表的“行”称为()
A、数据
B、字段
答案:错误
49、数据采集器不能采集以下哪种数据()
A、图片
B、文字
C、网站信息
D、专利
答案:D
50、哪种不是数据采集器
A
B、八爪鱼采集器
C、火车头采集器
D、后羿采集器
51、简易采集模式是利用系统内置模板进行数据采集的模式。
答案:正确
52、简易采集可根据不同的参数进行不同程度的自定义采集。
答案:正确
53、简易采集模板所有用户都可以使用。
答案:错误
16、新闻网站有()
A、腾讯网
B、百度贴吧
C、凤凰网
D、博客
答案:AC
17、社交网站有()
A、腾讯网
B、百度贴吧
C、凤凰网
D、博客
答案:BD
18、商务数据可用于多种行业()
A、制造业
B、金融业
C、个人娱乐
D、餐饮行业
19、商务数据可以监控竞争对手的动态。
答案:正确
20、商务数据不同帮助企业和个人共享客户信息。
答案:
7、产品自有数据就是自身产品销售过程中产生的数据。
答案:正确
8、调查问卷是以问题的形式系统的记载调查内容的一种印件。
答案:正确
9、互联网数据分布在网页的不同位置.我们很难采集下来。
答案:错误
10、EXCel是按照数据结构来组织,存储和管理数据的仓库。
答案:错误
11、商务数据指用户在电子商务网站购买商品的过程中,网站记录用户行为的大量数据。
C、记录
D、大数据
答案:C
4、数据表是由行(记录)和列(字段)构成,因此也称()
A、数据
B、二维表
C、表格
D、大数据
3、大数据具有以下特征
A、大容量、多种类、高速度
B、复杂性、高价值
C、可变性、真实性
D、以上都是
答案:D
6、数据的获取途径有()
A、产品自有数据
B、调查问卷
C、互联网数据导入
D、从别人数据库窃取
43、数据采集工具不能爬取学术信息=
答案:错误
44、常见的爬虫语言有()
A
B
C
D
答案:
45、Python是一款服务器端解释性开源非编译脚本语言。
答案:正确
46、数据采集器是进行数据采集的机器或者工具;
答案:正确
47、数据采集器建立的任务也称之为规则。
答案:正确
48、数据采集器采集不同字段时,建立一种规则就可以了。
答案:错误
54、单页采集只能采集列表数据。
答案:错误
55>表格数据采集要先选中表格中的一行数据。
答案:正确
36、单网页采集主要是采集一个网页中的数据。
答案:正确
57、列表详情页数据采集比单网页数据采集复杂。
答案:正确
58、列表详情页需要从每个商品的标题进入到商品的详情页。
答案:正确
59、采集列表详情页数据不需要循环步骤。
答案:错误
21、商务数据的来源包括()
A、电子商务平台
B、社交平台
C、020数据
D、个人数据
答案:
22、B2B是企业对企业之间通过互联网进行产品、服务及信息的交换。
答案:正确
23、B2C是个人对企业开展的电子商务活动。
答案:错误
24、下列常用的B2C平台有()
A、阿里巴巴
B、京东
C、唯品会
D、亚马逊
答案:错误
60、单个网页上有很多相同链接,点击链接后进入I再进行详情页数据采集,。
答案:
详情页
♦
61、当配置好任务,进行数据采集是,即用自己的本地电脑进行数
据采集。
答案:
启动本地采集
62、如果想使用云服务集群进行采集,可以选择
答案:
启动云采集
63、数据导出可以导出的文件类型为()
A
B
C
D、MySqI数据表
答案:
64、文本循环是通过输入关键宇采集跟关键字相关的数据=
答案:正确
6Baidu Nhomakorabea、URL循环是通过使用多个URL地址进行数据采集。
答案:正确
66、循环采集包括()
A、URL循环
B、文本循环
C、单个元素循环
D、随机循环
答案:
67、采集京东商品详情页数据,字段可任意。
要求:叙述采集步骤
或
使用釆集器采集数据截图
答案:
解析:
68、分页循环采集是指把一页数据分成多页进行采集。
答案:错误
69、网址中有多个页面需要采集叫分页循环采集。
答案:正确
70、点击页面上的“下一页”按钮翻页,是最常见的翻页方式。
答案:正确
71、需要登录时就不能进行采集。
答案:错误
72、登录采集分登录采集和登录采集。
答案:
B、微信
C、蘑菇街
D、微博
答案:
29
答案:正确
30、020数据主要有020电商平台数据和展销平台组成。
答案:正确
31、数据采集又称数据获取.是利用设备或技术手段从现实环境及网络获取数据并放入系 统内部进行使用。
答案:正确
32、大多数互联网页编写都是用HTML语言。
答案:正确
33、电子商务数据主要归类为()
A、打开浏览器
B、抓取网页
C、数据存储
D、预处理
答案:
39、调用网站自身提供的应用程序编程接口,可以实现网络数据采集。
答案:正确
40、数据的存储方式有()
A
B
C、数据库
D
答案:
41、数据采集工具分为编程类和可视化采集工具两类。
答案:正确
42、数据采集工具可以针对某个主题从微博爬取相关信息。
答案:正确
B、图片
C、视频
D、音频
答案:
34、配置一种采集任务可以采集多个数据源。
33、防采集措施有()
A、封IP
B、验证码识别
C、登录
D、不允许打开网页
答案:
36、常见的采集方法包括Web爬虫采集和APl接口采集。
答案:正确
37、Web爬虫主要分为通用网络爬虫和聚焦网络爬虫。
答案:正确
38、通用网络爬虫基本工作流程包含()
答案:正确
12、商务数据包括()
A、电子商务平台的基础数据
B、电子商务专业网站的研究数据
C、电子商务媒体报道
D、评论数据
13、商品数据一般包括()
A、商品分类
B、商品价格
C、商品展ZF
D、商品评价
答案:
14、采集交易数据主要是为了通过数据分析评估客户价值.将潜在客户变为价值客户。
答案:正确
13、评价数据主要以图片的形式出现。
答案:
25、常见的C2C平台有()
A、阿里巴巴
B、咸鱼
C、淘宝
D
答案:
26、社交电商指基于社交关系、利用互联网社交媒介实现电子商务中的流量获取、商品推
广和交易等其中一个或多个环节,产生间接或直接交易行为的在线经营活动。
答案:正确
27、抖音属于社交内容电商。
答案:正确
28、社交分享电商主要包括()
A、拼多多
数据采集与处理-题库带答案
1、()是指对客观事件记录的符号,是对客观事物的性质、状态及相互关系等进行记载 的物理符号或这些物理符号的组合。
A、数据
B、字段
C、记录
D、大数据
答案:A
2、在数据表中,表的“列”称为()
A、数据
B、字段
C、记录
D、大数据
答案:B
3、在数据表中,表的“行”称为()
A、数据
B、字段
答案:错误
49、数据采集器不能采集以下哪种数据()
A、图片
B、文字
C、网站信息
D、专利
答案:D
50、哪种不是数据采集器
A
B、八爪鱼采集器
C、火车头采集器
D、后羿采集器
51、简易采集模式是利用系统内置模板进行数据采集的模式。
答案:正确
52、简易采集可根据不同的参数进行不同程度的自定义采集。
答案:正确
53、简易采集模板所有用户都可以使用。
答案:错误
16、新闻网站有()
A、腾讯网
B、百度贴吧
C、凤凰网
D、博客
答案:AC
17、社交网站有()
A、腾讯网
B、百度贴吧
C、凤凰网
D、博客
答案:BD
18、商务数据可用于多种行业()
A、制造业
B、金融业
C、个人娱乐
D、餐饮行业
19、商务数据可以监控竞争对手的动态。
答案:正确
20、商务数据不同帮助企业和个人共享客户信息。
答案:
7、产品自有数据就是自身产品销售过程中产生的数据。
答案:正确
8、调查问卷是以问题的形式系统的记载调查内容的一种印件。
答案:正确
9、互联网数据分布在网页的不同位置.我们很难采集下来。
答案:错误
10、EXCel是按照数据结构来组织,存储和管理数据的仓库。
答案:错误
11、商务数据指用户在电子商务网站购买商品的过程中,网站记录用户行为的大量数据。
C、记录
D、大数据
答案:C
4、数据表是由行(记录)和列(字段)构成,因此也称()
A、数据
B、二维表
C、表格
D、大数据
3、大数据具有以下特征
A、大容量、多种类、高速度
B、复杂性、高价值
C、可变性、真实性
D、以上都是
答案:D
6、数据的获取途径有()
A、产品自有数据
B、调查问卷
C、互联网数据导入
D、从别人数据库窃取
43、数据采集工具不能爬取学术信息=
答案:错误
44、常见的爬虫语言有()
A
B
C
D
答案:
45、Python是一款服务器端解释性开源非编译脚本语言。
答案:正确
46、数据采集器是进行数据采集的机器或者工具;
答案:正确
47、数据采集器建立的任务也称之为规则。
答案:正确
48、数据采集器采集不同字段时,建立一种规则就可以了。
答案:错误
54、单页采集只能采集列表数据。
答案:错误
55>表格数据采集要先选中表格中的一行数据。
答案:正确
36、单网页采集主要是采集一个网页中的数据。
答案:正确
57、列表详情页数据采集比单网页数据采集复杂。
答案:正确
58、列表详情页需要从每个商品的标题进入到商品的详情页。
答案:正确
59、采集列表详情页数据不需要循环步骤。
答案:错误
21、商务数据的来源包括()
A、电子商务平台
B、社交平台
C、020数据
D、个人数据
答案:
22、B2B是企业对企业之间通过互联网进行产品、服务及信息的交换。
答案:正确
23、B2C是个人对企业开展的电子商务活动。
答案:错误
24、下列常用的B2C平台有()
A、阿里巴巴
B、京东
C、唯品会
D、亚马逊
答案:错误
60、单个网页上有很多相同链接,点击链接后进入I再进行详情页数据采集,。
答案:
详情页
♦
61、当配置好任务,进行数据采集是,即用自己的本地电脑进行数
据采集。
答案:
启动本地采集
62、如果想使用云服务集群进行采集,可以选择
答案:
启动云采集
63、数据导出可以导出的文件类型为()
A
B
C
D、MySqI数据表
答案:
64、文本循环是通过输入关键宇采集跟关键字相关的数据=
答案:正确
6Baidu Nhomakorabea、URL循环是通过使用多个URL地址进行数据采集。
答案:正确
66、循环采集包括()
A、URL循环
B、文本循环
C、单个元素循环
D、随机循环
答案:
67、采集京东商品详情页数据,字段可任意。
要求:叙述采集步骤
或
使用釆集器采集数据截图
答案:
解析:
68、分页循环采集是指把一页数据分成多页进行采集。
答案:错误
69、网址中有多个页面需要采集叫分页循环采集。
答案:正确
70、点击页面上的“下一页”按钮翻页,是最常见的翻页方式。
答案:正确
71、需要登录时就不能进行采集。
答案:错误
72、登录采集分登录采集和登录采集。
答案:
B、微信
C、蘑菇街
D、微博
答案:
29
答案:正确
30、020数据主要有020电商平台数据和展销平台组成。
答案:正确
31、数据采集又称数据获取.是利用设备或技术手段从现实环境及网络获取数据并放入系 统内部进行使用。
答案:正确
32、大多数互联网页编写都是用HTML语言。
答案:正确
33、电子商务数据主要归类为()
A、打开浏览器
B、抓取网页
C、数据存储
D、预处理
答案:
39、调用网站自身提供的应用程序编程接口,可以实现网络数据采集。
答案:正确
40、数据的存储方式有()
A
B
C、数据库
D
答案:
41、数据采集工具分为编程类和可视化采集工具两类。
答案:正确
42、数据采集工具可以针对某个主题从微博爬取相关信息。
答案:正确