python数据分析课后习题精选全文完整版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

python数据分析课后习题
B. 数据合并按照合并轴⽅向主要分为左连接、右连接、内连接和外连接
C. 预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D. 数据标准化的主要对象是类别型的特征
3. (单选题)以下关于缺失值检测的说法中,正确的是(B)。

A. null 和 notnull 可以对缺失值进⾏处理
B. dropna⽅法既可以删除观测记录,亦可以删除特征
C. fillna⽅法中⽤来替换缺失值的值只能是数据框
D. pandas 库中的interpolate 模块包含了多种插值⽅法
4. (单选题)关于标准差标准化,下列说法中错误的是(B)。

A. 经过该⽅法处理后的数据均值为0,标准差为1
B. 可能会改变数据的分布情况
C.
Python中可⾃定义该⽅法实现函数:
def StandardScaler(data):
data=(data-data.mean())/data.std()
return data
D. 计算公式为X*=(X-`X)/σ
5. (单选题)以下关于pandas数据预处理说法正确的是(D)。

A. pandas没有做哑变量的函数
B. 在不导⼈其他库的情况下,仅仅使⽤pandas 就可实现聚类分析离散化
C. pandas 可以实现所有的数据预处理操作
D. cut 函数默认情况下做的是等宽法离散化
6. (单选题)以下关于异常值检测的说法中错误的是(D)。

A. 3σ原则利⽤了统计学中⼩概率事件的原理
B. 使⽤箱线图⽅法时要求数据服从或近似服从正态分布
C. 基于聚类的⽅法可以进⾏离群点检测
D. 基于分类的⽅法可以进⾏离群点检测
7. (单选题)有⼀份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述性分析。

下列的步骤和⽅法正确的是(A)。

A. dtypes 查看类型,astype 转换类别,describe 描述性统计
B. astype 查看类型,dtypes转换类别,describe描述性统计
C. describe查看类型,astype转换类别,dtypes描述性统计
D. dtypes 查看类型,describe 转换类别,astype 描述性统计
8. (单选题)下列与标准化⽅法有关的说法中错误的是(A)。

A. 离差标准化简单易懂,对最⼤值和最⼩值敏感度不⾼
B. 常⽤的标准化⽅法,⼜名零⼀均值标准化
C. ⼩数定标标准化实质上就是将数据按照⼀定的⽐例缩⼩
D. 多个特征的数据的KMeans 聚类不需要对数据进⾏标准化
9. (单选题)以下关于drop_duplicates函数的说法中错误的是(B)。

A. 仅对 DataFrame 和 Series 类型的数据有效
第七章:
1. (单选题)下列关于K-Means算法初始聚类中⼼说法正确的是(B)
A. 样本中择优选出
B. 样本中随机选出
C. 互相距离最近的n个点
D. 互相距离最远的n个点
2. (单选题)下列关于K-Means算法的说法错误的是(D)
A. 构建K-Means 聚类模型需要对数据进⾏标准化
B. K-Means 算法涉及空间距离计算
C. K-Means 算法训练结果具有⼀定的随机性,所以需要多次训练
D. K-Means 算法是 sklearn 的 cluster 模块中唯⼀涉及距离计算的聚类算法
3. (单选题)下列关于客户价值分析的说法错误的是(B)
A. RFM 模型常⽤于客户价值分析模型
B. RFM 模型适⽤于所有的客户价值分析
C. 客户价值分析是客户关系管理的⼀部分
D. 客户价值分析能够帮助制定营销策略
4. (单选题)K-Means 算法接收的数据类型为(A)
A. 连续型
B. 离散型
C. 名义型
D. 顺序型
5. (单选题)以下不属于RFM 客户价值分析模型常⽤特征的是(B)
A. 消费⾦额
B. 消费⼈数
C. 最近⼀次消费时间和截⽌时间的间隔
D. 消费频率。

相关文档
最新文档