pandas选择列或者添加列生成新的DataFrame
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
pandas选择列或者添加列⽣成新的DataFrame 选择某些列
import pandas as pd
# 从Excel中读取数据,⽣成DataFrame数据
# 导⼊Excel路径和sheet name
df = pd.read_excel(excelName, sheet_name=sheetName)
# 读取某些列,⽣成新的DataFrame
newDf = pd.DataFrame(df, columns=[column1, column2, column3])
选择某些列和⾏
# 读取某些列,并根据某个列的值筛选⾏
newDf = pd.DataFrame(df, columns=[column1, column2, column3])[(df.column1 == value1) & (df.column2 == value2)]
添加新的列
# 第⼀种直接赋值
df["newColumn"] = newValue
# 第⼆种⽤concat组合两个DataFrame
pd.concat([oldDf, newDf])
更改某⼀列的值
# 第⼀种,replace
df["column1"] = df["column1"].replace(oldValue, newValue)
# 第⼆种,map
df["column1"] = df["column1"].map({oldValue: newValue})
# 第三种,loc
# 将column2 中某些⾏(通过column1中的value1来过滤出来的)的值为value2
df.loc[df["column1"] == value1, "column2"] = value2
补全缺失值
# fillna填充缺失值
df["column1"] = df["column1"].fillna(value1)