df定义列

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

df定义列
DataFrames(df)是Python中最常用的数据结构之一,特别是在数据科学中。

它是由不同的列组成的二维表,而每一列都可以是不同类型的数据(例如整数、字符串、浮点数等)。

在本文中,我们将详细介绍df定义列的方法和技巧。

定义 df 列
在 Pandas 库中,我们可以通过许多方法来定义 df 列,以下是最常用的方法:
1. 定义 df
首先,我们需要定义一个空的 df。

我们可以使用Pandas 库中的 DataFrame()函数。

它具有许多参数,可以让我们定义 df 的基本属性,例如列名、索引、数据类型等。

我们可以定义一个以下所示的空 DataFrame,其中使用thedata和thetarget两个量 (columns) 作为列名。

```python import pandas as pd
df = pd.DataFrame(columns = ['thedata',
'thetarget']) ```
2. 添加新的 df 列
要将新的列添加到 df 中,我们可以使用以下方法之一:
• 通过字典定义添加列的名称和值
```python df['新的列'] = {'值1', '值2','值
3'} ```
• 直接在 df 中添加一个新列,使用 loc() 和 at()
```python df.loc[:, '新的列'] = {'值1', '值
2','值3'} df.at[:, '新的列'] = {'值1', '值2','
值3'} ```
在这种情况下,我们将添加一个名为“新的列”的新
列,其中包含三个值。

我们可以尝试打印 df 来查看结
果。

```python print(df) ```
结果类似于以下内容:
``` thedata thetarget 新的列 0 NaN NaN 值1 1 NaN NaN 值2 2 NaN NaN 值3 ```
在 df 中,我们可以看到一个名为“新的列”的新
列,其中包含三个值:值1、值2 和值3。

由于我们没有在
前面给出的 DataFrame 定义任何值,因此其他两个列中的
所有值均为 NaN。

如果需要,我们可以通过
dataframe.fillna() 将 NaN 替换为其他值。

3. 通过函数或映射定义 df 列
我们还可以使用映射或函数来定义新的 df 列。

以下
是使用示例。

• 通过映射定义新 df 列
```python df['number'] =
df['thedata'].map(lambda x: len(str(x))) ```
• 通过函数定义新 df 列
```python def check_number(x): if x > 3: return 'high' else: return 'low' ```现在我们可以使用 map() 函数将该函数应用于我们的
列。

```python df['new_col'] =
df['thedata'].map(check_number) ```
此代码将一个名为“number”的新列添加到 df 中,
我们使用的映射是一个匿名函数,该函数将以字符串形式
传递的数据转换为字符串,以字符串的长度作为数据的标
记。

我们还可以使用其它函数进行映射,例如将数据范围
定义为列。

此代码还将一个名为“new_col”的新列添加到 df
中,我们使用的函数根据每项数据的值定义了这个标记的
高低。

总结
在本文中,我们详细介绍了 df 定义列的方法和技巧。

我们了解到,可以使用字典、映射、函数和在 df 中直接添加新列来定义新的 df 列。

使用这些技巧,您可以更轻松地处理数据,更快地获取有用的信息。

相关文档
最新文档