Python数据分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实训:Python数据分析

〖实训目的〗

了解Python基本编程语法,掌握Python进行数据载入、预处理、分析和可视化的方法。

〖实训内容与步骤〗

1.在Python中导入数据

(1)读取CSV文件

CSV文件是由由逗号分割字段构成的数据记录型文件。我们可以方便地把

EXCEL中的电子表格存储为CSV文件。例如,我们有一份CSV

数据是英国近些年的降雨量统计数据,可以从以下网址找https:///dataset/average-temperature-and-rainfall-england-and-

source/3fea0f7b-5304-4f11-a809-159f4558e7da)

从EXCEL中看到的数据如下图2-53所示:

图2-53 读取CSV文件

如果这个文件被保存在以下位置:

D:\data\uk_rain_2014.csv

我们可以在Python中利用Pandas库将它导入:

>>>import pandas as pd

>>>df = pd.read_csv('d:\\data\\uk_rain_2014.csv', header=0)

这里需要注意的是,因为windows下用于分割目录的“\”符号在Python中被用于转义符(转义符就是用来输入特殊符号的引导符号,例如\n是回车,\r是换行等),因此“\”本身在Python语言中需要通过“\\”来输入。

以上两行程序就将这个csv文件导入成pandas中的一种类型为Dataframe的对象中,并给这个对象起名为df。

为了验证我们确实导入了这个数据文件,我们可以把df的内容打印出来:>>>print df

Water Year Rain (mm) Oct-Sep Outflow (m3/s) Oct-Sep Rain (mm) Dec-Feb \

0 1980/81 1182 5408 292

1 1981/8

2 1098 5112 257

2 1982/8

3 1156 5701 330

3 1983/8

4 993 426

5 391

4 1984/8

5 1182 5364 217

5 1985/8

6 102

7 4991 304

6 1986/8

7 1151 5196 295

7 1987/88 1210 5572 343

8 1988/89 976 4330 309

9 1989/90 1130 4973 470

10 1990/91 1022 4418 305

11 1991/92 1151 4506 246 121992/93 1130 5246 308 (2)读取EXCEL文件

因为EXCEL文件本身可以方便地另存为CSV文件,所以把EXCEL文件导入Python的一种办法就是将EXCEL中的数据表另存为CSV文件,然后利用上一节的方法将CSV导入Python。

当然,Pandas也提供了直接读取EXCEL文件的方法。同样,如果相应的EXCEL 文件放在D:\data\uk_rain_2014.xlsx,我们同样可以在Python中利用Pandas库将它导入:

>>>import pandas as pd

>>>df = pd.read_excel('d:\\data\\uk_rain_2014.xlsx')

同样,我们也可以把df的内容打印出来作为验证。

将数据导入Python之后,我们就可以对数据进行分析了。但在数据量很大的时候,我们往往需要从数据中提取和筛选出一部分数据来进行针对性的分析。

2.数据提取和筛选

仍然针对上面导入的英国天气数据,由于数据有很多行,我们希望只看到数据的前5行:

>>> df.head(5)

Water Year Rain (mm) Oct-Sep Outflow (m3/s) Oct-Sep Rain (mm) Dec-Feb \

相关文档
最新文档