2022年高中信息技术基础知识综合复习第四章课时2编程处理数据课件必修1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
或者for i in Series对象名
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
#下行语句与for i in inf等价(for i in Series对象名默认为遍历values)
import pandas as pd
s1=pd.Series(['周欣怡','王培新','张佳明','林逢春','朱梁栋','陈清瑞'])
print(s1)
(2)指定索引值
①格式
对象名=pd.Series(values,index=索引列表)
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明','林
'籍贯':['杭州','嘉兴','湖州']}
df=pd.DataFrame(data,columns=
['编号','姓名','籍贯'])
print(df)
print('_' * 25)
for i in df.index:
print(i)
(6)查看列标题
①格式:for i in df.columns:
②答案 xm=='0'
解析 当输入的姓名xm为字符‘0’时,结束修改状态
③答案 inf[xm]=nl
解析 修改Series对象值的格式为:对象名[index]=新值
④答案 inf[i]<=15
解析 for i in inf.index:说明for遍历Series对象inf的索引,i为每次循环
遍历到的index,与之相应的value为inf[i],年龄不Байду номын сангаас大于15岁
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
for i in inf.index:
print(i)
(8)遍历values
①格式(对象名默认遍历值)
for i in Series对象名.values:
'x5':'朱梁栋','x6':'陈清瑞'}
inf=pd.Series(dic,index=['x3','x5'])
print(inf)
(7)遍历index
①格式
for i in Series对象名.index:
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
3.主要操作
(1)用列表创建Series对象
①格式:如下
对象名=pd.Series(values,index)
②常用属性
属性
说明
index
Series的下标索引,其值默认是从0起递增的整数
values
存放Series值的一个数组
③范例:创建1个Series结构类型的对象s1,存储6名选手的姓名。
inf=pd.DataFrame(list)
print(inf)
(4)可以直接读取二维数据表文件创建(如Excel)
范例:读取Excel文件“抽奖信息.xls”中的“奖品名称”和“姓名”列数
据(如图a所示),创建DataFrame对象,并编程输出随机抽奖的结果。
程序运行界面如图b所示。
图a
程序代码如下:
append( )
在指定元素的结尾插入内容
insert( )
在指定位置插入列
rename( )
修改列名或者索引
concat( )
合并DataFrame对象
set_value( )
根据行标签和列标签设置单个值
plot( )
绘图
6.主要操作
(1)用字典创建DataFrame对象
①原理:用字典中的一个元素创建DataFrame对象中的一列。字典
①原理: 用列表中的一个列表元素,创建DataFrame对象中的一行。
②格式
df=pd.DataFrame(data,columns=[列标签列表])
注意:data为列表,列表中每个元素是一个子列表,对应要创建的
DataFrame对象中的一行数据
③范例
import pandas as pd
list=[['周欣怡','湖州',15],['王培新','杭州',16],['张佳明','杭州',16],
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
print(inf)
print('-'*30)
print(inf['x5'])
(4)修改Series对象中的值
①格式
Series对象[索引]=新值
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
print(inf)
print('-'* 25)
inf['x5']='姚晓倩'
C.matpoltlib
D.pandas
答案 C
)
考点2Series
1.概念:是一种一维的数据结构,包含一个数组的数据和一个与数据
关联的索引(index),索引值默认是从0起递增的整数。
2.要点
(1)列表、字典等可以用来创建Series数据结构。
(2)与列表不同的是,Series的索引可以指定,类型可以为字符串型。
②范例
import pandas as pd
data={'编号':['x1','x2','x3'],'姓名':['周欣怡','王培新','张佳明'],
if
:
break
nl=int(input('请输入需
要修改的年龄值:'))
print(inf)
ans=″
for i in inf.index:
if
:
ans=ans+″+i
print('通过年龄审核的选手是:',ans)
①答案 pd.Series(dic)
解析 用字典创建一维Series数据对象,参数为对象名
课时2
编程处理数据
考点1Python进行数据处理时常用的扩展模块
1.numpy:科学计算(随机数、数组运算等基础函数)
2.scipy:基于numpy构建。增强了高等数学、信号处理、图像处理、
统计等处理能力。
3.matpoltlib:绘图库
4.pandas:基于numpy实现,主要用于数据的处理和分析。
import pandas as pd
from random import shuffle
df=pd.read_excel(″抽奖信息.xls″)
print(df)
name=[]
jp=[]
for i in df.index:
name.append(df.at[i,'姓名'])
jp.append(df.at[i,'奖品名称'])
inf=pd.Series(dic)
print(inf)
(6)用字典部分数据创建Series对象
①原理:将字典的键作为索引index,字典键为values。
②格式
对象名=pd.Series(字典名,index=[字典中的部分键])
③范例
import pandas as pd
dic={'x1':'周欣怡','x2':'王培新','x3':'张佳明','x4':'林逢春',
describe( )
标准差、最大值、最小值及4分位差
head( )、tail( )
返回DataFrame的前n个、后n个数据记录
对各列或各行中的数据进行分组,然后可对其中
groupby( )
每一组数据进行不同的操作
sort_values( )
排序,通过axis=0/1确定行列
drop( )
删除数据,通过axis=0/1确定行列
考点3DataFrame
1.定义:是一种二维的数据结构(如下图所示,Rows为行,Columns为
列),由1个索引列(index)和若干个数据列组成,每个数据列可以是不
同的类型。
2.要点:可以看作是共享同一个index的Series的集合
3.通常用一个相等长度的列表或字典来创建
4.常用属性
属性
index
columns
values
T
说明
DataFrame的行索引
存放各列的列标题
存放值的二维数据
行列转置
5.常用函数
函数
说明
count( )
返回非空(NaN)数据项的数量
sum( )、mean( ) 求和、求平均值,通过axis=0/1确定行列
max( )、min( ) 返回最大、最小值
返回各列的基本描述统计值,包含计数、平均数、
(1)Pandas提供了Series和DataFrame两种数据结构完成数据的整理、
计算、统计、分析及简单可视化。
(2)导入pandas模块:
import pandas[as pd](导入pandas模块,一般用pd替代,不替代时可省
略括号内内容)
典例1下列扩展模块中用于绘图的是(
A.numpy
B.scipy
['林逢春','嘉兴',15],['朱梁栋','湖州',16],['陈清瑞','嘉兴',15]]
inf=pd.DataFrame(list,columns=['姓名','地区','年龄'])
print(inf)
(3)用列表[字典]创建DataFrame对象
①原理: 用列表中的一个字典型元素,创建DataFrame对象中的一行。
程序运行界面和代码如下,请在划线处填上合适的代码。
import pandas as pd
dic={'姚佳云':15,'庄怡婷':16,'孙雁婷'
:17,'马能':16,'谢震宇':16,'傅怿成':17,
'沈雯雯':15,'王婧':16}
inf=
print(inf)
while True:
xm=input('请输入需要修改年龄的人名:')
逢春','朱梁栋','陈清瑞']
inf=pd.Series(xm,index=['x1','x2',
'x3','x4','x5','x6'])
print(inf)
(3)选取Series对象中的值
①格式:Series对象[索引]
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
print(inf)
(5)用字典创建Series对象
①原理:将字典的键作为索引index,字典值为values。
②格式
对象名=pd.Series(字典名)
③范例
import pandas as pd
dic={'x1':'周欣怡','x2':'王培新',
'x3':'张佳明','x4':'林逢春',
'x5':'朱梁栋','x6':'陈清瑞'}
dic={'姓名':['周欣怡','王培新','张佳明','林逢春','朱梁栋','陈清瑞'],
'地区':['湖州','杭州','杭州','嘉兴','湖州','嘉兴'],
'年龄':[15,16,16,15,16,15]}
inf=pd.DataFrame(dic)
print(inf)
(2)用[列表]创建DataFrame对象
for i in inf.values:
print(i)
典例2编写Python小程序建立字典存储如图所示Excel中的选手数
据;并利用字典生成pandas的Series对象;输出Series对象,并自动进
入修改选手年龄的状态(输入选手的姓名、新的年龄值),当输入为0
时,退出修改状态;然后输出年龄审核通过(不超过15岁)的选手名单。
中一个元素的key为DataFrame对象中列的列标签,元素的values列
表为DataFrame对象中该列的值。
②格式
df=pd.DataFrame(data)
注意:data为字典名
③范例:用字典创建1个DataFrame对象df,存储3位选手的编号、姓
名和籍贯信息
import pandas as pd
②格式
df=pd.DataFrame(data)
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
#下行语句与for i in inf等价(for i in Series对象名默认为遍历values)
import pandas as pd
s1=pd.Series(['周欣怡','王培新','张佳明','林逢春','朱梁栋','陈清瑞'])
print(s1)
(2)指定索引值
①格式
对象名=pd.Series(values,index=索引列表)
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明','林
'籍贯':['杭州','嘉兴','湖州']}
df=pd.DataFrame(data,columns=
['编号','姓名','籍贯'])
print(df)
print('_' * 25)
for i in df.index:
print(i)
(6)查看列标题
①格式:for i in df.columns:
②答案 xm=='0'
解析 当输入的姓名xm为字符‘0’时,结束修改状态
③答案 inf[xm]=nl
解析 修改Series对象值的格式为:对象名[index]=新值
④答案 inf[i]<=15
解析 for i in inf.index:说明for遍历Series对象inf的索引,i为每次循环
遍历到的index,与之相应的value为inf[i],年龄不Байду номын сангаас大于15岁
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
for i in inf.index:
print(i)
(8)遍历values
①格式(对象名默认遍历值)
for i in Series对象名.values:
'x5':'朱梁栋','x6':'陈清瑞'}
inf=pd.Series(dic,index=['x3','x5'])
print(inf)
(7)遍历index
①格式
for i in Series对象名.index:
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
3.主要操作
(1)用列表创建Series对象
①格式:如下
对象名=pd.Series(values,index)
②常用属性
属性
说明
index
Series的下标索引,其值默认是从0起递增的整数
values
存放Series值的一个数组
③范例:创建1个Series结构类型的对象s1,存储6名选手的姓名。
inf=pd.DataFrame(list)
print(inf)
(4)可以直接读取二维数据表文件创建(如Excel)
范例:读取Excel文件“抽奖信息.xls”中的“奖品名称”和“姓名”列数
据(如图a所示),创建DataFrame对象,并编程输出随机抽奖的结果。
程序运行界面如图b所示。
图a
程序代码如下:
append( )
在指定元素的结尾插入内容
insert( )
在指定位置插入列
rename( )
修改列名或者索引
concat( )
合并DataFrame对象
set_value( )
根据行标签和列标签设置单个值
plot( )
绘图
6.主要操作
(1)用字典创建DataFrame对象
①原理:用字典中的一个元素创建DataFrame对象中的一列。字典
①原理: 用列表中的一个列表元素,创建DataFrame对象中的一行。
②格式
df=pd.DataFrame(data,columns=[列标签列表])
注意:data为列表,列表中每个元素是一个子列表,对应要创建的
DataFrame对象中的一行数据
③范例
import pandas as pd
list=[['周欣怡','湖州',15],['王培新','杭州',16],['张佳明','杭州',16],
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
print(inf)
print('-'*30)
print(inf['x5'])
(4)修改Series对象中的值
①格式
Series对象[索引]=新值
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
'林逢春','朱梁栋','陈清瑞']
sy=['x1','x2','x3','x4','x5','x6']
inf=pd.Series(xm,index=sy)
print(inf)
print('-'* 25)
inf['x5']='姚晓倩'
C.matpoltlib
D.pandas
答案 C
)
考点2Series
1.概念:是一种一维的数据结构,包含一个数组的数据和一个与数据
关联的索引(index),索引值默认是从0起递增的整数。
2.要点
(1)列表、字典等可以用来创建Series数据结构。
(2)与列表不同的是,Series的索引可以指定,类型可以为字符串型。
②范例
import pandas as pd
data={'编号':['x1','x2','x3'],'姓名':['周欣怡','王培新','张佳明'],
if
:
break
nl=int(input('请输入需
要修改的年龄值:'))
print(inf)
ans=″
for i in inf.index:
if
:
ans=ans+″+i
print('通过年龄审核的选手是:',ans)
①答案 pd.Series(dic)
解析 用字典创建一维Series数据对象,参数为对象名
课时2
编程处理数据
考点1Python进行数据处理时常用的扩展模块
1.numpy:科学计算(随机数、数组运算等基础函数)
2.scipy:基于numpy构建。增强了高等数学、信号处理、图像处理、
统计等处理能力。
3.matpoltlib:绘图库
4.pandas:基于numpy实现,主要用于数据的处理和分析。
import pandas as pd
from random import shuffle
df=pd.read_excel(″抽奖信息.xls″)
print(df)
name=[]
jp=[]
for i in df.index:
name.append(df.at[i,'姓名'])
jp.append(df.at[i,'奖品名称'])
inf=pd.Series(dic)
print(inf)
(6)用字典部分数据创建Series对象
①原理:将字典的键作为索引index,字典键为values。
②格式
对象名=pd.Series(字典名,index=[字典中的部分键])
③范例
import pandas as pd
dic={'x1':'周欣怡','x2':'王培新','x3':'张佳明','x4':'林逢春',
describe( )
标准差、最大值、最小值及4分位差
head( )、tail( )
返回DataFrame的前n个、后n个数据记录
对各列或各行中的数据进行分组,然后可对其中
groupby( )
每一组数据进行不同的操作
sort_values( )
排序,通过axis=0/1确定行列
drop( )
删除数据,通过axis=0/1确定行列
考点3DataFrame
1.定义:是一种二维的数据结构(如下图所示,Rows为行,Columns为
列),由1个索引列(index)和若干个数据列组成,每个数据列可以是不
同的类型。
2.要点:可以看作是共享同一个index的Series的集合
3.通常用一个相等长度的列表或字典来创建
4.常用属性
属性
index
columns
values
T
说明
DataFrame的行索引
存放各列的列标题
存放值的二维数据
行列转置
5.常用函数
函数
说明
count( )
返回非空(NaN)数据项的数量
sum( )、mean( ) 求和、求平均值,通过axis=0/1确定行列
max( )、min( ) 返回最大、最小值
返回各列的基本描述统计值,包含计数、平均数、
(1)Pandas提供了Series和DataFrame两种数据结构完成数据的整理、
计算、统计、分析及简单可视化。
(2)导入pandas模块:
import pandas[as pd](导入pandas模块,一般用pd替代,不替代时可省
略括号内内容)
典例1下列扩展模块中用于绘图的是(
A.numpy
B.scipy
['林逢春','嘉兴',15],['朱梁栋','湖州',16],['陈清瑞','嘉兴',15]]
inf=pd.DataFrame(list,columns=['姓名','地区','年龄'])
print(inf)
(3)用列表[字典]创建DataFrame对象
①原理: 用列表中的一个字典型元素,创建DataFrame对象中的一行。
程序运行界面和代码如下,请在划线处填上合适的代码。
import pandas as pd
dic={'姚佳云':15,'庄怡婷':16,'孙雁婷'
:17,'马能':16,'谢震宇':16,'傅怿成':17,
'沈雯雯':15,'王婧':16}
inf=
print(inf)
while True:
xm=input('请输入需要修改年龄的人名:')
逢春','朱梁栋','陈清瑞']
inf=pd.Series(xm,index=['x1','x2',
'x3','x4','x5','x6'])
print(inf)
(3)选取Series对象中的值
①格式:Series对象[索引]
②范例
import pandas as pd
xm=['周欣怡','王培新','张佳明',
print(inf)
(5)用字典创建Series对象
①原理:将字典的键作为索引index,字典值为values。
②格式
对象名=pd.Series(字典名)
③范例
import pandas as pd
dic={'x1':'周欣怡','x2':'王培新',
'x3':'张佳明','x4':'林逢春',
'x5':'朱梁栋','x6':'陈清瑞'}
dic={'姓名':['周欣怡','王培新','张佳明','林逢春','朱梁栋','陈清瑞'],
'地区':['湖州','杭州','杭州','嘉兴','湖州','嘉兴'],
'年龄':[15,16,16,15,16,15]}
inf=pd.DataFrame(dic)
print(inf)
(2)用[列表]创建DataFrame对象
for i in inf.values:
print(i)
典例2编写Python小程序建立字典存储如图所示Excel中的选手数
据;并利用字典生成pandas的Series对象;输出Series对象,并自动进
入修改选手年龄的状态(输入选手的姓名、新的年龄值),当输入为0
时,退出修改状态;然后输出年龄审核通过(不超过15岁)的选手名单。
中一个元素的key为DataFrame对象中列的列标签,元素的values列
表为DataFrame对象中该列的值。
②格式
df=pd.DataFrame(data)
注意:data为字典名
③范例:用字典创建1个DataFrame对象df,存储3位选手的编号、姓
名和籍贯信息
import pandas as pd
②格式
df=pd.DataFrame(data)