python处理excel文件(xls和xlsx)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

python处理excel⽂件(xls和xlsx)
⼀、xlrd和xlwt
使⽤之前需要先安装,windows上如果直接在cmd中运⾏python则需要先执⾏pip3 install xlrd和pip3 install xlwt,如果使⽤pycharm则需要在项⽬的解释器中安装这两个模块,File-Settings-Project:layout-Project Interpreter,点击右侧界⾯的+号,然后搜索xlrd和xlwt,然后点击Install Package进⾏安装。

对于excel来说,整个excel⽂件称为⼯作簿,⼯作簿中的每个页称为⼯作表,⼯作表⼜由单元格组成。

对于xlrd和xlwt,⾏数和列数从0开始,单元格的⾏和列也从0开始,例如sheet.row_values(2)表⽰第三⾏的内容,sheet.cell(1,2).value表⽰第⼆⾏第三列单元格的内容。

1.xlrd模块读取excel⽂件
使⽤xlrd模块之前需要先导⼊import xlrd,xlrd模块既可读取xls⽂件也可读取xlsx⽂件。

获取⼯作簿对象:book = xlrd.open_workbook('excel⽂件名称')
获取所有⼯作表名称:names = book.sheet_names(),结果为列表
根据索引获取⼯作表对象:sheet = book.sheet_by_index(i)
根据名称获取⼯作表对象:sheet = book.sheet_by_name('⼯作表名称')
获取⼯作表⾏数:rows = sheet.nrows
获取⼯作表列数:cols = sheet.ncols
获取⼯作表某⼀⾏的内容:row = sheet.row_values(i) ,结果为列表【sheet.row(i),列表】
获取⼯作表某⼀列的内容:col = sheet.col_values(i) 结果为列表【sheet.col(i),列表】
获取⼯作表某⼀单元格的内容:cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,结果为字符串或数值【sheet.cell(0,0),xlrd.sheet.Cell对象】
⽰例:假设在py执⾏⽂件同层⽬录下有⼀fruit.xls⽂件,有三个sheet页Sheet1、Sheet2、Sheet3,其中Sheet1内容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')
print('sheet页名称:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncols
print('该⼯作表有%d⾏,%d列.'%(rows,cols))
print('第三⾏内容为:',sheet.row_values(2))
print('第⼆列内容为%s,数据类型为%s.'%(sheet.col_values(1),type(sheet.col_values(1))))
print('第⼆列内容为%s,数据类型为%s.'%(sheet.col(1),type(sheet.col(1))))
print('第⼆⾏第⼆列的单元格内容为:',sheet.cell_value(1,1))
print('第三⾏第⼆列的单元格内容为:',sheet.cell(2,1).value)
print('第五⾏第三列的单元格内容为:',sheet.row(4)[2].value)
print('第五⾏第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))
print('第五⾏第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))
# 执⾏结果
# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']
# 该⼯作表有5⾏,3列.
# 第三⾏内容为: ['梨', 3.5, 130.0]
# 第⼆列内容为['单价/元', 8.0, 3.5, 4.5, 3.8],数据类型为<class 'list'>.
# 第⼆列内容为[text:'单价/元', number:8.0, number:3.5, number:4.5, number:3.8],数据类型为<class 'list'>.
# 第⼆⾏第⼆列的单元格内容为: 8.0
# 第三⾏第⼆列的单元格内容为: 3.5
# 第五⾏第三列的单元格内容为: 300.0
# 第五⾏第三列的单元格内容为300.0,数据类型为<class 'float'>
# 第五⾏第三列的单元格内容为number:300.0,数据类型为<class 'xlrd.sheet.Cell'>
xlrd读取excel⽰例
可以看出通过sheet.row(i)、sheet.col(i)也可获取⾏或列的内容,并且结果也是⼀个列表,但是列表中的每⼀项类似字典的键值对,形式为数据类型:值。

⽽sheet.cell(0,0)获取单元格内容,结果是⼀个键值对,并且是⼀个xlrd.sheet.Cell对象。

2.xlwt写⼊excel⽂件
使⽤xlwt模块之前需要先导⼊import xlwt,xlwt模块只能写xls⽂件,不能写xlsx⽂件(写xlsx程序不会报错,但最后⽂件⽆法直接打开,会报错)。

创建⼯作簿:book = xlwt.Workbook(),如果写⼊中⽂为乱码,可添加参数encoding = 'utf-8'
创建⼯作表:sheet = book.add_sheet('Sheet1')
向单元格写⼊内容:sheet.write(m,n,'内容1')、sheet.write(x,y,'内容2')
保存⼯作簿:book.save('excel⽂件名称'),默认保存在py⽂件相同路径下,如果该路径下有相同⽂件,会被新创建的⽂件覆盖,即xlwt不能修改⽂件。

import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
xlwt创建并写⼊excel⽰例
逐个单元格写⼊excel⽐较⿇烦,可以按⾏或者列写⼊。

import xlwt
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','梨','⾹蕉','橘⼦']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
for i in range(0,len(proj)):
sheet.write(0,i,proj[i]) #按⾏插⼊⾏标题
for i in range(0,len(fruit)):
sheet.write(i+1,0,fruit[i]) #插⼊第⼀列⽔果名称
for i in range(0,len(price)):
sheet.write(i+1,1,price[i]) #插⼊第⼆列单价
for i in range(0,len(storage)):
sheet.write(i+1,2,storage[i]) #插⼊第三列库存
book.save('fruit2.xls')
xlwt逐⾏或列写⼊excel
⼆、openpyxl模块
openpyxl模块可实现对excel⽂件的读、写和修改,只能处理xlsx⽂件,不能处理xls⽂件,使⽤之前同样需要先安装该模块,再导⼊ import openpyxl。

对于openpyxl,⾏数和列数都从1开始,单元格的⾏和列也从1开始。

例如sheet.cell(1,2).value表⽰第⼀⾏第⼆列单元格的内容
1.openpyxl读取excel⽂件
获取⼯作簿对象:book = openpyxl.load_workbook('excel⽂件名称')
获取所有⼯作表名称:names = book.sheetnames
获取⼯作表对象:sheet1 = book.worksheets[n]、sheet2 = book['⼯作表名称']、sheet3 = book[book.sheetnames[n]]
获取⼯作表名称:title = sheet1.title
获取⼯作表⾏数:rows = sheet1.max_row
获取⼯作表列数:cols = sheet1.max_column
获取某⼀单元格内容:cell = sheet.cell(1,2).value、sheet['单元格'].value例如sheet['B1'].value
假设有⼀fruit2.xlsx,除后缀名其他与上述fruit.xls完全⼀样
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')
print('所有sheet页名称:',book.sheetnames)
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]
print('⼯作表名称:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_column
print('该⼯作表有%d⾏,%d列.'%(rows,cols))
# 执⾏结果
# 所有sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']
# ⼯作表名称: Sheet1
# 该⼯作表有5⾏,3列.
openpyxl读取excel⽰例
2.⾏和列⽣成器
对于xlrd模块来说,可直接通过sheet.row[i]和sheet.col[i]获取⾏和列的内容,但是对于openpyxl模块来说,⽆法直接获取某⼀⾏或列的内
容,openpyxl模块的sheet.rows和sheet.columns表⽰⾏和列的⽣成器,即generator object,需要通过循环或转换成列表、元组的形式得到⾏或列的值。

print(sheet.rows,sheet.columns)
for col in sheet.columns:
print(col)
for row in sheet.rows:
for i in row:
print(i.value,end='')
print()
# 执⾏结果
# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0> <generator object Worksheet._cells_by_col at 0x00000230E102FC00>
# (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)
# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)
# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)
# 名称单价/元库存/kg
# 苹果 8 150
# 梨 3.5 130
# ⾹蕉 4.5 100
# 橘⼦ 3.8 300
openpyxl的⾏和列⽣成器
如果要获取某⼀⾏或者列的内容,可将⾏、列⽣成器对象转换成列表或者元组,再循环列表或者元组得到内容。

前⾯说过openpyxl模块的⾏和列都从1开始,但是由于将⽣成器转化成了列表list(sheet.rows),⽽列表的索引从0开始,因此list(sheet.rows)[1]还是表⽰第⼆⾏的内容,不是第⼀⾏的内容。

for i in list(sheet.rows)[1]:
print(i.value,end='')
print()
for i in list(sheet.columns)[0]:
print(i.value,end='')
# 执⾏结果
# 苹果 8 150
# 名称苹果梨⾹蕉橘⼦
获取某⼀⾏或者列的内容
获取单元格的内容
print(sheet.cell(1,2).value) #第⼀⾏第⼆列单元格的内容
print(sheet['a2'].value) #使⽤excel单元格的表⽰法,字母不区分⼤⼩写
3.openpyxl写excel⽂件
创建⼯作簿:book = openpyxl.Workbook(),如果写⼊中⽂为乱码,可添加参数encoding = 'utf-8'
创建⼯作表:sheet = book.create_sheet('⼯作表名称',0),0表⽰创建的⼯作表在⼯作薄最前⾯
向单元格写⼊内容:sheet.cell(m,n,'内容1')、sheet.cell(x,y,'内容2')
保存⼯作簿:book.save('excel⽂件名称'),默认保存在py⽂件相同路径下,如果该路径下有相同⽂件,会被新创建的⽂件覆盖。

book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','⾹蕉','梨','橘⼦']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]
for i in range(len(proj)):
sheet.cell(1,i+1,proj[i])
for i in range(len(fruit)):
sheet.cell(i+2,1,fruit[i])
for i in range(len(price)):
sheet.cell(i+2,2,price[i])
for i in range(len(storage)):
sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
openpyxl创建和写excel⽰例
4.openpyxl修改excel⽂件
sheet.insert_rows(m)和sheet.insert_cols(n)分别表⽰在第m⾏、第n列前⾯插⼊⾏、列
sheet.delete_rows(m)和sheet.delete_cols(n)分别表⽰删除第m⾏、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['樱桃',17,80]
for j in cherry:
sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
openpyxl在指定位置增加⾏
修改单元格内容:sheet.cell(m,n) = '内容1'或者sheet['B3'] = '内容2'
sheet.cell(3,2,4)
sheet['B3'] = 5
book.save('fruit2.xlsx')
openpyxl修改单元格的内容
在最后追加⾏:sheet.append(可迭代对象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
append在最后追加⾏。

相关文档
最新文档