python文件之指针操作

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

python⽂件之指针操作⼀：⽂件内指针移动的单位是什么？
读出⼆进制解码的到的字符串：
只有t模式下,read(n),n是字符个数
with open('a.txt', mode='rt',encoding='utf-8') as f: # 你好呀hello word
data = f.read(6)
print(f.tell()) # 12
print(data) # 你好呀hel
b模式下read(n),n是多少个⼆进制数bit
8bit=>1Byte
1024Byte = 1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
1GB=1024*1024*8
with open('a.txt',mode='rb') as f:
data =f.read(6)
print(f.tell()) # 6
print(data.decode('utf-8')) # 你好
以b模式读取⽂件内容
with open('a.txt', mode='rb') as f:
data = f.read(9) # 在utf-8编码保存⽂件⼀个中⽂字符占3个byte
print(type(data))
print(len(data))
print(data.decode('utf-8'))
b.txt ⽂件是以gbk编码保存的⽂件，底层存的是⼆进制
gbk编码中⽂占连个byte
with open('b.txt', mode='rb') as f: # hello你好
data = f.read(7)
print(type(data))
print(len(data))
print(data.decode('utf-8')) # 报错你以gbk编码写⼊⽂件的，同样都出来，也是gbk编码读出来
print(data.decode('gbk'))
⼆主动/单独地控制⽂件指针移动
f.seek(x,y)
x代表移动的字节个数
y代表模式(0,1,2)b
0:代表指针参照物是⽂件开头，可以在t模式和b模式下使⽤
b.txt是以utf-8编码存储到⽂件中
with open('b.txt', mode='rt', encoding='utf-8') as f: # 从删库到跑路
data = f.read(2)
print(data) # 从删
print(f.tell()) # 6
1：代表的是当前位置，只能在b模式下⽤
c.txt他是utf-8编码存的
with open('c.txt',mode='rb') as f: # 你好word
f.read(1)
print(f.tell()) # 1
f.seek(2, 1)
print(f.tell()) # 3
print(f.read().decode('utf-8')) # 好word
2：代表的是参照物在⽂件末尾，只能以b模式下⽤
with open('d.txt', mode='rb') as f: # 你好word真难
f.seek(250, 2)
print(f.tell()) # 16+250=266
f.seek(-3, 2)
print(f.tell()) # 13
f.seek(0, 2) # 快速将指针移动到⽂件末尾(可以⽤a模式打开也⼀样
print(f.tell()) # 16
开发 tailf -f 命令
import time
with open(r'D:\s9\day10\acess.log', mode='rb') as f:
f.seek(0, 2)
while True:
line = f.readline()
if len(line) == 0:
time.sleep(1)
else:
print(line.decode('utf-8'),end='')
⽇志⽣成器
import time
with open('acess.log', mode='at', encoding='utf-8') as f:
f.write('%s 你这个程序是死循环\n' % (time.strftime('%Y-%m-%d %H:%M:%m')))
⽂件修改
⽂件修改都是模拟出来的，实现修改需要借助内存
硬盘数据没有修改的说法，都是⽤新内容覆盖旧的内容
有两种⽅式
⽅式⼀
1：硬盘中的内容全部读⼊内存，
2：把内存中的数据⼀次性修改完毕
3：把内存中修改完成的结果覆盖会原⽂件
with open('f.txt', mode='rb') as f_read: # 你好word真难
data = f_read.read().decode('utf-8')
res = data.replace('word', '世界')
print(res)
with open('f.txt', mode='wb') as f_write:
f_write.write(res.encode('utf-8'))
缺点：浪费内存，有可能⽂件过⼤，撑爆内存
优点：不费硬盘空间，数据只存⼀份
⽅式⼆
1：把硬盘内容全部读⼊内存
2：在内存中把内容⼀次性修改完毕，临时存储到硬盘中
3：让后把临时⽂件重新命名，源⽂件删除掉
import os
with open('f.txt', mode='rt',encoding='utf-8') as read_f,\
open(".f.txt.swap",mode='wt',encoding='utf-8') as write_f: # 你好世界真难 for line in read_f:
write_f.write(line.replace("word",'世界'))
os.remove('f.txt')
os.rename('.f.txt.swap', 'f.txt')
优点：省内存空间，内存同⼀时刻只有⽂件的⼀⾏内容
缺点：浪费硬盘⽂件，在修改过程中会存放两份数据。