Python程序设计实验报告:实验八文件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Python程序设计实验报告:实验⼋⽂件
安徽⼯程⼤学
Python程序设计实验报告
班级物流192班姓名吕晨学号 3190505209 成绩
⽇期 2020.6.2 指导⽼师修宇
【实验名称】实验⼋⽂件
【实验⽬的】
掌握读写⽂本⽂件或 CSV ⽂件,进⽽对数据进⾏处理的⽅法。
【实验条件】
PC机或者远程编程环境
【实验内容】
完成⼆个编程题。
1)⽔浒传词频统计
⽔浒传-词频统计
描述
使⽤词频统计的⽅法,⽣成《⽔浒传》出场次数最多的10个⼈物的姓名。
⽔浒传⽂本下载(略)
读取《⽔浒传》⽂本⽂件的代码如下:
txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()
代码模板:
# ThreeKingdomsV2
import jieba
# 读取txt⽂件,获取需要统计词汇的⽂本
txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()
# 设置需要输出最多的前n位⼈物的数量
n = 10
# 请在下列exludes集合中,⾃⾏补充其他需要排除的词汇
excludes = {
"两个", "⼀个", "只见", "如何", "那⾥", "哥哥",
}
words = jieba.lcut(txt)
counts = {}
# 请扩展下列分⽀结构,转换更多替代词
for word in words:
if len(word) == 1:
continue
elif word == "宋江道":
rword = "宋江"
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
# 实现删除⼲扰词汇功能(此处约2⾏代码)
# 使⽤列表和lambda功能实现词汇的排序(此处约2⾏代码)
# 依次输出统计次数最多的前n位(此处约3⾏代码)
2)⾎压⼼率分析
描述
BP.txt”是以逗号分隔的⽇期、⾎压、⼼率记录数据⽂本⽂件( open('BP.txt',encoding="gbk"))
统计收缩压、舒张压、⼼率的总平均值(保留3位⼩数)。
【实验过程】
实验过程与记录
⼀、⽔浒传词频统计
代码如下:
在实验中遇到的问题:
在得到正确代码的过程中,需要不断补充其他需要排除的词汇直到结果正确。
例如下图:
⼆、⾎压⼼率分析代码如下:
在输⼊代码时应注意符号⼤⼩写、中英⽂符号等细节问题。
在实验过程中遇到的问题:
⼀开始做此题并没有清晰的思路,后来⽼师给了提⽰:
理解提⽰中每⾏代码的含义后,补充剩下的⼏⾏代码:
⽤IDLE运⾏代码得到的结果:。