删除WORD和TXT文件中重复段落
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在WORD、TEXT等文件中,经常会出现重复的段落,特别是下载的文件中,有时重复的广告段落比正文还多,如果文稿较短,手动删除即可,但几百页、上千页中有大量重复段落,就不好办了。我在网上搜索了一下,发现有不少删除办法,但我认为自己的方法是最好的,是利用EXECL中数据筛选,去除重复的记录方法实现的。下面给大家共享一下。
1、打开MS OFFICE软件中的EXCEL表格软件。
2、点击“文件”--“打开”,这时会出现一个文件选择窗口。
3、点击“文件类型”选择条,选择“所有文件(*.*)”。
4、在文件选择窗口里选择你需要删除重复段落的WORD或TXT文件后点击“打开”。
5、出现“文本导入向导”,选择“分隔符号”点击“下一步”,选择“TAB键”,点击“完成”。
6、文本已经导入EXECL中。
7、选择表格中第一列,点击菜单“数据”--“筛选”--“高级筛选”,列表区域是你所有数据,例如A1至A10000,则列表区域为$A$1:$A$1000,选择“将筛选结果复制到其他区域”,可选择$M$1:$M$1000,勾选“选择不重复的记录”,然后点击“确定”。
8、通过以上步骤,不重复的段落全部复制到$M$1:$M$1000中,这时可将原数据,即A列删除,剩下的就是不重复的段落。
9、将文件另存为TXT文件,任务完成。
需要说明的是,有时有用的重复段落也会被
删除,另外,有时候需要对原文件进行一下
处理才能准确实现。