抽取包含关键词的段落文本

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽取包含关键词的段落文本

有时我们知道某一关键词,包含这一关键词的文本连续,而且位置不固定,如何把包含这一关键词的文本以段落或行为单位提取出来呢?

如图,有上千条这样的词条,如何将包含某一单词的词条抽出来呢?下面以抽取单词“your”为例。

方法一:

使用DOS命令FIND查找命令提取,FIND命令的详细参数可以在C:状态上输入FIND/?来查询。

第一步,将这些文字导成文本格式,存到英文目录或磁盘根目录入,方便DOS命令使用,本文将文本保存为D:\CT.TXT。

第二步,在C:命令符状态下,切换到包含此文本的目录下,输入FIND “your" ct.txt >xct.txt回车,xct.txt为我们抽取出包含关键词“your”的文本。

打开D:\XCT.TXT文本查看结果如下:

从上图中可以看出我们已经从CT.TXT文本中成功抽取了包启your的所有段落。

如果说有N个关键词怎么办呢?

这个也很简单,首先将所有要抽取的关键词归并到一个WORD文档中,如下:Your

Sheep

to

....

在每一行的前面都添加FIND ",在每平行的后面都添加" ct.txt >>xct.txt,这个可以用查找替换来完成如下图:

替换完成后,将此文件内容复制到写字板中,另存为A.BAT,最好和CT.TXT 文件保存在一起。

回到C:状态D:下,键入A回车,结果如下:

从上图可以看出,已经成功的将结果提出来来了。可能有的朋友不爱使用DOS使用,下面介绍第二种方法,用EXCEL来提取同样的结果。

第一步,用EXCEL打开前面另存的CT.txt文件。

第二步,选择查找命令,点击选项按钮,打开选项。查找内容处键入要查找的关键词,仍以查找“your”为例,点击查找全部后下面就会列出所有包含“your”的条目,如图:

第三步,选中下面查找到的结果,复制。

第四步,在EXCEL表格任意空白单元格中粘贴,然后再点击复制或进剪切。

第五步,到WORD或者文本或者自己需要的软件中选择粘贴,将结果复制到这个目标文档中。

重复以上步骤提取其他想要的文本。

本人木有文化,文字表达甚弱,帮以图片形式来表达,希望对有此需要的朋友有所帮助。

相关文档
最新文档