linux中截取字符串cut命令用法简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

linux中截取字符串cut命令用法简介:

语法:cut -cnum1-num2 fileName

使用权限:所有使用者

说明:显示每行从开头算起num1 到num2 的文字。

例子:

shell>> cat fileName

test2

this is a test content

shell>> cut -c1-6 fileName ## print 开头算起前6 个字元

test2

this i

-c m-n 表示显示每一行的第m个字元到第n个字元。例如:

liubi 23 140004

# cut -c 1-5,10-14 file

liubi

-f m-n 表示显示第m栏到第n栏(使用tab分隔)。例如:

liubi 23 14000

# cut -f 1,3 file

liubi 14000

-c 和-f 参数可以跟以下子参数:

m 第m个字符或字段

m- 从第m个字符或字段到文件结束

-n 从第1个到第n个字符或字段

m-n 从第m个到第n个字符或字段

我们经常会遇到需要取出分字段的文件的某些特定字段,例如/etc/password就是通过":"分隔各个字段的。可以通过cut命令来实现。例如,我们希望将系统账号名保存到特定的文件,就可以:

cut -d: -f 1 /etc/passwd > /tmp/users

-d用来定义分隔符,默认为tab键,-f表示需要取得哪个字段

如:

使用|分隔

cut -d’|’ -f2 1.test>2.test

使用:分隔

cut -d’:’ -f2 1.test>2.test

这里使用单引号或双引号都行。

Linux下cut命令用法详解

Linux及相关2008-12-05 15:58:57 阅读38 评论0 字号:大中小订阅

有时我们经常会遇到这样一些问题:有一页电话号码薄,上面按顺序规则地写着人名、家庭住址、电话、备注等,此时我们只想取出所有人的名字和其对应的电话号码,你有几种方法可以实现呢?

以下内容欢迎转载,但请保留作者名号及出处,谢谢!

确实这种纵向定位的方式用常规办法难以实现,这时,cut就可以大显身手了。

cut -b list [-n] [file ...]

cut -c list [file ...]

cut -f list [-d delim][-s][file ...]

上面的-b、-c、-f分别表示字节、字符、字段(即byte、character、field);

list

delim(英文全写:delimiter)表示分隔符,默认情况下为TAB;

-s表示不包括那些不含分隔符的行(这样有利于去掉注释和标题)

上面三种方式中,表示从指定的范围中提取字节(-b)、或字符(-c)、或字段(-f)。

范围的表示方法:

interrupts文件中的字符排列非常齐整,正适合我们切豆腐。

但这里我们只对两个数字列感兴趣,用法如下:

里面还有一些不需要的内容,精减一下:

关于正则表达式的使用,请自行查阅相关资料。

合到一起:

不相邻列的截选又应该如何做呢?

这种方式需要事先确定占多少个字符位置,不仅麻烦,而且容易出错。

下面的问题该怎么去做?

cut –c主要是用来在固定字符位置或个数的文本文件中提取,对于上面的例子就显得无能为力了。仔细观察,发现passwd文件有个规律,就是以冒号来区分不同的段的文本,于是。。。

继续,创建一个文本文件,名为a.txt,名字有点土,凑合着用吧。

A1、B1、C1所代表的行字符之间均以TAB分隔,D1却是以空格来分开的。

看到-s的作用了吗?(因为第一行不含有任何TAB字符,所以直接被剔除了),而最后一行(即D1行),是以空格区分间距,所以也不合要求。

多了个参数,这个我没讲,只要你的智商比范伟高一点点,就肯定能猜出来啦。^_^

好了,下面是最后一个用法的讲解了:

因为虚拟终端下无法显示汉字,所以我只好回到图形下,截图就成这个白不垃圾的样子啦,忍忍吧,就快讲完了。

在这个文件中,每个汉字都是用半角空格分隔的。

原因在于汉字本身是双字节的,cut –c把汉字“我”当成一个字符来处理,而cut –b是以字节来处理,把“我”拆成了两个字节,结果是字符被“切成两半”,因此无法正常显示。

原因找到了,要怎么办才好呢?

相关文档
最新文档