【awk】提取文件第一列


生信数据文件一般是按列分开的,如果我们只想简单的提取一列而不是费尽周折写个程序提取哪一列的话,awk作为一个非常好用的文档处理工具,我们现在来简单看一下他的一些功能:

awk '{print $1}' ./Input.txt > ./out.txt

这里' '中是要输出的表达式,$1代表第一列,Input.txt是输入文件。

awk '{print $1,$2}'

提取前两列。

提取之后的文件就可以用sort等命令进行操作:

sort ./out.txt | uniq out

排序并删除重复行。