专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
BioArt  ·  Nature | ... ·  2 天前  
BioArt  ·  Cell Metab | ... ·  2 天前  
生信宝典  ·  Nature | ... ·  2 天前  
今天看啥  ›  专栏  ›  生信菜鸟团

Linux操作/统计文本的命令

生信菜鸟团  · 公众号  · 生物  · 2024-10-14 18:02
    

文章预览

学习笔记总结于『生信技能树』马拉松课程 本文学习Linux操作/统计文本的几个基础命令: wc 、 cut 、 sort 、 uniq 、 paste 、 tr 一、 wc wc :统计文本 常见参数 -l ## 统计行数(做生信项目时,多关注行数,一般以行为单位进行处理) -w ## 统计字符串数 -c ## 统计字节数 #不加参数,则默认全部统计出来,即-l、-w、-c同时实现 wc readme.txt 6 29 207 readme.txt # 6行,29个字符串,207个字节 图1 字符串 图2 字节 贴心功能 wc 还有两个贴心的功能:显示文件名和统计数量 图3 二、 cut cut :文本切割 常见参数 -d ## 指定分隔符,默认的分隔符为\t。 ## \t指的是一个tab,即空了一片。按一次空格键则只空了一格,按一次tab键则会空一大片 -f ## 输出哪几列(字段fields) 1.取列 ①切第一列 less -S Data/example.gtf less -S Data/example.gtf | cut -f 1 | head 图4 ②必须要有参数 怎么切都可 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览