• tar、gzip、zip、jar是什么,怎么查看?


    原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。

    简介#

    如果你是后端程序员,我想你一定见过*.tar.gz*.zip*.jar后缀的文件吧,这些都是压缩文件,那这些文件都是怎么生成的,又有哪些关键区别呢?本文将带你一起了解这些文件和配套的操作命令,以及其经常使用的场景。

    tar与gzip#

    Linux上最常见的压缩文件就是*.tar.gz了,各种开源软件常以这种格式发布源码或程序,所以作为一名后端开发,还是很有必要了解一下的。

    首先,可以发现这个文件后缀名有两段,即.tar.gz,取这个名称也是有原因的,因为它的制作过程就分为两个部分,如下:

    1. 使用tar将目录打包成单个.tar文件
    # 将applogs目录打包为applogs.tar文件
    # 其中-c代表打包、-f指定打包文件名
    $ tar -cf applogs.tar applogs/
    
    # 可以发现,打包文件大小与目录占用大小差不多,因为tar仅仅是把目录中文件拼成单个文件,默认并不压缩  
    $ du -sh applogs/ applogs.tar
    177M    applogs/
    175M    applogs.tar
    
    1. 使用gzip将.tar文件压缩为.gz文件
    # 使用gzip压缩,会生成applogs.tar.gz文件
    $ gzip -k applogs.tar
    
    # 可以发现压缩后文件体积明显变小
    $ du -sh applogs.tar applogs.tar.gz
    175M    applogs.tar
    8.8M    applogs.tar.gz
    

    这就是*.tar.gz文件的制作过程,其实这两步使用tar命令可以简化为一步,如下:

    # 打包并压缩,其中-z代表打包后再使用gzip压缩
    $ tar -czf applogs.tar.gz applogs/
    
    # 解压到当前目录
    $ tar -xzf applogs.tar.gz -C ./
    

    压缩日志文件
    另外,由于日志文件内容一般都有很高重复率,这导致Linux上经常会将后端系统产生的历史日志文件压缩后存储起来,这样可以大幅减低磁盘空间占用。

    基于这种情况,Linux上又诞生了一批查看压缩日志文件的命令,如zcat、zgrep、zless等,如下:

    # 自动解压文件,并将其中文件内容输出
    $ zcat applogs.tar.gz
    
    # 自动解压文件,并在其中搜索,用法和grep类似
    $ zgrep -a 'error' applogs.tar.gz
    

    这比傻乎乎地先解压文件,再在文件中搜索要高效多了。

    tar与其它压缩算法
    另外,除了gzip外,tar其实也可以搭配其它压缩算法,像bzip2、xz等等,如下:

      -j, --bzip2                filter the archive through bzip2
      -J, --xz                   filter the archive through xz
          --lzip                 filter the archive through lzip
          --lzma                 filter the archive through xz
          --lzop                 filter the archive through lzop
      -z, --gzip, --gunzip, --ungzip   filter the archive through gzip
          --zstd                 filter the archive through zstd
      -Z, --compress, --uncompress   filter the archive through compress
    

    zip与jar#

    zip同样是一种常见的压缩文件格式,后缀是*.zip,与上面tar、gzip不同的是,zip将打包与压缩两个过程融合在一起了,在Linux下对应的操作命令是zipunzip,如下:

    # 创建zip压缩文件
    $ zip -r applogs.zip applogs/
    
    # 查看zip压缩文件中有哪些文件
    $ unzip -l applogs.zip
    Archive:  applogs.zip
      Length      Date    Time    Name
    ---------  ---------- -----   ----
            0  2022-09-17 12:58   applogs/
        99166  2022-09-16 18:20   applogs/demo.2022-09-16.0.log
     13177092  2022-09-17 13:37   applogs/demo.2022-09-17.0.log
          948  2022-08-09 15:08   applogs/demo.log
    ...
    ---------                     -------
    203039002                     140 files
    
    # 解压zip文件,-d指定解压目录
    $ unzip applogs.zip -d ./
    

    与gzip类似的是,zip也配套了一批方便特定场景使用的命令工具,如zipinfo、zipgrep等,如下:

    # zipinfo查看zip文件包含哪些文件
    $ zipinfo applogs.zip
    Archive:  applogs.zip
    Zip file size: 9573195 bytes, number of entries: 140
    drwxrwxrwx  3.0 unx        0 bx stor 22-Sep-17 12:58 applogs/
    -rwxrwxrwx  3.0 unx    99166 tx defN 22-Sep-16 18:20 applogs/demo.2022-09-16.0.log
    -rwxrwxrwx  3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log
    -rwxrwxrwx  3.0 unx      948 tx defN 22-Aug-09 15:08 applogs/demo.log
    ...
    140 files, 203039002 bytes uncompressed, 9546235 bytes compressed:  95.3%
    
    # zipgrep自动解压文件,并在其中搜索,用法和grep类似
    $ zipgrep 'error' applogs.zip
    

    查看jar文件
    目前,绝大多数java项目都是基于spingboot的,众所周知,spingboot会将项目打包成单个jar文件来部署,但其实jar文件本质上就是zip格式,它相比zip文件只是多了一个META-INF/MANIFEST.MF文件而已,如下:

    $ unzip -p app.jar META-INF/MANIFEST.MF
    Manifest-Version: 1.0
    Spring-Boot-Classpath-Index: BOOT-INF/classpath.idx
    Implementation-Version: 0.0.1-SNAPSHOT
    Spring-Boot-Layers-Index: BOOT-INF/layers.idx
    Start-Class: com.example.demo.DemoApplication
    Spring-Boot-Classes: BOOT-INF/classes/
    Spring-Boot-Lib: BOOT-INF/lib/
    Build-Jdk-Spec: 1.8
    Spring-Boot-Version: 2.4.0
    Created-By: Maven Jar Plugin 3.2.0
    Main-Class: org.springframework.boot.loader.JarLauncher
    

    如上所示,MANIFEST.MF文件指定了jar包的Main-Class,这样当执行java -jar app.jar时,java就知道去哪个类找main方法了,而spingboot打包的jar,无非就是将启动类换成了自己的而已。

    而很多时候,我们需要确认下jar文件里面的内容,比如我想看一下app.jar里被spingboot内嵌的tomcat的线程池配置大小,可如下查看:

    $ zipgrep 'max-thread' app.jar 
    BOOT-INF/classes/application.yml:    max-threads: 500
    

    这可比jdk自带的jar命令方便多了,如果你是java开发同学,这个命令应该成为你开发工具箱中的一员。

    总结#

    ok,压缩文件与命令介绍得差不多了,简单总结一下:

    1. tar、gzip:用于打包或解压*.tar.gz文件的命令,虽然它们是两个命令,但几乎都是一起使用的。
    2. zip、unzip:用于打包或解压*.zip文件的命令,值得注意的是,它们同样可处理*.jar文件,且在搜索场景中,使用zipgrep更方便。

    less命令其实可以直接打开这些压缩文件,它甚至可以打开png、pdf等广义上的压缩文件!

    另外,Linux平台上其实还有一些其它的压缩命令,如bzip2、xz、7z、rar等,就不一一介绍了,感兴趣可查看Linux man文档。

    往期内容#

    密码学入门
    接口偶尔超时,竟又是JVM停顿的锅!
    耗时几个月,终于找到了JVM停顿十几秒的原因
    mysql的timestamp会存在时区问题?
    真正理解可重复读事务隔离级别
    字符编码解惑

  • 相关阅读:
    用HTML+CSS做一个学生抗疫感动专题网页设计作业网页
    运行近20年,基于Win 98的火星探测器软件迎来首次升级
    Net6 Xunit 集成测试
    Pandas实现一列切分为多列
    Spring5复习笔记
    信息系统项目管理师-范围管理论文提纲
    面试突击83:什么情况会导致@Transactional事务失效?
    python单元测试框架(继承、unittest参数化、断言、测试报告)
    centos7篇---禁用默认的驱动nouveau,安装cuda和cudnn
    使用 dlv 进行 debug
  • 原文地址:https://www.cnblogs.com/codelogs/p/16702759.html