トップQs
タイムライン
チャット
視点
Gzip
データ圧縮プログラムのひとつ、およびその圧縮データのフォーマット ウィキペディアから
Remove ads
gzip(ジー・ジップ)は、データ圧縮プログラムのひとつ、およびその圧縮データのフォーマットである。「GNU zip」の略であり[2] GNUプロジェクトによって開発・メンテナンスされている。現在、多くのUNIXに標準搭載される。
![]() |
それ以前に普及していたcompressの圧縮アルゴリズムはLZWだが、LZWは特許を侵害していたのでGNUプロジェクトが代替としてgzipを開発した[3][注 1]。
Remove ads
概要
gzipは、Lempel-Zivアルゴリズム (LZ77) とハフマン符号を用いており、従来のcompressよりも圧縮率が高いことが特徴である[5]。ただし非常に冗長なファイルでは、compressの方が圧縮率が高いこともある。開発者向けにライブラリとしてzlibが作成され、これにより広く使われる形式となった。gzipによって圧縮されたファイルの拡張子は慣習的に.gz
を用いる(極初期のgzipは.z
を用いたが、packとの混同を避けるため変更された。1993年頃に作成された.z
はgzipファイルの可能性が高い。なお、gzip自体はpack形式の伸長が可能である)。
また、gzipコマンドは標準入力から受け取ったデータを圧縮し、標準出力から取り出すことができる(gunzipは逆の動作)[5]ため、ファイル圧縮に限らず、多様な目的に使用できる。
gzipはzip等と異なりファイルアーカイバとしての機能は持たず、複数ファイルを扱いたい場合はtarファイルをgzip圧縮するという使い方が一般的である[5]。GNU tarにはアーカイブをgzipにフィルタする-zオプションが付いている。これによりアーカイブと圧縮を同時に、あるいは抽出と伸張を同時に行うことができる[6]。gzip圧縮したtarアーカイブは拡張子.tar.gz
または.tgz
を付ける習慣がある。
HTTP 1.1にはデータを圧縮し転送量を減らす機能があるが、gzipはその際の圧縮フォーマットの一つとしても使われている[7]。また、gzipはその仕様がRFC 1952で記述されている。
初期のうちに登場した1.2.4が安定したバージョンとして長期にわたって利用されたが、4GB超のファイルへの対応が無かったため、種々のバージョンアップが行われた。
Remove ads
互換性
gzipは、zip、compress、compress -H、packで圧縮されたファイルを伸張することができる。zipファイルについては、Deflate法で圧縮されファイルが1つしか含まれていない場合にだけ伸張できる[5]。gzipがインストールされているシステムでは、gunzip、zcat、uncompressコマンドが、gzipコマンドへのハードリンクとして存在していることがある。Linux Standard Baseでも指定コマンドになっている[9]。
主なオプション[5]
- -r
- サブディレクトリにわたって圧縮する
- -v
- 詳細情報を表示する
- -数字
- 圧縮率の調整 (例:-9 圧縮率を最大にする -1 圧縮速度を最大にする。既定は6)
- -f
- 上書きを強制する
拡張子
tarと組み合わせる場合には.tar.gz
もしくは.tgz
とする[10]。
Media Type
2012年8月に発行されたRFC 6713でapplication/gzip
が定義されて、IANAにも正式に登録された。以前はapplication/x-gzip
やapplication/x-gzip-compressed
などが用いられていた。[11]
tarによるアーカイブがなされている場合は、非公式のapplication/x-tar-gz
も用いられる。[要出典]
HTTP圧縮
gzipは、HTTP通信を高速化するために使用されるもっとも一般的な圧縮アルゴリズムであり、現在ではほとんどのサーバーソフトウェアとブラウザーがgzip圧縮に対応している[12][13]。2024年3月現在、すべてのウェブサイトのうち約50%がgzip圧縮を使用している[14]。
脚注
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads