GCP
PR

Google Storage上のgzファイルを連結して1つにする方法(gsutil compose)

ycsg113XYZ
記事内に商品プロモーションを含む場合があります
スポンサーリンク

gsutil composeでまとめる

bq extractなどによりGoogle Storage上に出力する際、以下のように複数のテーブルに分かれる場合があります。

gs://mybucket/myfile_00000001.csv.gz

gs://mybucket/myfile_00000002.csv.gz

gs://mybucket/myfile_00000003.csv.gz

Linuxのローカルディスクを使用する事なく、このファイルを1つにするコマンドがあります。linuxのディスク上に存在する場合はcatを使って連結できますが、同様にgs上のファイルを1つに出来ます。

以下はmyfile_*.csv.gzたちをまとめてmyfile_matome.csv.gzに1ファイルにします。

gsutil compose gs://mybucket/myfile_*.csv.gz gs://mybucket/myfile_matome

ただし、まとめられるファイル数に制限があります。

このコマンドでまとめられるファイル数は、32個までです。

スポンサーリンク
ABOUT ME
ひろし
ひろし
都内在中のなんちゃってSE。ギリギリPG。の私が管理者のひろしです。 日々夜遅くまで仕事に追われています。 今日は早く帰りたい・・・
スポンサーリンク
記事URLをコピーしました