Colaboratory環境でGoogle Cloud Storage(GCS)と連携する(gsutil,gcsfuse)
本記事では、gsutilとgcsfuseを利用したColaboratory環境とGoogle Cloud Storage(GCS)との連携について見ていきます。 【目次】 [1]概要 (1)Vision APIに関連するGCSの利用シナリオ例 (2)GCSとの連携方法 (3)利用料金について [2]gsutil (1)Google Cloud Storage URI (2)一般公開データのダウンロード例 (3)認証 (4)プロジェクトの設定(オプション) (5)URIとワイルドカード (6)gsutil ls:バケットやオブジェクトの情報表示 (7)gsutil cp:ファイルやフォルダのコピー [3]Cloud Storage FUSE(gcsfuse) (1)インストール (2)認証 (3)マウントして利用する (4)マウントの解除 (5)他ツールとの共存:ディレクトリの扱いなどの問題 [1]概要 Google Cloud Storageは、公式ドキュメント( https://cloud.google.com/storage/docs?hl=ja )で以下のように説明されています。 Cloud Storage は、Google Cloud でオブジェクトを保存するためのサービスです。 オブジェクトとは、任意の形式のファイルで構成される不変のデータのことです。オブジェクトをバケットと呼ばれるコンテナに保存します。すべてのバケットがプロジェクトに関連付けられ、組織のプロジェクトをグループ化できます。 これは技術的側面からの説明ですが、大雑把に言えば、Google Cloud Platform(GCP)が提供するデータ保管サービスの一つです。利用方法によっては、OSのファイルのように扱うこともできます。 本記事では、Google Cloud Storageについての説明は行いませんが、記事『 Colaboratory+GoogleドライブでVision APIの実験環境を作る 』の流れから、Colaboratory環境からGoogle Cloud Storageを利用する方法を見ていきます。また、利用例などはVision APIの利用に関するものを中心としています。 以下は、Google Cloud StorageをGCSと略して書きます。 ...