1. W&B にログインする
2. run を初期化する
wandb.init() を使用して run を初期化します。これにより、データを Sync・ログするバックグラウンドプロセスが起動します。プロジェクト名とジョブタイプを指定します:
3. artifact オブジェクトを作成する
wandb.Artifact() を使用して artifact オブジェクトを作成します。name パラメーターには artifact の名を、type パラメーターにはファイルタイプを表す説明を指定します。
たとえば、次のコードスニペットは、‘dataset’ ラベルを持つ ‘bicycle-dataset’ という artifact を作成する方法を示しています。
4. データセットをartifactに追加する
dataset.h5 という名前のデータセットをartifactに追加します。
dataset.h5 を、artifact に追加するファイルのパスに置き換えます。
5. データセットをログする
wandb.Run.log_artifact() method を使用して、artifact のバージョンを保存すると同時に、その artifact を run の出力 として宣言します。
'latest' のエイリアスが作成されます。artifact のエイリアスとバージョンの詳細については、それぞれカスタムエイリアスを作成すると新しい artifact バージョンを作成するを参照してください。
以上を踏まえると、ここまでのスクリプトは次のようになります。
6. artifact をダウンロードして使用する
- まず、
wandb.init()で新しい run オブジェクトを初期化します。 - 次に、run オブジェクトの
wandb.Run.use_artifact()method を使用して、使用する artifact を W&B に指定します。これにより、artifact オブジェクトが返されます。 - 最後に、artifact の
wandb.Artifact.download()method を使用して、artifact の内容をダウンロードします。
wandb.Api) を使用できます。詳細は 外部ファイルをトラッキングする を参照してください。