메인 콘텐츠로 건너뛰기
W&B CLI를 사용해 sweep을 일시 중지, 재개, 취소할 수 있습니다. CLI의 sweep command는 --pause, --resume 같은 플래그를 사용해 sweep이 새 W&B run을 생성할 수 있는지를 제어하며, 기존 run에는 다음과 같이 서로 다른 영향을 줍니다.
  • --pause: sweep을 일시 중지하면 sweep을 재개할 때까지 에이전트가 새 run을 생성하지 않습니다. 기존 run은 정상적으로 계속 실행됩니다.
  • --resume: sweep을 재개하면 에이전트가 검색 전략에 따라 새 run 생성을 계속합니다.
  • --stop: sweep을 중지하면 에이전트가 새 run 생성을 중지합니다. 기존 run은 완료될 때까지 계속 실행됩니다.
  • --cancel: sweep을 취소하면 에이전트가 현재 실행 중인 모든 run을 즉시 종료하고 새 run 생성을 중지합니다.
다음 안내에 따라 sweep을 일시 중지, 재개, 취소하세요. 각 경우에 sweep을 초기화할 때 생성된 sweep ID를 입력해야 합니다.

sweep 일시 중지

sweep를 일시 중지하면 새 run 생성이 일시적으로 중단됩니다. 이미 실행 중인 run은 완료될 때까지 계속 실행됩니다. sweep를 일시 중지하려면 wandb sweep --pause 명령어를 사용하세요. 일시 중지할 sweep ID를 지정합니다.
wandb sweep --pause entity/project/sweep_ID

sweep 재개

일시 중지된 sweep은 wandb sweep --resume 명령어로 재개할 수 있습니다. sweep은 검색 전략에 따라 새 run을 다시 생성하기 시작합니다. 재개하려는 sweep ID를 지정합니다:
wandb sweep --resume entity/project/sweep_ID

sweep 중지

현재 실행 중인 run은 정상적으로 완료되도록 하면서 새 run이 생성되지 않게 하려면 sweep을 종료하세요. wandb sweep --stop 명령어를 사용합니다:
wandb sweep --stop entity/project/sweep_ID
프로젝트를 삭제해도 W&B는 실행 중인 Sweeps 또는 에이전트를 종료하지 않습니다.

sweep 취소

sweep를 취소하면 현재 실행 중인 모든 run이 즉시 종료되고 새 run은 더 이상 생성되지 않습니다. 기존 run을 강제로 종료하는 유일한 sweep 명령어입니다. run은 즉시 강제 종료되므로, 실행 중인 프로세스는 사용자 정의 signal handler를 실행할 기회를 갖지 못합니다. sweep를 취소하려면 wandb sweep --cancel 명령어를 사용하세요. 취소할 sweep ID를 지정하세요. signal과 sweep run에 대한 자세한 내용은 Signal handling and sweep runs를 참조하세요.
wandb sweep --cancel entity/project/sweep_ID
CLI 명령 옵션의 전체 목록은 wandb sweep CLI 레퍼런스 가이드를 참조하세요.
프로젝트를 삭제해도 W&B는 활성 sweeps나 에이전트를 종료하지 않습니다.

sweep와 run 상태 이해하기

sweep는 하이퍼파라미터 조합을 탐색하기 위해 여러 run을 실행하고 관리합니다. 하이퍼파라미터 최적화를 효과적으로 관리하려면 sweep 상태와 run 상태가 어떻게 상호작용하는지 이해하는 것이 중요합니다.

주요 차이점

  • Sweep status는 새 run이 생성될지 여부를 제어합니다 (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
  • Run status는 개별 run의 실행 상태를 나타냅니다 (Pending, Running, Finished, Failed, Crashed, Killed)

개별 run 중지

sweep에서 run을 중지하면 sweep 에이전트가 sweep의 다음 run을 자동으로 시작합니다. 따라서 sweep의 전체 진행을 중단하지 않고도 성능이 좋지 않은 설정을 건너뛸 수 있습니다.

모범 사례

  • 실행 중인 Experiments를 잃지 않고 탐색을 일시 중지하려면 cancel 대신 --pause를 사용하세요
  • 개별 run 상태를 모니터링하여 시스템적 실패를 파악하세요
  • 만족스러운 하이퍼파라미터를 찾았다면 정상적으로 종료하려면 --stop을 사용하세요
  • run이 과도한 리소스를 소모하거나 오류를 발생시키는 긴급 상황에서만 --cancel을 사용하세요