가격
Inference
트레이닝
모델 저장소
제한 사항
-
Inference 동시성 제한: 기본적으로 Serverless RL은 현재 사용자당 최대 2000개의 동시 요청과 프로젝트당 6000개의 동시 요청까지 지원합니다. 요청 속도 제한을 초과하면 Inference API는
429 Concurrency limit reached for requests응답을 반환합니다. 이 오류를 방지하려면 트레이닝 작업 또는 프로덕션 워크로드가 한 번에 보내는 동시 요청 수를 줄이세요. 더 높은 요청 속도 제한이 필요하면 support@wandb.com으로 요청할 수 있습니다. - 지리적 제한: Serverless RL은 지원되는 지역에서만 사용할 수 있습니다. 자세한 내용은 Terms of Service를 참조하세요.