시작하기
weave.init(project=...)를 호출하세요. project 인수를 사용해 team-name/project-name 형식으로 특정 W&B Teams 이름에 로그를 기록하거나, project-name을 사용해 기본 Teams/entity에 로그를 기록할 수 있습니다.
call 메타데이터 추적
weave.attributes 컨텍스트 관리자를 사용할 수 있습니다. 이 컨텍스트 관리자를 사용하면 파이프라인 run이나 evaluation 배치와 같은 특정 코드 블록에 맞춤형 메타데이터를 설정할 수 있습니다.
트레이스
- 파이프라인 실행 step
- Judge 단위 평가
- 레이어 변환
- 풀링 오퍼레이션
- 맞춤형 단위 및 변환
파이프라인 트레이싱 예시
- 메인 Pipeline 실행
- Layer 내 각 JudgeUnit 평가
- MeanPoolUnit 집계 step
- 각 오퍼레이션의 타이밍 정보
설정
weave.init()를 호출하면 Verdict 파이프라인에서 트레이싱이 자동으로 활성화됩니다. 이 인테그레이션은 Pipeline.__init__() 메서드를 패치해 모든 트레이스 데이터를 Weave로 전달하는 VerdictTracer를 주입하는 방식으로 작동합니다.
추가 설정은 필요하지 않습니다. Weave가 자동으로 다음을 수행합니다:
- 모든 파이프라인 오퍼레이션 캡처
- 실행 시간 추적
- 입력과 출력 기록
- 트레이스 계층 구조 유지
- 동시 파이프라인 실행 처리
맞춤형 트레이서와 Weave
VerdictTracer도 함께 사용할 수 있습니다:
Models 및 평가
weave.Model을 사용하면 프롬프트, 파이프라인 설정, 평가 매개변수와 같은 실험 세부 정보를 담아 체계적으로 정리할 수 있어, 서로 다른 반복 버전을 더 쉽게 비교할 수 있습니다.
다음 예제에서는 Verdict 파이프라인을 WeaveModel로 래핑하는 방법을 보여줍니다:
평가
weave.Evaluation 클래스를 사용하면 특정 작업이나 데이터셋에서 Verdict 파이프라인이 얼마나 잘 동작하는지 파악할 수 있습니다: