메인 콘텐츠로 건너뛰기
W&B Weave는 LLM 애플리케이션을 추적하고, 평가하고, 개선할 수 있게 해주는 관측성 및 평가 플랫폼입니다. Weave로 다음 작업을 수행할 수 있습니다.
  • 관찰 및 디버깅으로 LLM 애플리케이션을 관찰하고 디버깅할 수 있습니다
  • 평가로 LLM 기반 평가자와 맞춤형 scorer를 사용해 애플리케이션의 응답을 평가할 수 있습니다

시작하기

다음 문서에서는 Weave 도구 모음을 사용하는 기본 방법을 안내합니다.

퀵스타트: LLM 입력 및 출력 추적

먼저 LLM에 대한 기본 call을 트레이싱하고 W&B 계정에서 데이터를 확인해 보세요.

앱 평가 시작하기

Weave scorer를 사용해 애플리케이션 성능을 테스트하고 추적하는 평가 파이프라인을 구축하는 방법을 알아보세요.

RAG 애플리케이션 평가하기

Weave와 LLM 기반 평가자를 사용해 검색 품질을 측정하면서 RAG 애플리케이션을 구축하고 평가하세요.

Weave 설치

W&B Weave는 Python 및 TypeScript 라이브러리를 제공합니다. Weave 라이브러리를 설치하려면 다음 명령어를 실행하세요.
pip install weave
Weave 라이브러리 사용을 시작하려면 Weights & Biases (W&B) 계정을 만들고 User Settings에서 API 키를 생성하세요. API 키를 사용하면 W&B 계정에 인증하고 데이터를 전송할 수 있습니다.