TypeScript용 Weave 퀵스타트 가이드
- 언어 모델의 입력, 출력, 트레이스를 로깅하고 디버깅
- 언어 모델 사용 사례에 대해 동일한 조건으로 비교할 수 있는 엄격한 평가 구축
- 실험부터 평가, 프로덕션에 이르기까지 LLM 워크플로 전반에서 생성되는 모든 정보 정리
함수 추적
weave.op 래퍼를 추가하세요.
weave.op를 추가하고 함수를 호출한 뒤, W&B 대시보드로 이동해 프로젝트에서 해당 함수가 추적되는 것을 확인하세요.
코드는 자동으로 추적되므로 UI의 코드 탭을 확인하세요!
OpenAI 인테그레이션
- 토큰 사용량
- API 비용
- 요청/응답 쌍
- 모델 설정
OpenAI 외에도 Weave는 Anthropic 및 Mistral과 같은 다른 LLM 제공업체의 자동 로깅도 지원합니다. 전체 목록은 인테그레이션 문서의 LLM Providers를 참조하세요.
중첩 함수 추적
- 애플리케이션 로직 흐름 전체를 파악 가능
- 복잡한 오퍼레이션 체인을 쉽게 디버깅 가능
- 성능 최적화 기회 제공
데이터셋 관리
weave.Dataset 클래스를 사용하면 Weave로 데이터셋을 생성하고 관리할 수 있습니다. Weave Models와 마찬가지로 weave.Dataset는 다음과 같은 작업에 도움이 됩니다:
- 데이터를 추적하고 버전을 관리
- 테스트 케이스를 구성
- 팀 구성원 간에 데이터셋을 공유
- 체계적인 평가 수행 지원
평가 프레임워크
Evaluation 클래스를 통해 평가 주도 개발을 지원합니다. 평가를 사용하면 GenAI 애플리케이션을 더 안정적으로 반복 개선할 수 있습니다. Evaluation 클래스는 다음을 수행합니다:
Dataset에서Model의 성능을 평가합니다- 맞춤형 채점 함수를 적용합니다
- 상세한 성능 보고서를 생성합니다
- 모델 버전 간 비교를 지원합니다
main 함수는 모든 데모를 실행합니다: