이 노트북은 대화형 노트북입니다. 로컬에서 실행하거나 아래 링크를 사용할 수 있습니다:
Weave로 통합하기: 프로덕션 대시보드
- Weave에서 트레이스, 비용, 피드백 및 기타 메트릭 가져오기
- 사용자 피드백과 비용 분포를 위한 집계 뷰 만들기
- 시간 경과에 따른 토큰 사용량 및 지연 시간 시각화 만들기
1. 설정
2. 구현
2.1 Weave 클라이언트 초기화 및 비용 정의
- 여러 일반적인 모델의 기본 비용은 이미 포함되어 있지만, 사용자 정의 비용과 맞춤형 모델도 쉽게 추가할 수 있습니다. 아래에서는 몇 가지 모델에 사용자 정의 비용을 추가하고, 나머지에는 기본 비용을 사용하는 방법을 보여드리겠습니다.
- 비용은 Weave의 각 call / calls에 대해 추적된 토큰을 기준으로 계산됩니다. 많은 LLM 벤더 라이브러리에서는 토큰 사용량을 자동으로 추적하지만, 어떤 call / calls이든 사용자 정의 토큰 수를 반환하도록 할 수도 있습니다. 맞춤형 모델의 토큰 수와 비용 계산을 정의하는 방법은 이 쿡북을 참조하세요 - custom cost cookbook.
2.2 Weave에서 calls 데이터 가져오기
- call / calls별로 데이터 가져오기
- 고수준 API 사용하기
2.2.1 call / calls별로 데이터 가져오기
calls_query_stream API를 사용하여 Weave에서 calls 데이터를 가져올 수 있습니다.
calls_query_streamAPI: 이 API를 사용하면 Weave에서 calls 데이터를 가져올 수 있습니다.filterdictionary: 이 dictionary에는 calls 데이터를 가져오기 위한 필터 매개변수가 포함됩니다. 자세한 내용은 여기를 참조하세요.expand_columnslist: 이 list에는 calls 데이터에서 확장할 column이 포함됩니다.sort_bylist: 이 list에는 calls 데이터의 정렬 매개변수가 포함됩니다.include_costsboolean: 이 boolean은 calls 데이터에 비용을 포함할지 여부를 나타냅니다.include_feedbackboolean: 이 boolean은 calls 데이터에 피드백을 포함할지 여부를 나타냅니다.
2.2.2 고수준 API 사용
query_costs API를 사용하겠습니다:
2.4 입력값 수집 및 시각화 생성
결론
- 데이터 입력:
- @weave-op() 데코레이터를 사용한 프레임워크 독립적 트레이싱과 CSV에서 call / calls를 임포트하는 기능(관련 임포트 쿡북 참조)
- 다양한 프로그래밍 프레임워크와 언어에서 Weave에 로그를 기록할 수 있는 서비스 API 엔드포인트. 자세한 내용은 여기를 참조하세요.
- 데이터 출력: