Dataset은 프로그래밍 방식이나 UI를 통해 생성하고 사용할 수 있습니다.
이 페이지에서는 다음을 설명합니다:
- Python 및 TypeScript에서의 기본
Dataset오퍼레이션과 시작하는 방법 - Weave calls와 같은 객체로부터 Python 및 TypeScript에서
Dataset을 생성하는 방법 - UI에서
Dataset에 대해 사용할 수 있는 오퍼레이션
Dataset 퀵스타트
Dataset 오퍼레이션을 수행하는 방법을 보여줍니다. SDK를 사용하면 다음을 할 수 있습니다.
Dataset생성Dataset게시Dataset조회Dataset의 특정 예제에 접근
- Python
- TypeScript
다른 객체로 Dataset 만들기
- Python
- TypeScript
Python에서는 calls 같은 일반적인 Weave 객체나 그런 다음
pandas.DataFrame 같은 Python 객체로도 Dataset을 생성할 수 있습니다. 이 기능은 특정 예제들로 예시 Dataset을 만들고 싶을 때 유용합니다.Weave call
하나 이상의 Weave call에서Dataset을 만들려면 call 객체를 조회한 뒤, from_calls 메서드에 전달하는 목록에 추가합니다.Pandas DataFrame
PandasDataFrame 객체에서 Dataset을 만들려면 from_pandas 메서드를 사용합니다.다시 Dataset을 DataFrame으로 변환하려면 to_pandas를 사용합니다.Hugging Face Datasets
Hugging Facedatasets.Dataset 또는 datasets.DatasetDict 객체에서 Dataset을 만들려면 먼저 필요한 의존성이 설치되어 있는지 확인합니다:from_hf 메서드를 사용합니다. 여러 split(‘train’, ‘test’, ‘validation’ 등)이 포함된 DatasetDict를 제공하면 Weave는 자동으로 ‘train’ split을 사용하고 경고를 표시합니다. ‘train’ split이 없으면 오류가 발생합니다. 특정 split을 직접 제공할 수도 있습니다(예: hf_dataset_dict['test']).weave.Dataset을 다시 Hugging Face Dataset으로 변환하려면 to_hf 메서드를 사용합니다.UI에서 Dataset 생성, 수정 및 삭제
Dataset을 생성, 수정 및 삭제할 수 있습니다. Weave UI에서 데이터셋을 생성하면 코드를 편집하지 않고도 귀하와 팀의 비엔지니어링 구성원이 예시, 질문 및 기타 에이전트 테스트 데이터가 포함된 공유 가능한 데이터셋을 만들고 큐레이션할 수 있습니다.
새 Dataset 만들기
- 수정하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새
Dataset을 만들 call을 하나 이상 선택합니다. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 있음)을 클릭합니다.
- Choose a dataset 드롭다운에서 Create new를 선택합니다. 그러면 Dataset name 필드가 나타납니다.
-
Dataset name 필드에 데이터셋 이름을 입력합니다. 그러면 Configure dataset fields 옵션이 표시됩니다.
Dataset 이름은 문자 또는 숫자로 시작해야 하며, 문자, 숫자, 하이픈(-), 밑줄(_)만 포함할 수 있습니다.
-
(선택 사항) Configure dataset fields에서 데이터셋에 포함할 call의 필드를 선택합니다.
- 선택한 각 필드의 열 이름을 사용자 지정할 수 있습니다.
- 새
Dataset에 포함할 필드 일부만 선택하거나, 모든 필드의 선택을 해제할 수 있습니다.
-
데이터셋 필드 설정을 마치면 Next를 클릭합니다. 새
Dataset의 미리보기가 표시됩니다. - (선택 사항) Dataset에서 편집 가능한 필드를 클릭해 항목을 수정합니다.
- Create dataset을 클릭합니다. 새 데이터셋이 생성됩니다.
-
확인 팝업에서 View the dataset을 클릭해 새
Dataset을 확인합니다. 또는 Datasets 탭으로 이동합니다.
Dataset 편집
-
편집할
Dataset이 있는 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset이 표시됩니다.
-
객체 열에서 편집할
Dataset의 이름과 버전을 클릭합니다. 이름, 버전, 작성자,Dataset행 등Dataset정보가 표시되는 팝아웃 모달이 나타납니다.
-
모달 오른쪽 상단에서 Edit dataset 버튼(연필 아이콘)을 클릭합니다. 모달 하단에 + Add row 버튼이 표시됩니다.

-
+ Add row를 클릭합니다. 기존
Dataset행 위에 초록색 행이 표시되며,Dataset에 새 행을 추가할 수 있음을 나타냅니다.
-
새 행에 데이터를 추가하려면 해당 행에서 원하는 열을 클릭합니다.
Dataset행의 기본 id 열은 Weave가 생성 시 자동으로 할당하므로 편집할 수 없습니다. 서식 지정을 위한 Text, Code, Diff 옵션이 있는 편집 모달이 나타납니다.
-
새 행에서 데이터를 추가하려는 각 열에 대해 6단계를 반복합니다.

-
Dataset에 추가하려는 각 행에 대해 5단계를 반복합니다. -
편집이 끝나면 모달 오른쪽 상단의 Publish를 클릭해
Dataset을 게시합니다. 변경 사항을 게시하지 않으려면 Cancel을 클릭합니다. 게시가 완료되면 업데이트된 행이 포함된 새 버전의
Dataset을 UI에서 사용할 수 있습니다.

Dataset 삭제
-
수정하려는
Dataset이 있는 Weave 프로젝트로 이동합니다. -
사이드바에서 Datasets를 선택합니다. 사용 가능한
Dataset이 표시됩니다. -
객체 열에서 삭제하려는
Dataset의 이름과 버전을 클릭합니다. 이름, 버전, 작성자,Dataset행 등Dataset정보가 표시된 팝아웃 모달이 나타납니다. -
모달 오른쪽 상단에서 휴지통 아이콘을 클릭합니다.
Dataset삭제를 확인하는 팝업 모달이 나타납니다.
-
팝업 모달에서 빨간색 Delete 버튼을 클릭해
Dataset을 삭제합니다.Dataset을 삭제하지 않으려면 Cancel을 클릭합니다. 이제Dataset이 삭제되며, Weave 대시보드의 Datasets 탭에 더 이상 표시되지 않습니다.
Dataset에 새 예제 추가
- 편집하려는 Weave 프로젝트로 이동합니다.
- 사이드바에서 Traces를 선택합니다.
-
새 예제를 만들
Datasets가 있는 call을 하나 이상 선택합니다. - 오른쪽 상단 메뉴에서 Add selected rows to a dataset 아이콘(휴지통 아이콘 옆에 있음)을 클릭합니다. 필요하면 Show latest versions를 꺼서 사용 가능한 모든 데이터셋의 전체 버전을 표시합니다.
-
Choose a dataset 드롭다운에서 예제를 추가할
Dataset을 선택합니다. 그러면 Configure field mapping 옵션이 표시됩니다. - (선택 사항) Configure field mapping에서 call의 필드를 해당 데이터셋 열에 매핑하는 방식을 조정할 수 있습니다.
-
필드 매핑 구성을 마치면 Next를 클릭합니다. 새
Dataset의 미리보기가 표시됩니다. - 빈 행(초록색)에 새 예제 값을 추가합니다. id 필드는 편집할 수 없으며 Weave가 자동으로 생성한다는 점에 유의하세요.
- Add to dataset을 클릭합니다. 또는 Configure field mapping 화면으로 돌아가려면 Back을 클릭합니다.
-
확인 팝업에서 View the dataset을 클릭해 변경 사항을 확인합니다. 또는 Datasets 탭으로 이동해
Dataset의 업데이트를 확인합니다.
기타 데이터셋 오퍼레이션
- Python
- TypeScript