기본 예제
평가자 인자
코드 평가자 함수는 특정 인자 이름을 가져야 합니다. 다음 인자들 중 일부를 사용할 수 있습니다:run: Run: 주어진 예제에 대해 애플리케이션이 생성한 전체 Run 객체입니다.example: Example: 예제 입력, 출력(사용 가능한 경우), 메타데이터(사용 가능한 경우)를 포함한 전체 데이터셋 Example입니다.inputs: dict: 데이터셋의 단일 예제에 해당하는 입력의 딕셔너리입니다.outputs: dict: 주어진inputs에 대해 애플리케이션이 생성한 출력의 딕셔너리입니다.reference_outputs/referenceOutputs: dict: 예제와 연관된 참조 출력의 딕셔너리입니다(사용 가능한 경우).
inputs, outputs, reference_outputs만 필요합니다. run과 example은 애플리케이션의 실제 입력과 출력 외에 추가 추적 정보나 예제 메타데이터가 필요한 경우에만 유용합니다.
JS/TS를 사용할 때는 이들 모두를 단일 객체 인자의 일부로 전달해야 합니다.
평가자 출력
코드 평가자는 다음 타입 중 하나를 반환해야 합니다: Python 및 JS/TSdict:{"score" | "value": ..., "key": ...}형태의 딕셔너리를 사용하면 지표 타입(수치형은 “score”, 범주형은 “value”)과 지표 이름을 커스터마이징할 수 있습니다. 예를 들어 정수를 범주형 지표로 기록하고 싶을 때 유용합니다.
int | float | bool: 평균화, 정렬 등이 가능한 연속형 지표로 해석됩니다. 함수 이름이 지표 이름으로 사용됩니다.str: 범주형 지표로 해석됩니다. 함수 이름이 지표 이름으로 사용됩니다.list[dict]: 단일 함수를 사용하여 여러 지표를 반환합니다.
추가 예제
langsmith>=0.2.0 필요
관련 항목
- 집계된 실험 결과 평가: 전체 실험에 대한 지표를 계산하는 요약 평가자를 정의합니다.
- 두 실험을 비교하는 평가 실행: 둘 이상의 실험을 서로 비교하여 지표를 계산하는 쌍별 평가자를 정의합니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.