평가 개념
LangSmith에서 평가가 작동하는 방식을 이해하기 위한 핵심 용어와 개념을 살펴보세요.
데이터셋 관리
UI 또는 SDK를 통해 평가용 데이터셋을 생성하고 관리하세요.
평가 실행
다양한 평가자와 기법을 활용하여 애플리케이션을 평가하고 품질을 측정하세요.
결과 분석
평가 결과를 확인 및 분석하고, 실험을 비교하며, 데이터를 필터링하고, 결과를 내보내세요.
피드백 수집
주석 큐와 출력에 대한 인라인 주석을 통해 사람의 피드백을 수집하세요.
튜토리얼 따라하기
간단한 챗봇부터 복잡한 에이전트 평가까지 단계별 튜토리얼을 따라 학습하세요.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.