evaluate() / aevaluate()에 upload_results=False를 전달하면 이를 수행할 수 있습니다.
이렇게 하면 애플리케이션과 평가자가 평소와 똑같이 실행되고 동일한 출력을 반환하지만, LangSmith에는 아무것도 기록되지 않습니다. 이는 실험 결과뿐만 아니라 애플리케이션과 평가자 추적도 포함됩니다.
예제
예제를 살펴보겠습니다:langsmith>=0.2.0이 필요합니다. 예제에서는 pandas도 사용합니다.
| inputs.question | outputs.answer | reference.answer | feedback.is_concise | |
|---|---|---|---|---|
| 0 | What is the largest mammal? | What is the largest mammal? is a good question. I don’t know the answer. | The blue whale | False |
| 1 | What do mammals and birds have in common? | What do mammals and birds have in common? is a good question. I don’t know the answer. | They are both warm-blooded | False |
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.