다중 턴 대화 테스트하기

이 가이드에서는 다중 턴 대화를 위한 플레이그라운드 설정 방법을 안내합니다. 이를 통해 긴 메시지 스레드에 대해 다양한 도구 구성과 시스템 프롬프트를 테스트할 수 있습니다.

기존 실행에서 시작하기

먼저 다중 턴 대화를 적절히 추적했는지 확인한 후, 추적 프로젝트로 이동합니다. 추적 프로젝트에 들어간 후 다음과 같이 실행을 열고 LLM 호출을 선택한 다음 플레이그라운드에서 엽니다:

그런 다음 시스템 프롬프트를 편집하고 도구 및/또는 출력 스키마를 조정하여 다중 턴 대화의 출력이 어떻게 변하는지 관찰할 수 있습니다.

데이터셋에서 시작하기

시작하기 전에 데이터셋을 설정했는지 확인하세요. 다중 턴 대화를 평가하려면 입력에 메시지 목록을 포함하는 키가 있어야 합니다. 데이터셋을 생성한 후 플레이그라운드로 이동하여 평가를 위해 데이터셋을 로드합니다. 그런 다음 프롬프트에 메시지 목록 변수를 추가하되, 메시지 목록을 포함하는 입력의 키와 동일한 이름을 지정해야 합니다:

프롬프트를 실행하면 각 예제의 메시지가 ‘Messages List’ 변수 자리에 목록으로 추가됩니다.

수동으로 생성하기

다중 턴 대화를 수동으로 생성하는 방법은 두 가지입니다. 첫 번째 방법은 프롬프트에 메시지를 추가하는 것입니다:

이 방법은 빠른 반복에 유용하지만 다중 턴 대화가 하드코딩되어 있어 유연하지 않습니다. 대신 프롬프트가 모든 다중 턴 대화에서 작동하도록 하려면 ‘Messages List’ 변수를 추가하고 여기에 다중 턴 대화를 추가할 수 있습니다:

이렇게 하면 시스템 프롬프트나 도구만 조정하면서 Messages List 변수 자리에 모든 다중 턴 대화를 배치할 수 있어 다양한 실행에서 이 프롬프트를 재사용할 수 있습니다.

다음 단계

이제 다중 턴 상호작용을 위한 플레이그라운드 설정 방법을 알게 되었으므로, 출력을 수동으로 검사하고 판단하거나 결과를 분류하기 위해 평가자를 추가할 수 있습니다. 또한 플레이그라운드를 사용하여 평가를 실행하는 방법에 대해 자세히 알아보려면 이 가이드들을 참조하세요.

Edit the source of this page on GitHub.

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.

Create and update prompts

Tutorials

다중 턴 대화 테스트하기

기존 실행에서 시작하기

데이터셋에서 시작하기

수동으로 생성하기

다음 단계

Create and update prompts

Tutorials

​기존 실행에서 시작하기

​데이터셋에서 시작하기

​수동으로 생성하기

​다음 단계

기존 실행에서 시작하기

데이터셋에서 시작하기

수동으로 생성하기

다음 단계