Azure Machine Learning은 머신러닝 모델을 구축, 학습 및 배포하는 데 사용되는 플랫폼입니다. 사용자는 다양한 공급자의 기본 및 범용 모델을 제공하는 모델 카탈로그에서 배포할 모델 유형을 탐색할 수 있습니다. 일반적으로 예측(추론)을 사용하려면 모델을 배포해야 합니다.이 노트북은Azure Machine Learning에서 온라인 엔드포인트는 실시간 서빙과 함께 이러한 모델을 배포하는 데 사용됩니다. 이들은 프로덕션 워크로드의 인터페이스를 이를 제공하는 구현에서 분리할 수 있는엔드포인트및배포개념을 기반으로 합니다.
Azure Machine Learning 엔드포인트에서 호스팅되는 채팅 모델을 사용하는 방법을 다룹니다.
설정
Azure ML에 모델을 배포하거나 Azure AI Foundry(이전 Azure AI Studio)에 배포하고 다음 매개변수를 가져와야 합니다:endpoint_url: 엔드포인트에서 제공하는 REST 엔드포인트 URLendpoint_api_type: 전용 엔드포인트(호스팅된 관리 인프라)에 모델을 배포할 때endpoint_type='dedicated'를 사용합니다. 종량제 제공(서비스로서의 모델)을 사용하여 모델을 배포할 때endpoint_type='serverless'를 사용합니다.endpoint_api_key: 엔드포인트에서 제공하는 API 키
콘텐츠 포매터
content_formatter 매개변수는 AzureML 엔드포인트의 요청과 응답을 필요한 스키마와 일치하도록 변환하는 핸들러 클래스입니다. 모델 카탈로그에는 광범위한 모델이 있고 각 모델은 서로 다르게 데이터를 처리할 수 있으므로, 사용자가 원하는 대로 데이터를 변환할 수 있도록 ContentFormatterBase 클래스가 제공됩니다. 다음 콘텐츠 포매터가 제공됩니다:
CustomOpenAIChatContentFormatter: 요청 및 응답에 대해 OpenAI API 사양을 따르는 LLaMa2-chat과 같은 모델의 요청 및 응답 데이터를 포맷합니다.
langchain.chat_models.azureml_endpoint.LlamaChatContentFormatter는 더 이상 사용되지 않으며 langchain.chat_models.azureml_endpoint.CustomOpenAIChatContentFormatter로 대체됩니다.
langchain_community.llms.azureml_endpoint.ContentFormatterBase 클래스에서 파생하여 모델에 특정한 사용자 정의 콘텐츠 포매터를 구현할 수 있습니다.
예제
다음 섹션에는 이 클래스를 사용하는 방법에 대한 예제가 포함되어 있습니다:예제: 실시간 엔드포인트를 사용한 채팅 완성
예제: 종량제 배포를 사용한 채팅 완성(서비스로서의 모델)
model_kwargs 인수를 사용하세요:
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.