Skip to main content
Amazon Athena는 오픈소스 프레임워크를 기반으로 구축된 서버리스 대화형 분석 서비스로, 오픈 테이블 및 파일 형식을 지원합니다. Athena는 데이터가 있는 곳에서 페타바이트급 데이터를 분석할 수 있는 간소화되고 유연한 방법을 제공합니다. Amazon Simple Storage Service(S3) 데이터 레이크와 온프레미스 데이터 소스 또는 다른 클라우드 시스템을 포함한 30개의 데이터 소스에서 SQL 또는 Python을 사용하여 데이터를 분석하거나 애플리케이션을 구축할 수 있습니다. Athena는 오픈소스 TrinoPresto 엔진과 Apache Spark 프레임워크를 기반으로 구축되었으며, 프로비저닝이나 구성 작업이 필요하지 않습니다.
이 노트북에서는 AWS Athena에서 문서를 로드하는 방법을 다룹니다.

설정

AWS 계정 설정 지침을 따르세요. Python 라이브러리를 설치합니다:
! pip install boto3

예제

from langchain_community.document_loaders.athena import AthenaLoader
database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
)

documents = loader.load()
print(documents)
메타데이터 컬럼을 사용하는 예제
database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"
metadata_columns = ["_row", "_created_at"]

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
    metadata_columns=metadata_columns,
)

documents = loader.load()
print(documents)

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I