개요
통합 세부 정보
| Class | Package | Local | Serializable | JS support |
|---|---|---|---|---|
| OpenDataLoader PDF | langchain-opendataloader-pdf | ✅ | ❌ | ❌ |
로더 기능
| Source | Document Lazy Loading | Native Async Support |
|---|---|---|
| OpenDataLoaderPDFLoader | ✅ | ❌ |
OpenDataLoaderPDFLoader 컴포넌트는 PDF를 구조화된 Document 객체로 파싱할 수 있게 해줍니다.
요구 사항
- Python >= 3.9
- 시스템
PATH에서 사용 가능한 Java 11 이상 - opendataloader-pdf >= 1.1.1
설치
빠른 시작
매개변수
| Parameter | Type | Required | Default | Description |
|---|---|---|---|---|
file_path | List[str] | ✅ Yes | — | 처리할 하나 이상의 PDF 파일 경로 또는 디렉토리입니다. |
format | str | No | None | 출력 형식(예: "json", "html", "markdown", "text"). |
quiet | bool | No | False | True일 때 CLI 로깅 출력을 억제합니다. |
content_safety_off | Optional[List[str]] | No | None | 비활성화할 콘텐츠 안전 필터 목록(예: "all", "hidden-text", "off-page", "tiny", "hidden-ocg"). |
추가 리소스
- LangChain OpenDataLoader PDF 통합 GitHub
- LangChain OpenDataLoader PDF 통합 PyPI 패키지
- OpenDataLoader PDF GitHub
- OpenDataLoader PDF 홈페이지
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.