Skip to main content
MHTML은 이메일과 아카이브된 웹페이지 모두에 사용됩니다. MHT라고도 하는 MHTML은 MIME HTML의 약자로, 전체 웹페이지가 아카이브된 단일 파일입니다. 웹페이지를 MHTML 형식으로 저장하면 이 파일 확장자에는 HTML 코드, 이미지, 오디오 파일, 플래시 애니메이션 등이 포함됩니다.
from langchain_community.document_loaders import MHTMLLoader
# Create a new loader object for the MHTML file
loader = MHTMLLoader(
    file_path="../../../../../../tests/integration_tests/examples/example.mht"
)

# Load the document from the file
documents = loader.load()

# Print the documents to see the results
for doc in documents:
    print(doc)
page_content='LangChain\nLANG CHAIN 🦜️🔗Official Home Page\xa0\n\n\n\n\n\n\n\nIntegrations\n\n\n\nFeatures\n\n\n\n\nBlog\n\n\n\nConceptual Guide\n\n\n\n\nPython Repo\n\n\nJavaScript Repo\n\n\n\nPython Documentation \n\n\nJavaScript Documentation\n\n\n\n\nPython ChatLangChain \n\n\nJavaScript ChatLangChain\n\n\n\n\nDiscord \n\n\nTwitter\n\n\n\n\nIf you have any comments about our WEB page, you can \nwrite us at the address shown above.  However, due to \nthe limited number of personnel in our corporate office, we are unable to \nprovide a direct response.\n\nCopyright © 2023-2023 LangChain Inc.\n\n\n' metadata={'source': '../../../../../../tests/integration_tests/examples/example.mht', 'title': 'LangChain'}

Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.
I