js-tiktoken
js-tiktoken은
OpenAI가 만든 BPE 토크나이저의 JavaScript 버전입니다.tiktoken으로 사용된 토큰을 추정할 수 있습니다. OpenAI 모델에는 더 정확할 것입니다.
- 텍스트 분할 방식: 전달된 문자 기준.
- 청크 크기 측정 방식:
tiktoken토크나이저 기준.
tiktoken으로 청크를 병합하려면 @[TokenTextSplitter]를 초기화할 때 encodingName(예: cl100k_base)을 전달하세요. 이 메서드로 분할한 결과는 tiktoken 토크나이저로 측정한 청크 크기보다 클 수 있습니다.
Connect these docs programmatically to Claude, VSCode, and more via MCP for real-time answers.