RAGアプリケーション向けの高速で軽量なテキストチャンキングライブラリ。
MIT
PDFやその他のドキュメントを高忠実度で解析するIBMのドキュメント理解ライブラリ。
LLM向けの非構造化データの前処理と変換のためのオープンソースライブラリ。
WebサイトをLLM対応Markdownに変換するWebスクレイピングAPI。