PDFやその他のドキュメントを高忠実度で解析するIBMのドキュメント理解ライブラリ。
MIT
テーブルや図を含む複雑なPDF向けのLlamaIndexによるドキュメント解析サービス。
LLM向けの非構造化データの前処理と変換のためのオープンソースライブラリ。
RAGアプリケーション向けの高速で軽量なテキストチャンキングライブラリ。