RAG カタログ
ホーム
🏗️RAGフレームワーク📊評価・最適化⚙️RAGエンジン📄データ準備🗄️ベクトルデータベース🧠エンベディングモデル📚リソース・チュートリアル
検索
カタログに戻る
📄

データ準備

ETL、チャンキング、ドキュメント処理ツール

タグで絞り込み:
並び替え:

5件中5件を表示

Firecrawl

24k
📄データ準備

WebサイトをLLM対応Markdownに変換するWebスクレイピングAPI。

typescriptスクレイピングmarkdownapi

Docling

18k
📄データ準備

PDFやその他のドキュメントを高忠実度で解析するIBMのドキュメント理解ライブラリ。

pythonibmpdfテーブル

Unstructured

10k
📄データ準備

LLM向けの非構造化データの前処理と変換のためのオープンソースライブラリ。

pythonパースetlドキュメント

Chonkie

3k
📄データ準備

RAGアプリケーション向けの高速で軽量なテキストチャンキングライブラリ。

pythonチャンキング高速軽量

LlamaParse

📄データ準備

テーブルや図を含む複雑なPDF向けのLlamaIndexによるドキュメント解析サービス。

saaspdfテーブルllamaindex

RAG カタログ

フレームワークGitHub