カタログに戻る
📄
データ準備
ETL、チャンキング、ドキュメント処理ツール
タグで絞り込み:
並び替え:
5件中5件を表示
Firecrawl
24k
📄データ準備
WebサイトをLLM対応Markdownに変換するWebスクレイピングAPI。
typescriptスクレイピングmarkdownapi
Docling
18k
📄データ準備
PDFやその他のドキュメントを高忠実度で解析するIBMのドキュメント理解ライブラリ。
pythonibmpdfテーブル
Unstructured
10k
📄データ準備
LLM向けの非構造化データの前処理と変換のためのオープンソースライブラリ。
pythonパースetlドキュメント
Chonkie
3k
📄データ準備
RAGアプリケーション向けの高速で軽量なテキストチャンキングライブラリ。
pythonチャンキング高速軽量
LlamaParse
📄データ準備
テーブルや図を含む複雑なPDF向けのLlamaIndexによるドキュメント解析サービス。
saaspdfテーブルllamaindex