評価・最適化に戻る

Phoenix (Arize)

4.5kスター

📊評価・最適化

トレーシング、評価、デバッグを備えたLLMアプリケーション向けオープンソースオブザーバビリティ。

タグ

pythonオブザーバビリティトレーシングデバッグ

機能

LLMトレーシング
評価
エンベディング可視化
プロンプト分析

ユースケース

LLMオブザーバビリティ
デバッグ
パフォーマンス監視

リンク

ウェブサイト GitHub

ライセンス

Elastic-2.0

関連アイテム

Langfuse

📊評価・最適化

トレーシング、プロンプト管理、評価のためのオープンソースLLMエンジニアリングプラットフォーム。

typescriptトレーシングアナリティクスオープンソース

RAGAS

📊評価・最適化

人手によるラベル付け回答なしでLLMを使用してレスポンス品質を評価する評価フレームワーク。

pythonメトリクスLLM評価自動化

DeepEval

📊評価・最適化

14以上の評価メトリクスとCI/CD統合を備えたLLM向けユニットテストフレームワーク。

pythonテストメトリクスci-cd