跨供應商的 OpenAI 風格存取
透過相容 OpenAI 的介面呼叫 100+ 個 LLM,並將這些呼叫轉譯為各供應商特定的 endpoints,例如 chat completions、responses、embeddings、images、audio 與 batches。
LiteLLM 是一個 developer platform,可透過 Python SDK 或 proxy server 呼叫與管理大型語言模型。其核心目的是提供相容 OpenAI 的介面,並在背後將請求轉譯到多個供應商專屬的 endpoints。
文件將 LiteLLM 描述為支援 100+ 個模型與多種 endpoint 類型,包括 chat completions、responses、embeddings、images、audio、batches、routing,以及以 proxy 為基礎的 gateway workflows。這使它很適合需要單一存取層來使用多供應商 LLM、追蹤成本與管理請求的團隊。
透過相容 OpenAI 的介面呼叫 100+ 個 LLM,並將這些呼叫轉譯為各供應商特定的 endpoints,例如 chat completions、responses、embeddings、images、audio 與 batches。
將 proxy 作為集中式 LLM gateway 使用,提供 authentication 與 authorization、virtual keys,以及用於監控與管理的 admin dashboard。
依 project 與 user 追蹤支出、設定 budgets,並套用 per-project 自訂功能,例如 logging、guardrails 與 caching。
透過 retry 與 fallback 邏輯在各部署之間路由請求,包含 cooldowns、timeouts、queueing,以及跨 Azure、OpenAI 與其他供應商的 load balancing 支援。
透過 proxy 提供多種支援的介面,包括 chat completions、embeddings、image generation、RAG endpoints、guardrails、memory 與其他供應商特定 endpoints。
整合 Lunary、MLflow 與 Langfuse 等 observability callbacks,並使用相容 OpenAI 的錯誤來進行應用層處理。
當多個應用程式需要受控地存取共用模型供應商時,可將 proxy 作為中央 LLM gateway。文件強調此設定中的 authentication、authorization、virtual keys、admin monitoring 與 per-project policy controls。
當你希望將 LiteLLM 直接嵌入應用程式程式碼時,可使用 Python SDK。文件將此路徑定位為適合建立 LLM 專案、且不想操作獨立 proxy 的開發者。
當流量必須分散到同一 model alias 的多個部署時,可使用 Router。路由文件描述了 load balancing、retry、fallback、cooldowns、queueing,以及考量延遲或成本的策略選項。
當需要在團隊或專案之間追蹤支出並管理 budgets 時,可使用此平台。首頁提到 per-project 的支出追蹤與 budgets,而 proxy 文件則補充了多租戶成本管理與 user/project-level 控制。
當你需要透過單一介面存取多種供應商特定 endpoints 時,可使用 LiteLLM。支援的 endpoints 頁面顯示其範圍不只 chat,還包括 embeddings、images、audio、RAG、memory、guardrails 以及其他專門 API。
LiteLLM 可透過 Proxy Server 或直接使用 Python SDK。文件將這兩種方式視為同一產品的一部分,其中 proxy 定位為中央 LLM gateway,而 SDK 則適合直接在 Python 程式碼中使用。
文件強調 LiteLLM 會在維持 OpenAI 風格輸入與輸出格式的同時,將請求轉譯為各供應商特定的 endpoints。它支援 chat completions、responses、embeddings、images、audio、batches 等。
LiteLLM Router 可在多個同一 model alias 的部署之間進行 load balancing,並支援 retry、fallback、cooldowns、timeouts 與 queueing。proxy 文件也提到在生產環境中管理 token-per-minute 和 requests-per-minute 限制時,可使用基於 Redis 的 cooldown 與使用量追蹤。
蒐集到的來源沒有顯示公開價格資訊。pricing URL 回傳的是 page not found 訊息,因此應視為無法從提供的文件中確認 pricing。
proxy 被描述為適用於 GenAI enablement 和 ML platform 團隊,而 Python SDK 則適用於正在建立 LLM 專案的開發者。這表示此產品同時可支援集中式平台工作流程與直接的應用程式整合。
OpenAI is an AI research and deployment company centered on ChatGPT, the API, Platform tools, and Codex. The site helps individuals, developers, and businesses explore conversational AI, build with models, and follow product and research updates.
AakarDev AI helps teams manage AI provider access, project-level setups, logs, and analytics from one dashboard. It supports BYOK workflows and lists providers including OpenAI, Google Gemini, Anthropic, Groq, Mistral AI, and Perplexity AI.
DDS Hub 是一個支援 Claude 與 OpenAI 家族模型工作流程的 AI API 平台,提供 token 計價、模型選擇與 Claude Code 設定指引,方便開發者在同一處取得 API 存取、用量計費與基本疑難排解。
NavtoAI API is a unified AI API gateway that lets developers and teams route requests across 200+ models through one account and one API shape. The collected pages also show API key usage lookup, routing controls, and centralized management for keys, quota, billing, users, and observability.
EvoLink 是 AI 模型 API 平台,提供相容 OpenAI 的單一端點,讓開發者可存取多家供應商的文字、圖片、影片與音樂模型,適合正式應用、agents 與工作流程。
Happycapy is a browser-based agent platform that lets users run Claude Code, manage skills, and delegate tasks inside a secure sandbox. It offers a free tier plus paid plans for more automation, email handoff, and larger workloads.