여러 무료 제공업체를 함께 연결
Google, Groq, Cerebras, NVIDIA, Mistral, OpenRouter, GitHub Models, Cohere, Cloudflare, HuggingFace, Z.ai, Ollama, Kilo, Pollinations, LLM7, OVH AI Endpoints, OpenCode Zen 등 여러 제공업체의 무료 요금을 하나의 OpenAI 호환 표면 아래로 통합합니다.
FreeLLMAPI는 여러 LLM 제공업체의 무료 요금을 하나의 /v1 엔드포인트로 연결하는 OpenAI 호환 프록시입니다. 개인 실험용으로 자동 장애 조치, 암호화된 업스트림 키 저장, 내장 관리자 대시보드를 제공합니다.
FreeLLMAPI는 단일 /v1 엔드포인트 뒤에서 여러 LLM 제공업체의 무료 요금제를 가로질러 요청을 라우팅하는 OpenAI 호환 프록시입니다. 이 프로젝트는 개인 실험용으로 개별 무료 플랜을 하나의 공유 추론 표면으로 결합하는 방법으로 자신을 소개합니다.
여러 제공업체 통합은 물론 llama.cpp, LM Studio, vLLM, 로컬 Ollama 인스턴스 같은 임의의 OpenAI 호환 엔드포인트도 지원합니다. 이 프록시는 모델 라우팅, 자동 장애 조치, 업스트림 키의 암호화 저장, 키 관리와 사용량 검토를 위한 대시보드를 처리합니다.
Google, Groq, Cerebras, NVIDIA, Mistral, OpenRouter, GitHub Models, Cohere, Cloudflare, HuggingFace, Z.ai, Ollama, Kilo, Pollinations, LLM7, OVH AI Endpoints, OpenCode Zen 등 여러 제공업체의 무료 요금을 하나의 OpenAI 호환 표면 아래로 통합합니다.
각 요청에 대해 모델을 선택하는 라우터를 사용하며, 속도 제한에 걸리거나 429/5xx를 반환하거나 시간 초과가 발생하면 다음 제공업체로 폴백하고, 실패한 키에는 짧은 쿨다운을 유지합니다.
제공업체, 모델, 키별로 RPM, RPD, TPM, TPD를 추적하며, 여러 턴의 대화 중에는 약 30분 동안 같은 모델에 스티키 세션을 유지합니다.
제공업체 API 키를 SQLite에 AES-256-GCM으로 암호화해 저장하고, 클라이언트는 하나의 통합 베어러 토큰으로 프록시에 인증합니다.
/v1/chat/completions, /v1/models, /v1/responses, /v1/embeddings, 스트리밍, 비스트리밍, OpenAI 스타일 도구 호출을 호환 클라이언트에 제공합니다.
키 관리, 폴백 체인 정렬, 분석 확인, 플레이그라운드에서 프롬프트 실행을 위한 React + Vite 관리자 대시보드를 포함합니다.
OpenAI SDK, LangChain, LlamaIndex, Continue 또는 유사한 클라이언트를 프록시에 연결하고, 업스트림 경로를 /v1로 바꾸면서 동일한 애플리케이션 코드를 유지합니다.
여러 무료 요금제 서비스의 제공업체 키를 추가한 뒤 라우터가 사용 가능한 모델을 선택하도록 하고, 제공업체가 제한되거나 사용 불가할 때 자동으로 폴백합니다.
Docker Compose 설정을 로컬이나 소형 서버에서 실행해 API, 대시보드, SQLite 데이터를 하나의 자체 호스팅 환경에 유지합니다.
관리자 대시보드로 폴백 체인을 재정렬하고, 지연 시간과 토큰 사용량을 확인하며, 클라이언트를 프록시에 연결하기 전에 프롬프트를 테스트합니다.
LM Studio, llama.cpp, vLLM, 로컬 Ollama 같은 커스텀 OpenAI 호환 백엔드를 동일한 통합 라우터를 통해 연결합니다.
FreeLLMAPI는 OpenAI 호환 클라이언트와 함께 작동하도록 설계되었습니다. README에서는 base URL을 변경하면 OpenAI SDK나 LangChain, LlamaIndex, Continue, Hermes 같은 호환 클라이언트를 프록시에 연결할 수 있다고 설명합니다.
Docker 가이드에 따르면 개인 사용에는 Docker Compose로 실행하는 것이 권장됩니다. API와 대시보드를 하나의 프로세스로 포트 3001에서 제공하며, SQLite는 이름 있는 볼륨에 유지됩니다.
README에 따르면 이 프록시는 /v1/chat/completions, /v1/models, /v1/responses, /v1/embeddings, 스트리밍 및 비스트리밍 응답, 그리고 OpenAI 스타일 도구 호출을 구현합니다. 이미지 생성, 오디오, 레거시 completions, moderation, 요청당 여러 completions, 사용자별 청구는 구현하지 않습니다.
이 프로젝트는 단일 사용자 설정을 중심으로 만들어졌습니다. README에서는 사용자별 청구와 멀티테넌트 인증이 아직 지원되지 않는다고 명시합니다.
DDS Hub is an AI API platform for Claude and OpenAI-family model workflows, with token-based pricing, model selection, and Claude Code setup guidance. It is aimed at developers who want API access, usage-based billing, and basic troubleshooting in one place.
NavtoAI API is a unified AI API gateway that lets developers and teams route requests across 200+ models through one account and one API shape. The collected pages also show API key usage lookup, routing controls, and centralized management for keys, quota, billing, users, and observability.
EvoLink is an AI model API platform that gives developers one OpenAI-compatible endpoint for accessing text, image, video, and music models from multiple providers. It is positioned for production apps, agents, and workflows that need model comparison, routing, and usage-based access.
ZenMux is an enterprise LLM platform with a unified API for multiple model providers, automatic prompt-based routing, and usage-based or subscription pricing. It is aimed at developers and teams building AI applications that need multi-model access, cost visibility, and compensation for certain model failures.
Kie.ai is a developer-focused AI API platform for accessing chat, image, video, and music models through one interface. It combines model browsing, API keys, billing, usage logs, and per-model pricing for integration-focused workflows.
AIHubMix is a developer-oriented AI gateway for routing requests through a single API across multiple model families, including ChatGPT, Claude, Gemini, DeepSeek, Doubao, and Qwen. The site also states support for unlimited concurrency.