FreeLLMAPI est un proxy compatible OpenAI qui route les requêtes entre les offres gratuites de plusieurs fournisseurs LLM derrière un seul endpoint /v1. Le projet se présente comme un moyen de combiner des abonnements gratuits individuels en une surface d’inférence partagée pour des expérimentations personnelles.
Il prend en charge une longue liste d’intégrations de fournisseurs, ainsi que tout endpoint personnalisé compatible OpenAI comme llama.cpp, LM Studio, vLLM ou une instance Ollama locale. Le proxy gère le routage des modèles, la bascule automatique, le stockage chiffré des clés amont et un dashboard pour gérer les clés et consulter l’utilisation.