Eine URL tauschen. Prompts werden nie gespeichert. Bei Ausfall gehen Requests unverändert durch. Fail-Open by Default.
Ihr Code sendet LLM-Requests an CostGhost statt direkt an OpenAI/Anthropic. Eine Zeile ändern. Keine SDK-Änderung.
Edge-Klassifikation in <1ms. 23 Routing-Regeln, 5 Budget-Phasen und ein lernender Cache bestimmen das optimale Modell.
Niedrige Priorität? Haiku statt Opus. Kritisch? Bestes Modell, garantiert. Sie sparen bei Requests, die nie das teure Modell brauchten.
Client → CostGhost Gateway → Budget State Machine → Optimales Modell → Provider
Cloudflare Workers · Durable Objects · 300+ Edge-Locations · <5ms Routing
Prompts werden nie gespeichert. Audit-Logs enthalten nur Metadaten: Modell, Kosten, Latenz, Tenant-ID. Prompt-Logging ist explizites Opt-in.
60 automatisierte Tests garantieren das.
Bei DO-Timeout (>800ms): Request geht unverändert an den Provider. Budget-Kontrolle ist im Bypass deaktiviert — Verfügbarkeit vor Kostenkontrolle. BYPASS_GATEWAY=true deaktiviert CostGhost komplett. Per-Tenant konfigurierbar: Fail-Open (Default) oder Fail-Closed für strikte Budget-Einhaltung.
Default ist Fail-Open. Kein Produktionsrisiko.
X-CG-Mode: observation — kein Request wird verändert. CostGhost berechnet hypothetische Einsparungen asynchron im Hintergrund.
Risikoloser Proof of Concept. Null Impact.
Zwei API-Formate: /v1/chat/completions + /v1/messages. Routing nur innerhalb desselben Providers. Kein Cross-Provider-Format-Rewrite.
Kein Minimum. Kein Commitment. Keine versteckten Kosten.
Ihr LLM-Spend $10.000 CostGhost-Routing spart ~$3.000 (30%) Platform-Fee (5%) -$500 Netto-Ersparnis $2.500/Monat
Die 5% Fee gilt auf den gesamten Spend, der durch CostGhost geroutet wird. Nicht auf die Ersparnis.
// OpenAI — eine Zeile ändern:
const client = new OpenAI({
baseURL: "https://api.openai.com/v1"
baseURL: "https://gw.costghost.dev/v1"
});
// Anthropic — gleiche Idee:
const client = new Anthropic({
baseURL: "https://gw.costghost.dev"
});
// Optional: Priorität setzen
headers: { "X-CG-Priority": "low" }
Starten Sie mit Shadow Mode. Sehen Sie Ihre Ersparnis, bevor Sie sich entscheiden. Keine Kreditkarte.