Budget & Kontingent
Jede Lizenz beinhaltet ein monatliches Nutzungskontingent für KI-Anfragen. So hat jeder im Workspace fairen Zugang zu allen verfügbaren KI-Modellen, von den sparsamen bis zu den leistungsstärksten.
Die allermeisten Nutzer kommen nie an ihr Kontingent. Spürbar wird die Grenze in der Praxis nur bei besonders intensiver Nutzung der teuersten Premium-Modelle.
Kontingent pro Lizenz
Abschnitt betitelt „Kontingent pro Lizenz“Jede Lizenz hat ein eigenes monatliches Kontingent. Je höher der Lizenztier, desto mehr Spielraum:
| Lizenz | Kontingent (Multiplikator) |
|---|---|
| Pro | 1x (Basis) |
| Business | 3x |
| Max | 20x |
| Enterprise | Individuell |
Wir setzen die Kontingente bewusst großzügig an. Konkret ist das Limit pro Lizenz so gewählt, dass die Token-Kosten der KI-Anbieter den Lizenzpreis nicht überschreiten. Die meisten Nutzer reizen ihr Kontingent selten aus. So funktioniert das Modell wirtschaftlich für beide Seiten: Du hast genug Spielraum für deinen Alltag und wir können den Service zu einem fairen Preis dauerhaft anbieten.
Das Kontingent wird am 1. jedes Monats zurückgesetzt.
Warum keine harte Anfragezahl? Eine Zahl wie „X Anfragen pro Monat” wäre trügerisch. Eine einzige lange Analyse mit einem Spitzenmodell kann so viel Kontingent verbrauchen wie mehrere hundert kurze Alltagsfragen mit einem sparsamen Modell. Statt einer Zahl, die in der Praxis nicht trägt, siehst du in der Nutzungsanalyse jederzeit den realen Verbrauch deines Workspaces.
Modellwahl beeinflusst den Verbrauch
Abschnitt betitelt „Modellwahl beeinflusst den Verbrauch“Nicht jede KI-Anfrage verbraucht gleich viel Kontingent. Im Modell-Selector und in den Modell-Einstellungen siehst du bei jedem Modell eine Kostenkategorie:
| Kategorie | Bedeutung |
|---|---|
| € | Sparsam, gut für einfache Aufgaben und Routineanfragen |
| €€ | Ausgewogen, gute Balance aus Qualität und Verbrauch |
| €€€ | Hohe Qualität, deutlich höherer Kontingentverbrauch pro Anfrage |
| €€€€ | Spitzenklasse, sehr hoher Kontingentverbrauch pro Anfrage |
Das Prinzip: Premium-Modelle (€€€ und €€€€) liefern die besten Ergebnisse, verbrauchen aber deutlich mehr Kontingent pro Anfrage als sparsame Modelle. Wer regelmäßig mit den teuersten Modellen arbeitet, erschöpft sein Kontingent entsprechend schneller.
Tipp: Für alltägliche Aufgaben reicht oft ein €- oder €€-Modell. Greife zu €€€- und €€€€-Modellen, wenn höchste Qualität wirklich zählt, etwa bei komplexen Analysen, anspruchsvollen Coding-Aufgaben oder besonders sensiblen Texten.
Budget-Sharing im Team
Abschnitt betitelt „Budget-Sharing im Team“Kontingente werden innerhalb des Workspaces geteilt. Das bedeutet:
- Nutzer, die weniger verbrauchen, geben automatisch Spielraum für Kollegen mit höherem Bedarf
- Ein einzelner Nutzer kann bis zu 200% seines eigenen Lizenzkontingents nutzen, solange das Gesamtbudget des Workspaces dies hergibt
- So wird sichergestellt, dass ungenutztes Kontingent nicht verfällt, sondern dem Team zugutekommt
Anpassung auf Anfrage: Die 200%-Grenze ist ein Standardwert, der für die meisten Workspaces gut passt. Reicht sie für einzelne Power-User in deinem Team nicht aus, oder möchtest du sie umgekehrt enger ziehen, um den Verbrauch fester zu deckeln, können wir den Wert pro Kunde individuell anpassen. Wende dich dafür an deinen Ansprechpartner bei 9brains.
Kostenbegrenzung pro Agent
Abschnitt betitelt „Kostenbegrenzung pro Agent“Mit der Agenten-Plattform lassen sich Aufgaben auch autonom (per Cron oder Webhook) ausführen. Damit ein Agent niemals unbemerkt mehr Kontingent verbraucht als gewollt, hat jeder Agent eine eigene monatliche Kostenbegrenzung als Sicherheitsnetz. Bei Erreichen pausiert der Agent automatisch und der Owner wird per Mail informiert.
Voreingestellt sind €10/Monat, für die meisten Anwendungsfälle komfortabel. Den Wert kannst du pro Agent jederzeit anpassen: nach oben für leistungshungrigere Agenten, nach unten für eine noch engere Absicherung.
Pro Agent konfigurierbar:
- Monatliche Kostenbegrenzung: Owner und Administratoren können den Wert ändern
- Frühwarnung bei Auslastung: Mail-Benachrichtigung bei zum Beispiel 80 % Verbrauch
- Erlaubte Modelle: zum Beispiel nur sparsame Modelle erlauben, keine Premium-Modelle für High-Volume-Crons
- Auto-Pause bei 3 Fehlern in Folge: schützt vor „davonlaufenden” Konfigurationen
Auf welches Kontingent ein Run gebucht wird, hängt von der Sichtbarkeit des Agenten ab:
- Persönliche Agenten (nur der Owner sieht sie): Verbrauch geht auf das persönliche Kontingent des Owners
- Geteilte Agenten (Gruppe oder Workspace): Verbrauch geht auf das Workspace-Kontingent, auch bei Chat-Runs, weil ein geteilter Agent per Definition Team-Ressource ist
Administratoren sehen unter Einstellungen → Nutzungsanalyse → Agenten eine Übersicht aller Agenten mit Verbrauch, Begrenzung und Status. Sie können die Begrenzung pro Agent gezielt überstimmen.
Verbrauch pro Nutzer steuern
Abschnitt betitelt „Verbrauch pro Nutzer steuern“Als Admin steuerst du den Verbrauch im Workspace gezielt dort, wo er entsteht. Drei Stellschrauben stehen dir zur Verfügung:
- Lizenzwahl pro Person in der Benutzerverwaltung. Pro, Business oder Max bestimmen das Basiskontingent und welche Features (Agenten, Integrationen, API) freigeschaltet sind.
- Agenten-Kostenbegrenzung pro Agent in der Nutzungsanalyse. Du kannst die monatliche Begrenzung pro Agent als Override setzen und zusätzlich die erlaubten Modelle pro Agent einschränken, zum Beispiel nur sparsame Modelle für High-Volume-Crons.
- Workspace-Cap als globale Obergrenze (Standard 200 %, auf Anfrage anpassbar), siehe Budget-Sharing im Team.
Welche Bremse greift wann?
Abschnitt betitelt „Welche Bremse greift wann?“Im Workspace gibt es mehrere unabhängige Bremsen, die den Verbrauch absichern. Sie wirken getrennt voneinander, das ist der häufigste Punkt, an dem die Frage entsteht „Mein Budget ist doch erhöht, warum läuft mein Agent trotzdem nicht?”. Die folgende Tabelle macht das Mapping eindeutig:
| Bremse | Wann sie greift | Was passiert | Was du tun kannst |
|---|---|---|---|
| Workspace-Kontingent erschöpft | Wenn der monatliche Workspace-Pool aller Lizenzen aufgebraucht ist | Sparmodus für alle Nutzer: günstige Modelle laufen weiter, Premium-Modelle sind bis zum nächsten Reset deaktiviert | Guthaben nachkaufen, Lizenz upgraden oder bis zum 1. des Folgemonats warten |
| Agent-Kostenbegrenzung erreicht | Wenn der monatliche Verbrauch eines einzelnen Agenten seine eigene Begrenzung erreicht (Standard €10) | Der Agent pausiert komplett, Owner und Admin werden per Mail informiert. Andere Agenten und der Chat laufen weiter | Begrenzung im Tab Modelle & Kosten erhöhen, oder bis Monatsende warten. Admins können den Wert in der Nutzungsanalyse überstimmen |
| Auto-Pause nach drei Fehlern in Folge | Wenn ein autonom getriggerter Agent dreimal hintereinander mit einem Fehler endet | Der Agent pausiert, weitere Cron- und Webhook-Runs werden nicht ausgeführt. Chat-Runs sind davon nicht betroffen | Ursache in der Run-Historie prüfen, Konfiguration anpassen und Agent im Tab Allgemein wieder aktivieren |
| Tageslimit in der Testphase | Während der 7-tägigen Testphase, wenn das tägliche Kontingent erreicht ist | Harte Grenze: neue KI-Anfragen pausieren bis zum Tagesreset | Bis zum nächsten Tag warten oder eine Lizenz buchen |
Praktische Konsequenz: Eine Erhöhung deines persönlichen Anteils am Workspace-Pool hilft nicht, wenn ein einzelner Agent seine eigene Kostenbegrenzung erreicht hat. Beides sind getrennte Stellschrauben. Wenn ein Agent unerwartet pausiert, schau zuerst auf die Agenten-Kostenbegrenzung im Tab Modelle & Kosten und auf den Status in der Nutzungsanalyse.
Was passiert bei Erschöpfung?
Abschnitt betitelt „Was passiert bei Erschöpfung?“Auch wenn das Kontingent aufgebraucht ist, bleibst du arbeitsfähig:
- Du chattest weiter, allerdings nur noch mit den günstigen Modellen. Diese decken die allermeisten Alltagsanfragen problemlos ab.
- Die teuren Premium-Modelle bleiben bis zum nächsten Kontingent-Reset deaktiviert. Im Modell-Selektor erscheinen sie ausgegraut, mit einem Hinweis, ab wann sie wieder verfügbar sind.
- Die Plattform bleibt vollständig nutzbar: Wissensmanagement, Einstellungen und bestehende Chats lesen sind ohne Einschränkung möglich.
- In der linken Seitenleiste erscheint ein Statushinweis mit dem Reset-Datum.
Wenn du sofort wieder zu den Premium-Modellen greifen willst, hast du zwei Optionen:
- Guthaben nachkaufen, um sofort weiterzuarbeiten
- Auf eine höhere Lizenz upgraden, für dauerhaft mehr Kontingent (zum Beispiel von Pro auf Business oder Max)
Andernfalls werden die Premium-Modelle automatisch am 1. des Monats wieder freigeschaltet, wenn das Kontingent zurückgesetzt wird.
Hinweis zu autonomen Agenten: Cron- oder Webhook-Agenten laufen in diesem Zustand nur weiter, wenn sie ohnehin auf eines der günstigen Modelle konfiguriert sind. Steht beim Agenten ein Premium-Modell, pausiert er bis zum nächsten Reset oder bis du das Modell anpasst. Mehr dazu unter Kostenbegrenzung pro Agent.
Guthaben
Abschnitt betitelt „Guthaben“Guthaben sind zusätzliches Kontingent, das du bei Bedarf als Einmalkauf erwerben kannst.
- Guthaben wird erst verbraucht, wenn das reguläre Monatskontingent erschöpft ist
- Nicht verbrauchtes Guthaben verfällt nicht, es steht im nächsten Monat weiterhin zur Verfügung
- Administratoren können Guthaben unter Abrechnung erwerben
Guthaben eignen sich besonders für Monate mit erhöhtem Bedarf, etwa bei Projekten, Quartalsabschlüssen oder wenn neue Mitarbeiter die Plattform intensiv kennenlernen.