Budget & Kontingent

Jede Lizenz beinhaltet ein monatliches Nutzungskontingent für KI-Anfragen. So hat jeder im Workspace fairen Zugang zu allen verfügbaren KI-Modellen, von den sparsamen bis zu den leistungsstärksten.

Die allermeisten Nutzer kommen nie an ihr Kontingent. Spürbar wird die Grenze in der Praxis nur bei besonders intensiver Nutzung der teuersten Premium-Modelle.

Kontingent pro Lizenz

Jede Lizenz hat ein eigenes monatliches Kontingent. Je höher der Lizenztier, desto mehr Spielraum:

Lizenz	Kontingent (Multiplikator)
Pro	1x (Basis)
Business	3x
Max	20x
Enterprise	Individuell

Wir setzen die Kontingente bewusst großzügig an. Konkret ist das Limit pro Lizenz so gewählt, dass die Token-Kosten der KI-Anbieter den Lizenzpreis nicht überschreiten. Die meisten Nutzer reizen ihr Kontingent selten aus. So funktioniert das Modell wirtschaftlich für beide Seiten: Du hast genug Spielraum für deinen Alltag und wir können den Service zu einem fairen Preis dauerhaft anbieten.

Das Kontingent wird am 1. jedes Monats zurückgesetzt.

Warum keine harte Anfragezahl? Eine Zahl wie „X Anfragen pro Monat” wäre trügerisch. Eine einzige lange Analyse mit einem Spitzenmodell kann so viel Kontingent verbrauchen wie mehrere hundert kurze Alltagsfragen mit einem sparsamen Modell. Statt einer Zahl, die in der Praxis nicht trägt, siehst du in der Nutzungsanalyse jederzeit den realen Verbrauch deines Workspaces.

Modellwahl beeinflusst den Verbrauch

Nicht jede KI-Anfrage verbraucht gleich viel Kontingent. Im Modell-Selector und in den Modell-Einstellungen siehst du bei jedem Modell eine Kostenkategorie:

Kategorie	Bedeutung
€	Sparsam, gut für einfache Aufgaben und Routineanfragen
€€	Ausgewogen, gute Balance aus Qualität und Verbrauch
€€€	Hohe Qualität, deutlich höherer Kontingentverbrauch pro Anfrage
€€€€	Spitzenklasse, sehr hoher Kontingentverbrauch pro Anfrage

Das Prinzip: Premium-Modelle (€€€ und €€€€) liefern die besten Ergebnisse, verbrauchen aber deutlich mehr Kontingent pro Anfrage als sparsame Modelle. Wer regelmäßig mit den teuersten Modellen arbeitet, erschöpft sein Kontingent entsprechend schneller.

Tipp: Für alltägliche Aufgaben reicht oft ein €- oder €€-Modell. Greife zu €€€- und €€€€-Modellen, wenn höchste Qualität wirklich zählt, etwa bei komplexen Analysen, anspruchsvollen Coding-Aufgaben oder besonders sensiblen Texten.

Kontingente werden innerhalb des Workspaces geteilt. Das bedeutet:

Nutzer, die weniger verbrauchen, geben automatisch Spielraum für Kollegen mit höherem Bedarf
Ein einzelner Nutzer kann bis zu 200% seines eigenen Lizenzkontingents nutzen, solange das Gesamtbudget des Workspaces dies hergibt
So wird sichergestellt, dass ungenutztes Kontingent nicht verfällt, sondern dem Team zugutekommt

Anpassung auf Anfrage: Die 200%-Grenze ist ein Standardwert, der für die meisten Workspaces gut passt. Reicht sie für einzelne Power-User in deinem Team nicht aus, oder möchtest du sie umgekehrt enger ziehen, um den Verbrauch fester zu deckeln, können wir den Wert pro Kunde individuell anpassen. Wende dich dafür an deinen Ansprechpartner bei 9brains.

Kostenbegrenzung pro Agent

Mit der Agenten-Plattform lassen sich Aufgaben auch autonom (per Cron oder Webhook) ausführen. Damit ein Agent niemals unbemerkt mehr Kontingent verbraucht als gewollt, hat jeder Agent eine eigene monatliche Kostenbegrenzung als Sicherheitsnetz. Bei Erreichen pausiert der Agent automatisch und der Owner wird per Mail informiert.

Voreingestellt sind €10/Monat, für die meisten Anwendungsfälle komfortabel. Den Wert kannst du pro Agent jederzeit anpassen: nach oben für leistungshungrigere Agenten, nach unten für eine noch engere Absicherung.

Pro Agent konfigurierbar:

Monatliche Kostenbegrenzung: Owner und Administratoren können den Wert ändern
Frühwarnung bei Auslastung: Mail-Benachrichtigung bei zum Beispiel 80 % Verbrauch
Erlaubte Modelle: zum Beispiel nur sparsame Modelle erlauben, keine Premium-Modelle für High-Volume-Crons
Auto-Pause bei 3 Fehlern in Folge: schützt vor „davonlaufenden” Konfigurationen

Auf welches Kontingent ein Run gebucht wird, hängt von der Sichtbarkeit des Agenten ab:

Persönliche Agenten (nur der Owner sieht sie): Verbrauch geht auf das persönliche Kontingent des Owners
Geteilte Agenten (Gruppe oder Workspace): Verbrauch geht auf das Workspace-Kontingent, auch bei Chat-Runs, weil ein geteilter Agent per Definition Team-Ressource ist

Administratoren sehen unter Einstellungen → Nutzungsanalyse → Agenten eine Übersicht aller Agenten mit Verbrauch, Begrenzung und Status. Sie können die Begrenzung pro Agent gezielt überstimmen.

Verbrauch pro Nutzer steuern

Als Admin steuerst du den Verbrauch im Workspace gezielt dort, wo er entsteht. Drei Stellschrauben stehen dir zur Verfügung:

Lizenzwahl pro Person in der Benutzerverwaltung. Pro, Business oder Max bestimmen das Basiskontingent und welche Features (Agenten, Integrationen, API) freigeschaltet sind.
Agenten-Kostenbegrenzung pro Agent in der Nutzungsanalyse. Du kannst die monatliche Begrenzung pro Agent als Override setzen und zusätzlich die erlaubten Modelle pro Agent einschränken, zum Beispiel nur sparsame Modelle für High-Volume-Crons.
Workspace-Cap als globale Obergrenze (Standard 200 %, auf Anfrage anpassbar), siehe Budget-Sharing im Team.

Welche Bremse greift wann?

Im Workspace gibt es mehrere unabhängige Bremsen, die den Verbrauch absichern. Sie wirken getrennt voneinander, das ist der häufigste Punkt, an dem die Frage entsteht „Mein Budget ist doch erhöht, warum läuft mein Agent trotzdem nicht?”. Die folgende Tabelle macht das Mapping eindeutig:

Bremse	Wann sie greift	Was passiert	Was du tun kannst
Workspace-Kontingent erschöpft	Wenn der monatliche Workspace-Pool aller Lizenzen aufgebraucht ist	Sparmodus für alle Nutzer: günstige Modelle laufen weiter, Premium-Modelle sind bis zum nächsten Reset deaktiviert	Guthaben nachkaufen, Lizenz upgraden oder bis zum 1. des Folgemonats warten
Agent-Kostenbegrenzung erreicht	Wenn der monatliche Verbrauch eines einzelnen Agenten seine eigene Begrenzung erreicht (Standard €10)	Der Agent pausiert komplett, Owner und Admin werden per Mail informiert. Andere Agenten und der Chat laufen weiter	Begrenzung im Tab Modelle & Kosten erhöhen, oder bis Monatsende warten. Admins können den Wert in der Nutzungsanalyse überstimmen
Auto-Pause nach drei Fehlern in Folge	Wenn ein autonom getriggerter Agent dreimal hintereinander mit einem Fehler endet	Der Agent pausiert, weitere Cron- und Webhook-Runs werden nicht ausgeführt. Chat-Runs sind davon nicht betroffen	Ursache in der Run-Historie prüfen, Konfiguration anpassen und Agent im Tab Allgemein wieder aktivieren
Tageslimit in der Testphase	Während der 7-tägigen Testphase, wenn das tägliche Kontingent erreicht ist	Harte Grenze: neue KI-Anfragen pausieren bis zum Tagesreset	Bis zum nächsten Tag warten oder eine Lizenz buchen

Praktische Konsequenz: Eine Erhöhung deines persönlichen Anteils am Workspace-Pool hilft nicht, wenn ein einzelner Agent seine eigene Kostenbegrenzung erreicht hat. Beides sind getrennte Stellschrauben. Wenn ein Agent unerwartet pausiert, schau zuerst auf die Agenten-Kostenbegrenzung im Tab Modelle & Kosten und auf den Status in der Nutzungsanalyse.

Was passiert bei Erschöpfung?

Auch wenn das Kontingent aufgebraucht ist, bleibst du arbeitsfähig:

Du chattest weiter, allerdings nur noch mit den günstigen Modellen. Diese decken die allermeisten Alltagsanfragen problemlos ab.
Die teuren Premium-Modelle bleiben bis zum nächsten Kontingent-Reset deaktiviert. Im Modell-Selektor erscheinen sie ausgegraut, mit einem Hinweis, ab wann sie wieder verfügbar sind.
Die Plattform bleibt vollständig nutzbar: Wissensmanagement, Einstellungen und bestehende Chats lesen sind ohne Einschränkung möglich.
In der linken Seitenleiste erscheint ein Statushinweis mit dem Reset-Datum.

Wenn du sofort wieder zu den Premium-Modellen greifen willst, hast du zwei Optionen:

Guthaben nachkaufen, um sofort weiterzuarbeiten
Auf eine höhere Lizenz upgraden, für dauerhaft mehr Kontingent (zum Beispiel von Pro auf Business oder Max)

Andernfalls werden die Premium-Modelle automatisch am 1. des Monats wieder freigeschaltet, wenn das Kontingent zurückgesetzt wird.

Hinweis zu autonomen Agenten: Cron- oder Webhook-Agenten laufen in diesem Zustand nur weiter, wenn sie ohnehin auf eines der günstigen Modelle konfiguriert sind. Steht beim Agenten ein Premium-Modell, pausiert er bis zum nächsten Reset oder bis du das Modell anpasst. Mehr dazu unter Kostenbegrenzung pro Agent.

Guthaben

Guthaben sind zusätzliches Kontingent, das du bei Bedarf als Einmalkauf erwerben kannst.

Guthaben wird erst verbraucht, wenn das reguläre Monatskontingent erschöpft ist
Nicht verbrauchtes Guthaben verfällt nicht, es steht im nächsten Monat weiterhin zur Verfügung
Administratoren können Guthaben unter Abrechnung erwerben

Guthaben eignen sich besonders für Monate mit erhöhtem Bedarf, etwa bei Projekten, Quartalsabschlüssen oder wenn neue Mitarbeiter die Plattform intensiv kennenlernen.