Was sind Input und Output Tokens?
Jede Interaktion mit der KI besteht aus zwei Teilen: dem Input (was du der KI schickst) und dem Output (was die KI dir zurückgibt). Beides verbraucht unterschiedlich viele Tokens.
Input Tokens entstehen durch:
- Deine eigentliche Frage oder Anfrage
- Den gesamten bisherigen Gesprächsverlauf
- System-Prompts im Hintergrund
- Dokumente, Code oder Daten, die du hochlädst
Output Tokens entstehen durch:
- Die Antwort der KI auf deine Anfrage
Input oder Output – was verbraucht mehr?
In den meisten Alltagssituationen ist der Input-Verbrauch höher. Das liegt daran, dass bei jedem neuen Schritt im Gespräch der gesamte bisherige Chat-Verlauf erneut mitgesendet wird – das summiert sich schnell.
Es gibt jedoch Use Cases, bei denen der Output überwiegt:
Situation | Was dominiert? |
Langer Gesprächsverlauf | Input |
Dokument hochladen & analysieren | Input |
Code generieren | Output |
Kreatives Schreiben | Output |
Kurze Frage, lange Antwort | Output |
Beispiel Input-lastig:
Du lädst einen 10-seitigen Bericht hoch und fragst: „Fasse das zusammen." → Das Dokument macht den Grossteil der Tokens aus, die Zusammenfassung ist vergleichsweise kurz.
Beispiel Output-lastig:
Du schreibst: „Schreib mir ein vollständiges Python-Skript für eine Budgetverwaltung." → Die Anfrage ist kurz, der generierte Code ist lang.
So nutzt du dein Token-Budget clever
- Starte bei neuen Themen einen frischen Chat, statt den Verlauf endlos zu verlängern
- Lade nur relevante Ausschnitte von Dokumenten hoch
- Formuliere präzise Prompts "Qualität vor Quantität" – das spart Tokens und verbessert die Antwortqualität
Wichtiger Hinweis: Es gibt keine universelle Regel – der Verbrauch hängt immer vom konkreten Use Case ab. Bei Fragen zu deinem Token-Verbrauch hilft dir unser Customer Success Team gerne weiter.
