Claude Opus 4.6: Wie Sie Kostenfallen der neuen KI umgehen
Anthropics neues Sprachmodell soll schwerere Aufgaben wuppen als ChatGPT. Wer jedoch nicht aufpasst, steht bald knietief im Dispo.
(Bild: nuruddean / Shutterstock.com)
Lesezeit:
9 Min.
Woche für Woche buhlen KI-Entwickler mit neuen Modellen um die Gunst der Nutzer. Dabei müssen die Konkurrenten von OpenAI mit besonderen Funktionen punkten, um Kunden von ChatGPT wegzulocken. Der US-Hersteller Anthropic setzt bei seinem neuen Modell Claude Opus 4.6 auf mächtige Funktionen für aufwendige Aufgaben, die beispielsweise beim Coding ein Team aus mehreren KI-Agenten parallel löst. Das verspricht, größere Probleme zu knacken, an denen einfachere Modelle scheitern, erzeugt aber auch deutlich höhere Kosten, wenn die Agenten sich untereinander austauschen.
Mit dem kostenlosen Account oder selbst dem Pro-Abo für rund 21 Euro im Monat ist man da schnell am Ende. Wir haben das neue Modell ausprobiert und klären die Frage, ob Opus 4.6 sich für gewöhnliche Anwender mit Flatrate-Abo lohnt, wie es sich von ChatGPT unterscheidet und worauf Sie unbedingt achten sollten.
In diesem Hands-on klappern wir nicht die Feature-Listen ab und beten Benchmarks runter, sondern zeigen, wie man mit solchen Kalibern von Sprachmodellen anders umgehen muss, als einfach drauflos zu plappern. Einen Überblick, was Anthropic alles in Opus 4.6 verbessert haben will, finden Sie in diesem Artikel.
Neue Einnahmequellen
Dass die großen KI-Entwickler in den USA mit Milliarden nur so um sich werfen, ist bekannt. Doch die Geldgeber blicken zunehmend besorgt auf die Einnahmen und darauf, ob sich ihre Investitionen künftig auszahlen. OpenAI experimentiert mit zusätzlichen Erlösmodellen, etwa Werbung in kostenlosen Varianten. Anthropic geht einen anderen Weg. Es baut seine Modelle zu schweren Geschützen aus, die deutlich mehr Rechenzeit verbrauchen und höhere Kosten verursachen, dafür aber eine höhere Leistung versprechen.
Bei der Arbeit mit Opus 4.6 stößt man schnell ans Limit und wird von Anthropic aufgefordert, mehr Geld zu zahlen, wenn man zügig weiterarbeiten will.
(Bild: Anthropic)
Neben vielen kleineren Verbesserungen setzt Opus 4.6 vor allem auf sogenannte Agent Teams, also ganze Gruppen aus verschiedenen KI-Agenten, die eine Aufgabe gemeinsam lösen. Das ist derzeit auf Programmieraufgaben beschränkt, könnte aber grundsätzlich auch für die Auswertung von Statistiken und Analysen eingesetzt werden.
Lesen Sie auch
Anthropic stellt Claude Opus 4.6 mit Agent Teams vor
Aufteilungen in spezialisierte Agenten gibt es schon länger. Meist werden sie jedoch von einem leitenden Prozess gesteuert, der Aufgaben verteilt und Ergebnisse einsammelt. In den Teams von Opus 4.6 können die Agenten sich zusätzlich untereinander austauschen. Das verbessert ihren Workflow und erlaubt parallele Arbeitsschritte. Es lässt aber auch die Zahl der zur internen Kommunikation berechneten Token explodieren – und damit die Kosten.
Das übliche Kleingedruckte
Wer das ausprobieren möchte, kann Opus 4.6 bei Anthropic online nutzen. Das Modell läuft ausschließlich auf den Servern des Anbieters. Kunden melden sich per Mail oder Google-Konto an und akzeptieren die Geschäftsbedingungen sowie die Datenschutzerklärung.
Diese liegen auf Deutsch vor und entsprechen zumindest formal den europäischen Vorgaben. Gleichwohl gelten die üblichen Datenschutzregeln aller US-amerikanischen KI-Dienstleister. Die Daten und Eingaben werden in den USA verarbeitet und unterliegen damit auch US-Recht. Das erlaubt den dortigen Behörden beispielsweise geheime Zugriffe, ohne die Betroffenen benachrichtigen zu müssen.
Anthropic informiert Nutzer, dass die Daten gemäß US-Recht mindestens 30 Tage gespeichert bleiben, selbst wenn man seine Daten nicht zum Modelltraining freigibt.
Nutzer können in den Einstellungen deaktivieren, dass ihre Eingaben von Anthropic für Trainingszwecke verwendet werden, und Chats löschen. Allerdings ist auch hier keine absolute Datensouveränität gegeben, da die Chats zumindest für 30 Tage gespeichert bleiben. Geschäftsgeheimnisse und andere sensible Daten, die man nicht mit Donald Trump teilen möchte, haben deshalb in Chats mit in den USA gehosteten Sprachmodellen generell nichts verloren. Wer das vermeiden will, muss entweder auf europäische Anbieter ausweichen oder ein offenes Modell selbst hosten.
Bis die Kreditkarte platzt
Wer damit leben kann, sollte nach der Anmeldung unbedingt einen Blick auf die Bezahleinstellungen werfen. Denn Opus 4.6 ist so rechenhungrig, dass man mit dem kostenlosen Abo nicht weit kommt und seine Kreditkartendaten für einen Pro-Account hinterlegen muss. Der kostet brutto 21,42 Euro pro Monat.
Das Pro-Abo arbeitet mit dynamischen Nutzungslimits. In den Einstellungen unter Nutzung sieht der Anwender nur einen blauen Balken, der sich mit jeder Anfrage füllt. Es gibt ein Zeitfenster von etwa vier Stunden, in dem ein bestimmtes Kontingent zur Verfügung steht, sowie zusätzliche wöchentliche Begrenzungen. Wie viele Token konkret enthalten sind, bleibt jedoch intransparent. Der blaue Balken füllt sich erst langsam und bei länger werdenden Chats immer schneller, bis Claude schließlich nicht mehr antwortet.
In den Einstellungen sieht der Nutzer blaue Balken zu den Limits, die bei längeren Chats immer schneller wachsen.
Wie schnell der Balken wächst, hängt von der Länge des Chats, der Komplexität der Aufgabe und der Modellvariante ab. Anthropic rät dazu, Chats möglichst kurz zu halten, da bei jeder weiteren Frage der gesamte bisherige Verlauf erneut als Input verarbeitet wird – wie bei allen Transformer-Modellen.
Ist das Limit erreicht, muss man entweder mehrere Stunden warten, sein Abo auf die Stufe „Max“ für 90 Euro im Monat erweitern oder weitere Token kaufen, die Anthropic nach API-Preisen abrechnet. Die Kosten orientieren sich an den Preislisten von Anthropic. Als Sicherheitsnetz lassen sich immerhin Tageslimits setzen.
Gegenüber früheren Opus-Versionen hat Anthropic die API-Preise deutlich gesenkt. Für API-Nutzer kosten eine Million Input-Tokens rund 5 US-Dollar, eine Million Output-Tokens rund 25 US-Dollar. Wer Agententeams einsetzt, erzeugt durch interne Kommunikation und umfangreiche Antworten schnell hohe Token-Mengen. Wie groß diese ausfallen, lässt sich im Voraus kaum abschätzen. Eine detaillierte Token-Statistik bietet die Weboberfläche derzeit nicht.
In unseren Stichproben war bei normalen Chat-Anfragen mit Opus 4.6 bereits nach rund 20 Nachfragen das Vier-Stunden-Limit erreicht. Bei komplexeren Aufgaben, etwa der statistischen Analyse einer großen Tabelle mit verlinkten Dokumenten, lief der Nutzungsbalken des Pro-Accounts bereits nach fünf bis sechs Anfragen voll. Danach mussten wir mehrere Stunden warten, bevor wir weiterarbeiten konnten.
Vorbereitungen
Im gewöhnlichen Chat ist Opus 4.6 spürbar träger als das aktuelle GPT-5.2-Modell von OpenAI. Während dieses schnell reagiert und sich für schnelle Iterationen eignet, nimmt sich Claude deutlich mehr Zeit und schreibt Antworten Wort für Wort aus. Wenn mehrere Agenten beteiligt sind, zeigt die Oberfläche immerhin, welche Teilaufgaben gerade bearbeitet werden.
Opus 4.6 ist daher nicht das richtige Modell für schnelle Zwischenfragen oder spontane Geistesblitze – dafür hält Claude andere Modelle wie Sonnet 4.5 oder Haiku 4.5 bereit. Stattdessen behandelt es jede Anfrage wie eine größere Aufgabe und versucht, möglichst vollständig und konsistent zu antworten. Das bremst einen iterativen Austausch aus, wie er mit ChatGPT gut funktioniert und wo der Anwender während des Chats immer wieder gegensteuern kann, wenn das Modell zu stark abdriftet. Opus 4.6 verlangt eine sorgfältige Vorbereitung. Wer ihm unklare oder halbfertige Prompts gibt, verbrennt schnell Zeit und Geld.
Gute Vorbereitung nötig
Opus 4.6 ist weniger Konkurrenz als Ergänzung zu schnelleren Modellen wie GPT 5.2 von OpenAI oder den kleineren Claude-Modellen. Wer effizient arbeiten will, diskutiert ein Problem zunächst mit einem flinkeren reaktiven Modell und schärft seinen Prompt iterativ. Erst wenn die Anforderungen klar formuliert sind, lohnt es sich, Opus 4.6 an die Arbeit zu schicken. Sinnvoll ist es zudem, das Modell vorab zu fragen, welche zusätzlichen Informationen es benötigt, bevor die Agenten im Team loslegen.
In unserem Test konnte Opus 4.6 beispielsweise eine Tabelle mit 40 Einträgen analysieren, darin enthaltene Links auswerten und am Ende einen strukturierten Übersichtsreport als HTML-Seite erstellen. ChatGPT kann in längeren Diskussionen zwar ähnlich gute Tipps geben, aber nicht so umfassend aufbereiten.
Mit rund 20 Euro kommt man künftig als Privatnutzer kaum noch aus, wenn man die neuesten Modelle produktiv nutzen will. Anthropic preist die nächste Abostufe bei 90 Dollar pro Monat plus Mehrwertsteuer ein.
(Bild: Anthropic)
Allerdings akzeptieren das Web-Interface und die Desktop-App von Claude derzeit nur den maximalen Upload von 20 Dateien pro Analysevorgang. Größere Analysen muss man daher in Teilaufgaben unterteilen und diese in Projekten anlegen.
Fazit
Jede Branche hat andere Workflows, in die eine KI eingebunden werden soll. Diese lassen sich in einem Hands-on wie diesem nicht vollständig abdecken. Wer Opus 4.6 produktiv einsetzen will, sollte das Modell mehrere Wochen evaluieren, um Stärken und Schwächen realistisch einzuschätzen. Dazu bietet Anthropic bis zum 16. Februar für bereits registrierte Kunden ein Startguthaben in Höhe von 50 US-Dollar an.
Eingehende Tests können aber schnell richtig ins Geld gehen: In seinem Blog schreibt ein Entwickler von Anthropic, wie er mithilfe von Opus 4.6 einen C-Compiler entwickelt hat. Die Token-Kosten beliefen sich dabei auf rund 20.000 US-Dollar. Die Kostenfalle sollte also niemand auf die leichte Schulter nehmen.
Gewiss taugt solche von der KI programmierte Software erstmal nur als Prototyp. Für ein fertiges Produkt wären umfangreiche Qualitätsprüfungen echter Entwickler nötig, die KI-generierter Vibe-Code jedoch vor besondere Herausforderungen stellt. Mit dem Aufkommen immer mächtigerer Modelle wie Opus 4.6 wird die Zahl solcher per Vibe-Coding erzeugten Programme wahrscheinlich steigen – und damit die Risiken, weil Menschen den Code kaum noch Zeile für Zeile prüfen können.
Denn auch wenn die Modelle immer mächtiger werden, bleiben sie am Ende immer noch Werkzeuge, die für manche Einsatzzwecke nützlich sind und für andere ungeeignet. Opus 4.6 taugt zwar nicht für den schnellen Wissensaustausch im Dialog, kann mit detaillierten Anweisungen aber komplexere Aufgaben bewältigen und Analysen anstellen als die Modelle von ChatGPT.
(hag)
- Claude Opus 4.6 im Hands-on: Mächtige KI-Agenten treiben Kosten in die Höhe
- OpenClaw im Selbstversuch: Erste Schritte mit dem Super-KI-Agenten
- Vision Language Model: Wie FastVLM hochauflösende Bilder im Browser analysiert
- Privates Wissensarchiv: Anleitungen und Co. mit lokaler KI durchsuchen
- Parameter in KI-Modellen: Was sie bei großen Sprachmodellen wirklich bedeuten
- IT-Recht beim KI-Agenten-Einsatz