Ich habe heute ein Video gemacht, das mich selbst zeigt. Ich steige auf mein Motorrad, fahre weg, die Kamera bleibt stehen. Hintergrund: die Altstadt von Salzburg, goldenes Abendlicht, Kopfsteinpflaster. Das Einzige, was ich dafür gebraucht habe, war ein Foto und ein Prompt. Kein Schnittprogramm, keine Location, kein Kameramann.
Das Modell dahinter heißt Seedance 2.0, und ich steuere es direkt aus Claude heraus.
Das ist kein Zukunftsszenario. Das läuft seit Ende April 2026 produktiv in meinem Workflow, und ich sage dir, was davon wirklich funktioniert, was die Grenzen sind und wie du die Verbindung selbst einrichtest.
Was Seedance 2.0 eigentlich ist
Zur Klarheit, weil die Begriffe gerade durcheinandergehen: Seedance 2.0 ist ein Videomodell von ByteDance, dem Konzern hinter TikTok. Nicht zu verwechseln mit Seedream (Bild-Modell, ebenfalls von ByteDance) oder mit Sora (OpenAI). Seedance ist für Bewegtbild, und Seedance 2.0 ist die im Februar 2026 veröffentlichte zweite Generation.
Was das Modell von seinem Vorgänger unterscheidet, ist nicht die Auflösung. Es ist die Architektur. Seedance 2.0 arbeitet multimodal nativ: Text, Bild, Audio und Video werden gemeinsam generiert, nicht nachträglich zusammengestückelt. Das Modell erzeugt Bild- und Tonspur in einem einzigen Durchgang.
Das klingt nach technischem Detail. Ist es aber nicht. Der Unterschied im Ergebnis ist sofort sichtbar.
Bei Videomodellen der ersten Generation ist das Hauptproblem nicht die Bildqualität, es ist die Konsistenz. Eine Person sieht in Frame 1 anders aus als in Frame 10. Das Hemd wechselt die Farbe. Das Gesicht verändert sich subtil. Für Marketing-Content, für Storytelling, für alles, wo eine identifizierbare Person oder ein Produkt über mehrere Szenen erkennbar bleiben muss, war das lange ein Dealbreaker. Seedance 2.0 ist das Modell, das diesem Problem bisher am nächsten kommt, speziell wegen der visuellen Konsistenz über Frames, Charaktere und Szenen hinweg.
Ich beobachte das seit Monaten in der täglichen Beratungsarbeit mit EPU und KMU in Österreich. Fast alle, die KI-Video ausprobieren, landen an diesem Punkt: Das erste Ergebnis ist beeindruckend, das zweite ist schon ein anderer Mensch. Seedance 2.0 ist das erste Modell, bei dem ich sagen kann: Das hält.
Die Technologie dahinter, ohne Physikvorlesung
Zur Klarheit, weil die Begriffe gerade oft verwechselt werden: Seedance ist das Videomodell. Seedream ist das dazugehörige Bildmodell. Beide kommen von ByteDance, beide laufen auf Higgsfield, beide haben nichts mit OpenAI zu tun.
Seedance 2.0 unterstützt direkte Audio-Video-Generierung mit Clip-Längen zwischen 4 und 15 Sekunden, native Ausgabe-Auflösungen von 480p und 1080p, und als Referenz-Inputs bis zu 3 Videoclips, 9 Bilder und 3 Audiodateien gleichzeitig. Auf der Higgsfield-Plattform läuft das bis 4K hoch.
Das klingt kurz, 15 Sekunden. Für Reels, TikToks oder LinkedIn-Clips ist das aber mehr als genug. 10 Sekunden dichter, konsistenter, kinematografischer Content sind mehr wert als 60 Sekunden instabiler Brei.
Wer tiefer einsteigen will: In aktuellen öffentlichen Benchmark-Evaluierungen wie VideoGen-Eval sitzt Seedance 2.0 an oder nahe der Spitze, unter anderem mit starken Werten für Cinematic Photorealism, komplexe Lichtführung und natürliche Kamerabewegung. Das sind reproduzierbare Zahlen, kein Marketing-Claim.
Und es gibt eine beschleunigte Variante: Seedance 2.0 Fast ist eine accelerated Version, die für Low-Latency-Szenarien ausgelegt ist. Für Drafts, Konzept-Checks und schnelle Iteration in der Frühphase eines Projekts ist das relevant.
Higgsfield: Die Plattform, die das zugänglich macht
Seedance 2.0 direkt über die ByteDance-API zu nutzen ist möglich, aber nichts, was ich einem EPU oder KMU empfehlen würde. API-Keys, Modell-Parameter, Kredit-Management, keine GUI. Das ist Developer-Territorium.
Higgsfield ist eine Plattform, die Seedance 2.0 zusammen mit über 30 anderen Video- und Bildmodellen unter einer Oberfläche zugänglich macht. Das Katalog umfasst auf der Videoseite Sora 2, Veo 3.1, Kling 3.0, Seedance 2.0, Wan 2.7 und MiniMax Hailuo 02, auf der Bildseite Soul 2.0, Nano Banana Pro, GPT Image 2, Seedream 4.5 und FLUX, dazu 9 vorstrukturierte E-Commerce-Videoformate für UGC, Unboxing, Product Review und TV-Spot.
Du arbeitest gegen eine Library, nicht gegen einzelne API-Endpunkte. Das ist der Unterschied.
Was Higgsfield für meinen Workflow aber wirklich interessant macht, ist nicht die Modell-Auswahl allein. Es ist die Tatsache, dass die Plattform seit Ende April 2026 über MCP mit Claude verbunden ist.
MCP: Was das bedeutet und warum es wichtig ist
MCP steht für Model Context Protocol, ein offener Standard, der KI-Agenten sicheren, strukturierten Zugriff auf externe Dienste gibt. Claude unterstützt MCP nativ, und Higgsfield betreibt einen MCP-Server, der die beiden Plattformen direkt verbindet. Der Conversation-Thread wird damit zum Produktions-Environment.
Was das in der Praxis bedeutet: Ich öffne keinen Browser-Tab für Higgsfield mehr. Ich wechsle nicht zwischen Claude und einem Videoeditor. Ich schreibe mein Brief in Claude, Claude wählt das Modell, konfiguriert die Parameter, feuert die Generierung ab und bringt den fertigen Clip zurück in den Chat.
Das ist die ehrliche Kernthese dieses Artikels: Für Solo-Kreative und kleine Agenturen ist der Higgsfield-MCP-Connector der erste praxistaugliche Weg, professionellen Video-Content ohne separaten Toolstack zu produzieren.
Ich übertreibe leicht. Aber nur leicht.
Verbindung einrichten: Schritt für Schritt
Das Setup dauert tatsächlich etwa zwei Minuten. Kein API-Key, kein Developer-Account, keine Konfigurationsdatei.
Voraussetzungen: ein aktiver Higgsfield-Account (kostenloser Account reicht für den Start, neue Accounts kommen mit Free Credits) und Claude.ai, idealerweise Pro.
- In Claude oben rechts auf das Profilbild klicken, dann „Settings“ aufrufen. Dort den Reiter „Integrations“ oder „Connectors“ wählen.
- Auf „Add custom connector“ klicken. Als Name „Higgsfield“ eintragen. In das URL-Feld kommt die MCP-Server-Adresse:
https://mcp.higgsfield.ai/mcp - Speichern, dann auf „Connect“ klicken. Claude leitet dich zum Higgsfield-Login weiter. Du loggst dich mit deinem bestehenden Account ein und gibst die Zugriffsrechte frei. Das ist ein einmaliger Schritt, die Verbindung bleibt danach aktiv.
- In den Connector-Einstellungen Read- und Write-Permissions auf „Always Allow“ setzen. Das ist optional, aber ich empfehle es. Ohne diese Einstellung fragt Claude vor jeder Tool-Operation nach Bestätigung. Mit ihr läuft der Workflow durch, ohne dass du nach jedem Schritt einen Knopf drücken musst.
- Neuen Chat öffnen, erste Szene beschreiben. Fertig.
Ein einfacher Einstiegsprompt, den ich für Tests verwende: „Generiere einen 15-Sekunden-Clip: Ein Mann sitzt in einem Wiener Kaffeehaus, Dampf steigt aus der Tasse, weiches Morgenlicht. Seedance 2.0, 16:9.“ Claude erkennt den Connector, wählt das Modell, startet die Generierung und zeigt dir das Ergebnis direkt im Chat.
Was du über den Connector alles steuern kannst
Über den Connector hat Claude Zugriff auf jedes Video- und Bildmodell der Plattform. Nicht nur Seedance.
Modellvergleich in einem einzigen Chat: Du schickst denselben Brief an Seedance 2.0, Kling 3.0 und Veo 3.1 gleichzeitig, siehst die Ergebnisse nebeneinander und entscheidest, welche Version weitergeht. Das spart Budget, weil du nicht blind das teuerste Modell nimmst.
Referenz-basierte Generierung: Du lädst ein Bild hoch, ein Produktfoto oder ein Porträt, und Claude baut den Videoclip um diese Referenz herum. Das ist der Mechanismus, mit dem mein Motorrad-Video entstanden ist. Foto von mir und der Yamaha XVS 650, Prompt für die Szene, Salzburg Altstadt als Setting, Golden Hour als Lichtstimmung.
Soul Characters für Konsistenz über mehrere Clips: Wenn du nicht einen einzelnen Clip brauchst, sondern einen Charakter, der über zehn verschiedene Szenen erkennbar bleibt, trainierst du über Claude einen Soul Character auf Higgsfield. 5 bis 20 Fotos, rund 10 Minuten Trainingszeit, danach ist der Charakter als wiederverwendbare Referenz verfügbar. Das ist für Kampagnen-Produktion relevant, nicht für Einzel-Content.
Marketing Studio für strukturierte Ad-Produktion: Für Produkt-Videos, UGC-Formate, Unboxing-Clips gibt es vorstrukturierte Produktionsformate, die du ebenfalls über Claude steuern kannst. Für EPU, die regelmäßig Social-Media-Content für Produkte produzieren, ist das ein echter Zeitgewinn.
Wo ich ehrlich sein muss
Seedance 2.0 ist beeindruckend. Aber es gibt Grenzen, die ich nicht unter den Tisch kehre.
15 Sekunden ist die Obergrenze. Für alles, was über kurze Clips hinausgeht, eine Markenstory, ein Tutorial, ein Erklärvideo, reicht das nicht. Du brauchst dann eine Sequenz einzelner Clips oder ein anderes Tool.
Prompting ist Handwerk. Der Unterschied zwischen einem mittelmäßigen und einem guten Clip liegt fast immer im Prompt, nicht im Modell. Kamera-Sprache verwenden (locked-off tripod shot, shallow depth of field, 24fps film grain), Licht konkret beschreiben, Action-Sequenzen präzise formulieren. Wer das nicht macht, kriegt Stock-Footage-Qualität.
Credits kosten Geld. Higgsfield ist kein Gratis-Tool. Ein 4K-Clip auf Seedance 2.0 kostet Credits, und für professionellen Output läppert sich das. Für Einzelprojekte ist das vertretbar. Für tägliche Content-Produktion muss man rechnen.
DSGVO-Frage ist offen. Higgsfield ist ein US-amerikanisches Unternehmen. Für professionelle Content-Produktion ohne personenbezogene Daten sehe ich das entspannt. Sobald du aber Kunden-Gesichter, Kundendaten oder interne Marken-Assets hochlädst, ist das eine Compliance-Frage. Ich lade für Kundenprojekte keine sensiblen Assets auf externe Plattformen. Das ist meine klare Linie.
Was das für EPU und kleine Agenturen bedeutet
Bis vor einem Jahr war professioneller Video-Content für Solo-Kreative ein Ressourcenproblem. Kamera, Location, Schnitt, Nachbearbeitung: das ist entweder teuer outgesourct oder zeitintensiv selbst gemacht. KI-Videotools haben das aufgebrochen, aber die meisten Workflows haben immer noch gefordert, dass du zwischen mehreren Tools wechselst, Prompts irgendwo verwaltest und Ergebnisse manuell in eine Content-Pipeline eingepflegt hast.
Der Higgsfield-MCP-Connector schließt diese Lücke. Nicht perfekt. Aber brauchbar.
Was mich konkret überzeugt: Ich kann in demselben Chat, in dem ich einen Blogartikel schreibe, den dazugehörigen Teaser-Clip generieren. Ich kann ein Kundenbriefing in Claude eingeben, den Higgsfield-Connector damit verbinden und direkt ein Konzept mit Beispiel-Clips liefern. Ich kann Prompts innerhalb von Claude iterieren, ohne die Plattform zu wechseln.
Das ist kein Spielzeug. Das ist ein verschobenes Verhältnis zwischen Aufwand und Output.
Naja, doch ein wenig Spielzeug. Denn man kann richtig lustige Sachen damit machen – auch wenn sie für’s Geschäftsleben nicht brauchbar sind: