Google Flow und Flow Music: Die neuen KI-Studios für Video und Musik
Google hat im Frühjahr 2026 zwei eigenständige KI-Studios an den Start gebracht: Flow für Video und Flow Music für Musik. Beide laufen im Browser, beide setzen auf Googles eigene Modelle, beide sind frei zugänglich – mit Tagesbudget im Basistarif und höheren Kontingenten in den Bezahltarifen. Wir zeigen mit konkreten Prompt-Beispielen, was die Werkzeuge im Alltag taugen und wo die Grenzen liegen.
Was ist Google Flow?
Flow ist Googles dediziertes KI-Filmwerkzeug, vorgestellt im Mai 2025 auf der Google-I/O-Konferenz. Im Hintergrund laufen drei Modelle: Veo erzeugt die Videoclips, Imagen die Standbilder und Referenzen, Gemini versteht und verfeinert die Eingaben.
Die Bedienung läuft über Textprompts. Sie beschreiben in normaler Sprache eine Szene – Kameraführung, Ort, Stimmung, Personen – und Flow rendert daraus einen kurzen Filmschnipsel. Die aktuelle Modellgeneration Veo 3.1 erzeugt acht Sekunden Material in 16:9 oder 9:16, mit nativem Ton: Umgebungsgeräusche, Dialog und passende Atmosphäre kommen aus demselben Modell, ohne separaten Audio-Schritt.
Zwei Eigenschaften heben Flow vom Wettbewerb (Runway, Pika, Kling) ab:
- Ingredient-System – Sie laden ein Referenzbild für eine Person oder ein Produkt hoch und Flow hält diese Figur über mehrere Clips konstant. Damit lassen sich kleine Filmsequenzen mit gleichbleibendem Hauptdarsteller bauen.
- Native Tonspur – Veo 3 erzeugt Bild und Ton in einem Durchgang. Wer eine belebte Markthalle prompted, bekommt automatisch Stimmen-Gewusel, Schritte und Hintergrundgeräusche dazu. Lippen-Synchron klappt bereits erstaunlich gut.
Beispiel-Prompt für Google Flow
Ein konkreter Prompt, wie er für einen kurzen Image-Clip einer Handwerks-Manufaktur funktioniert. Klare Bildsprache, dokumentarischer Stil, keine Sci-Fi-Effekte:
A craftsman in his 40s, wearing a dark work apron, soldering a small electronic board on a wooden workbench. Warm afternoon light from a window on the left, soft shadows. The camera slowly dollies in from the side at table height. Close-up on the hands and the glowing tip of the soldering iron, thin smoke rising. Background slightly blurred: shelf with tools and a small green plant. Realistic, documentary style, no cinematic colour grading, no neon. 16:9, 8 seconds.
Veo erzeugt daraus einen Acht-Sekunden-Clip mit leiser Manufaktur-Atmosphäre im Hintergrund – ein leises Brutzeln des Lötkolbens, das Surren einer Lüftung. Für eine Webseiten-Hero-Animation oder eine LinkedIn-Story ist das Material direkt einsetzbar.
Was ist Flow Music?
Im April 2026 hat Google das zugekaufte Werkzeug ProducerAI in die eigene Marken-Familie integriert und als Flow Music neu gestartet. Erreichbar unter flowmusic.app. Die Plattform ist die Audio-Schwester von Flow und teilt sich mit ihr den Markennamen, läuft aber als eigenständige Anwendung mit eigenem Konto.
Im Hintergrund arbeitet Lyria 3 Pro, Googles fortschrittlichstes Musik-Modell. Es versteht musikalische Struktur – also Intro, Strophe, Refrain, Bridge – und erzeugt vollständige Stücke mit bis zu drei Minuten Länge. Gesang kommt direkt aus dem Modell, in mehreren Sprachen.
Drei Funktionen sind im Alltag besonders interessant:
- Ghostwriter – schreibt Liedtext zum Prompt und übergibt ihn an Lyria. Aus einem Stichwort wird ein vollständiges Lied mit Text.
- Replace – ersetzt einzelne Abschnitte eines fertigen Stücks ohne Neuerzeugung des Ganzen. Sie tauschen nur die Bridge oder den Refrain aus.
- Extend – verlängert ein Stück über das ursprüngliche Ende hinaus und hält Stil und Energie bei.
Stem-Splitting (Trennung in Einzelspuren für Stimme, Schlagzeug, Instrumente) und ein Export in MP3, WAV oder M4A sind direkt in der Oberfläche vorhanden.
Beispiel-Prompt für Flow Music
Für die Hintergrundmusik eines Schulungs-Videos brauchen Sie kein orchestrales Werk, sondern eine ruhige, gleichmäßige Spur. Ein typischer Prompt sieht so aus:
Calm instrumental background music for a software tutorial. Lo-fi hip-hop influences, warm electric piano, soft brushed drums, gentle vinyl crackle. Slow tempo around 75 BPM. Mostly muted, foreground-friendly. Two minutes total, with a soft intro and a fade-out at the end. No vocals, no sudden changes.
Lyria liefert dazu in der Regel ein zweiminütiges Stück, das sich problemlos unter eine Stimm-Aufnahme legt. Mit der Replace-Funktion lassen sich störende Stellen anschließend gezielt austauschen, ohne das ganze Stück neu zu generieren.
Hörprobe – direkt aus Lyria mit genau diesem Prompt:
Generiert mit dem Modell lyria-3-clip-preview über die Gemini-API – exakt der oben abgebildete Prompt, ohne Nachbearbeitung. 27 Sekunden, Stereo, 128 kbps MP3 / OGG Vorbis als Fallback. Inhalt der Datei trägt das unsichtbare SynthID-Wasserzeichen von Google.
Ein zweites Beispiel für einen Marken-Jingle oder einen Podcast-Opener:
10-second sting for a German B2B tech podcast intro. Modern electronic, slightly warm, organic feel. Soft synth pad, sparse percussion, ending with a subtle musical resolve. No vocals. Tempo around 95 BPM. Clean, professional, not aggressive.
Wie Flow und Flow Music zusammenarbeiten
Beide Werkzeuge sitzen in derselben Marken-Familie und greifen auf denselben Modell-Stack zurück. Flow Music bringt einen Veo-Music-Video-Modus mit: Aus einem fertigen Stück lässt sich direkt ein passendes Musikvideo erzeugen, das visuell zum Rhythmus passt. Umgekehrt kann ein in Flow erzeugter Clip durch ein eigens dafür erzeugtes Stück aus Flow Music untermalt werden.
Für die typische Mittelstands-Anwendung – ein kurzer Image-Film mit Hintergrundmusik – heißt das: Sie können den Bild- und den Ton-Teil aus einer Hand erzeugen, ohne dass die beiden Komponenten sich später beißen.
Zugang und Tarifstruktur
Beide Werkzeuge sind direkt im Browser erreichbar:
- Google Flow: labs.google/fx/tools/flow
- Flow Music: flowmusic.app
Die Basisstufe ist mit einem normalen Google-Konto erreichbar und bietet ein Tagesbudget an Generierungen. Google AI Pro erweitert das Kontingent und schaltet zusätzliche Funktionen frei. Google AI Ultra bringt die höchsten Limits, frühen Zugriff auf neue Modellversionen und Export in 4K. Eine Altersprüfung ab 18 Jahren gilt für die Musik-Erzeugung in mehreren Regionen.
Alle erzeugten Inhalte tragen das unsichtbare Wasserzeichen SynthID. Die kommerziellen Nutzungsrechte räumt Google ein, Markenrechte und Persönlichkeitsrechte bleiben Sache des Nutzers.
Wo Flow und Flow Music in der Praxis passen
Aus unserer Sicht sind die Werkzeuge dort sinnvoll, wo schnelles Material in solider Qualität gebraucht wird – ohne dass eine ganze Produktionsfirma beauftragt werden muss:
- Erklär-Clips für Produkte und Software – kurze Sequenzen, die einen Ablauf zeigen, untermalt mit ruhiger Hintergrundmusik.
- Hero-Animationen auf der Webseite – ein achtsekündiger Loop, der mehr Atmosphäre transportiert als ein Standbild.
- Podcast- und Newsletter-Jingles – kurze, gleichbleibende Intros, die das eigene Format wiedererkennbar machen.
- Schulungsvideos – Begleitmusik für Trainings-Sequenzen, ohne dass Lizenzfragen für Stockmusik geprüft werden müssen.
- Social-Posts – Reels und Shorts mit eigenständigem Bild- und Tonmaterial statt austauschbarer Schablonen.
Grenzen, die man kennen sollte
Die Werkzeuge sind beeindruckend, aber kein Allheilmittel. Drei Punkte sollten Sie vor dem produktiven Einsatz prüfen:
- Deutsche Sprache – englische Prompts liefern sowohl in Flow als auch in Flow Music die saubersten Ergebnisse. Deutscher Gesang funktioniert, klingt aktuell aber häufig nach Akzent. Für instrumentale Stücke und visuelles Material ohne Sprach-Dialog spielt das keine Rolle.
- Markenrechte – Veo und Lyria sind angelernt darauf, bekannte Marken, Logos und Künstler-Stimmen nicht zu imitieren. Erzwingen Sie eine Annäherung im Prompt, bekommen Sie aber im Zweifelsfall Material, das Sie rechtlich nicht nutzen können. Markenrecht prüfen bleibt Aufgabe des Auftraggebers.
- Datenschutz – Eingaben und erzeugte Inhalte werden auf Google-Servern verarbeitet. Für interne, vertrauliche Inhalte mit Personenbezug sind die Werkzeuge nicht das richtige Werkzeug. Für öffentliches Marketing-Material sind sie es.
Konkurrenz im Markt
Google ist nicht allein. Für Video gehören Runway, Pika und das chinesische Kling zu den ernstzunehmenden Wettbewerbern. Für Musik sind Suno und Udio die beiden größten Häuser. Google hat zwei Vorteile, die zählen: erstens die direkte Anbindung an YouTube, zweitens ein integriertes Konzept aus Bild, Video und Musik unter einem Dach. Wer sowieso schon im Google-Universum arbeitet, hat den kürzesten Weg.
Fazit
Google Flow und Flow Music sind reife Werkzeuge mit klarem Schwerpunkt. Sie ersetzen keine vollständige Filmproduktion und keine Studio-Aufnahme mit professionellen Sängern. Sie ersetzen aber sehr wohl die zähe Suche nach passender Stockmusik, das stundenlange Schneiden eines Konzept-Clips und den Weg über drei verschiedene Werkzeuge mit drei verschiedenen Konten.
Für mittelständische Anwendungen – Image-Clips, Erklärvideos, Hintergrundmusik, Social-Posts – sind die beiden Werkzeuge in unserer Einschätzung der derzeit kürzeste Weg von der Idee zum sendefertigen Ergebnis. Wer den Workflow sauber aufsetzt, spart spürbar Zeit gegenüber klassischen Produktions-Ketten.
KI-gestützten Video- und Audio-Workflow aufbauen?
Wir richten den passenden Schnitt- und Veröffentlichungs-Workflow ein, prüfen die Datenschutz-Lage für Ihren Anwendungsfall und liefern ein schriftliches Protokoll mit allen Schritten. Schreiben Sie uns Ihren Anwendungsfall – wir antworten mit einer Einschätzung.
Anfrage stellen