Google hat am Dienstag auf der Google I/O 2024 sein neuestes Produkt im Bereich der künstlichen Intelligenz vorgestellt: Veo. Diese hochauflösende KI-Videogenerierung hat das Potenzial, den Markt zu revolutionieren, indem sie aus rein textbasierten Eingaben detailreiche Videos erstellt. Ähnlich wie der bereits bekannte Sora von OpenAI ist Veo in der Lage, 1080p-Videos mit einer Länge von mehr als einer Minute zu generieren und bestehende Videos anhand schriftlicher Anweisungen zu bearbeiten.

Funktionen und Möglichkeiten von Veo

Veo ermöglicht die Erstellung und Bearbeitung von Videos durch einfache Text-, Bild- oder Videoeingabe. Das Modell kann Videosequenzen mit einer Länge von mehr als 60 Sekunden generieren, die visuell konsistent sind und eine narrative Struktur aufweisen. Einzigartig ist die Fähigkeit, detaillierte Szenen mit filmischen Effekten wie Zeitraffer, Luftaufnahmen und verschiedenen visuellen Stilen zu erzeugen. Google gibt an, dass Veo auf seinen früheren Videogenerierungsmodellen wie Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet und Lumiere aufbaut.

Veo im Vergleich zu Sora von OpenAI

Seit der Einführung von DALL-E 2 im April 2022 hat sich die Bild- und Videogenerierungstechnologie stetig weiterentwickelt. Während Sora von OpenAI bisher als führendes Modell in der Branche galt, scheint Veo ähnliche Fähigkeiten zu bieten. Allerdings bleibt abzuwarten, wie sich Veo in der Praxis schlägt, da bisher nur ausgewählte Demo-Videos von Google präsentiert wurden.

Demo-Videos und ihre Aussagen

Die von Google veröffentlichten Beispielvideos zeigen unter anderem einen Cowboy, der auf einem Pferd reitet, eine schnelle Kamerafahrt durch eine Vorstadtstraße, auf einem Grill brutzelnde Kebabs und eine sich öffnende Sonnenblume im Zeitraffer. Auffällig ist das Fehlen detaillierter Darstellungen von Menschen, die für KI-Modelle traditionell schwierig zu generieren sind, ohne offensichtliche Deformationen zu zeigen. Google erklärt, dass Veo detailliertere Videobeschreibungen in das Training einbezieht, die es dem Modell ermöglichen, Texteingaben präziser zu interpretieren.

Veo und die Filmindustrie

Interessant ist auch, dass Veo Filmkommandos unterstützt. Google erklärt, dass das Modell beispielsweise in der Lage ist, einem Eingabevideo und einem Bearbeitungsbefehl wie “Kajaks zu einer Luftaufnahme der Küste hinzufügen” zu folgen und das Originalvideo entsprechend zu bearbeiten. Diese Fähigkeit könnte vor allem für die Filmindustrie von großem Interesse sein. Google arbeitet bereits mit dem Schauspieler Donald Glover und seinem Studio Gilga zusammen, um einen KI-generierten Demonstrationsfilm zu produzieren, der in Kürze vorgestellt werden soll.

Zugänglichkeit und künftige Integration

Zunächst wird Veo über VideoFX zugänglich sein, ein neues experimentelles Tool auf der Google AI Test Kitchen Website, labs.google. Kreative können sich auf eine Warteliste setzen lassen, um möglicherweise in den kommenden Wochen Zugang zu den Funktionen von Veo zu erhalten. Google plant außerdem, einige der Funktionen von Veo in YouTube Shorts und andere Produkte zu integrieren.

Verantwortungsvolle Nutzung von Veo

Ein wichtiges Thema bei der Einführung von Veo ist die Frage nach der Herkunft der Trainingsdaten. Obwohl Google dazu keine konkreten Angaben gemacht hat, liegt die Vermutung nahe, dass YouTube als Datenquelle gedient haben könnte. Google betont jedoch, dass ein verantwortungsvoller Umgang mit Veo im Vordergrund steht. „Die von Veo erstellten Videos werden mit SynthID, unserem hochmodernen Tool zur Erkennung von Wasserzeichen und zur Identifizierung von KI-generierten Inhalten, markiert und durchlaufen Sicherheitsfilter und Speicherkontrollen, die dabei helfen, Risiken in den Bereichen Datenschutz, Urheberrecht und Voreingenommenheit zu minimieren“, so das Unternehmen.

Fazit

Die Einführung von Veo markiert einen wichtigen Schritt in der Entwicklung der KI-gestützten Videogenerierung. Während Veo auf den ersten Blick vielversprechend erscheint, bleibt abzuwarten, wie sich das Modell in der Praxis bewährt und ob es tatsächlich das Potenzial hat, mit OpenAI’s Sora zu konkurrieren. Die zukünftige Integration in Produkte wie YouTube Shorts könnte zudem neue kreative Möglichkeiten für Content Creators eröffnen. Google ist zuversichtlich, dass Veo durch seine fortschrittlichen Funktionen und den verantwortungsvollen Umgang mit der Technologie eine wichtige Rolle im Bereich der Videoproduktion spielen wird.