Google Whisk: Neues KI-Tool für kreative Bildgenerierung

Autor: Dipl.-Ök. Ismail Özköseoğlu

Seit 2002 unterstütze ich Unternehmen mit individuellen Lösungen wie WordPress-Websites, WooCommerce-Onlineshops, SEO und Google Ads.

Durch den Einsatz künstlicher Intelligenz arbeite ich hocheffizient, datenbasiert und detailgenau, um Ihre Marketingziele zu erreichen.

Google hat mit „Whisk“ ein weiteres KI-Tool vorgestellt, das auf der Google Labs Plattform verfügbar ist. Dieses innovative Bildgenerierungswerkzeug erlaubt es Nutzern, bestehende Bilder als Grundlage für die Erstellung neuer visueller Inhalte zu verwenden. Das Besondere: Statt eine Vorlage detailgetreu nachzubilden, fängt Whisk lediglich deren „Essenz“ ein und verwendet diese für die Erzeugung neuer Bildideen. Damit eignet sich Whisk insbesondere für schnelles Brainstorming und visuelle Experimente, weniger jedoch für präzise Bildbearbeitungen.

Ein erster Blick auf Whisk

Google beschreibt Whisk als „eine neue Art von Kreativ-Tool“. Das Interface der Anwendung ist bewusst minimalistisch gestaltet und bietet eine einfache Eingabemaske für Stil und Thema. Derzeit können Nutzer aus drei vordefinierten Stilrichtungen wählen: Aufkleber, Emaille-Pins und Plüschtiere. Diese eingeschränkte Auswahl deutet darauf hin, dass Whisk in seiner aktuellen Experimentierphase vor allem für grobe Konzeptvisualisierungen gedacht ist.

Ein Beispiel zeigt, wie Whisk ein Bild von Wilford Brimley als Plüschfigur generierte. Obwohl Googles Nutzungsbedingungen eigentlich die Erstellung von Bildern prominenter Persönlichkeiten untersagen, scheint dieses Bild durch die Filter geschlüpft zu sein. Das Ergebnis ist eine ansprechende Plüschfigur, die klar von der Vorlage inspiriert wurde, jedoch keine detailgetreue Reproduktion darstellt.

Fortgeschrittene Funktionen für mehr Kontrolle

Neben der einfachen Eingabemaske bietet Whisk auch einen erweiterten Modus. Dieser lässt sich über die Option „Start from scratch“ aufrufen und erlaubt die Kombination von Text- und Bildeingaben in drei Kategorien: Subjekt, Szene und Stil. Zusätzlich gibt es eine Textleiste, um spezifische Anpassungen hinzuzufügen.

Trotz dieser erweiterten Möglichkeiten bleiben die Ergebnisse oft ungenau. Ein Versuch, Wilford Brimley in einer Lightbox-Szene im Stil eines Plüschtier-Walrosses darzustellen, zeigt, dass die Ergebnisse stark von der ursprünglichen Idee abweichen können. Das generierte Bild zeigt lediglich eine vage Ähnlichkeit mit der Vorlage, was Googles Empfehlung unterstreicht, Whisk eher für „schnelle visuelle Erkundungen“ als für Produktionszwecke zu verwenden.

So funktioniert Whisk

Die Technologie hinter Whisk basiert auf zwei KI-Modellen von Google: Gemini und Imagen 3. Zunächst analysiert Gemini das hochgeladene Bild und erstellt eine detaillierte textliche Beschreibung. Diese Beschreibung wird anschließend an Imagen 3 weitergeleitet, das ein neues Bild auf Basis dieser Worte erzeugt.

Diese Methode erklärt, warum die Ergebnisse oft nur einige wesentliche Merkmale der Vorlage übernehmen. Google weist darauf hin, dass das generierte Bild Unterschiede in Größe, Gewicht, Frisur oder Hautfarbe aufweisen kann. Es handelt sich somit nicht um eine exakte Reproduktion, sondern um eine Neuinterpretation der Vorlage.

Anwendungsbereiche und Verfügbarkeit

Whisk ist aktuell nur in den USA verfügbar und kann über die Google Labs Plattform ausprobiert werden. Das Tool richtet sich vor allem an kreative Köpfe, die schnelle visuelle Ideen entwickeln möchten. Dank der Kombination aus einfacher Bedienbarkeit und fortgeschrittenen Funktionen könnte Whisk insbesondere für Designer, Künstler oder Marketing-Teams interessant sein.

Fazit

Mit Whisk erweitert Google sein Portfolio an KI-Tools um eine weitere innovative Lösung. Das Tool zeigt Potenzial für kreative Anwendungen, obwohl es in seiner derzeitigen Form noch deutliche Einschränkungen hat. Seine Fähigkeit, Bilder neu zu interpretieren und Ideen schnell zu visualisieren, macht es jedoch zu einem spannenden Werkzeug für alle, die mit visuellen Konzepten arbeiten.

Während Whisk keine detailgetreuen Ergebnisse liefert, könnte es dennoch einen wertvollen Beitrag im Bereich des kreativen Arbeitens leisten. Mit weiteren Entwicklungen und Optimierungen könnte das Tool in Zukunft auch für präzisere Anwendungsfälle geeignet sein. Bis dahin bleibt es ein interessantes Experiment für kreative Explorationen.