Mit der Einführung von Gemini leitet Google eine neue Ära in der Welt der Künstlichen Intelligenz (KI) ein. Sundar Pichai, CEO von Google, bezeichnet diesen Schritt als den Beginn der Gemini-Ära. Dieses neueste große Sprachmodell wurde erstmals auf der I/O-Entwicklerkonferenz im Juni angeteasert und ist nun für die Öffentlichkeit zugänglich. Nach den Worten von Pichai und Demis Hassabis, CEO von Google DeepMind, stellt Gemini einen gewaltigen Sprung in der Entwicklung von KI-Modellen dar, der nahezu alle Produkte von Google beeinflussen wird.

Interessanterweise besteht Gemini nicht nur aus einem einzigen KI-Modell. Es umfasst eine leichtere Version namens Gemini Nano, die für den nativen und offline Betrieb auf Android-Geräten konzipiert ist, sowie eine leistungsfähigere Version, Gemini Pro, die bald viele Google-KI-Dienste antreiben wird und ab heute die Grundlage für Bard bildet. Darüber hinaus gibt es ein noch fähigeres Modell namens Gemini Ultra, das das bisher leistungsstärkste LLM von Google darstellt und hauptsächlich für Rechenzentren und Unternehmensanwendungen gedacht ist.

Google startet das Modell auf verschiedene Weisen: Bard wird jetzt von Gemini Pro angetrieben, und Nutzer des Pixel 8 Pro werden dank Gemini Nano einige neue Funktionen erhalten. Gemini Ultra wird im nächsten Jahr verfügbar sein. Entwickler und Unternehmenskunden können ab dem 13. Dezember auf Gemini Pro über Google Generative AI Studio oder Vertex AI in Google Cloud zugreifen. Derzeit ist Gemini nur in Englisch verfügbar, weitere Sprachen sollen jedoch bald folgen. Pichai betont, dass das Modell letztlich in Googles Suchmaschine, seine Werbeprodukte, den Chrome-Browser und mehr integriert wird, und zwar weltweit.

Die echte Herausforderung für Google liegt darin, mit OpenAIs GPT-4 zu konkurrieren. Google hat beide Modelle eingehend analysiert und verglichen. Hassabis berichtet, dass Google 32 etablierte Benchmarks durchgeführt hat, um die beiden Modelle zu vergleichen. Dabei schnitt Gemini in 30 der 32 Benchmarks besser ab. Ein deutlicher Vorteil von Gemini liegt in seiner Fähigkeit, Video- und Audiodaten zu verstehen und zu verarbeiten. Dies ist kein Zufall: Multimodalität war von Anfang an ein wichtiger Bestandteil des Gemini-Plans. Im Gegensatz zu OpenAI, die separate Modelle für Bilder und Stimme wie DALL-E und Whisper entwickelt haben, hat Google von Beginn an ein multisensorisches Modell aufgebaut.

Die Basisversionen von Gemini arbeiten mit Texteingaben und -ausgaben, aber leistungsfähigere Modelle wie Gemini Ultra können mit Bildern, Videos und Audio umgehen. Hassabis betont, dass Gemini im Laufe der Zeit noch vielfältigere Sinneswahrnehmungen integrieren und dadurch genauer und realitätsnaher werden wird. Trotzdem gibt er zu, dass diese Modelle immer noch zu Halluzinationen neigen und Vorurteile sowie andere Probleme aufweisen.

Google legt auch großen Wert darauf, dass Gemini ein weitaus effizienteres Modell ist. Es wurde auf Googles eigenen Tensor Processing Units trainiert und ist sowohl schneller als auch kostengünstiger zu betreiben als vorherige Modelle wie PaLM. Neben dem neuen Modell startet Google auch eine neue Version seines TPU-Systems, das TPU v5p, ein Rechensystem, das für den Einsatz in Rechenzentren zur Ausbildung und zum Betrieb groß angelegter Modelle konzipiert ist.

Für Pichai und Hassabis ist die Einführung von Gemini sowohl der Beginn eines größeren Projekts als auch ein bedeutender Schritt nach vorn. Google, das nach dem Start von ChatGPT einen “Code Red” ausgerufen hat und seitdem als Nachzügler galt, versucht weiterhin, an seinem Mantra “kühn und verantwortungsbewusst” festzuhalten. Sie betonen die Notwendigkeit, besonders im Hinblick auf das ultimative KI-Ziel – die künstliche generelle Intelligenz – vorsichtig, aber optimistisch vorzugehen. Google hat viel Arbeit in die Sicherheit und Verantwortlichkeit von Gemini investiert, sowohl durch interne als auch externe Tests und Red-Teaming. Insbesondere bei Produkten, die zuerst für Unternehmen bestimmt sind, ist die Gewährleistung von Datensicherheit und Zuverlässigkeit von entscheidender Bedeutung.

Gemini mag in dieser ersten Generation die Welt vielleicht noch nicht verändern. Im besten Fall könnte es Google helfen, mit OpenAI im Rennen um die Entwicklung großartiger generativer KI aufzuholen. Pichai, Hassabis und alle anderen bei Google scheinen jedoch zu glauben, dass dies der Beginn von etwas wirklich Großem ist. Das Internet machte Google zu einem Technologiegiganten; Gemini könnte noch größer werden.

Ich helfe Ihnen gerne KI-Tools in ihre Arbeitsprozesse in Ihrem Marketing zu integrieren. Über den folgenden Link gelangen Sie zu meinen Kontaktdaten.