Während OpenAI’s ChatGPT weltweit für Aufsehen sorgt und eines der am schnellsten wachsenden Verbraucherprodukte aller Zeiten ist, hat Googles Bard lange Zeit eher im Schatten gestanden. Bard, ursprünglich als einfacher Chatbot konzipiert, hat kontinuierlich neue Funktionen erhalten, einschließlich des Zugriffs auf Benutzerdaten über andere Google-Produkte. Jedoch schienen die Antworten und Informationen von Bard selten mit denen von ChatGPT und anderen Bots, die GPT-3 und GPT-4 nutzen, zu konkurrieren.
Diese Wahrnehmung könnte sich nun jedoch ändern: Seit heute ist Bard für englischsprachige Nutzer in 170 Ländern durch Googles neues Gemini-Modell angetrieben, das nach Aussage des Unternehmens in vielerlei Hinsicht mit der Technologie von OpenAI gleichzieht und diese sogar übertrifft. Google plant, Gemini in naher Zukunft in weiteren Sprachen und Ländern einzuführen.
Bard läuft derzeit auf Gemini Pro, der mittleren Stufe der Gemini-Serie. Ultra, die größte und langsamste, aber auch leistungsfähigste Variante, Nano, klein und schnell für Aufgaben auf dem Gerät, und Pro, die eine ausgewogene Mitte bildet. Gemini Pro soll die ideale Version des Modells sein: schnell und effizient, dabei so leistungsfähig wie möglich. Sissie Hsiao, die bei Google Bard und Assistant leitet, bezeichnete in einem Pressebriefing Gemini als die “größte und beste Verbesserung” für Bard. Dies sollte eine deutliche Verbesserung für fast alles sein, was Bard bereits kann: Zusammenfassen, Brainstorming, Schreiben und Ähnliches. Sundar Pichai, der CEO von Google, bemerkte in seinen Tests, dass es weniger um neue spektakuläre Funktionen geht, als vielmehr um eine generelle Verbesserung. “Ich denke, die Leute werden feststellen, dass das Produkt viel besser geworden ist”, sagt er. “Es versteht ihre Absichten besser, antwortet besser, ist faktischer, qualitativ hochwertiger. Wenn es ums Programmieren geht, ist es besser!”
Derzeit ist Bard immer noch nur ein Chatbot: Man tippt ein, und er antwortet. Doch eine neue Version von Bard, die bald erscheinen könnte, verspricht mehr. Im nächsten Jahr plant Google, eine Vorschau von “Bard Advanced” zu starten, angetrieben von Gemini Ultra, der leistungsfähigsten und fähigsten Version von Googles neuem großen Sprachmodell. Gemini Ultra ist zudem die multimodale Version des Modells, was bedeutet, dass es Bilder, Audio und Video zusätzlich zu Text akzeptieren und erstellen kann. Die nicht-textbasierten Interaktionen sind Bereiche, in denen Gemini besonders glänzt, sagt Demis Hassabis, der Leiter von Google DeepMind. “Wir haben es von Grund auf als nativ multimodal konzipiert”, erklärt er. “Das ist eine der neuen Fähigkeiten, die es hat… die Art der nahtlosen Integration und des Reasonings, das es über Modalitäten hinweg durchführen kann.” Zu Googles Demos gehörten der YouTuber Mark Rober, der Bard nutzte, um das perfekte Papierflugzeug zu bauen – einschließlich der Nutzung von Fotos seiner Entwürfe, um KI-gestütztes Feedback zu erhalten – und Eltern, die Bilder der Hausaufgaben ihrer Kinder hochluden, um Hilfe bei der Lösung mathematischer Probleme zu erhalten.
Dies sind bisher jedoch nur Demos und Werbevideos. Pichai betrachtet diesen Start sowohl als einen wichtigen Moment für Bard als auch als den Beginn der Gemini-Ära. Sollten Googles Benchmarks zutreffen, könnte das neue Modell Bard bereits jetzt zu einem ebenso guten Chatbot wie ChatGPT machen. Und das ist bereits eine beachtliche Leistung.
Ich helfe Ihnen gerne KI-Tools in ihre Arbeitsprozesse in Ihrem Marketing zu integrieren. Über den folgenden Link gelangen Sie zu meinen Kontaktdaten.