In der Geschichte der Künstlichen Intelligenz (KI) gab es immer wieder sogenannte „KI-Winter“, Phasen, in denen es schien, als hätte die Technologie eine Sackgasse erreicht und die Finanzierung versiegte. Jeder dieser Perioden wurde von der Proklamation begleitet, dass es für Menschen einfach zu schwierig sei, Maschinen wirklich intelligent zu machen.

Die Veröffentlichung von Gemini durch Google, das als grundlegend neues KI-Modell und als das bisher leistungsfähigste des Unternehmens angepriesen wird, deutet darauf hin, dass ein neuer KI-Winter so bald nicht zu erwarten ist. In der Tat war das Jahr seit der Einführung von ChatGPT durch OpenAI ein Bannerjahr für die KI, und es gibt gute Gründe zu der Annahme, dass der aktuelle KI-Boom gerade erst beginnt.

Als OpenAI im November 2022 die „niedrigschwellige Forschungsvorschau“ namens ChatGPT startete, waren die Erwartungen nicht hoch. Es handelte sich lediglich um einen Test einer neuen Schnittstelle für seine textgenerierenden Großmodelle (LLMs). Doch die Fähigkeit des Chatbots, eine breite Palette von Aufgaben zu bewältigen, von der Synthese von Essays und Poesie bis hin zur Lösung von Programmierproblemen, beeindruckte und beunruhigte viele Menschen und setzte die Technologiebranche in Aufruhr. Als OpenAI sein neues LLM GPT-4 zu ChatGPT hinzufügte, waren einige Experten so beunruhigt, dass sie das Unternehmen baten, langsamer zu machen. Es gibt bereits wenige Anzeichen dafür, dass jemand diesen Alarmruf beachtet hat. Nun scheint es undenkbar, dass Google mit der Ankündigung von Gemini die Einsatzhöhe erhöht und vielleicht auch die Spielregeln geändert hat.

Google hatte bereits Anfang des Jahres mit Bard eine direkte Antwort auf ChatGPT herausgebracht und schließlich eine LLM-Chatbot-Technologie auf den Markt gebracht, die es früher als OpenAI entwickelt hatte, aber privat halten wollte. Mit Gemini behauptet das Unternehmen, eine neue Ära eingeläutet zu haben, die über primär an Text gebundene LLMs hinausgeht und möglicherweise die Bühne für eine neue Runde von KI-Produkten bereitet, die sich deutlich von denen unterscheiden, die durch ChatGPT ermöglicht wurden.

Google bezeichnet Gemini als „nativ multimodales“ Modell, was bedeutet, dass es aus Daten lernen kann, die über reinen Text hinausgehen, indem es auch Erkenntnisse aus Audio, Video und Bildern aufnimmt. ChatGPT zeigt, wie viel KI-Modelle über die Welt lernen können, wenn ihnen genügend Text zur Verfügung gestellt wird. Einige KI-Forscher haben argumentiert, dass einfach größere Sprachmodelle ihre Fähigkeiten bis zum Punkt erhöhen könnten, an dem sie mit denen von Menschen konkurrieren.

Aber es gibt nur so viel, was man über die physische Realität durch den Filter des Textes lernen kann, den Menschen darüber geschrieben haben, und die schwer zu beseitigenden Einschränkungen von LLMs wie GPT-4 – wie das Halluzinieren von Informationen, schlechtes Reasoning und ihre merkwürdigen Sicherheitsmängel – scheinen darauf hinzudeuten, dass die Skalierung bestehender Technologie ihre Grenzen hat.

Vor der gestrigen Ankündigung von Gemini sprach WIRED mit Demis Hassabis, dem leitenden Entwickler von Gemini, dessen frühere Leistungen die Leitung des Teams umfassen, das den übermenschlichen Go-spielenden Bot AlphaGo entwickelte. Er war erwartungsgemäß begeistert von Gemini und behauptete, es führe neue Fähigkeiten ein, die letztendlich dazu führen werden, dass sich Googles Produkte abheben. Hassabis sagte jedoch auch, dass um KI-Systeme zu liefern, die die Welt auf eine Weise verstehen können, wie es heutige Chatbots nicht können, LLMs mit anderen KI-Techniken kombiniert werden müssen.

Hassabis befindet sich in einem aggressiven Wettbewerb mit OpenAI, aber die Rivalen scheinen sich einig zu sein, dass radikal neue Ansätze erforderlich sind. Ein geheimnisvolles Projekt, das bei OpenAI unter dem Namen Q* läuft, deutet darauf hin, dass das Unternehmen ebenfalls Ideen erforscht, die mehr beinhalten als nur die Skalierung von Systemen wie GPT-4.

Das passt zu Bemerkungen, die Sam Altman, CEO von OpenAI, im April am MIT machte, als er klarstellte, dass trotz des Erfolgs von ChatGPT das Feld der KI eine große neue Idee benötigt, um signifikante weitere Fortschritte zu erzielen. „Ich denke, wir sind am Ende der Ära, in der es um diese riesigen, riesigen Modelle geht“, sagte Altman. „Wir werden sie auf andere Weisen verbessern.“

Google hat möglicherweise gerade einen Ansatz demonstriert, der über ChatGPT hinausgeht. Aber vielleicht ist die bemerkenswerteste Botschaft vom Start von Gemini, dass Google darauf aus ist, etwas Bedeutenderes als die heutigen Chatbots anzustreben – genau wie es OpenAI offenbar auch tut.

Ich helfe Ihnen gerne KI-Tools in ihre Arbeitsprozesse in Ihrem Marketing zu integrieren. Über den folgenden Link gelangen Sie zu meinen Kontaktdaten.