OpenAI hat kürzlich sein neuestes KI-Modell namens Sora vorgestellt, das in der Lage ist, auf der Grundlage von Textbeschreibungen, die als Eingabeaufforderungen bereitgestellt werden, äußerst realistische Videos zu erzeugen. Obwohl es noch nicht verfügbar ist, wird seine Veröffentlichung mit Spannung erwartet. Die Ankündigung von Sora hat das Internet aufgrund der unglaublichen Realitätsnähe, mit der Videos allein auf der Grundlage von Text erzeugt werden können, in Aufregung versetzt.

Was ist Sora?

Sora ist das neueste KI-Modell von OpenAI, das in der Lage ist, extrem realistische und kreative Videos aus Textbeschreibungen von Nutzern zu erstellen. OpenAI zeigte auch Beispiele von Videos, die von Sora generiert wurden (natürlich ohne jegliche Bearbeitung). Die Ergebnisse waren verblüffend. Wenn Sie wissen möchten, warum Sora derzeit eine Internet-Sensation ist, schauen Sie sich auf der Website weitere Videobeispiele an. Sie werden erstaunt sein.

Wie benutze ich OpenAI Sora und seine API?

Wenn Sie OpenAI’s ChatGPT noch nicht benutzt haben, funktioniert Sora ähnlich. Sora wartet darauf, dass der Benutzer eine Eingabeaufforderung zur Verarbeitung sendet. Ein Beispiel für eine Eingabeaufforderung, mit der Sora ein Video erstellt hat, lautet wie folgt

“Das schöne, verschneite Tokio ist voller Leben. Die Kamera bewegt sich durch die belebten Straßen der Stadt und folgt mehreren Menschen, die das schöne Schneewetter genießen und an nahe gelegenen Ständen einkaufen. Wunderschöne Kirschblütenblätter fliegen zusammen mit Schneeflocken im Wind”.

Beachten Sie, dass die Eingabeaufforderung viele Details über die Szene enthält – und dass Sora all diese Details berücksichtigt, um ein Video zu produzieren, das der Realität sehr nahe kommt. Die Videos, die Sie mit Sora erstellen können, sind im Grunde nur durch Ihre Vorstellungskraft begrenzt.

Was kann Sora?

Obwohl Sora von OpenAI nicht das erste KI-Modell zur Generierung von Videos ist, übertrifft es bestehende KI-Video-Generatoren in vielen Aspekten, wie:

  • Qualität und Realismus: Die Videos, die Sora produziert, sind außergewöhnlich präzise und konsistent mit der gegebenen Eingabeaufforderung. Darüber hinaus hat Sora eine beeindruckende Realitätstreue, als wäre es live gefilmt worden.
  • Anpassbare Ansichten: Mit Sora können Sie festlegen, wie das Video aufgenommen werden soll. Es könnte eine Vogelperspektive einer Autoverfolgungsjagd sein oder vielleicht eine Nahaufnahme eines Löwen bei der Jagd.
  • Minutenlange Videos: Während andere KI-Modelle nur einige Sekunden an Videos erstellen können, kann Sora eine minutenlange Szene generieren, die komplexe Elemente enthält.

Wofür wird die Sora API genutzt?

OpenAI’s Sora wird hauptsächlich für die Videogenerierung verwendet. Sie müssen nicht mehr nach draußen gehen oder einen Stunt nachmachen, um ein Video zu haben. Alles, was Sie tun müssen, ist eine Eingabeaufforderung mit einer genauen Beschreibung bereitzustellen, um das gewünschte Video zu generieren.

Es gibt viele mögliche Anwendungen für Sora. Zum Beispiel kann Sora verwendet werden, um Lernvideos für Kinder zu erstellen oder vielleicht um eine Kampfszene in einem Spiel zu erzeugen. Wo immer Sora anwendbar ist, kann erwartet werden, dass es die Effizienz steigert und die Kosten in vielen verschiedenen Aspekten und Gemeinschaftssektoren der Gesellschaft senkt.

Ist Sora (und seine API) bereits verfügbar?

Zum Zeitpunkt dieses Schreibens sind Sora und die Sora APIs noch nicht öffentlich verfügbar. Nur ausgewählte Entwickler haben Zugang zu Sora, um mögliche Schwächen und Risiken des Sora KI-Modells zu evaluieren. Auf der anderen Seite ist eine Handvoll visueller Künstler, Designer und Filmemacher eingeladen, die aktuellen Fähigkeiten von Sora zu bewerten und Feedback zu geben, wie OpenAI Sora verbessern kann. Der Grund, warum OpenAI Sora noch nicht veröffentlicht hat, ist, dass es noch nicht perfekt ist. Insbesondere bei der Simulation komplexer Szenen mit spezifischen Ursache-Wirkungs-Beziehungen hat Sora noch Schwächen.

Ein weiteres von OpenAI angesprochenes Problem ist, dass das aktuelle Sora-Modell bei komplexen räumlichen Details einer Eingabeaufforderung, wie z.B. was links und was rechts ist, verwirrt wird. Sora findet es auch schwierig, Beschreibungen von Eingabeaufforderungen über die Zeit zu verfolgen.

OpenAI konsultiert weiterhin die notwendigen Drittparteien (z.B. politische Entscheidungsträger, Pädagogen und Künstler), um sicherzustellen, dass Sora gut in unsere Gesellschaft integriert werden kann.