Gedanken über KI

Damit hat Hollywood nicht gerechnet... Oder vielleicht doch?

Sora: Ein neues KI-Modell, dass 60-Sekunden Videos (in nahezu Hollywoodfilm-Niveau) mit nur 1 Prompt Realität werden lässt...

von Philipp Schrittwieser, BSc, MBA,

15. Feburar 2024

Blogbild

Sora: Ein neues KI-Modell, dass 60-Sekunden Videos (in nahezu Hollywoodfilm-Niveau) mit nur 1 Prompt Realität werden lässt...

Mittlerweile verstehe ich um einiges besser, warum Hollywood so vehement gegen KI-Unterstützung im Movie-Business ist/war:

Seit ca. 2h hat OpenAI "Sora" veröffentlicht (oder zumindest von Sora erstelle Videos veröffentlicht) und ich bin echt "paff"! Ich folge vielen Tech-YouTubern und beschäftige mich selbst sehr intensiv mit der Technologie (programmieren...), also war diese Entwicklung eigentlich absehbar, aber dennoch bin ich überrascht und zugleich fasziniert! Nur durch ein paar Zeilen Text entsteht wie durch Magie ein eigenes Video, fast so, als würde man direkt aus seinen eigenen Gedanken heraus Regie führen!

Aber was steckt dahinter?

Das Geheimnis von Sora liegt in seiner Fähigkeit, Textanweisungen in detaillierte Videos umzusetzen. Es nutzt ein Diffusionsmodell, das mit statischem Rauschen beginnt und dieses allmählich in klare Bilder umwandelt. Mit einer Transformer-Architektur ausgestattet, kann Sora komplexe Szenen mit mehreren Charakteren und präzisen Hintergrunddetails erstellen.

Die Zukunft mit Sora?

Die Möglichkeiten, die Sora eröffnet, sind atemberaubend. Bildungsmaterialien, Werbeinhalte, sogar die Unterstützung von Film-Producern bei der Visualisierung ihrer Ideen – all das könnte bald Realität werden. OpenAI plant, Sora einer ausgewählten Gruppe von Kreativprofis zur Verfügung zu stellen, um das Modell weiter zu verbessern und anzupassen. Leider vorerst nicht für die breite Öffentlichkeit verfügbar oder vielleicht Gott sei Dank?

Mein Fazit

Ich bin überzeugt, dass Sora nur der Anfang einer Revolution in der Videoproduktion ist. Wir stehen möglicherweise am Beginn einer neuen Ära, in der die Art und Weise, wie wir Geschichten erzählen und teilen, grundlegend verändert wird. Und während Sora noch seine Grenzen hat – wie die Schwierigkeit, komplexe Physik und spezifische Ursache-Wirkungs-Zusammenhänge zu simulieren – ist das Potenzial für die Zukunft gigantisch!

Hollywood wake up! ;) Mit Sora könnten wir bald Zeugen davon werden, wie KI in kürzester Zeit die verrücktesten kreativen Träume Realität werden lässt. Ich bin gespannt was als Nächstes kommt! AGI? Superintelligence?

* Ein bedeutender Teil dieses Beitrags wurde von Perplexity AI verfasst. Ich habe jedoch häufig meine persönlichen Notizen hinzugefügt und einige Adjektive ausgetauscht. Erkennst du den Unterschied?


Most people will miss it

Seit gut einem Jahr verwende ich fast täglich ChatGPT, aber...

von Philipp Schrittwieser, BSc, MBA,

14. Dezember 2023

Blogbild

Seit gut einem Jahr verwende ich fast täglich ChatGPT, aber...

"Aber ChatGPT lügt...", "ChatGPT kann nicht alles...", "ChatGPT macht viele Fehler.." Nicht nur, dass momentan sehr intelligente Menschen daran arbeiten, diese Probleme zu beseitigen, aber sie sind mir ehrlich gesagt auch vollkommen egal! ChatGPT unterstützt mich dabei, irgendwo zwischen 50% und 500% (intuitive Schätzung) produktiver in meiner Arbeit zu sein als zuvor.

Ist es perfekt? Nein!

Ist es gut? Ja, es ist verdammt gut!

Wird das erst der Anfang sein? Ja! OpenAI soll angeblich nächsten Monat (Dezember) mit dem Training von ChatGPT 5 fertig werden und Inflection AI trainiert angeblich momentan ein Modell, das 100x so groß wie ChatGPT 4 sein soll.

Wie weit kann es gehen? Das wissen momentan die wenigsten, aber mein derzeitiges Verständnis: Je größer das Modell, desto intelligenter!

Hauptsächlich nütze ich ChatGPT zum Programmieren. Er (weil der Chatbot) hilft mir, neuen Code zu schreiben, bestehenden Code zu optimieren oder Bugs in meinem Code zu beseitigen. Außerdem kann ich mit ChatGPT 4 auch darüber diskutieren, wie ich meine gesamte Software-Architektur verbessern kann, und das, indem ich ihm einfach einen Screenshot von einem PowerPoint-Slide sende!

ChatGPT schreibt, schlussfolgert, sieht, spricht, kann mir zu den meisten Themen eine qualitative Expertenmeinung geben und wird wahrscheinlich als eines der ersten Modelle, die einen Funken an eigener Intelligenz haben, in die Geschichte eingehen!

War das zu hyperbol formuliert? Ich denke nicht! Der Gedanke, dass ich von zu Hause, mit der OpenAI oder Claude API ("Programmier-Schnittstelle") in ca. einem Wochenende mir großteils von ChatGPT den Code schreiben lassen kann, der mithilfe von Javascript/Node JS die allermeisten Knowledge Tasks automatisieren kann, und dem Gefühl, dass das erst der Anfang gewesen ist, dann frage ich mich wirklich sehr, wie dann erst die Zukunft aussehen wird?

Spoiler Alert: Es wird wahrscheinlich ganz schnell gehen! Viele Graphen zeigen momentan exponentielles Wachstum (KI-Investment, vorhandene Rechenleistung, Rechenleistung in KI-Training investiert), das alles und einfach mein subjektives Gefühl, dass ich täglich bei der Nutzung von KI-Technologien verspüre, führt mich zu folgender Conclusio:

1. Die Zukunft wird sehr spannend.

2. Unsere Leben könnten sich drastisch verändern.

3. Menschen müssen sich viel mehr mit diesen Technologien beschäftigen, um nicht auf der Strecke zu bleiben.

Könnte ich falsch liegen? Das kann natürlich sein.

Die Tatsache, dass mir ChatGPT gerade 7 peinliche Fehler in meinem Text ausgebessert hat, bevor ich auf Senden klicken wollte bringt mich zum Lachen! ;)