Letzte Woche haben mir so viele Leute das Sora-Video von Open AI geschickt, dass mein Postfach schier übergelaufen ist.
Mit solchen Kommentar: Schon gesehen? Krass! Unreal! Das kann KI schon? Aber auch: Was bedeutet das für die Industrie, die Werbung? Was bedeutet das für mich als Medienschaffender? Als Drohnenpilot? Kamerafrau? Cutter? Regisseur? Wie werden sich unsere Jobs verändern? Sind wir überflüssig? Und – Ist das jetzt schon AGI?
Aber von vorne:
Bildgeneratoren mit KI hat inzwischen jeder gesehen. Ich hab mit einigen herumgespielt und mit Playground.ai z.B. tolle Ergebnisse bekommen. Alle Bilder, Hintergründe und Grafiken in dieser Folge sind mit oder zumindest mit Hilfe von KI erstellt.
Die geschaffenen Bilder sind mega beeindruckend und falls gewünscht, von der Realität meist kaum mehr zu unterscheiden. Sora kann das jetzt mit Video! Ein paar Wörter und das Video ist fertig.
Aber schauen wir uns doch mal ein paar auf diese Art generierte Filme an. Wie bei den Bildern, muss man auch hier eingeben, was man sehen möchte. Der Promt, also die vorgegebene Beschreibung für dieses Video lautet in etwa:
Eine stylishe Frau läuft durch Tokio. Warme Neonlichter und animierte Schilder. Sie trägt eine schwarze Lederjacke, ein langes rotes Kleid, schwarze Stiefel und eine schwarze Handtasche. Sie trägt eine Sonnenbrille und einen roten Lippenstift. Sie läuft zuversichtlich und lässig. Der Boden reflektiert die bunten Lichter. Viele Fußgänger.
Aus diesen paar Worten hat Sora jetzt ein einminütiges Video erstellt. Wahnsinnig nahe an der Realität, perfekt ausgeleuchtet, mit einer dynamischen Kamerafahrt und es hat “nichts” gekostet. Bei einer regulären Produktion wären hier ca. 20 Leute am Set. Mit einem 7,5-Tonner Licht, Schienen für den Kameradolly, Steadycam, Straße sperren lassen, Wohnwagen für Maske und Talent, Catering-Truck. Dann fängt es vielleicht an zu regnen… Diese Aufnahmen hätten bestimmt 20.-50.000.-€ gekostet.
Wenn man hier jetzt noch coole Mukke unterlegt, paar schnelle Schnitte, irgendein Effekt drauf und am Ende z.B. ein Prada-Logo eingeblendet. Fertig ist die Kampagne!
Noch – muss man sagen – sind die Clips ohne Ton – aber auch das wird nicht mehr lange dauern. Dann kann man sicher auch Dialoge oder einfach ein Thema vorgeben – und die Charaktere sprechen miteinander.
Diese Technologie ist gerade dabei, unser ganzes Leben und die globale Wirtschaft für immer zu verändern.
Denn Sehen bedeutet nicht mehr Glauben.
DEFINITION AI und AGI
AI ist, denke ich, jedem bekannt als Artificial Intelligence oder KI – für Künstliche Intelligenz. Der Durchbruch bei AI ist aber AGI. AGI bedeutet Artificial General Intelligence – oder auf Deutsch: Allgemeine Künstliche Intelligenz
Kann man sich so vorstellen:
AI – Künstliche Intelligenz – ist ein Tool, sowas wie ein Taschenrechner.
Chat-GPT hilft uns z.B. beim Schreiben von Mails und sogar wissenschaftlichen Texten.
AGI hat den Taschenrechner erfunden.
AGI ist eine hochentwickelte Künstliche Intelligenz, die jede gestellte Aufgabe besser als ein Mensch erledigen kann.
Also – z.B. erfinde mir einen optimalen Routenplaner, erfinde ein neues Medikament, erfinde mir einen World-Simulator. So nennt Open AI nämlich ihr SORA-Projekt. World Simulator. Und das ist es auch.
Sora sieht für mich jetzt schon aus wie AGI, zumindest für Video-Produktionen. Jede Aufgabe in der Videoproduktion, die ich sonst einem Regisseur, einer Kamerafrau, einem Cutter geben würde, erfüllt SORA schneller und “besser”.
Ich stelle mir in Zukunft die Interaktion so vor: Wir starten wieder mit einem Prompt, also der Videobeschreibung. Kann ich später sicher auch per Sprache eingeben:
Sora, zeige mir: “Einen Film Trailer von den Abenteuern eines 30-jährigen Weltraum Reisenden, der einen roten, gestrickten Motorradhelm trägt. Blauer Himmel, Salzwüste, Kino-Style, auf 35mm Film gedreht, lebendige Farben.”
Und das ist dabei rausgekommen: lässige Aufnahmen in der Wüste von einem Astronauten mit gestricktem Helm. Krass!!
Jetzt ist das aber viel zu lange für meinen Spot:
Sora, zeige mir eine 7 Sekunden-Version.
Und natürlich Musik und Soundeffekte
Sora, Moderne Musik. Space und Roboter-Geräusche hinzufügen.
Cool.
Sora, erstelle für das Ende einen 4 Sekunden Zoom auf einen Packshot von einer HUGO BOSS Parfümflasche. Setting: Salzwüste, Flasche hat Ähnlichkeit zu einem UFO.
Sieht schon nicht schlecht aus.
Sora, füge Lensflares hinzu und gleiche die Farbe des Packshots auf das Video an.
Fertig ist die neue Werbung für UFO von HUGO BOSS.
Verrückt!!
Ich kann euch privat gerne die ganze Rechnung aufstellen, aber diese Produktion hätte sicher 500.000,- Euro gekostet. Setbau, Wüste, großer Kunde, große Agentur, monatelange Vorbereitung. Und jetzt – in Zukunft? Bezahlt mich in Zukunft jemand dafür, zehn solche Kampagnen zu entwerfen? Was heißt entwerfen? Komplett produziert zu präsentieren! Und der Kunde sucht nur noch aus. Wird der Cutter, der Regisseur zum Promt-Engineer? World Simulator Operator? Sim-Creator?
Bei unserem Weltraumreisenden hab ich den letzten Schliff per Hand gemacht, aber sobald mich die AI versteht und meine Änderungen so umsetzt wie ich es machen würde – nur schneller – dann ist es für mich AGI. AGI Artificial General Intelligence – also Allgemeine Künstliche Intelligenz ist die wichtigste Erfindung in der gesamten Menschheitsgeschichte und wird wahrscheinlich auch unsere letzte sein. Denn wenn du etwas erschaffst, das alles erschaffen kann, ist das Spiel vorbei.
Ich dachte früher, das ist Science-Fiction, oder es würde zumindest noch lange dauern und wahrscheinlich nicht so lange ich lebe. Aber es ist irgendwie beängstigend, wie schnell es tatsächlich passiert und sich beschleunigt. Seit der AI Hype losgegangen ist, erzähle ich jedem der es hören will und noch ein paar Leuten mehr, dass es Millionen von Arbeitsplätzen nicht mehr geben wird. Und während dieses Videos werde ich wahrscheinlich mehr Fragen stellen als beantworten, weil ich die Antwort auch nicht kenne.
Was passiert zum Beispiel mit all den 3D-Leuten? Die Animations-Künstler, die Sachen wie Toy Story gemacht haben. Das sind etwa 2 Millionen Menschen weltweit. Sind die ab morgen arbeitslos? Entscheidet selbst: Hier ist eine animierte Szene mit einer Nahaufnahme eines kleinen flauschigen Monsters neben einer schmelzenden roten Kerze. Wenn ich dieses Monster jetzt losschicken kann – und Abenteuer erleben lassen kann – wow! Just wow!
Was wird aus Unternehmen, die Kameras, Objektive oder Drohnen herstellen? Der Drohnenhersteller DJI investiert Millionen Euro in Entwicklung und jetzt musst du nur „Drohnensicht Amalfi-Küste“ eingeben. Und zack. Du bekommst ein perfektes Drohnenvideo in Kinoqualität. Das ist verrückt. Niemand musste sich Drohnen-Equipment kaufen oder leihen, nach Neapel fahren, sich Fluglizenzen besorgen, das richtige Wetter abwarten, verschiedene Flugmanöver trainieren, Abstimmung mit dem Kunden, Aufnahmen machen, Material sichern, schneiden, farbkorrigieren. Das fällt alles weg!!
Das ist auch das Ende der Stockfootage-Branche. Warum sollte ich diesen Amalfi-Drohnen-Shot-Video kaufen, wenn ich ihn mit KI einfach selbst herstellen kann?
Aber es wird noch besser:
Zu dem Drohnenflug lass ich mir jetzt noch ein Hotel generieren, lachende Menschen beim leckeren Frühstück und eine wunderschöne Poollandschaft. 1800.-€ pro Person für eine Woche. Was hält mich davon ab, so ein Reiseangebot von einem nicht existierenden Urlaubsdomizil zu erstellen? Ach ja – mein Gewissen… aber da geht es sicher nicht jedem so.
Was ist mit Unternehmen wie Sigma, Canon, Zeiss, die spezielles Glas für Makroobjektive herstellen? Hier ist zum Beispiel eine extreme Nahaufnahme eines 24-jährigen Frauen Auges, das in Marrakesch während der Goldenen Stunde zwinkert.
Da muss man schon ganz ganz genau hinsehen, um zu erkennen, dass das KI ist.
Wer kauft sich da noch ein Macro für tausende Euro? Wer soll die R&D-Abteilung bezahlen, wenn keine Nachfrage mehr besteht.
Es wird viele Arbeitsplätze geben, die beseitigt werden oder zumindest deren Einkommen drastisch reduziert werden, und die Jobs werden sich auf weniger Arbeitsplätze konzentrieren. Netflix sucht gerade einen KI-Plattform-Manager und bietet 900.000 Dollar pro Jahr. Wenn dafür 30, 50, 100 Jobs wegfallen, ist das noch immer günstig. Und das Beängstigende, ohne Angst schüren zu wollen, weil ich die Antwort nicht kenne – wenn man eine ganze Branche eliminiert, auch wenn es nur eine kleine ist, kann das Auswirkungen auf die gesamte globale Wirtschaft haben. Mit Arbeitsplatzverlust, Produktivitätsverlust, geringeren Gewinnen, Lieferkettenproblemen. Was ist mit den Mieten, den Krediten und Autos dieser Menschen – wer bezahlt dafür, wenn sie es nicht mehr können.
Diese Technologie ist so gut geworden, dass die Menschen in diesen KI-Videos real aussehen, besonders für Menschen, die vielleicht nicht nach dem suchen oder sich dessen vielleicht nicht bewusst sind, was KI bereits kann. Und das Schockierende daran – diese Technologie wird immer schneller, immer besser.
Sehr unspektakulär und trotzdem für mich sehr beeindruckend war dieser Clip: Reflektion im Fenster eines durch Tokios Vororte fahrenden Zuges. Das sieht für mich echt aus. Verzerrte Linse, Kamera-wackeln, hell/dunkel Spiel der Reflektion. Bombe. World Simulator.
Aber – Wie wird SORA die Welt verändern? Wo führt das ganze hin? Ich hoffe auf eine neue Staffel Game of Thrones. Mit oder ohne alternativem Ende der letzten real produzierten Staffel. Ich hoffe auf eine Kinoversion meines Lieblingshörbuchs. A propos – ich hör ja gerne Hörbücher mit einer Spielzeit von gerne 15-20 Stunden. Daraus könnte jetzt mit nur einem Copy-Paste Befehl ein 20stündiger Film werden. Das sind 1200 Minuten – eine Folge 45 Minuten – macht 26 Folgen – 2 Staffeln á 13 Folgen – schon kannst du dein Lieblings-Hörbuch über’s Wochenende auf dem Fernseher bingen. Und danach gleich nochmal 2 Staffeln, die komplett von der KI erstellt sind.
Was bedeutet das für Autoren? Die schreiben kein Drehbuch mehr, sondern sprechen mit der KI über die Idee, über die Geschichte. Und man entwickelt zusammen einen Plot. Am Ende des Tages ist jetzt JEDER Autor und es kommt nur darauf an, wie gut deine Geschichte ist. Die Möglichkeiten der Umsetzung sind jetzt OPEN SOURCE. Es ist egal, ob du eine 100.000.-€ Kamera hast, es ist egal ob du ein begnadeter Cutter bist – die Idee zählt. Den Rest macht die KI.
Sobald die Technologie verfügbar ist, wird SocialMedia geflutet werden von neu generiertem Material. Eventuell wird man auf den Plattformen angeben müssen, ob der Inhalt mit KI erstellt wurde und Algos überprüfen permanent “nicht gekennzeichnete” Clips auf Authentizität. Ich freue mich jetzt schon auf die verrückten Filme und Serien, die uns diese Technologie bescheren wird. BreakingBad im Weltraum. Eine zweite Staffel the peripheral. (da war ich echt traurig). Aber auch Experimente mit Zukunftsvisionen oder wie hier: historisches Material aus der Goldrush-Zeit.
Nur die eigene Vorstellungskraft ist das Limit.