Liebe Leserinnen und Leser! Nachdem OpenAIs „Sora“ ja für Normalsterbliche nicht verfügbar ist, habe ich mir die Alternativen angeschaut, die einem heutzutage zur Verfügung stehen. In meinem Fall sind dies „RunwayML“ und „Pika“. Was zeichnet diese Tools aus?
Was ist RunwayML?
Runway ML bietet eine fortschrittliche Möglichkeit, Bilder in beeindruckende Videos umzuwandeln, indem künstliche Intelligenz eingesetzt wird, um dynamische Bewegungen und Szenen zu erzeugen. Mit der Einführung von Runway Gen-2 können Benutzer nun einzigartige Videos aus einer Vielzahl von Quellen erstellen, seien es Textbeschreibungen, Bilder oder vorhandene Videoclips. Diese Funktion ermöglicht es, statische Bilder in bewegte Bilder zu verwandeln, die durch Text ergänzt werden können, um fesselnde Geschichten zu erzählen.
Und Pika?
Pika ist eine Plattform, die Kreativität in Bewegung bringt, indem sie die Möglichkeit bietet, Bilder in Videos umzuwandeln. Mit Pika können Nutzer ihre Lieblingsfotos, Gemälde und Zeichnungen in bewegte Szenen verwandeln. Der Schwerpunkt der Plattform liegt auf der kreativen Kontrolle, indem einfache Befehle zur Bearbeitung und Anpassung der Videos angeboten werden, wie z. B. das Ändern bestimmter Bildbereiche, das Erweitern der Leinwand und das Verlängern der Videolänge. Pika unterstützt die Ideen der Nutzer durch Text-zu-Video-, Bild-zu-Video- und Video-zu-Video-Funktionen und bietet so unendliche Möglichkeiten für die Erstellung einzigartiger Inhalte.
Aber was ist der Unterschied?
Ja, ihr habt Recht. Augenscheinlich können beide Tools das Gleiche. Unter der Haube gibt es aber einen wesentlichen Unterschied. RunwayML bietet ein „Brush Tool“ an, bei dem ihr die Teile des Bild markieren könnt und dann mittels Schieberegler definiert, wie sie sich bewegen sollen. Das bietet Pika aktuell (noch) nicht. Beide Tools verstehen aber auch Prompts, mit denen man die Bewegung genauer definieren kann bzw. könnte.
Das Ausgangsbild
Das Ausgangsbild für diesen schnellen Test kommt von Midjourney:
create a commercial shot of a single soda can, alpine landscape themed "ALPEN BIER " --v 6.0
Also kurz und knackig. Wobei ich schon fast verwundert war, dass Midjourney bei zwei Vorschaubildern den Text auf der Dose richtig geschrieben hat – damit haben Bild-KIs ja oftmals Probleme:
Das macht RunwayML
Ich habe mich dazu entschieden, keines der Bilder mit einem unterstützenden Prompt zu einem Video generieren zu lassen. Dennoch komm ich nicht umhin, bei RunwayML dem oben angeführten „Brush Tool“ eine Chance zu geben. Das Ergebnis seht ihr hier:
Im Großen und Ganzen sieht das schon gut aus! Das Wasser bewegt sich schön, allein der Baum im Hintergrund sieht nicht natürlich aus.
Das Pika Resultat
Pika läuft wie Midjourney auf Discord, Dort hab ich das Bild hinaufgeladen. Nach ca. einer Minute war das Ergebnis da:
Das Wasser gefällt mir bei RunwayML um Klassen besser! Was mich aber bei Pika am meisten stört, ist das, was das Tool mit dem Text macht! Da bin ich einmal richtig stolz auf Midjourney, dass der Text so passt, wie ich ihn gepromptet hab und dafür macht Pika den wieder „kaputt“!
Alles „nett“, aber nichts gegen Sora!
Und damit wir „Normalos“ noch alle richtig was zu weinen haben, gibt’s zum Abschluss meines Blogs noch ein Video von Sora (passend zum Thema „Wasser“).
Meine Herrschaften… Vor ein paar Tagen wäre ich von RunwayML noch richtig „geflashed“ gewesen, im Vergleich zu Sora ist das zum Kinderkram mutiert. Aber noch haben wir ja auf Sora keine Zugriff.
Mein „Testsieger“…
…wäre natürlich Sora. Aber darauf kann ich nicht zugreifen und deswegen bleibe ich bis dahin bei RunwayML, da mir das Tool wesentlich mehr „Finetuning“ erlaubt. Bei beiden Tools – so ehrlich muss man sein – ist es ein wenig „try and error“. Ob sich die Tools zu einem kommerziellen Nutzen eignen, darf aus heutiger Sicht bezweifelt werden.
Bis bald, euer Alex