Liebe Leserinnen und Leser! Seit dem Zeitpunkt, als DALL-E 3 in ChatGPT integriert wurde, experimentiere ich gerne damit. Es ist einfach lustig, wie ich der KI sagen kann, was sie zu tun hat – und das in natürlichen Sätzen und ohne krypisch-technische Anweisungen. Im Vorfeld sei gesagt: DALL-E 3 ist nicht Midjourney und kommt gerade bei realistischen Sachen nicht an den Marktführer heran. Aber schauen wir mal, was da noch kommt.
Der Ursprungsprompt
Folgende Aufgabe habe ich ChatGPT 4 gestellt:
Mache mir folgendes Bild: Ein 55 jähriger Mann mit kurzen Haaren, einer Brille mit schwarzem Brillengestell und einem grauen Goatee Bart sitzt auf einem schwarzen Harley Davidsson Chopper. Der Mann trägt eine Lederjacke. Das Bild soll von vorne aufgenommen sein, der Mann schaut in die Kamera. Im Hintergrund sieht man Berge, der Mann fährt auf einer Straße.
Ergänzt habe ich die Anforderungen dann um einen bestimmten Stil. Das Ergebnis seht ihr hier, der Stil ist in der Bildbeschreibung:
Schwächen
DALL-E 3 setzt künstlerische Aufgaben wirklich gut um. Wenn es um Fotorealismus geht, hat aber Midjourney die Nase weit vorn. Dieses Bild hat DALL-E 3 produziert:
Nein, es ist nicht schlecht. Aber es sieht mehr nach einer Computergrafik aus. Den Prompt hab ich dann in Midjourney eingefügt, das Ergebnis sehr ihr hier:
DALL-E 3 vs. Midjourney
Midjourney ist bekannt für seine Fähigkeit, detaillierte und realistische Bilder zu erzeugen. Es wird oft in kreativen Berufen verwendet, um konzeptionelle Kunstwerke, Produktdesigns und sogar Architekturvisualisierungen zu erstellen. Seine Stärke liegt in der Erstellung von Bildern, die nahe an fotografische Qualität heranreichen, und es bietet Benutzern eine intuitive Benutzeroberfläche.
DALL-E 3, entwickelt von OpenAI, hat eine breitere Palette an kreativen Möglichkeiten. Es kann halbwegs realistische Bilder generieren, aber auch surreale und abstrakte Kunstwerke. DALL-E 3 ist besonders bekannt für seine Fähigkeit, humorvolle und phantasievolle Bilder zu erstellen, die oft einen viralen Charakter haben. Die Weiterentwicklung von DALL-E 3 konzentriert sich darauf, noch realistischere Bilder zu erzeugen und gleichzeitig die Fähigkeit zu verbessern, abstrakte Konzepte und Anweisungen zu interpretieren.
Beide Tools haben ihre eigene Nische und werden in verschiedenen Szenarien verwendet. Während Midjourney für realistischere Darstellungen bevorzugt wird, eignet sich DALL-E 3 besser für kreative und experimentelle Projekte. Die laufende Entwicklung von DALL-E 3 zielt darauf ab, die Grenzen der Kreativität weiter zu verschieben und Benutzern mehr Flexibilität in der Bildgestaltung zu bieten.
Abschließend gesagt: Beide KIs liefern sehr gute Bilder, es kommt halt darauf an, wofür ich die Bilder benötige. In der Bedienung ist DALL-E 3 wesentlich lustiger, da ich mit dem Tool so reden kann, wie mir der Schnabel gewachsen ist, ohne das ich irgendwelche kryptischen Parameter verwenden muss.