Seit kurzem ist etwas möglich, was sich viele Nutzer von KI-Tools schon lange gewünscht haben: Bilder direkt in ChatGPT zu erstellen – und das auf einem Niveau, das sich wirklich sehen lassen kann. Mit dem neuen ChatGPT 4o-Modell hat OpenAI eine Version veröffentlicht, die nicht nur schneller und flexibler mit Prompts umgeht, sondern auch Bilder erzeugen kann, die qualitativ mit Midjourney oder DALL-E mithalten können – und das direkt im Chat.
Ein besonders spannendes Feature in diesem Zusammenhang: Man kann eigene Fotos hochladen und sich in beliebigen Szenen darstellen lassen – von der Wüste auf Tatooine bis zum schicken Fotoshooting im New Yorker Loft. Klingt verrückt? Ein bisschen schon. Aber vor allem ist es ein echter Gamechanger.
Das eigene Gesicht als kreatives Werkzeug
Viele kennen Tools wie Lensa, Voilà AI Artist oder Artbreeder – alles Apps, mit denen man sich von KI in verschiedene Stile und Welten versetzen lassen kann. Der Haken: Oft kostenpflichtig, mit eingeschränkten Optionen und manchmal eher „naja“ in Sachen Ähnlichkeit oder Qualität.
ChatGPT 4o bringt diese Funktion nun direkt in den Dialog. Du kannst ein Selfie hochladen – oder mehrere Bilder von dir aus verschiedenen Perspektiven – und dann einfach sagen, was du sehen möchtest.
Und so geht’s:
Lade einfach mal 1-2 Bilder von dir hoch (ja, ich bin nicht fotogen)
ChatGPT analysiert dein Gesicht und erzeugt ein Bild, das dich in deinem gewünschten Setting zeigt – ohne dass du einen Cent extra zahlen oder ein externes Tool verwenden musst. Natürlich ist es noch nicht perfekt (gerade bei Posen oder Händen gibt’s gelegentlich kuriose Ergebnisse), aber: Das Niveau ist beachtlich und reicht oft schon für Social Media, Moodboards oder einfach zum Spaß.
Nun folgt der Prompt:
ich hätte gerne ein fotorealistisches bild von mir, wo ich auf einem motorrad sitze und auf einer einsamen straße im sonnenuntergang fahre. mein gesicht muss gut sichtbar sein. aufgenommen mit einer 50 mm linse, im format 16 zu 9
Voila! Da nach einiger Zeit erscheint das Bild:
Der Trick mit dem Prompt
Wie bei Midjourney oder DALL-E gilt auch hier: Der Prompt ist alles. Je klarer und bildhafter du beschreibst, was du willst, desto besser wird das Ergebnis. Ein Beispiel:
🟡 Weniger hilfreich: „Ich in einem Wald“
🟢 Besser: „Foto von mir, wie ich mit einem grünen Umhang in einem nebligen Wald stehe. Umgeben von moosbewachsenen Bäumen, Dämmerlicht, magische Atmosphäre“.
Der Unterschied? Der zweite Prompt liefert viel mehr visuelle Hinweise. Die KI versteht, was du sehen willst – und das sieht man dem Ergebnis an.
Tipp am Rande: Wer sich unsicher ist, kann auch mit Midjourney (z.B. V6) Bildideen generieren, dort den Prompt verfeinern und dann die beschriebene Szene in ChatGPT übertragen – diesmal eben mit dem eigenen Gesicht als Hauptdarsteller.
Mach mich als Comic
Die eigene Person als Comicfigur? Kein Problem. Bleib (das setze ich jetzt voraus) im gleichen Chat und schreib einfach den richtigen Prompt:
nun bitte im stil eines marvel comics, mit einer sprechblase wo angedeutet wird, dass ich "born to be free" singe. das format soll nun 9 zu 16 sein, also zeigt auch mehr vom motorrad
Das Resultat:
Ja, ChatGPT kann auch Simpsons. Sag der KI einfach nur, dass er das Bild nun im Stil der Simpsons machen soll:
Vorbereitung ist das Wichtigste!
Damit deine Bilder auch wirklich nach dir aussehen, sind ein paar Dinge zu beachten:
- Gute Referenzbilder hochladen: Ideal sind 2–3 Fotos mit neutralem Gesichtsausdruck, unterschiedlichen Winkeln (frontal, leicht seitlich) und guter Belichtung. Selfies gehen, Studiofotos sind natürlich noch besser.
- Stil wählen: Möchtest du realistische Fotos? Dann schreib das auch so („photo-realistic“ oder „realistic style“). Willst du eher Kunst- oder Comic-Stil, dann entsprechend umformulieren.
- Kontext ist King: Die Szene muss gut beschrieben sein – Licht, Kleidung, Hintergrund, Stimmung – je konkreter, desto besser.
Und keine Sorge: Deine Bilder bleiben privat, solange du sie nur in deinem Chat verwendest.
Was (noch) nicht geht – aber vielleicht bald
Natürlich ist das Ganze keine Zauberei. Manchmal stimmen die Proportionen nicht ganz, Gesichter wirken verzerrt oder Kleidungsdetails passen nicht zum Setting. Auch mit dynamischen Posen tut sich die KI noch schwer. Und: Es ist (noch) nicht möglich, einen Avatar dauerhaft zu speichern, der in mehreren Szenen gleich bleibt.
Aber: Für schnelle Visualisierungen, kreative Experimente oder einfach nur zum Spaß ist es erstaunlich, wie weit man mit ein paar Prompts kommt.
Warum das spannend ist – auch für Profis
Gerade für Content Creator, Designer, Autoren oder Social Media-Macher ergeben sich durch diese Funktion komplett neue Workflows. Statt Stockfotos von irgendwem kannst du dich selbst in Szene setzen – im gewünschten Stil, zur passenden Jahreszeit, im Kontext deines Themas.
Das spart Zeit, Geld und macht Spaß. Du willst dich auf deinem Blog als Cyberpunk-Krieger präsentieren? Kein Problem. Du brauchst ein Titelbild für deine E-Book-Seite, auf dem du wie ein Detektiv aus den 40er Jahren aussiehst? Läuft.
KI-Bilder mit deinem Gesicht? Ja, bitte!
ChatGPT 4o bringt etwas zurück, was viele KI-Tools oft vermissen lassen: Persönlichkeit. Und dank der Möglichkeit, eigene Bilder hochzuladen, wird das Ganze zu einer kreativen Spielwiese für alle, die Lust haben, sich selbst in Szene zu setzen – sei es zum Spaß oder mit ernsthaftem Anspruch.
Natürlich ist das erst der Anfang. Aber wer heute experimentiert, wird morgen ganz vorne mit dabei sein – sei es als Kreativer, als Markenmacher oder einfach als jemand, der Lust auf neue digitale Möglichkeiten hat.
PS: Mich gibt’s jetzt auch als Action Figur zu kaufen 😀