Jetzt geht’s los mit Bildern in ChatGPT-4o: Was du wissen musst

Okay – das ist eine echte Ankündigung: ChatGPT kann jetzt selbst Bilder erzeugen, direkt im Interface. Wenn du also schon mal mit Midjourney oder DALL-E herumgespielt hast, kannst du dich jetzt freuen: Das neue Feature in ChatGPT-4o (das „o“ steht übrigens für „omni“) macht das Ganze noch einfacher, schneller und – ehrlich gesagt – ziemlich beeindruckend.

Und das Beste: Du brauchst dafür kein Prompt-Engineering-Studium. Aber bevor ich dir zeige, wie du damit realistische Bilder machst, hier erst einmal die Grundlagen.

Was ist neu an ChatGPT-4o?

ChatGPT-4o ist das neue Multimodal-Modell von OpenAI. „Multimodal“ bedeutet: Es kann Text, Bild, Audio und Video verarbeiten – und jetzt auch Bilder erstellen, ganz ohne Umwege über externe Tools. Die Bildfunktion basiert im Hintergrund auf DALL·E 3, aber der Zugang ist direkt in die Chat-Oberfläche integriert. Kein Discord, kein Spezialportal, keine API-Bastelei.

Du gibst einfach eine Bildbeschreibung ein – also einen Textprompt – und ChatGPT spuckt dir das passende Bild aus. So einfach ist das.

Wie starte ich?

  • Öffne ChatGPT (aktuell ist das Feature nur in der Pro-Version verfügbar).
  • Vergewissere dich, dass du GPT-4o verwendest (du kannst das Modell oben links auswählen).
  • Schreibe deinen Bildprompt, zum Beispiel: „Ein realistisches Porträt eines älteren Mannes mit wettergegerbtem Gesicht, im Stil eines Fotos aus den 1960er Jahren“.
  • Zack – das Bild wird generiert und direkt im Chat angezeigt.

Klingt einfach? Ist es auch. Aber wie bei allem, was mit KI zu tun hat: Die Magie steckt im Detail.

Wie bekommt man realistische Bilder hin?

Jetzt kommt der spannende Teil. Viele Leute schreiben etwas wie „ein schönes realistisches Bild von einem Hund“ – und wundern sich dann, wenn der Hund aussieht wie aus einem Disney-Film auf Steroiden. Um mit ChatGPT-4o realistisch aussehende Bilder zu erzeugen, muss man an seinem Prompt ein wenig feilen.

Hier ein paar Tipps aus der Praxis:

Sei präzise – wirklich präzise
Statt „realistisches Bild einer Frau“ lieber: „Eine 35-jährige Frau mit olivfarbener Haut, dunklen Locken, ungeschminkt, steht vor einem Fenster in natürlichem Licht, fotografiert mit einer 50-mm-Linse“.

Das klingt zunächst nerdy, aber je mehr man das Bild in Worte fasst, desto realistischer wird es. Die KI kann nur mit dem arbeiten, was du ihr gibst.

Fachbegriffe sind sehr hilfreich
Wenn du willst, dass ein Bild wie ein echtes Foto aussieht, benutze Begriffe wie

Fotostil: „analog“, „digital“, „Polaroid“, „Studioaufnahme“
Lichtverhältnisse: „goldene Stunde“, „weiches Licht“, „harte Schatten“
Kameraeigenschaften: „50mm-Objektiv“, „f1.8“, „hohe Schärfentiefe“
Bildaufbau: „Nahaufnahme“, „Halbtotal“, „Frontalaufnahme“

Das ist wie ein kleines Briefing für einen echten Fotografen – und die KI reagiert genauso dankbar.

Stil vs. Realiät
Wenn du „im Stil von Pixar“ schreibst, bekommst du ein Bild wie aus einem Zeichentrickfilm. Wenn du aber „im Stil eines Straßenfotos von New York 1975“ schreibst, bekommst du etwas ganz anderes – und oft viel realistischeres. Du willst es fotorealistisch? Dann sag es ausdrücklich.

Emotionen & Stimmung einbauen
Auch wichtig: Was soll das Bild ausdrücken? Schreibe es auf.
Beispiel: „Alter Mann sitzt allein auf einer Parkbank, regnerischer Tag, melancholischer Blick“.
Die KI versteht das erstaunlich gut.

Ein alter Mann sitzt allein auf einer Parkbank, regnerischer Tag, Melancholie in seinem Blick.

    Was du vermeiden solltest

    • Vage Begriffe wie „schön“, „interessant“, „cool“ – das ist Geschmackssache und für die KI zu vage.
    • Zu viele Stile mischen („im Stil von Van Gogh, aber wie ein modernes Straßenfoto“ – ergibt oft Murks).
    • Keine Details angeben – das Ergebnis ist ein generisches Bild.

    Wie viele Bilder kann man machen?

    Im Moment scheint es eine Art „weiches Limit“ zu geben, wie viele Bilder du pro Tag generieren kannst – das ist nicht öffentlich dokumentiert, aber wenn du viele in kurzer Zeit machst, musst du vielleicht eine Pause einlegen.

    Außerdem kannst du derzeit nur ein Bild auf einmal erstellen. Also kein „Mach mir 4 Versionen davon“ – zumindest noch nicht.

    Was macht diese Funktion so besonders?

    Kurz gesagt: Es senkt die Schwelle. Du brauchst keine weiteren Werkzeuge, kein technisches Know-how. Einfach Bildidee rein – fertig.

    Und: Es macht auch noch Spaß. Du kannst alles ausprobieren: Portraits, Produktdesigns, Logos, Fantasiewelten, Moodboards, Cover Art … alles direkt im Chat.

    Das Teil kann TEXT!

    Eine große Schwäche von generativer Bilder-KI war immer die Darstellung von Text im Bild. Das gelang so gut wie nie. Doch nun:

    ChatGPT Image 26. Maerz 2025 11 05 29 | DIGITALHANDWERK

    Und dieser Prompt war jetzt nicht mal aufregend schwer: create a cover of the vogue magazin, showing Monica Bellucci in a red dress on an italian Beach, holding a glass champagne

    ChatGPT-4o + Bilder = Gamechanger

    Die neue Bildfunktion in ChatGPT-4o ist kein Gimmick, sondern ein echtes Kreativwerkzeug. Natürlich haben Midjourney & Co. (noch) ihre Daseinsberechtigung, aber um schnell, intuitiv und qualitativ hochwertig Bilder zu generieren, ist das hier schon ziemlich stark.

    Wer sich ein wenig mit den Prompts auseinandersetzt und lernt, seine Bildideen richtig zu formulieren, kommt zu Ergebnissen, die richtig gut aussehen – und manchmal sogar fast unheimlich echt wirken.

    Also: ausprobieren, spielen, testen. Und ruhig ein bisschen nerdig werden. Die besten Bilder kommen meist von den detailliertesten Aufgabenstellungen.

    PS: Es versteht sich von selbst, dass alle Bilder in diesem Beitrag von ChatGPT gemacht wurden 😉

    War der Beitrag für dich hilfreich?

    Klick bitte auf die Sterne zur Bewertung.

    Durchschnittliche Bewertung: 5 / 5. Anzahl der Bewertungen: 21

    Bislang keine Bewertungen

    Hinterlasse einen Kommentar

    This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

    The reCAPTCHA verification period has expired. Please reload the page.