Ziel: Du lernst, wie du aus klaren Texten echte Bilder entstehen lässt – realistisch, kreativ und technisch sauber.
Zielgruppe: Anfänger jeden Alters
Tools: ChatGPT und/oder Google Gemini Nano Banana (am besten über Google AI Studio)
Warum so viele KI-Bilder gleich aussehen
Scroll durch Social Media: du siehst dieselben makellosen Gesichter, dieselben pastellfarbenen Sonnenuntergänge, dieselben generischen Räume. Warum? Weil die Prompts alle gleich klingen.
„Ein schöner Sonnenuntergang über dem Meer.“
„Eine Frau mit Laptop im Büro.“
„Ein futuristischer Roboter.“
Das Problem ist nicht die KI – sondern die Einfallslosigkeit. Wenn du willst, dass dein Bild lebt, musst du der KI zeigen, was du siehst. Nicht was sie erraten soll.
Wie KI aus Text ein Bild macht
Sowohl ChatGPT (mit DALL-E Engine) als auch Google Nano Banana verstehen deinen Prompt als eine Art Regieanweisung. Du beschreibst Szene, Stimmung, Stil und Details – die KI übersetzt sie in Pixel.
- ChatGPT arbeitet sehr intuitiv. Es versteht Emotion, Atmosphäre und einfache Sprache. Perfekt für schnelle, kreative Visuals.
- Nano Banana ist analytischer. Es achtet stärker auf technische Angaben wie Licht, Perspektive, Farbstimmung oder Stilrichtung.
Die Kombination beider Tools ist Gold wert:
ChatGPT hilft dir, die Idee zu formulieren. Nano Banana setzt sie präzise um.
Dein erster Bildprompt
Fangen wir simpel an:
Schlecht wäre:
„Ein Mann arbeitet am Laptop.“
Gut ist:
„Ein Mann sitzt frühmorgens in einem hellen Büro vor seinem Laptop, das erste Sonnenlicht fällt auf den Tisch, neben ihm eine Kaffeetasse. Realistischer Stil, natürliche Farben.“
Wenn du diesen Prompt ins AI-Studio eingibst, Aspect Ration 16:9 auswählst, dann fängt Nano Banana sofort an. Das zweite Beispiel liefert plötzlich Stimmung, Tiefe und Komposition.
Die KI weiß jetzt, woher das Licht kommt, welche Atmosphäre du willst und wie das Bild aufgebaut ist.

Aufbau eines guten Bildprompts
Ein starker Bildprompt besteht aus fünf Bausteinen:
- Motiv: Wer oder was ist im Bild? „Eine ältere Frau mit grauen Haaren liest am Fenster.“
- Umgebung: Wo passiert es? „In einem alten Wohnzimmer mit Pflanzen und Holzmöbeln.“
- Licht & Stimmung: Welche Atmosphäre herrscht? „Weiches Morgenlicht, ruhige, warme Töne.“
- Stil & Technik: Wie soll das Bild aussehen? „Realistisch, fotografisch, 16:9 Format.“
- Details: Was macht das Bild besonders? „Kleine Staubpartikel im Sonnenlicht, Fokus auf ihr Lächeln.“
Wenn du diese Struktur nutzt, produziert fast jede KI sofort deutlich bessere Ergebnisse.
Licht – die Seele des Bildes
Licht entscheidet über Stimmung.
Sag der KI also immer, woher das Licht kommt und wie es wirkt.
- Morgenlicht: sanft, golden, ruhig
- Mittagslicht: klar, kontrastreich, hart
- Abendlicht: warm, melancholisch, weich
- Neonlicht: modern, kühl, künstlich
Beispiel:
„Ein Musiker auf einer Bühne, beleuchtet von blauem Neonlicht, Publikum im Schatten.“
Klingt sofort anders als:„Ein Musiker auf einer Bühne.“
Komposition & Perspektive
Eine der größten Stärken moderner KI-Bildgeneratoren ist ihre Fähigkeit, räumliche Tiefe zu verstehen.
Sag also, aus welcher Perspektive du das Bild sehen willst.
Beispiele:
- Nahaufnahme: emotional, persönlich
- Totale: Überblick, Kontext
- Froschperspektive: kraftvoll, heroisch
- Vogelperspektive: ruhig, übersichtlich
Beispiel-Prompt:
„Ein Kind läuft barfuß über eine Wiese, fotografiert aus Froschperspektive bei tiefstehender Sonne, realistisch.“
Das erzeugt sofort Dynamik:

Stil & Genre
Jetzt wird’s spannend.
Mit Stilentscheidungen legst du fest, wie dein Bild wirken soll:
- Realistisch: naturgetreue Darstellung
- Reportage: wie ein Pressefoto, echt und spontan
- Cinematic: wie eine Filmszene
- Aquarell / Illustration / 3D / Retro / Noir: klarer Stilcharakter
Ein einziger Zusatz verändert alles:
„Eine Frau steht im Regen“
vs.„Eine Frau steht im Regen, filmischer Stil, warmes Gegenlicht, Cinematic Lighting.“
Das zweite klingt nicht nur schöner – es fühlt sich nach Geschichte an.

Fehler, die fast alle machen
- Zu kurze oder unklare Prompts
- Widersprüchliche Angaben („helles Nachtbild“)
- Kein Stil, kein Licht, kein Kontext
- Zu viele unnötige Adjektive („wunderschön, fantastisch, toll“)
- Alles auf einmal
KI ist kein Wahrsager.
Wenn du fünf Stilrichtungen in einem Satz vermischst, bekommt sie Kopfschmerzen.
Also lieber klar und einfach: ein Gedanke pro Prompt.
Bonus-Tipp: Variationen statt Perfektion
Niemand trifft beim ersten Mal den perfekten Prompt.
Das Geheimnis ist, Varianten zu testen.
Fang mit einer Basis an, zum Beispiel:
„Ein alter Fiat 500 auf einer italienischen Küstenstraße bei Sonnenuntergang.“
Dann spiel mit Licht und Stil:
- „…bei leichtem Regen, melancholisch, Film noir.“
- „…in den 1970ern, grobkörniger Filmlook.“
- „…minimalistisch, moderne Architektur im Hintergrund.“

So lernst du, wie sehr kleine Änderungen die Wirkung verändern.
Das macht Spaß – und trainiert dein Auge.
KI richtig verstehen
ChatGPT und Nano Banana sind keine Künstler, aber sie sind exzellente Werkzeuge. Sie verstehen Sprache, Struktur und Stil. Deine Aufgabe ist es, sie anzuleiten – nicht zu überfordern.
Sprich mit der KI wie mit einem Fotografen: klar, ruhig, detailliert.
Wenn du lernst, so zu denken, wirst du merken: KI ist kein Zufallsprodukt, sondern planbare Kreativität.
Vorschau auf die nächsten Teile
Im Teil 1 ging es darum, wie man gute Prompts schreibt.
Das war Teil 2 – Bildgenerierung mit ChatGPT & Google Nano Banana.
Im 3. Teil geht’s um die Königsdisziplin: Midjourney.
Dort lernst du, wie du deine Bilder verfeinerst, Emotionen steuerst, Kamerawinkel nutzt und mit Stilen experimentierst, bis das Ergebnis echte Handschrift zeigt.
Und danach folgt Teil 4 – Musik mit Suno, wo du Texte in Songs verwandelst – inklusive Stimme, Stil und Stimmung.
Zum Abschluss
KI-Bilder sind kein Glücksspiel.
Sie sind das Ergebnis von klaren Worten, Vorstellungskraft und Neugier.
Wenn du sie mit einem guten Prompt fütterst, bekommst du kein Zufallsbild, sondern dein Bild.
Probier’s aus: Formuliere heute Abend einfach eine kleine Szene. Ein Ort, ein Gefühl, ein Licht.
Lass ChatGPT oder Nano Banana daraus ein Bild machen – und beobachte, wie Sprache zu Sichtbarem wird.
Das ist keine Magie. Das ist modernes Handwerk.


