Damals: Kunstunterricht mit Augenrollen
„Beschreibe das Bild!“
Allein dieser Satz hat ganze Klassenzimmer zum Stöhnen gebracht. Im Fach „Bildnerische Erziehung“ mussten wir Kunstwerke beschreiben, analysieren, interpretieren – am besten mit Einleitung, Hauptteil und Schluss.
Motiv, Komposition, Farben, Licht, Perspektive, Figuren.
Alles schön der Reihe nach.
Ich erinnere mich noch gut: Ich wollte zeichnen, nicht über Zeichnungen reden. Und innerlich fragte ich mich jedes Mal: Wofür brauche ich das je wieder?
Tja. Heute weiß ich’s.
Warum uns die Bildbeschreibung damals genervt hat
Im Grunde war sie ein Training fürs Sehen.
Nicht einfach „ein Baum im Sonnenuntergang“, sondern: Wie ist der Himmel gefärbt? Woher kommt das Licht? Wie wirken die Linien, Schatten, Strukturen?
Nur – das hat uns niemand gesagt. Für uns war das reines Schulblabla.
Wir wollten schnelle Ergebnisse. So wie viele heute, die in Midjourney eintippen: „Mach mir ein cooles Porträt“ – und sich dann wundern, dass es nicht cool aussieht.
Die Parallele ist herrlich: Damals keine Lust auf genaue Beschreibung, heute keine Lust auf genaue Prompts. Nur dass KI dir gnadenlos zeigt, wenn du’s unsauber machst.
Heute: KI liebt gute Beobachter:innen
Midjourney, ChatGPT oder Gemini Nano Banana – sie alle können nur mit dem arbeiten, was du ihnen gibst.
Sie verstehen keine Gedanken, nur Worte.
Und plötzlich ist sie wieder da, diese alte Schulweisheit:
Nur wer genau hinsieht, kann genau ausdrücken, was er will.
Wenn du heute ein Bild generierst, bist du wieder im Kunstunterricht.
Dein Prompt ist deine Bildbeschreibung.
Ein Beispiel:
„Ein Mann am Strand“
bringt ein austauschbares Stockfoto.
„Ein älterer Mann mit grauem Bart und schwarzem T-Shirt steht barfuß im warmen Abendlicht am Meer. Das Wasser reflektiert die Sonne, das Licht ist weich, Leica-Look, 50 mm, f/1.8, realistisch.“
Und schon versteht die KI: Das ist ein Moment, kein Clipart.

Vom Allgemeinen zum Detail: Schulwissen als Prompt-Struktur
Die klassische Struktur der Bildbeschreibung funktioniert heute 1:1 für KI:
Einleitung: Was sehe ich? Kontext, Thema, Zeit.
„Porträt einer jungen Frau in einem Pariser Café bei Tageslicht.“
Hauptteil: Wie sieht es aus? Farben, Licht, Stimmung, Perspektive.
„Natürliches Licht fällt durchs Fenster, sanfte Schatten, warme Farbtöne, filmischer Look.“
Schluss: Interpretation oder Stil.
„Fotorealistisch im Stil von Annie Leibovitz, Canon R5, 85 mm.“
Das ist exakt der Aufbau, den Midjourney oder Gemini liebt.
Vom Groben ins Feine, vom Außen nach Innen.
Wer sich daran hält, bekommt präzisere, realistischere und vor allem konsistente Ergebnisse.

Die neue Kunst: visuell denken in Worten
Künstliche Intelligenz zwingt uns, Bilder wieder zu sehen – aber diesmal mit Worten. Das ist der wahre Shift.
Wir müssen nicht mehr malen, sondern beschreiben, was wir sehen wollen. Das erfordert Achtsamkeit. Beobachtung. Sprache mit Bildgefühl.
Wenn du sagst: „eine Frau mit rotem Kleid“, weiß die KI nicht, ob du Haute Couture oder Flohmarkt meinst.
Sagst du: „eine Frau in einem eleganten roten Seidenkleid mit tiefem Faltenwurf, fotografiert im Gegenlicht, 85 mm Linse, Modefoto im Stil der 1950er“, dann versteht sie dich.
Je präziser du bist, desto realer wird das Ergebnis.
ChatGPT und Gemini als neue Bildbeschreibungs-Coaches
Was früher die Lehrerin war, ist heute ChatGPT: geduldig, analytisch, detailverliebt.
Wenn du willst, dass deine Beschreibung wirklich sitzt, lass ChatGPT deinen Prompt überarbeiten.
Sag einfach:
„Formuliere diesen Prompt im Stil einer professionellen Bildbeschreibung.“
Er wird automatisch strukturieren: Szene, Licht, Farbe, Komposition, Stimmung.
Genau das, was du damals gelernt – und gehasst – hast.
Gemini wiederum kann auch helfen – beispielsweise beim Feintuning:
Es sieht Muster, erkennt Stilrichtungen, kombiniert Kameraeinstellungen mit künstlerischen Looks.
Ein digitaler Zeichenlehrer, der keine Noten vergibt, sondern visuelle Präzision belohnt.
Midjourney als neues Klassenzimmer
Midjourney ist der Raum, in dem du siehst, ob du gelernt hast. Ein Prompt ist wie ein Aufsatz.
Die KI ist die Lehrerin, die kommentarlos deine Arbeit zurückgibt. Und ihr Feedback ist gnadenlos ehrlich: das Ergebnis selbst.
Manchmal perfekt, manchmal katastrophal. Aber immer ehrlich.
Wenn du merkst, dass dein Bild nicht stimmt, hilft kein Ärgern – nur Beobachten.
Frag dich:
Was habe ich nicht beschrieben?
Was habe ich ungenau gesagt?
Welche Details fehlen, um den Moment zu fangen?
Und schon bist du wieder im alten Schulmodus – nur dass du diesmal freiwillig lernst.
Alles kommt zurück – besonders das, was uns früher genervt hat
Die Bildbeschreibung war nie überflüssig. Sie war nur ihrer Zeit voraus.
Was wir damals mühsam in Worte fassen mussten, ist heute das Handwerkszeug für die visuelle KI-Generation.
Ob Midjourney, ChatGPT oder Gemini Nano Banana – sie alle leben von präziser Sprache.
Und vielleicht sollten wir uns bei unseren alten Zeichenlehrer:innen bedanken.
Sie haben uns beigebracht, was wirklich zählt:
Nicht einfach sehen, sondern verstehen, was wir sehen.
Heute nennen wir das Prompt Engineering.
Damals hieß es schlicht: Bildbeschreibung.


