Ziel: Du lernst, wie du mit Midjourney beeindruckende KI-Bilder erstellst – realistisch, kreativ und technisch präzise.
Zielgruppe: Anfänger jeden Alters
Tools: Midjourney im Web oder Discord
Midjourney – das Premium-Tool unter den Bild-KIs
Wenn du Bilder mit KI erzeugen willst, kommst du an Midjourney kaum vorbei.
Es ist das Premium-Tool unter den Bildgeneratoren – präzise, kreativ und unglaublich sensibel für Details.
Während viele andere Tools austauschbare KI-Grafiken liefern, erzeugt Midjourney Ergebnisse, die aussehen wie echte Fotografien oder Kunstwerke.
Es versteht Licht, Emotion und Komposition fast wie ein Mensch – und reagiert auf kleinste Nuancen in deiner Beschreibung.
Darum setzen Designer:innen, Fotograf:innen, Agenturen und Kreative weltweit auf Midjourney:
Weil es nicht einfach nur Bilder generiert, sondern Visionen sichtbar macht.
Mit anderen Worten: Wenn du mit KI wirklich sehen lernen willst, ist Midjourney das richtige Werkzeug.
Midjourney: Webseite oder Discord – du entscheidest
Midjourney lässt sich auf zwei Arten nutzen:
- Über die Website (midjourney.com) – übersichtlich, modern, ideal für Einsteiger:innen.
- Über Discord – die klassische Variante mit direkter Texteingabe, Community-Feeling und allen Profi-Funktionen.
Beide Varianten erzeugen dieselben Bilder, unterscheiden sich aber in der Bedienung.
Auf der Webseite bekommst du mehr Übersicht und Galerien, auf Discord mehr Kontrolle und Geschwindigkeit.
Midjourney gibt es nicht kostenlos! Aber wenn du auf professioneller Ebene Bilder machen willst, dann rechnet sich das ganz schnell.
Vorab-Info: Warum du Midjourney auf Englisch prompten solltest
Midjourney denkt visuell – und auf Englisch.
Natürlich versteht es auch Deutsch, aber Begriffe wie „depth of field“, „cinematic lighting“ oder „golden hour“ sind im Englischen viel genauer.
Wenn du also das Maximum herausholen willst, schreib deine Prompts auf Englisch.
Kein Perfektionsdruck – einfache, klare Sätze reichen völlig.
Beispiel:
“A cozy café in Paris, warm light, cinematic composition, 85mm lens, realistic photo.”
Warum Midjourney mehr ist als ein Generator
Viele sehen Midjourney als Spielerei.
Aber das Tool ist viel mehr – es ist wie ein visuelles Notizbuch deiner Gedanken.
Wenn du deine Vorstellung präzise formulierst, bekommst du Bilder, die wirken, als hättest du sie selbst fotografiert oder gemalt.
Wer dagegen nur ein paar Schlagwörter eintippt, erhält Zufallsergebnisse.
“portrait, woman, city, light”Das ist kein Prompt, das ist Raterei.
Schreib lieber:
“A cinematic portrait of a woman standing in a rainy city street at night, soft reflections, warm neon lights, 85mm lens, shallow depth of field, realistic style.”

Das ist Regie.
Der Aufbau eines professionellen Midjourney-Prompts
- Betreff: Wer oder was ist auf dem Bild zu sehen? “An elderly man sitting on a wooden bench with a guitar”
- Umgebung: Wo findet das statt? “In a narrow street in Naples, warm evening light”
- Beleuchtung & Stimmung: Wie fühlt es sich an? “Golden hour, cinematic lighting, peaceful atmosphere”
- Kamera & Stil: Wie soll es aussehen? “85mm lens, shallow depth of field, realistic photo”
- Art Direction: Feinabstimmung. “Documentary style, soft film grain, natural tones”
Zusammen:
“An elderly man sitting on a wooden bench with a guitar, in a narrow street in Naples, golden hour, cinematic lighting, 85mm lens, shallow depth of field, documentary style, realistic photo.”

Licht & Stimmung: Der Schlüssel zur Emotion
Midjourney reagiert stark auf Licht.
Beschreib immer, wie es aussieht und sich anfühlt.
- Golden hour: warm, nostalgic, soft shadows
- Overcast: neutral, calm, diffuse light
- Neon light: vibrant, colorful, urban
- Candlelight: intimate, warm, storytelling
Beispiel:
A woman reading a book in a café, candlelight, soft reflections, cinematic atmosphere --ar 16:9
So entsteht Stimmung, nicht nur ein Motiv.

Kamera & Perspektive
Midjourney versteht fotografische Sprache:
- 35mm – Dokumentarfilm, Natur
- 50mm – klassisch, neutral
- 85mm – Porträt, geringe Tiefenschärfe
- 24mm – dynamisch, breit
Beispiel:
A child running through autumn leaves, 85mm lens, depth of field, cinematic lighting, warm tones --ar 16:9
So denkst du wie ein Fotograf – nicht wie jemand, der nur „ein Bild“ will.

Kamerapositionen – dein Werkzeug für Perspektive und Wirkung
Midjourney denkt wie eine Kamera.
Wenn du ihr sagst, aus welcher Perspektive sie dein Motiv sehen soll, verändert sich sofort die Stimmung.
Diese Kamerabegriffe sind nicht nur für Profis – sie sind dein Werkzeug, um Tiefe, Nähe und Emotion zu steuern.
Hier die wichtigsten Perspektiven, die du in deinen Prompts nutzen kannst:
- Full Shot: Das ganze Motiv im Bild – perfekt, um Szene und Person gleichermaßen zu zeigen. “A traveler standing in a busy marketplace, full shot, cinematic lighting, –ar 16:9.”
- Medium Shot: Halbnah – etwa von der Hüfte aufwärts. Gut für Dialoge oder natürliche Szenen. “A man talking to a vendor at a fruit stand, medium shot, warm light, –ar 16:9.”
- Close-Up Shot: Nahaufnahme – ideal für Emotionen und Details. “A close-up of a woman smiling, sunlight reflecting in her eyes, realistic photo.”
- Over the Shoulder Shot: Du siehst über die Schulter einer Person – wirkt filmisch, wie eine Szene aus einem Gespräch. “Over the shoulder shot of a man reading a map, people in the background, natural light.”
- Low Angle Shot: Von unten nach oben fotografiert – verleiht Stärke, Größe oder Dramatik. “Low angle shot of a musician performing on stage, spotlight, cinematic atmosphere.”
- Dutch Shot: Die Kamera ist leicht geneigt – vermittelt Spannung oder Bewegung. “Dutch shot of a detective walking through a neon-lit alley, moody tone, –ar 21:9.”
- Aerial View: Von oben – gibt Überblick und Kontext. “Aerial view of a crowded marketplace, colorful umbrellas, morning light, realistic photo.”
- Insert Shot: Detailaufnahme – perfekt für Objekte oder symbolische Elemente. “Insert shot of fresh fruit on a wooden table, soft light, shallow depth of field.”
- Establishing Shot: Der erste Blick auf eine Szene – zeigt Ort, Stimmung und Kontext. “Establishing shot of a coastal town at sunset, warm tones, cinematic composition, –ar 16:9.”
Wenn du solche Perspektiven in deinen Prompts nutzt, fühlt sich dein Bild plötzlich filmisch an.
Die Szene bekommt Tiefe, Struktur und Spannung – genau wie im Kino.
Stilrichtungen
Wähle bewusst einen Stil, sonst mischt Midjourney beliebig:
- Photorealistic – detailliert und natürlich
- Cinematic – wie ein Standbild aus einem Film
- Analog film / Kodachrome / Polaroid – Vintage-Charme
- Watercolor / Oil painting / Sketch – künstlerische Stile
- Street photography / Documentary – Authentizität
Beispiel:
A boxer training in a dim gym, sweaty skin, analog film, low-key lighting, cinematic composition --ar 16:9
Das wirkt echt – nicht generisch.

Emotionen beschreiben
Gute Prompts erzeugen Gefühle, nicht nur Formen.
Beispiel:
An old man looking into the sun, peaceful face, eyes half closed, gentle smile, soft haze, quiet happiness --ar 16:9
Diese Worte führen die KI zu Licht, Mimik, Ausdruck.
So entstehen Bilder, die „sprechen“.

Das Seitenverhältnis steuern – mit --ar
Standardmäßig erzeugt Midjourney quadratische Bilder (1:1).
Mit dem Parameter --ar (aspect ratio) steuerst du das Format:
- –ar 16:9 → Querformat (z. B. für Websites, YouTube Thumbnails)
- –ar 9:16 → Hochformat (z. B. für Instagram Reels, Stories)
- –ar 4:3 → Klassisches Fotoseitenverhältnis
- –ar 3:2 → Kameraformat (DSLR-Stil)
Beispiel:
A surfer on a wave at sunset, cinematic lighting, 85mm, photorealistic --ar 16:9
oderA portrait of a smiling woman with natural light, realistic photo --ar 3:2
Das richtige Seitenverhältnis verändert sofort Wirkung und Komposition.
Je genauer du bist, desto besser wird’s
Midjourney liebt Details.
Je präziser du dein Bild beschreibst, desto realistischer, stimmungsvoller und glaubwürdiger wird das Ergebnis.
„Ein Mann mit Gitarre“ ist nett.
Aber Midjourney braucht mehr Kontext, um dein Bild wirklich zu verstehen: Stimmung, Licht, Ort, Perspektive, Stil.
Stell dir vor, du würdest einer Kameraanweisung folgen – genau so denkt die KI.
Ein zu kurzer Prompt ist wie ein undeutliches Foto.
Je klarer du formulierst, desto schärfer wird das Ergebnis.
Beispiel: Von simpel zu professionell
Einfach:
A man playing guitar.
das ist generisch, zufällig, austauschbar.
Professionell:
A middle-aged man sitting on a wooden chair in a dimly lit jazz bar, playing an old acoustic guitar, cigarette smoke drifting through the warm light, soft reflections on brass instruments in the background, cinematic composition, 85mm lens, medium shot, depth of field, realistic photo, moody atmosphere --ar 16:9

Das ist die Sprache, die Midjourney versteht.
Du gibst ihr nicht nur ein Motiv, sondern ein ganzes Setting: Licht, Raum, Textur, Emotion.
Das Ergebnis wirkt wie ein echtes Foto – mit Seele, Tiefe und Geschichte.
Fehler, die viele machen
- Prompts zu kurz oder widersprüchlich
- Kein Stil, kein Licht, kein Gefühl
- Zu viele Adjektive ohne Bedeutung
- Falsches Format (z. B. für Social Media)
- Nur einen Versuch, statt zu experimentieren
Midjourney ist kein Zufallsorakel. Es folgt dir – wenn du klar führst.
Bonus-Tipp: Varianten nutzen
Teste Varianten mit kleinen Änderungen:
Basis:
A red bicycle leaning against a stone wall, morning light, realistic photo.
Varianten:
- “…in rainy weather, reflections on pavement, cinematic tone.”
- “…in golden hour, soft shadows, analog film style.”
- “…black and white, high contrast, documentary look.”
So lernst du, wie Stil, Licht und Format zusammenwirken.
Vorschau auf Teil 4
Das war Teil 3 – Bildgenerierung mit Midjourney.
Im nächsten Teil geht’s ans Hören:
Musik mit Suno AI.
Du lernst, wie du Texte in Songs verwandelst – mit Emotion, Struktur und Stimme.
Weil Kreativität nicht beim Bild endet.


