Kurzanleitung

Wie kommt dieser Eisbär in die Wüste? Erstellung von KI-Bildern einfach erklärt

Ein Eisbär läuft durch die glühend heiße Sahara.
1 von 10
Eine Fotomontage ist oft dann gut, wenn man ihre Echtheit auf den ersten Blick nicht anzweifelt – egal wie absurd ist, was sie zeigt. Weil Schatten, Reflexionen, Proportionen perfekt passen. So wirkt auch dieser Eisbär für eine Sekunde unverdächtig. Dabei läuft er durch eine Wüste. Wäre das Bild eine Fotomontage, sie könnte also als gelungen gelten. Doch es ist keine. Eine Künstliche Intelligenz (KI) hat es generiert, innerhalb von Sekunden.
Ein majestätisches Nashorn stürmt durch einen verschneiten Kiefernwald und kontrastiert mit seiner kraftvollen Präsenz mit der ruhigen Winterlandschaft.
2 von 10
Natürlich hat die KI das nicht alleine gemacht. Ein Gestalter musste ihr erstmal sagen, was sie machen soll. Genau wie bei diesem Werk: ein Nashorn im Schnee. Dafür muss der Gestalter sich viel Zeit nehmen. Damit das Ergebnis so gut wird, braucht die Person, die die KI bedient, Erfahrungswerte. Doch programmieren können muss sie dafür nicht, ein Technik-Profi braucht sie auch nicht zu sein. In ganzen Sätzen hat sie der KI eine Art Arbeitsauftrag geschrieben, der genau ausführt, wie das Bild aussehen soll.
Eine majestätische Waran sitzt majestätisch auf einem verwitterten Stein inmitten einer atemberaubenden Alpenlandschaft in den leuchtenden Farben des Frühlings.
3 von 10
Auch Sie können das ausprobieren. Dafür müssen Sie sich bei einem KI-Bildgenerator anmelden. Dazu, welche es gibt, kommen wir gleich. Dann können Sie drauflosschreiben – und den Text so lange ausbessern, bis Ihnen die Bilder gefallen, die ausgespuckt werden. Für ein solches Bild könnten Sie etwas schreiben wie: „Ein Waran sitzt vor einer Berglandschaft auf einem Stein. Der Stil ist realistisch. Neugierig soll er nach links blicken.“ Diesen Text nennt man Prompt.
Ein majestätisches Pferd galoppiert in einer Unterwasserwelt aus leuchtenden Korallen und bewegt sich anmutig durch die Tiefen des Ozeans.
4 von 10
Sie fragen sich nun sicher: Wie funktioniert diese Technik? Zuerst einmal muss die KI lernen – anhand einer Datenmenge, die unvorstellbar groß ist und aus dem Internet stammt. Die KI erkennt Muster in ihr. Bilder erzeugen kann sie dann, indem sie diese gelernten Muster reproduziert.
Ein majestätischer Weißer Hai ist in einem kleinen Fischglas eingesperrt, seine immense Kraft wird durch die Glaswände, die ihn umgeben, eingeschränkt.
5 von 10
Doch wie geht die KI vor, um Sätze, die wir ihr geben, zu Bildern zu machen? Sie nimmt einen Satz und verwandelt ihn in eine Art Code. Diesen versteht sie besser, als normale Wörter. Dann nimmt sie diesen Code und wandelt ihn in eine Reihe von Anweisungen um. Die sagen, was das Bild zeigen soll. Nun folgt die KI diesen Anweisungen und generiert ein Bild: zum Beispiel das eines Hais, der in einem Goldfischglas herumschwimmt, mitten im heimischen Wohnzimmer.
Ein Wildschwein liegt auf einem hohen Ast inmitten eines leuchtend grünen Baumes und demonstriert dabei seine Anpassungsfähigkeit.
6 von 10
Und wie funktioniert dieser letzte Schritt, das Generieren des Bildes? Dafür gibt es verschiedene Techniken. Eine besonders wichtige heißt Diffusionsmodell. So wird das trainiert: Einem Bild werden nach und nach immer mehr Farbflecken hinzugefügt, bis es kaum noch zu erkennen ist. Dabei lernt die KI. Danach beherrscht sie das umgekehrte Vorgehen: Sie nimmt ein chaotisches Farbfleck-Gewusel und entfernt diesmal nach und nach Flecken, bis ein sinnvolles Bild entsteht.
Eine Kuh steht in türkis schimmerndem Wasser an einem paradiesischen Strand.
7 von 10
Nun können Menschen mithilfe der KI kreative Werke erstellen – wie diese Kuh im Wasser. Für alle Bilder in dieser Fotogalerie kam das Programm Midjourney zum Einsatz. Es kann besonders realistische Ergebnisse erstellen – aber ist auch recht kompliziert zu bedienen. Das Programm Stable Diffusion soll die größte Flexibilität bei der Gestaltung bieten. Und Dall-e 2 von OpenAI ist besonders benutzerfreundlich, auch wenn die Bilder oft eher einfach gehalten sind.
Eine Giraffe ist umgeben vom Meer und Eisbergen in der Arktis.
8 von 10
Aller Faszination zum Trotz: Die Programme haben auch Schattenseiten. Sie können nicht nur benutzt werden, um Kunstwerke wie diese Giraffe in der Arktis zu schaffen. Mit ihnen können auch täuschend echte Bildfälschungen generiert werden. Kritiker sorgen sich, dass so Fake News gestreut werden. Letztens spukte etwa ein Bild durchs Internet, das viele für echt hielten: Es zeigte Papst Franziskus mit einer extravaganten weißen Daunenjacke, die es gar nicht gibt.
Ein Oktopus klammert sich an einen verwitterten Stein in der Weite einer kargen, heißen Wüste.
9 von 10
Ein weiteres Problem ist, dass die KI mit Texten und Bildern übt, die aus dem Internet stammen. Und im Internet gibt es eben nicht nur richtige Informationen und besonnene Äußerungen, sondern auch unzählige problematische Inhalte. So gab es schon viele Fälle, in denen KI-Bildgeneratoren Vorurteile weitergegeben haben. KIs neigen laut zahlreicher Berichte dazu, Akademiker als weiße Menschen darzustellen, Gefängnisinsassen hingegen seltener.
Ein Elefant läuft selbstbewusst über den schwelenden Vulkanrand, während Lava ausbricht, aus der Vogelperspektive aus der Ferne fotografiert.
10 von 10
So ist es mit den Bilder-KIs, wie mit beinahe allem auf der Welt: Mit ihnen kann großer Schaden angerichtet werden. Aber sie haben auch Vorteile. Ihre Ergebnisse sind mitunter beeindruckend. So sehr, dass der deutsche Fotograf Boris Eldagsen sogar den Sony World Photography Award gewonnen hat – mit einem KI-Bild, das wie eine Fotografie aussieht. Den Preis hat er nicht angenommen. Aber wer weiß, vielleicht hat ja auch dieses Werk mit einem Elefanten auf Lavagestein Preis-Potential.
  • Felix Leitmeyer
    VonFelix Leitmeyer
    schließen

Mit künstlicher Intelligenz lassen sich faszinierende Bilder generieren. Und das aus wenigen Zeilen Text. Ein Werk, das so erstellt wurde, hat sogar schon einen Fotopreis gewonnen. Doch wie funktioniert die Technik eigentlich? Und wie können auch Sie KI-Kunstwerke erstellen?

*Diese Bilder wurden mithilfe maschineller Unterstützung erstellt. Dafür wurde ein Text-to-Image-Modell genutzt. Auswahl des Modells, Entwicklung der Modell-Anweisungen sowie finale Bearbeitung der Bilder: Art Director Nicolas Bruckmann.

Rubriklistenbild: © Maximilian Litzka/Midjourney (maschinell erstellt*)

Mehr zum Thema

Mehr zum Thema

Kommentare