Handlungsanleitung

Bilder mit KI generieren

Das Bild zeigt einen surrealen Raum, in dem ein Roboter in einem Sessel an einem Laptop sitzt und vor ihm eine digitale Leinwand mit ganz vielen verschiedenen Bildern abgebildet ist.

Keine aufwändige Bilderrecherche mehr, keine hohen Kosten für Stockfotos, keine Probleme mit Urheberrechten, perfekte Illustrationen für die eigenen Materialien – mit Hilfe von Künstlicher Intelligenz (KI) eigene Bilder zu generieren, klingt sehr verlockend. In dieser Handlungsanleitung haben wir für Sie Tipps zusammengetragen, mit denen Sie erfolgreich eigene Bilder generieren können, erklären aber auch, welche Grenzen und Fallstricke es zu beachten gibt.

Wie generiert eine KI eigentlich Bilder?

Ohne technisch ins Detail zu gehen, kann man sagen, dass eine KI anhand von Millionen und Milliarden Bilder trainiert wird und auf diese Art und Weise Muster im Bildaufbau lernt. Sie lernt zum Beispiel, dass die Sonne eine Lichtquelle ist und diese die Belichtungsrichtung vorgibt oder, wie der Darstellungsstil „Cartoon“ aussieht oder, welche Merkmale für die Darstellung einer Katze wichtig sind. Sie übersetzt dabei schriftliche Anweisungen in Bildpunkte und umgekehrt. Viele Bildpunkte geben zusammen ein Bildelement. Weist man einen Bildgenerator an, ein Bild nach bestimmten Vorgaben zu erstellen, gibt es verschiedenen technische Umsetzungsformen. Eine Herausforderung bei der Bildgenerierung und damit auch eine Quelle von Frustration, ist das Übersetzen von Text in grafische Elemente. Die KI lernt anhand von grafischen Elementen, zum Beispiel dem Verhältnis von verschiedenen Bildpunkten zueinander oder von Farbschemata. Zwei Bilder ähneln sich technisch, wenn auf beiden die Belichtungs- oder Farbparameter dicht beieinander liegen. Das heißt aber noch nicht, dass die Bilder sich inhaltlich ähneln: Eine große graue dunkle Fläche mit grün drum herum kann ebenso ein Haus, wie einen Elefanten darstellen.

Einfluss verschiedener Bildgenerierungstools auf die Ergebnisse

Unterschiedliche Programme bieten unterschiedliche Möglichkeiten der Bildgenerierung zu verschiedenen Konditionen an. In dieser Linkliste haben wir Ihnen ein paar KI-Bildgenerierungstools zusammengestellt und informieren über Preise, technische Möglichkeiten und Grenzen: KI-Bilder generieren - Toolliste - Medien - Material - wb-web

Manche Tools können Bilder von Prompt zu Prompt verändern, manche Tools generieren mit jedem Prompt wieder ein völlig neues Bild. Andere Programme bauen wiederum auf Bildbearbeitungstools auf und können in dem Zusammenhang Bildgenerierung und Bildbearbeitung kombinieren, was mehr Einfluss auf das Ergebnis ermöglicht.

Scheinbar entwickeln die verschiedenen Bildgenerierungstools außerdem eigene Stile, beziehungsweise werden unterschiedlich mit Trainingsdaten geframt. Denn unterschiedliche Tools kommen mit unterschiedlichen Bildstilen besser zurecht als andere oder generieren bei freier Eingabe Bilder eigenständig immer in einem ähnlichen Stil.

Der richtige Prompt für das gewünschte Bild

Die Qualität eines KI generierten Bildes hängt von der Qualität der textlichen Eingabe – den sogenannten Prompts – ab. Je besser die Beschreibung, desto passender das generierte Bild. Je detaillierter und komplexer aber die Prompts, desto schwieriger ist die Umsetzung und desto höher die Gefahr, dass einzelne Elemente im Bild nicht oder nicht wie gewünscht wiedergegeben werden. Daher ist es sinnvoll, der KI bei der Generierung der Bilder einen gewissen kreativen Freiraum zu lassen.

Obwohl der Chatbot in den gängigen KI-Bilder-Tools in der Lage ist, Sprache zu übersetzen, werden die Ergebnisse besser, wenn die Prompts direkt in englischer Sprache eingegeben werden. Wer sich im Umgang mit der englischen Sprache unsicher fühlt, nutzt im Vorfeld Übersetzungstools wie deepl.com oder ähnliche.

Jeder Prompt sollte so kurz wie möglich und so lang wie nötig sein. Alles, was unwichtig ist, bleibt außen vor. Das heißt, auch ganze Sätze enthalten für das Bild zumeist unwichtige Worte, daher besser stichpunktartig formulieren.  

  • Das Wichtigste kommt an den Anfang: Um was geht es im Bild? Was ist der Mittelpunkt?
  •  Welche Details möchte ich zum Objekt oder zur Umgebung hinzufügen? Was darf die KI selbst entscheiden und auf welche Hinweise möchte ich nicht verzichten?
  •  Welcher Bildstil soll genutzt werden?
  •  Gibt es etwas, was nicht auf dem Bild zu sehen sein sollte? Dann schließen Sie es einfach per Negativ-Prompt Elemente aus.
Das Bild zeigt eine Goldenretriever-Welpen und fröhliche Kinder im Hintergrund.

allgemeiner Prompt: "Create the picture of a dog" (generiert mit Copilot, DALL-E))

Das Bild zeigt das Portrait eines grauen Hundes mit unscharfer Wasserfläche und Grün im Hintergrund.

Prompt mit groben Details: “Create the picture of a grey dog, water in background, green in foreground” (generiert mit Copilot, DALL-E)

Das Bild zeigt das Portrait eines gezeichneten grauen Hundes mit Wasser und Bergen im Hintergrund und grün im Vorder- und Mittelgrund.

Prompt mit groben Details und Bildstil: "Create the picture of a grey dog, water in background, green in foreground, drawing style" (generiert mit Copilot, DALL-E)

Spezifische Befehle beim Prompting

Um spezifische Befehle in Prompts eingeben zu können, muss man lernen, sich vorzustellen, welche Stichworte ausschlaggebend bei der Bildgestaltung sein können. Was ist beispielsweise mit Bildstil gemeint? Das ist unter anderem die Darstellungsform von einem gezeichneten Bild, über Fotos bis hin zu kreativen Maltechniken. Bildart-Prompts können daher zum Beispiel sein:

  • Cartoon
  •  Photo
  •  Illustration
  •  Painting

Ein Foto kann man weiter spezifizieren, indem man beispielsweise den Kameratyp eingibt, der das Bild gemacht haben könnte:

  • "Create a photo, brown cat, ultra realistic, canon eos 2000d“

Aber auch durch Hinweise zur Beleuchtung:

  • Backlight (Gegenlicht)
  •  Golden hour (Goldene Stunde)
  •  Studio illumination (Studiobeleuchtung)
  •  Sparkling light (funkelndes Licht)

Oder durch Eingabe von Komposition, Farbe oder Emotion:

  •  Wide angle (Weitwinkel)
  •  Portrait
  •  Panorama
  •  Close up (Nahaufnahme)
  •  Bright colors (strahlende Farben)
  •  Matt/glossy (matt/glänzend)
  •  Animated (belebt)
  •  Calm (ruhig)

Eine andere Möglichkeit, den Bildstil zu bestimmen ist es, Referenzen zur Kunstrichtung einzugeben. Also einen Künstler oder eine Künstlerin zu benennen, von dem oder der es bereits Bilder im Internet zu finden gibt und dessen Stil man sich zu nutzen machen kann:

  • „Create a picture of a cat in van Gogh style“
  •  Steampunk
  •  Constructivistic
  •  „like a medieval painting“ (wie ein mittelalterliches Gemälde)
  •  „as Dalí would have painted it“ (wie Dalí es gemalt hätte)

In manchen Bildgenerierungstools gibt es spezifische Kurzbefehle, mit deren Hilfe Bildformate, Bildstil oder kreative Umsetzung, sowie viele andere Parameter vorgegeben werden können. Zahlreiche Tipps dazu findet man, wenn man im Internet nach Kurzbefehlen im Zusammenhang mit konkreten Tools sucht.

Das Bild zeigt eine braune Cartoon-Katze.

"Create the picture of a cat, cartoon" (Copilot, Dall-E)

Das Bild zeigt das Foto einer braun getigerte Katze, die auf einem Holzboden liegt und in die Kamera guckt.

"photo, brown cat, ultra realistic, canon eos 2000d" (Copilot, DALL-E)

Das Bild zeigt das Foto einer braun getigerten Katze, die in goldenem Licht angeleuchtet ist. Die Katze schaut an der Kamera vorbei.

"photo of a brown cat, portrait, golden light" (Copilot, DALL-E)

Das Bild zeigt das Portrait einer braun getigerten Katze in professioneller Fotoshooting-Atmosphäre.

"create the image of a brown cat, studio lighting, portrait, professional shooting" (Copilot, DALL-E)

Das Bild zeigt eine braun getigerte Katze, die maunzend in die Kamera guckt.

"Create the image of a brown cat, animated, active and cheerful, fotorealistic" (leonardo.ai)

Das Bild zeigt das nicht realistische Portrait einer braun getigerten Katze im Disney-Stil, die von funkelndem Glitzer umgeben ist.

"Image of a brown cat, not realistic, sparkling light, disney style” (Copilot, DALL-E)

Das Bild zeigt das Portrait einer gemalten Katze im van Gogh Stil.

"picture of a brown cat, van gogh style" (Copilot, DALL-E)

Mit Bildern lernen und üben

Das Prompten für Bilder ist gar nicht so einfach, besonders, wenn man etwas spezifischere Bilder haben möchte. Oftmals entscheidet ein Wort mehr oder weniger über Erfolg oder Misserfolg bei der Bildgeneration. Bildergalerien mit KI-Bildern, deren Prompts mit aufgeführt werden, helfen dabei, ein Gespür für das Prompting zu entwickeln! Scrollt man durch die verschiedenen Bilder, findet man möglicherweise bereits einen Bildstil oder sieht eine ansprechende Objektauswahl. Anhand der hinterlegten Prompts können die Bilder verglichen werden und eigene Prompts kombiniert und erstellt werden.

Wichtig: Dabei ist beachten, dass man mit ein und demselben Prompt niemals mehrfach hintereinander das gleiche Bild generieren kann!

Galerien, die KI-Bilder nebst ihrer Prompts aufführen sind zum Beispiel:

Auf diesen Seiten werden anschaulich die Unterschiede zwischen verschiedenen KI-Bildergeneratoren mit Beispielen aufgelistet:

Promptgeneratoren zur Bildererstellung

Diese Tools sind entwickelt worden, um das Erstellen von Prompts für die Bildgenerierung zu vereinfachen. Man kann dort mit eigenen Worten das gewünschte Bild beschreiben, hat gegebenenfalls noch Auswahlfelder für Bildstil und Co und das Programm wandelt die Beschreibung in einen präzisen Prompt um.

Ob ein Promptgenerator bessere Bilder erstellt, als es mit eigenen Eingaben möglich wäre, entscheiden Sie selbst durch das eigene Ausprobieren:

Wie sieht es mit dem Urheberrecht aus?

Grundsätzlich unterliegen KI-generierte Inhalte keinem Urheberrecht. Sie werden als gemeinfrei (public domain) beschrieben und sollten als „KI-generiert“ gekennzeichnet werden. Falls die Person, die das Bild durch Prompts erstellt und verfeinert, das Bild im Anschluss noch händisch oder digital erheblich weiterentwickelt, kann sie das Urheberrecht an dem Werk gewinnen. Denn dann kann das ursprünglich KI-generierte Bild als Werkzeug oder Impulsgeber gewertet werden und die Eigenleistung stellt das eigentliche künstlerische Schaffen dar. Hier gibt es aber keine klar definierten Grenzen.

Fabian Rack hat für das Online-Portal OERinfo einen anschaulichen Text dazu geschrieben: OER und CC-Lizenzen bei generativer KI – iRights.info – iRights.info

Da die KI-Bilder nicht „neu“ erstellt, sondern aus dem gelernten Datensatz von unzähligen Trainingsbildern schöpft, ist nicht auszuschließen, dass sich Ähnlichkeiten mit bereits real existierenden Fotos, Gemälden und Co ergeben, zumal es bei manchen KI-Bildgeneratoren auch die Möglichkeit gibt, eigene Bilder hochzuladen, um sie mit Hilfe der KI zu verändern. Ob es bei der Darstellung von Menschen durch KI zu Verletzungen von Persönlichkeitsrechten kommen kann, konnte die Autorin dieses Textes zum aktuellen Zeitpunkt nicht herausfinden.

Empfehlenswert ist in diesem Zusammenhang aber eine Bilderrückwärtssuche: So kann das KI-generierte Bild untersucht werden und ähnliche oder gleiche Bilder, die sich im Netz finden lassen, angezeigt werden. Neben der Rückwärtssuche innerhalb von Suchmaschinen wie Google, gibt es auch eigene Programme, in denen man entweder die Bilder-URL eingeben oder ein Bild hochladen kann: z.B. TinEye Reverse Image Search

Lösen KI-Bildgeneratoren nun alle Probleme?

Suchen Sie nach Illustrationen für Ihre Kursmaterialien, Bebilderungen für Präsentationen oder Icons für Merkblätter, werden Sie mit KI-generierten Bildern viel Arbeit und Zeit sparen und passende Bilder für Ihren Bedarf erstellen können.

Je spezifischer Sie allerdings Bilder anfertigen möchten, desto höher ist das Frustrationspotenzial. Haben Sie nämlich noch nicht so viel Erfahrung im Prompting, aber eine ganz genaue Vorstellung, wie das KI-generierte Bild auszusehen hat, ist das Risiko hoch, dass das genutzte Programm die Prompts nicht oder nicht richtig umsetzt. Im Test für diese Handlungsanleitung hat zum Beispiel ein besonderer negativer Prompt dazu geführt, dass das, was auf keinen Fall auf dem Bild zu sehen sein sollte, überhaupt erst im Bild aufgetaucht ist und als Attribut egal mit welcher Umformulierung nicht mehr verschwinden wollte.

Die Entwicklung von KI-Tools verläuft aktuell rasant. Negative Aspekte bei der Bildgenerierung, wie zu viele oder zu wenige Finger an einer menschlichen Hand (Artefakte), Unschärfen oder Belichtungs- oder Spiegelungsfehler werden in der Zukunft vermutlich immer weniger auftreten, weil die Programme beständig professionalisiert werden. Kostenmodelle unterliegen einem ähnlich schnellen Wandel, wie die technische Entwicklung. Ob in Zukunft KI-Tools eher kostenpflichtig oder kostenlos angeboten werden, ist zu diesem Zeitpunkt nicht absehbar, wobei einige ehemals kostenlose Programme ihre Dienste mittlerweile nur noch kostenpflichtig anbieten.

Vorsichtig sollte man mit der Funktion umgehen, eigene Bilder ins Internet hochzuladen, um sie entweder als Vorlage für die KI zu verwenden oder das eigene Bild mit Hilfe der KI zu verändern. Je nach Geschäftsbedingung können die eigenen Bilder zu Trainingszwecken genutzt werden, bzw. ist einfach noch nicht richtig klar, wie KI-Tools Bilder verarbeiten und ggf. weiternutzen.

 

CC BY-SA 3.0 DE by Christina Bliss für wb-web (20.08.2024)


Das könnte Sie auch interessieren

Prompting - Formuliere die perfekte Frage

- Blog

Prompting - Formuliere die perfekte Frage
„Wie man in den Wald ruft, so schallt es heraus“ – So ähnlich funktionieren Chatbots, wenn man von einschränkenden ideologischen Vorgaben in der Programmierung absieht. Um von einem Chatbot wie z.B. ChatGPT eine Antwort zu erhalten, stellt man eine Frage. Umso genauer man die Frage formuliert, umso treffender antwortet der Chatbot. Aber, wie stellt man die perfekte Frage?

Mehr

ChatGPT - Licht und Schatten

- Blog

ChatGPT - Licht und Schatten
Die Anwendung ChatGPT zur KI-gestützten Generierung von Texten ist derzeit in aller Munde. Welche Vorteile bietet sie und was kann sie leisten? Welche Nachteile können sich ergeben? Wie steht es um den Urheberschutz und Leistungsschutzrechte, insbesondere in der Nachnutzung? Was passiert im Hintergrund von ChatGPT? Wie lässt sich ChatGPT in der Erwachsenen- und Weiterbildung nutzen?

Mehr

Warum ein Chatbot-Didaktik Modell?

- Blog

Warum ein Chatbot-Didaktik Modell?
Chatbots sind keine neue Erfindung, aber mit ChatGPT fand ein Entwicklungssprung statt. Der dadurch ausgelöste ChatGPT-Hype Anfang des Jahres 2023 setzte das Thema in der Bildungspolitik auf die Tagesordnung. Bildungsministerien, (Hoch-) Schulen und weitere Bildungseinrichtungen erarbeiteten in Windeseile wertvolle Handreichungen. Gleichzeitig entstand dadurch eine unübersichtliche Vielfalt an Stellungnahmen und Best-Practice-Beispielen.

Mehr