AIKategorie

Bilder mit KI erstellen: Ein Leitfaden für Anfänger:innen und Profis

9 min lesen
GoDaddy Deutschland Content Team
Titelmotiv des Blogartikels zum Thema: Fotos mit AI erstellen: Ein Leitfaden für Anfänger und ProfisFotos mit AI erstellen: Ein Leitfaden für Anfänger:innen und Profis

Künstliche Intelligenz (KI) hat in den letzten Jahren eine beeindruckende Entwicklung durchgemacht, und eine der spannendsten Anwendungen ist zweifellos die Erstellung von Bildern durch KI. Was einst Science-Fiction war, ist heute Realität: Mit nur wenigen Eingaben und Klicks lassen sich Bilder erzeugen, die nicht nur kreativ und originell, sondern oft auch täuschend echt – fotorealistisch – aussehen. In diesem Artikel erfährst du, wie du KI-basierte Bildgeneratoren für deine kreativen Projekte nutzen kannst.

KI-basierte Bildgeneratoren revolutionieren die Medienwelt

Grafik- und Fotografie-Profis fürchten um ihre Umsätze, Marketingabteilungen und Privatleute frohlocken: Die Möglichkeit, Bilder mit Hilfe von KI zu erstellen, verändert grundlegend die Art und Weise, wie wir visuelle Inhalte produzieren. Traditionell erforderte das oft teure Fotoshootings, langwierige Designprozesse oder den Kauf von Stockfotos. Mit KI-Bildgeneratoren lassen sich jedoch in Sekundenschnelle ansprechende Bilder erzeugen und auf die Anforderungen eines Projekts zuschneiden.

Dies hat weitreichende Auswirkungen auf die Medienwelt. Von Marketingagenturen über Verlage bis hin zu Social-Media-Influencer:innen profitieren immer mehr Menschen von der Möglichkeit, schnell und kostengünstig Bilder zu erstellen. In einer Zeit, in der der Bedarf an visuellen Inhalten explodiert, bieten KI-Bildgeneratoren neue Chancen, um im Wettbewerb mitzuhalten.

Überblick über Anwendungsfälle KI-generierter Bilder

Die Einsatzmöglichkeiten von KI-generierten Bildern sind vielfältig. Einige der gängigsten Anwendungen sind:

  • Marketing und Werbung: Ob Banner, Social-Media-Posts oder Produktbilder – Unternehmen nutzen KI-Bildgeneratoren, um schnell und preiswert ansprechende Werbematerialien zu erstellen, die genau auf ihre Zielgruppe abgestimmt sind.
  • Content Creation für Blogs und Webseiten: Blogger:innen und Webseitenbetreiber:innen können mit KI-Bildern ihre Inhalte visuell aufwerten. Von Illustrationen bis hin zu spezifischen Szenarien, die mit herkömmlichen Mitteln schwer darzustellen wären – KI macht es möglich.
  • Gaming und Filmproduktion: In der Unterhaltungsbranche werden KI-Bilder genutzt, um schnell visuelle Entwürfe für Charaktere, Landschaften und Szenen zu kreieren. Besonders in der Konzeptphase sparen Entwickler:innen so Zeit und Kosten.
  • Virtuelle und erweiterte Realität: KI-generierte Bilder spielen auch eine Rolle in der Erstellung von VR- und AR-Inhalten, wo realistische Darstellungen entscheidend sind, um Nutzer:innen zu überzeugen.
  • Kunst und kreative Projekte: Künstler:innen nutzen KI als Werkzeug, um traditionelle Kunstformen zu erweitern oder neue Stile zu kreieren.

Wie funktionieren KI-Bildgeneratoren?

KI-Bildgeneratoren basieren meist auf maschinellem Lernen, genauer gesagt auf neuronalen Netzwerken. Aus solchen Netzwerken bestehende KI-Modelle werden mit riesigen Mengen von Bildern trainiert, um deren Eigenschaften zu erlernen. Die heute gebräuchlichsten Bildgeneratoren werden zusätzlich auch mit passenden Bildtexten trainiert, damit sie Bilder aus Beschreibungen erzeugen können.

Ein früher, einflussreicher Lernansatz für die Bildgenerierung sind Generative Adversarial Networks (GANs). Dabei treten zwei Netzwerke gegeneinander an, Generator und Diskriminator. Der Diskriminator versucht zu entscheiden, ob ein Bild „real“ ist oder vom Generator erzeugt wurde. Der Generator versucht also quasi den Diskriminator auszutricksen. Durch diesen Wettbewerb verbessern sich beide Netzwerke immer mehr, bis das GAN in der Lage ist, sehr realistische Bilder zu erzeugen. Ein bekanntes Beispiel für den Einsatz von GANs ist Artbreeder.

Heute setzen die meisten beliebten KI-Bildgeneratoren wie DALL-E, Midjourney oder Stable Diffusion auf eine andere Technologie: sogenannte Diffusionsmodelle. Diese Modelle lernen zunächst, Bildern mit zufälligen Störungen (Rauschen) zu versehen, und kehren diesen Prozess dann um: Sie beginnen mit einem Bild, das ganz aus Rauschen besteht und wandeln dieses schrittweise in immer realistischere Bilder um, reduzieren also das Rauschen, indem sie Details hinzufügen.

Image-to-Image oder Text-to-Image

KI-Bildgeneratoren erzeugen neue Bilder entweder aus Beschreibungen, auch „Prompts“ genannt (Text-to-Image) oder aus einer Bildvorlage, die sie gemäß einer Anweisung verändern (Image-to-Image). Image-to-Image-Aufgaben sind beispielsweise  Outpainting (Bilderweiterungen), Inpainting (gezielte Veränderung von Bildbereichen, z. B. zur Optimierung, Ausbesserung bzw. Restaurierung) sowie andere Modifikationen. Viele Modelle, darunter DALL-E 2 oder Stable Diffusion, beherrschen beide Aufgabenbereiche in unterschiedlicher Ausprägung.

Echt oder künstlich? 

Die Ergebnisse von KI-Bildgeneratoren können beeindruckend sein: Vom realistischen Porträt bis hin zu surrealen Kunstwerken ist alles möglich. Auf den ersten Blick sind sie oft kaum von Fotos zu unterscheiden – oder von dem Malstil berühmter Künstler:innen, wenn das Teil der Vorgabe war. Jedoch weisen die erzeugten Bilder bei genauerem Hinsehen oft mehr oder weniger subtile Unstimmigkeiten auf, etwa anatomische Fehler oder unnatürliche Texturen.

Ein wesentlicher Unterschied zwischen KI-Bildern und herkömmlichen Fotos ist, dass KI-Bilder – wie auch KI-Texte – rein statistisch basierte Wahrscheinlichkeitsverteilungen von Pixeln darstellen. So realistisch sie aussehen mögen, sie bilden nicht die Wirklichkeit ab und stellen keine realen Szenen oder Personen dar.

Tools und Plattformen zur Erstellung von KI-Bildern

Die Auswahl an Tools und Plattformen zur Erstellung von KI-Bildern ist groß, und viele von ihnen sind mit gewissen Einschränkungen kostenlos nutzbar. Wir stellen beispielhaft einige interessante Werkzeuge vor, die sich in ihren Funktionen und Nutzungsmodalitäten unterscheiden. Der Funktionsumfang dieser Tools wächst ständig – die folgenden Beschreibungen stellen daher nur eine Momentaufnahme dar.

1. Midjourney

Midjourney ist ein kostenpflichtiges KI-Tool, das für seine künstlerisch anmutenden und stylishen Ergebnisse bekannt ist. Midjourney hat sich als eines der beliebtesten Tools in der Kreativszene etabliert. Es verwendet Diffusionsmodelle, bietet zahlreiche Funktionen (auch zum Beispiel komplexes Inpainting) und richtet sich damit besonders an professionelle Nutzer:innen, die Wert auf, einzigartige, kreative und ästhetisch ansprechende Bilder legen. Midjourney ist über www.midjourney.com oder Discord zugänglich, und für die Nutzung wird ein Konto benötigt (ab 10 US-Dollar im Monat). 

2. DALL-E  

DALL-E, entwickelt von ChatGPT-Erfinder OpenAI, ist eine Familie von KI-Modellen zur Erstellung von Bildern. Aktuell verfügbar sind DALL-E 2 und DALL-E 3. Für den Zugang zu diesen Modellen ist ein OpenAI-Konto erforderlich; zudem ist die Nutzung kostenpflichtig. DALL-2 ist nur über eine Schnittstelle (API) zugänglich, DALL-E 3 kann auch im Rahmen von ChatGPT Plus genutzt werden.

DALL-E 2 verwendet ein Diffusionsmodell und beherrscht neben Text-to-Image auch Image-to-Image-Aufgaben. Es kann also Bilder als Input verwenden – sogar von dir hochgeladene. Der Nachfolger DALL-E 3 arbeitet eng mit dem Textmodell GPT-4 zusammen und kann daher Prompts besser verarbeiten und sogar gezielt verbessern; allerdings beherrscht er derzeit nur Image-to-Text oder die Weiterbearbeitung (Inpainting) eines von ihm selbst generierten Bildes. DALL-E 3 bietet eine ähnliche Bildqualität wie Midjourney, aber weniger Funktionen; dafür ist es einfacher zu bedienen.

Tipp: Eine Reihe von Werkzeugen anderer Anbieter nutzt ebenfalls DALL-E-Modelle. Dazu zählen auch Bing Image Creator bzw. Copilot von Microsoft sowie der Microsoft Designer – eine Möglichkeit, DALL-E 3 kostenlos auszuprobieren (Konto erforderlich).

3. Stable Diffusion  

Stable Diffusion ist eine Serie von Diffusionsmodellen verschiedener Größe und Leistungsfähigkeit, die im Gegensatz zu den oben genannten Modellen frei verfügbar sind. Diese Modelle können ebenfalls Text-to-Image- und Image-to-Image-Aufgaben lösen, inkl. Inpainting und Outpainting hochgeladener Bilder.

Stable-Diffusion-Modelle können nicht nur kostenlos genutzt, sondern auch lokal auf entsprechend leistungsfähigen Rechnern ausgeführt werden (mithilfe einer grafischen Oberfläche wie ComfyUI, Automatic1111 oder Foocus), was größere Kontrolle über den Generierungsprozess ermöglicht. Ein Konto ist nicht erforderlich.

Im Bezug auf Promptumsetzung und Bildqualität sind Stable-Diffusion-Modelle den kostenpflichtigen Tools ebenbürtig. Allerdings erfordert ihre Bedienung viel Einarbeitung. Diverse Online-Plattformen erleichtern den Zugang, beispielsweise Stable Diffusion WebUI.

Als Open-Source-Modelle können Stable-Diffusion-Versionen zudem nach eigenen Bedürfnissen weiterentwickelt und als Basismodelle für eigenes Training verwendet werden. Auch bekannte Werkzeuge wie Leonardo.AI, Playground, Lexica oder Dreamlike basieren auf Stable Diffusion. Diese Tools bieten meist auch einen kostenfreien Tarif für eine begrenzte Anzahl Bilder an.

4.  Craiyon 

Crayion, früher auch als DALL-E mini bekannt, beruht ursprünglich auf einer einfacheren Version von DALL-E (OpenAIs erstem Text-to-Image-Modell, das noch auf GPT-3 basierte). Die kostenlos und ohne Konto nutzbare Plattform ist besonders einfach zu bedienen: Einfach in das Prompt-Feld klicken und losschreiben, die Generierung beginnt bereits während der Eingabe. Lass dich nicht davon abschrecken, dass die Website auf Englisch ist – dein Prompt kann auch auf Deutsch sein (das gilt für so gut wie alle der hier genannten Tools). Die Ergebnisse sind allerdings weniger professionell als die der Konkurrenz (und mit deutschen Prompts noch schlechter), aber trotzdem machen sie oft viel Spaß: Probier‘s doch einfach mal aus!

Teste jetzt GoDaddy Studio und erstelle ganz einfach Inhalte, die deine Marke in den sozialen Netzwerken und überall sonst im Internet hervorheben und vermarkten.

Welche Vorkenntnisse braucht man, um KI-Bilder zu erstellen?

Es sind keine speziellen Vorkenntnisse nötig, um mit KI-Bildgeneratoren zu arbeiten. Die meisten Plattformen sind intuitiv gestaltet und bieten einen einfachen Einstieg, selbst wenn auch komplexere Funktionen geboten werden. Nützlich ist es, die Prompts überlegt zu formulieren und gewünschte Bildinhalte, Stil oder auch unerwünschte Elemente detailliert zu beschreiben. Denn so lässt sich mit etwas Übung das Ergebnis immer präziser steuern.

Wer noch mehr Kontrolle über den Prozess haben möchte oder spezifische Anpassungen vornehmen will, kann zu Stable Diffusion greifen oder gleich sein eigenes Modell trainieren – das braucht dann aber deutlich mehr Know-how und ist ein zeitaufwendiges Hobby.

Kann man sich die Rechte an KI-Bildern sichern?

Die rechtliche Lage bei KI-generierten Bildern ist komplex. Zunächst gelten die Nutzungsbedingungen der jeweiligen Plattformen; manche schränken die kommerzielle Nutzung ihrer Ergebnisse ein. Allerdings sind KI-generierte Werke in Deutschland nicht urheberrechtlich geschützt, weil sie keine persönlichen geistigen Schöpfungen eines Menschen gemäß § 2 Urheberrechtsgesetz darstellen; in anderen Ländern ist das ähnlich. Deshalb kannst du sie zwar in der Regel frei verwenden, aber gegenüber anderen keine Rechte daran geltend machen – Nachahmer haben freie Bahn.

Außerdem muss stets geprüft werden, ob nicht das generierte KI-Bild selbst Marken- oder Urheberrechte verletzt – ob also darin womöglich existierende Marken oder Werke erkennbar sind, die beim Training der KI verwendet wurden. Wenn du allerdings ein eigenes Bild, für das du Urheberrechte besitzt, der KI zur Vorlage gibst, sollte das Ergebnis ebenfalls geschützt sein.

Der Bereich der KI-Fotografie entwickelt sich rasant weiter. Aktuelle Trends umfassen nicht nur immer bessere Algorithmen für noch realistischere Ergebnisse, sondern auch zum Beispiel die Integration von KI-Bildern in virtuelle Welten oder die Nutzung von KI zur Generierung von Video- und 3D-Inhalten. Mit leistungsfähigeren Werkzeugen werden sicher auch neue Anwendungsbereiche erschlossen werden, etwa im Bereich der personalisierten Werbung oder der dynamischen Content-Erstellung für Webseiten und Apps.

Tipp: Starte dein Business mit Hilfe von AI. Kaufe eine Domain und erstelle dann sofort eine Website, ein Logo und vieles mehr - mit Airo von GoDaddy.

Gleichzeitig bekommen aber KI-Anbieter zunehmend Gegenwind, weil es immer schwieriger wird, rechtskonform an die großen Bildmengen zu gelangen, die für das Training der KI-Modelle benötigt werden. Es bleibt also spannend. 

Bildnachweis: Pixabay, Fotograf:in Riekus