Fotos generieren mit AI – eine Einordnung

Als die erste Version des AI-Bild-Generators Midjourney im März 2022 über über die Chat-Anwendung Discord zum ersten mal für Nutzer verfügbar war, war dies keine große Meldung für die Masse.

Die Ergebnisse waren - naja - ok.

Was sind Bild-Generatoren? Wir geben einen Prompt ein, der das Bild (Grafik, Foto, Comic, …) beschreibt und erhalten als Ergebnis ein Bild, welches im besten aller Fälle unser im Prompt beschriebenes Motiv optimal trifft.

Kurz: Text to Image.

Im Dezember 2023 wurde Version 6 des Bild-Generierungs-Anbieters veröffentlich. Da standen schon sehr viele Münder offen – staunend was in so kurzer Zeit an Fortschritt erreicht worden war.

Die Experten waren sich überwiegend einig - bis relevante Ergebnisse in im Video-Bereich (Text to Video) akzeptable Ergebnisse erreichen werden, würden noch 12 bis 24 Monate ins Land ziehen.

Letzte Woche hat OpenAI mit seinem neuen Text to Video-Tool “Sora” uns eines besseren belehrt. Unglaublich, wie schnell die Entwicklung voranschreitet. Schneller, als selbst die Bullen im AI-Segment es prophezeit haben.

In diesem Artikel nehmen wir uns dem Thema Bild-Generierung an.

Warum?

Wir sind meiner Meinung nach mittlerweile auf einem Niveau angekommen, das in vielen Szenarien aufwändige Fotoshootings mehr als ersetzen kann und auch kleineren Brands mit wenig Budget neue Möglichkeiten eröffnet, wenn es um Brand-Fotos für Kommunikation und Marketing geht.

Los geht’s!

Die Entwicklung der Foto-Qualität bei Midjourney

Wir verwenden immer den gleichen Bild-Prompt. Einmal in Version 3, einmal in Version 5.1 und dann in der Version 6.0:

haggard elderly Louisiannan old man. magazin photo. --s 650 --style raw --ar 16:9 --v 3 // --v 5.1 // ---v 6.0

Version 3: Nicht zu gebrauchen

Version 3: 3 Arme, kein Magazin-Foto, schlechte Bild-Qualität

Version 5.1: Klar als AI-Bild zu identifizieren

Version 5.1: Gutes Ergebnis - aber klar als AI-Bild zu identifizieren

Version 6.0: Magazin-Qualität erreicht

Version 6: Fotografiert oder mit AI-erzeugt. Nicht mehr klar zu sagen - oder?

Du siehst die Weiterentwicklung innerhalb von einem Jahr. Unglaublich, was hier erreicht wurde.

Ich finde dieses Beispiel visualisiert sehr gut, wie schnell die Entwicklung in diesem AI-Segment vorangeschritten ist und welch hohe Qualität wir schon erreicht haben.

Was hat das mit “AI im Business” zu tun?

Bilder spielen in unserer Unternehmens-Kommunikation eine sehr wichtige Rolle. Denken wir nur an Anzeigen, Online-Ads, Social-Media-Kommunikation, Präsentationen, Broschüren, … .

Die Möglichkeiten in sehr kurzer Zeit, sehr hochwertige Bilder für unser Unternehmen zu generieren und nicht mehr zwangsweise auf aufwändige Fotoshootings zurückgreifen zu müssen ermöglichst es jedem Unternehmen jetzt auf einem ganz anderen Niveau zu agieren. Das betrifft sowohl das notwendige Budget, als auch die Zeit die es benötigt, verwertbare Arbeitsergebnisse zu erreichen.

Interesse an einem AI-Workshop in deiner Firma?

Steige innerhalb von nur einem Tag in die produktive Nutzung von AI-Tools ein. Du und bis zu 15 deiner Kolleg:innen sind schon am folgenden Tag in der Lage effizienten und qualitativ besser zu arbeiten. Informiere dich jetzt und sichere dir einen Termin.

Mehr zu den AI-Workshops

5 AI-Tools für unterschiedliche Einsatzzwecke

Es gibt huderte von AI-Bild-Generatoren. Nachfolgend habe ich euch die zusammengestellt, die ich im Einsatz im Unternehmens-Umfeld für sinnvoll und ausgereift genug halte.

DALL-E 3: Schnell mal ne Grafik für die Präsentation erstellen

Wenn das Arbeits-Ergebnis nicht fotorealistisch werden muss und es schnell und einfach gehen soll: Bleib einfach in ChatGPT und generiere dein Bild mit dem dort integrierten DALL-E. Für Präsentation gut geeignet.
Übrigens: Ich rechne sehr stark damit dass DALL-E in den nächsten Wochen auch bei fotorealistischen Bildern einen großen Sprung nach vorne machen wird. Das Text to Video-Tool “Sora” ist so gut bei der Video-Generierung - ich sehe keinen Grund, warum das nicht für Bilder funktionieren sollte.

Anwendung: Sehr einfach!

Midjourney 6: Hochwertige Fotos erzeugen

Wie in unserem Beispiel vorher zu sehen. Aktuell produziert kein AI-Tool bessere fotorealistische Fotos. Wir können sehr nah an die Ergebnisse eines hochwertigen Fotoshootings kommen. Mit einem Promille der Kosten und in kürzester Zeit.

Foto aus einem meiner Tests: “AI Foto-Shooting” für den imaginären Regelmantel-Brand “Octopus”. Wie viel hätte vor zwei Jahren dieses Foto-Shooting wohl gekostet? Für dieses Bild habe ich in Midjourney ca. 20 Minuten benötigt.

Anwendung: Komplexer - aber in den Basics innerhalb von ein paar Stunden erlernbar.

Stable Diffusion: Konstant mit einer Charaktere arbeiten

Wenn es darum geht ein spezielles Gesicht bzw. eine spezielle Person in unterschiedlichen Einstellungen und Szenen zu zeigen ist Stable Diffusion aktuell die erste Wahl. Allerdings ist die Erreichung überzeugender Ergebnisse nicht trivial und erfordert eine deutlich längere Lernphase und mehr technisches Verständnis.

Anwendung: Komplex und sehr technisch.

Qreates: Physische Produkte ins rechte Licht rücken

Wenn es darum geht bestehende physische Produkte für Marketing und Kommunikation ins rechte Licht zu rücken, kommen wir an dem Fotoshootings für das Produkt selbst noch nicht vorbei. Doch das neutrale, freigestellt Produktfoto kann die Basis sein, dieses in vielen hochwertigen Szenen und mit diversen Hintergründen mit Hilfe der AI zu präsentieren. Mit dem Tool “Qreates.com” kann man Beleuchtung, Schatten, Konturen und viele weitere Dinge einstellen und so mit einem eher langweiligen Produktfoto sehr coole Ergebnisse erreichen.

Anwendung: Relativ teuer – aber sein Geld wert.

Avatare erstellen mit artflow

Ein großer Spaß - aber auch praktisch für eine kreative Social Media-Produktion. Mit Artflow kann man einen Charakter “trainieren”, in dem man ca. 20 Bilder von ihm hochlegt und diese trainierten Charakter dann via Text-Prompt in unterschiedlichen Themen und Szenen (inkl. “Kostüm”) zeigen.

Ein großer Spaß: Würde ich so als “Rockstar” aussehen?

Anwendung: Einfach, wenn genügend Bilder vorliegen.

Links aus diesem Artikel

Hier, wie versprochen, alle Links, die in diesem Artikel genannt wurden:

Sora: neues Text to Image Tool von OpenAI

Midjourney: Perfekte Fotos - der aktuelle Gold-Standard

Stablediffusion: Konstante Charaktere erzeugen.

Qreates: Physische Produkte ins rechte Licht rücken

DALL-E: Schnell und einfach Grafiken erstellen

Artflow: Verwandele dich und andere in Avatare oder Charktere deiner Wahl

Wenn das, was wir uns heute angeschaut haben, das Ergebnis der Entwicklung eines Jahres ist – mit was werden wir uns in 2025 oder gar 2030 beschäftigen?

Es ist immer wieder beeindruckend, wie schnell alles geht, seitdem der AI-Zug im November 2022 angerollt ist.

In diesem Sinne - bis zum nächsten mal.

Kai Michael Schäfer

Fotos generieren mit AI – eine Einordnung

Die Entwicklung der Foto-Qualität bei Midjourney

Version 3: Nicht zu gebrauchen

Version 5.1: Klar als AI-Bild zu identifizieren

Version 6.0: Magazin-Qualität erreicht

Was hat das mit “AI im Business” zu tun?

Interesse an einem AI-Workshop in deiner Firma?

5 AI-Tools für unterschiedliche Einsatzzwecke

DALL-E 3: Schnell mal ne Grafik für die Präsentation erstellen

Midjourney 6: Hochwertige Fotos erzeugen

Stable Diffusion: Konstant mit einer Charaktere arbeiten

Qreates: Physische Produkte ins rechte Licht rücken

Avatare erstellen mit artflow

Links aus diesem Artikel

Kennst du schon den Master AI Newsletter?