Als die erste Version des AI-Bild-Generators Midjourney im März 2022 über über die Chat-Anwendung Discord zum ersten mal für Nutzer verfügbar war, war dies keine große Meldung für die Masse. 

Die Ergebnisse waren - naja - ok.

Was sind Bild-Generatoren? Wir geben einen Prompt ein, der das Bild (Grafik, Foto, Comic, …) beschreibt und erhalten als Ergebnis ein Bild, welches im besten aller Fälle unser im Prompt beschriebenes Motiv optimal trifft. 

Kurz: Text to Image.

Im Dezember 2023 wurde Version 6 des Bild-Generierungs-Anbieters veröffentlich. Da standen schon sehr viele Münder offen – staunend was in so kurzer Zeit an Fortschritt erreicht worden war. 

Die Experten waren sich überwiegend einig - bis relevante Ergebnisse in im Video-Bereich (Text to Video) akzeptable Ergebnisse erreichen werden, würden noch 12 bis 24 Monate ins Land ziehen.

Letzte Woche hat OpenAI mit seinem neuen Text to Video-Tool “Sora” uns eines besseren belehrt. Unglaublich, wie schnell die Entwicklung voranschreitet. Schneller, als selbst die Bullen im AI-Segment es prophezeit haben. 

In diesem Artikel nehmen wir uns dem Thema Bild-Generierung an.

Warum? 

Wir sind meiner Meinung nach mittlerweile auf einem Niveau angekommen, das in vielen Szenarien aufwändige Fotoshootings mehr als ersetzen kann und auch kleineren Brands mit wenig Budget neue Möglichkeiten eröffnet, wenn es um Brand-Fotos für Kommunikation und Marketing geht. 

Los geht’s! 🚀



Die Entwicklung der Foto-Qualität bei Midjourney

Wir verwenden immer den gleichen Bild-Prompt. Einmal in Version 3, einmal in Version 5.1 und dann in der Version 6.0:

haggard elderly Louisiannan old man. magazin photo. --s 650 --style raw --ar 16:9 --v 3 // --v 5.1 // ---v 6.0

Version 3: Nicht zu gebrauchen 

Version 3: 3 Arme, kein Magazin-Foto, schlechte Bild-Qualität

Version 5.1: Klar als AI-Bild zu identifizieren 

Version 5.1: Gutes Ergebnis - aber klar als AI-Bild zu identifizieren

Version 6.0: Magazin-Qualität erreicht 

Version 6: Fotografiert oder mit AI-erzeugt. Nicht mehr klar zu sagen - oder?

Du siehst die Weiterentwicklung innerhalb von einem Jahr. Unglaublich, was hier erreicht wurde. 

Ich finde dieses Beispiel visualisiert sehr gut, wie schnell die Entwicklung in diesem AI-Segment vorangeschritten ist und welch hohe Qualität wir schon erreicht haben.


Was hat das mit “AI im Business” zu tun?

Bilder spielen in unserer Unternehmens-Kommunikation eine sehr wichtige Rolle. Denken wir nur an Anzeigen, Online-Ads, Social-Media-Kommunikation, Präsentationen, Broschüren, … .

Die Möglichkeiten in sehr kurzer Zeit, sehr hochwertige Bilder für unser Unternehmen zu generieren und nicht mehr zwangsweise auf aufwändige Fotoshootings zurückgreifen zu müssen ermöglichst es jedem Unternehmen jetzt auf einem ganz anderen Niveau zu agieren. Das betrifft sowohl das notwendige Budget, als auch die Zeit die es benötigt, verwertbare Arbeitsergebnisse zu erreichen. 


5 AI-Tools für unterschiedliche Einsatzzwecke

Es gibt huderte von AI-Bild-Generatoren. Nachfolgend habe ich euch die zusammengestellt, die ich im Einsatz im Unternehmens-Umfeld für sinnvoll und ausgereift genug halte.

DALL-E 3: Schnell mal ne Grafik für die Präsentation erstellen 

Wenn das Arbeits-Ergebnis nicht fotorealistisch werden muss und es schnell und einfach gehen soll: Bleib einfach in ChatGPT und generiere dein Bild mit dem dort integrierten DALL-E. Für Präsentation gut geeignet. 
Übrigens: Ich rechne sehr stark damit dass DALL-E in den nächsten Wochen auch bei fotorealistischen Bildern einen großen Sprung nach vorne machen wird. Das Text to Video-Tool “Sora” ist so gut bei der Video-Generierung - ich sehe keinen Grund, warum das nicht für Bilder funktionieren sollte. 

Anwendung: Sehr einfach!

Midjourney 6: Hochwertige Fotos erzeugen

Wie in unserem Beispiel vorher zu sehen. Aktuell produziert kein AI-Tool bessere fotorealistische Fotos. Wir können sehr nah an die Ergebnisse eines hochwertigen Fotoshootings kommen. Mit einem Promille der Kosten und in kürzester Zeit.

Foto aus einem meiner Tests: “AI Foto-Shooting” für den imaginären Regelmantel-Brand “Octopus”. Wie viel hätte vor zwei Jahren dieses Foto-Shooting wohl gekostet? Für dieses Bild habe ich in Midjourney ca. 20 Minuten benötigt.

Anwendung: Komplexer - aber in den Basics innerhalb von ein paar Stunden erlernbar. 
  

Stable Diffusion: Konstant mit einer Charaktere arbeiten 

Wenn es darum geht ein spezielles Gesicht bzw. eine spezielle Person in unterschiedlichen Einstellungen und Szenen zu zeigen ist Stable Diffusion aktuell die erste Wahl. Allerdings ist die Erreichung überzeugender Ergebnisse nicht trivial und erfordert eine deutlich längere Lernphase und mehr technisches Verständnis. 

Anwendung: Komplex und sehr technisch. 
  

Qreates: Physische Produkte ins rechte Licht rücken

Wenn es darum geht bestehende physische Produkte für Marketing und Kommunikation ins rechte Licht zu rücken, kommen wir an dem Fotoshootings für das Produkt selbst noch nicht vorbei. Doch das neutrale, freigestellt Produktfoto kann die Basis sein, dieses in vielen hochwertigen Szenen und mit diversen Hintergründen mit Hilfe der AI zu präsentieren. Mit dem Tool “Qreates.com” kann man Beleuchtung, Schatten, Konturen und viele weitere Dinge einstellen und so mit einem eher langweiligen Produktfoto sehr coole Ergebnisse erreichen. 

Anwendung: Relativ teuer – aber sein Geld wert.
  

Avatare erstellen mit artflow

Ein großer Spaß - aber auch praktisch für eine kreative Social Media-Produktion. Mit Artflow kann man einen Charakter “trainieren”, in dem man ca. 20 Bilder von ihm hochlegt und diese trainierten Charakter dann via Text-Prompt in unterschiedlichen Themen und Szenen (inkl. “Kostüm”) zeigen. 

Ein großer Spaß: Würde ich so als “Rockstar” aussehen? 😂

Anwendung: Einfach, wenn genügend Bilder vorliegen.


Links aus diesem Artikel

Hier, wie versprochen, alle Links, die in diesem Artikel genannt wurden:

Sora: neues Text to Image Tool von OpenAI

Midjourney: Perfekte Fotos - der aktuelle Gold-Standard

Stablediffusion: Konstante Charaktere erzeugen.

Qreates: Physische Produkte ins rechte Licht rücken

DALL-E: Schnell und einfach Grafiken erstellen

Artflow: Verwandele dich und andere in Avatare oder Charktere deiner Wahl


Wenn das, was wir uns heute angeschaut haben, das Ergebnis der Entwicklung eines Jahres ist – mit was werden wir uns in 2025 oder gar 2030 beschäftigen?

Es ist immer wieder beeindruckend, wie schnell alles geht, seitdem der AI-Zug im November 2022 angerollt ist.

In diesem Sinne - bis zum nächsten mal.

✌🏼Kai Michael Schäfer

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>