Künstliche Intelligenz: Text-zu-Bild-Revolution

Ralf Dreiundzwanzig

vor 2 Jahren

Künstliche Intelligenz verwenden wir in unserem Atelier für Virtual Reality und interaktive Markenerlebnisse und im Fotostudio für Werbefotografie schon etwas länger. Aber wussten Sie, dass Künstliche Intelligenz auch kreativ sein kann?

Anfang dieses Jahres habe ich eine sehr spannende Werbeanzeige von Meta (früher Facebook) gelesen. Hier wurde eine Studie von McKinsey vorgestellt, in der 77 Prozent der befragten Führungskräfte in Unternehmen, die Kreativität als einen der entscheidenden Wachstumsfaktoren ansehen.

In dieser Werbeanzeige wurde beispielhaft die Künstliche Intelligenz von Spark AR als Creative-Partner vorgestellt.

Link-Empfehlung

KI revolutioniert die Kreativität von morgen

Eine neue Generation von KI-Tools eröffnet Menschen und Unternehmen neue Welten der Fantasie und Zusammenarbeit

https://www.facebook.com/business/news/insights/how-ai-will-elevate-the-future-of-creativity

Künstliche Intelligenz: Text-zu-Bild-Revolution

Beginnen wir mit « einem altägyptischem Bild von einem Streit darüber, wer mit Müllrausbringen dran ist». Die unmöglichsten Dinge illustriert eine Künstliche Intelligenz recht glaubwürdig.

Twitter Tweet zu dem altägyptischem Bild

KI-Forschung nach dem Vorbild Cern

Ein wirklich lesenswerter Artikel über Hugging Face - Die KI-Gemeinschaft baut die Zukunft.

https://huggingface.co/

Stable Diffusion ist ein Text-zu-Bild-Modell

Stable Diffusion ist ein Text-zu-Bild-Modell für latente Diffusion, das von Forschern und Ingenieuren von CompVis, Stability AI und LAION entwickelt wurde. Es wurde auf 512x512 Bildern aus einer Teilmenge der LAION-5B-Datenbank trainiert. LAION-5B ist der größte, frei zugängliche multimodale Datensatz, der derzeit existiert.

Die Open-Source-Lizenz.

Bevor Sie das Modell verwenden können, müssen Sie die Modelllizenz akzeptieren, um die Gewichte herunterladen und verwenden zu können.

Die Lizenz wurde entwickelt, um die potenziell schädlichen Auswirkungen eines so leistungsstarken maschinellen Lernsystems zu mindern.

Sie dürfen das Modell nicht verwenden, um absichtlich illegale oder schädliche Ergebnisse oder Inhalte zu produzieren oder weiterzugeben.
Die Entwickler erheben keinen Anspruch auf die von Ihnen erzeugten Ergebnisse, Sie können sie frei verwenden und sind für ihre Verwendung verantwortlich, die nicht gegen die in der Lizenz festgelegten Bestimmungen verstoßen sollte.
Sie dürfen die Gewichte weiterverteilen und das Modell kommerziell und/oder als Dienstleistung nutzen. Wenn Sie dies tun, beachten Sie bitte, dass Sie dieselben Nutzungsbeschränkungen wie in der Lizenz einhalten müssen und eine Kopie von CreativeML OpenRAIL-M an alle Ihre Nutzer weitergeben müssen.

Suchmaschine Lexica

Mit der Suchmaschine Lexica können Sie die bislang mit Stable Diffusion erzeugten Bilder durchsuchen. Lexica erschließt derzeit über fünf Millionen Einträge, laufend werden es mehr. Wer mit Stable Diffusion Text-zu-Bild-System KI-basiert Bilder erstellt, findet hier kreative Inspiration.

Bad Omen

Art Nouveau

Porträt eines transzendentalen Wesens

Szene aus Tim Burton's Alptraum

Porträt von Jungen und Mädchen mit Astronautenhelmen

Anleitungen und Quellen

Der Heise Verlag hat eine wunderbare Einführung in die Technik veröffentlicht

https://www.heise.de/news/Text-zu-Bild-Revolution-Stable-Diffusion-ermoeglicht-KI-Bildgenerieren-fuer-alle-7244307.html

Im Blog von Hugging Face hat ein Code Beispiel veröffentlicht https://huggingface.co/blog/stable_diffusion und stellt weiterführende Kurse und Anleitungen zur Verfügung.

Jetzt sind Sie gefragt!

Haben Sie Anregungen, Ergänzungen oder einen Fehler gefunden? Dann freue ich mich auf Ihren Kommentar.

Sie können diesen Beitrag natürlich auch weiterempfehlen. Ich bin Ihnen für jede Unterstützung dankbar!