Generative KI: Stable Diffusion

Was ist Stable Diffusion?

Stable Diffusion ist ein Text-zu-Bild-Generator und gehört zur Kategorie generative Künstlicher Intelligenz (KI), also eine KI, die i. d. R. durch eine Texteingabe („prompten“) etwas erzeugt, in diesem Fall digitale Bilder. So hat es zumindest begonnen…

Mittlerweile umfasst Stable Diffusion noch mehr Funktionen, z. B.

  • Text in Bild oder Video wandeln

  • Handgezeichnete Skizzen in ein digitales Bild umwandeln

  • Gesichter in Videos und Fotos austauschen

  • Hintergrund aus Bildern entfernen

  • Löschen von unerwünschten Objekten in Bildern

  • Hochskalieren von Bildern, bis auf 4K

  • etc.


Wie funktioniert Stable Diffusion?

Durch das Trainieren mit großen Mengen an Bilddaten lernt die KI, darin Muster und Strukturen zu erkennen und nutzt diese wiederum zur Generierung neuer Bilder. Stable Diffusion analysiert die als Textbefehl eingegebenen Wörter und sucht nach relevanten Mustern in seinem internen Wissen. Basierend auf diesen Mustern erstellt das Modell dann Bilder, die der Beschreibung entsprechen.


Wer hat’s gebaut?

Das finden besonders toll und deswegen erwähnen wir das Tool auch hier in unserem Glossar:
Stable Diffusion wurde von Stability AI in Kooperation mit einer Forschungsgruppe der Ludwig-Maximilians-Universität München, LAION, RunwayML und EleutherAI entwickelt und 2022 veröffentlicht.
Als Open-Source-Software steht Stable Diffusion allen kostenlos für kommerzielle und private Projekte zur Verfügung.

Die Anwendung läuft online über verschiedene GUIs (Grafische Benutzeroberflächen) wie DreamStudio von Stability AI oder lokal auf dem Rechner. Überdies ermöglichen Plug-ins die Integration in Software von Drittherstellern wie Adobe Photoshop, wodurch Projekte direkt in vertrauten Umgebungen umsetzen werden können.


Risiken solcher oder ähnlicher KI

  • Die missbräuchliche Nutzung für z. B. Diffamierung, politische Propaganda, sexualisierte Darstellungen, Desinformationskampagnen oder Deepfakes.

  • Viele rechtliche Fragen zu Urheber- und Nutzungsrechten der generierten Bilder und des verwendeten Trainingsmaterials sind noch offen.

  • Beeinflussung der Bilderstellung durch im Trainingsmaterial enthaltenen Bias, dass z. B. nur weiße Männer als Bild für den Prompt “worker” (die englische Bezeichnung ist geschlechtsneutral) erscheinen.

  • Der hohe Energiebedarf und technische Aufwand sowohl für das Training der KI als auch jedes Generieren von Bildern.

  • KI erkennt nur Muster z. B. das einer Hand, aber versteht nicht, was eine Hand eigentlich ist. Darum sind Hände mit drei oder sechs Fingern ein Klassiker bei der Bildgenerierung durch KI.

Chancen generativer KI

Stable Diffusion und ähnliche generative KI bringen natürlich aber auch viele Chancen mit sich. Ihre Fähigkeit, eigenständig neue Inhalte und Ideen zu entwickeln, kann nicht nur kreative Prozesse beschleunigen, sondern auch Innovationen vorantreiben.
Generative KI eröffnet zudem Möglichkeiten für individuell angepasste Lösungen in verschiedenen Bereichen wie Musik, Kunst, Design und Texterstellung.
Unternehmen können durch den Einsatz generativer KI ihre Abläufe automatisieren, Kosten reduzieren und insgesamt effizienter agieren.
Der verantwortungsbewusste Umgang damit liegt aber natürlich in der Hand von uns allen.

Und hier geht’s los

 

Tina

Director AI
030 / 609 888 213
ts@neuewerte.de

KI Agentur Berlin

Zurück
Zurück

Darum scheitern Start-ups

Weiter
Weiter

Citizen Entrepreneurship