Künstliche Intelligenz in der Fotografie, Teil 1 Potenzielle Gefahren und Chancen oder Curiosity Killed The Cat Ein Beitrag von Claudia Wiens

Künstliche Intelligenz in der Fotografie

Derzeit rollt die Entwicklung der Künstlichen Intelligenz (KI) wie ein Tsunami oder eine Katze auf einem Skateboard über uns hinweg, mit noch unbekannten Folgen für unser Leben. Die News überschlagen sich, da „Frankenstein“ sich augenscheinlich verselbstständigt hat, und selbst die Expertinnen und Experten nicht mehr die Kontrolle über ihre eigene Erfindung haben. Die Entwicklung ist so rasant, dass dieser Beitrag, wenn Sie ihn gelesen haben, nicht mehr aktuell sein wird.

Bereits 2015 gab es die ersten Bildgeneratoren. Die Qualität der Ergebnisse war aber noch sehr bescheiden und es wurde dem wenig Beachtung geschenkt. Bereits seit 2018 gibt es aber die Website This Person Does Not Exist, wo man KI-Porträts generieren kann, mit einem komplizierten KI-Algorithmus, der von der amerikanischen Techfirma NVIDIA entwickelt wurde. Jeder kann auf dieser Website Fotos von nichtexistierenden Menschen generieren lassen. Ich habe ein wenig damit gespielt nachfolgende Bilder generiert. Meine Prompts waren bspw.: männlich, 12–18 Jahre alt, Inder.

l_PAmn5q
avatar-gen110b7b3803d74ca87aeeb923e431e191
avatar-gen116efc1e2e5d54d9d2d173fd4ff4894d

An dieser Stelle bitte einmal zurücklehnen und sich bewusst werden, WAS Sie hier betrachten. Einen Menschen, den es gar nicht gibt. Aber es gibt ein Foto von ihm! Auch wenn Fotos noch nie ein Abbild der Realität waren, so haben sie doch bisher zumindest real existierende Menschen oder Objekte abgebildet.

Potenzielle Gefahren und Chancen oder Curiosity Killed The Cat

KI zieht sich bereits seit einigen Jahren durch alle Lebensbereiche. Sie schreibt Songs, entwickelt pharmazeutische Produkte, navigiert fahrerlose Autos und erkennt Gesichter, um nur einige Beispiele zu nennen. Es wurde und wird als eine vielversprechende Erfindung angepriesen. Doch seit einigen Monaten herrscht mehr Sorge als Euphorie. Googles CEO Sundar Pichai drückte seine Bedenken in einem Interview im April 2023 mit CBS aus und gab zu, dass die rasante Entwicklung der künstlichen Intelligenz ihm schlaflose Nächte bereite und warnte, dass die Technologie sehr schädlich („very harmful“) sein könnte, wenn sie falsch eingesetzt würde. Eine digitale Atombombe war mein erster Gedanke. So dachte sich wohl auch der Journalist, der an späterer Stelle fragte, ob man ein Abkommen im Stile der nuklearen Waffen benötige. Etwas, das Pinchai ohne Zögern bejahte. Die KI-Technologie hinter ChatGPT und Bard, bekannt als „Large Language Modell“ wird trainiert (sowie die Bilder generierenden Modelle), mit einer enormen Datenflut, die dem Internet entnommen wird, und ist dann in der Lage, plausible – aber nicht notwendigerweise korrekte – Antworten zu jedem beliebigen Thema zu geben. Das Potenzial, Desinformation und Manipulation zu kreieren, ist enorm. Man kann jetzt problemlos Videos erzeugen, in denen der Papst eine Rede über die Vorzüge des Heroinkonsums anpreist. Und das wäre noch eines der geringsten Probleme.

Die Sorge über potenzielle Gefahren ist inzwischen sogar so groß, dass im März 2023 Tausende von KI Experten:innen, Forscher:innen und Unterstützer:innen einen offenen Brief unterzeichnet haben, in dem gefordert wird für wenigstens sechs Monate die Entwicklung gigantischer KIs zu pausieren, da die Sorge besteht, dass die Entwicklung dieser Technologie außer Kontrolle gerät (oder bereits außer Kontrolle geraten ist). Sie fordern internationale Abkommen über Richtlinien und Gesetze, die die Sicherheit gewährleisten. Denn selbst die Erfinder der künstlichen Intelligenz sind nicht mehr in der Lage zu verstehen, wie ihre Kreation funktioniert, sie zu kontrollieren und geschweige denn vorherzusehen, was passieren wird. Eine echte Frankenstein-Kreation, faszinierend, aber potenziell höchst gefährlich.

Als ob diese News nicht bereits alarmierend genug wären, hat dann auch noch der „Godfather of AI“, wie Geoffrey Hinton häufig genannt wurde, Anfang Mai 2023 seinen Job bei Google gekündigt, um zukünftig offener über die potenziellen Gefahren von KI sprechen zu können. Teilweise bedauert er sogar seine Beteiligung an der Entwicklung von KI. Selbst wenn Wissenschaftler:innen sich für einen langsameren und bewussteren Ansatz bei der KI entscheiden sollten, beunruhigt der mögliche Ausgang einer weiteren Entwicklung offensichtlich auch Hinton: „Es ist schwer vorstellbar, wie man die schlechten Akteure daran hindern kann, sie (die KI, Anmerkung der Autorin) für schlechte Dinge zu nutzen“, sagte er.

Sind KI-Bilder Fotografien oder etwas anderes?

Im April 2023 wurde die internationale Fotografie Welt durch ein Ereignis, das in wenigen Tagen zum Selbstläufer wurde, wachgerüttelt und eine lebhafte Debatte begann. Der deutsche Fotokünstler Boris Eldagsen gewann bei den renommierten Sony World Photography Awards 2023 in der Kategorie „Kreativ“ den ersten Platz mit einem Porträt, das zwei Frauen zeigt. Sein preisgekröntes „Foto“ hat er aber mit KI generiert. Als die Organisatoren nicht auf seinen Wunsch eingingen, den Preis mit einer offenen Debatte zu verbinden, hat er die Auszeichnung abgelehnt.

In einem Post auf Twitter schrieb er „Ich habe mich ganz frech beworben, um herauszufinden, ob die Wettbewerbe für die Teilnahme von KI-Bildern vorbereitet sind. Sind sie nicht! Wir, die Fotowelt, benötigt eine offene Diskussion. Eine Diskussion darüber, was wir unter Fotografie verstehen wollen und was nicht. Ist der Überbegriff Fotografie groß genug, um KI-Bilder zur Teilnahme einzuladen – oder wäre das ein Fehler? Mit meiner Ablehnung des Preises hoffe ich, diese Debatte zu beschleunigen.“

Photography by KI & Boris Eldagsen Quelle: https://www.eldagsen.com/sony-world-photography-awards-2023/
Photography by KI & Boris Eldagsen Quelle: https://www.eldagsen.com/sony-world-photography-awards-2023/

Das ist ihm gelungen, die Ablehnung des Preises schlug sogar höhere Wellen, als er sich zuvor erhofft hatte, sodass im April 2023 auch viele internationale Medien wie The Guardian, BBC, Al-Jazeera, CNN und viele mehr Interviews mit Eldagsen führten. Offensichtlich trifft die Thematik einen Nerv. Auch ich bin erst dadurch wirklich aufgeschreckt und habe mich aktuell ausführlich mit KI in der Fotografie auseinandergesetzt, und bin zugleich geschockt und fasziniert. Das Thema wirft viele Fragen auf. Die offensichtlichste Frage ist‚ sind KI-Bilder überhaupt Fotografien? Ist die Voraussetzung für Fotografie eine Kamera? Ich würde das mit JA beantworten. Somit wären KI-Bilder keine Fotografien. Aber was sind sie dann? KI generiert schließlich so etwas wie Fotos.

Auch Eldagsen hält es für eine andere Kunstform und sagt deshalb, wir benötigen einen neuen Namen, und passend schlägt er „Promptografie“ vor, da die Bilder anhand von Prompts erzeugt werden. Laut Eldagsen, sollten Fotografie und „Promptografie“ getrennte Kategorien sein, die nicht miteinander konkurrieren. Wie auch Malerei und Fotografie es sind.

Auch der Deutsche Fotorat hält eine Kamera für zwingend notwendig, um Fotografien zu erstellen und positioniert sich wie folgt:

„KI-Bilder sind keine Fotografien.“

Dem Deutschen Fotorat ist wichtig, zwischen kamerabasierten Fotografien und synthetisch erzeugten KI-Bildern zu unterscheiden, denn Fotografien entstehen ausschließlich durch die Abbildung von Licht in einer Kamera.

KI-generierte Bilder sind daher keine Fotografien und sollten nicht so bezeichnet werden, auch wenn sie durch ihre fotorealistische Darstellung diesen Eindruck vermitteln. Weil die qualitativen Grenzen verschwinden, ist eine klare Differenzierung zwischen Fotografien einerseits und generierten Bildern andererseits für deren Einordnung und Wahrnehmung von entscheidender Bedeutung und stärkt die Medienkompetenz der Betrachter.“

Es scheint also bereits ein Konsens zu existieren, dass KI-Bilder keine Fotografien sind, sondern etwas anderes, das noch genauer definiert werden muss.

erdbeere
banane
orange
zitrone

Wie werden KI-Bilder generiert?

Falls Sie sich noch nie mit KI in der Fotografie beschäftigt haben, hier ein kurzer Überblick wie es funktioniert:

Es gibt mehrere Open Source Modelle wie Midjourney, Dall-E2, Stable Diffusion, und viele Programme, die man kaufen kann.
Momentan gibt es vorwiegend drei Möglichkeiten, Bilder zu generieren.

  1. Man gibt sogenannte Prompts (to prompt = auffordern) ein. Es gibt inzwischen viele Kategorien wie Perspektive, Thema, Farbgebung, Stil, Licht usw., durch die man das Ergebnis präziser bestimmen kann. Außerdem gibt es negative Prompts, also Ausschlüsse. Anhand dieser Prompts errechnet oder generiert die KI nun ein Bild. Je präziser man die Prompts formuliert, desto genauer das Ergebnis.
  2. Man lädt ein Foto hoch und bittet darum, Variationen zu generieren.
  3. Man lädt ein Foto hoch, oder benutzt ein generiertes Foto und radiert eine Stelle aus und ersetzt diese Stelle durch etwas anderes anhand von Prompts.

Natürlich kann man diese generativen Vorgänge untereinander mischen und die Möglichkeiten sind unendlich.

sunflower
Gorilla

Das Pizza-Bild habe ich mit Stable Diffusion generiert. Meine Prompts waren „knusprige Pizza, von oben gesehen, frische rote Tomaten und etwas Basilikum“.

Die KI wird mit unzähligen Informationen „trainiert“, diese Informationen werden meistens von Bots im Internet gesammelt, das heißt dabei werden dann auch sämtliche Urheberrechtsbestimmungen umgangen. Wenn nun jemand Prompts eingibt, werden vorhandene Bilder zum Rauschen gebracht, also in ihre Pixel zerlegt, dieser Raum heißt „latent space“, und dann werden die Pixel ganz neu zusammengesetzt und es entsteht ein neues Bild, generiert durch die Prompts. Sowie die nachfolgende Sonnenblume.

Hier können Sie kostenlos mal etwas herumprobieren. Manche Ergebnisse wirken erschreckend echt, andere sind sofort als fake zu erkennen wie mein Gorilla in New York.

Eldagsen ist überzeugt, dass KI eine Wissensverstärkung sein kann, wenn die Prompts von einem Profi eingegeben werden. Eine Fotografin oder ein Fotograf könnten demnach präzisere Prompts eingeben und damit dann auch bessere Ergebnisse erzielen als jemand, der keine Ahnung von Fotografie hat und beliebige Prompts benutzt.

Neue Wege beschreiten ...

... mit KI als Werkzeug, um die eigenen Ideen umzusetzen und nicht als Ersatz für fehlende Kreativität.

Der geniale Fotokünstler Charlie Engman, besonders bekannt für seine ungewöhnlichen Fotos von seiner Mutter, macht sich KI zu eigen, um ganz neue Werke kreieren zu können, die vorher so nicht möglich waren. In einem Interview mit The New Yorker im Mai 2023 sagte er „Das Tolle an KI ist, dass ich 300 Bilder am Tag erzeugen kann. Ich werde schlichtweg nicht durch die physikalische Realität begrenzt“. Seine Bilder sind auf eine faszinierende Weise irritierend und bizarr, weil Realität und Surrealität nahtlos miteinander verschmelzen. Ein Bild zeigt mehrere Geschäftsfrauen, die sich liebevoll umarmen und dabei auch ein seltsames aufblasbares Wesen küssen. Ein anderes Bild zeigt zwei Jungen auf einer Couch hockend, zwischen ihnen so etwas wie ein Zwergpferd. Es wirkt wie ein freundliches Familienbild, das erst auf den zweiten Blick seine Surrealität offenbart.

Wie bereits erwähnt, sind die Urheberrechtsfragen sehr heikel, ungeklärt und auch nicht so einfach zu definieren. Wie geht also ein Künstler damit um, der einerseits sein Urheberrecht gewahrt wissen will, aber andererseits das Urheberrecht umgeht, wenn er mit Midjourney neue Bilder generiert. Engman hat da eine eher unbekümmerte Haltung und argumentiert, dass jede:r Künstler:in die Werke anderer studiert und dadurch inspiriert wird und dann das Gesehene unweigerlich in die eigenen Arbeiten einbringt. Und so sieht er die neu gemixten KI-Bilder als eine Art „Ausleihe“, die sich nicht wesentlich von der Art und Weise unterscheidet, mit der er aus einer Reihe ästhetischer Einflüsse die Rosinen herauspickte, um seine Bilder seiner Mutter zu kreieren, wie er in einem Interview mit The New Yorker erklärte.

Inzwischen füttert er Midjourney auch mit seinen eigenen älteren Bildern seiner Mutter und erzeugt jetzt extrem skurrile Bilder, die aber kurioserweise im Stil und Bildsprache gut zu den echten Fotografien passen. Die Fotografien seiner Mutter sind teilweise so bizarr, dass surreale KI-Bilder schon fast die logische Weiterführung sind.

Kann KI die Fotografen:innen ersetzen?

Im kreativen Bereich könnten die durch KI generierten Bilder einen Großteil der Fotos ersetzen, und tun es wahrscheinlich bereits, da es keine Regulierungen dazu gibt. Mit großer Sicherheit ist es für viele Firmen, Unternehmen und Geschäfte verlockend, Bilder in Sekundenschnelle für wenig Geld zu erzeugen. Sie greifen bereits jetzt schon seit Langem auf Royalty Free Fotos zurück. Seitdem es diese Fotoschwemme für Peanuts gibt, ist eine große Einnahmequelle für Fotografen weggefallen. Agenturverkäufe bringen nichts mehr und der Aufwand Bilder zu beschriften und hochzuladen, ist zu groß für das, was später dabei herauskommen könnte. Mit durch Prompts generierte Bilder werden sich alle generischen Bilder wie Pizzen, Blumen und Katzen problemlos ersetzen lassen.

Diese Frage habe ich dann doch auch einfach mal ChatGPT gestellt und siehe da, ich habe eine umfassende Antwort mit mehreren plausiblen Punkten erhalten. Einen davon möchte ich hier mit Ihnen teilen, weil er mir der ausschlaggebendste und vor allen richtungsweisende zu sein scheint:

„Zwischenmenschliche Verbindung und Interaktion: Fotografie beinhaltet oft die Arbeit mit Menschen, sei es Porträtfotografie, Hochzeiten, Veranstaltungen oder Fotojournalismus. Fotografen bauen eine Beziehung zu ihren Subjekten und Motiven auf, schaffen ein angenehmes Umfeld und fangen echte Emotionen ein. Der KI fehlen die emotionale Intelligenz und die zwischenmenschlichen Fähigkeiten, die erforderlich sind, um solche Verbindungen herzustellen und sinnvoll mit ihren Subjekten zu interagieren.“

Aber auch auf dem Gebiet gibt es bereits Erfolge zu verzeichnen. Das Wettrennen um die AKI (Allgemeine Künstliche Intelligenz) hat längst begonnen und Singularität ist nicht nur mehr ein Horrorszenario für Science Fiction Movies. Aber das ist ein Thema für einen weiteren Blogeintrag.

Da KI definitiv in kürzester Zeit viele Jobs ersetzen wird – in Polen liefern bereits kleine Roboterautos Essen aus – sollte man sich, wenn möglich, in Bereichen weiterbilden oder ausrichten, in denen uns KI unterlegen ist. All jene Bereiche, wo emotionale Intelligenz gefragt ist. Etwas mehr Empathie, Herzlichkeit und Wohlwollen können unserem Planeten generell nicht schaden. Das wird unsere Überlebensstrategie im zwischenmenschlichen, aber eben auch im beruflichen Umfeld sein müssen.

Und wirkliche Kreativität! Kreative Innovation, Problemlösung, Improvisation werden auch Qualitäten sein, die uns Menschen (zumindest noch für einige Zeit) überlegen sein lassen.

Die Programme erzeugen Bilder, indem sie auf riesige „Datensätze“ bereits vorhandener Bilder zurückgreifen. Das ist wahrscheinlich der Grund, warum bisher nur wenig davon das Niveau von herausragender und mutiger Originalität erreicht.

andy-warhol
helmut-newton

Ich mache mir meine Welt, wie sie mir gefällt. Hier habe ich mir ein Foto eines Bohemien-Sängers im Andy Warhol Stil gewünscht, und eines von einer Sängerin im Helmut Newton Stil. Voilà! Dall-E 2 macht es möglich.

Was sind die möglichen Gefahren im Bereich der Fotografie?

„Die KI wird wahrscheinlich zum Ende der Welt führen, aber in der Zwischenzeit wird es große Unternehmen geben.“  – Sam Altman, CEO von OpenAI

Abgesehen vom Verlust von bestimmten Fotoaufträgen ist die größte Gefahr die Verbreitung von Desinformation und Manipulation. Fake News, und damit meine ich wirklich erfundene Nachrichten, wurden schon immer zu Propagandazwecken eingesetzt, aber noch nie war die Erstellung und Verbreitung solcher Inhalte so einfach wie jetzt. Im Grunde kann jeder jetzt neue Bilder generieren oder vorhandene manipulieren und sie dann verbreiten. Über die sozialen Medien werden oft rasant schnell Millionen von Menschen erreicht. Und auch wenn es später eine Richtigstellung gibt, ist der Schaden bereits angerichtet. Im Grunde könnte man fast jeden Beitrag anzweifeln, besonders, wenn es sich um sensible oder sehr umstrittene Themen handelt.

Abgesehen von den Konsumenten der künstlichen Bilderflut, werden ganz besonders die Urheber:innen von Fotografien in ihrer Existenz bedroht, weil ihre Inhalte gestohlen werden, da es bisher keinerlei Bestimmungen oder Gesetze dazu gibt, und weil ihre Arbeit obsolet wird.

Der deutsche Fotorat fordert daher Folgendes:

„… denn die derzeitige Arbeitsweise von KI-Systemen steht im Widerspruch zum grundlegenden Prinzip des Urheberrechts, dass UrheberInnen selbst und allein die Früchte aus der Verwertung ihrer Werke ziehen und eine angemessene Vergütung erhalten.“

Der Deutsche Fotorat wünscht schnellstmögliche Rechtssicherheit in Bezug auf die Urheber- und Verwertungsrechte der SchöpferInnen von Fotografien, die als Trainingsdaten verwendet werden. Es muss nachvollziehbar sein, auf welcher Basis ein KI-Bild generiert wurde. Werden dafür Bildwerke von FotografInnen verarbeitet, muss es auch Mechanismen zur fairen Vergütung für SchöpferInnen dieser Bildwerke geben.“

Und

„Der Fotorat fordert alle Institutionen auf, die an der Erstellung und Verbreitung von nachrichtlich-dokumentarischen Inhalten beteiligt sind, ethische Standards für den Umgang mit ihren Quellen zu erarbeiten. Diese Regeln und Arbeitsweisen müssen sicherstellen, dass authentisches Material verifiziert und als solches erkennbar und überprüfbar weitergegeben wird. In klarer Abgrenzung sollten generierte Bilder nicht als Fotografien bezeichnet werden, auch wenn ihr Fotorealismus ein immer höheres Niveau erreicht.“

Klingt wie Musik in meinen Ohren, ist aber so unrealistisch wie ein pinkfarbenes Einhorn. Der Zug ist abgefahren. Die Regierungen weltweit sind Lichtjahre hinterher, was die Regulierung von KI betrifft. In Deutschland ist es noch gar nicht so lange her (2013), dass eine Bundeskanzlerin bei der gemeinsamen Pressekonferenz mit Barack Obama auf eine Frage nach dem Überwachungsprogramm Prism fröhlich antwortete „Das Internet ist für uns alle Neuland“. Na dann … Gute Aussichten für die Regulierung der KI im Allgemeinen und des Urheberrechts im Besonderen. Aber selbst, wenn der Wille da wäre, ist es schlichtweg unmöglich, das Geforderte zu kontrollieren und die Einhaltung zu garantieren.

Auch die Initiative Urheberrecht, bestehend aus 44 Verbänden und 140.000 Künstler:innen und Urheber:innen, hat eine Stellungnahme zur KI verfasst, „Ruf nach Schutz vor generativer KI“. Dort wird vor den Folgen gewarnt, und Gesetze und Transparenz gefordert.

Seit mehreren Jahren verhandelt die EU über die Europäische KI-Verordnung (AI Act) und im Mai 2023 wurde nun eine weitere Hürde genommen. Abgeordnete des EU-Parlaments haben sich auf einen Entwurf der weltweit ersten gesetzlichen Regulierung von künstlicher Intelligenz geeinigt. Es kann aber noch lange dauern, bis wirkliche Gesetze von den Mitgliedsstaaten eingeführt werden. Der Initiative Urheberrecht geht der AI Act aber nicht weit genug, weil er nicht nur die „(Urheber)Rechte ausklammert, sondern sich auch anschickt, generative KI-Systeme unter Minimalvorgaben zuzulassen, die nicht einmal dem schon heute zu beobachtenden Missbrauch dieser Systeme und deren gesellschaftlichen und wirtschaftlichen Implikationen gerecht werden.“ Von der Seite werden Kreativschaffende also eher keine Unterstützung zu erwarten haben.

ausserirdische

Hier habe ich DALL E2 aufgefordert mir ein Foto von Außerirdischen, die auf einer deutschen Autobahn landen, zu generieren. Vielleicht habe ich es aber auch selbst beobachtet und fotografiert. Wer weiß das schon? Spielt das überhaupt noch eine Rolle?

Mein persönliches Fazit:

Im Rahmen dieses Artikels habe ich mich nun mehrere Wochen intensivst mit diesem Thema auseinandergesetzt, inhaltlich und praktisch. Die Thematik ist komplex und wird weitreichende Folgen haben, welcher Art auch immer, soviel ist klar. Die praktische Anwendung war für mich, nach anfänglichem, kindischem Vergnügen, eher langweilig und ernüchternd. Die wichtigsten Aspekte der Fotografie, die mir die größte Freude bereiten, sind der Kontakt mit anderen Menschen, das Entdecken von Orten und Ereignissen und das bewusste Sehen. Es ist ein unglaublich aufregendes Gefühl für mich, durch eine Kamera zu schauen und dann ein Bild zu sehen zu beginnen. Linien, Farben, Licht beginnen ein Bild zu formen und ich fühle eine tiefe Verbindung mit dem, was ich sehe, und meiner Kreativität. Ich gerate in einen Flow Zustand. Jemand, der sich jemals in Flow befunden hat, wird verstehen, was ich meine. Dieses Gefühl blieb gänzlich aus, während ich Prompts eingegeben habe. Weder meine Augen noch mein inneres Auge war am Entstehungsprozess der Bilder beteiligt, mit Sehen hatte die Generierung von Bildern also rein gar nichts zu tun. Und einen emotionalen Bezug gab es zu diesen Pixeln auch nicht. Ich werde die Entwicklung natürlich, weiterhin genauestens verfolgen, aber große Lust, KI-Bilder zu generieren, habe ich nicht.

OfG Dozent Dozentin Claudia Wiens, Fotografie

Ihre Claudia Wiens
Dozentin für Fotografie

Und jetzt ohne KI: Get creative!


Sollten Sie weitere Fragen haben, melden Sie sich gerne bei uns.