Make-Up, Made Up, Fed Up?
Warum Kennzeichnungspflichten für manipulierte und KI-Bilder manchmal helfen – und manchmal genau das Gegenteil bewirken
Man stelle sich zwei junge Menschen vor. Beide schauen auf ein Smartphone, beide sehen ein Bild, das nicht dem entspricht, was die Kamera ursprünglich aufgenommen hat. Aber beide schauen auf grundverschiedene Weise hin.
Die eine Person ist 15 Jahre alt, scrollt am Abend durch ihren TikTok-Feed und sieht eine Influencerin mit perfekter Haut, schmaler Taille und makellosem Lächeln. Das Bild trägt einen kleinen Hinweis: „Mit KI bearbeitet“. Die 15-Jährige liest den Hinweis, schaut wieder auf das Bild und beginnt zu analysieren: Wo wurde wohl retuschiert? Was an dem Bild ist echt, was fake? Wie würde sie selbst aussehen, wenn sie so einen Filter auf sich anwenden würde? Warum sehen die Beine der anderen so viel länger aus als die eigenen? Und die Wangenknochen so viel besser? Das Kennzeichen, das eigentlich Distanz und kritische Reflexion ermöglichen sollte, hat einen genaueren Blick provoziert. Und mit dem genaueren Blick kommt mehr Unzufriedenheit und Frust über den eigenen Körper auf.
Die andere Person ist 17, sitzt morgens am Frühstückstisch und sieht ein kurzes Video, in dem eine bekannte Politikerin einen Satz sagt, der nicht zu ihr passt. Über dem Video steht: „KI-generiert“. Der 17‑Jährige stutzt, schaut genauer hin, erkennt jetzt die seltsame Synchronisation der Lippen, schließt das Video. In der Berufsschule erzählt er es am Mittag einer Freundin als kuriose Anekdote über das, was heute alles mit KI möglich ist. Die Kennzeichnung hat hier keine Risiken verstärkt, sondern hilfreich aufgeklärt. Es hat einen Reflex unterbrochen, der ohne den Hinweis vielleicht zu einem Posting, einem Kommentar oder einem Vorurteil geführt hätte.
Es kommt offenbar weniger darauf an, was man kennzeichnet, sondern darauf, wie die Menschen auf die gekennzeichneten Darstellungen schauen.
Beide Kennzeichen folgen hier derselben regulatorischen Logik. Sie sollen Transparenz schaffen, kritische Distanz ermöglichen und letztlich Schaden verhindern. Und doch wirken sie im Beispiel diametral verschieden. Bei genauerer Betrachtung, warum die eine Etikettierung scheitert und die andere gelingt, stößt man auf eine Einsicht, die in der gegenwärtigen Regulierungsdebatte selten angesprochen wird: Es kommt offenbar weniger darauf an, was man kennzeichnet, sondern darauf, wie die Menschen auf die gekennzeichneten Darstellungen schauen.
Vom Photoshop Law zum AI Act
Die Frage hat praktisches Gewicht, denn mit Art. 50 des AI Act (KI-Verordnung) hat die EU eine Kennzeichnungspflicht für KI-generierte Inhalte eingeführt, die ab August 2026 greift. Die Idee dahinter ist nicht neu – sie steht in einer Linie mit Israels „Photoshop-Gesetz“ von 2013, dem französischen „Photographie Retouchée-Label“ von 2017 und der norwegischen Kennzeichnungspflicht für bearbeitete Werbefotos von 2022.1 Irreführende Darstellungen von Gesichtern und Körpern sollen klar gekennzeichnet werden, um die Entstehung und Festigung unrealistischer Körperbilder und Schönheitsideale insbesondere bei Jüngeren zu verhindern. Vor dem Hintergrund solcher gesetzlichen Aktivitäten ist der regulatorische Reflex, auch bei KI-Darstellungen zur Kennzeichnungspflicht zu greifen, Ausdruck eines größeren politischen Trends. Kennzeichnungspflichten sind dabei ein vergleichsweise sanfter Eingriff: Darstellungen werden nicht verboten oder gelöscht, bestimmte Inhalte sollen nur besondere Labels erhalten. Das Problem ist, dass die empirische Bilanz dieser Idee – jedenfalls dort, wo sie am längsten und gründlichsten erforscht wurde – eher ernüchternd ausfällt.
Die kontraintuitive Wirkung von Beautyfilter-Kennzeichen
Ein im Auftrag der Kommission für Jugendmedienschutz erstelltes Gutachten des Hans-Bredow-Instituts hat den Forschungsstand und die legislativen Realexperimente in Israel, Frankreich und Norwegen zur Kennzeichnung von manipulierten Fotos und Videos 2025 systematisch ausgewertet (vgl. Dreyer et al. 2025). Das Bild, das die Studie zeichnet, entzaubert Kennzeichnungspflichten in diesem Bereich als komplex, voraussetzungsvoll und – bestenfalls – kaum wirksam. Israels Gesetz krankte seit Beginn an fehlenden Sanktionen und unklaren Zuständigkeiten, eine Evaluation 2017 fand im ganzen Land nahezu keine korrekt angebrachten Hinweise. Frankreichs Label wird häufig in den Falz von Magazindoppelseiten gedruckt oder online so klein und kontrastarm gesetzt, dass es nur dem geschulten Blick auffällt; eine Stichprobe bei zehn großen französischen Beauty-Influencer:innen ergab nicht ein einziges gekennzeichnetes Bild. In Norwegen, das den ambitioniertesten Ansatz der drei Länder gewählt hat, trifft die Kennzeichnungspflicht bis heute auf Social-Media-Feeds im Alltag, die neben den gekennzeichneten kommerziellen Darstellungen jede Menge nicht gekennzeichneter Fotos und Videos mit Filtern enthalten, für die die gesetzliche Pflicht nicht gilt. Die rechtstreuen Influencer:innen sind unzufrieden, die Social-Media-Nutzenden mangels Orientierung auch.
Das Label […] lenkt die Aufmerksamkeit auf die manipulierten Körperpartien und verstärkt so noch den Sozialvergleich.
Schwerer wiegt aber noch ein zweiter Befund: Die experimentelle Wirkungsforschung zu Kennzeichen und Disclaimern bei bearbeiteten Bildern findet überwiegend keine positive Wirkung auf die Körperzufriedenheit der Betrachtenden (vgl. de Valle et. al.2021 u. Fioravanti et al. 2022). Manche Studien dokumentieren sogar das Gegenteil – das Label wird wie im Beispiel der 15-Jährigen oben zum Blickfang, lenkt die Aufmerksamkeit auf die manipulierten Körperpartien und verstärkt so noch den Sozialvergleich (vgl. Bury et al. 2016a u. 2016b). Selbst Kennzeichen, die zusammen mit Jugendlichen entwickelt wurden, hatten kaum Einfluss auf die wahrgenommene Realitätsnähe oder die Zufriedenheit mit dem eigenen Körper. Junge Nutzende, so vermutet die Forschung, haben die Bildbearbeitung längst als selbstverständliche Praxis verinnerlicht und sind „grundkritisch“. Ein Hinweis, der ihnen sagt, was sie ohnehin wissen, verändert dann wenig.
Der Befund von „Bumerang-Effekten“ – die gut gemeinten Hinweise verschlimmern gerade das, was sie eigentlich verhindern sollen – ist für viele überraschend. Hier ist er Ausgangspunkt für die Frage, ob man die Ergebnisse auch auf die KI-Kennzeichnungspflicht aus dem AI Act übertragen kann: Wenn Labels bei schönheitsbezogenen Darstellungen nicht funktionieren, wie wirken sie bei anderen KI-manipulierten oder KI-generierten Inhalten?
Der Plot-Twist: Beautyfilter-Label als Ausnahme
Die Forschung zu Hinweisen durch Faktenchecker, durch KI-Label und Deepfake-Kennzeichen zeigt ein anderes Bild als die Beautylabel-Experimente: Es sieht so aus, als sei der Bumerang-Effekt nicht ein Naturgesetz aller Kennzeichnungspflichten, sondern eine Eigentümlichkeit im Schönheitskontext. Vergleichbare Hinweise und Kennzeichen in anderen Bereichen können möglicherweise aufklären und die gewünschte Reflexion verursachen. So finden experimentelle Arbeiten zur Wahrnehmung politischer Deepfakes und Studien zur Wirkung von Faktenchecklabels auf X (früher: Twitter) und Facebook häufig zwar moderate, aber positive Effekte: Markierte Falschinformationen werden seltener geteilt, ihre Glaubwürdigkeit sinkt messbar, die Bereitschaft zur Weiterverbreitung wird gedämpft (vgl. Vaccari/Chadwick 2020, Clayton et al. 2020). Auch die jüngere Forschung zum sogenannten Prebunking, d. h. Vorabwarnungen vor gängigen Manipulationsmustern, dokumentiert signifikante Effektgrößen, vor allem wenn die Warnungen spielerisch, kontinuierlich und im richtigen Moment erfolgen (vgl. Roozenbeek/van der Linden 2029 u. 2021).
Markierte Falschinformationen werden seltener geteilt, ihre Glaubwürdigkeit sinkt messbar, die Bereitschaft zur Weiterverbreitung wird gedämpft.
Wie kann es sein, dass dasselbe Regulierungsinstrument in einem Bereich scheitert und in einem anderen wirkt? Die Antwort scheint in der Frage zu liegen, mit welchen Augen die Menschen das jeweilige Bild anschauen.
Der Blick in den Spiegel und der Blick auf die Welt
Es lohnt sich, einen Moment innezuhalten und sich klarzumachen, dass wir Bilder nicht alle auf dieselbe Weise verarbeiten. Manchmal schauen wir auf ein Bild, als wäre es ein Spiegel. Wir suchen darin uns selbst, unsere Position, unseren Wert und vergleichen im selben Augenblick. Manchmal schauen wir auf ein Bild, als wäre es ein Fenster in die Welt: Wir wollen wissen, was draußen los ist, ob die Welt so ist, wie sie behauptet zu sein.
Diese beiden Blicke sind aus Sicht der Forschung grundverschieden: Wer in den Spiegel schaut, fühlt zuerst und denkt später; die Reaktion ist körperlich, emotional, vergleichend. Wie im Beispiel schönheitsbezogener Darstellungen schießen als erstes (selbst-)bewertende Gedanken durch den Kopf: zu dünn, zu dick, zu alt, zu unauffällig. Wer aber durch ein Fenster schaut, denkt zuerst und fühlt später, denn hier ist die Reaktion prüfend, neugierig und skeptisch: Stimmt das, was ich sehe? Ergibt das Sinn? Passt das zu dem, was ich sonst gesehen habe oder weiß?
Wer in den Spiegel schaut, fühlt zuerst und denkt später […]. Wer aber durch ein Fenster schaut, denkt zuerst und fühlt später.
Die Tragik der Idee einer Beautyfilter-Kennzeichnung liegt also möglicherweise darin, dass sie versucht, einen „Spiegel-Blick“ mit einer „Fenster-Information“ zu korrigieren. Das Kennzeichen sagt: „Achtung, dieses Bild ist nicht echt!“. Aber die 15-Jährige aus dem Eingangsbeispiel schaut nicht im Modus „Stimmt das?“ auf das Bild; sie sieht sich das Foto im Modus „Wie sehe ich im Vergleich dazu aus?“ an. In diesem Modus ist die Information, dass das Bild bearbeitet wurde, weder entlastend noch reflexionsfördernd. Sie wird als Einladung missverstanden, noch genauer hinzusehen, um den bearbeiteten Teil zu identifizieren – und damit den Sozialvergleich zu intensivieren. Der Hinweis funktioniert nicht, weil er auf der falschen Ebene ansetzt.
Beim politischen Deepfake aus dem Beispiel sieht die Lage anders aus: Der 17-Jährige schaut im Modus „Stimmt das?“ auf das Video. Genau in diesem Modus ist die Information, dass der Inhalt KI-generiert ist, hochrelevant – denn sie kann genau jene Frage beantworten, die der Jugendliche sich gerade stellt. Der Hinweis kommt nicht in einem Moment des affektiv aufgeladenen Vergleichs, er wird im Rahmen eines prüfenden Bewertungsprozesses wahrgenommen, der nun sinnvoll ergänzt wird.
Dieser Beitrag kann keine vollständige Theorie einer Kennzeichnungswirkung entfalten, aber der an die Dualprozess-Theorie der Kognitionswissenschaften angelehnte Spiegel-Fenster-Ansatz kann eine Erklärung liefern, warum dasselbe Werkzeug in zwei Kontexten so unterschiedlich wirkt.
Bevor man diese Heuristik allerdings in regulatorische Empfehlungen übersetzt, ist ein Wort der Warnung angebracht: Die Arten und Nutzungskontexte manipulierter Darstellungen sind vielfältig und lassen sich nicht immer in die beiden Extreme des Anfangsbeispiels verorten. So gibt es Inhalte, die Aspekte von beiden beschriebenen Blickweisen haben – und das sind ausgerechnet besonders problematische. Ein KI-generiertes pornografisches Deepfake einer realen Frau wird einerseits epistemisch verarbeitet („Ist die Darstellung echt, ist sie das wirklich?“), andererseits und gleichzeitig aber ggf. voyeuristisch-affektiv. Ein Deepfake des politischen Gegners in einer kompromittierenden Situation etwa kann epistemische Prüfung und identitätsbezogene Reaktion gleichzeitig aktivieren; je polarisierter das politische Klima, desto stärker dominiert ggf. der zweite Modus über den ersten.
Die Forschung zum sogenannten Motivated Reasoning zeigt seit Jahrzehnten, dass Menschen Informationen, die ihre politische oder soziale Identität bedrohen, anders verarbeiten als Informationen, die nur ihr Wissen erweitern (vgl. Kahan 2023; Taber/Lodge 2006). In hochpolarisierten Themenfeldern kann die Kennzeichnung eines unliebsamen Inhalts deshalb genau jene Trotzreaktion auslösen, die sie verhindern sollte: „Die wollen mir das ausreden, also muss es wahr sein.“
In hochpolarisierten Themenfeldern kann die Kennzeichnung eines unliebsamen Inhalts deshalb genau jene Trotzreaktion auslösen, die sie verhindern sollte.
Hinzu kommt ein zweites, subtileres Problem: der Implied Truth Effect, den die Faktencheck-Forschung gut dokumentiert hat. Wenn ein System einzelne Inhalte als problematisch markiert, verleiht es allen nicht markierten Inhalten implizit ein Echtheitssiegel (vgl. Pennycook 2020). Da kein technisches Erkennungssystem für KI-generierte Inhalte je hundertprozentig sein wird, profitieren ausgerechnet die unmarkierten Fälschungen vom Vertrauensvorschuss, den die Kennzeichnungspflicht insgesamt erzeugt.
Die Heuristik von Spiegel und Fenster ist also kein Freibrief für Optimismus. Sie sagt erstmal nur, dass eine pauschale Skepsis gegenüber allen Kennzeichnungspflichten zu undifferenziert und möglicherweise unangebracht ist. Es kann sich also lohnen, hier zu unterscheiden.
Was bedeutet das für die Regulierung?
Wenn man diese Differenzierung ernst nimmt, ergeben sich drei Folgegedanken für die regulatorische Praxis:
Die Skepsis gegenüber Kennzeichnungspflichten im Bereich der körperbezogenen Schönheits- und Lifestyle-Manipulationen bleibt berechtigt.
Die Wirkungsforschung gibt den Wirkungsannahmen einer Kennzeichnungspflicht hier wenig Rückendeckung. Außerdem versprechen die Alternativen, also algorithmische Drosselung schönheitsbezogener Empfehlungslogiken, plattformseitige Filterverbote und medienpädagogische Awareness-Arbeit bessere Wirkung als ein (weiteres) Label. Die gesetzgeberische Energie wäre hier also besser darauf verwendet, die plattformseitigen Maßnahmen (noch) stärker einzufordern und zu evaluieren, als noch ein Kennzeichen vorzuschreiben.
Im Bereich politisch-epistemischer Manipulation kann die Kennzeichnungspflicht des AI Act eine sinnvolle Komponente sein, sofern sie als Teil eines Bündels gedacht wird.
Die maschinenlesbare Kennzeichnung nach Art. 50 Abs. 2 AI Act könnte sich etwa auf kryptografische Standards der Positivkennzeichnung von unmanipulierten Bilddaten wie C2PA stützen2. So würde eine Infrastruktur geschaffen, die Plattformen, Recommendern und nutzerseitigen Tools eine automatisierte Verarbeitung ermöglichte. Die für Menschen sichtbare Kennzeichnung nach Art. 50 Abs. 4 AI Act kann darüber hinaus als laufendes Prebunking wirken, das das Bewusstsein für synthetische Inhalte schärft. Wirksam wird das aber nur, wenn es mit plattformseitigen Faktencheck-Strukturen, Community-Notes und einer Kultur kritischer Quellenprüfung verbunden ist.
Drittens – und das ist leider ernüchternd – bleibt der Bereich der Mischformen ein Problem.
Pornografische Deepfakes, politisch aufgeladene Inszenierungen mit identitätsbezogenen Vergleichen, KI-generierte Lifestyle-Influencer mit politischer Botschaft: Hier funktionieren die beschriebenen einfachen Einsichten weder aus dem einen noch aus dem anderen Lager. Genau hier sollte Forschung in den nächsten Jahren vermehrt ansetzen, denn auf diese Fälle ist die KI-Verordnung am wenigsten vorbereitet.
Kennzeichnungspflichten als differenziertes Steuerungsinstrument
Die Geschichte der Kennzeichnungspflichten ist letztlich also keine Geschichte eines gescheiterten Instruments. Sie verweist darauf, dass Label in unterschiedlichen Kontexten unterschiedlich gut funktionieren. Der Gesetzgeber dagegen hat es bislang aber eher als Universalwerkzeug eingesetzt. Dabei sind die Beispielszenen vom Anfang keine besonderen Ausnahmesituationen, sondern Alltagsrealität. Millionen Menschen scrollen durch Feeds, in denen „Spiegel-Inhalte“ und „Fenster-Inhalte“ schnell nacheinander angezeigt werden und sich abwechseln – und es finden sich auch Inhalte, die beides gleichzeitig sind. Die Aufgabe eines guten Regulierungsansatzes wird hier sein, in Zukunft präziser zu fragen: Welcher Inhalt aktiviert welchen Blick und welches Werkzeug passt dazu?
Die KI-Verordnung kann auf diese Frage noch keine Antwort bieten, auch sie wirft das Instrument „Kennzeichnungspflicht“ zunächst auf alle denkbaren KI-generierten Inhalte. Besser wäre es in der Praxis, ihre Werkzeuge dort einzusetzen, wo sie passen, und dort durch andere zu ergänzen, wo sie nicht passen. Mit den geplanten (strafrechtlichen) Verboten für pornografische Deepfakes (§ 201b StGB‑E) scheint hier bereits auf, dass es restriktivere Ansätze für jedenfalls einen der beschriebenen Problembereiche geben könnte. Am Ende sollte stehen, dass wir Lösungen finden, die jenen Menschen helfen, die abends mit dem Smartphone in der Hand zwischen „Spiegel“ und „Fenster“ hin- und herwechseln – ohne dass sie dabei selbst immer wüssten, in welchem Modus sie gerade auf ein Bild schauen.
Die Aufgabe eines guten Regulierungsansatzes wird hier sein, in Zukunft präziser zu fragen: Welcher Inhalt aktiviert welchen Blick und welches Werkzeug passt dazu?
Anmerkungen:
1 Israel: Gesetz Nr. 5772-2012 zur Beschränkung des Gewichts in der Modelindustrie; Frankreich: Art. L 2133‑2 des Gesetzes zur öffentlichen Gesundheit und Décret Nr. 2017‑738; Norwegen: § 2 Abs. 2 S. 2 und 3 Marketinggesetz.
2 Coalition for Content Provenance and Authenticity (C2PA), Technical Specification 2.1, vgl. ergänzend die Content Authenticity Initiative.
Literatur:
Bury, B./Tiggemann, M./Slater, A.: Disclaimer labels on fashion magazine advertisements: Impact on visual attention and relationship with body dissatisfaction. In: Body Image, 16, März 2016a, S. 1‑9. Abrufbar unter: https://doi.org/10.1016/j.bodyim.2015.09.005
Bury, B./Tiggemann, M./Slater, A.: The effect of digital alteration disclaimer labels on social comparison and body image. In: Body Image, 17, Juni 2016b, S. 136–142. Abrufbar unter: https://doi.org/10.1016/j.bodyim.2016.03.005
Clayton, K./Blair, S./Busam, J. A. et al.: Real Solutions for Fake News? Measuring the Effectiveness of General Warnings and Fact-Check Tags in Reducing Belief in False Stories on Social Media. In: Political Behavior, 42, Dezember 2020, S. 1073–1095
Dreyer, S./Lampert, C./Andresen, S.: Kennzeichnung von bearbeiteten (Influencer‑)Fotos. Erforderlichkeit, Wirkung, Regelungsansätze. Hamburg 2025. Abrufbar unter: https://doi.org/10.21241/ssoar.99635
Fioravanti, G./Bocci Benucci, S./Ceragioli, G./Casale, S.: How the Exposure to Beauty Ideals on Social Networking Sites Influences Body Image: A Systematic Review of Experimental Studies. In: Adolescent Research Review, 7, Januar 2022, S. 419–458. Abrufbar unter: https://link.springer.com/article/10.1007/s40894-022-00179-4
Kahan D. M.: Ideology, motivated reasoning, and cognitive reflection. In: Judgment and Decision Making, Vo. 8, Juli 2023, S. 407–424, Abrufbar unter: https://doi.org/10.1017/S1930297500005271
Pennycook, G./Bear, A./Evan T. Collins, E. T./David G. Rand, D. G.: The Implied Truth Effect: Attaching Warnings to a Subset of Fake News Headlines Increases Perceived Accuracy of Headlines Without Warnings. In: Management Science, 66, Februar 2020, S. 4944–4957. Abrufbar unter: https://doi.org/10.1287/mnsc.2019.3478
Roozenbeek, J./van der Linden, S.: Fake news game confers psychological resistance against online misinformation. In: Palgrave Communications, 5, Juni 2019. Abrufbar unter: https://doi.org/10.1057/s41599-019-0279-9
Roozenbeek, J./van der Linden, S.: Inoculation Theory And Misinformation. Herausgegeben von: NATO Strategic Communications Centre of Excellence. Riga 2021. Abrufbar unter: https://stratcomcoe.org
Taber, C. S./Lodge, M.: Motivated Skepticism in the Evaluation of Political Beliefs. In: American Journal of Political Science, 50, Juli 2006, S. 755–769. Abrufbar unter: https://doi.org/10.1111/j.1540-5907.2006.00214.x
Vaccari, C./Chadwick, A.: Deepfakes and Disinformation: Exploring the Impact of Synthetic Political Video on Deception, Uncertainty, and Trust in News. In: Social Media + Society, 6 Januar 2020, S. 1–13. Abrufbar unter: https://doi.org/10.1177/2056305120903408
de Valle, M. K./Gallego-García, M./Williamson, T., Wade, T. D.: Social media, body image, and the question of causation: Meta-analyses of experimental and longitudinal evidence. In: Body Image, 39, Dezember 2021, S. 276–292. Abrufbar unter: https://doi.org/10.1016/j.bodyim.2021.10.001
