AI on the Internet: Was 35 % KI-Texte wirklich bedeuten

Quelle: Jonas Dolezal, Sawood Alam, Mark Graham, Maty Bohacek: The Impact of AI-Generated Text on the Internet (2026), Internet Archive / Imperial College London / Stanford University.

Kontext: Die „Dead Internet“-Frage wird messbar

Seit ChatGPT öffentlich verfügbar ist, gibt es eine diffuse Sorge: Wenn immer mehr Texte nicht mehr von Menschen, sondern von Modellen geschrieben werden, verändert sich dann das Internet selbst? Nicht nur einzelne Artikel, Produktbeschreibungen oder SEO-Seiten – sondern der gesamte öffentliche Diskurs?

Die Studie The Impact of AI-Generated Text on the Internet ist deshalb spannend, weil sie diese Frage nicht nur anekdotisch behandelt. Die Autoren ziehen eine repräsentative Stichprobe öffentlich erreichbarer Websites aus der Wayback Machine, untersuchen Veröffentlichungen zwischen 2022 und 2025 und klassifizieren die Texte mit mehreren Detektionsverfahren. Nach Robustheitschecks entscheiden sie sich für Pangram v3 als stärksten Detektor.

Das wichtigste Ergebnis: Bis Mitte 2025 werden rund 35 % neu publizierter Websites als KI-generiert oder KI-assistiert eingestuft. Vor dem öffentlichen Launch von ChatGPT Ende 2022 lag dieser Anteil praktisch bei null.

Das ist kein kleines Randphänomen mehr. Es bedeutet: KI ist nicht nur ein Werkzeug für einzelne Autoren oder Marketingteams. KI ist inzwischen ein struktureller Faktor in der Content-Produktion des Webs.

Warum diese Studie relevant ist

Viele Diskussionen über KI-Texte drehen sich um Einzelfälle: eine halluzinierte Quelle, ein schlechter LinkedIn-Post, ein SEO-Spam-Artikel, ein Supporttext, der unangenehm glatt klingt. Die Studie zoomt heraus und fragt: Welche messbaren Spuren hinterlässt KI, wenn sie massenhaft in Webtexten auftaucht?

Dafür prüfen die Autoren sechs Hypothesen:

Hypothese	Kurz gesagt	Ergebnis
Semantic Contraction	Der Ideenraum wird enger	bestätigt
Truth Decay	Texte werden faktisch falscher	nicht bestätigt
Positivity Shift	Texte werden künstlich positiver	bestätigt
Epistemic Islands	Texte verlinken weniger nach außen	nicht bestätigt
Entropy Dilution	Texte werden länger, aber informationsärmer	nicht bestätigt
Stylistic Monoculture	Schreibstile werden messbar gleicher	nicht bestätigt

Die öffentliche Wahrnehmung ist deutlich pessimistischer als die Messdaten: In einer stratifizierten US-Befragung mit 853 Erwachsenen glaubte eine Mehrheit an alle sechs negativen Effekte. Die Daten bestätigen aber nur zwei davon: semantische Verengung und positiveren, glatteren Ton.

Die wichtigsten Zahlen

Kennzahl	Wert
Untersuchter Zeitraum	2022 bis Mitte 2025
Datenquelle	Internet Archive / Wayback Machine
Klassifikation	Pangram v3 nach Detektorvergleich
Anteil KI-generierter oder KI-assistierter neuer Websites Mitte 2025	ca. 35 %
Befragte Erwachsene in den USA	853
Bestätigte Hypothesen	Semantic Contraction, Positivity Shift
Nicht bestätigte Hypothesen	Truth Decay, Epistemic Islands, Entropy Dilution, Stylistic Monoculture

1. Semantic Contraction: Der Ideenraum schrumpft

Die erste bestätigte Hypothese ist vermutlich die wichtigste: Je höher der KI-Anteil, desto stärker ähneln sich Texte semantisch.

Gemessen wurde das über die durchschnittliche Cosine Similarity zwischen Text-Embeddings. Vereinfacht: Die Forscher prüfen, wie nah die Bedeutungsräume der Texte beieinanderliegen. Das Ergebnis ist signifikant:

ρ = 0,47
p = 0,004
KI-generierte Websites hatten laut Studie 33 % höhere semantische Ähnlichkeit als nicht-KI-Websites.

Das bedeutet nicht, dass jeder KI-Text gleich klingt. Es bedeutet: Auf Aggregatebene bewegen sich KI-Texte enger um ähnliche Themen, Argumentationsmuster und Formulierungsräume.

Genau hier liegt ein unterschätztes Risiko. Wenn Millionen Texte mit ähnlichen Modellen, ähnlichen Prompts und ähnlichen Optimierungszielen entstehen, wird das Web nicht zwingend falscher – aber es kann ärmer werden. Weniger abweichende Perspektiven, weniger Ecken, weniger originäre Erfahrung. Der Durchschnitt wird lauter.

Für Unternehmen ist das besonders relevant. Wer KI nur nutzt, um vorhandene Standardantworten schneller zu produzieren, skaliert Durchschnitt. Wer Differenzierung will, muss aktiv gegensteuern: eigene Daten, eigene Positionen, eigene Beispiele, echte Redaktion.

2. Truth Decay: Mehr KI heißt nicht automatisch mehr Fehler

Die zweite Hypothese war: Wenn mehr KI-Texte im Web erscheinen, steigt der Anteil faktisch falscher Aussagen.

Das klingt plausibel. Modelle halluzinieren. Quellen werden erfunden. Zahlen werden manchmal selbstbewusst falsch ausgegeben. Aber im untersuchten Web-Korpus findet die Studie dafür keine statistisch signifikante Evidenz:

ρ = –0,19
p = 0,27
75,1 % der Befragten glaubten trotzdem an diesen Effekt.

Das ist ein wichtiger Reality Check. Das Hauptproblem von KI-Texten im offenen Web scheint nicht zu sein, dass sie massenhaft nachweisbar falscher sind. Zumindest nicht in dieser Messung und in diesem Zeitraum.

Aber daraus folgt nicht: „Alles gut.“ Erstens ist Fact-Checking schwierig und immer nur so gut wie das Messverfahren. Zweitens können viele KI-Texte korrekt und trotzdem wertlos sein. Drittens können indirekte Effekte später auftreten: Wenn Modelle zunehmend auf KI-generierten Texten trainieren, verschiebt sich die Datenbasis – auch ohne sofort sichtbare Fehlerexplosion.

Die bessere Schlussfolgerung lautet: Halluzinationen sind real, aber sie sind nicht der einzige und vielleicht nicht einmal der dominante Makroeffekt. Wer nur auf Fehlerjagd geht, übersieht die subtileren Veränderungen: Glättung, Wiederholung, semantische Verarmung.

3. Positivity Shift: Das Web wird freundlicher – aber auch steriler

Die zweite bestätigte Hypothese ist der Positivity Shift. Je höher der KI-Anteil, desto stärker steigt der Anteil positiv klassifizierter Texte.

Die Zahlen:

ρ = 0,56
p = 0,0003
KI-generierte Websites hatten laut Studie 107 % höhere positive Sentiment-Werte als nicht-KI-Websites.

Das passt zu dem, was viele im Alltag spüren: KI schreibt selten wirklich hart, mürrisch, unsicher, widersprüchlich oder eigensinnig. Standardmodelle sind auf Hilfsbereitschaft, Höflichkeit, Sicherheit und Anschlussfähigkeit optimiert. Das ist nützlich in Support, Dokumentation und interner Kommunikation. Aber im öffentlichen Diskurs kann es zu einer Art synthetischer Freundlichkeit führen.

Das Web wird dann nicht unbedingt netter im menschlichen Sinn. Es wird glatter. Kritik klingt konstruktiv, auch wenn sie eigentlich scharf sein müsste. Risiken werden abgefedert. Konflikte werden moderiert, bevor sie überhaupt ausgetragen sind. Texte klingen professionell, aber weniger lebendig.

Für Marken und Medien ist das eine paradoxe Chance: Je mehr Content generisch positiv wird, desto wertvoller werden echte Haltung, klare Urteile und erkennbare Autorenschaft.

4. Epistemic Islands: Keine klare Evidenz für weniger Quellen

Die Hypothese „Epistemic Islands“ beschreibt ein Web, in dem Texte immer weniger nach außen verlinken und stattdessen abgeschlossene Antwortinseln bilden. Das wäre problematisch, weil Links eine zentrale Infrastruktur des Webs sind: Sie machen Wissen prüfbar, navigierbar und kontextualisierbar.

Gemessen wurde hier die Outbound-Link-Dichte. Ergebnis:

ρ = –0,12
p = 0,48
keine statistisch signifikante inverse Korrelation.

Die Daten zeigen also nicht, dass KI-Texte im Untersuchungszeitraum systematisch weniger verlinken. Trotzdem bleibt das Thema strategisch wichtig. Denn viele KI-Produkte verschieben Nutzerverhalten bereits von „ich klicke mich durch Quellen“ zu „ich bekomme eine zusammengefasste Antwort“.

Die Studie misst Websites, nicht das gesamte Antwortökosystem aus Chatbots, AI Overviews, Agenten und Suchinterfaces. Für Publisher, Unternehmen und Wissensplattformen bleibt Quellenarbeit deshalb entscheidend: Verlinkung, Provenienz, Zitate und nachvollziehbare Herleitung werden zu Qualitätsmerkmalen.

5. Entropy Dilution: Nicht jeder lange KI-Text ist messbar dünner

Die Entropy-Dilution-Hypothese lautet: KI macht Texte länger, aber weniger informationsdicht. Jeder kennt diese Art Output: viel Struktur, viele Übergänge, viele allgemeine Sätze – aber wenig Substanz.

Die Studie misst dafür unter anderem Komprimierbarkeit über die Gzip-Ratio. Die Idee dahinter: Redundante Texte lassen sich stärker komprimieren. Ergebnis:

ρ = –0,02
p = 0,89
keine signifikante Korrelation.

Das heißt nicht, dass es keine aufgeblasenen KI-Texte gibt. Es heißt nur: Auf Makroebene konnte die Studie diesen Effekt nicht eindeutig nachweisen.

Praktisch bleibt die Lehre trotzdem klar: Länge ist kein Qualitätsmerkmal. KI macht es extrem billig, 2.000 Wörter zu produzieren. Wert entsteht erst durch Auswahl, Verdichtung, Beispiele, Daten und eine klare These.

6. Stylistic Monoculture: Stilgleichheit wird gefühlt, aber nicht eindeutig gemessen

Die stärkste öffentliche Intuition betrifft oft den Stil: „Alles klingt wie ChatGPT.“ Die Studie prüft diese Hypothese über Charakter-3-Gramm-Jaccard-Similarity – also eine formale Ähnlichkeitsmessung auf Zeichenmustern.

Ergebnis:

ρ = 0,24
p = 0,17
83,0 % der Befragten glaubten trotzdem an diesen Effekt.

Das ist interessant, weil es eine Lücke zwischen Gefühl und Messung zeigt. Menschen erkennen KI-Stil oft an weichen Signalen: Tonfall, Absicherung, Satzrhythmus, generische Übergänge, fehlende Reibung. Eine 3-Gramm-Metrik kann solche Signale nur teilweise abbilden.

Möglich ist also beides: Die Studie findet keine robuste statistische Evidenz für Stil-Monokultur in dieser Metrik – und trotzdem können Menschen im Alltag eine KI-typische Glätte wahrnehmen.

Evidence vs. Belief: Die eigentliche Pointe

Die spannendste Erkenntnis ist nicht nur, was bestätigt wurde. Spannend ist die Differenz zwischen Evidenz und öffentlichem Glauben.

Viele Menschen befürchten, dass KI das Web falscher, gleichförmiger, quellenärmer, länger und stilistisch monotoner macht. Die Daten bestätigen davon nur einen Teil. Aber dieser Teil ist ernst genug:

Der semantische Raum wird enger.
Der Ton wird positiver und steriler.

Das ist subtiler als die „Dead Internet“-Karikatur. Das Web stirbt nicht plötzlich. Es wird auch nicht einfach zu einer riesigen Halluzinationsmaschine. Es verändert seine Textur: weniger rau, weniger eigensinnig, stärker optimiert, stärker mittelwertig.

Was das für Unternehmen bedeutet

Für CIOs, Marketingteams, Knowledge-Manager und KI-Verantwortliche ist die Studie ein guter Warnschuss. Nicht: „Nutzt keine KI.“ Sondern: „Nutzt KI nicht so, dass ihr eure eigene Differenzierung wegautomatisiert.“

1. KI-Content braucht redaktionelle Eigenleistung

Wenn ein Text nur aus Prompt, Modell und minimaler Korrektur entsteht, landet er schnell im semantischen Durchschnitt. Gute KI-Nutzung braucht zusätzliche Inputs:

eigene Daten
konkrete Erfahrungen
interne Fallbeispiele
klare Positionen
fachliche Gegenprüfung
menschliche Schlussfolgerung

Die Frage ist nicht: „Kann KI diesen Blogpost schreiben?“ Die Frage ist: „Welche Substanz haben wir, die das Modell alleine nicht haben kann?“

2. Differenzierung wird wichtiger als Produktionsgeschwindigkeit

KI senkt die Kosten für Contentproduktion dramatisch. Dadurch steigt aber auch das Angebot an mittelguten Texten. Wenn alle schneller publizieren, gewinnt nicht automatisch der Schnellste. Gewinnen werden die, die erkennbarer, präziser und nützlicher sind.

Für Content-Strategien heißt das: Weniger generische Themencluster, mehr originäre Analyse. Weniger „10 Tipps für…“, mehr echte Perspektive. Weniger synthetische Freundlichkeit, mehr klare Kante.

3. Governance darf nicht nur auf Falschinformationen schauen

Viele KI-Governance-Programme fokussieren auf Accuracy, Datenschutz und Copyright. Das ist notwendig, aber unvollständig. Die Studie zeigt, dass auch weichere Qualitätsdimensionen messbar werden:

semantische Vielfalt
Quellenqualität
Wiederholungsgrad
Tonalität
Autorenschaft
Provenienz

Wer KI im Unternehmen skaliert, sollte diese Dimensionen in Reviews und Freigabeprozesse aufnehmen.

4. Human Origin wird zum Vertrauenssignal

Wenn 35 % neuer Websites KI-generiert oder KI-assistiert sind, wird die Frage „Wer spricht hier eigentlich?“ wichtiger. Nicht jeder Text muss komplett menschlich geschrieben sein. Aber Nutzer, Kunden und Suchsysteme werden stärker unterscheiden wollen zwischen:

automatisch erzeugtem Füllcontent
KI-assistierter Expertenarbeit
geprüfter redaktioneller Analyse
authentischer persönlicher Erfahrung

Content Credentials, transparente Autorenprozesse und nachvollziehbare Quellen werden dadurch wertvoller.

Empfehlungen

Für Publisher und Marketingteams

KI nicht als Ersatz für Haltung nutzen. Modelle können strukturieren, verdichten und Varianten liefern. Die These muss von euch kommen.
Eigene Beispiele erzwingen. Jeder KI-assistierte Text sollte konkrete Beobachtungen, Kundencases oder Daten enthalten, die nicht aus dem Modell stammen.
Glätte aktiv brechen. Zu höfliche, zu runde, zu allgemeine Absätze streichen oder verschärfen.
Quellen sichtbar machen. Nicht nur wegen SEO, sondern wegen Vertrauen.

Für CIOs und KI-Verantwortliche

Content-Governance erweitern. Prüft nicht nur faktische Korrektheit, sondern auch Wiederholungen, Tonalität und Differenzierung.
Training- und Retrieval-Daten kuratieren. Wenn interne Wissenssysteme mit generischem KI-Content gefüttert werden, wird auch der Output generischer.
Human-in-the-loop ernst nehmen. Nicht als Alibi-Freigabe, sondern als redaktionelle Qualitätsstufe.
Metriken definieren. Semantische Ähnlichkeit, Quellenabdeckung und Duplikatnähe lassen sich technisch messen.

Für Plattformen und Suchsysteme

Vielfalt belohnen. Ranking sollte nicht nur Relevanz und Engagement optimieren, sondern auch Originalität und Quellenqualität.
Provenienz standardisieren. Rückwirkende KI-Detection bleibt unsicher. Besser sind nachvollziehbare Erstellungs- und Signaturketten.
AI-Slop nicht nur über Spam erkennen. Der gefährlichere Fall ist nicht immer offensichtlicher Müll, sondern sauber formatierter Durchschnitt.

Fazit

Die Studie zeigt kein apokalyptisches Web voller Halluzinationen. Sie zeigt etwas Nüchterneres – und vielleicht Gefährlicheres: Das Web wird messbar stärker von KI geprägt, aber die größten Effekte liegen nicht dort, wo viele sie erwarten.

Der aktuelle Befund lautet:

35 % neuer Websites sind Mitte 2025 KI-generiert oder KI-assistiert.
Es gibt Evidenz für semantische Verengung.
Es gibt Evidenz für einen positiveren, glatteren Ton.
Es gibt keine robuste Evidenz für eine allgemeine Explosion faktischer Fehler oder messbare Stil-Monokultur.

Das Web ist also nicht tot. Aber es wird durchschnittlicher.

Und genau dagegen müssen gute Teams arbeiten: mit besseren Quellen, klarerer Haltung, echter Erfahrung und bewusster redaktioneller Qualität. KI kann Texte schneller machen. Menschen müssen sie bedeutungsvoller machen.

Pro-Tipp: Strategy first, dann Model. Und bei Content: Substanz first, dann Prompt.