Blinder Fleck in der Debatte
Wenn über Künstliche Intelligenz gesprochen wird, richtet sich die Aufmerksamkeit meist auf den Output: Wem gehört ein KI-generierter Text? Ist er geschützt? Darf man ihn nutzen? Deutlich seltener geht es um die entscheidende Vorfrage: Woher kommt eigentlich das Material, mit dem diese Systeme trainiert werden? Denn KI lernt nicht im luftleeren Raum. Sie greift auf enorme Mengen bestehender Inhalte zurück – Texte, Bilder, Musik. Und genau hier beginnt das urheberrechtliche Problem.
Juristisch betrachtet ist der Ausgangspunkt überraschend klar: Das zentrale Recht des Urhebers ist das Vervielfältigungsrecht. Wer Inhalte aus dem Internet ausliest, speichert und für Trainingszwecke verwendet, vervielfältigt sie – zumindest im Arbeitsspeicher, häufig aber auch dauerhaft in Datenbanken. Genau das passiert beim Webscraping. Und damit gilt im Grundsatz: Diese Nutzung ist erlaubnispflichtig. Mit anderen Worten: Urheber könnten sich dagegen wehren. Sie könnten die Nutzung ihrer Werke für KI-Training verbieten oder von einer Lizenz abhängig machen.
Warum bekannte Schranken nicht greifen
Jetzt könnte man denken: Es gibt doch im Urheberrecht zahlreiche Ausnahmen. Greifen die hier nicht? Teilweise – aber eben nicht wirklich. Kurzfristige, technisch notwendige Kopien sind zwar erlaubt. Doch beim KI-Training geht es gerade nicht um bloße Zwischenschritte ohne wirtschaftliche Bedeutung. Im Gegenteil: Die Nutzung zielt darauf ab, neue – potenziell konkurrierende – Inhalte zu erzeugen. Auch die Regeln zum Text- und Data-Mining helfen nicht weiter. Sie erlauben es, Daten nach Mustern, Trends oder Zusammenhängen zu analysieren. Aber genau das ist nicht der Kern von KI-Training. Hier geht es nicht nur um das Erkennen von Strukturen – sondern um die Nutzung des inhaltlichen Gehalts selbst. Und damit verlässt man den Bereich dessen, was diese Ausnahmen eigentlich erlauben sollen. Das Ergebnis ist eindeutig: Die bestehenden Schranken passen schlicht nicht auf das Phänomen KI.
Auf dem Papier klingt das alles nach einer starken Position für Urheber. In der Praxis sieht es anders aus. Das Problem ist die internationale Dimension. KI-Systeme werden oft von Unternehmen betrieben, die außerhalb Europas sitzen. Die Daten liegen auf Servern irgendwo auf der Welt. Trainingsprozesse sind verteilt, schwer greifbar, kaum nachvollziehbar. Die Folge: Selbst wenn ein Verstoß vorliegt, ist es extrem schwierig, ihn effektiv zu verfolgen. Das Urheberrecht stößt hier an eine ganz praktische Grenze – nicht, weil es inhaltlich versagt, sondern weil seine Durchsetzung im globalen Kontext kaum funktioniert. Diese Situation ist für alle Beteiligten unbefriedigend. Urheber haben zwar Rechte, können sie aber kaum durchsetzen. KI-Unternehmen bewegen sich in rechtlicher Unsicherheit. Und gleichzeitig wächst der wirtschaftliche Druck, immer bessere Modelle zu entwickeln – was wiederum große, hochwertige Datensätze erfordert. Hinzu kommt ein weiteres Problem: Würde man die Nutzung strikt unterbinden, könnte das die Qualität von KI-Systemen erheblich verschlechtern. Denn gerade hochwertige, geschützte Inhalte sind für gutes Training besonders wertvoll. Das Recht steht also vor einem klassischen Zielkonflikt: Schutz der Urheber – versus technologische Entwicklung.
Einfache Lösungen überzeugen nicht
Man könnte versucht sein, einfache Lösungen zu wählen. Etwa ein vollständiges Verbot. Oder umgekehrt: eine vollständige Freigabe. Beides überzeugt nicht. Ein striktes Verbot wäre faktisch kaum durchsetzbar und würde Innovation ausbremsen. Eine vollständige Freigabe würde dagegen die Interessen der Urheber ignorieren und ihre wirtschaftliche Grundlage gefährden. Auch Modelle, bei denen Urheber aktiv widersprechen müssen, wirken auf den ersten Blick attraktiv – scheitern aber oft an der Realität. Denn sie verlagern die Verantwortung auf diejenigen, die ohnehin die schwächere Position haben.
Die überzeugendste Lösung liegt deshalb an anderer Stelle: nicht im Entweder-oder, sondern im Ausgleich. Statt KI-Training zu verbieten oder vollständig freizugeben, spricht vieles für ein System gesetzlicher Vergütungsansprüche. Die Idee dahinter ist einfach: Nutzung wird erlaubt – aber nicht kostenlos. Ähnlich wie bei der Geräte- und Speichermedienabgabe könnte die Vergütung dort ansetzen, wo KI wirtschaftlich genutzt wird. Also nicht beim bloßen Training, sondern beim Output. Das hätte mehrere Vorteile: Rechtssicherheit für Unternehmen, Beteiligung der Urheber, praktikable Durchsetzung über Verwertungssysteme. Und vor allem: Es würde den Konflikt entschärfen, ohne eine Seite komplett zu benachteiligen.
Die Diskussion um KI und Urheberrecht zeigt vor allem eines: Das Recht steht vor einer Transformation. Es geht nicht mehr nur darum, bestehende Regeln anzuwenden. Es geht darum, sie weiterzuentwickeln – in einer Welt, in der Inhalte global verfügbar, technisch reproduzierbar und wirtschaftlich hochrelevant sind. Die entscheidende Frage ist deshalb nicht, ob KI genutzt werden darf. Sondern wie. Ein funktionierendes System wird weder auf reiner Kontrolle noch auf vollständiger Freiheit beruhen. Es wird ein System sein müssen, das Nutzung ermöglicht – und gleichzeitig fair verteilt. Denn am Ende geht es nicht nur um Technologie. Es geht um die Spielregeln einer digitalen Wissensgesellschaft.