Lade Inhalt...

Kommerzielles Text- und Data-Mining im Urheberrecht

von Maximilian Wellmann (Autor:in)
©2022 Dissertation 312 Seiten

Zusammenfassung

Wertschöpfung aus Big Data ist in Zeiten eines stetig wachsenden Informationsbedürfnisses zu einer zentralen Aufgabe in vielen Wirtschaftsbereichen geworden. Text- und Data- Mining Analysen können Unternehmen helfen sich einen Wettbewerbsvorsprung zu sichern. Mit dem Inkrafttreten der DSM-Richtlinie und der Schranke des § 44b UrhG regelt das Urheberrecht nun erstmals das kommerzielle Text- und Data- Mining umfassend. Der Gesetzgeber versucht so den Anschluss an eine rasante technische Entwicklung herzustellen. Anlass genug für den Autor der Frage nachzugehen, ob es dem Gesetzgeber gelungen ist ein rechtssicheres Umfeld für das Text- und Data-Mining im europäischen Binnenmarkt zu schaffen. Dabei werden auch Defizite offenbart und Vorschläge gemacht, wie durch eine techniksensiblere Regulierung identifizierten Problemen abgeholfen werden könnte.

Inhaltsverzeichnis

  • Cover
  • Titel
  • Copyright
  • Autorenangaben
  • Über das Buch
  • Zitierfähigkeit des eBooks
  • Vorwort
  • Gliederung
  • Abkürzungsverzeichnis
  • A. Einführung und Hintergrund
  • I. Problemaufriss –​ von der Informationsgesellschaft in die „data-​mining society“
  • II. Anstoß und Gang der Arbeit
  • III. Forschungsfragen
  • IV. Technischer Hintergrund und begriffliche Grundlagen des Text-​ und Data-​Mining
  • V. Begriffsbestimmungen und technischer Hintergrund der Informatik
  • 1. Data-​Mining
  • a) Alternative 1: Data-​Mining als Methode –​ Knowledge Discovery in Databases als Prozess
  • b) Alternative 2: Data-​Mining als Prozess und Methode
  • 2. Text-​Mining
  • 3. Web-​Mining
  • 4. Text-​ und Data-​Mining-​Prozess
  • a) Analyseziel: Informationsgewinnung
  • b) Analyserohstoff: Daten
  • aa) Big Data
  • bb) Big Data und die Notwendigkeit automatisierter Datenanalyseverfahren
  • c) Zentrale Analysemethoden
  • aa) Klassifikation
  • bb) Segmentierung
  • cc) Abhängigkeitsanalyse
  • dd) Abweichungsanalyse
  • 5. Einsatzgebiete des Text-​ und Data-​Mining
  • a) Text-​ und Data-​Mining in der Wissenschaft
  • b) Text-​ und Data-​Mining im kommerziellen Sektor
  • c) Text-​ und Data-​Mining im hoheitlichen Einsatz
  • VI. Begriffsbestimmung und technisches Verständnis der DSM-​Richtlinie
  • 1. Systematik
  • 2. Legaldefinition des Art. 2 Nr. 2 DSM-​RL
  • a) Schlagwortartiges Verständnis der DSM-​Richtlinie
  • b) Prozessorientiertes Verständnis der DSM-​Richtlinie
  • c) Reichweite des Datenbegriffs in Art. 2 Nr. 2 DSM-​RL
  • d) Systematische Inkohärenz zu Art. 3, 4 DSM-​RL
  • 3. Kritik
  • VII. Begriffsbestimmung und technisches Verständnis des Urheberrechtsgesetzes
  • 1. Systematik
  • 2. Legaldefinition des § 44b Abs. 1 UrhG
  • 3. Kritik
  • VIII. Terminologische Prämissen für den weiteren Fortgang der Arbeit
  • B. Die verwertungsrechtliche Analyse des zentralen Prozessschritts der Datenauswahl im Text-​ und Data-​Mining
  • I. Die Untersuchung leitende Grundsätze der urheberrechtlichen Dogmatik
  • II. Datenauswahl aus Werken
  • 1. Der einheitliche europäische Werkbegriff
  • a) Voraussetzungen
  • b) Der Schutz von Werkteilen
  • 2. Eingriff in das Vervielfältigungsrecht durch die Auswahl von Werken
  • a) Gründe für das Eingreifen des § 16 UrhG
  • b) Grenzfälle
  • aa) Keine verbindliche Schutzuntergrenze durch die Rechtsprechung
  • bb) Konsequenz für das Text-​Mining
  • c) Rechtliche Lösung: Die Datenauswahl als vorüberge-​ hende Vervielfältigung im Arbeitsspeicher
  • d) Technische Lösung: Die Methode der abgeleiteten Textformate
  • aa) Technischer Vorgang
  • bb) Kritik
  • III. Datenauswahl aus Datenbankwerken, § 4 Abs. 2 S. 1 UrhG
  • 1. Besonderer Stellenwert der Datenauswahl aus Datenbanken für den Data-​Mining-​Prozess
  • 2. Allgemeine Voraussetzungen des Datenbankbegriffs
  • a) Einordnung relationaler Datenbanken unter den Datenbankbegriff
  • aa) Technischer Aufbau
  • bb) Voraussetzungen des Datenbankbegriffs
  • (1) Problematische Voraussetzung der Unabhängigkeit
  • (2) Datenkombinationen als unabhängige Elemente nach EuGH „Esterbauer“
  • b) Einordnung eines Data Warehouse unter den Datenbankbegriff
  • aa) Technischer Aufbau
  • bb) Voraussetzungen des Datenbankbegriffs
  • c) Einordnung horizontal skalierter Datenbanksysteme unter den Datenbankbegriff
  • 3. Besondere Voraussetzung: Persönlich geistige Schöpfung
  • 4. Eingriff in das Vervielfältigungsrecht durch den Vorgang der Datenauswahl
  • a) Technischer Vorgang des Abrufs
  • b) Abruf einzelner Daten
  • c) Notwendige Differenzierung beim Abruf der gesamten Datenbank
  • IV. Datenauswahl aus Datenbanken sui generis, §§ 87a ff. UrhG
  • 1. Besondere Voraussetzung: Quantitativ oder qualitativ wesentliche Investition
  • a) Wesentliche Investition
  • b) „Allerweltsinvestition“ oder signifikante Investition
  • 2. Eingriff in das Vervielfältigungsrecht durch die Datenauswahl
  • a) Problemaufriss und Unterschiede in der Bewertung zum Abruf aus Werken und Datenbankwerken
  • b) Abruf einzelner Daten
  • c) Wiederholter und systematischer Abruf einzelner Daten
  • aa) Die Datenauswahl als normale Nutzung, § 87b Abs. 1 S. 2 Alt. 1 UrhG
  • bb) Keine unzumutbare Beeinträchtigung berechtig-​ ter Interessen, § 87b Abs. 1 S. 2 Alt. 2 UrhG
  • d) Abruf des gesamten Datenbestandes aus einer Datenbank
  • 3. Sonderfall des in-​database data mining
  • V. Datenauswahl aus vertraglich geschützten Datenbanken
  • 1. EuGH „Ryanair“
  • 2. Rechtliche Implikationen der Datenauswahl
  • VI. Der urheberrechtliche Schutz von Webseiten und seine Konsequenzen für die Datenauswahl
  • 1. Technische Struktur einer HTML-​Webseite
  • 2. Urheberrechtlicher Schutz von Webseiten
  • a) Webseiten als (Multimedia-​)Werk
  • b) Webseiten als Datenbankwerk
  • c) Webseiten als Datenbank sui generis
  • aa) Einordnung für einzelne Benutzeroberflächen
  • bb) Einordnung für mehrere HTML-​Webseiten und Plattformstrukturen
  • cc) Besondere Voraussetzung: Quantitativ oder qualitativ wesentliche Investition
  • d) Webseiten als Computerprogramm
  • 3. Eingriff in das Vervielfältigungsrecht durch die Datenauswahl
  • a) Technischer Vorgang der Datenauswahl durch Screen-​Scraping-​Software
  • b) Abruf von Daten aus Webseiten
  • c) Abruf von Daten aus Webseiten als Datenbank sui generis
  • aa) Keine andere Wertung durch EuGH „Innoweb“
  • bb) Unwirksamkeit entgegenstehender vertraglicher Beschränkungen gem. § 87e UrhG
  • VII. Zwischenergebnis
  • C. Die verwertungsrechtliche Analyse der weiteren Prozessschritte des Text-​ und Data-​Mining
  • I. Datenvorbereitung (Preprocessing)
  • 1. Preprocessing von Werken
  • a) (Weiterer) Eingriff in das Vervielfältigungsrecht
  • b) Kein Eingriff in das Bearbeitungsrecht durch Annotation und Reduktion des Datenbestandes
  • 2. Preprocessing von Datenbanken
  • II. Transformation in eine Datenmatrix oder ein Textkorpus
  • 1. Technische Vorgaben
  • 2. Eingriff in das Vervielfältigungsrecht durch Konvertierung in ein maschinenlesbares Datenformat
  • a) Die urheberrechtliche Schutzfähigkeit einer Datenmatrix
  • aa) Schutzfähigkeit gem. §§ 2 Nr. 7, 4 Abs. 2 S. 1 UrhG
  • bb) Schutzfähigkeit als neue Datenbank gem. § 87a Abs. 1 S. 2 UrhG
  • (1) Ausschluss von Spin-​off-​Datenbanken durch die Rechtsprechung
  • (2) Übertragung auf die vorliegende Konstellation
  • b) Die urheberrechtliche Schutzfähigkeit eines Textkorpus
  • 3. Eingriff in das Recht zur öffentlichen Wiedergabe bei Veröffentlichung der Datenmatrix
  • a) Konstellation 1
  • b) Konstellation 2
  • 4. Eingriff in das Recht zur öffentlichen Wiedergabe bei Veröffentlichung des Textkorpus
  • III. Data-​Mining im engeren Sinne: Die Anwendung des Data-​Mining-​Algorithmus
  • 1. Technische Betrachtung
  • a) Konfigurierte Algorithmen
  • b) Selbstlernende Algorithmen
  • 2. Urheberrechtliche Bewertung des Analysevorgangs
  • 3. Urheberrechtliches Schicksal des Data-​Mining-​Algorithmus
  • a) Konfigurierte Algorithmen
  • b) Selbstlernende Algorithmen
  • IV. Evaluation und Interpretation der offenbarten Muster
  • V. Gesamtergebnis der verwertungsrechtlichen Analyse des Text-​ und Data-​Mining-​Prozesses
  • D. Die urheberrechtliche Schutzfähigkeit der Text-​ und Data-​Mining-​Ergebnisse
  • I. Abgrenzung zwischen Text-​ und Data-​Mining-​Ergebnissen und KI-​Erzeugnissen
  • II. Schutzfähigkeit unter dem einheitlichen europäischen Werkbegriff
  • 1. Der Anthropozentrismus des Werkbegriffs als Ausschlusskriterium
  • 2. Möglichkeit eines derivativen Schutzes?
  • III. Schutzfähigkeit unter dem Schutzrecht sui generis des Datenbankherstellers
  • 1. Voraussetzungen des § 87a Abs. 1 S. 1 UrhG
  • 2. Berücksichtigungsfähigkeit der Investition
  • a) Abgrenzungspostulat nach EuGH „BHB/​William Hill“
  • b) Problem der „selbstständigen Investition“ in mehrstufigen Datenanalyseprozessen
  • 3. Teleologische Extension der Voraussetzung der Beschaffung in § 87a Abs. 1 S. 1 UrhG
  • a) Kritische Würdigung des Begriffs der Rohdaten
  • b) Ambivalente Auswirkung einer teleologisch-​extensiven Auslegung auf das Text-​ und Data-​Mining
  • c) Weitere Bedenken
  • 4. Das Zusammenspiel des relativen und absoluten Datenbankschutzes und die Konsequenz der faktischen Exklusivität
  • IV. Der Schutz von Text-​ und Data-​Mining-​Ergebnissen im US-​amerikanischen Copyright Law
  • 1. Zielsetzung des Rechtsvergleichs
  • 2. Schutzfähigkeit von Daten und Datensammlungen
  • 3. Für das Text-​ und Data-​Mining entscheidende Voraussetzungen des Werkschutzes
  • 4. Misappropriation-​Doktrin
  • a) Voraussetzungen
  • b) Anwendung auf die Ergebnisse des Text-​ und Data-​Mining-​Prozesses
  • 5. Schutz in den USA erzeugter Text-​ und Data-​Mining-​Ergebnisse über §§ 87a ff. UrhG
  • a) Ansatz über § 127a Abs. 2 UrhG
  • b) Schutz durch Unterlizenzierung an europäische Tochtergesellschaften
  • V. Zwischenergebnis
  • E. Einordnung der Schrankenbestimmungen zum Text-​ und Data-​Mining in den Acquis Unionaire
  • I. Entstehungsgeschichte
  • II. Die DSM-​Richtlinie im Acquis Unionaire des Urheberrechts
  • 1. Der Acquis Unionaire des Urheberrechts
  • 2. Integration der DSM-​Richtlinie
  • III. Defizite der bisher einschlägigen Rechtslage für das Text-​ und Data-​Mining
  • 1. Art. 5 Abs. 1 InfoSoc-​RL
  • 2. Art. 5 Abs. 3 lit. a InfoSoc-​RL
  • 3. Art. 6 Abs. 1, 2 lit. b Datenbank-​RL
  • 4. Bewertung des bisherigen Schrankenregimes
  • IV. Verhältnis der DSM-​Richtlinie zur InfoSoc-​Richtlinie
  • 1. Art. 3, 4 DSM-​RL als leges speciales zu den Schranken der InfoSoc-​ und Datenbank-​Richtlinie
  • 2. Gegenansicht
  • 3. Bewertung
  • F. Materiellrechtliche Würdigung der Schrankenbestimmung des Art. 4 DSM-​RL
  • I. Voraussetzungen, Art. 4 Abs. 1 DSM-​RL
  • 1. Persönlicher Anwendungsbereich
  • 2. Sachlicher Anwendungsbereich
  • a) Keine Notwendigkeit einer extensiven Auslegung
  • b) Digitalisierung
  • c) Einzelnes Werk
  • 3. Rechtmäßiger Zugang
  • a) Veröffentlichung von Schutzgegenständen im Internet ohne Zustimmung des Rechtsinhabers
  • b) Rechtfertigung der Voraussetzung über den Dreistufentest
  • 4. Urheberpersönlichkeitsrechtliche Aspekte
  • II. Speicherung, Art. 4 Abs. 2 DSM-​RL
  • III. Nutzungsvorbehalt, Art. 4 Abs. 3 DSM-​RL
  • 1. Sinn und Zweck des maschinenlesbaren Nutzungsvorbehalts
  • 2. Problemaufriss
  • 3. Robots.txt als maschinenlesbares Mittel i. S. v. Art. 4 Abs. 3 DSM-​RL
  • a) Einordnung als technische Schutzmaßnahme
  • b) Einordnung als Erklärungszeichen
  • 4. Rechtsfolgen der Erklärung eines maschinenlesbaren Nutzungsvorbehalts
  • 5. Probleme im Zusammenhang mit Art. 7 Abs. 2 S. 2 DSM-​RL
  • IV. Flankierender Rechtsvorbehalt, Umkehrschluss aus Art. 7 Abs. 1 DSM-​RL
  • V. Auswirkungen des Private Ordering
  • 1. Drohender überschießender Schutz
  • 2. Auswirkung des Private Ordering auf die angeordnete Vergütungsfreiheit
  • 3. Abgleich mit empirischen Untersuchungen
  • 4. Lösung des Problems über ein bereichsspezifisches Zugangsrecht zu analyserelevanten Daten?
  • a) Konstruktion über das bestehende Datenbankherstellerrecht
  • b) Dogmatische Bedenken
  • VI. Public-​Private Partnership: Verhältnis zu Art. 3 DSM-​RL
  • VII. Vorläufige Bewertung
  • G. Die Umsetzung der Schranke zum kommerziellen Text-​ und Data-​Mining in das Urheberrechtsgesetz
  • I. Umsetzungsspielraum durch den Harmonisierungsgrad
  • II. Ausnahme oder Beschränkung
  • III. Umsetzung in § 44b Abs. 2, 3 UrhG
  • 1. Systematik
  • 2. Voraussetzungen, § 44b Abs. 2 S. 1 UrhG
  • a) Vervielfältigungen von Werken
  • aa) Keine überschießende Umsetzung durch § 44b Abs. 2 S. 1 UrhG
  • bb) Richtlinienkonforme Auslegung im Hinblick auf Art. 15 Abs. 1 DSM-​RL
  • cc) Keine richtlinienkonforme Auslegung im Hinblick auf weitere Verwertungsrechte
  • b) Rechtmäßiger Zugang
  • 3. Löschpflicht, § 44b Abs. 2 S. 2 UrhG
  • a) Auslegungsprämissen
  • aa) Zeitpunkt
  • bb) Umfang
  • cc) Rechtsfolgen eines Verstoßes gegen die Löschpflicht
  • b) Konzeptionelle Schwäche der Löschpflicht
  • 4. Nutzungsvorbehalt, § 44b Abs. 3 S. 1 UrhG
  • a) Begriff des Nutzungsvorbehalts
  • b) Problematische Aspekte
  • c) Unwirksamkeit des Nutzungsvorbehalts
  • 5. Maschinenlesbarer Nutzungsvorbehalt, § 44b Abs. 3 S. 2 UrhG
  • a) Diskriminierungsverbot
  • b) Problematik der fehlenden Identität zwischen Rechtsinhaber und Webseitenbetreiber
  • aa) Praxis der Rechtseinräumung im Internet
  • bb) Zurechnung des erklärten Nutzungsvorbehalts über konkludente Vollmachtserteilung
  • cc) Voraussetzungen und Grenzen
  • dd) Übertragung auf § 44b Abs. 3 S. 2 UrhG
  • (1) Voraussetzungen
  • (2) Bewertung
  • c) Fehlende Techniksensibilität des § 44b Abs. 3 S. 2 UrhG
  • d) Unwirksamkeit maschinenlesbarer Nutzungsvorbehalte
  • 6. Vergütungsproblematik
  • IV. Verhältnis zu weiteren Schrankenregelungen des UrhG
  • 1. § 44a UrhG
  • 2. § 87c Abs. 1 S. 1 Nr. 4 UrhG
  • 3. § 69d Abs. 4 UrhG
  • V. Anpassung des § 95b Abs. 1 S. 1 Nr. 1, Abs. 3 Nr. 1 UrhG
  • VI. Konzeptionelle Schwäche der Schrankenregelung am Beispiel der Presse
  • 1. Grundsätze der Rechtsprechung des EuGH
  • 2. Keine Übertragung der Grundsätze auf Art. 4 DSM-​RL
  • 3. Kein Ausweichen auf §§ 50, 63 Abs. 1, 2 S. 1 UrhG
  • 4. Kritik
  • VII. Bewertung des § 44b UrhG unter Berücksichtigung der Erkenntnisse zu Art. 4 DSM-​RL
  • 1. Stärkung der Rechtsinhaber durch die drei Instrumente des Private Ordering
  • 2. Keine Beseitigung der rechtlichen Fragmentierung durch die DSM-​Richtlinie
  • 3. Weitere identifizierte Schwächen der Schranke
  • a) Regelungslücke im Hinblick auf die fehlende Identität zwischen Rechtsinhaber und Webseitenbetreiber
  • b) Fehlende Techniksensibilität
  • c) Anreizfunktion zur Abschottung gemeinfreier Inhalte
  • 4. Die Schranke als Ausdruck einer problematischen verwertungsrechtlichen Einschätzung des Gesetzgebers
  • 5. Gesamtfazit
  • H. Alternative Überlegungen zur Einordnung des Text-​ und Data-​Mining
  • I. Alternative auf Schrankenebene: Die Fair-​Use-​Doktrin des US-​amerikanischen Copyright Law
  • 1. Die Voraussetzungen der Fair-​Use-​Doktrin und ihre Anwendung auf das Text-​ und Data-​Mining
  • a) Erster Faktor
  • b) Zweiter Faktor
  • c) Dritter Faktor
  • d) Vierter Faktor
  • 2. Vergleich der Fair-​Use-​Lösung zu Art. 4 DSM-​RL
  • a) Keine allgemeine Unterlegenheit eines enumerativen Regelungsansatzes
  • b) Identifizierte Schwächen des Art. 4 DSM-​RL als „Wettbewerbsnachteil“ zu Fair-​Use-​Regimen
  • II. Alternativen auf Schutzbereichsebene
  • 1. Text-​ und Data-​Mining als freier digitaler Werkgenuss
  • a) Idee des freien digitalen Werkgenusses
  • b) Verwertungsrechtliche Implikationen
  • 2. Freistellung des Text-​ und Data-​Mining über § 5 Abs. 1 UrhG, §§ 24 UrhG a. F., 23 Abs. 1 UrhG
  • a) Dogmatische Anknüpfung an § 5 Abs. 1 UrhG
  • b) Dogmatische Anknüpfung an §§ 24 UrhG a. F., 23 Abs. 1 UrhG
  • c) Bewertung
  • 3. Idee eines normativen Vervielfältigungsrechts zur Freistellung des Text-​ und Data-​Mining auf Schutzbereichsebene
  • a) Konstruktion eines normativen Vervielfältigungsrechts des Art. 2 lit. c InfoSoc-​RL in EuGH „Metall auf Metall“
  • b) Übertragbarkeit auf die sonstigen Vervielfältigungsrechte in Art. 2 InfoSoc-​RL
  • aa) Pro
  • bb) Contra
  • c) Bewertung
  • I. Vorschlag eines neuen § 16 Abs. 3 UrhG n. F.
  • I. § 23 UrhG Abs. 3 S. 3 UrhG als regelungstechnisches Vorbild
  • II. Konkrete Ausgestaltung des § 16 Abs. 3 UrhG n. F.
  • III. Erläuterungen
  • 1. § 16 Abs. 3 S. 1 UrhG n. F.
  • 2. § 16 Abs. 3 S. 2 UrhG n. F.
  • 3. § 16 Abs. 3 S. 3 UrhG n. F.
  • IV. Vorteile der Lösung gegenüber der eingeführten Schranke des § 44b UrhG
  • J. Ergebnisse und Schlussbetrachtung
  • I. Zusammenfassung der Ergebnisse in Thesen
  • II. Wertende Schlussbetrachtung
  • Literaturverzeichnis

←20 | 21→

Abkürzungsverzeichnis

Dieses Verzeichnis enthält Abkürzungen, die nicht im Duden oder bei Kirchner, Abkürzungsverzeichnis der Rechtssprache, 9. Aufl., Berlin 2018 aufgeführt sind.

←22 | 23→

A. Einführung und Hintergrund

„We are drowning in information, but starving for knowledge“.

Dieses Zitat des amerikanischen Zukunftsforschers John Naisbitt offenbart das Paradoxon der Informationsgesellschaft des 21. Jahrhunderts. Smart Cars, Internet of Things (IoT), Smart Grids oder Wearables – all diese Entwicklungen erzeugen riesige Datenmengen und substituieren in zunehmendem Maße klassische körperliche Güter.1 Selbst kühne Optimisten hätten mit einer solch rasanten Entwicklung des historischen Phänomens der Datenflut durch die zunehmende Ubiquität des Digitalen nicht gerechnet. Versuche, das Phänomen der Datenflut in statistisch belastbaren Zahlen auszudrücken, sind angesichts der Eigenschaften von Daten als nicht-exklusive und nicht-rivale Güter bislang allerdings wenig erfolgreich gewesen.

Wagt man gleichwohl eine Schätzung, wird zugrunde gelegt, dass sich das weltweite Datenvolumen alle zwei Jahre verdoppelt und im Jahr 2025 auf insgesamt 163 Zettabyte angewachsen sein wird.2 Einen wesentlichen Anteil an dieser Entwicklung haben dabei nicht zuletzt große datengetriebene Unternehmen. Allein Google verarbeitet täglich 24 Petabyte Daten, was dem 6000-fachen Dateninhalt der US Library of Congress entspricht.3

Flankierend zu diesen Entwicklungen treibt auch die vierte industrielle Revolution (Industrie 4.0) die Datenflut immer weiter voran.4 Körperliche Geräte und in der Fertigung eingesetzte Maschinen werden immer stärker miteinander vernetzt und werden so „on purpose“ oder „en passant“ zu Datenerzeugern.5

←23 | 24→

Dabei sind die großen Datenunternehmen die Profiteure der Datenflut. Maßgeblich gefördert wird sie von Menschen, was sich darin zeigt, dass es ohne die immer stärkere Verlagerung des Lebens in das Internet und die Nutzung von „Smart Devices“ keine datengetriebenen Internetkonzerne gäbe.

Heutzutage ist es üblich, dass jeder einzelne Mensch schon durch seine Kommunikation und sein tatsächliches Agieren eine Vielzahl von Daten erzeugt, die das Leben von Menschen für Wirtschaftsunternehmen zu einem analyserelevanten Wirtschaftsgut macht.6

Es wäre jedoch fehlgehend, die Datenflut mit den Errungenschaften der Informationsgesellschaft als abebbend oder gar beendet anzusehen. Vielmehr wird sie weiter kräftig voranschreiten und durch die Entwicklungen im Bereich des maschinellen Lernens und der selbstlernenden Algorithmen eine neue Dynamik entfalten.

Absehbar ist dabei bereits jetzt, dass sich die Funktion von Daten fundamental auf den Kopf stellen wird und sich Daten künftig aus sich selbst heraus erzeugen werden.7 Solche sich selbsterzeugenden Daten werden insoweit die nächste Evolutionsstufe des die Menschheitsgeschichte begleitenden Phänomens der Datenflut bilden.

I. Problemaufriss – von der Informationsgesellschaft in die „data-mining society“

Um der Datenflut zu begegnen, bedarf es moderner Analysetechniken, mit deren Hilfe es möglich ist, aus Big Data einen kommerziellen Nutzen zu ziehen und die Datenflut zum gesellschaftlichen Vorteil zu nutzen. Um allerdings riesige Text- und Datenbestände, die Milliarden einzelner Daten und Texte enthalten können, auf relevante Informationen hin auszuwerten, braucht es automatisierte Analysemethoden, mit denen es möglich wird, die im Datenbestand angelegten Informationen für einen menschlichen Betrachter wahrnehmbar zu machen.

An dieser Stelle setzen die Verfahren des Text- und Data-Mining an.

Die Verfahren reihen sich dabei in der Historie der Datenflut in die Erfindung der Akte oder der Volltextsuche ein, mit der in der Vergangenheit Instrumente erfunden wurden, um sich einen Weg aus der datengetriebenen Überforderung zu bahnen.8

←24 | 25→

Möglich wurden die Entwicklung und der großflächige Einsatz von Text- und Data-Mining-Technologien jedoch erst durch die Entwicklungen und Fortschritte im Bereich der Speichertechnologie und der Rechenleistung. Ausgehend vom Mooreschen Gesetz verdoppelt sich seit den 1960er Jahren alle 18 Monate die Rechenkapazität bei gleichzeitiger Miniaturisierung und Verbilligung der Geräte.9

Ohne diese Gesetzmäßigkeit wäre ein Text- und Data-Mining-Einsatz in der heutigen Dimension nicht denkbar.10

Angesichts dieser Entwicklungen ist es deshalb nicht fernliegend, von einer Transformation der „information society“ in eine „data-mining society“ auszugehen, deren vorrangiges Ziel nicht mehr alleine darin besteht, Daten nur massenhaft abzuspeichern und abzurufen.11

Anknüpfungspunkt dieses auf Dommering zurückgehenden Sprachbildes ist dabei der Ansatz, dass eine Gesellschaft, die sich nur der Erhebung und Speicherung von Massendaten widmet, die Innovations- und Wertschöpfungsversprechen, die sich aus dem Wirtschaftsgut Daten ergeben, nicht wird einlösen können.12

Anders als in der Informationsgesellschaft ist die Grundidee des Einsatzes von Text- und Data-Mining-Methoden daher, die menschlich-kognitive Verarbeitung von Daten durch einen großflächigen Einsatz von maschinell-automatisierten Datenanalyseverfahren abzulösen, um Big Data im Sinne des gesellschaftlichen Fortschritts nutzen zu können.

←25 | 26→

Die zu untersuchenden Verfahren des Text- und Data-Mining stellen insoweit ein Instrument dar, mit dessen Hilfe es möglich wird, einen für den (kommerziellen) Anwender potenziell wertvollen, aber für die menschliche Wahrnehmung zunächst verborgenen Informationsgehalt zu offenbaren.

II. Anstoß und Gang der Arbeit

Der beschriebene Transformationsprozess und die hierauf ergangene Reaktion des Gesetzgebers liefern den zentralen Anstoß für die nachfolgende Untersuchung des Text- und Data-Mining.

Das Kernelement der Arbeit stellt dabei die seit Jahren in der Diskussion stehende und 2019 nunmehr final in Kraft getretene DSM-Richtlinie13 mit ihrer in Art. 4 DSM-RL verankerten neuen Schranke zum kommerziellen Text- und Data-Mining dar.

Umgesetzt wird die Vorschrift im deutschen Recht durch § 44b UrhG, der im Zusammenspiel mit Art. 4 DSM-RL das Regelungskonzept zum Text- und Data-Mining im europäischen Mehrebenensystem bildet.

Im Fokus der Abhandlung steht dabei in Rekurs auf ihren Titel das kommerzielle Text- und Data-Mining, das bisher ohne legislatives Vorbild war.

Abseits der urheberrechtlichen Regulierung werden andere für das Text- und Data-Mining in Betracht kommende Schutzrechtsregime wie das Datenschutzrecht oder das Wettbewerbsrecht aus der Betrachtung herausgehalten und nur dort thematisiert, wo dies problemorientiert geboten ist.14

Der Arbeit liegt ein ganzheitlicher Ansatz zugrunde, nach dem ausgehend von der Untersuchung der verwertungsrechtlichen Relevanz des Text- und Data-Mining-Prozesses eine Analyse und Bewertung der neuen Schrankenregelungen vorgenommen wird.

Zum Auftakt der Untersuchung werden in Kapitel B die relevante Terminologie und die technischen Hintergründe zum Text- und Data-Mining beleuchtet. Neben der Darstellung des „Analyserohstoffs“ Daten und dem beabsichtigten „Analyseprodukt“ der semantischen Informationen werden dabei auch die ←26 | 27→Querbezüge des Text- und Data-Mining zu Big Data thematisiert und zentrale Analysemethoden und Einsatzgebiete eingeführt.

In Kapitel C erfolgt der Einstieg in die verwertungsrechtliche Analyse des Text- und Data-Mining-Prozesses. Ausgehend vom Prozessschritt der Datenauswahl wird hier für zentrale Schutzgegenstände des Urheberrechts untersucht, inwiefern es durch die Datenauswahl überhaupt zu einem Eingriff in Verwertungsrechte des jeweiligen Schutzrechtsinhabers kommt.

Im Anschluss an diese Auseinandersetzung erfolgt in Kapitel D die verwertungsrechtliche Analyse der weiteren Prozessschritte des Text- und Data-Mining.

Kapitel E geht im Anschluss der Frage nach, inwieweit ein urheberrechtlicher Schutz von Text- und Data-Mining-Ergebnissen de lege lata in Betracht kommt. Dabei wird die Analyse um die Perspektive des US-amerikanischen Copyright Law ergänzt, um akzentuiert auf bestehende Stärken und Schwächen des europäischen Schutzregimes eingehen zu können.

Anknüpfend an die in den Kapiteln C und D gewonnenen Erkenntnisse widmet sich Kapitel F der Untersuchung der neu eingeführten Schranke des Art. 4 DSM-RL zum kommerziellen Text- und Data-Mining.

Die dogmatische Einordnung der DSM-Richtlinie in den Acquis Unionaire liefert dabei das Fundament für Kapitel G, in dem die materiellrechtliche Würdigung der Schranke zum kommerziellen Text- und Data-Mining vollzogen wird.

Ausgehend von den verbindlichen Vorgaben der DSM-Richtlinie erfolgt in Kapitel H die Auseinandersetzung mit der Umsetzungsvorschrift des § 44b UrhG. Die dort geübte Kritik wirft dabei bereits ein Schlaglicht auf die Diskussion der regulatorischen Alternativen im Kapitel I.

Den Schluss der Abhandlung bildet ein eigener Regelungsvorschlag in Kapitel J, der sich auf Grundlage der gewonnenen Erkenntnisse eine angemessene Einordung des Text- und Data-Mining zum Ziel setzt.

III. Forschungsfragen

Beim Text- und Data-Mining handelt es sich um eine junge Materie der urheberrechtlichen Regulierung. Zuletzt hat sich jedoch eine legislative Dynamik entfaltet, die ihren Ausgangspunkt in der Einführung des § 60d UrhG a. F. durch das UrhWissG15 findet, über das Inkrafttreten der DSM-Richtlinie 2019 reicht ←27 | 28→und ihren vorläufigen Abschluss in der Umsetzung der neuen Vorschriften zum Text- und Data-Mining in das Urheberrechtsgesetz finden wird.

Ohne Vorbild ist dabei die Einführung einer eigenen Schranke zum kommerziellen Text- und Data-Mining in § 44b UrhG, Art. 4 DSM-RL. Der Forschungsstand für diesen Bereich ist dementsprechend noch durch zahlreiche Leerstellen geprägt und bedarf einer grundlegenden wissenschaftlichen Auseinandersetzung.

Die Untersuchung greift in ihrer Konzeption die zahlreichen legislativen Umbrüche der jüngsten Zeit auf und setzt sich eine dogmatische Analyse der neuen Schranke des § 44b UrhG, Art. 4 DSM-RL zum kommerziellen Text- und Data-Mining zum Ziel.

Ausgehend von der Untersuchung der verwertungsrechtlichen Relevanz steht dabei die zentrale Forschungsfrage, ob es überhaupt einer eigenen Schranke für das kommerzielle Text- und Data-Mining bedarf oder ob die eingeführte Regelung des § 44b UrhG, Art. 4 DSM-RL nicht vielmehr überflüssig ist.

Dabei gilt es parallel zu untersuchen, ob die neu eingeführte Schranke zum kommerziellen Text- und Data-Mining technikneutral und zukunftsfest ausgestaltet ist, ihrer klassischen Funktion des Interessenausgleichs zwischen Kreativen, Rechtsinhabern und Nutzern nachkommt und zugleich erfolgreich zu Innovationen in Europa beitragen kann.16

Die Abhandlung nimmt dabei nicht nur eine kritische Auseinandersetzung mit den Tatbestandsvoraussetzungen der neu eingeführten § 44b UrhG, Art. 4 DSM-RL vor, sondern geht darüber hinaus auch der Frage nach, ob die eingeführte Schranke in der Lage ist, das Freihaltebedürfnis für Informationen im Urheberrecht angemessen mit Blick auf die Zielsetzung des Text- und Data-Mining zu sichern.

Ziel der Arbeit ist es zudem, regulatorische Alternativen zu entwickeln, die sich an der Fragestellung orientieren, ob ausgehend von den Wertungen des Dreistufentests eine interessengerechtere Regulierung des kommerziellen Text- und Data-Mining auch außerhalb der eingeführten Schranke zum kommerziellen Text- und Data-Mining möglich gewesen wäre.17

←28 | 29→

In der Entwicklung der Alternativen wird dabei auch ein rechtsvergleichender Ansatz eingebracht, der speziell untersucht, ob über die flexiblere Ausgestaltung der Text- und Data-Mining-Schranke nach dem Vorbild des Fair-Use-Regime des US-amerikanischen Copyright Law eine stärkere Betonung der Nutzerinteressen in der Schranke zum kommerziellen Text- und Data-Mining sinnvoll gewesen wäre.

Details

Seiten
312
Jahr
2022
ISBN (PDF)
9783631862179
ISBN (ePUB)
9783631874714
ISBN (MOBI)
9783631874721
ISBN (Paperback)
9783631868904
DOI
10.3726/b19513
DOI
10.3726/b19543
Sprache
Deutsch
Erscheinungsdatum
2022 (Januar)
Erschienen
Berlin, Bern, Bruxelles, New York, Oxford, Warszawa, Wien, 2022. 312 S.

Biographische Angaben

Maximilian Wellmann (Autor:in)

Maximilian Wellmann hat Rechtswissenschaften an der Albert-Ludwigs-Universität Freiburg, an der Eötvös-Loránd Universität Budapest sowie an der Westfälischen Wilhelms-Universität Münster mit Schwerpunkt im Informations-, Telekommunikations- und Medienrecht studiert. Im Anschluss war er als wissenschaftlicher Mitarbeiter zunächst in einer internationalen Großkanzlei in Düsseldorf und dann am Institut für Informations-, Telekommunikations- und Medienrecht in Münster tätig. Sein Referendariat absolviert er im Bezirk des Oberlandesgerichts Hamm.

Zurück

Titel: Kommerzielles Text- und Data-Mining im Urheberrecht
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
book preview page numper 16
book preview page numper 17
book preview page numper 18
book preview page numper 19
book preview page numper 20
book preview page numper 21
book preview page numper 22
book preview page numper 23
book preview page numper 24
book preview page numper 25
book preview page numper 26
book preview page numper 27
book preview page numper 28
book preview page numper 29
book preview page numper 30
book preview page numper 31
book preview page numper 32
book preview page numper 33
book preview page numper 34
book preview page numper 35
book preview page numper 36
book preview page numper 37
book preview page numper 38
book preview page numper 39
book preview page numper 40
314 Seiten