Was macht eine Forschungs-Schnittstelle im Digital Services Act?

Über das geplante Digitale-Dienste-Gesetz der EU (auch „Digital Services Act“) ist in letzter Zeit viel geschrieben worden, meistens im Zusammenhang mit der Bekämpfung von Hassbotschaften im Netz. Illegale Inhalte sollen leichter bekämpft werden, große Plattformen wie Facebook und Twitter sollen stärkerer Kontrolle unterliegen. Eine gute Nachricht für die Wissenschaft geht in den Debatten aber meistens unter: Das Gesetz schafft auch Datenschnittstellen für die Forschung.

OK, der Reihe nach. Der EU Digital Services Act befindet sich aktuell im Entwurfsstadium und wurde mit dem Grundgedanken entworfen, dass alles, was in der realen Welt illegal ist, auch im Netz bekämpft werden sollte: Betrug, Volksverhetzung, sexueller Missbrauch und Ähnliches. Er regelt allerdings auch den kommerziellen Wettbewerb im Netz sowie Fragen der Rechenschaftspflicht von Online-Plattformen. Abgestuft ist das Ganze nach vier Gruppen:

  • Vermittlungsdienste (z.B. Internetanbieter), darunter:
  • Hosting-Dienste, darunter:
  • Online-Plattformen, die Verkäufer und Verbraucher zusammenbringen, wie Online-Marktplätze, App-Stores und Social Media.  
  • Sehr große Online-Plattformen, die monatlich mehr als 10% der europäischen Verbraucher/innen erreichen. (Yep, mindestens 45 Millionen User!)

Für die letzte Gruppe umfasst der EU-Gesetzesentwurf jetzt insgesamt 19 neue Verpflichtungen, zum Beispiel zur Meldung von Straftaten oder zur Transparenz bei Online-Bewertungen. Und eine dieser Verpflichtungen ist die Schaffung einer Forschungsschnittstelle.

Präziser gesagt, Artikel 31 des EU Digital Services Act erlaubt es den Behörden, die Schaffung eines Datenzugangs anzuordnen:

Sehr große Online-Plattformen gewähren auf begründetes Verlangen […] zugelassenen Forschern […] Zugang zu Daten zum ausschließlichen Zweck der Durchführung von Forschungsarbeiten, die zur Ermittlung und zum Verständnis systemischer Risiken […] beitragen.

Da die Erfassung monatlicher Nutzerzahlen nicht trivial ist, gibt es noch keine offizielle Liste, wer aktuell zu diesen „sehr großen Online-Plattformen“ zählt. In jedem Fall werden sie als besonders regulierungsbedürftig betrachtet, weil zu ihnen die großen Sozialen Medien gehören: TikTok, Instagram, Facebook, Whatsapp und dergleichen. Fehlentwicklungen auf diesen Plattformen haben aufgrund ihrer schieren Nutzerzahl das Potenzial, enormen gesellschaftlichen Schaden anzurichten. Das Gesetz macht allerdings keinen Unterschied zwischen Social Media und anderen Plattformen, so dass auch beispielsweise Ebay oder Paypal mit eingeschlossen sein könnten. (Fun fact: Auch Webseiten wie Pornhub oder xhamster.com könnten aufgrund ihrer Nutzerzahl zu den „sehr großen Online-Plattformen“ zählen. Auf die Forschungsergebnisse darf man gespannt sein.)

Wie sieht dieser Zugang konkret aus?

Grundsätzlich gibt es für Plattformen zwei Möglichkeiten, Zugriff auf ihre Daten zu ermöglichen: Über eine Anwenderschnittstelle zum laufenden System (API = application programming interface), oder über eine Datenbank. Die zweite Option wäre in der Praxis vermutlich eine Datenkopie, die einen bestimmten Zeitpunkt des Systems abbildet. Anwenderschnittstellen hingegen können auch Live-Analysen ermöglichen und erleichtern Zeitreihen.

Fast jede Software enthält solche Schnittstellen, denn über sie werden Daten mit anderen Programmen und Systemen ausgetauscht. Der Betreiber stellt hierfür die notwendigen technischen Informationen bereit, die externe Programmierer brauchen, um entweder Daten aus dem System abzurufen oder welche einzuspeisen. Das sieht dann so aus und ist für Leute wie mich, die in grauer Vorzeit nur QBASIC und HTML gelernt haben, leider völlig unverständlich.

Der Digital Services Act grenzt ein paar wichtige Fragen rund um die Schnittstellen bereits ein:

  • Für wen wird der Zugang gelegt? (Forschende an akademischen Einrichtungen mit entsprechender Fachkenntnis)
  • Auslesen von Daten, einspeisen oder beides? (Auslesen)
  • Zu welchem Zweck? (Analyse sog. „systemischer Risiken“, gemeint sind beispielsweise die Verbreitung illegaler Inhalte, die Missachtung bestimmter Grundrechte, Gefährdung Minderjähriger oder Manipulation von Wahlen.)

Die konkrete behördliche Anordnung wird hingegen Fragen regeln wie: Welche Daten dürfen ausgelesen werden? Für welchen Zeitraum? Welche Sicherheitsvorkehrungen sind nötig? Usw…

Viele Social-Media-Plattformen stellen übrigens schon länger solche Datensätze oder Analyse-Tools bereit, weil sie großen kommerziellen Nutzen haben können, beispielsweise für Werbung und Marktforschung. Gerade Facebook ist allerdings sehr experimentierfreudig und stellt verschiedene Daten-Sets für Forschungszwecke zur Verfügung. Die Plattform CrowdTangle ist darunter die umfangreichste und bietet wissenschaftlichen Teams die Möglichkeit, sich direkt für einen Forschungszugang zu bewerben. Institute wie das Weizenbaum-Institut oder das Humboldt-Institut für Internet und Gesellschaft dürften sich freuen.

(Die Originaltabelle ist deutlicher länger als hier abgebildet und enthält insgesamt 50 Parameter, die sich abfragen lassen.)

Was lässt sich mit diesen Daten anfangen?

Daten aus sozialen Medien lassen sich natürlich für die verschiedensten wissenschaftlichen Analysen nutzen: Linguistik, urbane Kartierung, Einkommensverteilung, etc… Beim Digital Services Act geht es allerdings um ein deutlich eingeschränktes Spektrum, aus zwei Gründen: Erstens ist der Zugang für wissenschaftliche Teams durch Artikel 31 des Gesetzes sehr streng reguliert, d.h. es wird mitnichten so sein, dass ein einmal geschaffener Datenzugang von der Wissenschaft frei genutzt werden kann. Zweitens dürfen die Daten nicht für beliebige Fragestellungen genutzt werden, sondern es gibt eine gesetzliche Beschränkung auf die Analyse systemischer Risiken (s.o.). Teilweise wird dies verkürzt dargestellt als „Knacken des Algorithmus“ hinter Youtube, Facebook oder Twitter, aber das ist irreführend. Die Forschungsfrage lautet in der Regel nicht: „Wie mag der Algorithmus aussehen, der den Usern den nächsten Beitrag anzeigt?“. Meistens geht es eher darum, wie sich die Nutzung der Plattform auf das menschliche Verhalten auswirkt. Kürzlich wurde beispielweise untersucht, ob der Empfehlungs-Algorithmus auf YouTube für eine politische Radikalisierung seiner Nutzer verantwortlich ist. (Die Antwort war übrigens: Nein, es sind eher externe Links und das Abonnieren bestimmter Kanäle, die zur Radikalisierung führen.)

Das wirklich Bemerkenswerte an diesem Gesetzesentwurf ist aber etwas anderes: Er gehört gar nicht in den Kontext Wissenschaft. Hier geht es nicht um eine Stärkung der europäischen Forschung, es ist kein EU Digital Research Act. Vielmehr geht es um Rechtsstaatlichkeit, fairen Wettbewerb und die Stabilität von Demokratien. Dass in diesem Zusammenhang ein Forschungszugang behördlich angeordnet werden kann, ist letztendlich auch ein Eingeständnis der Politik: Wenn wir Schaden von der Gesellschaft abwenden wollen, müssen wir zuerst verstehen, wie er verursacht wird – und dazu brauchen wir die Wissenschaft. Auch wenn dieses Bekenntnis in Paragraph 31 gut versteckt ist, darf man das als Zeichen der Wertschätzung verstehen.

Mehr davon? Erhalten Sie immer die neuesten Artikel in Ihren Posteingang:

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s