Header Grafik für Big Data Special

Moment mal – was ist überhaupt das Problem an der Datensammlung?

Privatsphäre, Überwachung, Edward Snowden, Cambridge Analytica, Digital Fingerprints und Mikrotargeting – Die Basics der Big Data-Problematik für Anfänger und Fortgeschrittene

Spätestens seitdem die europäische Datenschutz-Grundverordnung (DSGVO) am 25. Mai 2018 wirksam wurde und viel öffentliche Aufmerksamkeit auf sich zog, haben wohl die meisten Bürgerinnen und Bürger schon von Datenschutz im Internet gehört. Davor brachten bereits im Juni 2013 die Enthüllungen von Edward Snowden die Überwachungspraxis der amerikanischen Geheimdienste auf die öffentliche Agenda, und im März 2018 machte der Cambridge Analytica-Skandal die Risiken der Datensammlung durch soziale Netzwerke bewusst.

Hinweis: Die Links im Text führen zu Medienbeiträgen und wichtigen Quellen – und damit mitten hinein in die Debatte.

Was ist Big Data?

Wenn es um die Datensammlung im Internet geht, fällt oft der Begriff „Big Data“. Was ist damit gemeint, und wo liegt überhaupt das Problem? Tatsächlich geht es bei Big Data weniger um die wörtliche Bedeutung, „große Daten“, sondern darum, wie diese Daten entstehen und genutzt werden.

Der Begriff beschreibt die Möglichkeit, massenweise Daten in Echtzeit zu sammeln, verschiedene Datensets zu verbinden, zu analysieren und darin Muster zu erkennen. Häufig werden diese Muster genutzt, um Rückschlüsse auf das Verhalten oder die Einstellungen von Bürgerinnen und Bürgern zu ziehen, doch mehr dazu später.

Welche Daten werden gesammelt und wie?

Generell sind viele Datenquellen möglich, doch in der Regel geht es bei Big Data um Datensätze, die im Internet gesammelt werden. Bereits durch den Besuch einer Website, aber auch durch die Nutzung eines Smartphones, den Download und die Nutzung von Apps, das Öffnen von E-Mails oder das Ausfüllen von Online-Formularen geben Internetnutzerinnen und -nutzer Daten von sich preis.

Je nachdem, welche Apps oder Dienste wir nutzen, können verschiedene Daten anfallen. Online-Shops zum Beispiel fragen persönliche Informationen ab wie Name, Alter oder Geburtsdatum sowie Kontaktdaten wie Mailadressen und Telefonnummern. Diese müssen wir in der Regel selbst angeben.

Doch sehr viele Daten werden gesammelt, ohne dass wir es merken. Zum Beispiel hinterlassen wir beim Besuch von Internetseiten einen digitalen Fingerabdruck. Auf unseren Geräten werden kleine Dateien gespeichert, sogenannte Cookies. Zusammen mit anderen Technologien ermöglichen diese Cookies es, einzelne Nutzerinnen und Nutzer wiederzuerkennen und zu verfolgen. Dies wird als Tracking bezeichnet.

Einen großen Teil der Spuren, die wir hinterlassen, machen sogenannte Metadaten aus: Zum Beispiel Daten über den Standort, wie lange wir uns auf bestimmten Internetseiten aufhalten, welche Seiten wir vorher besucht haben. Messenger-Dienste erfassen, wie viele Nachrichten wir an wen verschicken.

Soziale Netzwerke und Shops versuchen meist, uns noch besser kennenzulernen. Sie sammeln Informationen über Vorlieben, Interessen, Beruf oder Hobbies und Daten von unseren gespeicherten Kontakten.

Von sogenannten Data-Brokern – zu Deutsch: Datenhändlern – werden diese Daten gekauft und häufig mit Daten aus anderen Quellen kombiniert. Das können auch Informationen sein, die nicht aus dem Internet stammen. Zum Beispiel erwarb die britische Firma Cambridge Analytica in den USA unter anderem Grundbucheinträge, Wählerverzeichnisse und medizinische Daten und kombinierte diese mit Facebook-Daten. So konnten für über 85 Millionen Wähler in den USA detaillierte psychologische Profile zu deren Vorlieben und Interessen erstellt werden, welche dann für individuelle Wahlwerbung verwendet wurden.

Dies alles geschieht, weil sich mit den Daten viel Geld verdienen lässt. Einige der größten Internetplattformen wie Google, YouTube oder Facebook verdienen ihr Geld hauptsächlich mit Werbung, die sie ihren Nutzerinnen und Nutzern anzeigen. Andere verkaufen online Produkte. Die Unternehmen können Werbung und Produkte umso besser verkaufen, je mehr sie über die Vorlieben der Internetnutzerinnen und Nutzer wissen.

Darüber erhoffen sich auch andere, Big Data nutzen zu können. Daten gelten als Rohstoff, der neue Anwendungen ermöglicht. Zum Beispiel könnte Big Data helfen, die Energieversorgung auf erneuerbare Energien umzustellen oder Verkehrsmittel zu vernetzen.

Privatsphäre in Gefahr?

Wo liegt nun das Problem an der Sammlung persönlicher Daten im Internet? Es gibt mehrere Problemfelder. Beim ersten geht es um die Privatsphäre. Das Recht auf Privatsphäre gilt als Menschenrecht und ist in Deutschland im Grundgesetz indirekt verankert. Es wird zwar nicht ausdrücklich erwähnt, aber es lässt sich sowohl aus dem allgemeinen Persönlichkeitsrecht ableiten (Artikel 1 und 2) als auch aus dem Recht auf die Unverletzlichkeit der Wohnung (Artikel 13) sowie aus dem Post- und Fernmeldegeheimnis (Artikel 10).

Wenn allerdings immer mehr persönliche Daten im Internet gesammelt, analysiert und weiterverkauft werden, und Firmen wie auch staatliche Stellen leicht an Informationen über einzelne Bürgerinnen und Bürger gelangen können, ist die Privatsphäre in Gefahr.

Die Sorge, dass wir durch das Internet für den Staat zu „gläsernen“ Bürgerinnen und Bürgern werden, gibt es schon länger. Doch die Snowden-Enthüllungen im Jahr 2013 machten die Dimension von Überwachung durch Staaten deutlich. Der frühere US-amerikanische Geheimdienstmitarbeiter Edward Snowden veröffentlichte geheime Informationen, um die Öffentlichkeit über das Ausmaß US-amerikanischer und britischer Programme zur Überwachung der weltweiten Internetkommunikation aufzuklären. Dazu gehörte das sogenannte PRISM-Programm. Es erlaubte den Geheimdiensten den Zugriff auf die Kommunikation im Internet – unter anderem von Anbietern wie Google, Facebook, Microsoft und Apple.

Trotz der Welle des Protests, die diese Veröffentlichung anstieß, herrscht immer noch großes Unwissen. Vielen Internetnutzerinnen und -nutzern ist nicht bewusst, wie ihre Daten im Internet gesammelt werden und wie sie von Unternehmen und staatlichen Stellen genutzt werden.

Außerdem: Manche Preisgabe von Daten lässt sich durch bewusste Internetnutzung verhindern, bei anderen jedoch haben Nutzerinnen und Nutzer keine Wahl. Wenn sich zum Beispiel eine Stadt entscheidet, zur „Smart City“ zu werden und beginnt, umfassende Daten über Bürgerinnen und Bürger zu sammeln, diese zu analysieren und so die Stadt und ihre Bewohnerinnen und Bewohner zu „optimieren“, haben diese meist nur wenig Mitspracherecht.

Personalisierung und Mikrotargeting

Abgesehen von den Risiken in Bezug auf die Privatsphäre hat der digitale Fingerabdruck, den wir im Netz hinterlassen, zahlreiche weitere Auswirkungen. Zwei weitere Problemfelder sind die zunehmende Personalisierung sowie das sogenannte Mikrotargeting.

Ein großer Teil der Inhalte, die wir im Internet zu sehen bekommen, basiert auf Algorithmen – auf Computerprogrammen. Sie wählen automatisch aus der Masse an vorhandenen Inhalten diejenigen aus, die laut der Vorgaben des Programms für uns relevant sind. Zunehmend sind die Ergebnisse dieser automatischen Auswahl personalisiert: die Social Media Posts unserer Freunde, die uns angezeigt werden, die Ergebnisse der Suchmaschine, die wir nutzen, die Werbung, die wir sehen und die Preise, die wir im Internet zahlen, werden individuell für uns angepasst. Jede und jeder sieht andere Ergebnisse und zahlt eventuell einen anderen Preis für Produkte, die im Netz angeboten werden.

Viele kritisieren, dass so jede und jeder das Internet anders erlebt. Das kann außerdem dazu führen, dass wir uns im Netz zunehmend in einer sogenannten Filterblase befinden, in der wir nur auf Meinungen stoßen, die mit unserer eigenen übereinstimmen.

Zudem ermöglicht diese Personalisierung das sogenannte Mikrotargeting. Das ist eine Form des Marketings, bei der Werbetreibende jeder Nutzerin und jedem Nutzer individuell passende Angebote anzeigen. Bei Facebook kann eine Produktwerbung oder auch eine Stellenanzeige zum Beispiel nur weißen und kinderlosen Männern zwischen 30-35 angezeigt werden.

Noch brisanter wird es, wenn diese Technik zur Wahlwerbung verwendet wird, wie beim Brexit-Referendum und der US-Wahl 2016 mit Hilfe der Firma Cambridge Analytica geschehen. Hier wurden zudem Falschinformationen an verschiedene Wählergruppen verbreitet.

Datafizierte Gesellschaft

Unsere Gesellschaft ist zunehmend „datafiziert“: Die Menge der gesammelten Daten wächst, und dies wird zunehmend genutzt. Auch in der „Offline-Welt“ werden immer mehr Entscheidungen auf der Basis von Daten getroffen, die im Internet gesammelt werden.

Big Data-Analysen und darauf basierende Vorhersagen werden bereits in vielen gesellschaftlichen Bereichen verwendet. Damit ist meist die Hoffnung verbunden, effizienter und genauer arbeiten zu können. Beispiele sind die Verwendung vor Gericht, durch die Polizei, im Kreditwesen, Stadtmanagement, Sozialwesen, und durch Versicherungen. So werden zum Beispiel Vorhersagen darüber getroffen, wer krank, straffällig oder arbeitslos werden könnte.

Allerdings ist umstritten, wie effizient diese Systeme wirklich sind. Viele Kritikerinnen und Kritiker weisen darauf hin, dass Daten verzerrt sein und falsche Prognosen liefern können. Neben den Gefahren für die Privatsphäre besteht die Gefahr, dass die Anwendung von Datenanalysen zur Verstärkung bestehender Diskriminierungen führen kann. Zudem wird kritisiert, dass viele Praktiken ohne das Wissen der Bürgerinnen und Bürger angewendet werden und ihre genauen Funktionsweisen häufig geheim bleiben.

Überwachung von allen Seiten?

Außerdem: Selbst, wenn die Nutzung der Daten perfekt funktionieren würden und fehlerfreie Vorhersagen treffen könnte – wollen wir das wirklich? Eine Gesellschaft, in der Staat und Wirtschaft jeden Schritt der Bürgerinnen und Bürger nachvollziehen und sogar vorhersagen können? Und in der private Firmen Einfluss auf jede öffentliche Entscheidung nehmen könnten? Und was, wenn diese Mächte in einem weniger demokratischen Staat wirken können?

Egal ob dieses Szenario eine Utopie oder eher eine Dystopie beschreibt, eins steht fest: In den nächsten Jahren werden datenbasierte Systeme immer mehr Lebensbereiche erobern und zunehmend an Einfluss gewinnen. Zudem sammeln Internetseiten, Apps und all unsere smarten Geräte weiter unermüdlich Daten. Für die Bürgerinnen und Bürger wird es zunehmend schwierig, sich der Datensammlung zu entziehen.

In einer datafizierten Gesellschaft braucht es mündige Bürgerinnen und Bürger, die verstehen wie ihre Daten gesammelt werden, wofür sie verwendet werden und was für kritische Auswirkungen Big Data-Systeme haben können. Internetnutzerinnen und -nutzer müssen lernen, wie sie ihre Daten besser schützen können. Und es ist eine öffentliche Debatte über die Nutzung von Big Data nötig, in der auch Bürgerinnen und Bürger ihre Sicht einbringen können.

Einen ersten Schritt in diese Richtung geht dieses Online-Special Datenkompetenz. Die vorgestellten 11 interaktiven Online-Tools bieten einen Einstieg, um Bürgerinnen und Bürger mehr Verständnis und kritische Reflexion von Big Data-Praktiken zu vermitteln. Zahlreiche weitere vertiefende Ressourcen, Tipps zur digitalen Selbstverteidigung und Materialien für Pädagoginnen und Pädagogen lassen sich zudem in der Linksammlung finden.