Wenn wir digital kommunizieren und digitale Artefakte (Fotos, Videos, Suchverläufe, E-Mails etc.) herstellen, werden neben den Daten dieser Artefakte und Kommunikation immer auch weitere Daten produziert, sogenannte Metadaten. Diese “Daten über Daten” werden aufgezeichnet und ausgewertet. Z. B. kann man mit Smartwatches den eigenen Puls und Bewegungen tracken. Aus diesen Informationen wird dann ein Gesundheitsprofil erstellt, das immer auf dem neuesten Stand ist und uns helfen soll, auf unsere Gesundheit zu achten. Dieselben Daten sind aber auch für andere interessant, z. B. für Krankenversicherungen, die damit das Krankheitsrisiko ihrer Versicherten abschätzen wollen. In der EU ist der Handel von Gesundheitsdaten zwar verboten, aber es gibt immer wieder Leaks, durch die sensible Daten in Umlauf kommen. Das Geschäft mit Daten und Metadaten nennt man die Datenwirtschaft.
In diesen kontinuierlich fließenden, von uns kaum zu beeinflussenden, Datenströmen wird über Daten ein Bild von uns gezeichnet, das wir nie zu sehen bekommen: wir werden durch Daten sichtbar.
Der Künstler Simon Weckert hat 2007 ein Wägelchen voller Smartphones (99 Stück) langsam eine Berliner Straße entlang gezogen. Google Maps hat die Bewegung dieser Smartphones registriert – und als Stau interpretiert. Die Straße wurde darum auf Google Maps als Stau markiert, was wiederum den Verkehr auf die umliegenden Straßen umleitete. (Video)
Dieses Beispiel zeigt, wie Daten funktionieren: sie bilden zwar etwas ab, aber sie stehen nicht für die Realität. Und dieser Zwischenraum ist wichtig, denn in ihm lebt sowohl der Witz von Simon Weckert, als auch die politische Dimension von Daten.
Datensätze sind die Basis der Datenauswertung. Nur was erfasst wurde, kann für eine Auswertung benutzt werden.
Wir erstellen einen Datensatz auf der Basis der Fotografien auf eurem Smartphone.
Die Teilnehmenden schauen sich auf ihrem persönlichen Smartphone ihre letzten 30 Fotos an, die in der Galerie gespeichert sind.
Danach werden alle analogen Datensätze der Teilnehmenden nebeneinandergelegt. Wir haben jetzt ein “big data” Dataset von [Anz. TN] Quellen mit je 30 Datenpunkten. Wir haben diese individuell aufgezeichnet, und werten diese nun als Gruppe aus.
Daten werden immer statistisch ausgewertet. Darum interessieren uns jetzt nicht die Fotos, sondern nur die Statistik über die Fotos.
Bei der Auswertung geht es darum, Muster in der Gesamtheit der Datensätze zu erkennen.
Das Erstellen von Profilen ist eine weitere Methode, wie Unternehmen und Institutionen versuchen uns durch das Sammeln und Auswerten von Daten zu beschreiben.
Profile werden erstellt, um uns interessante Dinge vorzuschlagen, z.B. von Suchmaschinen, Plattformen wie Spotify und Netflix, und natürlich auch von Social Media.
Wie geht dies genau? Wir probieren das aus.
Wir machen ein Profil von uns auf der Basis der 30 letzten Fotos.
Geht noch einmal alle eure Fotos auf euren Smartphones durch, die ihr für Aufgabe 1 benutzt habt, und ordnet diese in 5 Gruppen beziehungsweise Kategorien ein. Die Gruppen könnt ihr selbst bestimmen. Es können inhaltliche Gruppen (z.B. “Freunde”, “Ausflug”, “Schule”), aber auch formale Gruppen sein (“Selfie”, “Notiz”), oder sich an etwas orientieren, das euch wichtig ist.
Du siehst jetzt, welche Kategorien in deinem Datensatz am meisten vorkommen.
Vielleicht hast du eine Kategorie, die du auch noch gerne verwendet hättest, aber die es doch nicht unter die ersten 5 geschafft hat? Trage diese ebenfalls noch ein.
Zum Abschluss noch eine künstlerische Arbeit, die das ganze Thema nochmal umdreht, und Daten auf eine berührende und menschliche Art “auswertet”:
Bild: Eva & Franco Mattes: Hannah Uncut (2021)
Eva & Franco Mattes: Hannah Uncut (2021)
#Data, #Mobile, #Photography
Das Künstler*innen-Duo hat ein Mobiltelefon einer Privatperson gekauft, um die darauf vorhandenen Fotos zu nutzen. Sie haben damit ein Video-Portrait in Form einer Slideshow mit Musik gestaltet. Dabei haben sie keine Fotos verändert oder gelöscht, sondern nur die Anzeigedauer variiert. (Video-Auszug)
Der Workshop besteht aus zwei praktischen Teilen mit jeweils rund 30 Min. Dauer und einem Abschlussteil, der die Themen nochmal zusammenfasst und zurückführt auf die Ausgangslage. Jeder Teil beinhaltet eine kurze Reflektion und Diskussion im Plenum.
Hier folgen genauere Informationen zur Führung des Ablaufes und zur Leitung der Diskussionen.
Als Einführung kann das Video “Google Street Map Hack” des Berliner Künstler Simon Weckert gezeigt werden.
Diese Arbeit zeigt exemplarisch, wie Daten funktionieren: sie bilden zwar etwas ab, aber sie stehen nicht für die Realität.
Dieser Workshop will diesen Zwischenraum erkunden. Wie wird aus Daten Bedeutung? Und was passiert in diesem Schritt alles, was geht unter, vergessen, wird nicht mitgenommen? Wo liegt der Unterschied zwischen den Begriffen „Daten“ und „Informationen“?
In diesem Workshop werden wir ein eigenes kleines Datenset erstellen und untersuchen, was dieses Datenset für Rückschlüsse über uns erlaubt. Genauso werden wir aber auch untersuchen, wo die Grenzen sind, und welche Probleme sich sowohl in den Rückschlüssen, als auch in den blinden Flecken der Datenerfassung verstecken.
Als erstes ist es wichtig, zwischen verschiedenen Arten von Daten zu unterscheiden
Daten: Das können Dateien auf unseren Geräten sein, z.B. Fotos, aber auch Mitteilungen in SMS oder Messenger, Posts auf Social Media. Daten sind der Inhalt dieser Dinge: also die Bildinformation des Fotos, die Buchstabenfolge der Nachricht.
Metadaten hingegen sind Daten über Daten: z.B. der Zeitpunkt der Aufnahme des Fotos, der Zeitpunkt des Verschickens der SMS, die Länge des Telefonats, der Adressat der Nachricht. Metadaten entstehen über den Kontext der Handlung, sie sind nicht die Handlung selbst. Und: Metadaten können wir sehr viel weniger kontrollieren als Daten. Je nach Gerät, System und verwendeten Programmen werden unterschiedliche Metadaten aufgezeichnet und mitgespeichert. Beim Versenden einer Datei werden diese Metadaten immer mitgeschickt. Das heißt, wenn man ein Foto auf einer App teilt, dann hat diese App Zugriff auf alle Metatdaten. Im Bild z. B. weiß die App jetzt, welches Mobiltelefon ich verwende (Samsung SM-A5260).
Große Teile der Datenwirtschaft operieren mit Metadaten, die aufgezeichnet, in sogenannten Datasets gespeichert, vereinheitlicht, angereichert und ausgewertet werden.
Im ersten Teil des Workshops sammeln wir exemplarisch Metadaten und erstellen daraus einen Datensatz.
Jede*r Teilnehmer*in erstellt einen sehr kleinen Datensatz über die letzten 30 Fotos, die in seiner*ihrer Smartphone-Galerie gespeichert sind (Falls nicht alle Teilnehmenden Smartphones besitzen oder jemand nicht mit den eigenen Daten arbeiten möchte, kann die Workshop-Leitung auch im Voraus Beispieldatensätze erstellen, mit denen anstelle gearbeitet werden kann).
Anschließend werden diese individuellen Datensätze zu einem “big data” Datensatz zusammengeführt und ausgewertet.
Beispiele der Auswertung:
Beispiel A:
Muster: Es gibt zwei Gruppen von Datensätzen: die eine Gruppe hat 30 Fotos in 3 oder wenigen Tagen gemacht, die andere Gruppe hat wenig Fotos über viele Tage verteilt. Die meisten sind in der ersten Gruppe.
Schluss: User*innen lassen sich in 2 Kategorien einteilen:
1) Viel-Fotografierer*innen
2) Gelegenheitsfotografierer*innen
Ein*e durschnittliche User*in ist ein Vielfotografierer*in.
Beispiel B:
Muster: Es gibt eine Häufung von Fotografien an Wochenenden.
Interpretation: Menschen haben an den Wochenenden frei. Sie verbringen ihre Zeit mit Familie und Freund*innen, und fotografieren diese Aktivitäten.
Schluss: Auf den Fotos sind Familie und Freunde, das soziale Umfeld der Fotografierenden zu sehen.
Kategorien:
1) Soziale Fotografierer*innen
2) allgemeine Fotografierer*innen
Im ersten Teil ging es um eine vergleichende Auswertung der individuellen Datensätze im Vergleich zu einer Gruppe. Dagegen geht es im zweiten Teil um die Interpretation der Daten innerhalb eines einzelnen Datensatzes. Profiling ist eine Art automatischer Charakterisierung durch die Interpretation einzelner Datensätze.
In der Diskussion sollte darauf hingearbeitet werden, dass Kategorien nicht von denen bestimmt werden, welche Daten zur Verfügung stellen, sondern von denen, die Daten nutzen wollen.
Nachfragen: was sind gute Kategorien für
Bekannte Probleme mit diesen Algorithmen sind:
Zum Abschluss schauen wir ein Video der italienischen Künstler*in Eva und Franco Mattes, in dem sie die Fotos einer jungen Frau als Diashow zeigen. Nach dem Video gehen wir der Frage nach, was wir als Menschen in den Fotos sehen. Wer ist Hannah? Und wie fühlen wir uns von unseren Daten gesehen?
Der Künstler zeichnet die Aufnahmen von offenen ungesicherten Kameras im öffentlichen Raum auf und durchsucht Social Media nach Fotos, die mit deren geografischen Standort und Zeitraum der Aufzeichnung übereinstimmen, und schneidet dann den Teil der Aufnahme heraus, der die Entstehung des Fotos dokumentiert.
Wenn sehr viele Datenquellen verbunden werden, können vielfältige Informationen gewonnen werden.
Der Künstler verwendet machine learning- Systeme, um vorherzusagen, wo die nächsten Finanzverbrechen in den USA begangen werden. Dieser Vorgang von automatisierter Vorhersage von Verbrechen ist das Prinzip von „Predictive Policing“ (vorausschauende Polizeiarbeit) – Systemen, die auch von der Stadtpolizei Zürich eingesetzt werden. Die gängigen Systeme erfassen vor allem Kleinkriminalität aufgrund ihrer Häufigkeit und führen oft zu zunehmender Überwachung von bereits benachteiligten Stadtvierteln. Der Künstler kehrt diese Logik mit seiner App um, und mit dem Fokus auf hohe Deliktsummen statt der Menge an Delikten erscheint der Finanzdistrikt in Manhattan als Hochrisikozone – ein völlig ungewohntes Bild.
Die Künstlerin fragt, welche Datensätze eigentlich im gesellschaftlichen Leben fehlen. Sie spricht damit an, dass nur bestimmte Daten erhoben werden, und oft der Einfachheit halber einfach alles zur Verfügung Stehende ausgewertet wird, ohne dass nachgefragt wird, was man eigentlich zu welchem Zweck wissen möchte.
Die Künstlerin legt darum in dieser Arbeit einen Aktenschrank für fehlende Datensätze an: von Gewehrregistrationen bis zu nicht-erfassten Toten durch Umweltkatastrophen. Sie macht dadurch sichtbar, wie viel wir nicht wissen, und wirft damit auch die Frage auf, warum wir das nicht wissen.
Die Künstlerin nimmt Fotografien aus ihrem Familienarchiv und stellt sie neben Fotos, die durch den Google-Algorithmus als “ähnlich” klassifiziert wurden. Ursprünglich eine Webseite, ist es nun als Video dokumentiert und zeigt auf sehr poetische Weise die Eigenheiten algorithmischer Bildklassifizierung.
FB Demetricator:
https://bengrosser.com/projects/facebook-demetricator/
Twitter Demetricator:
https://bengrosser.com/projects/twitter-demetricator/
Instagram Demetricator:
https://bengrosser.com/projects/instagram-demetricator/
Der Künstler Ben Grosser programmiert kleine Browser-Erweiterungen, welche die Zahlenangaben von Interaktionen wie zum Beispiel Likes ausblenden. Er kritisiert damit das andauernde Zählen und dadurch implizite Bewerten von sozialer Interaktion und den daraus entstehenden psychologische Stress. Wenn alles gezählt wird, wird alles vergleichbar und bekommt dadurch implizit eine Wertung. Der Künstler weiß, dass die Plugins das Zählen selber nicht verhindern, und auch den Algorithmus nicht verändern, aber er möchte die eigene Wahrnehmung schützen: vor der Annahme, dass Posts mit hohen Zahlen wichtiger sind als andere, und vor dem Stress, das eigene Verhalten auf Reaktionen hin optimieren zu müssen.
Ein Arbeitsbuch zu digitaler Privatsphäre, Sicherheit, Zufriedenheit und Falschinformation speziell für junge Menschen, entwickelt vom Berliner Aktivistenkollektiv Tactical Tech.
Es eignet sich sehr gut zur Nachbearbeitung des Moduls. Mit diesem Guide können Jugendliche ihre Geräte, Einstellungen und ihr Verhalten selbständig überprüfen und ggf. korrigieren. Es gibt auf jeden Fall ein gutes Gefühl, dass man etwas tun kann.
Ingo Dachwitz: Das sind 650.000 Kategorien, in die uns die Online-Werbeindustrie einsortiert, Netzpolitik, 2023
Der Webcomic erklärt anschaulich, wie Daten über unser Online-Verhalten von Apps gesammelt werden, anhand des Chrome Browsers.
(gibt es auch als PDF in deutsch)
Sehr unterhaltsame Erläuterungen, wie der Datenmarkt funktioniert (nur englisch).
Bei https://mobilsicher.de gibt es jede Menge Informationen zu Daten, Apps und Überwachung.
Tracking: https://mobilsicher.de/ratgeber/tracking-im-internet-cookies-cache-co
Identifier: https://mobilsicher.de/ratgeber/was-sind-identifier-android
Metadaten: https://mobilsicher.de/ratgeber/was-sind-metadaten
Berechtigungen: https://appcheck.mobilsicher.de/berechtigungen
Erweiterung / Nachbearbeitung
Zur Nachbearbeitung kann das DataDetoxKit Youth von Tactical Tech verwendet werden.
Ein Arbeitsbuch zu digitaler Privatsphäre, Sicherheit, Zufriedenheit und Falschinformation speziell für junge Menschen, entwickelt vom Berliner Aktivistenkollektiv Tactical Tech.
Mit diesem Guide können Jugendliche ihre Geräte, Einstellungen und ihr Verhalten selbständig überprüfen und ggf. korrigieren.
Grimme Forschungskongress, AIA (Awareness in Art) Zürich als Teil des Vermittlungsangebotes für Schulen.