Elf Millionen Dokumente auf einen Blick
Wenn Journalisten in den Panama Papers Daten-Ordner der Anwaltskanzlei Mossack Fonseca öffnen, ist keiner wie der andere. In dem einen befindet sich kein einziges Dokument, im nächsten dann 200. Zwei Mails oder doch mehrere Tausend. Und vielleicht noch eine Datenbank.
Die Panama Papers bestehen aus zwei Ebenen. Sie enthalten auf der ersten Ebene die Namen von rund 214.000 Offshore-Firmen sowie die Namen von Personen, die offiziell als Anteilseigner oder Eigentümer gelten – eine Art kanzlei-internes Register. Dieses Register hat das das International Consortium of Investigative Journalists (ICIJ) in einer eigenen Datenbank zum Leak veröffentlicht. Darüber hinaus gibt es aber eine weiterführende Ebene - und die haben wir visualisiert.
Was die Grafik zeigt
Insgesamt 11,5 Millionen Originaldokumente wie E-Mails, Urkunden oder Passkopien stehen im Zusammenhang mit den gelisteten Firmen. Sie liegen in rund 260.000 Verzeichnissen und lassen sich in sechs Gruppen einordnen: E-Mails, Textdokumente, PDF-Dokumente, Bilder, Datenbanken und sonstige Dateien. In der Grafik bedeutet das: Jedes Verzeichnis besteht aus kleinen Quadraten. Jedes Quadrat steht für einen der Datentypen. Je intensiver die Farbe, desto mehr Dateien dieses Typs befinden sich in einem Verzeichnis.Es ergibt sich ein Bild, das einem Störbild in Zeiten des analogen Fernsehens gleicht.
Ein Beispiel: Die Firmen, die das Netzwerk um Sergej Roldugin, den russischen Musiker mit dem engen Draht zu Russlands Präsidenten Wladimir Putin, bilden, tauchen in fünf der rund 260.000 Ordner auf. Datenanalysten sprechen in solchen Fällen gerne davon, dass sie das Signal im Rauschen suchen. Im Fall der Panama Papers halfen dabei Programme wie Nuix. Die Software bringt die Daten in eine maschinenlesbare und vor allem leicht durchsuchbare Form.
Versuchen Sie selbst, in diesem Störbild die Verzeichnisse zu finden, die zum sogenannten Roldugin-Netzwerk gehören. Es ist fast unmöglich.