Gestapo-Archiv vs. heutige Datenbanken

Heute habe ich bei Phoenix kurz einen Ausschnitt über ein Archiv mit Gestapo-Karteikarten gesehen (in der Sendung „Die Gestapo„, Teil 1/3, Samstag 4.7.2009 14:00-14:45). Wenn ich richtig gehört habe war die Rede von 1.5 Millionen Karteikarten von Verdächtigen. Ein ganzer Keller voll verfahrbarer Archivschränke (mit Rad an der Seite zum Verschieben). Wenn man einfach mal so eine Zahl hört, denkt man sich „viel“, ist aber nicht so wirklich beeindruckt. Erst wenn man so ein Archiv sieht, wird einem klar, wie viel das ist.

Als ich den Beitrag gesehen habe, ist es mir kalt den Rücken heruntergelaufen. Jedoch nicht wegen der Abscheulichkeiten, die die Gestapo unter anderem mit Hilfe dieser Akten durchgeführt hat. Sondern, weil mir schlagartig klar wurde, wie das heute aussehen würde. So ein riesiger Archivkeller ist schwer nach Einträgen mit bestimmten Kriterien zu durchsuchen wenn man nicht genau nach dem Kriterium sucht, nach dem die Karten sortiert sind. Man müsste jede Karte einzeln herausnehmen, anschauen und wieder zurücklegen. Ein abartiger Aufwand, man wundert sich, wie es überhaupt möglich war, mit sowas zu arbeiten.

Heute hingegen würde es anders aussehen. Eine microSD(HC)-Speicherkarte ist kleiner als ein Daumennagel und kann z. B. 8 GB speichern. Wieder eine leere Zahl unter der man sich schwer was vorstellen kann. Deswegen drücken wir die doch mal so aus: Das sind 8 Millionen mal ein Kilobyte. Ein Kilobyte (KB) dürfte locker ausreichen, um die Informationen auf so einer Karteikarte zu speichern, wenn man das Bild und die Fingerabdrücke weglässt, also nur den reinen Text speichert. Zum Vergleich: Dieser Artikeltext entspricht ca. 7 KB. 8 Millionen kann man sich vielleicht besser vorstellen, wenn man an „10% der deutschen Bevölkerung“ denkt. Mit etwas Kompression lässt sich das natürlich noch deutlich optimieren. Nebenbei erwähnt, dürften die Kosten für das Papier der Gestapo-„Datenbank“ die Kosten für eine der genanten Speicherkarten natürlich bei weitem übersteigen.

Die microSD-Karte habe ich nur wegen ihrer geringen Größe erwähnt. In der Praxis werden natürlich Festplatten eingesetzt, die wesentlich mehr Speicherplatz bieten. Auf einer einzigen handels- und haushaltsüblichen Festplatte mit 1,5 TB Kapazität könnte man zu jedem Bürger Deutschlands etwa 18 KB speichern. Genug für eine sehr große Menge Text oder einige Seiten Text und ein Passbild in durchaus brauchbarer Qualität!

Der wichtigste Faktor ist jedoch nicht, wie viel Archivraum eine solche Datenbank verbraucht oder welche Kosten für das Material entstehen. Eine elektronische Datenbank kann man durchsuchen. Würde sich heute jemand entscheiden, z. B. alle Nichtchristen einer Stadt beseitigen zu wollen, würde ihm der Computer des Finanzamts die gewünschten Informationen so schnell liefern wie der angeschlossene Drucker das Papier durchziehen kann. Mit Adressen, selbstverständlich.

Eine weitere Gefahr von Datenbanken ist die Verknüpfung. Bereits die Gestapo benutzte das, was in der IT heutzutage unter „relationaler Datenbank“ verstanden wird: Die Karteikarten enthalten Verweise auf weitere Akten. Wenn die Gestapo z. B. die Strafakte einer Person einsehen wollte, musste zunächst die Karteikarte herausgesucht werden, dort stand, wo man die Strafakte findet. Das funktioniert bei computerbasierten Datenbanken genauso, und bis auf den einfacheren (Massen-)Zugriff gibt es zunächst keine großen Unterschiede. Bei Papierdatenbanken konnte man jedoch nur Bezüge herstellen, die von Anfang an vorgesehen waren. Der Auftrag „finde alle Leute, die schonmal wegen Flugblättern auffällig wurden und mehr als ein inzwischen verbotenes Buch bestellt haben“ wäre ziemlich schwer umzusetzen gewesen. Heutzutage ist das eine Sache von einem Arbeitstag für eine IT-Fachkraft.

Eine weitere Gefahr ist der Diebstahl von Daten. Unbemerkt mal eben die Gestapo-Kartei zu kopieren und die Kopien mitzunehmen wäre undenkbar. Eine heutige Datenbank hingegen, auf die man einmal kurz Zugriff hat, kann innerhalb von Stunden (bei sehr umfangreichen Datenbanken) auf einen USB-Stick, eine externe Festplatte oder vielleicht sogar auf eine der erwähnten fingernagelgroßen handelsüblichen microSD-Karten kopiert werden. In vielen Fällen dürfte das nicht einmal bemerkt werden.

Die Gefahren werden dadurch verstärkt, dass heutzutage über alles und jeden Daten gespeichert werden. Webshops speichern oft nicht nur, welche Bücher man kauft, sondern auch, welche man angesehen hat, Videoportale speichern welche Videos der Nutzer angesehen hat, Social Networking-Plattformen erstellen (wie der Name schon sagt, obwohl die wenigsten sich das klar machen) Abbildungen von sozialen Netzen, also Bindungen zwischen Menschen. Einzeln mögen die Datenbanken harmlos erscheinen. Verknüpt stellen sie eine große Gefahr dar. Man stelle sich beispielsweise eine Verknüpfung der Amazon-Daten mit den StudiVZ-Daten vor – schon bekommt man nicht nur eine Antwort auf „wer beschäftigt sich mit politisch kritischen Büchern“, sondern auch „wer kennt auffällig viele Leute die sich mit solchen Büchern beschäftigen“. Und das sind noch eher harmlose Beispiele, die auf richtiges Data Mining verzichten – es geht noch deutlich schlimmer, feine (Verhaltens-)Muster, die von Menschen nie wahrgenommen würden, können recht einfach ermittelt werden.

Nicht vergessen sollte man natürlich auch, dass allein schon in den offiziell öffentlich bekannten Datenbanken der Ermittlungsbehörden unglaubliche Datenhalden schlummern, die nur darauf warten, zu beliebigen Zwecken verwendet zu werden. Was an Datenbanken bei Geheimdiensten und nicht öffentlich bekannten Datenbanken bei Ermittlungsbehörden existiert, will ich glaube ich lieber gar nicht erst wissen.

Ich denke, jetzt wird deutlich, warum gerade Informatiker und sonstige IT-affine Personen gegen viele neue, tolle Technologien sind, obwohl man das Gegenteil erwarten würde. Sie kennen die Möglichkeiten und die Gefahren nur zu gut.

Fest steht, dass wenn (nicht „falls“, leider) irgendwann eine neue Diktatur mit „Stasi 2.0“ oder „Gestapo 2.0“ entsteht, diese durch die neuen Möglichkeiten unglaublich viel schlimmer wird als alles, was wir bisher erlebt haben. Es dürfte sehr, sehr lange dauern, bis sie gebrochen werden kann. Und wenn es einmal soweit ist, wird die Nachwelt wenig von den Datenbanken erfahren. Die Stasi hat versucht, ihre Unterlagen zu vernichten, was aufgrund der gigantischen Menge zum Glück nicht gelang. Während einmal öffentliche Daten nur sehr schwer restlos zu tilgen sind, dürfte eine zentrale, geheime, nur einem beschränkten Personenkreis zugängliche Datenbank bei Bedarf innerhalb von Minuten zuverlässig zerstört sein, beispielsweise indem der Verschlüsselungsschlüssel gelöscht wird. Es werden zwar vermutlich Spuren wie die Bezeichnungen von Datenfeldern zu retten sein, vom wahren Umfang des Inhalts wird die Öffentlichkeit jedoch nie etwas mitbekommen.

UPDATE: Die Auswirkungen der neuen Technologien kann man schön im Iran beobachten. Nachdem sie zunächst eher den Demonstranten genutzt haben, wendet sich jetzt das Blatt, und die social networks nutzen den Geheimdiensten und werden Demonstranten zum Verhängnis.

  1. fabiank22
    2009-07-05 um 18:04 UTC

    Ähmm:

    8kb x 1024 x 1024 = 8.388.608

    Bei 8 Terabyte krieg ich da nochmal ein bisschen was geschenkt: 8,589,934,592

    Und eine moderne Terabyte-Platte kostet derzeit 80€, tendenz fallend. Mit 8000€(und ein paar Zerquetschten für die restiliche Hardware und Strom) kann ich mir also einen 100Terabyte-Server aufsetzen und damit also knapp 1,irgendwas MB für jeden Bundesbürger speichern. Das reicht nicht nur für Bewegungsprofil und Passfoto, da krieg ich auch noch ein paar High-Quality-Satellitenfotos von Personen und Häusern dazu.

    Wir brauchen endlich funktionierende Datenschutzgesetze!

  2. Jan
    2009-07-05 um 18:35 UTC

    @2 (fabiank22): Wie kommst du auf 8 TB? Ich hatte einmal die microSD-Karte mit 8 Gigabyte erwähnt und einmal die Festplatten mit 1,5TB. Oder willst du nur auf die 1000 vs. 1024-Problematik hinweisen? Dann bedenke bitte, dass „Terabyte“ (TB) 1000^4 Byte sind und nicht 1024^4, das nennt sich TiB… (Ich halte auch wenig davon, ist aber so.) Im Artikel gehts aber eh um Größenordnungen, sodass es auf die Abweichungen eh nicht ankommt.

    Flash-Speicher wird zwar in den 1024-er-Einheiten gemessen, dafür geht aber wieder Platz für Verwaltungsinfos, Spare-Blöcke etc. verloren.

  3. fabiank22
    2009-07-05 um 19:22 UTC

    Hmm… ja, schein mein Fehler zu sein, ich hab die traditionelle Binärweise intus :D Und das mit den 8 TB war nur noch eine Erweiterung des Beispiels.

    „Although most manufacturers of hard disk drives and flash-memory disk devices define 1 gigabyte as 1000000000bytes, the computer operating systems used by most users usually calculate size in gigabytes by dividing the total capacity in bytes (whether it is disk capacity, file size, or system RAM) by 1073741824. This distinction can be a cause of confusion, as a hard disk with a manufacturer-rated capacity of 400 gigabytes may be reported by the operating system as only 372 GB large, depending on the type of report. The JEDEC memory standards uses the IEEE 100 nomenclatures which defines a gigabyte as 1073741824bytes.“

    http://en.wikipedia.org/wiki/Gigabyte

    „However, a possible confusion arises from a conflict between the long-standing tradition of using binary prefixes and base 2 for memory sizes, and the decimal (SI) standard adopted widely both within and outside of the computer industry. Standards organizations such as IEC, IEEE and ISO recommend to use the alternative term tebibyte to signify the traditional measure of 10244 bytes, or 1024 gibibytes, leading to the following definitions:

    * According to the SI standard usage, 1 terabyte (TB) equals 1000000000000bytes = 10004 or 1012 bytes.
    * Using the traditional binary interpretation, a terabyte is 1099511627776bytes = 10244 or 240 bytes = 1 tebibyte (TiB).“

    http://en.wikipedia.org/wiki/Terabyte

  4. Anonymous
    2010-09-02 um 12:20 UTC

    schwachsinn

  1. 2009-07-05 um 08:26 UTC

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: