Archiv

Posts Tagged ‘data-mining’

Gestapo-Archiv vs. heutige Datenbanken

2009-07-04 5 Kommentare

Heute habe ich bei Phoenix kurz einen Ausschnitt über ein Archiv mit Gestapo-Karteikarten gesehen (in der Sendung „Die Gestapo„, Teil 1/3, Samstag 4.7.2009 14:00-14:45). Wenn ich richtig gehört habe war die Rede von 1.5 Millionen Karteikarten von Verdächtigen. Ein ganzer Keller voll verfahrbarer Archivschränke (mit Rad an der Seite zum Verschieben). Wenn man einfach mal so eine Zahl hört, denkt man sich „viel“, ist aber nicht so wirklich beeindruckt. Erst wenn man so ein Archiv sieht, wird einem klar, wie viel das ist.

Als ich den Beitrag gesehen habe, ist es mir kalt den Rücken heruntergelaufen. Jedoch nicht wegen der Abscheulichkeiten, die die Gestapo unter anderem mit Hilfe dieser Akten durchgeführt hat. Sondern, weil mir schlagartig klar wurde, wie das heute aussehen würde. So ein riesiger Archivkeller ist schwer nach Einträgen mit bestimmten Kriterien zu durchsuchen wenn man nicht genau nach dem Kriterium sucht, nach dem die Karten sortiert sind. Man müsste jede Karte einzeln herausnehmen, anschauen und wieder zurücklegen. Ein abartiger Aufwand, man wundert sich, wie es überhaupt möglich war, mit sowas zu arbeiten.

Heute hingegen würde es anders aussehen. Eine microSD(HC)-Speicherkarte ist kleiner als ein Daumennagel und kann z. B. 8 GB speichern. Wieder eine leere Zahl unter der man sich schwer was vorstellen kann. Deswegen drücken wir die doch mal so aus: Das sind 8 Millionen mal ein Kilobyte. Ein Kilobyte (KB) dürfte locker ausreichen, um die Informationen auf so einer Karteikarte zu speichern, wenn man das Bild und die Fingerabdrücke weglässt, also nur den reinen Text speichert. Zum Vergleich: Dieser Artikeltext entspricht ca. 7 KB. 8 Millionen kann man sich vielleicht besser vorstellen, wenn man an „10% der deutschen Bevölkerung“ denkt. Mit etwas Kompression lässt sich das natürlich noch deutlich optimieren. Nebenbei erwähnt, dürften die Kosten für das Papier der Gestapo-„Datenbank“ die Kosten für eine der genanten Speicherkarten natürlich bei weitem übersteigen.

Die microSD-Karte habe ich nur wegen ihrer geringen Größe erwähnt. In der Praxis werden natürlich Festplatten eingesetzt, die wesentlich mehr Speicherplatz bieten. Auf einer einzigen handels- und haushaltsüblichen Festplatte mit 1,5 TB Kapazität könnte man zu jedem Bürger Deutschlands etwa 18 KB speichern. Genug für eine sehr große Menge Text oder einige Seiten Text und ein Passbild in durchaus brauchbarer Qualität!

Der wichtigste Faktor ist jedoch nicht, wie viel Archivraum eine solche Datenbank verbraucht oder welche Kosten für das Material entstehen. Eine elektronische Datenbank kann man durchsuchen. Würde sich heute jemand entscheiden, z. B. alle Nichtchristen einer Stadt beseitigen zu wollen, würde ihm der Computer des Finanzamts die gewünschten Informationen so schnell liefern wie der angeschlossene Drucker das Papier durchziehen kann. Mit Adressen, selbstverständlich.

Eine weitere Gefahr von Datenbanken ist die Verknüpfung. Bereits die Gestapo benutzte das, was in der IT heutzutage unter „relationaler Datenbank“ verstanden wird: Die Karteikarten enthalten Verweise auf weitere Akten. Wenn die Gestapo z. B. die Strafakte einer Person einsehen wollte, musste zunächst die Karteikarte herausgesucht werden, dort stand, wo man die Strafakte findet. Das funktioniert bei computerbasierten Datenbanken genauso, und bis auf den einfacheren (Massen-)Zugriff gibt es zunächst keine großen Unterschiede. Bei Papierdatenbanken konnte man jedoch nur Bezüge herstellen, die von Anfang an vorgesehen waren. Der Auftrag „finde alle Leute, die schonmal wegen Flugblättern auffällig wurden und mehr als ein inzwischen verbotenes Buch bestellt haben“ wäre ziemlich schwer umzusetzen gewesen. Heutzutage ist das eine Sache von einem Arbeitstag für eine IT-Fachkraft.

Eine weitere Gefahr ist der Diebstahl von Daten. Unbemerkt mal eben die Gestapo-Kartei zu kopieren und die Kopien mitzunehmen wäre undenkbar. Eine heutige Datenbank hingegen, auf die man einmal kurz Zugriff hat, kann innerhalb von Stunden (bei sehr umfangreichen Datenbanken) auf einen USB-Stick, eine externe Festplatte oder vielleicht sogar auf eine der erwähnten fingernagelgroßen handelsüblichen microSD-Karten kopiert werden. In vielen Fällen dürfte das nicht einmal bemerkt werden.

Die Gefahren werden dadurch verstärkt, dass heutzutage über alles und jeden Daten gespeichert werden. Webshops speichern oft nicht nur, welche Bücher man kauft, sondern auch, welche man angesehen hat, Videoportale speichern welche Videos der Nutzer angesehen hat, Social Networking-Plattformen erstellen (wie der Name schon sagt, obwohl die wenigsten sich das klar machen) Abbildungen von sozialen Netzen, also Bindungen zwischen Menschen. Einzeln mögen die Datenbanken harmlos erscheinen. Verknüpt stellen sie eine große Gefahr dar. Man stelle sich beispielsweise eine Verknüpfung der Amazon-Daten mit den StudiVZ-Daten vor – schon bekommt man nicht nur eine Antwort auf „wer beschäftigt sich mit politisch kritischen Büchern“, sondern auch „wer kennt auffällig viele Leute die sich mit solchen Büchern beschäftigen“. Und das sind noch eher harmlose Beispiele, die auf richtiges Data Mining verzichten – es geht noch deutlich schlimmer, feine (Verhaltens-)Muster, die von Menschen nie wahrgenommen würden, können recht einfach ermittelt werden.

Nicht vergessen sollte man natürlich auch, dass allein schon in den offiziell öffentlich bekannten Datenbanken der Ermittlungsbehörden unglaubliche Datenhalden schlummern, die nur darauf warten, zu beliebigen Zwecken verwendet zu werden. Was an Datenbanken bei Geheimdiensten und nicht öffentlich bekannten Datenbanken bei Ermittlungsbehörden existiert, will ich glaube ich lieber gar nicht erst wissen.

Ich denke, jetzt wird deutlich, warum gerade Informatiker und sonstige IT-affine Personen gegen viele neue, tolle Technologien sind, obwohl man das Gegenteil erwarten würde. Sie kennen die Möglichkeiten und die Gefahren nur zu gut.

Fest steht, dass wenn (nicht „falls“, leider) irgendwann eine neue Diktatur mit „Stasi 2.0“ oder „Gestapo 2.0“ entsteht, diese durch die neuen Möglichkeiten unglaublich viel schlimmer wird als alles, was wir bisher erlebt haben. Es dürfte sehr, sehr lange dauern, bis sie gebrochen werden kann. Und wenn es einmal soweit ist, wird die Nachwelt wenig von den Datenbanken erfahren. Die Stasi hat versucht, ihre Unterlagen zu vernichten, was aufgrund der gigantischen Menge zum Glück nicht gelang. Während einmal öffentliche Daten nur sehr schwer restlos zu tilgen sind, dürfte eine zentrale, geheime, nur einem beschränkten Personenkreis zugängliche Datenbank bei Bedarf innerhalb von Minuten zuverlässig zerstört sein, beispielsweise indem der Verschlüsselungsschlüssel gelöscht wird. Es werden zwar vermutlich Spuren wie die Bezeichnungen von Datenfeldern zu retten sein, vom wahren Umfang des Inhalts wird die Öffentlichkeit jedoch nie etwas mitbekommen.

UPDATE: Die Auswirkungen der neuen Technologien kann man schön im Iran beobachten. Nachdem sie zunächst eher den Demonstranten genutzt haben, wendet sich jetzt das Blatt, und die social networks nutzen den Geheimdiensten und werden Demonstranten zum Verhängnis.

Über technischen Datenschutz

2007-10-08 3 Kommentare

Um eine Ausweitung von Überwachung und der Verwendung personenbezogener Daten zu behindern, sollte technischer Datenschutz in folgender Form vorgeschrieben sein:

Alle Systeme, sowohl im privaten als auch im behördlichen Bereich, die personenbezogene Daten verarbeiten, müssen so ausgelegt sein, dass sie für derzeit nicht erlaubte Nutzung von Daten (z. B. Zusammenführung, Auswertung, unbefugter Zugriff) nicht mit vertretbarem Aufwand benutzt werden können – selbst wenn diese Sicherheitsmaßnahmen zusätzliche Kosten verursachen und Nebenwirkungen wie schlechte Erweiterbarkeit zur Folge haben. (Bisher tendieren derartige Schutzvorschriften dazu, „Ausnahmen“ zuzulassen, wenn solche Maßnahmen zusätzliche Kosten verursachen würden, wobei meist die Ausnahme zur Regel und somit der Schutz wirkungslos wird.) Das hieße also nicht nur ein Verbot, ein System gezielt auf Erweiterbarkeit im Bezug auf Data-Mining auszulegen, sondern sogar, eine solche Erweiterbarkeit gezielt aktiv (z. B. durch eine entsprechende Struktur der Datenbanken, an den dafür wichtigen Stellen hart im Programmcode verankerte Systeme usw.) zu behindern. Das würde verhindern, dass durch die Schaffung von eigentlich wünschenswerten Systemen gleichzeitig potenzielle Totalüberwachungsmöglichkeiten geschaffen werden. Denn wenn Schäuble nur einen Knopf drücken muss, um alle Mautdaten für die Fahndung zu verwenden, wird er eher dazu geneigt sein, als wenn dazu das gesamte System teuer quasi komplett ersetzt werden müsste. Ja, so etwas würde die Kosten bei der Verarbeitung personenbezogener Daten stark steigern – umso besser, wenn sich Datensammelei nicht mehr lohnt, ist das auch ein weiterer Schritt zum Datenschutz.

Ich plane, auf Basis dieser Idee eine Petition zu erstellen und beim Petitionsausschuss des Deutschen Bundestags einzureichen. Ideen, Vorschläge, Kommentare und so weiter sind deswegen äußerst willkommen! Insbesondere interessant wären konkrete Entwürfe, wie man z. B. das Mautsystem, Statistiksysteme und ähnliche interessante Anwendungen entsprechend dieser Richtlinien entwerfen könnte.

Mischmasch 13 – leider schon wieder

2007-09-30 3 Kommentare

Eigentlich wollte ich keine Mischmasch-Postings mehr schreiben, aber ich komm nicht dazu, endlich eine ordentliche Lösung für Links einzurichten und will dennoch auf einige Sachen hinweisen, die nicht die öffentliche Aufmerksamkeit bekommen, die sie eigentlich meiner Meinung nach verdienen würden. Viel zu sagen gibt es dazu aber meist nicht. Ich wiedehole: Dieses Blog ist keine Linksammlung, eine solche werde ich einrichten, wenn Zeit, Geld und Lust es zulassen. Ich will mich in Zukunft eher tieferen Analysen widmen, einges ist in Vorbereitung (warum die CDU verfassungswidrig ist, warum Stasi 2.0/Diktatur etc. in Deutschland immer noch leicht möglich ist, und mehr).

Erstmal ein Aufruf – Mahnwache gegen Überwachungsstaat:
Mahnwache gegen Überwachung, Frankfurt am Main, Konstablerwache, Dienstag 2. Oktober 19 Uhr
Auch in anderen Städten (Berlin, Dortmund, Dresden, Hannover, Juist und Wetzlar) gibt es Mahnwachen gegen die Überwachung.

Es gibt bereits konkrete Pläne zum Data-Mining in den Daten aus der Vorratsdatenspeicherung (obwohl sowas natürlich nieeeee mit den Daten gemacht wird, sie sind nuuuur zur Terrorbekämpfung und werden nur in Einzelfällen und unter streeengsten Auflagen benutzt blah blah blah…). Gulli bringt es auf den Punkt, Futurezone hat einen ausführlichen Artikel.

Das BSI hat wohl gegen den Hackerparagraphen verstoßen und wurde daher angezeigt. Wird interessant.

Wie die Stasi (Version 1.0) sich darauf vorbereitet hat, über 10000 kritische Bürger bei „Bedarf“ zu isolieren. (UPDATE: Link scheinbar kaputt, neuer Link) Und das war nur auf dem Gebiet der DDR. Die BRD ist deutlich größer. Darf ich darauf hinweisen, dass auf der (übrigens entgegen der Absprachen) gründlich überwachten Anti-Überwachungsdemo je nach Angaben „nur“ 10-15 tausend Teilnehmer waren und die Onlinepetition für den Rücktritt Schäubles ca. 5000 Teilnehmer, mit Namen und Adressen, hat?

Wer sich auf der BKA-Seite über die Militante Gruppe informiert, ist Terrorist. Die IPs der Besucher wurden registriert und über den Provider soll die Identität der Besucher herausgefunden werden. In Zukunft könnte man also wahrscheinlich dafür, dass man sich informiert, eine Hausdurchsuchung abbekommen, und nicht „nur“ wenn man Worte benutzt, die auch in Bekennerschreiben dieser Gruppe vorkommen. Hier sieht man auch gut, wozu die Vorratsdatenspeicherung führt, denn nichts anderes ist das hier (die Rechtmäßigkeit sollte mal geprüft werden). Mal abgesehen davon steigert so eine Aktion das Vertrauen in offizielle Websites nicht gerade. Behörden können von mir absolut keine freiwillige Kooperation/Hilfe mehr erwarten, da sie jegliches Vertrauen verspielt haben.

Wie schlecht man von Hartz 4 leben kann, berichtet ein Blogeintrag einer Frau, die davon selbst betroffen war. Kurzzusammenfassung: Kein Platz mehr für Moral und Ehrlichkeit, keine gesunde Ernährung möglich, keine ordentliche Gesundheitsversorgung, viele nötige Sachen einfach nicht bezahlbar, man wird wie Scheiße behandelt, ein „Job“ als Versuchskaninchen wird interessant. Mal ganz abgesehen von den entwürdigenden 1-EUR-Jobs, die ich für verfassungswidrige Zwangsarbeit halte.

Die CIA verbietet offiziell Waterboarding. Daraus schließe ich, dass es bisher erlaubt war. Menschenrechte – was ist das, kann man das essen?

Und wer eine „falsche“ Meinung hat, kommt in ein Umerziehungslager.

Auf Arbeitsplätzen (und in Spielhallen) dürfen in der Regel 26° C nicht überschritten werden. In den Räumen (hessischer) Gymnasien sind 40 Grad allerdings offenbar kein Problem, Hitzefrei gibt es in der Oberstufe nicht mehr. [Sarkasmus] Bei der Temperatur macht Mathematikunterricht richtig Spaß, da kann man sich so richtig gut auf schwierige Formeln konzentrieren. [/Sarkasmus]