@euroedit · @bundesedit · @landesedit

Veröffentlichung anonymer Änderungen von Wikipedia Artikeln aus Bundes- und Landeseinrichtungen sowie aus Europäischen Institutionen

Bei @euroedit, @bundesedit und @landesedit handelt es sich um Twitterbots, die Änderungen an Wikipedia Artikeln durch anonyme Benutzer aus den Netzwerken der jeweiligen Parlaments-, Regierungs- und Landesstellen veröffentlichen.

Die Twitterbots verwenden das Projekt von edsu/anon. Nach dem gleichen Prinzip entstehen weltweit ähnliche Twitterbots wie zum Beispiel @congressedits, @gccaedits oder @rcmp_edits.

Wie es funktioniert

Das System basiert auf der Auswertung des Wikipedia IRC Channels, in dem die Systeme der Wikipedia alle Änderungen an Aritkel automatisiert aufzeichnen. Dieser Datenstream kann hier live verfolgt werden. Alle Änderungen, die nicht durch einen registrierten Benutzer durchgeführt werden, werden mit der IP-Adresse dort veröffentlicht. Diese wird dann mit den hier gepflegten Netzwerken abgegelichen. Sobald es eine Übereinstimmung gibt, wird ein Tweet erzeugt.

Die Daten der Netzwerke sind aus unterschiedlichen Quellen gesammelt und erheben keinen Anspruch auf Vollständigkeit oder Richtigkeit. Wir sind bemüht die Daten aktuell zu halten. Jeder, der etwas dazu beitragen möchte, ist gerne gesehen! Die Listen liegen als OpenData in unserem GitHub-Repository vor und können dort eingesehen werden.

Das System nimmt keinerlei Bewertung vor, die Daten werden direkt verarbeitet. Aktuell werden alle marginalen Änderungen mit einer Differenz von weniger als 10 Zeichen nicht veröffentlicht.

Was aus den veröffentlichten Daten zu lesen ist, kann jeder selbst entscheiden. Das Projekt dient der Förderung der Transparenz im Internet.

FAQ

Wie ist es zu dem Projekt gekommen?

Samstag Abend und ein langweiliges Fußballspiel im Fernsehen. Nebenbei in Blogs gelesen und dann bei Nerdcore diesen Artikel gefunden. Alle Bausteine in weniger als 30 Minuten zusammengesetzt und schon war der Bot am laufen. Anschließend eine Vollzugsmeldung als Blogkommentar eingesetzt. Das war's.

Es gibt doch so viele Schlupflöcher…

Richtig. Der Bot veröffentlich nur anonyme Änderungen in der Wikipedia. Wer als registrierter Benutzer die Änderungen durchführt oder das ganze von Zuhause macht bleibt unentdeckt. Das Problem der anonymen Änderungen ist, dass man mit dem Bearbeiter nicht mehr in Kontakt treten kann. Registrierte Benutzer haben bei der Wikipedia eine eigene Seite und man kann sich mit ihnen über ihre Änderungen gezielt austauschen.

Ach wenn die nur richtige Admins hätten, würden sie Proxies, Tor oder ähnliche Technologien verwenden!

Wir glauben nicht, dass man den Institutionen unterstellen kann, dass da keine gewissenhaften Admins arbeiten. Aber das Thema ist leider sehr komplex. Einfache Systeme wie dieses hier lassen sich leicht aushebeln. Keine Frage – aber bei diesen Äußerungen schwingt ja immer mit, dass wenn man es nur richtig machen würde, man immer anonym bleiben würde.

Einzelne Proxies, wie sie zum Beispiel das BSI scheinbar für einige Ministerien betreibt (siehe unten), haben das gleiche Problem wie das Ausgangsnetz auch: Am Ende gibt es eine (oder mehrere) IP-Adressen und die sind jemandem, also einer Firma, einer Organisation oder einer Privatperson zugeordnet. Anonyme Adressbereiche gibt es nicht. Jetzt kann man argumentieren, dass die IP-Adresse eines Hosters oder Tier-1 Providers unverfänglicher sind. Doch wie lange würde so etwas verborgen bleiben? Und dann? Jetzt kann man mit wechselnden IP-Adressen weiter argumentieren usw. Die Diskussion endet nie, wird bei großen Einrichtungen immer komplizierter und verdeutlicht, dass es nicht mit einer einfachen, technischen Antwort erledigt ist. Dies zeigt schon das Tor-Projekt sehr eindrücklich. Man braucht schon sehr viel mehr Know-how.

Auch bei Tor wissen wir mittlerweile, dass es unter bestimmten Umständen De-Anonymisierungsmöglichkeiten gibt. Ein noch viel spannenderer Vortrag erwartet uns dazu bei der BlackHat 2014, wenn die Ankündigungen stimmen.

Um jeden einzelen Privatmenschen im Netz zu de-anonymisieren wird sich der Aufwand wahrscheinlich nicht lohnen. Aber um an das "Bewegungsprofil" von Mitarbeitern einer Regierungsbehörde zu kommen wahrscheinlich schon. Egal ob aus wirtschaftlichen Interessen (zum Beispiel Manipulation von Ergebnissen bei Suchmaschinenanfragen) oder anderweitiger Interessen.

…aber warum dann das Ganze?

Wir möchten nur einen ganz kleinen Beitrag zu etwas mehr Transparenz leisten. Klar kann man das ganze System umgehen. Wir möchten dabei gerne zwei Dinge erreichen:

Zum einen wollen wir natürlich dem Staat und seinen Vertretern deutlich machen, dass nicht nur sie uns als Bürger in jeder Lebenslage beobachten können, sondern – auch wenn nur in einem sehr begrenzten Maße – dies auch umgekehrt möglich ist. Wir wollen ein Schild hoch halten: "Wir können auch hinschauen!"

Zum anderen wünschen wir uns etwas mehr Aufmerksamkeit auf die Versionsgeschichte von Artikeln lenken zu können. Gerade im journalistischen Bereich sollte man sich die Änderungen, und insbesondere wer hinter diesen Änderungen steckt, anschauen bevor man diese Informationen verwendet.

Welche Erkenntnisse werden erwartet?

Am Anfang erwarteten wir zwei Dinge: Zum einen natürlich Änderungen die in irgendeiner Weise manipulativ sind. Das wären negative Beispiele. Zum anderen aber auch positive Beispiele, bei denen die Fachkompetenz der Mitarbeiter in die Wikipedia einfließt. Es gibt immer beide Seiten und es wäre schön, wenn das Positive überwiegen würde.
Was wir nicht erwartet haben: Die massenhafte Änderung von Rechtschreibfehlern in Artikeln. Das hat uns tatsächlich selbst überrascht.

Vergrault man damit nicht das lobenswerte Engagement einzelner?

Nein, das denken wir nicht. Denn wir fänden es super, wenn die Mitarbeiter ihr Wissen in die Wikipedia einfließen lassen würden. Davon hat die Allgemeinheit etwas und das möchten wir nicht behindern. Wir denken auch, dass die Follower dieses unterscheiden können. Wenn jemand etwas positives zu einem Artikel während seiner Arbeitszeit beiträgt, wird niemand von "Haben die nichts besseres zu tun?" reden. Und wenn sich ein Mitarbeiter tatsächlich langweilt (warum auch immer) und dann Wikipedia Artikel korrigiert, ist die Zeit dort vielleicht besser investiert als sinnlos im Internet zu surfen.

Wäre es nicht sinnvoller gewesen, wenn man kritische Änderungen aus der Vergangenheit zusammengestellt hätte?

Ja, das ist richtig. Dies ist aber sehr aufwändig und für die Vergangenheit nur in einem begrenzten Rahmen möglich. Es gab ein entsprechendes Projekt namens WikiScanner, von dem es aktuell keinerlei online verfügbare Version gibt (Stand Juli 2014). Wir überlegen jedoch einen entsprechenden Service wieder zur Verfügung zu stellen.

Könnt ihr nicht einfach nur die echten Skandale veröffentlichen?

Skandale aufzudecken ist zuerst mal gar nicht unsere Intension (siehe oben). Wir bieten nur ein Werkzeug an. Es handelt sich um Bots. Eine Bewertung all dieser Informationen übersteigt unsere Fähigkeiten bei weitem. Dies überlassen wir lieber den Profis aus Wissenschaft und Journalismus. Wir sind nur Techies.

Jetzt, wo alle davon wissen, wird es ja wohl keine kritischen Änderungen aus den Netzen der Bundesregierung mehr geben.

Mag sein, dass man sich jetzt zurück hält, wo das Thema durch die Presse geht. Aber irgendwann ist das wieder vergessen, die Bots laufen aber weiter.

Warum taucht das BSI so häufig auf?

Dank der Recherche von sueddeutsche.de wurde eine von uns schon von Anfang an bestehende Vermutung bestätigt: Das BSI betreibt scheinbar für eine ganze Reihe von Ministerien und Einrichtungen einen zentralen Internetzugang. Daher kann hier das BSI überdurchschnittlich häufig auftauchen. Trotzdem kann man den Listen entnehmen, dass nicht alles über das BSI geht.

Warum eigentlich getrennte Twitter-Accounts?

Das ist nur aus der sehr kurzen Historie heraus entstanden. Zunächst gab es nur @bundesedit und wir wollten den Namen beibehalten und trotzdem noch @landesedit und @euroedit hinzufügen. So kann jeder nur dem folgen, was ihn persönlich interessiert. Außerdem ist @euroedit in Englisch während @bundesedit und @landesedit in Deutsch tweeten.

Skandal, ihr speichert IP-Adressen!

Nein tun wir nicht. Wir lesen in einem Stream mit, vergleichen die dortigen Informationen live mit unseren Listen und erzeugen einen Tweet. Wir speichern nirgends selbst IP-Adressen. Die Listen der Netze und deren Zugehörigkeit zu Firmen/ Organisationen sind von jedem auch an anderen Stellen im Netz einsehbar und nicht personenbezogen. Eine Zuordnung zu einzelnen Personen ist nicht möglich. Zumindest nicht für uns. Wir verzichten auch auf die Veröffentlichung im Tweet. Trotzdem sind die Daten in der Wikipedia für jeden einsehbar.

Okay, trotzdem Skandal! Denn die Wikipedia speichert IP-Adressen!

Hier können wir nur mutmaßen: Die Klassifizierung der IP-Adresse als personenbezogene Information ist in der überwiegenden Zahl der Ländern nicht gegeben. Die Server und der Sitz der Wikipedia sind in Amerika. Daher gehen wir davon aus, dass hier kein deutsches Recht gilt und somit die Wikipedia dieses tun kann. Aber das ist nur eine Mutmaßung. Wir sind jedenfalls froh, dass es diese Form der Transparenz gibt.

Ich habe Verbesserungsvorschläge...

Immer her damit! Entweder einfach per Twitter bei uns melden oder im GitHub-Repository ein Issue erzeugen.

Updates

Aus den zahlreichen Anfragen die an uns gestellt wurden haben wir diese Informationsseite gebaut. Wir werden diese weiter pflegen. Wir hoffen damit die meisten Fragen schon beantworten zu können. Wenn nicht, freuen wir uns über weitere.

Heute ist auch @euroedit mit seinen ersten Tweets an den Start gegangen.

Die Twitteraccounts zu @landesedit und @euroedit sind fertig eingerichtet und die Bots laufen ohne zu veröffentlichen. Wir sind noch auf der Recherche nach den richtigen IP Adressbereichen.

Wir haben ein #rechtschreibgate! Nach dem wir das Netz der Bundeswehr hinzugefügt haben, wird der Channel mit Rechtschreibkorrekturen geflutet. Wir sind gezwungen einen Filter einzubauen, der marginale Änderungen nicht mehr veröffentlich.

Wir erweitern das System noch um @landesedit und @euroedit. Beides auf Wunsch von Followern.

Seit heute hat @bundesedit nun ein eigenes Logo und ein passendes Design. Wir haben Hinweise auf weitere Netze bekommen. Danke an alle die uns unterstützen!

Wir wollen das System nicht nur auf den Bundestag beschränken. Wir erhalten auf Grund des Kommentars bei Nerdcore bereits Infos zu weiteren Netzwerken und recherchieren eigene. Wir wollen transparent sein und erzeugen das GitHub Repository in dem wir die Listen pflegen und damit öffentlich einsehbar machen.

Nach dem Aufruf bei Nerdcore wurde das System für @bundesedit innerhalb kürzester Zeit zum Laufen gebracht. Zunächste wird nur der Bundestag beobachtet. Es folgt der initiale Kommentar unter dem Artikel.

Impressum