Das Bundesamt für Migration und Flüchtlinge ist eine überforderte Behörde. Als im Jahr 2015 viele Menschen in Deutschland Schutz suchten, kam das Amt bei der Bearbeitung der Anträge nicht hinterher und wurde mithilfe mehrerer Unternehmensberatungen auf Effizienz getrimmt. Den Mitarbeitern, die entscheiden sollen, wer abgeschoben wird und wer nicht, wurden Vorgaben gemacht: 3,5 Entscheidungen sollen sie pro Tag treffen oder 3 Anhörungen von Antragstellern durchführen. Für einen Menschen ist das zeitlich eigentlich nicht zu schaffen. Doch die Führung des BAMF glaubt, eine bombensichere Lösung zu kennen: “Innovative Technologien” heißt die Zauberformel.
Im Vorfeld der Bundestagswahl 2017 hat die Behörde vier neue IT-Verfahren eingeführt und viel Technik an ihren über 60 Standorten installiert. Die Hardware- und Software-Tools sollen den Entscheidern bei einer zentralen Frage des Asylverfahrens helfen: Wer ist der Geflüchtete und woher kommt er?
Videos by VICE
Die IT-Tools brauchen teilweise nur wenige Minuten, dann sollen sie eine Antwort liefern. Mit 63 Prozent Wahrscheinlichkeit türkischsprachig, steht dann zum Beispiel auf einem Auswertungsbogen. Es werden Gesichtsfotos abgeglichen, Sprachaufnahmen analysiert, die Handys der Geflüchteten ausgewertet und Schreibweisen von Namen vereinheitlicht. Doch obwohl die Technik viele Millionen Euro gekostet hat, wird sie an manchen BAMF-Standorten kaum eingesetzt und funktioniert längst nicht so gut wie das BAMF öffentlich gerne behauptet. Das zeigen Recherchen von Welt und Motherboard.
Erst diese Woche ging der ehemalige IT-Leiter des BAMF, Markus Richter, der mittlerweile zum Vizechef der Behörde aufgestiegen ist, auf mediale Werbetour für die IT-Systeme. Gegenüber den Zeitungen der Funke Mediengruppe nennt Richter erstaunlich hohe Einsatzzahlen der Systeme. Richter spricht zum Beispiel von 19.000 durchgeführten Sprachauswertungen, das klingt nach einem oft eingesetzten, hilfreichen Tool. Richter bezeichnet das BAMF als einen “der absoluten Digitalisierungstreiber im gesamten öffentlichen Raum”.
Doch was Richter über den Nutzen der Technik im Alltag der Asylentscheidungen sagt, ist höchstens die halbe Wahrheit. Die Anzahl der nützlichen Ergebnisse der IT-Analysen, die wirklich in den Akten der Asylsuchenden landeten, ist in Wirklichkeit viel geringer. Seit die Hardware- und Software-Systeme im Jahr 2017 in Betrieb genommen wurden, steht die Frage im Raum, wie sinnvoll die IT-Strategie wirklich ist. Bisher nicht öffentliche interne Dokumente und neue vom Innenministerium erhobene Auswertungen zeichnen ein umfassendes Bild davon, wie wenig Dialektanalyse, Handyauswertung und Namenstranskription der Behörde wirklich bringen.
Die detaillierte Handyauswertung hilft in fast keinem Verfahren wirklich weiter
Das wohl bekannteste IT-Tool des BAMF ist die Handyauswertung. Dazu liest ein Hardware- und Software-System die Smartphones der Geflüchteten aus und analysiert Textnachrichten, gewählte Rufnummern, Standortdaten oder Adressbuch. Am Ende kommt ein Bericht heraus, der etwas über die Herkunft und Identität des Geflüchteten verraten soll.
Eine Antwort auf eine Kleine Anfrage, die die Linken-Abgeordnete Ulla Jelpke gestellt hat und die Motherboard und Welt vorliegt, zeigt nun, wie teuer die Handyauswertung inzwischen für das BAMF und Horst Seehofers Innenministerium geworden ist. Insgesamt kostet das Programm die Behörde bis 2019 voraussichtlich 11,2 Millionen Euro. Das sind noch einmal mehr als drei Millionen extra zu den bisher bis Ende 2018 veranschlagten 7,6 Millionen. Vor der Anschaffung hatte das BAMF noch geschätzt, zunächst nur 3,2 Millionen für das IT-System ausgeben zu müssen.
Die Anzahl der ausgelesenen Handys erscheint vor dem Hintergrund dieser Millionenbeträge eher gering: 9.710 Handys seien in diesem Jahr zwischen Januar und Ende Oktober ausgelesen und ein Ergebnisbericht erstellt worden. In 3.439 weiteren Fällen sei das Auslesen gescheitert. Das liege vor allem an nicht kompatiblen oder fehlenden USB-Anschlüssen an den Handys. Besonders ältere Handys würden dem BAMF Probleme bereiten, sagt das Bundesinnenministerium.
Der BAMF-Vizechef führt die Öffentlichkeit mit hohen Zahlen in die Irre
Diese vom BAMF selbst erfassten Zahlen widersprechen den angeblich 27.000 ausgelesenen Geräten von September 2017 bis heute, von denen BAMF-Vize Richter gegenüber der Funke Mediengruppe berichtete. Die Linken-Abgeordnete Ulla Jelpke wundert sich über die unterschiedlichen Zahlen. Sie finde es “erstaunlich, dass der Vizepräsident des BAMF offenbar von ganz anderen Informationen ausgeht als das Bundesinnenministerium”, das die Kleine Anfrage von Jelpke beantwortet hat. “Was stimmt denn nun?”, sagt sie gegenüber Motherboard.
“Die Handyauswertung trägt kaum dazu bei, falsche Identitäten aufzudecken.”
In den Antworten auf die Kleine Anfrage hält sich das Bundesinnenministerium eine Hintertür offen, um abweichende Zahlen erklären zu können. Die Daten, die sie in der Kleinen Anfrage angibt, könnten “unterzeichnet” sein, heißt es dort. Auf Nachfragen von Motherboard zu diesen Widersprüchen antwortete eine Pressesprecherin des BAMF, die Angabe von 27.000 Geräten beziehe sich “auf die technischen Auslesevorgänge”. Die Zahlen aus der Antwort des Bundesinnenministeriums dagegen würden sich auf das Auslesen und das folgende Erstellen eines Ergebnisberichts beziehen. Die dafür relevanten Zahlen würden “aus dem Asylverfahren gewonnen”, so das BAMF.
Die detaillierten und nach den verschiedenen Dienststellen und Monaten sortierten Daten in der Antwort auf die Kleine Anfrage spiegeln offenbar möglichst genau die tatsächliche Aktenlage aller Geflüchteter wieder. Die Zahlen, die Richter im Interview nennt, klingen eher nach jenen Daten, die sich aufgrund der Zählweise für eine IT-Erfolgsgeschichte eignen.
Um zu bewerten, wie nützlich die Handyauswertung des BAMF ist, ist jedoch nicht die Anzahl der ausgelesenen Geräte relevant, sondern der Anteil der Fälle, in denen die BAMF-Mitarbeiter überhaupt ein Ergebnis der Smartphone-Auswertung zu sehen bekommen. Das passierte in 2.845 Fällen. Diese Zahl ist deshalb geringer als die Zahl der ausgelesenen Geräte, weil ein Jurist in jedem Einzelfall freigeben muss, dass die Handy-Auswertung für den Asylantrag genutzt werden darf. Die Anzahl der “verwertbaren Ergebnisse” dieser freigegebenen Auswertung ist dann noch einmal viel geringer, sie liegt bei 35 Prozent.
Doch wie oft helfen die Handy-Analysen den BAMF-Mitarbeitern überhaupt herauszufinden, wenn ein Geflüchteter lügt und behauptet, aus einem anderen Herkunftsland als seiner tatsächlichen Heimat ist zu kommen? Wie häufig konnte die Auswertung also beispielsweise einem Geflüchteten, der behauptete aus Syrien zu stammen, nachweisen, dass er eigentlich aus der Türkei kommt?
Wenn ihr Informationen über die IT-Systeme des BAMF habt oder selbst davon betroffen seid, könnt ihr die Autorin per E-Mail kontaktieren . Motherboard wird auch in Zukunft weiter zu dem Thema recherchieren und berichten.
Laut den nun veröffentlichten Zahlen des BAMF passierte dies in diesem Jahr in nur zwei Prozent der tatsächlich in Asylanträgen verwendeten Handyauswertungen. Das entspricht hochgerechnet weniger als 60 Fällen. Eine für das BAMF ziemlich unangenehme Zahl. Schließlich investiert die Behörde auch deshalb seit zwei Jahren massiv in die IT-Systeme, um herauszufinden, ob Geflüchtete falsche Angaben über ihre Herkunft machen.
Die linke Bundestagsabgeordnete Ulla Jelpke findet, dass der erhebliche Eingriff in die Privatsphäre der Geflüchteten und der Nutzen in keinem Verhältnis stehen: “Die Handyauswertung trägt kaum dazu bei, falsche Identitäten aufzudecken”, sagte sie gegenüber Motherboard. “Diese massenhafte Verletzung des Rechts auf informationelle Selbstbestimmung ist vollkommen unverhältnismäßig.”
Die Antwort des Innenministeriums offenbart auch erstmals, welche Firmen das BAMF für seine Systeme testete: Bei 585.480 Euro teuren Tests probierte die Asylbehörde nicht nur, wie bisher bekannt, Technik von MSAB aus, sondern auch von den Wiener Forensikern T3K und von der umstrittenen, israelischen Firma Cellebrite.
Das Unternehmen ist bekannt als bester iPhone-Knacker der Welt und verkauft seine Technologie auch an Staaten, die damit Regimegegner ausspionieren und verfolgen. Am Ende fiel die Wahl auf MSAB, Geräte knacken will das BAMF aber nach eigenen Aussagen nicht, die Geflüchteten müssen laut einer Dienstanweisung ihre Geräte eigenständig entsperren.
Dialektanalyse: Zwei Minuten, die zum Problem werden können
Ein weiteres problematisches System ist die sogenannte Sprachbiometrie, die das BAMF bis zum Jahr 2019 etwa zwei Millionen Euro kosten wird: Ein Geflüchteter spricht in einen Telefonhörer und soll zwei Minuten lang ein Bild beschreiben. Danach: Rautetaste drücken und den Ergebnisbericht abwarten. Darauf finden sich Prozentangaben zu den wahrscheinlichsten Dialekten, die der Schutzsuchende spricht. Die Software soll auch Antragsteller überführen, die ihre Sprache verstellen, um ein Herkunftsland vorzutäuschen.
Laut aktuellen Angaben des Innenministeriums wurde die Sprachanalyse seit der bundesweiten Einführung im September 2017 bis Mitte November 2018 insgesamt 6.284 Mal eingesetzt. Das widerspricht wieder früheren Zahlen, in denen die Bundesregierung noch sagte, die Software sei bis April 2018 bereits 9.883 Mal genutzt worden. Wie bereits bei der Handyauswertung sagt das Innenministerium, die Zahlen könnten “unterzeichnet” sein und seien “nur bedingt mit früheren Auskünften” vergleichbar.
Unklar ist, wie oft die Sprachanalysen wirklich wesentliche Hinweise zur Herkunft Geflüchteter gebracht haben. Bei den Fällen, in denen dies aus den Asylakten ablesbar sei, gibt das Innenministerium an, dass die Sprachauswertung in rund 80 Prozent der Fälle die Angaben des Antragstellers bestätigt hätte.
Das Problem beim Sprachanalyseprogramm ist vor allem, dass die Software zu häufig eine falsche Antwort auf die Frage liefert, woher jemand kommt. Das musste zum Beispiel der vor dem IS geflohene Kurde Hajar aus dem Irak erleben, über den Motherboard vor einigen Monaten berichtete. Weil der Computer mit 63-prozentiger Wahrscheinlichkeit sagte, er spreche türkisch, wurde sein Asylantrag abgelehnt. Mit 22-prozentiger Wahrscheinlichkeit könnte er auch Hebräisch sprechen, sagte die Software. “Hebräisch, was ist das?”, sagte Hajar damals nur, als er seinen Auswertungsbogen in der Akte sah. Dass er tatsächlich Kurde ist, hätte die Software niemals erkennen können, denn sie kannte den Dialekt nicht, den Hajar spricht. Obwohl Hajars andere Angaben bestätigten, dass er aus den kurdischen Autonomiegebieten im Irak kam, sollte er kein Asyl bekommen.
Die Fehlerquote der Software liegt derzeit laut BAMF bei 15 Prozent, sie hänge aber von der Qualität des Sprachmodells ab – und die schwankt. Levantinisches Arabisch, das unter anderem in Syrien und Jordanien gesprochen wird, werde in 90 Prozent der Fälle richtig erkannt. Quoten für andere Dialekte gibt das Innenministerium nicht an. Die Qualität von Spracherkennungen hängt von der Anzahl der vorhandenen Sprachproben ab, insgesamt 8.000 sollen es für die großen arabischen Dialekte sein. Nach Informationen von Motherboard kennt die Software im Gegensatz zu anderen arabischen Dialekten ein Vielfaches von arabisch-levantinischen Sprachproben. Dementsprechend sind Asylsuchende aus solchen anderen Regionen einem höheren Risiko ausgesetzt, dass die Software falsch liegt. Eine Fehlerquote von 15 Prozent mag wenig klingen, ist in der Realität jedoch sehr hoch. Eine solche Quote betrifft tausende Geflüchtete und droht, ihre Anträge zu verfälschen und ihr Asyl zu gefährden.
Dazu kommt, dass BAMF-Mitarbeiter offenbar manchmal mit der Software und ihren Ergebnissen überfordert sind: In vorherigen Recherchen stieß Motherboard auf Fälle, in denen die Sprachaufnahmen nicht zwei Minuten lang waren, sondern gerade einmal 20 Sekunden gedauert haben. Dennoch wurden sie als Hinweis im Asylverfahren berücksichtigt.
BAMF-interne Schulungsunterlagen, die Motherboard vorliegen, erklären zwar ausführlich, auf welche Knöpfchen die Mitarbeiter drücken müssen – zur Interpretation der Ergebnisse enthält die Präsentation jedoch fast keine Hinweise. Zu den Qualitätsangaben der Sprachanalyse sagen die Folien sogar: “nicht relevant”. Ab welcher Prozentzahl die Entscheider auf die Aussagekraft der Software vertrauen können: keine verschriftlichten Informationen. Das kann dazu führen, dass Entscheider auch eine Wahrscheinlichkeit von 60 Prozent als stichhaltigen Hinweis interpretieren könnten, obwohl die Aussagekraft einem Würfelwurf gleicht. Für Schulungs- und Qualifizierungsmaßnahmen, die alle neuen IT-Tools betreffen, gab das BAMF im Jahr 2017 zusätzlich 180.000 Euro aus.
Eine wissenschaftliche Begleitung des Programms könnte helfen. Doch es gibt sie immer noch nicht, obwohl sie bereits im Jahr 2017 angekündigt wurde. Eine vormals erwähnte Zusammenarbeit mit der University of Pennsylvania hat sich mittlerweile als Beschaffungsmaßnahme herausgestellt, bei der für 3.700 Euro ein Arabisch-Levantinisches Sprachpaket gekauft wurde.
Name und Gesicht sollen die Identifizierung sicherstellen
Eines der Tools kommt bei jedem zum Einsatz, der in Deutschland Schutz sucht: die sogenannte Bildbiometrie. Dabei wird ein biometrisches Bild der Asylsuchenden aufgenommen und mit bereits registrierten Antragstellern verglichen. Das System soll die schon zuvor eingesetzten Fingerabdruck-Vergleiche ergänzen und helfen, Mehrfachregistrierungen zu erkennen. Bild und Fingerabdrücke werden dann auf den Chips der Elektronischen Aufenthaltstitel gespeichert. Bei arabischsprachigen Antragstellern nutzt das BAMF zusätzlich TraLitA, kurz für: Transliterationsassistent. Er soll dafür sorgen, dass Namen immer auf die gleiche Art und Weise in lateinische Schrift übertragen werden. Damit will das BAMF vermeiden, dass Antragsteller mehrmals im System auftauchen, weil die Transkription nicht immer einheitlich erfolgt ist. Doch nicht nur das: Die Software soll auch Hinweise darauf geben, wie üblich der Name im angegebenen Herkunftsland ist.
Zu Beginn testete das BAMF eine Software der Firma “The Rhythm Section”, die jedoch ab Juli 2017 nicht mehr genutzt wurde. Die Entscheidung fiel zugunsten der Firma SVA, deren Software konnte aus einem bestehenden Rahmenvertrag abgerufen werden. Die Auswertung sieht dann laut einer Dienstanweisung des BAMF zum Beispiel so aus: “Der Name kommt im angegebenen Land Afghanistan selten vor. In den Ländern Algerien und Marokko kommt er hingegen häufiger vor.” Menschen mit einem untypischen Namen werden sich dann erklären müssen, doch die Angaben stellen laut BAMF “lediglich ein Indiz dar und haben keine Beweiskraft”. Dennoch rufen sie zunächst Zweifel hervor.
Ebenfalls auf Motherboard: Wie ein Hacker Motorola ihren geheimen Quellcode abschwatzte
Laut BAMF-Vize Markus Richter habe das BAMF für die Software “alle Telefonbücher des arabischen Raums ausgewertet”. Aus der Antwort des Innenministeriums geht hervor, dass das System mit etwa einer Milliarde Namen aus der ganzen Welt gefüttert wurde. Bei den arabischen Namen, für die sich das BAMF interessiert, sind es aber wesentlich weniger: “20.000 reelle Namen” pro Herkunftsland seien enthalten.
Auch hier sieht die Bilanz der IT-Systeme also nicht so rosig aus, wie es auf den ersten Blick wirkt. Denn hinzu kommt, dass die Qualität der Ergebnisse immens schwankt: Während bei Syrern oder Irakern Erfolgsquoten von 85 bis 90 Prozent erreicht würden, seien es bei den Maghreb-Staaten – Mauretanien, Algerien, Tunesien, Libyen, Marokko und Westsahara – nur noch 35 Prozent. Schließlich hätte die Namensauswertung in einem Viertel aller Fälle, in denen die Software eingesetzt wurde, die Angaben der Asylsuchenden gestützt, bei 34 Prozent habe es Widersprüche gegeben, beim Rest seien die Ergebnisse nicht verifizierbar oder ohne Ergebnis geblieben.
Für diese Software hat das BAMF eine Menge Geld ausgegeben: 248.668 Euro für den Test der Software von The Rhythm Section, 10.115 Euro für den Test des SVA-Produkts, auf das letztlich die Auswahl fiel. Dazu kamen Lizenzen, Weiterentwicklung und Support. Inklusive der geplanten Weiterentwicklung bis 2019 sollen für den Betrieb etwa 3,1 Millionen Euro zusammenkommen, sagt das Innenministerium.
Fazit: Die Software vermittelt trügerische Sicherheit
Immer wieder betont das BAMF: Die Ergebnisse der Software seien ein Indiz unter vielen. Die Asylentscheidung falle in der Gesamtschau aller Angaben. Doch es besteht die Gefahr, dass sich Entscheider auf die Prozentzahlen verlassen; sie vermitteln Objektivität und Korrektheit. In früheren Recherchen haben wir Menschen getroffen, denen das zum Verhängnis wurde und deren Asylanträge in Gefahr waren. Khalil, ein syrischer Palästinenser, dem die Sprachauswertung unterstellt hat, er käme aus Ägypten, hat sich dagegen gewehrt – mit Erfolg. Am Ende musste das BAMF einsehen, dass seine Angaben glaubwürdiger waren als ein fragwürdiges Software-Ergebnis. Doch angesichts des Zeitdrucks ist für die BAMF-Mitarbeiter die Verführung offensichtlich in manchen Fällen zu groß, sich bei ihrer Entscheidung auf die IT-Systeme zu verlassen.
Eine fundierte Überprüfung der Systeme ist beinahe unmöglich: Widersprüchliche Statistiken, fehlende wissenschaftliche Begleitung und intransparente Algorithmen machen es unmöglich festzustellen, ob die Systeme dem BAMF irgendetwas bringen. Trotz der Millioneninvestitionen in die IT-Innovationen bleibt die Technologie eine Black Box, deren Nutzen unabhängig kaum überprüft wird. BAMF und Innenministerium verkaufen die Systeme trotzdem als Erfolg. Ulla Jelpke kann das nicht verstehen: “Die IT-Assistenzsysteme sind fehleranfällig, verursachen hohe Kosten und greifen in Grundrechte ein. Wie die Bundesregierung hier von einem Erfolg sprechen kann, ist mir schleierhaft.”
Folgt Anna auf Twitter und Motherboard auf Facebook , Instagram , Snapchat und Twitter