Zur unendlichen infrastrukturellen Reichweite eines Phonems

Essay
04.04.2019

Zur unendlichen infrastrukturellen Reichweite eines Phonems

Ein Telefon ist ein vertrautes Gerät. Damals wie heute verbinden wir das Telefon mit Zuhause und der Möglichkeit, aus der Ferne miteinander zu sprechen. Es ermöglicht, unsere Stimmen reisen zu lassen, Gedanken zu teilen und Geschichten zu erzählen. Doch was geschieht, wenn am anderen Ende der Leitung kein Mensch zuhört, sondern eine Software? Was verändert sich, wenn ein Telefon zu einer affektiven Infrastruktur wird, die Menschen durch Dialekterkennung Asyl gewährt oder verwehrt? Mit diesen Fragen beschäftigt sich J. S. Vieira Oliveira im folgenden Beitrag. Er verhandelt, wie das Triviale und Vertraute zu einer Waffe gemacht werden kann, um Gefühle auszulösen, Dialekte hervorzurufen und schließlich über den Verlauf von Leben zu entscheiden.

 

Lasst uns mit einer Frage beginnen: Welche Worte, Szenen, Formen regen uns dazu an, nach dem Telefon zu greifen und zu Hause anzurufen?

Ein Telefon kann ein gewisses Gefühl der Vertrautheit hervorrufen. Wir haben uns sogar  so sehr an Telefone gewöhnt, dass sie ein intrinsischer Teil von uns geworden sind. Sie berühren unsere Haut durch das Gewebe unserer Hosentaschen oder ruhen in Beuteln, Hand- oder Gürteltaschen, die an unseren Rücken, Schultern und Hüften hängen. Je nachdem wie alt wir sind und woher wir kommen, können wir uns vielleicht noch an das klobige Festnetztelefon als eines der Epizentren im Haushalt erinnern. Statisch, unbeweglich. Mit einer Wand verbunden, mit dem Tisch verkabelt. In einer Ecke, über dem Kühlschrank oder auf einem Schreibtisch. Umgeben von knappen Notizen und bekritzelten Zetteln, voller blauer oder schwarzer, roter oder grüner oder bleistiftgrauer abstrakter Zeichnungen, Nummern, Namen, Daten, Familienrezepte, kitschiger Gedichte. Verbunden mit dem Telefon, das mit der Wand verbunden ist. Das ist die Schönheit des Telefons und seiner Vertrautheit – es bringt uns nach Hause. Doch es hat dieses Zuhause in gewissem Maße auch gestaltet und tut das vielleicht noch immer. Erzählungen und Geschichte/n werden miteinander verknüpft, ineinander gewebt in einem affektiven Netz aus Stimm-Mustern, die durch die Kabel reisen.

Ein Telefon kann auch als etwas gedacht werden, mit dem ein Gefühl der Vertrautheit hervorgerufen werden kann. Stellen wir uns noch einmal ein Telefon vor, doch dieses Mal steht es auf einem Tisch in einem leeren Raum. Wie groß ist der Raum? Wie gut ist er beleuchtet? Fühlt er sich an wie ein verlassener Büroraum; hat er die sterile Atmosphäre, die durch summende weiße Lampen entsteht? Vielleicht können wir ihn ein bisschen verändern – wir wissen so vieles nicht, dass wir uns ein paar Freiheiten nehmen können. Wir können uns das Telefon vielleicht in einer schmalen Kabine vorstellen, auf einem kleinen, höher als üblichen Tisch, mit ausreichend Platz für einen einzigen Stuhl, der vielleicht zu niedrig ist für den Tisch, an dem er steht. Vielleicht wackelt der Stuhl ein wenig, ein Bein ist ein Stückchen kürzer als die anderen. Wir können ein bisschen kreativ sein und uns dieses Telefon in einem dunklen Rotton vorstellen. Doch höchstwahrscheinlich hat es diese eigentümliche Farbe zwischen gebrochenem Weiß und hellem Grau, vergilbt vom Alter und einer guten Dosis Zigarettenrauch. Die Wähltasten fühlen sich etwas speckig an. Jede Zahl trägt eine Schicht Sehnsucht, Hoffnung, Furcht, Liebe, Enttäuschung, Trauer. Höchstwahrscheinlich eine Mischung aus ihnen allen, kombiniert in einer Art bittersüßem Trank. Doch heute – so können wir mutmaßen – haftet diesem spezifischen Telefon die Angst an. Der kalte Schweiß, der durch die Kabel läuft, in die Wähltasten, den Tisch, den Stuhl, den Körper, der vor dem Telefon sitzt. Mit diesem Telefon, diesem spezifischen Gerät von eigentümlicher Farbe und speckiger Oberfläche, können wir jede Nummer wählen, die wir wollen. Es wird jedoch auf diese Tastenfolge reagieren:

                        7 2 0 9 9,
                                   dann #

Wenn wir genau hinsehen, bemerken wir vielleicht sogar, wie diese Zahlen auf den Wähltasten bereits verblassen. Die Tasten sind ein wenig leichter zu drücken, vielleicht wackeln sie sogar ein bisschen, wenn die Fingerspitze auf ihnen ruht, zögernd. Und doch funktionieren sie. Sollten sie zumindest. Dieses Telefon, dieses besondere Gerät von eigentümlicher Farbe und ziemlich speckiger Oberfläche, existiert nur insofern diese Nummer darin gewählt werden kann. Der Raum existiert nur, solange dieses Telefon darin steht. Mit der Wand verbunden, die mit dem Netzwerk verbunden ist. Sieben, zwei, null, neun, neun, Raute. Ein kurzes Piepen.

Nun lasst es uns eine Geschichte nennen. Wir haben zwei Minuten.

Moment, nicht irgendeine Geschichte. Es gibt dafür Protokolle. Und höchstwahrscheinlich sehen wir nun etwas vor uns, neben dem Gerät. Ein Bild, wahrscheinlich umgedreht, um ein bisschen die Neugier anzuregen. Wie können wir das vorher übersehen haben? Wer hat dieses Stück Papier dorthin gelegt, etwas verloren zwischen all der Bürokratie, die ein Leben in einer Sammlung von Unterlagen zusammenfasst, die unvollständige Geschichten über eine*n selbst darbieten? Vergessen wir das, nehmen wir das Bild in den Blick. Wir haben zwei Minuten, um es zu beschreiben.

Gloria Anzaldúa, chicana-feministische Dichterin und Autorin, hat ausgiebig die evozierende Macht von Objekten besprochen und die Kraft, die beim Erzählen mit ritualistischen Artefakten heraufbeschworen werden kann. Die ‚Präsenz‘ eines bestimmten Objekts, wenn es durch Ritus und Erzählung beschworen wird, lässt erkennen, dass ein Objekt „sowohl ein physisches Ding ist als auch die Kraft, die es durchdringt“, so schreibt sie.1 Objekte sind nicht statisch und Anzaldúas Texte erinnern uns daran, dass an den „neuen Materialismen“ nichts „Neues“ ist.2 In nicht-westlichen Kosmologien sind Objekte erfüllt von den Machtbeziehungen, die sie enthalten, die sie aufzubauen helfen und die – durch die in und um sie herum erzählten Geschichten – in ihnen heraufbeschworen werden. Das ergibt schließlich keinen in Zeit und Raum starren Gegenstand (wie die westliche Ästhetik annehmen würde), sondern stattdessen „ein Gefüge, eine Montage, ein Flechtwerk mit verschiedenen Leitmotiven und einem zentralen Kern […], die in einem verrückten Tanz auftauchen [und] verschwinden“.3 Die Welt verändert sich mit jeder erzählten Geschichte. Die Person, die erzählt, ist ein*e Formwandler*in. Und Geschichten von und mit Objekten sind transformativ.4 Im Wesen des Geschichtenerzählens liegt die Wiederholung. Das Wesen der Wiederholung ist nie gleich.

Die ritualistische Kraft von Objekten und ihre Fähigkeit, sowohl die erzählende als auch die zuhörende Person zu verändern, beschränkt sich nicht nur auf die beschwörende Kraft von Kunstwerken. Für Anzaldúa wäre das die wesentliche Unterscheidung zwischen der Kunst der Kolonisierenden und jener der Kolonisierten, weil für letztere die in Objekte hineinbeschworene Kunst nicht vom alltäglichen Leben getrennt ist. Macht ist in der affektiven Beziehung zwischen Gegenstand und Körper eingebettet. Denn wann immer Objekte uns berühren, bewohnen wir verschiedene Versionen unserer Körper. Anders ausgedrückt: Uns wohnen affektive Infrastrukturen inne; doch zugleich verändern sie die Welt um uns herum; und diese Veränderung prägt wiederum uns. Affektive Infrastrukturen sind haptisch, klangfarblich, formbar, texturiert – sie erinnern gar an ein Archipel.5

Ich denke an die Kraft von Erzählungen. Aber ich denke auch an die Machtstrukturen, die eine ganze Welt erschaffen, in deren Gewebe der Affekt aus dem Akt des Erzählens einer Geschichte entfernt werden soll.

Wenn wir an die zwei Minuten denken, in denen eine Geschichte erzählt werden muss, dann stellen wir fest, dass sie eine Veränderung im Leben der erzählenden Person bewirken. Das liegt aber nicht an der intrinsischen Kraft jener spezifischen Erzählung. Vielmehr lebt  die Erzählung von diesem Telefon, diesem spezifischen Gerät von eigentümlicher Farbe, das wegen der speckigen Oberfläche etwas unangenehm zu berühren ist und an dessen anderem Ende nicht ein Mensch sitzt, der zuhören und von der Geschichte berührt werden möchte, sondern eine Software. Ein Algorithmus, der die Erzählung verarbeiten wird, sie in kleinste Audioschnipsel zerteilen wird, sie aus dem Bereich der Zeit in den Bereich der Frequenz konvertieren wird, der die in dreizehn ausgewählten Vektoren verteilten Leistungskoeffizienten messen und das mit einem bestehenden Datensatz abgleichen wird.6 Schließlich spuckt er eine Liste von Wahrscheinlichkeiten aus, die sich auf einen spezifischen Satz an Sprachen verteilen, von deren Nutzung durch die erzählende Person die zuhörende Instanz zu x oder y Prozent Wahrscheinlichkeit ausgeht. 63 Prozent Türkisch oder 22 Prozent Hebräisch.7

Logarithmus des Wahrscheinlichkeitsquotienten.

Dass die Verarbeitung der Erzählung irgendeine Form des Zuhörens umfasst, sei sie menschlich oder maschinell, bedeutet nicht unbedingt, dass die affektive Kraft, die in den Inhalten der Geschichte liegt, von Gewicht ist. Im Gegenteil liegt die Macht in dem Akt, das Bild mit der sprechenden Person mit dem Telefon zu verbinden.

Wir beginnen nun zu verstehen, dass es sich nicht um ein gewöhnliches Telefon handelt – nicht zuletzt wegen seiner merkwürdigen Farbe und speckigen Tasten. Es handelt sich um ein Gerät, dass die sprechende Person nicht mit Zuhause verbinden soll, sondern stattdessen nur ein Gefühl dafür wachrufen soll. Es ist ein Gerät, das einen sitzenden Körper schafft, der sich nach Zuhause sehnt. Das Telefon, das diese sprechende Person mit ihrem Zuhause verbindet, steht nicht wie dieses auf einem Tisch, sondern übersteht  – ähnlich wie die Person selbst – die Reise, die dorthin führt. Die sprechende Person, so lernen wir, ist eine sehr spezifische Person, die als solche durch die Infrastrukturen von Grenzen, Geopolitik und Kriegen bestimmt ist. Verbunden mit der Wand, die mit dem Netzwerk verbunden ist, das mit dem System verbunden ist. Diese Verbindung kapert temporär die Autonomie über das (klingende) Selbst. Sprecher*in und Telefon, Sprecher*in und Infrastruktur, sie begründen einander, sind von den Machtverhältnissen bestimmt und verbunden, die dem Körper innewohnen, der Stimme, dem Telefon, dem Algorithmus, den Gesetzgebungen, den Handelsabkommen, den Regierungen, dem Kolonialismus, der Geschichte.

Ihr Name – eine Nummer. Ihre Identität – ein Platzhalter: „Asylsuchende“.

In der Soziolinguistik ergeben sich aus der Analyse eines Dialekts eine ganze Reihe ethischer Probleme, die Einfluss darauf nehmen, wie, warum und wann Sprechenden ein „natürlicheres“ Sprechen entlockt wird, d.h. wie, warum und wann sie so sprechen wie in ihrem Alltag. Eine Software, die spezifisch daraufhin kalibriert ist, einen Dialekt zu ermitteln, erfordert, dass die sprechende Person die „natürlichste“ Version ihrer Prosodie und Aussprache, ihres Rhythmus‘ und Vokabulars offenbart. Miriam Meyerhoff et al. argumentieren, dass Sprechende dazu neigen, ihr Sprechen anzupassen, wenn sie wissen, dass sie aufgezeichnet werden. Die Auslassung dieses Wissens und Bewusstseins verschärft die Machtbeziehung zwischen Forscher*in und Erforschten.8 

Wenn die Software die Figur der „Forschenden“ ausblendet – und sie etwa mit einem Telefon ersetzt – wird die Anwesenheit eines Aufzeichnungsgeräts zumindest visuell versteckt. Die Autor*innen besprechen des Weiteren eine Technik aus der soziolinguistischen Forschung, bei der Unterhaltungen zwischen zwei oder mehr sprechenden Personen aufgezeichnet werden, die miteinander vertraut sind, ohne dass die forschende Person physisch im selben Raum präsent ist.9 Während jedoch in der soziolinguistischen Forschung die (schriftliche oder anderweitige) Zustimmung dazugehört, ist die Dialektüberprüfung im deutschen Asylverfahren – in der Anhörung oder durch Software – zwingend, wenn kein anderer „materieller Nachweis“ über die Herkunft der asylsuchenden Person vorgelegt werden kann.10 Die Machtverhältnisse sind in diesem Fall nicht gestört oder verdeckt. Sie zeigen sich vielmehr überdeutlich.

Das Bundesamt für Migration und Flüchtlinge (BAMF) begann Ende 2017, sich mit Dialektanalysesoftware zu befassen, angeblich nach dem verheerenden Fall des Neonazis und Soldaten Franco A., dem es gelang, das Asylsystem zu hinterlisten und als jüdischer Syrer namens David Benjamin vorübergehendes Asyl zu erhalten. Er plante eine Reihe von terroristischen Anschlägen auf öffentliche Personen in Deutschland, um diese Gewalt dann seiner zeitweiligen Identität anzuhängen.11

Die Software wurde in 61 der innerdeutschen Ankunftszentren und Außenstellen eingeführt. Die Datenbanken für die Sprach- und Dialektanalyse (also die Sprachkorpora) wurden von der University of Pennsylvania in den USA erworben.12

Für einige Monate wurden deren Fähigkeiten besonders auf Sprechende der levantinischen, ägyptischen und „Golf“-Variationen des Arabischen fokussiert (oder eher abgestimmt). Bis April 2018 wurde diese Software 9883 Mal in Asylentscheidungen angewendet. Auf eine Nachfrage zur Wirksamkeit der Software hin berichtet das BAMF von einer Fehlerquote von 20 Prozent und verspricht die Verbesserung der Technik.13 In der langen Liste der Sprachkorpora der University of Pennsylvania finden wir heraus, dass die beliebtesten Datenbanken der arabischen Dialektvarianten als CALL FRIEND und als CALL HOME benannt wurden.14 

Pedro Oliveira – On the endless infrastructural reach of a phoneme
Komposition, zusätzliche Aufnahmen, Synthesizer und deutsche Stimme: Pedro Oliveira. Telefondialog zusammengestellt aus im Internet frei verfügbaren Aufnahmen.

Franco A. hat in seiner Anhörung nie ein Wort Arabisch gesprochen. Er beantwortete die Fragen auf Französisch und offenbar auch auf Deutsch.15

Nun wird das Bild vielleicht etwas klarer: Es geht hier um Form vor Inhalt. Macht ist hier in dem Ungleichgewicht zwischen diesen verwandten Aspekten verortet, präsent in der kontingenten Verknüpfung, die zwischen der Wichtigkeit des Inhalts für die sprechende Person und der Relevanz der Form für die zuhörende Person gebildet wird. Die Geschichte handelt nun von der endlosen infrastrukturellen Reichweite, die durch die Lautbildung eines Phonems eröffnet wird. Von dieser Artikulation hängen Leben ab, Schicksale beruhen auf dieser ungleichen Beziehung. Die Fehlerquote, so wissen wir, liegt bei 20 Prozent.

Die Liste der ethischen Probleme, die aus dem Versuch hervorgehen, Menschen dazu zu bringen, „natürlich zu sprechen“, ist endlos. Von dem Moment an, in dem diesem bereits sehr ungleichen Machtverhältnis die menschliche Komponente entzogen wird, wird davon ausgegangen, dass der Verlass auf softwarebasierte Entscheidungen ein gewisses Maß an „Neutralität“ oder „Objektivität“ birgt und die ethischen Probleme zeitweilig zur Seite gelegt werden können. Anders gesagt: Die Fehlerquote liegt bei 20 Prozent, aber zumindest – so sagen sie – gibt es keine Gefahr, dass menschliche Gefühle sich in die objektive Beschreibung seitens der zuhörenden Person einmischen – was vermeintlich  den Weg dafür ebnen würde, dass die sprechende Person Gefühle hervorlockt.

Sagt es mir: Welche Worte, Szenen, Formen regen uns dazu an, nach dem Telefon zu greifen und zu Hause anzurufen?

A telephone might be used as something to evoke an uneasy feeling of familiarity. According to Meyerhoff et al., “topics where speakers can get emotionally involved” tend to be extremely successful in evoking dialects, and they emphasize the use of techniques such as “the danger of death”:

Ein Telefon kann dafür benutzt werden, ein beunruhigendes Gefühl der Vertrautheit hervorzurufen. Nach Meyerhoff et al. neigen „Themen, bei denen die Sprechenden emotional involviert sein können“, dazu, enorm erfolgreich Dialekte hervorzuholen. Die Autor*innen heben die Nutzung von Techniken wie der „Todesgefahr“ hervor: 

„‚Waren Sie schonmal in einer Situation, in der Sie beinahe Ihr Leben verloren hätten? Als Sie dachten, das war‘s jetzt?‘ Antworten auf diese Frage erfordern üblicherweise ein gewisses emotionales Einlassen und sie kann Erzählungen mit einer Fülle an alltagssprachlichen Besonderheiten auslösen (Labov 1972a; 1984). Doch das funktioniert nicht unbedingt in allen Sprachgemeinschaften und bei allen Personen […] Eine der Personen, die zum Einsprechen des Bequia-Korpus beitrug (Meyerhoff und Walker 2007), begann zu weinen, nachdem sie die Frage beantwortet hatte […].“ 16

Es scheint, als würde diese Methode in der soziolinguistischen Forschung nicht mehr genutzt.17 Die Frage nach der „Todesgefahr“ ist nicht nur aus der Perspektive der Forschungsethik höchst problematisch. Sie ist auch extrem rücksichtslos gegenüber den Gefühlen der Person und den psychologischen Folgen des Auslösens von Erinnerungen an Traumata. Für Überlebende von Gewalt, Missbrauch und Krieg können solche ‚Entlockungen‘ langfristige Auswirkungen nach sich ziehen.

Wenn wir das Foto umdrehen, das auf dem Tisch vor uns liegt, und es genau betrachten, dann sehen wir, dass es eine Familie bei einer gemeinsamen Mahlzeit in ihrem Zuhause zeigt.

Anzaldúa erinnert uns, dass ein Bild eine „Brücke“ ist „zwischen hervorgerufenem Gefühl und bewusstem Wissen“.18 Können wir uns vorstellen, dass die trivialste Situation als Abkapselung des Unerreichbaren zu einer Waffe gemacht wird?

Ein Telefon kann dazu instrumentalisiert werden, eine asylsuchende Person daran zu erinnern, dass „Zuhause“ immer woanders ist. Zuhause ist scheinbar für immer außer Reichweite.

Wir haben jetzt zwei Minuten, um die Beschreibung eines Bildes in dieses Telefon zu sprechen, das vor uns steht. Verbunden mit der Wand, die mit dem Netzwerk verbunden ist, das mit dem System verbunden ist. Mit der Grenze verbunden.
 
Zuhause.

 

Übersetzung aus dem Englischen von Jen Theodor.

share

Print Friendly, PDF & Email
Related participants: