Update vom 4. August 2019:
Nach Google und Apple reagiert auch Amazon auf die Abhörkritik von Medien und Nutzern: In den Alexa-Optionen kann ab sofort die Teilnahme am Sprachanalyseprogramm deaktiviert werden. Amazon will Kunden zeitnah zum neuen Verfahren informieren.
Via: Bloomberg
Ursprünglicher Artikel vom 13. April 2019:
Amazon Alexa: Von wegen KI - Menschen hören mit
Der E-Commerce-Riese Amazon lässt menschliche Lohnarbeiter die Sprach-KI Alexa verbessern.
Amazon beschäftigt nach Recherchen von Bloomberg weltweit tausende Mitarbeiter und externe Dienstleister als professionelle Alexa-Lauscher. Ihre Aufgabe: Aufnahmen des Assistenzsystems analysieren. Mit den eigenen Ohren.
Die Teams sitzen in Boston, Costa Rica, Indien oder Rumänien und gehen bis zu 1.000 Aufnahmen pro Tag durch – auch die der deutschen Kunden.
Die Hörer transkribieren die Aufnahmen und versehen sie mit Anmerkungen. Ein Beispiel: Ein Mitarbeiter aus Boston geht Aufnahmen mit den Worten „Taylor Swift“ durch und weist sie der Sängerin zu.
Andere Teams vergleichen den Inhalt von Aufnahmen mit Alexas automatischer Transkription und passen sie bei Bedarf an. Diese Informationen nutzt Amazon, um Alexas Sprachverständnis zu verbessern.
Private Informationen werden ebenfalls übermittelt
Doch Alexa wird nicht nur durch konkrete Befehle aktiviert. Wie Mitarbeiter berichten, gibt es immer wieder durch Fernseher oder normale Gespräche ausgelöste Aufnahmen. Die Nutzer bekommen das häufig gar nicht mit.
Dadurch ist allerlei Privates zu hören: Gesänge unter der Dusche, Kindergespräche oder sogar Bankdaten. Sind allzu private Details zu hören, setzen die Teams einen Haken bei „critical data“.
Amazon betont in einer Stellungnahme, dass Beschäftigte keinen direkten Zugang zu Informationen hätten, durch die eine Person oder Account identifiziert werden könne. Alle Informationen würden streng vertraulich behandelt. Apple und Google geben gegenüber Bloomberg an, ebenfalls menschliche Prüfer für die Sprachaufnahmen von Siri und des Google Assistenten einzusetzen.
Identifikation durch Aufnahmen ist möglich
Grundsätzlich enthalten einzelne Aufnahmen selten Informationen, mit denen eine Person identifiziert werden kann. Allerdings werden sie über Monate oder sogar Jahre gespeichert. So sammeln sich hunderte Aufnahmen eines einzelnen Nutzers an.
Dass das für eine eindeutige Zuordnung reichen kann, zeigte letztes Jahr ein bedenkliches Datenschutzleck: Amazon schickte einem Kunden auf Anfrage über ihn gespeicherte Daten. Mit dabei waren 1.700 Aufnahmen von Alexa.
Der Kunde hatte Alexa jedoch noch nie genutzt. Alle Daten waren von einer anderen Person. Das Magazin c’t konnte sie anhand der Aufnahmen identifizieren. Über das Datenleck war sie nicht informiert, obwohl Amazon bereits davon wusste.
Unsichtbare menschliche Hilfe
Der ein oder andere mag zwar darüber informiert sein, dass Amazon mit Nutzerbefehlen das Sprachverständnis der Alexa-KI trainiert. Doch die menschlichen Zuhörerinnen und Zuhörer, die privaten Gesprächen lauschen, dürften viele überraschen, sagt Florian Schaub, Professor der Universität Michigan.
Schaub forscht zu Datenschutzproblemen von Sprachassistenten wie Alexa oder Google Home. Für ihn sind Alexa-Nutzer nicht zu naiv, sondern das Marketing zu geschickt: „Ich denke, wir wurden auf die Annahme konditioniert, dass diese Maschinen nur ‚magisches‘ Maschinenlernen nutzen. Aber dahinter steckt immer noch manuelle, menschliche Verarbeitung.“
Die Fließbandarbeiter hinter dem eleganten Tech-Konzern
Die Datenverarbeitung durch Niedriglohnkräfte ist eine blühende Industrie: Sie spielt eine wichtige Rolle für das autonome Fahren oder bei der Optimierung von Internet-Suchmaschinen. Dass die Arbeiter dabei Zugriff auf sensible Daten haben, ist für die Tech-Konzerne notwendig. Dass die Kunden darüber Bescheid wissen, eher hinderlich.
Das nicht nur aus Gründen des Datenschutzes, sondern auch, weil’s um den schönen Schein geht: Nämlich dass große Tech-Konzerne alle Probleme wie von selbst durch Technologie lösen können. Dass sie in Wirklichkeit im Hintergrund noch auf menschliche Fließbandarbeit angewiesen sind, passt nicht ins angestrebte Image.
Quelle: Bloomberg