Künstliche Intelligenz ist keine Zukunftsmusik, sie ist längst in unserem Alltag angekommen. In diesen zehn alltäglichen Dingen steckt KI.
Über den Begriff Künstliche Intelligenz lässt sich vortrefflich streiten. Meint er menschenähnliche Intelligenz? Künstliche Nachahmung biologischer Intelligenz? Geht es um Computer, die Symbole hin und her schubsen? Oder meint er maschinelle Systeme, die lernen?
Je nach Perspektive und Hintergrund ordnen Menschen dem KI-Begriff völlig unterschiedliche Dinge zu. Wie auch immer man KI definiert: Von der Technologie profitiert heute jeder, der die Digitalisierung nicht verschlafen hat. In diesem Artikel erkläre ich zehn KI-Anwendungen, die unseren Alltag beeinflussen.
"Googeln"
Google ist der Vorreiter beim Einsatz von KI-Technologie. Im Kerngeschäft der Suchmaschine setzt der Konzern seit mindestens 2015 auf Künstliche Intelligenz. Der KI-basierte Suchalgorithmus RankBrain hilft, Suchanfragen zu verstehen und liefert passende Ergebnisse.
RankBrain versucht, bei bisher unbekannten Suchanfragen vermutlich gewünschte Suchergebnisse anzuzeigen, indem der Algorithmus die Suchanfrage mit bereits bekannten, bedeutungsähnlichen Suchanfragen verknüpft. Die Ergebnisse der Suche zeichnet Google auf und nutzt sie fürs Training von RankBrain.
Im Oktober 2019 kündigte Google das bis dahin größte Update der Such-Engine an: Die Sprach-KI BERT versteht natürliche Sprache und hilft so, Suchanfragen noch präziser zu beantworten.
Als Beispiel für BERTs Fähigkeiten nennt Google die Suchanfrage "2019 brazil traveler to usa need a visa". Vor BERT wurde das Wort "to" nicht in die Suche einbezogen und ergab daher Suchergebnisse für US-Bürger, die nach Brasilien reisen.
Mit BERT ist Google in der Lage, die wichtige Rolle des Wortes "to" in diesem Kontext zu erfassen und gibt das passende Ergebnis aus: eine Visa-Information für Einreisende.
Netflix and Chill
Abends vor den Fernseher und ein bisschen Tiger King schauen. Aber warum taucht die Serie überhaupt in meinen Empfehlungen auf? Netflix setzt auf Empfehlungsalgorithmen, um zum Kundengeschmack passende Unterhaltung anzuzeigen.
Netflix sammelt allerlei Daten, die in den KI-Algorithmus fließen: Was ich schaue, was ich davor und danach schaue, was ich vor einem Jahr, was vor kurzem und um welche Uhrzeit ich es gesehen habe.
Wenn Netflix meine Vorlieben kennt, wählt der Algorithmus Inhalte aus und generiert eine passende Präsentation. Verschiedene Kunden sehen so nicht nur unterschiedliche Empfehlungen – selbst die Vorschaubilder sind auf den individuellen Geschmack angepasst.
Der eine sieht für einen Film eine dramatische Nahaufnahme des Hauptcharakters, der andere für den gleichen Film eine Hochzeitsszene. Meine anschließende Auswahl trainiert den Empfehlungsalgorithmus erneut.
Solche Algorithmen treiben auch die Empfehlungen von YouTube, Spotify, Amazon, Facebook, Twitter oder Instagram an. Sie basieren auf Varianten des Deep Learning.
Netflix setzt außerdem auf Künstliche Intelligenz, um Führungskräften des Konzerns zu helfen, Titel zu finanzieren, die sich für den jeweiligen Markt lohnen. Dafür analysiert die KI unzählige Filme und Serien und kann mit diesen Informationen Inhaltskategorien und zu erwartende Zuschauerzahlen in verschiedenen Ländern vorhersagen.
Spam & Hatefilter
Neben Empfehlungsalgorithmen setzen soziale Netzwerke auf Kontroll- und Prüfalgorithmen, die fragwürdige Inhalte erkennen sollen. Dazu gehören pornographische, gewalttätige oder politisch extreme Inhalte.
Diese Inhalte werden automatisiert markiert und im Extremfall gelöscht. Das funktioniert nicht immer wie gewollt: YouTube löschte etwa im Sommer 2019 Videos eines Geschichtslehrers über den Nationalsozialismus. Auch die rechtlichen Grundlagen werden immer wieder kritisch diskutiert – etwa das deutsche Netzwerkdurchsetzungsgesetz.
Besser funktionieren Kontroll- und Prüfalgorithmen im E-Mail-Verkehr: Dort arbeiten sie als Spam-Filter. Services wie Google Mail verwenden seit Jahren neben herkömmlichen regelbasierten Filtern auch Künstliche Intelligenz.
Regelbasierte Filter können offensichtliche Spam-Mails blockieren, aber sind nicht selbstständig lernfähig. Hier kommen die KI-Filter ins Spiel: Die Algorithmen analysieren eine Vielzahl an Informationen, von der E-Mail-Formatierung bis zur Sendezeit, um in den Datenströmen Muster zu finden, die auf Spam hindeuten. Dabei kommen überwachte und unüberwachte Lernmethoden zum Einsatz.
Im Kontext der Coronakrise rücken Kontroll- und Prüfalgorithmen noch stärker in den Fokus, da weniger Moderatoren zur Verfügung stehen und die Maschine so zwangsweise mehr Verantwortung übernehmen muss, damit der Betrieb bei Plattformen wie YouTube und Facebook weiterlaufen kann. So erklären jedenfalls Google und Co. den Schwenk zu mehr algorithmischer Kontrolle.
Gesichtserkennung
Für viele Menschen ist der morgendliche Blick aufs Smartphone längst zur Routine geworden. Häufig entsperren wir unsere Smartphones dabei direkt mit unseren Gesichtern. Und das funktioniert selbst nach einer durchzechten Nacht und mit Sturmfrisur noch verlässlich.
Möglich ist die Gesichtserkennung durch Künstliche Intelligenz: Im Smartphone werkeln Gesichtserkennungsalgorithmen, die nach kurzem Training unser Gesicht zuverlässig und schnell identifizieren können.
In vielen Fällen lernt die KI ununterbrochen dazu und wird mit jeder Entsperrung noch besser. Das KI-Training läuft dank effizienter Algorithmen und spezialisierter Hardware direkt auf dem Smartphone.
Ähnliche Bildanalyse-KIs suchen in unseren digitalen Fotoalben automatisch nach Personen und markieren sie. Das funktioniert mittlerweile auch für Tiere und einige Objekte.
Unternehmen wie Shadow nutzen diese Fähigkeit, um entlaufene Hunde wieder mit ihren Besitzern zu vereinen. Das soziale Hunde-Netzwerk Pet2Net möchte dagegen „komplexe Analysen von Hundebeziehungen“ ermöglichen – Big Data für Hunde quasi.
Auch in der Forschung findet die Gesichtserkennung Anwendung: Die Bärenforscherin Melanie Clapham setzt beim BearID-Projekt auf „Bearface“, eine Grizzly-Erkennungs-KI, die Bären anhand ihres Gesichts identifiziert und so die Arbeit der Forscherin erleichtert.
Kritisch diskutiert wird Gesichtserkennung im Kontext der Massenüberwachung: KI-gestützte Kameras können einzelne Personen identifizieren und über verschiedene Standorte hinweg beobachten - und das völlig automatisch.
Sprachergänzung: Baby Yoda & OK Boomer
Wer hart an den Trends lebt, kennt den Prozess: Am Anfang muss das neue Wort noch aufwendig per Hand in die Smartphone-Tastatur gehackt werden. Nach einigen Eingaben taucht es in den Wortvorschlägen der Tastatur auf und wird korrigiert, wenn es falsch eingegeben wird.
Zwar lassen sich Wörter auch manuell speichern, doch längst passiert das automatisiert dank maschinellem Lernen. Möglich ist das durch Algorithmen, die häufige genutzte Wörter erkennen und in die Vorschläge aufnehmen.
Google beispielsweise setzt dafür sogenanntes Federated Learning ein: Die Tastatur-App gibt die lokal gelernten Informationen zu häufig genutzten Worten samt typischer Tippfehler an eine zentrale Verarbeitungsstelle weiter.
Dadurch kommen Anbieter wie Google an große Mengen Trainingsdaten für aktuelle Wortvorschläge und Verbesserungen. Die werden in einem Update verteilt. So gelangen weltweit häufig genutzte Wörter in die Tastatur-Vorschläge der Smartphones.
Alexa & Google Assistant
Digitale Assistenten wie Amazons Alexa oder Googles Assistant kommen dem popkulturellen Bild Künstlicher Intelligenz am nächsten: Sie haben einen Namen und können sprechen. In vielen Haushalten gehören sie zum Computer-Alltag.
Computer, die sprechen und Sprache verstehen, sind die große Erfolgsgeschichte der KI-Forschung der letzten Jahre: Dank des maschinellen Lernens ist die Sprachverarbeitung, -synthese und -übersetzung viel besser geworden.
Die Assistenten verstehen uns zuverlässig, können Fragen beantworten und einfache Aufgaben erledigen. Ihre KI-Stimmen klingen immer mehr wie die eines Menschen.
Integrierte Dienste wie Google Translate oder Google Lens erleichtern maschinelle Übersetzungen, identifizieren Objekte oder Hinweisschilder und heben so Sprachbarrieren auf.
Weitere Verbesserungen stehen uns bevor: Anfang 2021 schlugen Sprach-KIs von Google und Microsoft den Sprachverständnis-Benchmark SuperGLUE und erreichten menschliches Niveau. Einen echten Assistenten können zwar auch diese Systeme nicht ersetzen, aber sie stellen einen deutlichen Leistungssprung gegenüber älteren Systemen dar.
Staubsaugerroboter und Tesla
Neben dem Sprechen lernen Maschinen auch das Sehen immer besser. Die Computer Vision ist grundlegend für (teil)autonome Roboter: von Staubsaugerrobotern, die unsere Wohnungen eigenständig kartografieren und dann reinigen bis zu selbstfahrenden Autos, die uns sicher durch den Straßenverkehr bringen sollen.
Der Durchbruch für maschinelles Sehen kam 2012 mit einer Bildanalyse-KI, die den ImageNet-Wettbewerb haushoch gewann. Seitdem ist Computer Vision auf dem Vormarsch: Fast 170.000 Patente für maschinelles Sehen wurden bis Anfang 2019 registriert – fast die Hälfte aller KI-Patente.
Deepfakes
Mit KI manipulierte Videos - sogenannte Deepfakes - erzielen bei YouTube Millionen Klicks, zum Beispiel indem sie die Gesichter bekannter Hollywood-Schauspieler in Filmen glaubhaft austauschen.
Dieses Faceswap-Prinzip ist zwar nicht neu. Aber dank des KI-Verfahrens funktioniert es nun effizienter und ist für mehr Menschen zugänglich. Dadurch steigt die Verbreitung entsprechender Videos.
Da die Qualität von Deepfakes in den letzten Jahren rasant zugenommen hat, warnen manche Experten, Forscher oder Politiker davor, dass massenhaft glaubhafte Videofälschungen unsere Entscheidungsfähigkeit als Gesellschaft aushebeln könnten - zum Beispiel wenn Social Media mit Deepfake-Wahlwerbevideos geflutet würden.
In einer Erklärung der Bundesregierung heißt es dazu: "Deepfakes können das gesellschaftliche Vertrauen in die grundsätzliche Echtheit von Audio- und Videoaufnahmen und damit die Glaubwürdigkeit öffentlich verfügbarer Informationen schwächen."
Sie könnten daher eine “große Gefahr für Gesellschaft und Politik darstellen”. Allerdings dürfe das Risiko auch nicht überbewertet werden. Plattformen wie Twitter und YouTube regulierten Deepfakes im US-Wahlkampf 2020. Die befürchtete Fake-Video-Schwemme blieb jedoch aus.
Stattdessen gab es eine Deepfake-Serie der Southpark-Macher, womöglich einen Deepfake-Auftritt in der Star-Wars-Serie „The Mandalorian“ und eine Deepfake-Queen im britischen Channel 4. Und Nvidia nutzt die Technologie, um euch in der Videotelefonie immer in die Kamera schauen zu lassen.
GPT-3: Maschinentexter im Internet
Sprach-KIs haben in den letzten Jahren große Fortschritte gemacht. Spätestens seit OpenAI die Ergebnisse von GPT-2 veröffentlichte, war klar: Maschinen texten mittlerweile so gut, dass es für Menschen schwer ist, sie von menschlichen Texten zu unterscheiden.
Solche Fähigkeiten werden etwa von Marketing-Experten eingesetzt, um Werbeslogans zu generieren oder von Microsoft, um KI-generierte Verbesserungsvorschläge in Word anzuzeigen. KI verfasst außerdem kurze Sport- und Wirtschaftsnachrichten, etwa für die New York Times oder Reuters.
Diese Entwicklung nimmt weiter Fahrt auf: Die Veröffentlichung und der Verkauf von OpenAIs GPT-3 zeigt, welches Marktpotenzial das KI-Unternehmen in Maschinentexten sieht. Microsoft hat sich direkt eine Exklusivlizenz für GPT-3 gekauft und will die Fähigkeiten der KI für eigene Produkte einsetzen.
Eine ganze Reihe Start-ups experimentiert ebenfalls mit neuen GPT-3-Produkten, etwa KI-generierten E-Mails oder KI-Avataren in Videospielen.
Das KI-Text-Abenteuer AI Dungeon setzt ebenfalls auf GPT-3 und überrascht selbst dessen Erfinder Nick Walton - auch nach tausenden Durchgängen. Einen kleinen Einblick in die kreative Fähigkeit von GPT-3 bietet unser Podcast Folge #229.
Kritik gibt es am Missbrauchspotenzial der Text-KIs. So gab GPT-3 etwa auf Reddit Tipps bei Selbstmordgedanken oder zeigte sich in einem Test als ultimativer Vorurteilsgenerator.
KI-Künstler und Maschinen-Designer
Auch abseits der Deepfakes etabliert sich Künstliche Intelligenz als Werkzeug für Künstler und Designer. Bereits im Oktober 2018 versteigerte das Auktionshaus Christie’s die erste KI-Kunst für 432.000 US-Dollar.
Die dafür notwendigen Werkzeuge wie Ganbreeder oder Nvidias GauGAN sind für jeden frei verfügbar.
Mit Ganbreeder mischt ihr Bilder unzähliger Kategorien – egal ob Hund und Nudel oder Goldfisch und Flugzeug.
GauGAN verwandelt simple Zeichnungen in realistische Gemälde und wurde etwa von Colie Wertz genutzt, einem Künstler der unter anderem am Star-Wars-Film „Rogue One“ mitarbeitete.
Diese und vergleichbare KI-Werkzeuge helfen Künstlern und Designern schon heute bei ihrer Arbeit - oder sind selbst Subjekt der Kunst. Der Künstler Fabin Rasheed untersucht etwa künstlerisch, was eine Text-KI wie GPT-3 sieht.
Die nächste Stufe der KI-Kreativität hat OpenAI erreicht: DALL-E führt die Textgenerierungsfähigkeit von GPT-3 mit der Bildgenerierungsfähigkeit von i-GPT zusammen und generiert so zur Texteingabe passende Bilder.
Der Kreativität sind keine Grenzen gesetzt: Ein Baby-Rettich mit Tutu, der mit einem Hund spazieren geht? Eine Kunstledertasche in der Form eines Schweins? Ein Pinguin aus Knoblauch? OpenAIs kreative Bild-KI Dall-e hat immer einen Vorschlag.