Inhalt
summary Zusammenfassung

Windows bekommt einen KI-Assistenten, der Systemeinstellungen per natürlicher Spracheingabe ändert. Das neue Sprachmodell "Mu" läuft komplett offline auf speziellen KI-Chips, ist aber vorerst nur für wenige Nutzer:innen verfügbar.

Anzeige

Nutzer:innen können damit künftig Befehle wie "Erhöhe die Bildschirmhelligkeit" oder auch Probleme wie "Mein Mauszeiger ist zu klein" eingeben, anstatt sich durch komplizierte Menüs zu klicken. Der Agent ist in die bestehende Suchbox der Einstellungen integriert und antwortet laut Microsoft in unter einer halben Sekunde.

Screenshot der Windows-Einstellungen: KI-Agent schlägt nach Suche vor, die Mauszeigergröße direkt anzupassen.
Statt sich durch Menüs zu klicken, will Microsoft Anfragen in natürlicher Sprache verstehen. | Bild: Microsoft

Angetrieben wird der Agent von einem neuen Sprachmodell namens "Mu", das Microsoft speziell für diese Aufgabe entwickelt hat. Das Modell hat 330 Millionen Parameter und nutzt eine Encoder-Decoder-Architektur, die laut Microsoft deutlich effizienter arbeitet als die meisten aktuellen Sprachmodelle, die auf eine reine Decoder-Architektur setzen.

Der Encoder wandelt die Eingabe der Nutzer:innen einmalig in eine interne Repräsentation um, während der Decoder daraus die entsprechenden Windows-Befehle generiert. Diese Aufteilung reduziert nach Angaben von Microsoft die Antwortzeit um 47 Prozent und erhöht die Verarbeitungsgeschwindigkeit um das 4,7-fache gegenüber vergleichbaren Modellen.

Anzeige
Anzeige
Liniendiagramm: Inferenzzeit von Encoder-Decoder und Decoder-Only Modellen bei Sequenzlängen von 512 bis 8192 Tokens.
Mus Encoder-Decoder-Architektur hält die Inferenzzeiten bei Sequenzlängen von 512 bis 8192 Tokens deutlich niedriger als der Decoder-Only-Ansatz. | Bild: Microsoft

Vollständig lokale Ausführung auf NPU-Chips

Mu läuft vollständig auf den Neural Processing Units (NPUs) der Copilot+ PCs. Diese speziellen KI-Chips sind für maschinelles Lernen optimiert und ermöglichen es dem Modell, über 100 Token pro Sekunde zu verarbeiten. Microsoft gibt an, dass das System auf einem Surface Laptop 7 über 200 Token pro Sekunde erreicht.

Das Unternehmen verwendete unter anderem Post-Training Quantization, um das Modell für die NPU-Hardware zu optimieren. Dabei werden die Modellgewichte von Fließkomma- in 8-Bit- und 16-Bit-Integer-Werte umgewandelt, was den Speicherverbrauch reduziert und die Geschwindigkeit erhöht.

Training mit 3,6 Millionen Beispielen

Microsoft trainierte Mu zunächst mit hunderten Milliarden "educational tokens" und nutzte anschließend eine Destillation aus den größeren Phi-Modellen des Unternehmens. Für die spezifische Aufgabe im Settings Agent verwendete Microsoft 3,6 Millionen zum Teil synthetische Trainingsbeispiele und erweiterte die Abdeckung von etwa 50 auf hunderte Windows-Einstellungen.

Das System funktioniert am besten bei längeren, eindeutigen Anfragen. Bei kurzen oder mehrdeutigen Befehlen zeigt die Suchbox weiterhin herkömmliche Suchergebnisse an. Problematisch sind etwa Befehle wie "Helligkeit erhöhen", wenn mehrere Monitore angeschlossen sind.

Nur für Windows Insider mit Copilot+

Microsoft sammelt derzeit Feedback von Windows Insiders, um das System zu verbessern. Das Unternehmen arbeitet daran, auch komplexere Aufgaben zu unterstützen, konzentriert sich aber zunächst auf die am häufigsten genutzten Einstellungen.

Empfehlung

Wann das Feature für alle Windows-Nutzer:innen verfügbar wird, teilte Microsoft nicht mit. Da das Feature auf NPU-Hardware angewiesen ist, die nur in den neuesten Copilot+-PCs verbaut ist, dürfte die Verbreitung zunächst begrenzt sein. Wer die nötigen Hardwarevoraussetzungen mitbringt, muss sich zudem im Dev Channel registrieren.

Insgesamt läutet Microsoft damit eine Ära ein, in der Computer zunehmend durch natürliche Sprache bedient werden können. In der Vergangenheit hat Microsoft bereits verschiedene experimentelle Agentensysteme gezeigt, die aber häufig die Interaktion mit GUIs durch ein multimodales Sprachmodell voraussetzten. Wie bei Mu ein Modell für eine konkrete Aufgabe zu trainieren, scheint der unflexiblere, dafür aber deutlich effizientere Weg.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Microsoft testet einen neuen KI-Assistenten für Windows, der Systemeinstellungen per natürlicher Sprache anpasst und vollständig offline auf speziellen NPU-Chips läuft. Zum Start steht das Feature nur wenigen Nutzer:innen mit Copilot+-PCs zur Verfügung.
  • Das zugrundeliegende Sprachmodell "Mu" nutzt eine Encoder-Decoder-Architektur, verarbeitet über 100 Token pro Sekunde und liefert laut Microsoft deutlich schnellere Antworten als vergleichbare Modelle. Optimiert wurde das Modell durch Quantisierung und Training mit 3,6 Millionen Beispielen für Windows-Einstellungen.
  • Der Assistent ist in die Suchbox der Einstellungen integriert und kann komplexere Befehle ausführen, solange sie eindeutig formuliert sind. Microsoft sammelt Feedback von Windows Insidern und plant weitere Verbesserungen, macht aber keine Angaben zum allgemeinen Starttermin.
Quellen
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!