Werbung

Microsoft erweitert sein KI-Portfolio mit Copilot Vision, einem neuen Tool, das Bildschirminhalte analysieren kann. Das Modul nutzt Technologien der Computer Vision, um Texte und Bilder auf Webseiten zu erkennen und in Echtzeit kontextbezogene Informationen bereitzustellen. Ziel ist es, Usern beim Onlineshopping, der Recherche oder sogar in Spielen zu unterstützen. Microsoft formuliert das in einem Blog-Beitrag so: "Copilot kann jetzt im vollen Kontext verstehen, was Sie online machen."

Copilot Vision erfasst Inhalte auf einer Webseite, erstellt Zusammenfassungen oder bietet weiterführende Recherchen an. Besonders beim Onlineshopping will das KI-Tool mit direkten Tipps oder Empfehlungen den Nutzer unterstützen. In Quizspielen wie Geoguesser soll die KI etwa gezeigte Bilder erkennen und diese geografisch zuordnen können.

Ein weiteres Highlight ist die Möglichkeit, Ergebnisse nicht nur als Text, sondern auch per Sprachoutput ausgeben zu lassen. So kann die KI zu einem interaktiven, virtuellen Gesprächspartner avancieren. Alle Datenverarbeitungen erfolgen cloudbasiert und nicht lokal.

Das Tool ist standardmäßig deaktiviert und wird nur mit Zustimmung des Nutzers aktiviert. Obwohl Copilot Vision während der Nutzung die Bildschirminhalte mitliest, betont Microsoft dennoch, dass sämtliche Daten sicher seien und nach Beendigung der Sitzung gelöscht werden.

Copilot Vision steht aktuell allerdings nur Testnutzern in den USA zur Verfügung. Voraussetzung ist zudem die Nutzung des Edge-Browsers sowie eine gültige Copilot-Pro-Lizenz. Zumindest vorerst soll das Tool auch Copilot-Labs-Insidern vorbehalten bleiben.

Mit Copilot Vision zeigt Microsoft eine neue Möglichkeit, wie KI den Alltag der Nutzer erleichtern kann. Gleichzeitig begleiten diese Möglichkeiten aber auch Diskussionen über den moralischen Einsatz solcher Technologien in Spielen oder anderen Bereichen.