Wenn es nach Google geht, benötigen Ihr Telefon und viele andere Android-basierte Geräte bald nicht mehr viele Informationen von Ihnen. Auf der Android Show: I/O Edition kündigte das Unternehmen Gemini Intelligence an, ein System zur Automatisierung mühsamer Aufgaben. Kurz gesagt, Google hat einen Computer-Benutzeragenten (denken Sie an Claude Cowork oder Perplexity Personal Computer) für Telefone erstellt.
Das Unternehmen gibt an, dass es fünf Monate damit verbracht hat, seinen neuesten Agenten zu optimieren, um ihn in die Lage zu versetzen, in einigen der heute beliebtesten Telefon-Apps nahtlos zu navigieren und mehrstufige Aufgaben auszuführen. Wie Sie sich vorstellen können, behauptet Google, dass das System zu erheblichen Automatisierungsleistungen fähig ist. Das Unternehmen gibt beispielsweise an, dass der Agent einen Kursplan in Gmail lesen und dann alle Bücher, die Sie für diesen Kurs benötigen, in einen Warenkorb legen kann.
Google fügt hinzu, dass das System noch leistungsfähiger ist, wenn es Kontext vom Bildschirm Ihres Telefons oder einem Bild extrahieren kann. Das Unternehmen beschreibt ein Szenario, in dem Benutzer möglicherweise eine Reisebroschüre in einem Hotel sehen und Gemini bitten, eine ähnliche Tour auf Expedia zu finden.
Verständlicherweise zögern manche Menschen, einem KI-Agenten die Kontrolle über ihr Telefon zu überlassen. Laut Google beginnt Gemini Intelligence erst dann mit der Arbeit an einer Aufgabe, wenn ein Benutzer dazu aufgefordert wird. Darüber hinaus müssen Sie bei jeder Aufgabe, bei der Gemini in Ihrem Namen etwas kauft, den Kauf bestätigen. Benutzer können auch über das bekannte Berechtigungsmenü von Google entscheiden, wann Gemini auf ihre Daten zugreifen kann, und ein Fortschrittsbalken ermöglicht es Benutzern, Gemini jederzeit zu stoppen.
Google plant, Gemini Intelligence zunächst auf den kürzlich eingeführten Pixel- und Samsung Galaxy-Handys einzuführen. Es wird interessant sein zu sehen, wie gut die Leute das System nutzen. Es ist nicht so, dass die meisten Apps schwierig zu bedienen wären; Vielmehr wurde im Laufe von zwei Jahrzehnten Mobildesign der Großteil so weit optimiert, dass die meisten von uns Aufgaben wie das Anrufen eines Uber-Telefons ohne viel Nachdenken erledigen können. Es wird auch bemerkenswert sein, ob Gemini Intelligence die Fehler vermeiden kann, die andere IT-fähige Agenten wie Claude Cowork gerne machen. Denn wenn Sie sich nicht auf die Konsistenz der von Ihnen verwendeten Software verlassen können, ist es unwahrscheinlich, dass die meisten Menschen sie mehr als einmal verwenden.