Es gilt als sicher, dass Apple viele neue KI-Funktionen in iOS 18 integrieren wird. die Umsetzung geschieht aber anders als Sie es erwarten.
Apple verwendet bereits heute überall in seinen Produkten Künstliche Intelligenz, für gewöhnlich nur als "maschinelles Lernen" bezeichnet, und hat sogar spezielle KI-Hardware namens "Neural Engine" in all seinen Chips. Geht es aber um generative KI, also etwa anspruchsvolle Chatbots (Chat-GPT, Microsoft Co-Pilot, Bard), Bildgeneratoren (Dall-E, Midjourney, Stable Diffusion), Musikgeneratoren (Amper, Musenet) und Codegenerierung (Github Co-Pilot), scheint Apple im Abseits zu stehen.
Aber nicht mehr lange! Mehrere Gerüchte besagen, dass Apple mit iOS 18 einen großen GenAI-Vorstoß unternehmen wird. Die Rede ist von Siri mit generativem KI-Chat, von KI-generierten Wiedergabelisten in Apple Music und vielleicht sogar von Bildergenerierung oder Tools für Fotos, iMovie und so weiter.
Wir gehen jedoch davon aus, dass sich Apples GenAI-Tools ein wenig von dem unterscheiden werden, was wir bisher auf dem Markt sehen. Apple legt großen Wert auf Datenschutz, geräteinterne Verarbeitung und ist bedacht, seinen Ruf in Bezug auf Sicherheit und Vertrauen zu schützen. Dieser Anspruch wird sich sicher auch auf die KI-Tools auswirken.
Die nächste Generation von Siri
Siri auf den aktuellen Stand zu bringen, wird die größte Herausforderung für Apple sein. Der persönliche Assistent ist das KI-Produkt von Apple, an dem die KI-Fähigkeiten des Unternehmens in der Öffentlichkeit gemessen werden. Es ist die sichtbarste und eine der ersten und größten Marken im Bereich KI.
Es ist auch die natürlichste Lösung für die Art von KI mit großen Sprachmodellen (LLM), die heute in Mode sind, wie Chat-GPT und Bard. Apple hat seine eigene LLM-Grundlage namens Ajax, die einigen Berichten zufolge ziemlich ausgefeilt ist.
Apple wird so viel wie möglich auf dem Gerät machen wollen. Das ist aus Sicht des Datenschutzes und der Sicherheit von entscheidender Bedeutung. Gleichzeitig bringt es auch Vorteile, was Reaktionsfähigkeit, Akkuleistung und Offline-Verfügbarkeit anbelangt.
Siri wäre darüber hinaus in der Lage, natürlich wirkende Gespräche zu führen. Dank Daten auf Ihrem iPhone, etwa Ihren Standort, die Personen und Objekte auf Ihren Fotos, die Apps, die Sie verwenden und vieles mehr, könnte es sich anfühlen, als würde sie Sie kennen. Siri könnte sich mehr wie ein Freund anfühlen als jede andere künstliche Intelligenz - und das alles, ohne jemals persönliche Daten zu übermitteln.
Die technischen Herausforderungen sind enorm, denn LLMs benötigen viel Arbeitsspeicher. Selbst LLMs von geringer Größe brauchen Gigabytes an Arbeitsspeicher und herkömmliche Smartphones haben oft keine Gigabytes zur Verfügung. Und niemand wird sich für die technische Leistung interessieren, ein LLM auf einem Gerät auszuführen, wenn das Ergebnis schlecht ist.
Ob fair oder nicht - Alltagsnutzer werden die Konversationsfähigkeiten von Siri mit den neuesten Online-KI-Chatbots vergleichen, die auf großen Serverfarmen laufen.
Die Forscher von Apple haben Ende Dezember 2023 ein Paper mit dem Titel "LLM in a Flash: Efficient Large Language Model Inference with Limited Memory" veröffentlicht, das sich genau mit diesem Problem befasst. Darin wird ein effizienter Weg beschrieben, die Stärken des Flash-Speichers zu nutzen, um den Speicher-Overhead zu reduzieren und die Leistung von LLMs zu steigern. Mit anderen Worten: Apple arbeitet hart daran, sicherzustellen, dass ein hochwertiges LLM vollständig auf einem iPhone ausgeführt werden kann.
Aber das ist nur eine der großen Herausforderungen, denen sich eine Siri mit erweiterten KI-Fähigkeiten stellen muss. Es gibt zahlreiche Beispiele dafür, dass Nutzer die Chatbots von heute ohne Schwierigkeiten dazu bringen, etwas Rassistisches, Sexistisch, Antisemitisches oder anderweitig Problematisches auszugeben, und zwar aufgrund der Daten, auf denen sie trainiert wurden.
Um zumindest sicherzustellen, dass die KI von Apple einigermaßen genaue Ergebnisse in Bezug auf Tatsachen liefert, möchte Apple Inhalte von großen Nachrichtenorganisationen lizenzieren, um die KI zu trainieren. Das ist eine gute Idee - es ist einfach, eine KI zu entwickeln, die als Schnittstelle für eine Suchmaschine dient und eine neue Zusammenfassung erstellt. Die Verwendung hochwertiger und zuverlässiger Berichterstattung über Ereignisse ist ein noch besserer Weg, um mehr Vertrauen ins System insgesamt zu bringen.
Apple möchte natürlich so viel wie möglich von seiner generativen KI auf dem Gerät laufen lassen, aber für viele der Informationen muss sie sich auch weiterhin mit dem Internet verbinden (auch wenn sie vieles offline erledigen kann). Aktuelle Wetter- oder Verkehrsinformationen, aktuelle Ereignisse, die Suche nach irgendwelchen Fakten, "Kann mein Hund Brokkoli essen?", und viele andere Abfragen erfordern einen Internetzugang und das wird sicherlich auch bei einer neuen, von der Gen-AI-gestützten Siri-Generation der Fall sein. Apple wird sich zweifellos große Mühe geben, zu erklären, dass unsere Anfragen anonymisiert sind und so privat wie möglich gehalten werden.
Gen-AI in kreativen Werkzeugen
Der Einsatz von generativer KI in Kreativ-Tools ist ein weiterer Bereich, in dem Apple große Chancen, aber auch ein schwieriges Minenfeld zu durchqueren hat.
Der Magic Eraser von Google entfernt Objekte aus Fotos, indem er sie identifiziert und herausschneidet und dann den Bereich mit generierten Bildern ausfüllt. Das ist ein toller Trick, den Apple-Benutzer auch gerne haben würden. Und das ist erst der Anfang. Generative KI könnte ein Foto über seine ursprünglichen Grenzen hinaus "erweitern". Apple kann bereits bestimmte Personen in Ihrem Fotoarchiv identifizieren - wie wäre es, wenn Sie eine Person namentlich auswählen könnten, um sie einem Foto hinzuzufügen?
Bereits heute werden iPhone-Fotos stark manipuliert, aber zumindest werden Motive nicht vollständig entfernt oder hinzugefügt. Apple müsste vermutlich sicherstellen, dass Bilder, die mit dieser Art von Werkzeugen manipuliert wurden, Metadaten und andere Identifikatoren haben, anhand derer man erkennen kann, dass sie manipuliert wurden.
Es gibt noch viele weitere Einsatzmöglichkeiten von GenAI. Stellen Sie sich vor, Sie schließen Ihr iMovie oder Final Cut Pro Videoprojekt ab und erstellen eine völlig originelle, lizenzfreie Musikuntermalung, indem Sie sie einfach mit ein paar Worten beschreiben. KI könnte einen 3D-Scan Ihres Gesichts erstellen (ähnlich wie bei Face-ID) und ein Memoji generieren, das Ihrem echten Gesicht am ähnlichsten ist.
Kreativere Bildgenerierung ist nicht unbedingt etwas, woran Apple sich beteiligt. Ein Apple-Äquivalent zu Dall-E oder Midjourney passt einfach nicht ins Produktportfolio von Cupertino. Aber es gibt viele Apps, die diese Werkzeuge nutzen, um aus Menschen aus vorhandenen Fotos Avatare in wilden Stilen zu erstellen und sie wie ein Gemälde von Norman Rockwell, eine Disney-Prinzessin oder eine Pixar-Figur aussehen lassen. Sie können auch Hintergründe ersetzen und die Beleuchtung verändern, um wirklich kreative und lustige Porträts zu erstellen.
Es ist nicht schwer, sich vorzustellen, dass Apple generative KI in den "Filtern" einsetzen könnte, die es beispielsweise im Kontaktposter-Editor oder der Clips-App anbietet, um Ihnen ähnliche Ergebnisse zu ermöglichen oder die sogar in Echtzeit während Facetime-Gesprächen laufen.
Die Herausforderung bei generativer KI für kreative Tools besteht nicht darin, Bereiche zu finden, an denen sie eingesetzt werden können, sondern sicherzustellen, dass sie sicher sind - sowohl aus rechtlicher Sicht (keine Plagiate oder Urheberrechtsverletzungen) als auch aus sozialer Sicht (nichts zu produzieren, was nicht zu den Werten von Apple passt).
Bequemlichkeit und Produktivitätsfunktionen
Die größte Chance für Apple liegt vielleicht im am wenigsten sexy Bereich der KI: die Entwicklung von Komfort- und Produktivitätsfunktionen. So wie Microsoft KI-Tools in Office integriert, wird Apple irgendwann KI-Funktionen in seine iWork-Suite (Pages, Numbers, Keynote) einbauen müssen. Das macht zwar keine Schlagzeilen oder hat Meme-Potenzial, kann aber sehr nützlich sein.
Anstelle von statischen Vorlagen können Sie eine KI bitten, einen einseitigen Lebenslauf zu erstellen und sie wird alles für Sie erledigen, vielleicht mit ein paar zusätzlichen Fragen. Aus einer kurzen Eingabe könnte sie ein komplettes, korrekt formatiertes Anschreiben erstellen. Sie benötigen Hilfe bei der Erstellung einer Präsentation? Lassen Sie KI Ihre Folie aus ein paar wichtigen Aufzählungspunkten, einer Audioaufnahme Ihrer begleitenden Rede oder einigen Fotos erstellen.
Eine der besten Anwendungen für generative KI ist die Erstellung prägnanter Zusammenfassungen von Abhandlungen, Artikeln und so weiter. Es heißt, dass Apple eine solche Funktion in Erwägung zieht, die entweder als Funktion von Siri oder Safari zum Einsatz kommen könnte (oder beides).
KI-generierte Wiedergabelisten für Apple Music sind Gerüchten zufolge ebenfalls in Planung. Das ist nicht besonders neu oder aufregend, aber vielleicht hat Apple vor, dem Ganzen einen neuen Twist zu geben. Das Unternehmen könnte die Daten, auf die es auf Ihrem iPhone Zugriff hat, nutzen, um auf Basis Ihrer aktuellen Aktivität (Autofahren, Trainieren, Lernen, Spazierengehen usw.), dem aktuellen Wetter und der Tageszeit sowie Ihrer Apple-Music-Hörhistorie genau die richtige Playlist für den genau diesen Moment zu erstellen, und zwar direkt auf dem Gerät.
Kurzbefehle sollten ein großes Ziel für die KI-Agenda von Apple sein. Sie sind ein furchtbar mächtiges Werkzeug, aber ich habe noch keinen Nichttechniker getroffen, der sie überhaupt benutzt. Es nicht direkt Coding, aber selbst die Schritt-für-Schritt-Skripterstellung, so einfach sie auch ist, ist für die meisten Benutzer viel zu einschüchternd. Stellen Sie sich eine künstliche Intelligenz vor, die eine einfache Text- oder Sprachbeschreibung dessen, was Sie tun möchten, aufnimmt und einen Kurzbefehl für Sie erstellt! Das ist einfacher als mit einer KI zu coden und bereits recht beliebt.
Apropos: Es wäre geradezu verrückt, wenn die nächste Hauptversion von Xcode keine KI-Codegenerierung enthalten würde (zumindest für Swift, das Apple gerne stärker fördern würde). Es gibt bereits Source-Editor-Erweiterungen für Xcode, die KI-Code generieren, aber Apple möchte wahrscheinlich etwas Integriertes, das vollständig auf lokaler Hardware laufen kann. Mark Gurmans jüngste Power-On-Kolumne legt nahe, dass Apple genau das tun wird.
Diese Art von Funktionen sind leichte Beute für Apple, weil sie unumstritten sind. Sie haben kaum eine Chance, problematische Bilder oder Audio zu erzeugen oder Hassreden auszuspucken, weil die Trainingsdaten nicht sorgfältig genug kuratiert wurden. Aber sie sind auch nicht die Art von Dingen, die Normalanwender begeistern, die Menschen online teilen und Millionen von Nutzern dazu bringen, sich ein neues iPhone zu kaufen.
Was auch immer Apple dieses Jahr mit KI in seiner Software anstellt, es hat einen großen Vorteil gegenüber all den Chat-GPTs, Bings und Stable Diffusions dieser Welt: Es ist eingebaut. Die Werkzeuge von Apple werden automatisch auf eine Milliarde iPhones heruntergeladen und selbst in Fällen, in denen sie mit Werkzeugen von Drittanbietern konkurrieren, werden sie standardmäßig installiert sein. Das ist ein enormer Vorteil und eine große Chance - aber auch eine große Verantwortung. Zumindest für eine Weile werden die Tools von Drittanbietern wahrscheinlich leistungsfähiger bleiben und sei es nur, weil sie nicht ganz so vorsichtig sein müssen.