Terug

Bespreking van de recent gepresenteerde WWDC24 - Siri met Apple Intelligence

By Sean Chen, 11 juni 2024

wwdc24

Apple heeft zojuist de nieuwste Apple Intelligence aangekondigd, met functies zoals schrijven, spraak naar tekst en samenvattingen, slimme antwoorden, schrijfhulpmiddelen, beeld- of emoji-generatie, en het belangrijkste is dat Siri dichter bij een echte spraakassistent komt.

Bij de introductie van de eerste paar tools lijkt het op het eerste gezicht alsof Apple opnieuw functies introduceert die Android al lang heeft.

Maar bij het zien van de volgende generatie Siri, wordt de sterke ontwerp- en integratiecapaciteit van Apple voor hun producten duidelijk.

Niet puur gebruik van GPT-4o zoals gespeculeerd

Uit de informatie van de Keynote en de officiële website blijkt dat het niet puur gebruik maakt van GPT-4o als model voor Apple Intelligence. Gezien de apparaten die het kunnen gebruiken, zoals de A17 Pro en M-serie hardware, lijkt het erop dat Apple een klein taalmodel of een specifiek beeldgeneratiemodel in het apparaat heeft geïntegreerd. Tegelijkertijd maakt het gebruik van de nieuwste Private Cloud Compute-technologie om, met behoud van privacy, Apple Intelligence of Siri toegang te geven tot grote taalmodellen in de cloud.

Het lijkt erop dat het gegenereerde taalmodel van Apple specifiek is getraind voor veelvoorkomende mobiele scenario's. Het GPT-4o model, in samenwerking met OpenAI, wordt alleen gebruikt voor geavanceerdere scenario's, zoals het stellen van complexe logische vragen. Dit stelt de AI achter Siri in staat zich meer te richten op het verbeteren van de "Apple-productervaring", waardoor het model meer gefocust en lichter wordt. Door verschillende diensten te combineren, vermindert Apple de druk om GenAI in te halen en gaat het de directe integratie van GenAI Chatbot-functies in het OS van Microsoft Copilot aan.

Op de weg naar het ontwikkelen van grote taalmodellen lijkt Apple niet gericht op het najagen van verschillende LLM-benchmarks, maar eerder op het terugkeren naar het product zelf, zodat LLM het product dient, in plaats van alleen maar de prestaties en multimodale capaciteiten van LLM na te streven.

Tot eind 2024 is er echter alleen een AI Siri die Engels ondersteunt. Andere oudere apparaten of niet-Engelstalige gebruikers lijken nog steeds de oude versie van Siri zonder LLM-ondersteuning te moeten gebruiken. In de race om grote taalmodellen loopt Apple nog steeds achter op mainstream spelers zoals OpenAI, Microsoft of Google, en het lijkt erop dat het ondersteunen van andere talen (of het bereiken van nauwkeurigheid in andere talen) nog een weg te gaan heeft.

Maar over het algemeen zal het in termen van "gebruikerservaring" nog steeds voorop lopen bij de huidige concurrenten.

Van "ChatBot" naar "ChatBot+" naar "Ervaring"

Bij de huidige andere grote spelers op de LLM-markt: OpenAI's ChatGPT blijft op het niveau van "ChatBot", en om verder te komen, moet het vertrouwen op het verkopen van API's aan ontwikkelaars voor integratie. Google's Gemini en Microsoft Copilot op pc's bevinden zich momenteel ook op het "ChatBot+"-niveau, wat betekent dat de ChatBot iets meer externe functies integreert, maar ze zijn nog steeds de meest waarschijnlijke spelers om diepe LLM-integratie te bereiken. Andere hardwaregiganten zoals Samsung en ASUS lijken nog steeds op het "functie"-niveau te zitten, zoals cirkelzoeken, realtime vertaling, AI-fotobewerking of beeldzoeken.

Met Apple Intelligence lijkt Apple LLM-diensten naar het "ervaringsniveau" te hebben gebracht, waardoor AI echt "relevant" wordt. Onder de voorwaarde van "relevant" kunnen gebruikers veel meer scenario's of functies gebruiken, zelfs bijna onbeperkt, en kan de ideale AI-assistent echt worden gerealiseerd. Kortom, binnen het sterke Apple-ecosysteem is het moeilijk voor andere taalmodellen om Apple's concurrentievermogen in "het diep integreren van LLM in het leven van gebruikers" te overtreffen, en we kijken uit naar een toekomst waarin LLM's dieper geïntegreerd worden in de levensscenario's van gebruikers.

MEER VAN ONZE BLOG

Neem contact op

NEEM CONTACT OP

Laten we praten over uw ideeën!

Geef uw bedrijf een vliegende start met uw innovatieve digitale partner. Wij reageren binnen één werkdag. (GMT+8)