By Sean Chen, 11 juni 2024
Apple har precis lanserat den senaste Apple Intelligence, med funktioner som skrivverktyg, tal-till-text och sammanfattning, smarta svar, skrivverktyg, bildgenerering eller emoji-generering, och viktigast av allt, gör Siri mer som en riktig röstassistent.
Vid första anblicken av de inledande verktygen verkar det som om Apple återigen introducerar funktioner som Android redan har haft utan större påverkan.
Men när man ser nästa generation av Siri, kan man verkligen känna Apples starka design och integrationsförmåga för sina produkter.
Från den senaste Keynote och informationen på Apples webbplats verkar det inte som om Apple Intelligence enbart använder GPT-4o som modell. Med tanke på de enheter som stöds, som A17 Pro och M-seriens hårdvara, verkar det som om Apple har integrerat små språkmodeller eller specifika bildgenereringsmodeller i enheterna. Samtidigt använder de sin senaste Private Cloud Compute-teknik för att låta Apple Intelligence eller Siri använda stora språkmodeller i molnet under förutsättning att integriteten skyddas.
Det verkar som om den generativa språkmodellen är specialtränad för vanliga scenarier på mobilen. GPT-4o-modellen, i samarbete med OpenAI, används endast i mer avancerade scenarier, som att ställa komplexa logiska frågor. Detta gör att AI bakom Siri kan fokusera mer på att förbättra "upplevelsen av att använda Apple-produkter", vilket gör modellen mer fokuserad och lättare. Genom att blanda olika tjänster minskar Apple pressen att hinna ikapp GenAI och möter samtidigt Microsoft Copilot, som direkt integrerar GenAI Chatbot i operativsystemet.
På vägen mot utveckling av stora språkmodeller verkar Apples mål inte vara att jaga olika LLM Benchmark, utan att återgå till själva produkten, så att LLM tjänar produkten istället för att bara sträva efter LLM:s prestanda och multimodala förmågor.
Men fram till slutet av 2024 kommer endast AI Siri som stöder engelska att vara tillgänglig, och äldre enheter eller icke-engelsktalande användare verkar fortfarande behöva använda den äldre versionen av Siri utan LLM-stöd. I loppet om stora språkmodeller ligger Apple fortfarande efter huvudaktörer som OpenAI, Microsoft eller Google, och det verkar som om det fortfarande finns en bit kvar innan andra språk stöds (eller att precisionen för andra språk når standarden).
Men överlag kommer "användarupplevelsen" fortfarande att leda över konkurrenterna.
För närvarande är de huvudsakliga aktörerna på LLM-marknaden: OpenAIs ChatGPT är på "ChatBot"-nivån, och för att utvecklas vidare måste ChatGPT sälja API:er för integration av utvecklare. Googles Gemeni och Microsofts Copilot på PC är för närvarande på "ChatBot+"-nivån, vilket innebär att ChatBot integrerar några externa funktioner, men de är fortfarande de mest sannolika aktörerna att uppnå djup LLM-integration. Andra hårdvarujättar som Samsung och Asus verkar fortfarande vara på "funktion"-stadiet, som bildsökning, realtidsöversättning, AI-redigering eller bildsökning.
För Apples Apple Intelligence verkar det som om LLM-tjänster redan har höjts till "upplevelse"-nivån, vilket gör AI verkligen "relevant". Med "relevant" som förutsättning kan antalet scenarier eller funktioner som användaren kan använda öka avsevärt, till och med närma sig oändlighet, och därmed verkligen förverkliga drömmen om AI-assistenten. Sammanfattningsvis, under Apples starka ekosystem, är det svårt för andra språkmodeller att rubba Apples konkurrenskraft att "integrera LLM djupt i användarens liv", och vi ser fram emot att framtida LLM kan integreras djupare i användarens livsscenarier.
Orden 'webbadress' och 'domän' ser lite lika ut, men de är inte samma sak! Vad händer egentligen när du skriver in google.com i webbläsaren? Och hur är detta relaterat till domän och webbadress? Den här artikeln kommer att hjälpa dig att förstå detta på ett klart och praktiskt sätt!
LÄS MEROm du alltid glömmer hur mycket du har spenderat när du reser utomlands och är för lat för att skriva ner dina utgifter, måste du prova denna superpraktiska app - 'SaySay Expense'.
LÄS MERSjälvbetjäning vid beställning har blivit vårt första steg när vi går in på en restaurang och en viktig del av vår matupplevelse. Om vi lägger till några roliga element, som AI-röstassistenter, kan beställning bli mer intuitiv, rolig och till och med mer mänsklig!
LÄS MERKONTAKTA OSS
Låt oss prata om dina idéer!
Kickstarta ditt företag med din innovativa digitala partner. Vi svarar inom en arbetsdag. (GMT+8)