By Sean Chen, 11 Iunie 2024
Apple a lansat recent noul Apple Intelligence, care include funcții precum scrierea, transcrierea vocală și sumarizarea, răspunsuri inteligente, unelte de scriere, generare de imagini sau emoji-uri, și cel mai important, transformând Siri într-un asistent vocal mai apropiat de realitate.
La prima vedere, introducerea acestor unelte pare a fi o altă mișcare de tipul „stoarcerea tubului de pastă de dinți” de la Apple, prezentând funcții care au fost deja disponibile pe Android.
Dar când vezi noua generație de Siri, simți din nou puterea designului și integrării produselor Apple.
Din informațiile prezentate în Keynote și pe site-ul oficial, nu pare că Apple Intelligence folosește pur și simplu modelul GPT-4o. Din perspectiva dispozitivelor compatibile, cum ar fi A17 Pro și seria M, se pare că Apple a integrat modele lingvistice mici sau modele de generare de imagini cu scop specific în dispozitive. În același timp, folosind cea mai recentă tehnologie Private Cloud Compute, Apple Intelligence sau Siri poate utiliza modele lingvistice mari din cloud, asigurând confidențialitatea.
Se pare că modelul lingvistic generativ este special antrenat pentru scenarii comune pe telefoane. Modelul GPT-4o, dezvoltat în colaborare cu OpenAI, este utilizat doar în scenarii mai avansate, cum ar fi întrebările logice complexe. Aceasta permite AI-ului din spatele Siri să se concentreze mai mult pe îmbunătățirea „experienței utilizării produselor Apple”, făcând modelul mai concentrat și mai ușor. Combinarea diferitelor servicii reduce presiunea asupra Apple de a ține pasul cu GenAI și, de asemenea, contracarează direct integrarea GenAI Chatbot de către Microsoft Copilot în sistemul de operare.
Pe drumul dezvoltării modelelor lingvistice mari, Apple pare să nu urmărească diversele benchmark-uri LLM, ci să se concentreze pe produsul în sine, făcând ca serviciile LLM să servească produsul, în loc să urmărească pur și simplu performanța și capacitățile multimodale ale LLM.
Cu toate acestea, până la sfârșitul anului 2024, doar AI Siri care suportă limba engleză va fi disponibil. Alte dispozitive mai vechi sau utilizatorii care nu vorbesc engleza vor trebui să folosească versiunea veche de Siri, care nu suportă LLM. În această cursă a modelelor lingvistice mari, Apple este încă în urma liderilor de piață precum OpenAI, Microsoft sau Google, și pare să mai aibă un drum de parcurs pentru a sprijini alte limbi (sau pentru a atinge precizia necesară în alte limbi).
Cu toate acestea, în ceea ce privește „experiența utilizatorului”, Apple va rămâne în fruntea concurenței.
În prezent, alți jucători principali din piața LLM: ChatGPT de la OpenAI rămâne la nivelul de „ChatBot”, iar pentru a evolua, se bazează pe vânzarea de API-uri pentru integrare de către dezvoltatori. Gemeni de la Google și Copilot de la Microsoft pe PC sunt la nivelul „ChatBot+”, adică un ChatBot cu integrare suplimentară a funcțiilor externe, dar rămân cei mai probabili jucători care pot realiza o integrare profundă a LLM. Alte companii mari de hardware, cum ar fi Samsung și Asus, par să fie încă la nivelul „funcționalității”, cum ar fi căutarea de imagini, traducerea în timp real, editarea foto AI sau căutarea de imagini.
În ceea ce privește Apple Intelligence, pare că a ridicat serviciile LLM la nivelul de „experiență”, făcând AI-ul cu adevărat „relevant”, iar în condițiile în care este „relevant”, numărul de scenarii sau funcții pe care utilizatorii le pot folosi va crește semnificativ, chiar tinde spre infinit, realizând astfel idealul unui asistent AI. În concluzie, sub puternicul ecosistem Apple, alte modele lingvistice, oricât de puternice ar fi, vor avea dificultăți în a concura cu capacitatea Apple de a „integra profund LLM în viața utilizatorilor”, și așteptăm cu nerăbdare ca toate modelele LLM să se integreze mai profund în scenariile de viață ale utilizatorilor.
Termenii „URL” și „domeniu” par similari, dar sunt diferiți! Ce se întâmplă în spatele scenei când introduci google.com în browser? Cum sunt acestea legate de domeniu și URL? Acest articol te va ajuta să înțelegi clar și practic!
CITEȘTE MAI MULTCând călătorești în străinătate și nu îți amintești cât ai cheltuit sau ești prea leneș să notezi cheltuielile, trebuie să încerci această aplicație super utilă — „Spune și Notează”.
CITEȘTE MAI MULTAuto-comandarea a devenit primul pas când intrăm într-un restaurant și o parte esențială a experienței noastre culinare. Dacă adăugăm elemente interesante, cum ar fi asistenții vocali AI, comandarea poate deveni mai intuitivă, distractivă și chiar mai umanizată!
CITEȘTE MAI MULTCONTACTEAZĂ-NE
Hai să vorbim despre ideile tale!
Pornește-ți afacerea cu partenerul tău digital inovator. Vom răspunde în maxim o zi lucrătoare. (GMT+8)