Zpět

Diskutujeme o právě vydané WWDC24 - Siri s Apple Intelligence

By Sean Chen, 11. června 2024

wwdc24

Apple právě vydal nejnovější Apple Intelligence, která zahrnuje funkce jako psaní, převod řeči na text a shrnutí, inteligentní odpovědi, nástroje pro psaní, generování obrázků nebo emotikonů a nejdůležitější je, že Siri se stává skutečnějším hlasovým asistentem.

Na první pohled při představení několika nástrojů to vypadá, jako by Apple opět představil funkce, které Android již dlouho má.

Nicméně při pohledu na novou generaci Siri je cítit silný design a schopnost integrace Apple produktů.

Není to čistě použití GPT-4o, jak se spekulovalo

Z informací z Keynote a oficiálních stránek to nevypadá, že by Apple Intelligence čistě používal GPT-4o jako model. Podle podporovaných zařízení A17 Pro a M série to vypadá, že Apple integroval malé jazykové modely nebo modely pro generování obrázků přímo do zařízení. Současně využívá nejnovější technologii Private Cloud Compute, která umožňuje Apple Intelligence nebo Siri používat velké jazykové modely v cloudu při zachování soukromí.

Zdá se, že tento generativní jazykový model je speciálně trénován pro běžné scénáře na mobilních zařízeních. Model GPT-4o, vyvinutý ve spolupráci s OpenAI, je využíván pouze pro pokročilejší scénáře, jako je řešení složitých logických otázek. Tím se AI za Siri může více zaměřit na zlepšení „zkušenosti s používáním Apple produktů“, což činí model více zaměřeným a lehčím. Kombinace různých služeb snižuje tlak na Apple v závodě s GenAI a zároveň čelí Microsoft Copilot, který integruje GenAI Chatbot přímo do OS.

Na cestě vývoje velkých jazykových modelů se zdá, že cílem Apple není honit se za různými LLM Benchmarky, ale vrátit se k samotnému produktu a umožnit, aby LLM sloužilo produktu, místo aby se slepě honilo za výkonem a multimodálními schopnostmi LLM.

Do konce roku 2024 bude k dispozici pouze anglická verze AI Siri. Starší zařízení nebo uživatelé jiných jazyků budou muset používat starší verzi Siri bez podpory LLM. V závodě s velkými jazykovými modely je Apple stále pozadu za hlavními hráči jako OpenAI, Microsoft nebo Google a podpora dalších jazyků (nebo dosažení přesnosti v jiných jazycích) se zdá být ještě daleko.

Celkově však v oblasti „uživatelské zkušenosti“ stále vede před současnými konkurenty.

Od „ChatBot“ k „ChatBot+“ k „zkušenosti“

Mezi hlavními hráči na trhu LLM: OpenAI's ChatGPT zůstává na úrovni „ChatBot“, a aby se posunul dál, musí prodávat API vývojářům pro integraci. Google's Gemeni a Microsoft PC's Copilot jsou na úrovni „ChatBot+“, což znamená, že ChatBot je více integrován s externími funkcemi, ale stále jsou to hráči s největší šancí na hlubokou integraci LLM. Ostatní velcí výrobci hardwaru jako Samsung a Asus se zdají být stále na úrovni „funkce“, jako je vyhledávání obrázků, překlad v reálném čase, AI úprava fotografií nebo vyhledávání obrázků.

Pokud jde o Apple Intelligence, zdá se, že LLM služby byly povýšeny na úroveň „zkušenosti“, což umožňuje AI dosáhnout skutečné „relevance“. Při dosažení „relevance“ se výrazně zvyšuje počet scénářů nebo funkcí, které uživatel může využít, a dokonce se blíží nekonečnu, což umožňuje skutečně realizovat ideál AI asistenta. Celkově vzato, v rámci silného ekosystému Apple je obtížné, aby jiné jazykové modely narušily konkurenceschopnost Apple v „hluboké integraci LLM do života uživatelů“, a těšíme se na budoucí hlubší integraci LLM do životních scénářů uživatelů.

VÍCE Z NAŠEHO BLOGU

Kontaktujte nás

KONTAKTUJTE NÁS

Pojďme si promluvit o vašich nápadech!

Nastartujte své podnikání s inovativním digitálním partnerem. Odpovíme vám do jednoho pracovního dne. (GMT+8)