Назад

Обговорення новинок WWDC24 - Siri з Apple Intelligence

By Sean Chen, 11 червня 2024 р.

wwdc24

Apple щойно представила новітню Apple Intelligence, функції якої включають написання, перетворення голосу в текст та резюме, розумні відповіді, інструменти для написання, генерацію зображень або емодзі тощо, і найголовніше, зробила Siri ближчою до справжнього голосового асистента.

На перший погляд, при презентації кількох інструментів, здається, що Apple знову використовує методику поступового вдосконалення, представляючи функції, які вже давно є на Android.

Але коли бачиш нове покоління Siri, відчуваєш потужний дизайн та інтеграційні можливості Apple щодо своїх продуктів.

Не просто використання GPT-4o, як передбачалося

З інформації, представленої на Keynote та офіційному сайті, не виглядає, що Apple Intelligence просто використовує GPT-4o як модель. З огляду на пристрої A17 Pro та M серії, здається, що Apple інтегрувала невеликі мовні моделі або моделі генерації зображень безпосередньо в пристрої. Водночас, використовуючи новітню технологію Private Cloud Compute, Apple Intelligence або Siri можуть використовувати великі мовні моделі в хмарі, зберігаючи конфіденційність.

Цього разу, здається, що генеративна мовна модель Apple спеціально тренована для часто використовуваних сценаріїв на смартфонах. Модель GPT-4o, розроблена у співпраці з OpenAI, використовується лише для більш складних сценаріїв, таких як запити з логічними питаннями. Це також дозволяє AI Siri більше зосередитися на покращенні "досвіду використання продуктів Apple", роблячи модель більш спеціалізованою та легшою. Поєднання різних сервісів зменшує тиск на Apple у гонитві за GenAI, а також протистоїть інтеграції GenAI Chatbot у ОС від Microsoft Copilot.

На шляху розробки великих мовних моделей, Apple, здається, не прагне досягти різних LLM Benchmark, а повертається до самого продукту, дозволяючи LLM обслуговувати продукт, а не просто гнатися за продуктивністю LLM та мультимодальними можливостями.

Однак до кінця 2024 року ми побачимо AI Siri, що підтримує лише англійську мову. Інші старі пристрої або користувачі, які не використовують англійську, здається, все ще можуть використовувати стару версію Siri без підтримки LLM. У цьому сенсі в гонитві за великими мовними моделями Apple все ще відстає від таких основних гравців, як OpenAI, Microsoft або Google, і, здається, ще є шлях до підтримки інших мов (або досягнення точності для інших мов).

Але загалом, у "досвіді використання" Apple все ще буде попереду своїх конкурентів.

Від "ChatBot" до "ChatBot+" до "досвіду"

На даний момент основні гравці на ринку LLM: OpenAI з ChatGPT залишається на рівні "ChatBot", і щоб вийти за межі ChatGPT, вони можуть лише продавати API для інтеграції розробникам. Google з Gemeni та Microsoft з Copilot на ПК також знаходяться на рівні "ChatBot+", тобто ChatBot з додатковою інтеграцією зовнішніх функцій, але вони все ще є найбільш ймовірними гравцями на ринку, які можуть досягти глибокої інтеграції LLM. Інші великі виробники обладнання, такі як Samsung та Asus, здається, все ще залишаються на рівні "функцій", таких як пошук за зображеннями, миттєвий переклад, AI-редагування фотографій або пошук зображень.

Що стосується Apple Intelligence, здається, що LLM-сервіс вже піднявся до рівня "досвіду", дозволяючи AI досягти справжньої "релевантності" (relevance). За умови досягнення "релевантності", кількість сценаріїв або функцій, які користувачі можуть використовувати, значно зросте, навіть наближаючись до нескінченності, і лише тоді можна буде реалізувати ідеал AI-асистента. Загалом, у потужній екосистемі Apple, інші мовні моделі, якими б потужними вони не були, навряд чи зможуть похитнути конкурентоспроможність Apple у "глибокій інтеграції LLM у життя користувачів", і ми сподіваємося, що в майбутньому всі LLM зможуть глибше інтегруватися в життєві сценарії користувачів.

БІЛЬШЕ З НАШОГО БЛОГУ

Зв'яжіться з нами

ЗВ'ЯЖІТЬСЯ З НАМИ

Давайте поговоримо про ваші ідеї!

Запустіть свій бізнес разом з інноваційним цифровим партнером. Ми відповімо протягом одного робочого дня. (GMT+8)