By Sean Chen, Ngày 11 tháng 6 năm 2024
Apple vừa phát hành Apple Intelligence mới nhất, với các tính năng bao gồm viết, chuyển giọng nói thành văn bản và tóm tắt, trả lời thông minh, công cụ viết, tạo hình ảnh hoặc biểu tượng cảm xúc, và quan trọng nhất là làm cho Siri trở nên gần gũi hơn với trợ lý giọng nói thực sự.
Khi giới thiệu các công cụ đầu tiên, thoạt nhìn, giống như Apple lại một lần nữa áp dụng chiến thuật nhỏ giọt, giới thiệu một số tính năng không mấy ấn tượng mà Android đã có từ lâu.
Nhưng khi nhìn thấy thế hệ Siri tiếp theo, bạn sẽ cảm nhận được khả năng thiết kế và tích hợp mạnh mẽ của Apple đối với sản phẩm của mình.
Từ Keynote và thông tin trên trang web chính thức, không giống như dự đoán ban đầu rằng chỉ sử dụng GPT-4o làm mô hình cho Apple Intelligence. Dựa trên các thiết bị có thể sử dụng như A17 Pro và phần cứng dòng M, có vẻ như Apple đã tích hợp mô hình ngôn ngữ nhỏ hoặc mô hình tạo hình ảnh cho mục đích cụ thể vào thiết bị. Đồng thời sử dụng công nghệ Private Cloud Compute mới nhất của mình, cho phép Apple Intelligence hoặc Siri sử dụng mô hình ngôn ngữ lớn trên đám mây mà vẫn bảo đảm quyền riêng tư.
Có vẻ như mô hình ngôn ngữ tạo ra lần này là mô hình mới được Apple đào tạo đặc biệt cho các tình huống thường gặp trên điện thoại. Mô hình GPT-4o hợp tác với OpenAI chỉ được sử dụng trong các tình huống phức tạp hơn, chẳng hạn như hỏi các câu hỏi logic phức tạp. Điều này cũng giúp AI đứng sau Siri tập trung hơn vào việc cải thiện "trải nghiệm sử dụng sản phẩm Apple", làm cho mô hình này tập trung và nhẹ nhàng hơn. Việc kết hợp các dịch vụ khác nhau đã giảm bớt áp lực cho Apple trong việc theo kịp GenAI, đồng thời đối đầu trực tiếp với tính năng tích hợp GenAI Chatbot của Microsoft Copilot trong hệ điều hành.
Trên con đường phát triển mô hình ngôn ngữ lớn, có vẻ như mục tiêu của Apple không phải là theo đuổi các tiêu chuẩn LLM Benchmark khác nhau, mà là quay trở lại với sản phẩm, để dịch vụ LLM phục vụ sản phẩm, thay vì chỉ đơn thuần theo đuổi hiệu suất và khả năng đa phương thức của LLM.
Tuy nhiên, trước cuối năm 2024, chỉ có thể thấy AI Siri hỗ trợ tiếng Anh, các thiết bị cũ hơn hoặc người dùng không sử dụng tiếng Anh có vẻ vẫn chỉ có thể sử dụng phiên bản Siri cũ không hỗ trợ LLM. Về mặt này, trong cuộc đua mô hình ngôn ngữ lớn, Apple vẫn tụt hậu so với các đối thủ chính như OpenAI, Microsoft hoặc Google, và có vẻ như việc hỗ trợ các ngôn ngữ khác (hoặc đạt độ chính xác cho các ngôn ngữ khác) vẫn còn một khoảng cách.
Nhưng nhìn chung, về "trải nghiệm sử dụng", vẫn sẽ dẫn đầu so với các đối thủ hiện tại.
Với các đối thủ chính trên thị trường LLM hiện tại: ChatGPT của OpenAI vẫn ở mức "ChatBot", để vượt qua ChatGPT hiện tại chỉ có thể dựa vào việc bán API cho các nhà phát triển để tích hợp. Gemeni của Google và Copilot trên PC của Microsoft hiện cũng ở mức "ChatBot+", tức là ChatBot được tích hợp thêm một số tính năng bên ngoài, nhưng vẫn là những người chơi có khả năng tích hợp sâu LLM nhất trên thị trường. Các hãng phần cứng khác như Samsung và Asus dường như vẫn dừng lại ở giai đoạn "tính năng", chẳng hạn như tìm kiếm hình ảnh, dịch thuật thời gian thực, chỉnh sửa ảnh AI hoặc tìm kiếm hình ảnh.
Với Apple Intelligence của Apple, dường như đã nâng dịch vụ LLM lên mức "trải nghiệm", làm cho AI thực sự "liên quan" (relevant), với điều kiện "liên quan" được thực hiện, số lượng tình huống hoặc tính năng mà người dùng có thể sử dụng sẽ tăng đáng kể, thậm chí gần như vô hạn, và chỉ khi đó mới có thể thực sự thực hiện lý tưởng của trợ lý AI. Tóm lại, dưới hệ sinh thái mạnh mẽ của Apple, các mô hình ngôn ngữ khác dù mạnh mẽ đến đâu cũng khó có thể làm lung lay khả năng cạnh tranh của Apple trong việc "tích hợp sâu LLM vào cuộc sống của người dùng", và hy vọng rằng trong tương lai các LLM khác có thể tích hợp sâu hơn vào các tình huống cuộc sống của người dùng.
Hai thuật ngữ 'URL' và 'Domain' trông có vẻ giống nhau, nhưng thực ra chúng khác nhau! Khi bạn nhập google.com vào trình duyệt, điều gì thực sự xảy ra phía sau? Và điều này liên quan như thế nào đến domain và URL? Bài viết này sẽ giúp bạn hiểu rõ một cách dễ dàng và thực tế!
XEM THÊMKhi đi du lịch nước ngoài, nếu bạn thường quên đã tiêu bao nhiêu tiền và lười gõ để ghi chép, hãy thử ngay ứng dụng siêu tiện lợi này — "Nói Nói Ghi Chép"
XEM THÊMTự phục vụ gọi món đã trở thành bước đầu tiên khi chúng ta vào nhà hàng và trở thành một phần quan trọng trong trải nghiệm ăn uống của chúng ta. Nếu thêm một số yếu tố thú vị, chẳng hạn như trợ lý giọng nói AI, có lẽ việc gọi món có thể trở nên trực quan, thú vị và thậm chí nhân văn hơn!
XEM THÊMLIÊN HỆ
Hãy cùng trao đổi về ý tưởng của bạn!
Khởi động doanh nghiệp của bạn với đối tác số sáng tạo. Chúng tôi sẽ phản hồi trong vòng một ngày làm việc. (GMT+8)