By Sean Chen, 11 de Junho de 2024
A Apple acabou de lançar o mais recente Apple Intelligence, com funcionalidades que incluem escrita, conversão de voz para texto e resumo, respostas inteligentes, ferramentas de escrita, geração de imagens ou emojis, entre outros, e o mais importante, tornar a Siri mais próxima de um verdadeiro assistente de voz.
Ao apresentar as primeiras ferramentas, à primeira vista, parece que a Apple novamente está introduzindo funcionalidades que o Android já possui há algum tempo.
Mas ao ver a próxima geração da Siri, percebe-se a forte capacidade de design e integração da Apple em seus produtos.
Pelo que foi apresentado no Keynote e nas informações do site oficial, não parece que a Apple usou apenas o GPT-4o como modelo para o Apple Intelligence. Com base nos dispositivos A17 Pro e hardware da série M, parece que a Apple incorporou pequenos modelos de linguagem ou modelos de geração de imagens específicos nos dispositivos. E ao mesmo tempo, utiliza sua mais recente tecnologia Private Cloud Compute para permitir que o Apple Intelligence ou a Siri usem modelos de linguagem em nuvem, garantindo a privacidade.
Parece que o modelo de linguagem gerativo desta vez foi especialmente treinado para cenários comuns em dispositivos móveis. E o modelo GPT-4o, em parceria com a OpenAI, é usado apenas em cenários mais avançados, como perguntas de lógica complexa. Isso também permite que a IA por trás da Siri se concentre mais em melhorar a "experiência de uso dos produtos Apple", tornando o modelo mais focado e leve. A combinação de diferentes serviços alivia a pressão da Apple em acompanhar a GenAI e, ao mesmo tempo, enfrenta diretamente a integração do GenAI Chatbot da Microsoft Copilot no sistema operacional.
No caminho do desenvolvimento de grandes modelos de linguagem, parece que o objetivo da Apple não é perseguir benchmarks de LLM, mas sim retornar ao próprio produto, permitindo que o LLM sirva ao produto, em vez de buscar apenas o desempenho e a capacidade multimodal do LLM.
No entanto, até o final de 2024, apenas a Siri em inglês com suporte de IA estará disponível. Outros dispositivos antigos ou usuários que não falam inglês ainda terão que usar a versão antiga da Siri sem suporte a LLM. Nesse sentido, na corrida dos modelos de linguagem, a Apple ainda está atrás de concorrentes como OpenAI, Microsoft ou Google, e parece que ainda há um longo caminho para suportar outros idiomas (ou alcançar precisão nesses idiomas).
Mas, no geral, em termos de "experiência de uso", ainda estará à frente dos concorrentes atuais.
Atualmente, outros principais players do mercado de LLM: O ChatGPT da OpenAI permanece no nível de "ChatBot", e para avançar, depende da venda de APIs para desenvolvedores integrarem. O Gemeni do Google e o Copilot da Microsoft no PC também estão no nível de "ChatBot+", ou seja, um ChatBot com integração adicional de funções externas, mas ainda são os players mais prováveis de alcançar uma integração profunda de LLM. Outras grandes empresas de hardware como Samsung e Asus parecem ainda estar no estágio de "função", como pesquisa de imagens, tradução em tempo real, edição de fotos com IA ou pesquisa de imagens.
No caso do Apple Intelligence, parece que já elevou o serviço LLM ao nível de "experiência", permitindo que a IA alcance uma verdadeira "relevância". Com a premissa de alcançar "relevância", o número de cenários ou funções que os usuários podem usar aumentará significativamente, até mesmo se aproximando do infinito, e só assim o ideal de um assistente de IA pode ser verdadeiramente realizado. Em resumo, sob o poderoso ecossistema da Apple, outros modelos de linguagem, por mais poderosos que sejam, terão dificuldade em abalar a competitividade da Apple em "integrar profundamente o LLM na vida dos usuários", e espera-se que no futuro, todos os LLMs possam se integrar mais profundamente nos cenários de vida dos usuários.
Os termos 'URL' e 'Domínio' podem parecer semelhantes, mas são bem diferentes! O que realmente acontece quando você digita google.com no navegador? E como isso se relaciona com domínios e URLs? Este artigo irá esclarecer tudo de forma clara e prática!
LEIA MAISAo viajar para o exterior, se você é do tipo que nunca se lembra de quanto gastou e tem preguiça de anotar as despesas, você deve experimentar este aplicativo super útil — 'Fale e Registre'.
LEIA MAISO autoatendimento tornou-se o primeiro passo ao entrar em um restaurante e um elemento crucial da nossa experiência gastronômica. Se adicionarmos elementos interessantes, como assistentes de voz com IA, o processo de pedido pode se tornar mais intuitivo, divertido e até mais humano!
LEIA MAISCONTATE-NOS
Vamos conversar sobre suas ideias!
Impulsione seu negócio com seu parceiro digital inovador. Responderemos em até um dia útil. (GMT+8)