By Sean Chen, 11 de Junio de 2024
Apple acaba de lanzar el último Apple Intelligence, que incluye funciones como escritura, conversión de voz a texto y resumen, respuestas inteligentes, herramientas de escritura, generación de imágenes o emojis, etc., y lo más importante, hace que Siri se acerque más a un asistente de voz real.
Al presentar las primeras herramientas, a primera vista, parece que Apple nuevamente está introduciendo funciones que Android ya tenía desde hace tiempo.
Pero al ver la próxima generación de Siri, uno puede sentir la poderosa capacidad de diseño e integración de Apple en sus productos.
Según el Keynote y la información del sitio web, no parece que Apple Intelligence use simplemente GPT-4o como modelo. Basado en los dispositivos compatibles como A17 Pro y la serie M, parece que Apple ha integrado modelos de lenguaje pequeños o modelos de generación de imágenes específicos en los dispositivos. Al mismo tiempo, utiliza su última tecnología Private Cloud Compute para permitir que Apple Intelligence o Siri utilicen modelos de lenguaje grandes en la nube, garantizando la privacidad.
Parece que este modelo de lenguaje generativo ha sido especialmente entrenado por Apple para situaciones comunes en los teléfonos. El modelo GPT-4o, en colaboración con OpenAI, solo se utiliza en situaciones más avanzadas, como preguntas de lógica compleja. Esto permite que la IA detrás de Siri se enfoque más en mejorar la "experiencia de uso de productos Apple", haciendo el modelo más enfocado y ligero. La combinación de diferentes servicios reduce la presión de Apple para ponerse al día con GenAI y enfrenta directamente la integración de GenAI Chatbot de Microsoft Copilot en el sistema operativo.
En el camino del desarrollo de modelos de lenguaje grandes, parece que el objetivo de Apple no es perseguir varios benchmarks de LLM, sino volver al producto en sí, permitiendo que el servicio LLM sirva al producto, en lugar de simplemente buscar el rendimiento y la capacidad multimodal de LLM.
Sin embargo, hasta finales de 2024, solo se verá el AI Siri compatible con inglés, y otros dispositivos antiguos o usuarios que no hablen inglés aún tendrán que usar la versión anterior de Siri sin soporte LLM. En este sentido, en la carrera de modelos de lenguaje grandes, Apple todavía está detrás de los principales actores como OpenAI, Microsoft o Google, y parece que aún queda un camino por recorrer para soportar otros idiomas (o para que la precisión en otros idiomas alcance el estándar).
Pero en general, en términos de "experiencia de uso", seguirá liderando a sus competidores actuales.
Actualmente, otros jugadores principales en el mercado de LLM: ChatGPT de OpenAI se mantiene en el nivel de "ChatBot", y para avanzar, ChatGPT solo puede vender API para que los desarrolladores las integren. Gemeni de Google y Copilot de Microsoft en PC también están en el nivel de "ChatBot+", lo que significa que el ChatBot está más integrado con funciones externas, pero siguen siendo los jugadores más probables para lograr una integración profunda de LLM en el mercado. Otros grandes fabricantes de hardware como Samsung y Asus parecen estar todavía en la etapa de "funcionalidad", como búsqueda de imágenes, traducción en tiempo real, edición de fotos con IA o búsqueda de imágenes.
En cuanto a Apple Intelligence de Apple, parece que ya ha elevado el servicio LLM al nivel de "experiencia", haciendo que la IA sea verdaderamente "relevante". Bajo la premisa de lograr "relevancia", el número de situaciones o funciones que los usuarios pueden utilizar aumentará significativamente, incluso acercándose al infinito, y solo así se puede realizar verdaderamente el ideal de un asistente de IA. En resumen, bajo el poderoso ecosistema de Apple, otros modelos de lenguaje, por muy poderosos que sean, tendrán dificultades para desafiar la competitividad de Apple en "integrar profundamente LLM en la vida de los usuarios", y se espera que en el futuro, otros LLM puedan integrarse más profundamente en los contextos de vida de los usuarios.
Los términos 'URL' y 'dominio' pueden parecer similares, ¡pero son diferentes! ¿Qué sucede realmente cuando escribes google.com en tu navegador? ¿Y cómo se relacionan el dominio y la URL? Este artículo te lo explicará de manera clara y práctica.
LEER MÁSCuando viajas al extranjero, ¿siempre olvidas cuánto has gastado y te da pereza anotar los gastos? Entonces, definitivamente debes probar esta súper útil App: 'Say Expense'.
LEER MÁSEl autoservicio de pedidos se ha convertido en el primer paso al entrar a un restaurante y en un elemento crucial de nuestra experiencia gastronómica. Si añadimos elementos interesantes, como un asistente de voz con IA, ¡hacer pedidos podría volverse más intuitivo, divertido e incluso más humano!
LEER MÁSCONTÁCTANOS
¡Hablemos sobre tus ideas!
Impulsa tu negocio con tu socio digital innovador. Responderemos en un día hábil. (GMT+8)