🚀 En un giro sorprendente y emocionante, Apple ha lanzado ‘Ferret’, su primer Modelo de Lenguaje Grande (LLM) multimodal y de código abierto, en colaboración con la Universidad de Columbia. Este paso, alejado de su típica política de puertas cerradas, subraya un enfoque renovado en colaboración y transparencia en el campo de la IA.
Ferret se destaca por su innovación técnica: alimentado por 8 GPUs Nvidia A100 y entrenado con el conjunto de datos GRIT, brilla en el procesamiento de pequeñas regiones de imágenes con alta precisión. Su habilidad en tareas de referencia y anclaje demuestra la maestría de Apple en IA generativa y funcionalidades multimodales, superando el análisis textual tradicional.
Imagina la integración de Ferret en el ecosistema de Apple: revolucionaría las interacciones del usuario. Esto incluye una comunicación visual mejorada con Siri, funciones avanzadas de búsqueda visual, soporte de accesibilidad superior y una comprensión más profunda del contenido multimedia.
Sin embargo, la escalabilidad sigue siendo un desafío para Ferret, especialmente en comparación con modelos más grandes como GPT-4. Esto exige decisiones estratégicas por parte de Apple, incluyendo posiblemente nuevas asociaciones o una mayor implicación en metodologías de código abierto.
El debut de Ferret marca un cambio crucial en la estrategia de IA de Apple, adoptando un modelo de código abierto que fomenta la colaboración y la innovación. A medida que las funcionalidades de Ferret evolucionen, está preparado para redefinir nuestra interacción con la tecnología, especialmente en el ámbito de la comprensión e integración de contenido visual por parte de la IA. Este movimiento no solo señala la dedicación de Apple al avance de la IA, sino que también tiene el potencial de remodelar el futuro panorama de las aplicaciones de IA.