Falcon Perception: el modelo de visión multimodal que desafía a GPT-4V y Gemini

Falcon Perception: el modelo de visión multimodal que desafía a GPT-4V y Gemini

El Technology Innovation Institute de Abu Dhabi lanza Falcon Perception, un modelo de inteligencia artificial que combina procesamiento de texto e imágenes con arquitectura abierta. Con 7.000 millones de parámetros y entrenado en 1.4 billones de tokens, compite directamente con las soluciones propietarias de OpenAI y Google.

Gemma 4: La inteligencia multimodal de vanguardia que cabe en tu dispositivo

Gemma 4: La inteligencia multimodal de vanguardia que cabe en tu dispositivo

Google Research presenta Gemma 4, un modelo de lenguaje multimodal que combina capacidades de texto, imagen y audio en un paquete optimizado para ejecutarse localmente. Esta nueva versión promete llevar la inteligencia artificial avanzada a dispositivos móviles y computadoras personales sin depender de la nube.

Translate »