OpenAI publica la System Card de GPT-5.5: capacidades, seguridad y limitaciones

OpenAI publica la System Card de GPT-5.5: capacidades, seguridad y limitaciones

OpenAI ha lanzado la System Card de GPT-5.5, un informe técnico que detalla las capacidades del modelo, las evaluaciones de seguridad realizadas y las limitaciones identificadas. El documento revela mejoras significativas en razonamiento y reducción de sesgos, pero también advierte sobre riesgos en contextos de alto impacto.

Cloudflare integra modelos de OpenAI en su plataforma de agentes IA para empresas

Cloudflare integra modelos de OpenAI en su plataforma de agentes IA para empresas

La alianza entre Cloudflare y OpenAI lleva los modelos GPT-5.4 y Codex a Agent Cloud, permitiendo a las empresas desarrollar agentes de inteligencia artificial para automatizar flujos de trabajo complejos. La integración combina la potencia de los modelos de lenguaje con la infraestructura de seguridad y escalabilidad de Cloudflare.

Un año después de DeepSeek: cómo la inteligencia artificial de código abierto está redefiniendo el ecosistema global

Un año después de DeepSeek: cómo la inteligencia artificial de código abierto está redefiniendo el ecosistema global

El lanzamiento de DeepSeek hace un año marcó un punto de inflexión en la inteligencia artificial de código abierto, demostrando que modelos de clase mundial pueden desarrollarse fuera de los gigantes tecnológicos estadounidenses. Hoy, iniciativas como AI+ están ampliando esta visión hacia un ecosistema más colaborativo y diverso, donde la innovación surge desde múltiples geografías y comunidades.

Hugging Face lanza Community Evals: una revolución en la evaluación de modelos de IA liderada por la comunidad

Hugging Face lanza Community Evals: una revolución en la evaluación de modelos de IA liderada por la comunidad

Hugging Face ha presentado Community Evals, una plataforma abierta que permite a cualquier persona evaluar y comparar modelos de lenguaje. Este movimiento busca democratizar la evaluación de IA, desafiando los rankings cerrados y opacos que dominan el sector. La herramienta ya incluye más de 100 benchmarks y permite evaluar modelos como Llama 3, Claude 3 y GPT-4.

Translate »