OpenAI publica la System Card de GPT-5.5: capacidades, seguridad y limitaciones

OpenAI publica la System Card de GPT-5.5: capacidades, seguridad y limitaciones

OpenAI ha lanzado la System Card de GPT-5.5, un informe técnico que detalla las capacidades del modelo, las evaluaciones de seguridad realizadas y las limitaciones identificadas. El documento revela mejoras significativas en razonamiento y reducción de sesgos, pero también advierte sobre riesgos en contextos de alto impacto.

Hugging Face lanza Community Evals: una revolución en la evaluación de modelos de IA liderada por la comunidad

Hugging Face lanza Community Evals: una revolución en la evaluación de modelos de IA liderada por la comunidad

Hugging Face ha presentado Community Evals, una plataforma abierta que permite a cualquier persona evaluar y comparar modelos de lenguaje. Este movimiento busca democratizar la evaluación de IA, desafiando los rankings cerrados y opacos que dominan el sector. La herramienta ya incluye más de 100 benchmarks y permite evaluar modelos como Llama 3, Claude 3 y GPT-4.

Translate »