Etiqueta: Benchmarks IA

  • Meta lanzó los modelos Llama 4, Scout y Maverick, este último prometiendo superar a GPT-4o y Gemini 2.0 Flash. Maverick alcanzó el segundo lugar en LMArena, con un puntaje ELO de 1417, superando a OpenAI 4o. Sin embargo, investigadores descubrieron que la versión de Maverick en LMArena era una «versión de chat experimental» optimizada para…

  • El equipo Qwen de Alibaba ha revelado QwQ-32B, un modelo de inteligencia artificial (IA) de 32 mil millones de parámetros que demuestra un rendimiento comparable al mucho más grande DeepSeek-R1. Este avance resalta el potencial de escalar el Aprendizaje por Refuerzo (RL) en modelos de base robustos. El equipo Qwen ha integrado con éxito capacidades…