IA, benchmarks y emprendimiento: Deep Dive con Guillermo Barbadillo
Inteligencia Artificial y el Desafío ARC
El episodio profundiza en el estado actual de la Inteligencia Artificial de la mano de Guillermo Barbadillo, investigador en este campo. La discusión gira en torno a los premios ARC (Abstraction and Reasoning Corpus), una métrica que desafía la capacidad de razonamiento real de los modelos:
• Limitaciones de los LLMs: Modelos como GPT-4 y O1 demuestran una capacidad sorprendente para tareas conocidas, pero fallan ante problemas nuevos y abstractos.
• Eficiencia vs. Habilidad: El estándar actual mide habilidades entrenadas, mientras que el ARC busca medir la capacidad real de aprender a resolver retos inéditos.
• El nuevo paradigma: Se debate la importancia de modelos que no estén "congelados", permitiendo que aprendan dinámicamente durante la resolución de nuevas tareas.
Novedades en OpenAI y el Paisaje Tech
La mesa analiza la estrategia reciente de OpenAI y su carrera por no perder terreno frente a competidores como Anthropic:
• ChatGPT Canvas y la capa de aplicación: Se destaca cómo OpenAI está adoptando funcionalidades que competidores como Cursor o Artifacts ya tenían, indicando una pérdida de liderazgo en la interfaz de usuario.
• Sora: Discusión sobre el lanzamiento retrasado del modelo de video, su potencial en animación y sus limitaciones actuales en física y realismo humano.
• Enfoque en Defensa: Sorpresa ante la incursión de empresas de IA en tecnología para defensa, citando casos como Helsing o Anduril.
"Estamos en una época un poco oscurantista en la cual no se publica prácticamente nada sobre cómo funcionan los modelos de vanguardia."
Emprendimiento, Regulación y el Caso Glovo
La tertulia aborda el impacto de la regulación europea en el ecosistema emprendedor:
• La Ley Rider: Crítica feroz a la falta de pragmatismo en España frente a modelos de innovación como Glovo o Cabify.
• Resiliencia europea: Se discute la necesidad de empresas líderes como Spotify y el rol de fondos de inversión en Europa.
• Closer: El episodio cierra con el pitch de una nueva red social hiperlocal que explota la interacción en el mundo real, generando un interesante debate sobre métricas, crecimiento orgánico y los desafíos de las aplicaciones sociales.