IA, benchmarks y emprendimiento: Deep Dive con Guillermo Barbadillo

·1h 33m
Punto compartido

Inteligencia Artificial y el Desafío ARC

El episodio profundiza en el estado actual de la Inteligencia Artificial de la mano de Guillermo Barbadillo, investigador en este campo. La discusión gira en torno a los premios ARC (Abstraction and Reasoning Corpus), una métrica que desafía la capacidad de razonamiento real de los modelos:

Limitaciones de los LLMs: Modelos como GPT-4 y O1 demuestran una capacidad sorprendente para tareas conocidas, pero fallan ante problemas nuevos y abstractos.
Eficiencia vs. Habilidad: El estándar actual mide habilidades entrenadas, mientras que el ARC busca medir la capacidad real de aprender a resolver retos inéditos.
El nuevo paradigma: Se debate la importancia de modelos que no estén "congelados", permitiendo que aprendan dinámicamente durante la resolución de nuevas tareas.

Novedades en OpenAI y el Paisaje Tech

La mesa analiza la estrategia reciente de OpenAI y su carrera por no perder terreno frente a competidores como Anthropic:

ChatGPT Canvas y la capa de aplicación: Se destaca cómo OpenAI está adoptando funcionalidades que competidores como Cursor o Artifacts ya tenían, indicando una pérdida de liderazgo en la interfaz de usuario.
Sora: Discusión sobre el lanzamiento retrasado del modelo de video, su potencial en animación y sus limitaciones actuales en física y realismo humano.
Enfoque en Defensa: Sorpresa ante la incursión de empresas de IA en tecnología para defensa, citando casos como Helsing o Anduril.

"Estamos en una época un poco oscurantista en la cual no se publica prácticamente nada sobre cómo funcionan los modelos de vanguardia."

Emprendimiento, Regulación y el Caso Glovo

La tertulia aborda el impacto de la regulación europea en el ecosistema emprendedor:

La Ley Rider: Crítica feroz a la falta de pragmatismo en España frente a modelos de innovación como Glovo o Cabify.
Resiliencia europea: Se discute la necesidad de empresas líderes como Spotify y el rol de fondos de inversión en Europa.
Closer: El episodio cierra con el pitch de una nueva red social hiperlocal que explota la interacción en el mundo real, generando un interesante debate sobre métricas, crecimiento orgánico y los desafíos de las aplicaciones sociales.

Temas

Capítulos

7 capítulos
Podcast de Itnig: Historias de startups
Chat con IA — respuestas basadas en los episodios