Más allá de los datos humanos: la apuesta de 1.100 millones de dólares de David Silver al aprendizaje por refuerzo

13

Un nuevo jugador ha entrado en la carrera de alto riesgo por la supremacía de la inteligencia artificial. Ineffable Intelligence, una startup británica de IA fundada por el ex peso pesado de DeepMind David Silver, ha obtenido 1.100 millones de dólares en financiación con una valoración de 5.100 millones de dólares.

La empresa no es un actor más en el mercado de modelos de lenguaje grande (LLM); está intentando cambiar fundamentalmente la forma en que las máquinas adquieren inteligencia.

El objetivo: crear un “superaprendiz”

Si bien los modelos actuales de IA como ChatGPT dependen en gran medida de vastos conjuntos de datos de texto generado por humanos para aprender, Ineffable Intelligence pretende superar esta dependencia. Su objetivo es desarrollar un “superaprendizaje” : una IA capaz de descubrir conocimientos y dominar habilidades complejas a través del aprendizaje por refuerzo.

A diferencia del aprendizaje supervisado tradicional, donde una IA estudia ejemplos humanos, el aprendizaje por refuerzo permite que un sistema aprenda mediante prueba y error. Este enfoque permite a la IA encontrar y resolver problemas que los humanos tal vez ni siquiera tengan los datos para describir.

“Si tiene éxito, esto representará un avance científico de magnitud comparable a la de Darwin: donde su ley explicó toda la Vida, nuestra ley explicará y construirá toda la Inteligencia.” — Inteligencia Inefable

El pedigrí de David Silver

La valoración masiva se debe en gran medida a la experiencia de su fundador. David Silver, profesor del University College London, pasó más de una década liderando el equipo de aprendizaje por refuerzo de Google DeepMind.

Su trayectoria incluye algunos de los hitos más importantes en la historia de la IA:
AlphaZero: Un programa que domina el ajedrez y los juegos de mesa. Juega exclusivamente por tu cuenta.
Descubrimiento autónomo: A diferencia de los motores anteriores que dependían de registros de juegos humanos, los sistemas de Silver aprendieron jugando contra ellos mismos, superando finalmente a los mejores jugadores humanos y informáticos del mundo.

Silver ve a Ineffable Intelligence como el “trabajo de su vida”, e incluso señala que cualquier beneficio personal de la empresa se donará a organizaciones benéficas de alto impacto.

Una nueva era de “rondas de coco”

La escala de esta ronda de financiación pone de relieve una tendencia creciente en el panorama del capital riesgo. Ineffable Intelligence ha alcanzado el estatus de “pentacornio” (una valoración superior a los 5 mil millones de dólares) casi inmediatamente después de su creación.

Esto sigue un patrón observado con otras nuevas empresas de “investigadores estrella”, a menudo denominadas “rondas de coco” : una escalada de la tradicional “ronda semilla” en la que se despliega capital masivo por adelantado en función de la reputación de los fundadores. Los ejemplos recientes incluyen:
AMI Labs: Cofundado por el ganador del Premio Turing Yann LeCun, que recientemente recaudó 1.030 millones de dólares.
Superinteligencia recursiva: Cofundada por el ex científico de DeepMind Tim Rocktäschel, que supuestamente busca hasta mil millones de dólares.

Londres: un centro global emergente de IA

El ascenso de Ineffable Intelligence refuerza la creciente importancia de Londres como nodo central en el ecosistema global de IA. Este impulso está impulsado por:
– El legado perdurable de DeepMind en el Reino Unido.
– Una poderosa red de ex alumnos de DeepMind que asumen roles de liderazgo en nuevas empresas.
– Inversión estratégica de entidades como el British Business Bank y el fondo Sovereign AI del Reino Unido.

La afluencia de capital de pesos pesados ​​como Sequoia Capital, Lightspeed Venture Partners, Nvidia y Google sugiere que la industria está apostando fuertemente por el cambio de modelos que imitan a los humanos a modelos que los superan a través del razonamiento independiente.


Conclusión
Al alejarse de los datos dependientes de humanos hacia el aprendizaje por refuerzo autónomo, Ineffable Intelligence está intentando resolver uno de los mayores cuellos de botella de la IA. Si Silver puede replicar su éxito con AlphaZero a una escala mucho mayor, podría señalar una transición de la IA generativa a una inteligencia verdaderamente autónoma.