Au-delà des données humaines : le pari de 1,1 milliard de dollars de David Silver sur l’apprentissage par renforcement

12

Un nouvel acteur est entré dans la course aux enjeux élevés pour la suprématie de l’intelligence artificielle. Ineffable Intelligence, une startup britannique d’IA fondée par l’ancien poids lourd de DeepMind David Silver, a obtenu 1,1 milliard de dollars de financement pour une valorisation de 5,1 milliards de dollars.

L’entreprise n’est pas simplement un acteur supplémentaire sur le marché des grands modèles linguistiques (LLM) ; il tente de changer fondamentalement la façon dont les machines acquièrent l’intelligence.

L’objectif : créer un “superapprenant”

Alors que les modèles d’IA actuels comme ChatGPT s’appuient fortement sur de vastes ensembles de données de textes générés par l’homme pour apprendre, Ineffable Intelligence vise à dépasser cette dépendance. Leur objectif est de développer un “superapprenant”, une IA capable de découvrir des connaissances et de maîtriser des compétences complexes grâce à l’apprentissage par renforcement.

Contrairement à l’apprentissage supervisé traditionnel, où une IA étudie des exemples humains, l’apprentissage par renforcement permet à un système d’apprendre par essais et erreurs. Cette approche permet à l’IA de rencontrer et de résoudre des problèmes que les humains ne disposent peut-être même pas des données nécessaires pour décrire.

“En cas de succès, cela représentera une avancée scientifique d’une ampleur comparable à celle de Darwin : là où sa loi expliquait toute vie, notre loi expliquera et construira toute l’intelligence.” — Intelligence ineffable

Le pedigree de David Silver

La valorisation massive est largement motivée par l’expertise de son fondateur. David Silver, professeur à l’University College London, a passé plus d’une décennie à diriger l’équipe d’apprentissage par renforcement de Google DeepMind.

Son palmarès comprend certaines des étapes les plus importantes de l’histoire de l’IA :
AlphaZero : Un programme qui maîtrise les échecs et le jeu de société Go uniquement grâce au jeu personnel.
Découverte autonome : Contrairement aux moteurs précédents qui s’appuyaient sur les enregistrements de jeux humains, les systèmes de Silver ont appris en jouant contre eux-mêmes, dépassant finalement les meilleurs joueurs humains et informatiques du monde.

Silver considère Ineffable Intelligence comme « l’œuvre de sa vie », notant même que tous les bénéfices personnels de l’entreprise seront reversés à des œuvres caritatives à fort impact.

Une nouvelle ère de « rondes de noix de coco »

L’ampleur de ce cycle de financement met en évidence une tendance croissante dans le paysage du capital-risque. Ineffable Intelligence a atteint le statut de ** « pentacorne »** (une valorisation dépassant les 5 milliards de dollars) presque immédiatement après sa création.

Cela suit un modèle observé avec d’autres startups de « chercheurs vedettes », souvent appelées ** « rondes de noix de coco » ** : une escalade du « ronde d’amorçage » traditionnelle où un capital massif est déployé dès le départ en fonction de la réputation des fondateurs. Les exemples récents incluent :
AMI Labs : Co-fondé par Yann LeCun, lauréat du prix Turing, qui a récemment levé 1,03 milliard de dollars.
Superintelligence récursive : Co-fondée par l’ancien scientifique de DeepMind Tim Rocktäschel, qui chercherait jusqu’à 1 milliard de dollars.

Londres : un hub mondial émergent pour l’IA

L’essor d’Ineffable Intelligence renforce l’importance croissante de Londres en tant que nœud central de l’écosystème mondial de l’IA. Cette dynamique est alimentée par :
– L’héritage durable de DeepMind au Royaume-Uni
– Un puissant réseau d’anciens élèves de DeepMind accédant à des postes de direction dans de nouvelles entreprises.
– Des investissements stratégiques provenant d’entités telles que la British Business Bank et le fonds Sovereign AI du Royaume-Uni.

L’afflux de capitaux de poids lourds comme Sequoia Capital, Lightspeed Venture Partners, Nvidia et Google suggère que l’industrie mise beaucoup sur le passage de modèles qui imitent les humains à des modèles qui les surpassent grâce à un raisonnement indépendant.


Conclusion
En s’éloignant des données dépendantes de l’homme pour se tourner vers l’apprentissage autonome par renforcement, Ineffable Intelligence tente de résoudre l’un des plus gros goulots d’étranglement de l’IA. Si Silver parvient à reproduire son succès avec AlphaZero à une échelle beaucoup plus grande, cela pourrait marquer une transition de l’IA générative vers une intelligence véritablement autonome.