AlphaGo, l'Intelligence artificielle de Google qui apprend toute seule

Felicite Anouilh
Octobre 19, 2017

AlphaGo Zero, ce nouveau programme "plus puissant", victorieux sur le score sans appel de 100 à 0, "est sans doute le plus fort joueur de go de l'histoire", estiment Demis Hassabis et David Silver, deux de ses concepteurs, selon une étude publiée mercredi dans la revue Nature.

AlphaGo continue sur sa lancée: l'intelligence artificielle développée par Deepmind, la branche intelligence artificielle de Google, est parvenue à se surpasser elle-même grâce au développement d'une nouvelle version baptisée AlphaGo Zero. Dans un post de blog, l'équipe chargée du développement du programme présente les résultats de sa nouvelle version et ceux-ci sont éloquents: AlphaGo Zero est parvenu à dominer la version précédente de l'IA, qui avait pourtant damé le pion aux plus grands champions humains de Go en 2016. Ici, AlphaGo Zero ne disposait à son démarrage que de la connaissance des règles du Go, contrairement aux versions précédentes qui pouvaient s'appuyer sur un corpus de parties jouées par les humains.

"Ce n'est pas le premier logiciel qui apprend par lui-même, la nouveauté c'est que AlphaGo Zero soit si bon", souligne le futurologue Anders Sandberg de l'Université d'Oxford.

Mourinho avait prévu la boulette du gardien de Benfica
Après le match nul 3-3 face à l'AS Roma, Antonio Conte a répondu à son vis-à-vis portugais. José Mourinho et Antonio Conte ne semblent pas être les meilleurs amis du monde.

En 40 jours, il écrase la version la plus performante d'Alpha Go 100 à 0.

Appelée AlphaGo Zero, sa particularité tient en une seule caractéristique exceptionnelle: elle n'a plus besoin des humains pour apprendre. AlphaGo Zero n'en a joué "que" 4,9 millions en prévision de cet affrontement.

Après seulement trois jours d'entraînement, AlphaGo Zero a été capable de battre la version du programme ayant battu le 18 fois champion du monde Lee Se-dol. La nouvelle approche retenue par AlphaGo Zero montre également la viabilité des approches s'appuyant sur des données "non supervisées", c'est-à-dire en l'absence de données classées et triées par des data scientists avant d'être analysés par AlphaGo.

Lourdes amendes pour Forbo, Gerflor et Tarkett — Cartel du lino
La société Tarkett, qui agissait de la sorte depuis 23 ans, a elle écopé de la plus lourde amende: 165 millions d'euros devront être remis.

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d'atomes dans l'univers. Mais aussi qu'il soit capable d'apprendre en n'étant "plus contraint par les limites de la connaissance humaine", ajoutent les concepteurs du projet.

Et alors qu'AlphaGo nécessitait plusieurs machines, son successeur fonctionne avec une seule. L'apprentissage "par renforcement" s'avère donc plus efficace que l'apprentissage "supervisé" pour certaines formes d'intelligence artificielle. Par ailleurs, le programme nécessite bien moins de ressources et de données pour fonctionner que ses prédécesseurs. "Pour que cette méthode puisse s'appliquer, il faut un cadre très défini, avec une représentation solide du domaine, des règles peu floues et un problème bien défini", explique le professeur Tristan Cazenave au Monde.

L'OGC Nice, pour aller très loin — Ligue Europa
Une rencontre de prestige pour laquelle l'OGC Nice a décidé de faire un geste vis-à-vis de ses fans. Bien parti pour se qualifier, Nice peut cette saison aller très loin en Ligue Europa .

Autres rapports virageauto.com

Discuter de cet article

SUIVRE NOTRE JOURNAL