Menu

Maria Selma Restaurant

Un nouveau niveau d’intelligence: Une nouvelle IA peut s’enseigner avec un «algorithme d’apprentissage par renforcement» qui se traduit par des capacités «surhumaines» en quelques heures

Cela fait deux décennies que DeepBlue a battu Garry Kasparov dans un match, mais les joueurs d’échecs ont été surpris par un autre développement. L’algorithme AlphaZero, une collaboration entre Google et DeepMind, a récemment détruit des records.

Même si AlphaZero de DeepMind n’a joué contre lui que pendant quatre heures, il a réussi à «synthétiser la connaissance des échecs d’un millénaire et demi». AlphaZero a réussi à surpasser les joueurs humains et le Champion du Monde en titre Stockfish avec 28 victoires match-jeu.

Demis Hassabis, co-fondateur de DeepMind, est un ancien prodige d’échecs. Avec son équipe, Hassabis visait à vaincre Go, un jeu que les humains avaient l’avantage sur l’intelligence artificielle (IA). Ils ne savaient pas qu’un moteur d’échecs serait bientôt capable d’apprendre assez vite pour nous battre à un autre match. (Relatif: Technologie dans la salle de classe: les robots pourraient remplacer les enseignants dans 10 ans.)

Les capacités surhumaines d’AlphaZero ont été documentées dans le document académique Mastering Chess et Shogi par Self-Play avec un algorithme d’apprentissage de renforcement général, publié le 5 décembre 2017. L’article a révélé que l’équipe DeepMind a confirmé avec succès qu’une version générique de leur algorithme, qui n’a pas de connaissances spécifiques autres que les règles du jeu, « pourrait s’entraîner pendant quatre heures aux échecs, deux heures en shogi (échecs japonais) ou huit heures dans Go et ensuite battre les champions en titre de l’informatique – c.-à-d. ces jeux. « 

Stockfish, le champion en titre des échecs informatiques TCEC, n’a toujours pas réussi à faire la finale cette année, même s’il a remporté 51 matchs. Mais face à l’AlphaZero formé aux échecs, Stockfish a perdu 28 parties et n’en a pas gagné tandis que les 72 parties restantes ont été tirées.

En jouant en blanc, AlphaZero a marqué 25 victoires et 25 nuls. En jouant Black, l’algorithme a seulement marqué 3 victoires et 47 nuls.

Mis à part les règles des échecs, AlphaZero était une ardoise vierge hyperactivité et trouble de l’attention. Il a ensuite joué à des jeux via un algorithme de Monte-Carlo, où «des mouvements initialement aléatoires seraient testés jusqu’à ce qu’un réseau de neurones commence à apprendre quelles options seraient les plus prometteuses.» AlphaGo avait accès à «5 000 TPU de première génération». pour générer des jeux self-play et 64 TPU de 2e génération pour former les réseaux de neurones. « 

Les TPU sont des unités de traitement tensoriel, et elles ne sont pas encore disponibles publiquement car Google les a développées spécifiquement pour gérer les calculs requis par l’apprentissage automatique. D’autre part, l’algorithme entraîné fonctionnait sur une seule machine qui avait quatre TPU. DeepMind a expliqué que son approche était efficace et AlphaZero ne recherchait que 80 000 positions par seconde, ce qui représentait une nette amélioration par rapport aux 70 millions de positions de Stockfish.

Même si AlphaZero a basé ses calculs sur un plus petit nombre d’évaluations, il a compensé la différence en utilisant son réseau neuronal profond pour se concentrer sur les variations les plus prometteuses, ce qui est certainement une approche plus «humaine».

Les algorithmes génériques d’apprentissage automatique sont des outils de changement, pas seulement pour le monde des échecs, mais pour le monde qui nous entoure. Bien qu’il y ait de nombreux obstacles à surmonter, nous pouvons bientôt développer une sorte de conscience et d’intelligence de base, ou ce qu’on appelle la vraie IA. Il est également possible que l’apprentissage renforcé façonne rapidement l’IA en «entité la plus intelligente de notre univers connu».

Les développements futurs dépendent de la capacité de DeepMind à maintenir actif son algorithme formé aux échecs.

Le document est plus détaillé sur CDN.Chess24.com.

Les avantages et les inconvénients de l’IA

Que vous soyez pour eux ou contre eux, nous ne pouvons pas nier que l’IA a des avantages et des inconvénients:

Avantages – Diagnostic précoce des maladies, des voitures sans conducteur et des assistants à commande vocale.

Inconvénients: montée de l’intelligence artificielle surdéveloppée (jeux sportifs ou vidéo, par exemple), automatisation des tâches et problèmes de sécurité.

Vous pouvez lire plus d’articles sur d’autres avancées technologiques sur FutureScienceNews.com.

 

Maria Selma Restaurant, LLC – 1617 Richmond Ave, Houston Tx 77006
Website Developed by: E-nnovations Technologies and Marketing LLC