Principal Innover L'intelligence artificielle de Google 'Alpha Go Zero' vient d'appuyer sur la réinitialisation sur la façon d'apprendre

L'intelligence artificielle de Google 'Alpha Go Zero' vient d'appuyer sur la réinitialisation sur la façon d'apprendre

Votre Horoscope Pour Demain

Rappelez-vous (vaguement) comment vous avez appris à marcher, à parler, à faire du vélo ou à conduire ? C'était désordonné et plein d'erreurs, mais les compétences que vous avez acquises de cette façon sont restées. En dehors des systèmes vivants, il a été difficile de structurer des algorithmes suffisamment puissants pour prendre en compte «l'expérience de la vie réelle» et développer des comportements collants et adaptables pour l'intelligence artificielle.



comment un homme vierge vous teste-t-il

Eh bien, Alpha Go Zero vient de le faire.

«Cela part d'une ardoise vierge et ne se calcule que pour lui-même, uniquement à partir d'un jeu personnel, et sans aucune connaissance humaine, ou aucune donnée humaine, ou caractéristiques, ou exemples, ou intervention humaine. Il découvre comment jouer au jeu de Go à partir des premiers principes », explique David Silver, professeur de DeepMind.

L'IA a eu plusieurs itérations, chacune plus intelligente et plus performante que la précédente. La version précédente utilisait une énorme base de données de jeux précédents ainsi qu'un tas d'algorithmes qui la dirigeaient vers la victoire. Cette approche a conduit à la défaite du joueur professionnel de Go, champion du monde en titre. Au poker, AI Libratus a récemment écorché les meilleurs joueurs de poker du monde de près de 2 millions de dollars, également en apprenant par l'auto-jeu au lieu de données de jeu humaines.

Maintenant, dans cette dernière version d'Alpha Go, le programme d'intelligence artificielle a enseigné lui-même comment jouer au Go - sans aucune formation humaine.

En exécutant des millions de simulations de jeu contre lui-même, il lui a fallu 40 jours pour apprendre, à partir de zéro, comment battre la version championne du monde de lui-même. Cela change vraiment la donne, non seulement pour le Go, mais aussi pour la façon dont de nouvelles connaissances sont découvertes. Dans quelle mesure votre expertise du domaine est-elle précise ou complète ? Il y a beaucoup plus à découvrir, c'est ce que nous dit cette fascinante expérience d'apprentissage avec Alpha Go Zero.

'L'idée d'Alpha Go n'est pas de sortir et de vaincre les humains, mais en fait de découvrir ce que signifie faire de la science - pour qu'un programme puisse apprendre de lui-même ce qu'est la connaissance', selon Silver dans un article YouTube sur la réalisation.



L'équipe d'Alpha Go Zero Deep Mind appelle cela l'apprentissage du premier principe, 'tabula rasa' (ardoise vierge).

'Si vous pouvez atteindre table rase l'apprentissage, vous avez un agent qui peut être transplanté du jeu de Go vers n'importe quel autre domaine, et les spécificités du jeu dans lequel vous vous trouvez, vous proposez un algorithme qui est si général qu'il peut être appliqué n'importe où », dit-il . C'est une idée provocatrice quand vous étendez le concept. Pensez simplement à ce que nous pourrions faire avec un ensemble d'algorithmes d'apprentissage puissants qui pourraient systématiquement résoudre des problèmes difficiles et apprendre plus rapidement que la connaissance collective de notre civilisation. . . en jours, pas en décennies.

Pour l'instant, le gros point à retenir est que 'les algorithmes comptent beaucoup plus que l'informatique ou les données disponibles', a déclaré Silver. Cela seul change la donne dans la façon dont nous approchons de l'extension du monde connu. Alors qu'Alpha Go fonctionne avec environ 25 millions de dollars de matériel - ce n'est pas exactement un système léger - vous savez que les gourous de l'IA travaillent depuis longtemps à la création d'ensembles de données plus propres et meilleurs. Aujourd'hui, de nombreux grands ensembles de données sont considérés comme trop bruyants - pleins de mauvaises données - pour former avec précision une intelligence artificielle. Si l'IA apprend à partir de données et que les données sont mauvaises, elle n'apprend pas. Gros problème.

Et si vous n'aviez pas besoin de données propres, mais juste de l'expérience, et que l'intelligence artificielle pouvait s'entraîner ?

C'est la réalisation passionnante d'Alpha Go Zero. Même s'il s'agit d'un monde de niche basé sur des règles, il a de grandes implications dans toutes les industries travaillant à partir de règles physiques - pensez à la chimie, au trafic, à la biologie, à la pharmacologie, aux voyages, à la logistique et à la fabrication. Si nous pouvons concevoir des règles si flexibles qu'elles puissent fonctionner à partir d'une expérience plus large, et si directionnelles qu'elles créent toujours des compétences plus fortes - comme Alpha Go Zero - alors il est possible de réaliser une intelligence artificielle qui dirige les systèmes. Ces systèmes n'auraient besoin d'aucune donnée extérieure, n'auraient aucun problème de nettoyage des données et n'auraient besoin d'aucun ralentissement intempestif. C'est en partie pourquoi la société mère de Google, Alphabet, mise l'entreprise sur l'intelligence artificielle et investit dans l'intelligence artificielle à un rythme rapide. (Amazon investit également dans l'intelligence artificielle, comme sa dernière acquisition d'IA, BodyLabs.)

Le professeur de Deep Mind, David Silver, déclare : « le fait que nous ayons vu un programme atteindre des performances de haut niveau … devrait signifier que nous pouvons maintenant commencer à nous attaquer à certains des problèmes les plus difficiles et les plus percutants pour l'humanité ».

Cet article a été mis à jour pour préciser que AI Libratus a récemment battu les meilleurs joueurs de poker en utilisant une stratégie qui implique un jeu personnel plutôt que des données saisies par l'homme.



Des Articles Intéressants

Choix De L'Éditeur

Daisy Fuentes Bio
Daisy Fuentes Bio
Connaître Daisy Fuentes Bio, Affaire, Marié, Mari, Valeur nette, Salaire, Âge, Nationalité, Taille, Animatrice de télévision, Wiki, Médias sociaux, Sexe, Horoscope. Qui est Daisy Fuentes? Daisy Fuentes est une animatrice de télévision cubano-américaine, comédienne et mannequin, qui était l'un des visages les plus connus de MTV dans les années 1990.
Ricky Rubio Bio
Ricky Rubio Bio
Connaître Ricky Rubio Bio, Affaire, Célibataire, Valeur nette, Origine ethnique, Salaire, Âge, Nationalité, Taille, Basketteur professionnel, Wiki, Médias sociaux, Sexe, Horoscope. Qui est Ricky Rubio? Ricky Rubio est un basketteur professionnel espagnol.
Vernon Davis Bio
Vernon Davis Bio
Connaître Vernon Davis Bio, affaire, en relation, valeur nette, origine ethnique, âge, nationalité, taille, joueur de football, wiki, médias sociaux, sexe, horoscope. Qui est Vernon Davis? Vernon Davis est un joueur serré de football américain qui joue pour les Redskins de Washington dans la National Football League (NFL).
Combien de temps est trop long pour se prélasser dans la gloire de gagner un prix ?
Combien de temps est trop long pour se prélasser dans la gloire de gagner un prix ?
Parfois, la promotion d'un prix d'entreprise peut en fait faire plus de mal que de bien à votre entreprise.
Qui est Ann Cabell Standish? Découvrez son âge, sa vie conjugale avec Robert Mueller, ses enfants, sa valeur nette et sa biographie
Qui est Ann Cabell Standish? Découvrez son âge, sa vie conjugale avec Robert Mueller, ses enfants, sa valeur nette et sa biographie
Ann Cabell Standish est l'épouse de Robert Mueller. Son mari, Robert, est un avocat américain et fonctionnaire du gouvernement qui a été le sixième directeur du Federal Bureau of Investigation (FBI) de 2001 à 2013.
Célébrer la fierté : 17 puissantes citations LGBT
Célébrer la fierté : 17 puissantes citations LGBT
Ces citations inspirantes en l'honneur du mois de la fierté égayeront certainement votre journée.
Enfant Vierge
Enfant Vierge
Astrologie de l'enfant Vierge. Personnalité de l'enfant Vierge. Caractéristiques d'un enfant Vierge. Caractéristiques d'un bébé Vierge.