Sviluppato da | Google DeepMind |
---|---|
genere | Vai al software di gioco |
Sito web | Sito ufficiale |
AlphaGo è un programma per computer in grado di giocare al gioco di Go , sviluppato dalla società britannica Google DeepMind .
Nel ottobre 2015, diventa il primo programma a battere un giocatore professionista (il francese Fan Hui ) su un goban a grandezza naturale (19 × 19) senza handicap. Questo è un passo simbolicamente forte poiché il programma Go player è quindi una sfida complessa per l'intelligenza artificiale . Nelmarzo 2016Ha battuto Lee Se-dol , uno dei migliori giocatori al mondo ( 9 ° dan professionista). Il27 maggio 2017, batte il campione del mondo Ke Jie e viene annunciato il ritiro del software.
L' algoritmo AlphaGo combina l'apprendimento automatico e le tecniche di attraversamento del grafico , associate a molti allenamenti con esseri umani, altri computer e soprattutto se stesso.
Questo algoritmo sarà ulteriormente migliorato nelle versioni successive. AlphaGo Zero in formatoottobre 2017raggiunge un livello superiore giocando solo contro se stesso. AlphaZero a dicembre 2017 supera ampiamente, sempre per autoapprendimento, il livello di tutti i giocatori umani e software, non solo nel go, ma anche negli scacchi e nello shōgi .
La programmazione di un giocatore di Go è considerata un problema molto più difficile rispetto ad altri giochi, come gli scacchi , a causa delle molte più combinazioni possibili, ma anche perché le condizioni di vittoria e gli obiettivi intermedi sono molto meno chiari, rendendo estremamente complesso l'utilizzo dei metodi tradizionali come la ricerca esaustiva . Quando il computer IBM Deep Blue sconfisse il campione mondiale di scacchi Garry Kasparov nel 1997, i computer erano quindi limitati al livello di deboli giocatori dilettanti al gioco del Go.
Il mondo della ricerca vede questa difficoltà come una sfida e migliora i suoi algoritmi e il livello dei programmi ha subito un'accelerazione negli anni 2010 . Nel 2012, il programma Zen ha battuto Takemiya Masaki ( 9 ° dan) due volte, con un handicap di 5 e 4 pietre. Nel 2013, Crazy Stone ha battuto Yoshio Ishida ( 9 ° dan) con un handicap di 4 pietre.
All'inizio del 2016, Facebook ha annunciato di aver ottenuto risultati incoraggianti da un'intelligenza artificiale go sviluppata internamente chiamata Darkforest.
AlphaGo è stato sviluppato da DeepMind Technologies , una società britannica specializzata in intelligenza artificiale creata da Demis Hassabis , Mustafa Suleyman e Shane Legg nel 2010 e acquisita da Google nel 2014.
AlphaGo rappresenta un miglioramento significativo rispetto ai precedenti programmi go . Su 500 partite giocate contro altri programmi, inclusi Crazy Stone e Zen, AlphaGo ne ha persa solo una.
Nel ottobre 2015, AlphaGo batte il campione europeo di go Fan Hui ( 2 ° dan), 5-0 nei giochi lenti e 3-2 nei giochi veloci. Questa è la prima volta che un programma Go ha battuto un giocatore professionista in una partita senza handicap su un goban a grandezza naturale (19 × 19). La notizia è stata annunciata solo il27 gennaio 2016in concomitanza con la pubblicazione di un articolo sulla rivista Nature che descrive l' algoritmo utilizzato.
AlphaGo si affaccia marzo 2016il giocatore sudcoreano Lee Se-dol ( 9 ° dan professionista, massimo livello), considerato il miglior giocatore del mondo tra il 2000 e il 2010. La partita, che ha vinto un premio di un milione di dollari, è circolata e commentata in diretta su Internet. Lee Sedol riceve $ 150.000 per la sua partecipazione e $ 20.000 per ogni partita vinta.
La partita in 5 parti termina con il computer che vince 4-1:
Anche prima dell'ultima partita e assicurato la vittoria, AlphaGo è classificato 9 ° dan professionista onorario dalla Hanguk Kiwon (Korean Go Game Federation). Il premio da 1 milione di dollari, vinto dal team AlphaGo, viene donato a enti di beneficenza.
Anche prima dell'incontro, altri professionisti avevano espresso il desiderio di opporsi ad AlphaGo, anche se Ke Jie sentiva, in vista delle sue partite contro Fan Hui, di non essere un degno avversario. Dopo la partita, Lee Sedol si è pentito di non aver dato il suo pieno potenziale e ha voluto una rivincita. Ma non è stato fino all'inizio delgiugno 2016che la prospettiva di un nuovo incontro è diventata più chiara, l'annuncio di una partita contro Ke Jie "prima della fine dell'anno" è stato fatto durante il World Amateur Go Championship a Wuxi ; comunque, il6 giugno, Demis Hassabis ha rifiutato di confermare queste informazioni.
Il 18 luglio 2016, AlphaGo diventa il miglior giocatore al mondo nella classifica GoRatings , con 3612 punti Elo (contro i 3608 del secondo classificato, Ke Jie ).
Nel settembre 2016, commenti dettagliati sulle partite contro Lee Sedol, di Gu Li e Zhou Ruiyang (en) e basati sull'analisi di AlphaGo, sono stati pubblicati sul sito di DeepMind; Secondo Gu Li, la maestria di AlphaGo e la profondità delle sue analisi superano ancora quanto avevamo già detto durante il match.
Il 4 gennaio 2017, Demis Hassabis annuncia che una versione migliorata di AlphaGo ha appena giocato una serie di 60 partite veloci contro i migliori giocatori del mondo ( Ke Jie , Iyama Yuta , Gu Li , Park Jeong-hwan (en) ...), giochi che ha hanno vinto tutti e giocheranno partite ufficiali nel corso dell'anno.
Dal 23 al 27 maggio 2017, un festival chiamato The Future of Go Summit è organizzato da Google e dall'associazione cinese weiqi a Wuzhen ; la versione più recente di AlphaGo affronta Ke Jie in una partita di tre partite, insieme ad altri professionisti cinesi che giocano in consultazione. Ancora una volta, AlphaGo vince tutte le partite giocate. Dopo questo incontro, Google annuncia che AlphaGo non giocherà più in modo competitivo, ma che pubblicherà documenti tecnici che descrivono i loro ultimi miglioramenti e una serie di giochi giocati dalla macchina contro se stessa; hanno anche in programma di sviluppare uno strumento di analisi basato su questo software per l'uso dei giocatori.
Il 17 ottobre 2017, DeepMind annuncia un nuovo sviluppo, che chiamano AlphaGo Zero ; questo programma utilizza un'architettura semplificata e parte da zero conoscenza del gioco (solo le regole); giocando solo contro se stesso, raggiunge il livello di principiante in tre ore, batte la versione avendo battuto Lee Sedol dopo 72 ore 100 a 0, e dopo 40 giorni batte la versione diMaggio 2017 (noto come "Master") 89 giochi su 100.
Il 5 dicembre 2017, una nuova versione chiamata AlphaZero generalizza ulteriormente questo algoritmo, ottenendo un programma generico in grado di imparare a giocare a go, scacchi o shōgi dalla semplice conoscenza delle regole; il programma riesce in poche ore a battere i migliori programmi esistenti (ad esempio, per gli scacchi, ottiene dopo quattro ore di apprendimento una netta vittoria su Stoccafisso : su 100 partite , 25 vittorie con il Bianco, 3 con il Nero e 72 pareggi ).
Le prime versioni di AlphaGo utilizzano il metodo Monte Carlo , guidato da una " rete di valori " e una " rete di politiche " (una rete di valori e una rete di obiettivi ), entrambe implementate utilizzando una rete neurale profonda .
AlphaGo è stato originariamente addestrato per "imitare" i giocatori umani, rintracciando i colpi registrati in decine di migliaia di partite condotte da giocatori esperti. Una volta raggiunto un certo livello, si è esercitato giocando milioni di partite contro altre sue istanze, utilizzando l' apprendimento per rinforzo per migliorare se stesso.
Tuttavia, in ottobre 2017, DeepMind pubblica un nuovo studio su Nature , descrivendo AlphaGo Zero , un'architettura semplificata che non utilizza più né il metodo Monte-Carlo né la conoscenza umana, ma che tuttavia raggiunge molto rapidamente prestazioni superiori rispetto alle versioni precedenti.
L'algoritmo AlphaGo (o almeno le sue idee essenziali) essendo stato reso pubblico, diversi gruppi hanno cercato di riprodurlo, o addirittura migliorarlo. A partire dal 2018, in particolare, un progetto collaborativo e open source , Leela Zero , ha ottenuto risultati simili in un anno, portatile su personal computer e persino su smartphone.