AI-genombrott: Go-mästare besegrad av dator

I fem partier i rad har Europamästaren i spelet Go besegrats av en dator som använder AI-tekniken deep learning. Nu ska datorn möta världsmästaren.

HÄR ÄR ÅRTALEN då datorerna började besegra de skickligaste människorna i klassiska spel och lekar:

• Dam: år 1994 på en 150 MHz Silicon Graphics Challenge med 16 processorer och 1 Gbyte RAM

• Schack: år 1997 på datorn Deep Blue, en IBM RS/6000 med 30 stycken P2SC-processorer på 120 MHz och en stor mängd specialutvecklade schack-asciar.

• Jeopardy: år 2011 på 90 stycken IBM Power750-servrar med åttkärniga fyrtrådade POWER7-processorer på 3,5 GHz och 16 terabyte RAM

• Space invaders: år 2014 på en vanlig PC med grafikkort

• Go: år 2015 på ett molnsystem bestående av 1200 cpu:er och 170 gpu:er

Programmet Alphago rankas som professionell Go-spelare på nivå fem efter att i fem partier ha besegrat den trefaldige Europamästaren Fan Hui, rankad på nivå två.

Spelet Go betraktas som den stora kvarstående utmaningen inom artificiell intelligens för spel efter att Deep Blue besegrade Garry Kasparov i schack år 1997.

Programmet Alphago har tagits fram på Googles dotterbolag Deep Mind som drivs av underbarnet Demis Hassabis, mest känd för att tidigare ha programmerat deep learning-nät att spela gamla Atari-spel bättre än människor.

Resultaten presenteras i en artikel i tidskriften Nature.

Segern är ytterligare en fjäder i hatten för deep learning, en familj algoritmer som används för bland annat rösttolkning, språkanalys och bildtolkning.

Storföretag som Google, Uber, Facebook och Microsoft satsar miljarder på deep learning eftersom den visat sig överlägsen konkurrerande AI-teknik.

Deep learning tillhör området artificiella neuronnät, som inspireras av hur biologiska hjärnceller arbetar och är kopplade till varandra. För en introduktion till deep learning kan du läsa en specialartikel i Elektroniktidningen från i fjol (länk).

Go har spelats i Kina i över 2500 år och har drygt 40 miljoner utövare idag.

– Det är ett mycket intuitivt spel. Om du frågar bra spelare hur de bestämmer sig för ett drag, så svarar de ofta att ”det kändes rätt”, säger Demis Hassabis på Google Deep Mind, där alphago utvecklades.

– Spelet verkar följa någon sorts estetik. Det är därför det fascinerat så många under tusentals år.

I grunden använder alla djupa neuronnnät samma teknik. Ur nätets synvinkel är det ingen skillnad mellan att känna igen ett bra Go-drag och att känna igen en katt i ett fotografi.

– Allt handlar om mönsterigenkänning, och det är något som deep learning är väldigt bra på, säger Demis Hassabis.

Demis Hassabis arbetsgivare Google letar efter möjligheter att tillämpa deep learning över i stort sett hela sin verksamhet.

Självkörande bilar är ett av de områden där tekniken redan väntas få en viktig roll för att identifiera objekt kring bilen från bildsensorer. På Googles medicinavdelning funderar man över om deep learning kan användas för att hjälpa läkare att ge patienter individanpassad vård.

Go-programmet Alphagos nyckelteknik är att leta efter mönster på ett sätt som liknar hur duktiga schackspelare och Go-spelare analyserar spelet.

När datorn Deep Blue besegrade människan i schack år 1997 använde den strategin att simulera alla tänkbara drag flera omgångar framåt och sedan välja det drag som gav den bästa utsikten.

Spelet Go är för komplext för att den strategin ska kunna användas i samma omfattning. Det beror på att antalet möjliga drag i Go är för stort, i snitt 250 att jämföra med 35 i schack. Den exponentiella tillväxten spårar snabbt ur om du försöker simulera fler drag i rad.

Alphago använder deep learning-näten för att skära ner antalet drag som behöver övervägas. Trots att Go är det betydligt komplexare spelet, undersöker Alphago i praktiken bara en tusendel så många drag som Deep Blue gjorde.

Två stycken deep learning-nät med ”miljoner” neuroner vardera används. Det ena nätet förutspår motståndarens nästa drag – det gissar korrekt i 57 procent av fallen – och det andra nätet uppskattar vinstchansen för de olika dragen.

För varje simulerat drag kopplas näten in för att bestämma vilka drag som ska simuleras i nästa steg.

Innan Alphago togs i bruk tränades näten. Först det nät som spår motståndarens drag. Det förevisades 30 miljoner drag utförda av skickliga Go-spelare. Därefter spelade nätet tusentals partier mot sig själv för att ytterligare trimma sina strategier.

Nätet som värderar dragen tränades genom att Alphago återigen fick spela partier mot sig själv.

När Alphago utvärderades mot dagens bästa Go-program i 500 matcher, vann Alphago alla utom en, trots att motståndarna fick fyra drags försprång.

Därefter utmanades Europamästaren. Han besegrades i fem matcher.

Redan år 2014 besegrades en Go-mästare med den högsta rankningen nio av ett annat datorprogram, Crazystone. Men Crazystone hade fyra drags försprång och skaparen av Crazystone spådde att det skulle dröja ett decennium innan en dator skulle kunna vinna utan handicap.

Go-spelaren Alphago har några klassiska fördelar mot sina mänskliga motståndare eftersom den är en maskin: den kan träna sig genom att spela många gånger fler spel under en dag än en människa hinner spela under en livstid, och den gör aldrig misstag. Av den anledningen tror Google Deep Mind att Alphago till slut inte bara kommer att kunna utmana de mänskliga stormästarna, utan också överträffa dem.

Förberedelserna pågår för nästa utmaning, vilket är att spela mot Lee Sedol, av många ansedd som världens bästa Go-spelare och rankad på den högsta nivån nio sedan år 2003.

– Det är en ära att ha blivit utvald, men jag är säker på att jag kan vinna, säger Lee Sedol.

Ordföranden för Storbritanniens Go-sällskap hade inte väntat sig att Alphago skulle besegra Fan Hui. Vad gäller Lee Sedol vågar han idag inte vara lika säker

– Om jag slog vad skulle jag satsa pengarna på människan. Men jag skulle inte satsa mycket pengar, säger han.

AI-genombrott:Go-mästare besegrad av dator

AI-genombrott:
Go-mästare besegrad av dator