Huvud Förnya Google Artificiell intelligens 'Alpha Go Zero' tryckte bara på Återställ om hur man lär sig

Google Artificiell intelligens 'Alpha Go Zero' tryckte bara på Återställ om hur man lär sig

Ditt Horoskop För Imorgon

Kom ihåg (vagt) hur du lärde dig att gå, prata, cykla eller köra? Det var rörigt och fullt av misstag, men de färdigheter du lärde dig på det sättet stannade kvar. Utanför levande system har det varit utmanande att strukturera tillräckligt starka algoritmer för att ta in 'verklig livserfarenhet' och utveckla klibbiga, anpassningsbara beteenden för artificiell intelligens.

Tja, Alpha Go Zero gjorde det bara.

'Det börjar från ett tomt skiffer och räknar ut endast för sig själv, bara från självspel och utan mänsklig kunskap, eller några mänskliga data, funktioner eller exempel eller ingripande från människor. Den upptäcker hur man spelar Go från de första principerna, säger DeepMinds professor David Silver.

AI har haft flera iterationer, var och en smartare och mer kapabel än den tidigare. Den tidigare versionen använde en enorm databas med tidigare spel tillsammans med en massa algoritmer som pekade på att vinna. Detta tillvägagångssätt ledde till nederlaget för den regerande världsmästaren professionella Go-spelare. I poker skinnade AI Libratus nyligen världens bästa pokerspelare med nästan 2 miljoner dollar, också genom att lära sig genom självspel istället för mänskliga speldata.

hillary älskar det eller lista det ålder

Nu, i den senaste versionen av Alpha Go, undervisade programmet för artificiell intelligens sig hur man spelar Go - utan mänsklig bakgrund.

Genom att köra miljontals spelsimuleringar mot sig själv tog det 40 dagar för det att - från grunden - lära sig att slå världsmästarversionen av sig själv. Det är verkligen spelförändrande, inte bara för Go utan också för hur ny kunskap upptäcks. Hur exakt eller fullständig är din domänexpertis? Det finns mycket mer att upptäcka, är vad detta fascinerande experiment med att lära sig med Alpha Go Zero berättar för oss.

'Tanken med Alpha Go är inte att gå ut och besegra människor, utan faktiskt att upptäcka vad det innebär att göra vetenskap - för ett program för att kunna lära sig själv vad kunskap är', enligt Silver i ett YouTube-inlägg om prestationen.

Alpha Go Zero Deep Mind-teamet kallar det första principen, 'tabula rasa' (blank skiffer) lärande.

'Om du kan uppnå tabula rasa lärande, du har en agent som kan transplanteras från spelet Gå till vilken annan domän som helst, och närmare detaljerna för spelet du befinner dig i kommer du med en algoritm som är så allmän att den kan användas var som helst, säger han . Det är en provocerande idé när du utvidgar konceptet. Tänk bara vad vi skulle kunna göra med en uppsättning starka inlärningsalgoritmer som systematiskt kan ta itu med tuffa problem och lära sig snabbare än vår civilisations kollektiva kunskap. . . i dagar, inte årtionden.

hur gammal är roselyn sanchez

För närvarande är den stora borttagningen, 'algoritmer betyder mycket mer än antingen databehandling eller tillgänglig data', säger Silver. Detta är enbart en spelväxlare i hur vi närmar oss att utvidga den kända världen. Medan Alpha Go körs på cirka 25 miljoner dollar i hårdvara - det är inte precis ett lättviktigt system - du vet att AI-guruer länge har arbetat med att skapa renare, bättre datamängder. Idag anses många stora datamängder vara för bullriga - fulla av dåliga data - för att träna en artificiell intelligens exakt. Om AI lär sig av data och data är dåliga lär sig det inte. Stort problem.

Vad händer om du inte behöver rena data utan bara erfarenhet och artificiell intelligens kan träna sig själv?

Det är den spännande prestationen i Alpha Go Zero. Även om det är i den nischade, regelbaserade spelvärlden, har det stora konsekvenser i alla branscher som arbetar med fysiska regler - tänk kemi, trafik, biologi, farmakologi, resor, logistik och tillverkning. Om vi ​​kan utforma regler så flexibla att de kan arbeta utifrån bredare erfarenhet och så riktade att de alltid skapar starkare skicklighet - som Alpha Go Zero - så är det möjligt att uppnå artificiell intelligens som masterminds system. Dessa system behöver inga externa data, har inga datarengöringsproblem och behöver ingen avmattning i människan. Det är delvis därför Googles moderbolag, Alphabet, satsade företaget på artificiell intelligens och investerar i artificiell intelligens i snabb takt. (Amazon investerar också i artificiell intelligens, precis som sitt senaste AI-förvärv BodyLabs.)

hur lång var Tom Petty

Deep Mind-professor David Silver säger, 'det faktum att vi har sett ett program uppnå en högprestanda ... borde betyda att vi nu kan börja ta itu med några av de mest utmanande och effektfulla problemen för mänskligheten.'

Det här inlägget har uppdaterats för att klargöra att AI Libratus nyligen slog de bästa pokerspelarna genom att använda en strategi som involverar självspel snarare än mänsklig inmatad data.