Google's AlphaZero besiegt Stockfish in einem 100 Partien Vergleich

Google's AlphaZero besiegt Stockfish in einem 100 Partien Vergleich

Heute hat sich Schach für immer verändert. Und vielleicht sogar die ganze Welt.

Vor etwas mehr als einem Jahr konnte AlphaGo sensationell gegen den besten GO Spieler gewinnen. Heute gewann das künstliche Intelligenzprogramm AlphaZero gegen das beste Schachprogramm der Welt

Stockfish, das für die meisten Top-Spieler unabdingbar geworden ist, 2016 die TCEC Championship und vor wenigen Wochen die Computerschach Meisterschaft 2017 gewinnen konnte, hatte keine Chance. Alpha Zero gewann das 100 Partien Duell mit 28 Siegen, 72 Remis und 0 Niederlagen.

Oh, und AlphaZero benötigte nur 4 Stunden um Schach zu "erlernen". Sorry liebe Leser, aber ihr habt es ja immerhin versucht.

Das stimmt -- die Programmierer von AlphaZero aus der DeepMind Abteilung von Google haben das "maschinelle Lernen" angewandt. Vereinfacht gesagt, wurde AlphaZero das Spiel nicht im traditionellen Stil beigebracht. Das heißt: Kein Eröffnungsbuch, keine Endspiel-Datenbanken und auch keine komplizierten Algorythmen die den Unterschied von Zentrums- und Randbauern sezierien.

Google Headquarters in London.

Das Firmengebäude von Google in London. Die DeepMind Abteilung befindet sich hier im 8. Stock. | Foto: Maria Emelianova/Chess.com.

Das wäre vergleichbar mit einem Roboter, der Zugang zu Tausenden von Metallteilen und -teilchen erhält, aber keine Kenntnis von einem Verbrennungsmotor hat und dann so lange mit jeder möglichen Kombination experimentiert, bis er einen Ferrari gebaut hat. Das ist alles in weniger Zeit, die man braucht, um die "Herr der Ringe" -Trilogie zu sehen. Das Programm hatte nur vier Stunden, in denen es gegen sich selbst spielte und dadurch sein eigener Lehrer wurde.

Das Programmiererteam hält sich bis jetzt bedeckt und verwehrte Chess.com mit den noch nicht fertigen Analysen ein Interview, wobei die Analysen jedoch bereits veröffentlicht wurden. Einer der Entwickler ist Demis Hassabis, ein CM aus England und Mitgründer von DeepMind (das Google 2014 übernommen hat). Hassabis, der im ProBiz Event der London Chess Classics mitgespielt hat, hält sich momentan in Kalifornien auf, wo er an einer Konferenz über neuronale Informationsverarbeitungssysteme teilnimmt, denn auch hier ist er Co-Autor einer Publikation, allerdings zu einem anderen Thema.

Demis Hassabis with Michael Adams in London.

Demis Hassabis spielte beim ProBiz Event im Google Firmensitz in London vor wenigen Tagen gegen Michael Adams. | Foto: Maria Emelianova/Chess.com.

GM Garry Kasparov, der viel Erfahrung mit Schachprogrammen hat und diese regelmäßig mit Chess.com teilt, ist nicht besonders überrascht, wie schnell DeepMind den Schritt vom Go zum Schach bewältigt hat.

"Es ist eine bemerkenswerte Leistung, die wir aber nach AlphaGo erwartet hatten", sagte er zu Chess.com. "Es nähert sich dem" Typ B ", einer menschenähnlichen Herangehensweise an Computerschach, von der Claude Shannon und Alan Turing anstelle von roher Gewalt geträumt haben."

Eine, der 10 ausgewählten Partien in der Publikation.

Genau wie Menschen betrachtet AlphaZero weniger Stellungen als seine Vorgänger. Die Publikation behauptet, dass es "nur" 80.000 Stellungen pro Sekunde betrachtet, verglichen mit Stockfishs 70 Millionen Stellungen pro Sekunde.

GM Peter Heine Nielsen, der langjährige Sekundant des Weltmeisters GM Magnus Carlsen, ist nun mit dem FIDE Präsidenten überein: Außerirdische. Er sagte zu Chess.com: "Nachdem ich die Publikation gelesen und besonders nachdem ich die Partien angesehen hatte, dachte ich mir: Tja. Ich habe mich immer gefragt, wie es wohl wäre, wenn Außerirdische auf der Erde landen und uns zeigen würden, wie man richtig Schach spielt. Jetzt fühle ich mich, als wäre es passiert."

Chess.com's Interview mit Nielsen über die AlphaZero Nachricht.

Ferner haben wir gelernt, dass Weiß in der Tat die richtige Wahl ist, sogar unter den Nicht-Empfindungsfähigen. Von AlphaZeros 28 Siegen kamen 25 von der weißen Seite (obwohl 3 Siege, 47 Remis und 0 Niederlagen mit Schwarz gegen die 3400 + Stockfish-Engine auch nicht schlecht sind).

Mit der Zeit erhöhte das Programm auch die Häufigkeit der Öffnungen, die sie bevorzugte. Wir entschuldigen uns jetzt schon bei allen Fans der Königsindischen Verteidigung, aber euer Baby ist nicht das Auserwählte. Der Enthusiasmus für Französisch ebbte auch immer mehr ab, während das Programm immer mehr gefallen am Damengambit und an der Englischen Eröffnung fand.

null

Die Häufigkeit der Eröffnungen von AlphaZero während seiner "Lernphase". Screenshot der AlphaZero Forschungsarbeit.

Und was machst du, wenn du ein Ding bist, das niemals müde wird und du gerade ein 1400 Jahre altes Spiel gemeistert hast? Du lernst das nächste! Nach dem Stockfisch-Match "trainierte" AlphaZero dann gerade mal zwei Stunden und besiegte dann das beste Shogi-spielende Computerprogramm "Elmo".

Die Auswirkungen für diese erfinderische Art des Lernens sind natürlich nicht auf Spiele beschränkt.

"Wir sind immer davon ausgegangen, dass Schach zu viel empirisches Wissen benötigt, als dass ein Computer so gut spielen könnte, ohne dass menschliches Wissen hinzugefügt wird", sagte Kasparov. "Natürlich bin ich gespannt herauszufinden, was wir von AlphaZero über Schach lernen können, denn das ist das beste des maschinellen Lernens. Maschinen, die Regeln herausfinden, die der Mensch nicht entdecken kann. Aber offensichtlich gehen die Implikationen weit über das Schach und andere Spiele hinaus. Die Fähigkeit einer Maschine, Jahrhunderte des menschlichen Wissens in komplexen geschlossenen Systemen nachzubilden und zu übertreffen, ist ein Werkzeug, das die Welt verändert."

Garry Kasparov and Demis Hassabis in London.

Garry Kasparov und Demis Hassabis beim ProBiz Event in London. | Foto: Maria Emelianova/Chess.com.

Chess.com interviewte acht der 10 Spieler, die an den London Chess Classic teilnehmen, über ihre Meinung zu dem Spiel. Videos ihrer Gedanken werden später auf der Website veröffentlicht.

Der Spieler mit den schärfsten Bedenken gegen die Bedingungen des Duells war GM Hikaru Nakamura. Während online eine herzhafte Diskussion über die Rechenleistung der beiden Seiten geführt wurde, war Nakamura der Ansicht, dass dies ein zweitrangiges Problem sei.

Der Amerikaner bezeichnete das Spiel als "unehrlich" und wies darauf hin, dass Stockfishs Methodik ein Eröffnungsbuch für eine optimale Leistung benötigt. Obwohl er nicht glaubt, dass sich der ultimative Gewinner geändert hätte, dachte Nakamura, dass die Höhe des Gewinns gemildert worden wäre.

"Ich bin mir ziemlich sicher, dass nicht einmal der liebe Gott 75 Prozent mit Weiß gegen Stockfish gewinnen würde, wenn Stockfish ohne Handicap spielen würde", sagte er über die 25 Siege und 25 Unentschieden, die AlphaZero mit den weißen Steinen erzielte.

GM Larry Kaufman, der führende Schachberater des Komodo-Programms, hofft, dass die Leistung des neuen Programms auch auf Heimcomputern, ohne die Vorteile der immensen Rechenleistung der Google Computer zu sehen sein werden und stimmte Nakamuras Einwänden wegen des Ausschaltens der Eröffnungsbibliothek von Stockfish zu.

"Der Erfolg ist natürlich ziemlich unglaublich," sagte er. "Nachdem ich von den Erfolgen von AlphaGo Zero in Go gehört hatte, erwartete ich jedoch ein Ergebnis wie dieses, zumal das Team mit Demis Hassabis einen Schachmeister hat. Noch ist allerdings nicht klar, ob AlphaZero auf normalen PCs Schach spielen könnte und wenn ja, wie stark es wäre. Es mag gut sein, dass die momentane Dominanz der Minimax-Schachmaschinen zu Ende ist, aber es ist noch zu früh, um das zu sagen. Es sollte darauf hingewiesen werden, dass AlphaZero effektiv sein eigenes Eröffnungsbuch aufgebaut hat, sodass ein fairer Vergleich nur gegen eine Top-Engine mit einem guten Eröffnungsbuch wäre."

Ganz abgesehen von den Spielbedingungen ist Nielsen jetzt schon gespannt, welche anderen Disziplinen durch diese Art des Lernens verfeinert oder gemeistert werden.

"Dies ist echte Künstliche Intelligenz", sagte er. "Es reicht von etwas Schachrelevantem zu etwas, das Nobelpreise gewinnt oder sogar etwas größerem als Nobelpreise. Ich denke, es ist grundsätzlich cool für das Schach, dass sich Google dafür entschied, vier Stunden Schach zu spielen, weil wir daraus so viel Wissen erhielten. Ich denke, es ist ein toller Tag für Schach, aber die Reise ist natürlich noch lange nicht zu Ende."

Mehr von FM MikeKlein
Georg Meier spielt in der Quali für die Speed Chess Meisterschaft

Georg Meier spielt in der Quali für die Speed Chess Meisterschaft

Shankland gewinnt die US Meisterschaft

Shankland gewinnt die US Meisterschaft