Vier Stunden Schach geübt – Weltmeister geschlagen!

Na, das ist ja einmal eine Meldung. Allerdings geht es hier nicht um den Schachweltmeister Magnus Carlsen, der wäre zu schwach! Nein, erwischt hat es Stockfish 8, den frisch gekürten Computer-Weltmeister und Liebling aller Computerschächer.

AlphaZero heißt das Programm der Fa. DeepMind, die schon mit dem Programm AlphaGo im vergangenen Jahr beim Go-Spiel menschliche Gegner düpierte.

Fällt die Bastion?

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm” heißt die Veröffentlichung des Google-Unternehmens vom Montag dieser Woche.

https://arxiv.org/pdf/1712.01815.pdf

Dem selbstlernenden Programm wurden die Schachregeln einprogrammiert – mehr nicht. Keine Eröffnungsbücher, keine Endspieldatenbanken. Dann ließ man das Programm 4 Stunden lang gegen sich selbst spielen und dabei lernen (700.000 Partien). Eine anfängliche Französisch-Präferenz des Programms verebbte zugunsten Caro-Kann. Damengambit und Englisch haben sich als Standardwaffen herausgeschält. Königsindisch und Sizilianisch fanden nur geringes Interesse.

Mit dem daraus erworbenen Wissen wurde das Programm für 100 Turnierpartien auf Stockfish losgelassen. “Unehrlich”, beurteilte Hikaru Nakamura das Match, denn Stockfish musste bei knapper Rechenzeit (Eine Min/Zug) auf sein Eröffnungsbuch verzichten. Die Begegnung endete trotzdem 64:36 für AlphaZero, wobei das Programm keine Partie verlor!

Ergebnis mit Weiß 25+/25=/0- und mit Schwarz 3+/47=/0-

Die menschliche Einschätzung, dass es einen Anzugsvorteil gibt, wird bestätigt, aber auch mit Schwarz kann man mindestens Remis rausholen!

Und weil 4 Stunden nur ein angebrochener Vormittag sind, durfte das Programm an diesem Tag noch 2 Stunden das chinesische Shogi-Schach studieren. Dessen bester Vertreter, Programm “Elmo” hatte danach auch keine Chance mehr. Dann nochmal ein paar Stunden Go gelernt und auch in diesem Spiel das Vorläuferprogramm “AlphaGo Master” deutlich geschlagen.

Aliens” klassifizierte Carlsen-Sekundant Peter Heine Nielsen auf chess.com die Partiequalität. Es sei als wären Außerirdische auf der Erde gelandet und hätten uns gezeigt wie man Schach spielt.

Kolumnist FM Mike Klein verglich das Verhalten des Computers mit dem eines anfänglich unwissenden Roboters, welchem man einen Haufen Bauteile zum Kombinieren zur Verfügung stellte und bevor man noch die Herr-der-Ringe-Trilogie zu Ende geschaut habe, bastele er schon an einem Ferrari …

https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match

Euphorisch berechnete User Nezhmetdinov191919 12/7/2017 04:14 auf chessbase.com:

Not so sure I did the math correctly, but it seems that with the total score of: AlphaZero 64 x 36 Stockfish (3389) that gives us a performance rating of 7255 and an estimated rating of 5323 (!!). It can give God the odds of knight and the move.

https://en.chessbase.com/post/the-future-is-here-alphazero-learns-chess

Zehn Partien aus der Veröffentlichung, referiert mit der Megabase 2015. (Klick auf Feld g8 zeigt Optionen)

Andreas Lange

2 Gedanken zu „Vier Stunden Schach geübt – Weltmeister geschlagen!“

  1. Klingt nach einer Sensations-Meldung und dem nahenden Weltuntergang.

    Aber zumindest die vermeintliche Elo-Performance-Berechnung von User Nezhmetdinov191919 ist schon mal komplett neben der Spur. 64% ist gemäß Elotabelle eine Performance von genau 100 Punkten über dem Gegnerschnitt. Und das ist auf 10x schnellerer Hardware (auf der AlphaZero dem Vernehmen nach lief) gar nicht mal so ungewöhnlich. Zumal, wenn man sich 700.000 Partien lang auf einen unbeweglichen Gegner einschiessen kann (der in der gleichen Zeit nicht dazu lernen darf, also einen einmal gemachten Fehler immer wieder wiederholt und zugleich seines Eröffnungsbuchs beraubt wurde). Das stutzt die ganze Sensationsmeldung m.E. wieder auf Normalmaß zurück. Der wahre Beweis der überlegenen Spielstärke steht noch aus und kann nur in einem fairen Wettkampf und gegen mehr als nur einen Gegner (Komodo, Houdini, …) erbracht werden. Welcher sicherlich nur und genau dann zur Austragung gelangt, wenn die Väter von AlphaZero von seinem Erfolg überzeugt sind (das können und werden sie ja vorab im stillen Kämmerlein testen). Wir werden also davon hören (oder auch nicht).

    Dass bei 700000 Computerpartien auch ein paar sensationelle neue Strategien gefunden werden, halte ich nicht für außergewöhnlich.

    Viele Grüße vom (Dipl.-Math.) Peter

  2. Die 700.000 Partien dienten nicht als Eröffnungsbuch, sondern in diesen Partien hat sich das Programm selbst beigebracht, wie man in Kenntnis der Regeln am erfolgreichsten Schach spielt. Eine Aufgabe die sonst Programmierer beschäftigt. Im Match spielten beide Rechner dann ohne Eröffnungsbuch. Während Stockfish 70.000.000 Knoten pro Sekunde bewertete begnügte sich AlphaZero mit durchschnittlich 80.000. “Nahe an Shannon-B” (Schachwissen, im Gegensatz zur Shannon-A-Strategie=Brute-Force-Rechenpower) nannte Kasparov die Spielweise. Einen Zug wie 21. Lg5!! in der 5. Partie fand AlphaZero in der Zeit (1 Minute). Houdini 6 benötigte in der Analyse dafür 5 Stunden. Wie man eine Partie mit Minusfigur zum Sieg führt zeigt eindrucksvoll Partie 9.

Schreibe einen Kommentar

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.