Bauernvorgaben

Angeregt durch Threads zum Thema Bauernvorgabe im CSS-Forum habe ich diverse Engines mit sehr verschiedenen Spielstärken jeweils 256 mal gegen

     Stockfish_14081001_x64_modern

antreten lassen.
Herausgekommen ist:
(eine Aufschlüsselung für einzelne Fehlbauern gibt es weiter unten.)

Engine

ELO gem. CCRL 40/4

ELO-Diff. ggü. SF

g-v-r

Punkte

Quote

entspricht
ELO-Diff.

Stockfish_14081001_x64_modern

3234

0

159-9-88

203,0

79,3%

233

Houdini_4_AQ_x64B

3232

-1

165-35-56

193,0

75,4%

194

Komodo 8 x64

3205

-28

152-24-80

192,0

75,0%

191

Gull 3 x64

3187

-46

120-61-75

157,5

61,5%

82

Critter_1.6a_64bit

3154

-79

105-55-96

153,0

59,8%

69

Komodo-5-64bit

3141

-92

105-61-90

150,0

58,6%

60

Houdini_103a_x64_1CPU

3114

-119

79-68-109

133,5

52,1%

15

Stockfish-191-64-ja      

3051

-182

44-126-86

87,0

34,0%

-115

Senpai1.0_sse42

2995

-238

40-133-83

81,5

31,8%

-132

Rybka 2.3.2a 64 bit

2975

-258

15-175-66

48,0

18,8%

-255

Spike 1.4

2919

-314

14-184-58

43,0

16,8%

-278

Naum 2,0 x64

2694

-539

3-216-37

21,5

8,4%

-415

Hermann 2.8 64 bit

2530

-703

3-238-15

10,5

4,1%

-548

Die ELO-Werte der Engines entnahm ich der CCRL-40/4-Liste für 1 CPU.
Den Wert für diese konkrete Stockfish-Develeopmentversion Stockfish_14081001_x64_modern’ habe ich basierend auf dieser Liste aber frech geschätzt. Wird schon ungefähr hinhauen.

Rahmenbedingungen:

  • Zeitvorgabe: 1 Min für die Partie + 0,5 Sec pro Zug
  • Pondern: off
  • Threads: 1
  • Tablebase: keine
  • Umfang: 256 Partien je Begegnung
  • Startstellungen: Reihum fehlte einer der 16 Bauern,
    jeweils stehen alle anderen Bauern auf den Ausgangsfeldern oder einer der 15 verbliebenen Bauern ist um ein Feld vorgerückt.
    = 16*(1+15) = 256 Startstellungen
  • Start-EPD-Datei: Fehlende_Bauern.epd
  • Prozessor: Intel(R) Core(TM) i3-2377M CPU @ 1.50GHz
    in einem 4GB-Notebook

 

Quote in Abhängigkeit von der ELO-Differenz zu Stockfish

Bauervorgabe3

Bemerkungen

  • Trendlinie
    Die Trendlinie habe ich aus freier Hand, also ohne jede formale Optimierung, eingezeichnet.
    Ich stelle mir halt vor, dass so ungefähr eine vernünftige Trendlinie aussehen könnte. :-)
  • Zeit
    Die Zeit 1min + 1/2sec ist natürlich verdammt kurz, besonders auf meinem eh nicht so sehr schnellen Notebook.
    Mit dieser Vorgabe dauerte eine Begegnung über 256 Partien aber höchstens 1 Tag und ich konnte in einigen Tagen halt etliche Begegnungen ansehen. Bei einer deutlichen Überlegenheit einer Seite dauerte es aber meist weniger lang.
  • Komodo 8
    Die Engine Komodo 8 mag diese Zeit vermutlich nicht wirklich und sie hat gerade im Vergleich zu Stockfish und Houdini nicht besonders gut gepunktet.
  • Marken
    Ungefähr 50% Erfolgsaussichten hat eine Engine, die 125 ELO hinter der bauerngeschwächten Engine liegt.
    Um 75% zu erwarten, braucht es schon recht genau die Spielstärke der geschwächten Engine,
    25% darf erwarten, wer ca. 250 ELO zurückliegt.
     
  • Arena
    Arena 3.0 und 3.5 haben den Bug, dass bei Turnieren mit Startstellungen-EPD-Datei ohne Wiederholung die erste gespielte Partie dann doch mit Farbvertauschung wiederholt wird. Das ist bei der Turnierdurchführung zu beachten. Spätere Tests habe ich dann mit PGN-Dateien für die Startstellungen durchgeführt, mit denen Arena fehlerfrei umgeht.

Das Fehlen welcher Bauern führt nun zu wie großen Vorteilen?

Die Einzelerfolge der Engines gegen Stockfish habe ich hier mal zusammen gefasst. Die ersten zwei Zeilen kennzeichnen den fehlenden Bauern. Die Zeilen unten geben an, wie erfolgreich der Gegner gegen Stockfish mit eben diesem Fehlbauern spielen konnte.
Ich habe das mal in folgenden Tabellen ausgewertet.

Stockfish hat weiß und ein Bauer fehlt, die anderen Engines dann eben mit schwarz :-)

Engine mit schwarz

a2

b2

c2

d2

e2

f2

g2

h2

Stockfish_14081001_x64_modern

11,5

12,0

10,0

13,5

13,5

13,0

11,5

9,0

Houdini_4_AQ_x64B

9,0

11,0

11,0

12,5

12,0

9,0

14,5

8,5

Komodo-8-64bit

9,0

10,5

9.0

14,00

13,0

11,5

11,5

7,5

Gull 3 x64

10,5

8,0

10,0

10,0

10,0

9,5

9,0

9,0

Critter_1.6a_64bit

7,5

10,5

8,0

10,5

10,5

8,5

10,5

6,5

Komodo-5-64bit

8,0

9,5

9,5

11,5

9,0

9,5

10,0

5,5

Houdini_103a_x64_1CPU

6,5

8,5

8,0

11,5

6,5

8,5

75

5,5

Stockfish-191-64-ja 

5,0

7,5

7,0

3,5

4,5

3,0

6,5

1,5

Senpai1.0_sse42

4,0

3,5

3,5

4,5

5,0

6,5

3,5

2,0

Rybka 2.3.2a 64 bi

1,5

2,0

3,0

5,0

4,5

1,5

3,0

1,5

Spike 1.4

1,5

2,5

2,5

0,0

2,5

2,5

1,5

0,5

Naum 2.0 x64

0,5

1,5

3,0

1,5

1,0

0,5

1,0

0,0

Hermann 2.8 64 bit

0,0

1,0

0,5

0,5

0,5

1,0

0,0

0,0

zusammen

74,5

88,0

85,0

98,5

92,5

84,5

90,0

57,0

Quote

35,8%

42,3%

40,9%

47,4%

44,5%

40,6%

43,3%

27,4%

Web Design

Stockfish hat schwarz und ein Bauer fehlt, die anderen Engines dann eben mit weiß

Engine mit weiß

a7

b7

c7

d7

e7

f7

g7

h7

Stockfish_14081001_x64_modern

13,0

13,0

14,0

15,0

13,5

14,5

14,5

11,5

Houdini_4_AQ_x64B

12,5

12,0

13,0

15,5

14,0

13,0

15,5

10,0

Komodo-8-64bit

13,0

14,0

14,0

11,5

14,0

13,6

14,5

11,5

Gull 3 x64

8,0

12,0

8,0

11,0

9,0

11,5

12,0

10,0

Critter_1.6a_64bit

10,5

9,5

11,5

12,0

9,0

100

12,0

6,0

Komodo-5-64bit

8,5

10,5

11,5

7,5

12,0

11,0

10,0

6,5

Houdini_103a_x64_1CPU

7,5

10,0

9,0

10,5

7,5

11,0

10,0

5,5

Stockfish-191-64-ja 

3,5

6,0

4,0

9,0

7,5

6,5

7,0

5,0

Senpai1.0_sse42

5,0

5,5

8,0

6,0

5,5

8,5

6,5

4,0

Rybka 2.3.2a 64 bi

2,5

2,0

2,5

4,0

5,0

3,5

5,0

1,5

Spike 1.4

5,0

4,0

4,0

3,5

3,5

3,5

4,0

2,0

Naum 2.0 x64

1,5

2,5

1,5

1,0

2,0

0,5

2,5

1,0

Hermann 2.8 64 bit

1,0

2,0

0,0

1,5

0,5

2,0

0,0

0,0

zusammen

91,5

103,0

101,01

108,0

103,0

109,0

113,5

74,5

Quote

44,0%

49,5%

48,6%

51,9%

49,5%

52,4%

54,6%

35,8%

  • Jede Engine spielte 256 mal gegen Stockfish und dabei jeweils 16 mal gegen jeden fehlenden Bauern.
  • Insgesamt waren es 13*256=3328 Partien, gegen jeden fehlenden Bauern wurde also 13*16=208 mal gespielt.
  • Leider kann man in dieser Tabelle nicht ablesen, wie groß der durchschnittliche Vorteil durch einen Mehrbauern ist.
    Allenfalls die erste Zeile 1 (Stockfish gegen sich selbst) vermittelt eine Ahnung.
  • Schwarz profitiert am meisten vom fehlenden d-, e-, g- und b-Bauern des Weißen, am wenigsten nützt es auch ihm, wenn der h-Bauer bei Weiß fehlt.
  • Weiß hat besonders gute Chancen, wenn dem Schwarzen der d-, f- oder g-Bauer fehlt.
    Der fehlende h-Bauer stört Schwarz aber vergleichsweise wenig. Auch der a-Bauer zählt recht wenig.
  • Dass fehlende a- und h-Bauern nicht so schlimm sind, deutete sich schon in den Bewertungen der Engines an, die dann regelmäßig kaum einen Vorteil für solch einen Mehrbauern auswiesen. Dass insbesondere der Mehrbesitz eines h-Bauern so viel weniger Vorteil bringt, finde ich überraschend.
     
  • Jeweils 208-Partien sind immer noch so wenig, dass der Zufall kräftig mitspielt. Daher können in dieser Tabelle bestenfalls Tendenzen abgelesen werden.
[Bennos Skizzen] [Computerschach] [PGN-Generatoren] [Bauernvorgaben] [Figurenvorgaben]