Zijn sterke schakers minder grillig? door Jesper de Groote
Gelukkig Nieuwjaar! Hoewel 2015 alweer twee weken tot het verleden behoort, begint het schaakjaar 2016 aanstaande zaterdag pas echt in Wijk aan Zee. In de tochtige kustplaats zal Magnus Carlsen graag revanche willen nemen voor een redelijk mislukt schaakjaar. Het begin en einde van 2015 verliepen goed voor hem, maar het tussenstuk was prut. Vooral op het Norway Chess in eigen land was de wereldkampioen onherkenbaar en dus raakte de magische 2900-grens volledig uit zicht. Carlsen sloot 2015 af met een bijna menselijke rating van 2834, bijna vijftig punten onder zijn record.
Natuurlijk zijn ratings niet constant (gelukkig maar) en blijkt ook de grote Carlsen niet voor ratingschommelingen immuun. Toch vroeg ik me af of Carlsens speelsterkte door het ratingsysteem niet overschat wordt. Jaren geleden, toen een nog 16-jarige Carlsen in de onderste regionen van de A-groep van het toenmalige Corus-toernooi meedeed, vroeg mijn schaaktrainer Piet Peelen zich af of het toeval was dat de toppers van dat moment in het toernooi rating wonnen. Topalov domineerde in Wijk aan Zee in 2007, terwijl Kramnik en Anand stevig in de subtop meededen (al sloot Anand het toernooi uiteindelijk met een klein minnetje af). Onderschatte het ratingsysteem de winstkansen van deze kampioenen tegen de andere wereldtoppers?
Dat zou kunnen komen doordat topschakers minder grillig zijn dan de gewone huis-tuin-en-keukenschaker. Ze zijn immers dusdanig geroutineerd dat ze met vrijwel alle stellingstypen goed uit de voeten kunnen. Doordat ze minder vaak door de ondergrens zakken, speelt het casino-element minder een rol en zal het speelsterkteverschil vaker naar voren komen. Het ratingsysteem houdt er geen rekening mee en dus kan het betekenen dat een speelsterkteverschil van 100 elopunten uiteindelijk resulteert in een ratingverschil van bijvoorbeeld 150 punten voor de topspelers. Dat kan dan bijvoorbeeld weer verklaren waarom Carlsen het onaantastbaar geachte ratingrecord van Kasparov zo makkelijk heeft verpulverd.
Tot zover de theorie, maar klopt het ook in de praktijk? Aanvankelijk leek het daar wel op. Een analyse van Carlsens schaakresultaten van de afgelopen vijf jaar laat verrassend weinig spreiding zien in de behaalde LPR’s (de TPR’s per ratinglijst), ondanks dat Carlsen zo nu en dan echt belabberde toernooien heeft. Een verdere analyse wees uit dat dit ook voor de overige deelnemers in de hoofdgroep van Tata Steel gold, zij het in iets mindere mate. Van de deelnemers was de nog piepjonge Wei Yi nog het grilligst, voor landgenoot Yifan Hou en de altijd onberekenbare Mamedyarov. Toch waren zelfs deze spelers minder grillig dan de gemiddelde schaker. Of niet?
Een gedetailleerdere analyse van de resultaten van Carlsen van de laatste vijf jaar laat zien dat dit niet echt klopt. Gebaseerd op bijna 300 partijen valt op dat Carlsens scores maar weinig afwijken ten opzichte van de door het ratingsysteem verwachte scores, wat doet vermoeden dat de analyse op basis van LPR’s niet goed werkt. Daar is wat voor te zeggen, want een TPR (toernooiprestatierating) is een getal dat op basis van minimale informatie (gemiddelde score en gemiddelde rating van de tegenstanders) tot stand is gekomen. Dit getal is daarom waarschijnlijk ook veel te onnauwkeurig om steekhoudende analyses op te kunnen verrichten.
Carlsens score uitgedrukt in TPR afgezet tegen het ratingverschil. De gemiddelden zijn berekend gebaseerd op maximaal 31 partijen. De grijze lijnen geven het 95%-betrouwbaarheidsinterval weer.
In ieder geval blijken Carlsens scores redelijk in de pas te lopen met de voorspelling van het ratingsysteem. Overal op de grafiek liggen zijn behaalde scores statistisch gezien binnen de verwachte scores. Wel vallen enkele afwijkingen op: zo blijkt Carlsen goed te scoren tegen spelers die maar iets zwakker zijn dan hijzelf, terwijl hij relatief matig scoort tegen spelers die ongeveer 200 elopunten zwakker zijn dan hijzelf. Misschien heeft dat een psychologische oorzaak, misschien is het gewoon toeval.
Vooralsnog wijst niks erop dat topspelers echt minder grillig zijn. Misschien zijn ze het wel, maar valt het niet op omdat er op hoog niveau minder ruimte voor fouten is. En misschien is grilligheid van resultaten een vast onderdeel van het spelletje. De ene keer lukt het gewoon beter dan de andere keer, zonder dat daar een duidelijk aanwijsbare oorzaak voor is. “Scoren is als ketchup”, wordt er in de voetbalwereld weleens gezegd en die vlieger lijkt in het schaken ook op te gaan.