Scorito-tips deel 2: de zin en onzin van cijfers en stats

Geplaatst door

De zestiende-eeuwse Franse apotheker, astroloog en ziener Michel de Nostredame – beter bekend als Nostradamus – is de bekendste toekomstvoorspeller uit de moderne geschiedenis. De aanhangers van Nostradamus claimen dat hij onder andere de twee wereldoorlogen, het communisme en de opkomst van Napoleon en Hitler heeft voorzien. Dat is natuurlijk allemaal leuk en aardig, maar in zijn boek Les Prophéties wordt met geen woord gerept over wie de veertiende etappe van de Giro d’Italia 2022 in de vroege vlucht zit om bergpunten te sprokkelen of welke sprinter van de tweede lijn beslag weet te leggen op de achtste plaats in een waaieretappe langs de Balearische kust in de Vuelta van 2024. Waardeloos dus!

Gelukkig voor de Scorito-fanaten heeft deze Franse charlatan een Friese erfgenaam die zijn prioriteiten wél op een rijtje heeft. Gesteund door de cijfers en algoritmes van het WielerOrakel heeft NostraHoekstra (@NostraHoekstra) een stapsgewijze methode ontwikkeld om tot een uitgebalanceerde en met bronnen onderbouwde teamselectie te komen voor je wielerpooltje! Vandaag volgt stap 2: de omgang met cijfers en statistieken.

LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING ALGEMEEN KLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING SPRINTKLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING BERGKLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING JONGERENKLASSEMENT
LEES OOK: SCORITO-TIPS DEEL 1 – PARCOURSANALYSE EN VERHOUDINGEN
LEES OOK: SCORITO-TIPS DEEL 3 – OP ZOEK NAAR QUOTES
LEES OOK: SORITO-TIPS DEEL 4 – OP ZOEK NAAR PARELS
LEES OOK: SCORITO-TIPS DEEL 5 – ORGANISATIE EIGEN SUBLEAGUE
LEES OOK: GIRO D’ITALIA 2022 – PARCOURS
LUISTER ONZE GIRO-SPECIAL MET SCORITO-CEO MARTIJN VAN DIJK!
LUISTER ONZE PODCAST SCORITO-TIPS GIRO D’ITALIA 2022
LEES OOK: GIRO D’ITALIA 2022 – SCORITO-TIPS GIRO
NEEM HET OP TEGEN DE COMPUTER EN SPEEL MEE MET ONZE SCORITO-SUBLEAGUE IN HET GIRO WIELERSPEL!

Scorito-tips deel 2: ‘Scorebordjournalistiek’, de zin en onzin van cijfers en statistieken

In 2003 introduceerde voetbaltrainer Co Adriaanse de term ‘scorebordjournalistiek’. Na een geflatteerde 5-1 nederlaag van zijn ploeg AZ tegen Roda JC vond hij dat de aanwezige media te veel nadruk legden op de uitslag in plaats van op de krachtsverhoudingen op het veld. De uitdrukking van Adriaanse ontwikkelde zich daarna razendsnel tot een (negatief) begrip binnen de sportjournalistiek.

Wij als koersvoorspellers ontkomen er haast niet aan om aan scorebordjournalistiek te doen. Het doorspitten van de uitslagen is vaak de belangrijkste (rationele) basis voor het inschatten van de potentie van een renner. Daar zitten allerlei haken en ogen aan – dat zal verderop in deze blog wel blijken – maar niets is zo geruststellend als een reeks van ‘1-tjes’ op ProCyclingStats of een plekje in de top van het Scoritopuntenklassement van vorig jaar.

Gelukkig heeft Scorito er een stokje voor gestoken dat we simpelweg alle toprenners in onze selectie kunnen opnemen. Sommige van mij subleaguevrienden stellen voorafgaand altijd dik tevreden vast dat het budget wel heel ruim is en dat ze ‘bijna alle toppers mee kunnen nemen’. Vaak krijg je een lamme arm van het scrollen als je deze deelnemers na drie weken probeert terug te vinden in de einduitslag. Een goed Scorito-team bestaat zelden uit ‘alle toppers’ en een reeks 500.000-knechten. De kunst is vaak om uit alle prijssegmenten de renners te pikken die ‘waar voor je geld’ opleveren.

Door het beperkte budget wordt je vanzelf gedwongen om ‘koopjes’ te zoeken (luister hier WielerOrakel Podcast #10 met de CEO van Scorito om erachter te komen hoe het totaalbedrag wordt bepaald). Zo kom je tijdens je zoektocht al snel steeds lager in de uitslagenlijsten of bij steeds kleinere wedstrijden uit. Maar hoe vergelijk je een 13e plek in de Tirreno-Adriatico (Pozzovivo, 1 miljoen) met een 10e plaats in de Ronde van Sicilië (Nibali, 1,5 miljoen) of een vroege overwinning in de Ruta del Sol (Poels, 1 miljoen)?

Hoe zorg je ervoor dat je de cijfers en statistieken op de juiste manier interpreteert? In deze blog geef ik een aantal tips om je omgang met uitslagenlijsten wat te verfijnen.

De zes best scorende renners van 2021 doen dit jaar overigens niet mee.

Tip 1: bronnen voor uitslagen en ‘relatieve’ resultaten

Als je overweegt om een renner in je team te klikken, dan bekijk je natuurlijk altijd minstens even zijn uitslagen van dit seizoen en eventueel van eerdere deelnames aan grote rondes. Vroeger deed ik dat altijd via www.sportuitslagen.org. Later ben ik overgestapt op www.procyclingstats.com, omdat zij een gedetailleerder profiel van etappes aanbieden. Andere deelnemers uit mijn subleague zweren bij www.firstcycling.com. Het is natuurlijk maar net wat je zelf handig vindt, heel veel fout kun je hier niet doen.

Voor de meeste deelnemers aan Scorito zal dit gesneden koek zijn. Waar je wellicht wel verschil kunt maken, is door één of twee muisklikjes verder te gaan. Kijk niet slechts naar de ‘absolute’ cijfertjes, maar ook naar het hoogteprofiel, de tijdsverschillen, de weersomstandigheden en wie de tegenstanders waren op een bepaalde dag. Dat zegt alvast iets meer over de krachtsverhoudingen en het niveau van prestatie. Je zou dit ‘relatieve resultaten’ kunnen noemen. Scorebordjournalistiek voor gevorderden dus. Co Adriaanse kan trots op je zijn!

ProCyclingStats biedt in één oogopslag al behoorlijk wat informatie over de totstandkoming van een uitslag (voorbeeld etappe 19 van vorig jaar).

Tip 2: maak een kleurenschema

Vaak hebben deelnemers moeite om de knoop door te hakken bij een keuze tussen twee renners van dezelfde prijsklasse en hetzelfde profiel. Vlak voor grote rondes wordt het WielerOrakel overspoeld met keuzevragen in de vorm ‘Renner A of Renner B?’  (bijboorbeeld: Aberasturi of Fiorelli?). Zoals we zagen is het soms best lastig om een keuze te maken op basis van resultaten, zeker als de coureurs al langere tijd niet tegen elkaar hebben gekoerst en de uitslagen steeds zo tussen plek 5 en 15 zijn.

Sinds de Ronde van Frankrijk in Corona-jaar 2020 maak ik voor een vorminschatting soms een simpel kleurenschema. Er waren toen voorafgaand aan de Tour maar weinig koersen om mijn Scoritokeuzes mee te onderbouwen en ik had te weinig tijd om er dieper in te duiken. Daarom wilde ik graag een overzichtje hebben waarin ik in één oogopslag kon zien wie er goed hadden gereden.  

Dit werkt als volgt: je geeft aan de presentatie van een renner in een bepaalde wedstrijd een kleurwaarde, bijvoorbeeld groen als het een goede uitslag was, geel als het ‘oké’ ging, oranje als de prestatie tegenviel en rood als het ronduit slecht was. Let wel op, het gaat dus om de relatieve resultaten. Voor een sprinter van 1 miljoen (Aberasturi of Fiorelli) is een reeks 6e plaatsen in een sterk sprintersveld een goede prestatie, terwijl dit voor Ewan of Merlier behoorlijk tegenvalt.

Je kunt de relatieve uitslagen natuurlijk ook op een andere manier overzichtelijk maken, bijvoorbeeld met cijfers. Dan krijg je een soort ‘seizoensrapport’, waarbij je ook gemiddelden kunt uitrekenen. Zelf vind ik de kleuren handig, omdat het snel, makkelijk en overzichtelijk is. Je ziet tevens direct of een renner in groeiende vorm is, wisselvallig presteert of dat zijn conditie een dalende trend toont.

Mijn supersimpele kleurenschema voor de Tour van 2020.

Tip 3: raadpleeg de computer van ZoerCyclingStats (shortcut)

Voor de casual Scoritospeler – voor wie het oneindig doorspitten van uitslagen, het schilderen van kleurenschema’s en het opstellen van jaarrapporten wat te ver gaat – is er gelukkig een shortcut.

Zoals de vaste volgers van WielerOrakel weten, heeft @ZoerCyclingStats een zelflerend algoritme ontwikkeld om wielerkoersen te voorspellen op basis van resultaten van de afgelopen drie jaar, waarbij recente uitslagen zwaarder wegen. De computer kent op basis van de behaalde prestaties een score toe aan bepaalde kwaliteiten van een renner. Dit zijn skills (zoals in Pro Cycling Manager, FIFA en andere sportgames) die nodig zijn om een wedstrijd te winnen (bijvoorbeeld punchen, kasseirijden, tijdrijden en sprinten in de Ronde van Vlaanderen). Ook wordt er rekening gehouden met de recente vorm en de sterkte van de ploeg. Zo rolt er vaak een heel aardige voorspelling uit, zowel voor klassementen als voor losse etappes. Dit kan een mooie basis vormen voor je Scorito-team!

De berekeningen van de computer kan je natuurlijk terugvinden op deze website. Wil je meer weten over het algoritme, neem dan een kijkje op www.zoercyclingstats.weebly.com. @ZoerCyclingStats zal voor de Giro ook een Scorito-team samenstellen op basis van zijn algoritme. In de subleague van WielerOrakel kan je het dus tegen de computer opnemen. Meld je hier alvast aan!

Een voorbeeld van de rekenkracht van de computer van ZoerCyclingStats.

Tip 4: odds van goksites (shortcut), of nog een stapje verder?

Veel wielerliefhebber willen weleens een gokje wagen op een wielerkoers. Een aantal van de bookmakers die sinds 1 oktober 2021 legaal op de Nederlandse markt opereren, bieden odds (letterlijk: kansen) aan voor het wielrennen, zeker tijdens grote rondes. Hoe hoger deze odds, hoe vaker je de inzet terugkrijgt als een bepaalde renner wint.

Voor ons als Scorito-spelers geven de odds een indicatie hoe groot de kans is op een bepaalde uitkomst van de wedstrijd – althans volgens de aanbieder van koersweddenschappen. De bookmakers maken voor hun kansberekening gebruik van algoritmes en volgen ontwikkelingen rond de koers nauwgezet. In zekere zin doen ze dus voor een groot deel van hetzelfde ‘werk’ als fanatieke Scorito-spelers en de uitkomsten van hun analyses staan overzichtelijk in één cijfer weergegeven op de gokwebsites.

Een aantal van mijn subleaguevrienden maakt graag gebruik van deze graadmeter. Zelf heb ik zo mijn twijfels over het nut van de odds, aangezien je zou kunnen zeggen dat de prijs van een renner in Scorito zelf al een vergelijkbare indicatie geeft. Bovendien zijn goksites er bij uitstek op gericht om geld te verdienen en dus om de gokker te misleiden. Dit betekent bijvoorbeeld dat ze inspelen op ‘hypes’ en verwachtingspatronen van fans. Niet zelden zie ik bijvoorbeeld de odds voor Van Aert en Evenepoel bij Belgische aanbieders een stuk lager zijn dan op Britse platforms.

Waar ik wel graag naar kijk zijn de tips van punters (mensen die regelmatig inzetten op sportwedstrijden) op Twitter. Zij geven aan voor welke renners relatief waardevolle odds te vinden zijn. Eigenlijk wijzen ze dus op mogelijke ‘foutjes’ in de lijsten van de wedkantoren. De Deense Twitteraar @Velocipeden beliep dit voorjaar al het juiste pad met Mohoric in Milaan-San Remo tegen 51 keer de inzet, Kwiatkowski in de Amstel Gold Race x81, Teuns in de Waalse Pijl x67 en Evenepoel in Luik-Bastenaken-Luik x15. Zelf zag ik de kans een gokje te wagen op Dylan van Baarle voor Parijs-Roubaix, waarbij ik 41 keer mijn inzet terugkreeg.

Beating the odds!

Sommige succesvolle tipgevers (zoals David Hunter van @cyclingmole) hebben hun adviezen inmiddels achter een betaalmuur geplaatst. Op www.cyclingmole.com biedt Hunter wel goede voorbeschouwingen aan, waarin hij niet zelden de juiste winnaar voorspelt. Voor de komende Giro komt WEDÛ – het podcastplatform van Lance Armstrong – met de nieuwe podcast Outcomes, waarin (o.a.) Johan Bruyneel tips zal geven voor weddenschappen op wielrennen. Wellicht kan dit ook wat inzichten opleveren voor je Scorito-pooltje!

De bookmakers houden de tipgevers overigens in de gaten en passen daar hun aanbod weer op aan. Bovendien dalen de odds vanzelf als er veel op een renner gewed wordt. Wil je de goksites gebruiken voor je Scorito-voorspellingen, dan kun je het beste even wachten tot de markt zich heeft ‘gevormd’ (voor weddenschappen kan je er juist beter snel bij zijn). Mijn ervaring is dat bookies en tipgevers vooral nuttig kunnen zijn bij het opstellen voor losse etappes. Voor de eindklassementen leveren ze minder vaak verrassende inzichten op.

Tip 5: toets aan klassieke wielerwetten

Fanatieke deelnemers aan wielerpooltjes weten natuurlijk dat er grenzen zitten aan de voorspellende waarde van koersuitslagen. Een bijzondere positie is weggelegd voor de voorbereidingskoersen voorafgaand aan een grote ronde. Beginnende spelers staren zich hier nog wel eens blind op.

Voor een klassiek voorbeeld kom je als snel uit bij het Critérium du Dauphiné en de Ronde van Zwitserland, die vaak worden gebruikt als voorbereidingskoersen op de Ronde van Frankrijk. Renners die daar op de toppen van hun kunnen presteren, vallen in de regel vaak tegen in de Tour. Recente voorbeelden van deze ‘wielerwet’ zijn Fuglsang (won de Dauphiné in 2019), Martinez (winnaar in 2020) en Porte (2021).

Als voorbereiding op de Giro rijden coureurs vaak de Tour of the Alps of de Ronde van Romandië. Hier tekent zich regelmatig hetzelfde patroon af. In 2019 domineerde Roglic in Romandië, maar bleek hij in de Ronde van Italië niet scherp genoeg om Carapaz van de winst te houden. Vorig jaar werd Masnada 3e in de Zwitserse etappekoers, maar kon hij geen potten breken in zijn thuisronde. Caruso was met een 9e plaats in de voorbereidingswedstrijd nog niet in topvorm, maar piekte perfect tijdens de Giro (2e). Overigens zit de Ronde van Romandië zeer dicht op de Giro, waardoor steeds minder klassementsrenners de laatste jaren via Zwitserland naar Italië afreizen. Een aantal renners heeft ervoor gekozen om ter voorbereiding de Ronde van Sicilië te rijden.

Nemen we een kijkje bij de Tour of the Alps van vorig jaar, dan zien we dat de top 5 – Yates, Bilbao, Vlasov, Cepada en Carthy – respectievelijk als 3e, 13e, 4e, als puntloze uitvaller in etappe 19 en 8e eindigden. De voorspellende waarde van deze koers bleek dus ook redelijk beperkt.

Veel deelnemers dachten vorig jaar met Jefferson Cepeda een goedkoop pareltje te hebben gescout. Hij kon zijn sterke Tour of the Alps geen vervolg geven tijdens de Giro.

Dat betekent natuurlijk niet dat je Bardet (dit jaar winnaar van de Alpenkoers) al kunt afschrijven voor de Girowinst. Er is geen ondoorbreekbaar wetenschappelijk verband die deze klassieke wielerwet ondersteunt. Grote (en controversiële) ronderenners als Armstrong en Froome wonnen regelmatig de Dauphiné en gingen er daarna met Tourwinst vandoor. Pogacar domineerde vorig jaar de Ronde van Slovenië voorafgaand aan zijn 2e overwinning in La Grande Boucle.

Het verschil is vaak dat de échte toppers een voorbereidingskoers kunnen winnen zonder in piekvorm te zijn. De categorie daaronder heeft die topconditie vaak juist wél nodig om een indrukwekkende etappekoers af te leveren, of moet er echt álles uitpersen voor de zege. De kans bestaat dan dat deze coureurs uitgeblust aan de start van de grote ronde verschijnen. Overigens geldt deze analyse vooral voor klassementsrenners. Sprinters kunnen hun vorm vaak langer vasthouden.

Ook hier speelt een analyse van de uitslag een rol – de relatieve resultaten dus. De conditie van Bardet leek tijdens de Tour of the Alps te groeien, wat erop kan duiden dat hij zijn topvorm nog wel even kan doortrekken. De nummer 4, Bilbao, zakte er na een hele goede periode wat doorheen in de laatste rit. Voor hem zou hetzelfde scenario als vorig jaar wel eens kunnen opdoemen. 

Een andere klassieke discussie voor koersvoorspellers is of het rijden van twee grote rondes achter elkaar (Giro-Tour of Tour-Vuelta) de vorm tijdens die tweede koers negatief beïnvloedt. Omdat de Giro de eerste drieweekse etappekoers van het seizoen is, gaan we hier nu (nog) niet op in.

Tip 6: het 100-punten-per-miljoen-systeem

In 2019 besloot een deelnemer uit mijn subleague dat hij het zat was om steeds in de onderste regionen te eindigen (hij was een van de eerder genoemde ‘je kunt alle toppers kopen’-uitroepers). Hij ging de zaak wetenschappelijker aanpakken, door in Excel de prijs van de renners af te zetten tegen het verwachte aantal punten. Hij kwam zo tot een aantal aardige inzichten. Zo besefte hij bijvoorbeeld dat een goedkope knecht van de eindwinnaar (in dit geval Luke Rowe van INEOS) zijn bedrag vrijwel altijd waard is, ook als hij zelf nauwelijks punten haalt. Prompt won hij dat jaar de subleague.

Op het forum van WielerFlits ging al enige tijd de stelregel rond dat een renner per miljoen van de aankoopprijs ongeveer 100 punten moet halen om rendabel te zijn (exclusief de verdubbellaar van het kopmanschap). Ik vroeg me altijd af waar deze berekening vandaan kwam, tot ik er tijdens het luisteren van de WielerOrakel Podcast met de CEO van Scorito achter kwam dat de spelaanbieder deze indicator zelf gebruikt voor het bepalen van de prijs. Het kan dus de moeite waard zijn om bij twijfel zelf na te gaan of je verwacht dat een renner boven die 100 punten per miljoen uitkomt.

Volgens deze stelregel moet Simon Yates (4 miljoen) dit jaar 400 punten halen om de investering waard te zijn. Alleen in 2018 kwam hij (zeer ruim) aan dit aantal.

Tip 7: Verbind cijfers met up-to-date informatie

Deze tip vormt eigenlijk het opstapje naar de volgende blog, waarin ik adviezen geef voor het doen van ‘brononderzoek’ om bruikbare informatie over vormpeil, teamorders, ambities en blessures te achterhalen. Resultaten uit het verleden, bieden geen garanties voor de toekomst… dus ga na het doorspitten van de ‘harde’ cijfers altijd op zoek naar ‘menselijke’ informatie. In ieder geval heb je met stap 1 (de parcoursanalyse en een goede balans binnen je team) en stap 2 (de juiste omgang met cijfers en statistieken) alvast een mooi fundament gelegd voor een succesvolle Scorito-deelname!

LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING ALGEMEEN KLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING SPRINTKLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING BERGKLASSEMENT
LEES OOK: GIRO D’ITALIA 2022 – VOORSPELLING JONGERENKLASSEMENT
LEES OOK: SCORITO-TIPS DEEL 1 – PARCOURSANALYSE EN VERHOUDINGEN
LEES OOK: SCORITO-TIPS DEEL 3 – OP ZOEK NAAR QUOTES
LEES OOK: SORITO-TIPS DEEL 4 – OP ZOEK NAAR PARELS
LEES OOK: SCORITO-TIPS DEEL 5 – ORGANISATIE EIGEN SUBLEAGUE
LEES OOK: GIRO D’ITALIA 2022 – PARCOURS
LUISTER ONZE GIRO-SPECIAL MET SCORITO-CEO MARTIJN VAN DIJK!
LUISTER ONZE PODCAST SCORITO-TIPS GIRO D’ITALIA 2022
LEES OOK: GIRO D’ITALIA 2022 – SCORITO-TIPS GIRO
NEEM HET OP TEGEN DE COMPUTER EN SPEEL MEE MET ONZE SCORITO-SUBLEAGUE IN HET GIRO WIELERSPEL!