H2H-data bij tennisweddenschappen: hoe je head-to-head correct interpreteert

Redactie «Gokken op us Open» juni 20, 2026 Leestijd: 11 min

H2H head-to-head data tennis weddenschappen sample size oppervlakte interpretatie

Inhoudsopgave

De statistiek die de meeste wedders verkeerd inzetten
Wat H2H is en wat het in essentie meet
Het sample-size-probleem dat alles ondergraaft
Ondergrond-subset: waarom alleen relevante matches tellen
Recency weighting: hoe lang geleden iets nog telt
De psychologische factor: realiteit, mythe en wat data laat zien

De statistiek die de meeste wedders verkeerd inzetten

Een paar zomers terug speelde een match op US Open tussen twee spelers die in hun loopbaan vier keer eerder tegen elkaar hadden gestaan. De underdog won alle vier de eerdere ontmoetingen — drie op gravel, eentje op een indoor hardcourt. De markten reflecteerden dat onhandig: de underdog kreeg lagere odds dan zijn ranking, vorm en hardcourt-prestaties zouden suggereren. Veel wedders volgden de markt, plaatsten geld op de underdog, en zagen de favoriet vervolgens in vier sets winnen. De head-to-head was misleidend. De data was te dun om iets te voorspellen, en de eerdere ontmoetingen waren in een verkeerde context.

Head-to-head — H2H — is de meest onderschatte en tegelijk meest verkeerd ingezette statistiek in tennis-wedanalyse. Onderschat omdat hij in specifieke gevallen werkelijk voorspellingskracht heeft. Verkeerd ingezet omdat de gemiddelde wedder de regels rond steekproef-grootte, ondergrond-relevantie en recency-weging niet toepast. Het resultaat: H2H wordt te vaak vertrouwd waar het niet zou moeten, en te vaak genegeerd waar het wel relevant is.

In dit artikel maak ik die regels expliciet. Wat is H2H? Wanneer zegt het iets? Wanneer is het ruis? En hoe pas je dat toe op match-keuzes voor US Open? Geen mystiek. Geen dieper verhaal over ‘mentale matchups’. Gewoon de discipline om data correct te lezen.

Wat H2H is en wat het in essentie meet

H2H is letterlijk het overzicht van eerdere onderlinge ontmoetingen tussen twee spelers — wie won, wanneer, op welke ondergrond, in welke ronde van welk toernooi, en met welke score. Op de ATP- en WTA-website is dit publiek beschikbaar voor alle spelers, en de meeste sportstatistiek-aanbieders presenteren het in een handzame tabel.

Wat de meting probeert te vatten is een veronderstelling die intuïtief klopt: dat sommige spelers een ‘mentale of stilistische voorsprong’ hebben tegen specifieke tegenstanders. Speler A’s diepe topspin tegen speler B’s vlakke counter — als de stijlen op een specifieke manier botsen waardoor speler A altijd de overhand heeft, dan zou je dat moeten zien in een herhaalde uitkomst over meerdere matches. Dat is de werkhypothese.

De wetenschappelijke vraag is of deze hypothese statistisch standhoudt. Onderzoek door tennis-analytici en data scientists heeft hier wisselende uitkomsten geleverd. Sommige studies vinden zwak bewijs voor ‘matchup-effecten’ boven wat ranking en vorm voorspellen. Anderen vinden geen significant effect — de uitkomsten van H2H volgen de algemene rangorde-spreiding van de twee spelers en hun vorm, niet een specifiek persoonlijk patroon.

Het pragmatische antwoord voor wedders: H2H is soms relevant, maar zelden zo relevant als wedders denken. Het is een additionele variabele in een breder model, niet een dominante voorspeller. En de relevantie hangt sterk af van drie factoren: hoeveel matches er zijn, op welke ondergronden, en hoe recent.

Het sample-size-probleem dat alles ondergraaft

Het grootste probleem met H2H is statistisch elementair: de meeste paren spelers hebben elkaar onvoldoende ontmoet om een betekenisvol patroon vast te stellen. Twee spelers die elkaar drie keer hebben getroffen, hebben een H2H-record dat per definitie 0-3, 1-2, 2-1 of 3-0 is. In geen van die gevallen is dat statistisch onderscheidend van willekeurig — drie matches is veel te weinig om een echt onderliggend patroon van een toevallige uitkomst te scheiden.

Hoe veel matches heb je nodig? De statistische vuistregel die ik gebruik: minimaal vijf matches voor enige indicatie, minimaal acht voor een betekenisvol patroon. Met acht of meer onderlinge matches kun je beginnen te onderscheiden of een 6-2 of 7-1 verdeling werkelijk een spel-stilistisch patroon weerspiegelt of een statistische uitschieter is. Onder vijf matches is H2H feitelijk anekdote — interessant om te lezen, niet bruikbaar om op te wedden.

De praktijk is dat de overgrote meerderheid van match-pairings op US Open onder die drempel zit. Twee spelers die elkaar voor het eerst treffen — ongeveer 60 tot 70 procent van eerste-ronde-matches op een Grand Slam — hebben geen H2H-data. Twee spelers die elkaar twee tot vier keer hebben getroffen — nog eens 20 tot 25 procent van de matches — hebben H2H die te dun is om te vertrouwen. Slechts ongeveer 10 procent van de matches op een Grand Slam-niveau heeft H2H-data van substantiële omvang. En zelfs bij die 10 procent moet je nog twee andere filters toepassen.

De wedders-fout is dat ze 0-3 of 3-0 H2H-cijfers absoluut nemen omdat het een ‘lijkt zo duidelijk’ patroon is. Drie matches die op één kant uitvielen, hebben een vrij hoge kans om puur door toeval zo te lopen — als de werkelijke kansverdeling 50/50 is, valt de uitslag in 25 procent van de gevallen 3-0. Een 8-1-record is statistisch substantieel anders. Een 3-0-record bijna niet.

Ondergrond-subset: waarom alleen relevante matches tellen

Naast steekproef-grootte is ondergrond de tweede grote filter. Tennis is een ondergrond-gevoelige sport: prestaties op gravel, gras en hardcourt verschillen substantieel voor dezelfde speler. Een H2H die opgebouwd is uit drie gravel-matches en een grasmatch zegt weinig over wat in een hardcourt-confrontatie gaat gebeuren.

De praktijk: voor een US Open-match wil je het H2H-record specifiek op hardcourt zien. DecoTurf medium-snel hardcourt — de US Open-ondergrond — speelt anders dan Plexicushion of GreenSet (Australian Open) of indoor hardcourt. Voor de fijnste analyse zou je zelfs binnen hardcourt onderscheid willen maken tussen US Open-edities en andere DecoTurf-toernooien (de Cincinnati hardcourt is bijvoorbeeld DecoTurf, dus relevant).

Dat verfijnde uitsplitsen levert vrijwel altijd nóg dunnere data op. Twee spelers met een totaal H2H van 6-2 hebben misschien een hardcourt H2H van 3-1, en een DecoTurf-specifiek H2H van 1-0. Op dat niveau is statistisch praten zinloos. Een vuistregel die ik volg: als de hardcourt-subset minder dan 4 matches is, gebruik ik H2H niet meer als variabele in mijn model. Dan vertrouw ik op surface-specifieke vorm en algemene ranking.

De omgekeerde situatie is ook leerzaam. Twee spelers met een H2H van 8-2, waarvan 6-2 op hardcourt — dát is data die wel iets zegt. Niet conclusief. Niet voorspellend op een individuele match. Maar wel een indicatie dat de winnende speler op deze ondergrond een echte stijlmatige edge heeft. Voor de wedder is dat reden om in zijn model een extra weging toe te kennen — niet om de markt-odds compleet te negeren, maar om bij twijfelgevallen de richting van het H2H-patroon te volgen.

Recency weighting: hoe lang geleden iets nog telt

Een H2H van 8-2 over de carrière van twee spelers kan tien jaar oud zijn. Als die acht overwinningen geconcentreerd waren in 2014-2018, en de twee daaropvolgende ontmoetingen in 2023 en 2024 voor de andere speler waren, vertelt een eenvoudige optelling het verkeerde verhaal. Spelers veranderen — hun spel evolueert, hun fysieke conditie verandert, hun mentale aanpak past zich aan. Een H2H-record uit 2014 zegt weinig over een match in 2026.

De praktische regel: weeg recente ontmoetingen aanzienlijk zwaarder dan oudere. Mijn werkbenadering: matches binnen de laatste 24 maanden krijgen volle weging, matches tussen 2 en 4 jaar krijgen halve weging, matches ouder dan 4 jaar krijgen kwart-weging. Wie strikt wil zijn: gebruik alleen matches uit de laatste 24 maanden, en als die set te klein is, gebruik H2H helemaal niet als variabele.

Een nuance: ingrijpende veranderingen versnellen de afschrijving. Wanneer een speler een grote blessure doormaakt — een lange knieoperatie, een serieuze rugblessure — moeten H2H-matches van vóór die blessure substantieel zwaarder afgewaardeerd worden. De speler vóór en na de blessure is functioneel niet dezelfde speler. Hetzelfde geldt voor coachwisseling — sommige spelers veranderen hun spel-aanpak fundamenteel onder een nieuwe coach.

Recency-weging is statistische voorzichtigheid, niet ouderdomsdiscriminatie. De vraag die je je voor elk record stelt: wat zegt deze data over de match die ik morgen ga zien? Een match uit 2018 tussen spelers die sindsdien beide zijn doorgegroeid en in de tussentijd op verschillende manieren hebben gespeeld, zegt vrijwel niets. Een match van zes weken geleden tussen dezelfde spelers, in vergelijkbare condities, zegt veel meer.

De psychologische factor: realiteit, mythe en wat data laat zien

Het tennis-vocabulaire zit vol begrippen rond psychologische matchups: ‘speler A heeft de mind’ op speler B, ‘er zit iets in zijn hoofd’, ‘hij weet hoe hij hem moet kraken’. Veel commentatoren halen deze duiding aan om H2H-resultaten te verklaren. De vraag is of dit fenomeen werkelijk bestaat boven wat ranking en stijl voorspellen.

De data is hier ambigu. Sommige onderzoekers vinden bewijs voor een psychologische component — een speler die zijn eerste ontmoeting met een specifieke tegenstander wint, lijkt iets vaker dan toeval ook de tweede te winnen, zelfs gecorrigeerd voor ranking-verschil. Maar de effectgrootte is klein, en de meeste recente analyses suggereren dat dit psychologische effect verdunt naarmate spelers ervaren raken — top-100 spelers laten zich minder door eerdere uitkomsten beïnvloeden dan ranglijsten suggereren.

Mijn pragmatische standpunt: matchup-psychologie bestaat waarschijnlijk in zeer beperkte mate, maar wedders overschatten het systematisch. Wanneer een speler 5-0 leidt in H2H, neemt de markt vaak een psychologisch effect op in de odds — en dat creëert juist value voor wie tegen die markt-bias durft te handelen. Niet altijd, niet automatisch, maar als de stilistische en surface-data niet ondersteunen wat de H2H suggereert, is er ruimte om scherp tegen de stroom te wedden.

De andere kant: een speler die op zijn rugzak een trauma met een specifieke tegenstander draagt — een belangrijke nederlaag in een eerder Grand Slam, een mentaal moeilijke match — kan in een nieuwe ontmoeting voor herhaalde scenario’s gevoelig zijn. Maar dat is anekdotische waarneming op individuele basis, niet statistisch gegeneraliseerde wijsheid. Voor wedders praktisch: psychologische component bestaat misschien, maar de markt prijst het al in. Tegen de markt op psychologische gronden alleen wedden, is meestal een verliesgame.

Wie H2H in zijn modellen wil meenemen, doet het zo: alleen bij voldoende sample-size (minimaal 5, liefst 8 matches), op de juiste ondergrond (alleen hardcourt-matches voor US Open-analyse), met recency-weging (matches uit de laatste 24 maanden zwaarst), en met bescheiden gewicht ten opzichte van surface-specifieke vorm en ranking. Wie systematischer wil werken aan de andere kant van het patroon — de actuele vorm waarmee spelers naar het toernooi komen — vindt in vorm en momentum analyseren bij tennisweddenschappen aanvullende handvatten.

Hoeveel onderlinge wedstrijden zijn nodig voordat h2h significant is?

Voor enige indicatie zijn minimaal 5 onderlinge matches nodig, en voor een betekenisvol patroon liefst 8 of meer. Onder die drempels is een schijnbaar duidelijke verdeling — bijvoorbeeld 3-0 of 4-1 — statistisch nauwelijks te onderscheiden van een toevallige uitkomst. Een 3-0-record kan in 25 procent van de gevallen ontstaan bij een werkelijke 50/50-kansverdeling. Met 8 matches en een 6-2-record begint het wel statistisch significant te worden, mits ook gecorrigeerd voor ondergrond en recency.

Telt h2h op andere oppervlakken mee voor US Open analyse?

In zeer beperkte mate. Tennis is sterk ondergrond-gevoelig, en prestaties op gravel of gras vertalen niet één-op-één naar hardcourt. Voor een US Open-match wil je het H2H-record specifiek op hardcourt zien. Als de hardcourt-subset minder dan 4 matches is, gebruik H2H beter niet als variabele en vertrouw je op surface-specifieke vorm en ranking. Matches op andere ondergronden geven zwakke achtergrond-context maar geen voorspellende waarde voor een DecoTurf-confrontatie.

Geschreven door het team van 'Gokken op us Open'.