Rating, een objectieve speelsterkteaanduiding

Rating, een objectieve speelsterkteaanduiding

18 berichten / 0 nieuw
Laatste bericht
Bassie
Rating, een objectieve speelsterkteaanduiding

Een kleine twintig jaar terug ben ik gestart met bridgen. Daarvoor heb ik veel geschaakt en waarschijnlijk daardoor een enorme afkeer ontwikkeld tegen de speelsterkteaanduiding die er in de bridgewereld wordt gehanteerd. Het systeem van meesterpunten is een kwantitatieve gebeurtenis en de huidige bridgerating is daar een afgeleide van. Veel spelen, eerder dan goed spelen, zorgt voor veel punten en dus kost slecht spelen niets. Er staan mensen in de subtop van Nederland die geen divisie spelen, die moeite hebben met de Staymanconventie, maar die wel vijfmaal in de week spelen en daarnaast wekelijks een kroegendrive meepakken. Er staan ook mensen buiten de top 100 die jaarlijks zich handhaven in de Meesterklasse, maar daarnaast geen clubavonden bezoeken. Dit is uiteraard onwenselijk. In elke zichzelf respecterende sport is er een objectieve speelsterkteaanduiding. Bij golf is dat een handicapsysteem en bij schaken een rating.

Uiteraard is zoiets opstarten een lastig iets, maar uitgaande van de kennis binnen de schaak‑ en damwereld makkelijk realiseerbaar. In eerste instantie krijg je namelijk inschattingen. De makkelijkste methode daarvoor is bijvoorbeeld alle Meesterklassers 2.600 geven, alle Eerste Divisiespelers 2.400, alle Tweede Divisiespelers 2.200, alle Hoofdklassespelers 2.000, alle Eerste Klassespelers en alle A-spelers bij redelijke clubs 1.800 en zo verder aflopend. Hiermee geef je een wereldkampioen 2.600 en ook iemand die per ongeluk juist een keer naar de Meesterklasse is gepromoveerd 2.600. Echter, deze wereldkampioen is sterker dan deze per ongeluk promovendus en gaat door de prestaties vanzelf stijgen en deze promovendus wel wat dalen. Na een jaar of twee komen alle spelers wel te staan waar ze moeten staan.

De basis van een ratingsysteem is erg eenvoudig, zeker met de huidige rekenprogrammatuur. Stel een speler met 2.000 en een speler van 1.900 spelen een toernooi met een gemiddelde sterkte van 1.900. Hun gemiddelde rating is 1.950 en hun verwachte score is dus meer dan 50%, zeg 53%. Halen zij een score hierboven, dan winnen zij punten en daaronder verliezen zij punten.

Met een eerlijke  en objectieve rating heb je enorm veel voordelen:

  • Bij vaststellen wie in welke lijn moet spelen zou het prettig zijn om een objectieve speelsterkteaanduiding te hebben en niet een kwantitatieve. Bij toernooien ken je vaak de spelers van buiten niet. Daarnaast is het indelen veel makkelijker en zonder discussie. De bovenste helft speelt in de A-lijn en de onderste in de B-lijn.
  • Veel spelers vinden het niet leuk om in een A-lijn te moeten spelen. Zelfs al halen zij een keer 50%, dan wordt dat niet gezien als een prestatie. Indien spelers echt boven hun verwachte score presteren, is het opeens wel leuk. Kijk naar de stablefordcompetities op golfbanen. Je kunt dus naast de winnaar met de hoogste score ook een winnaar uitroepen op basis van toernooiprestatierating. Een paar zou bijvoorbeeld 45% ‘behoren’ te halen en haalt 52%; dat is een relatief betere prestatie dan de clubkampioen die 58% behoort te halen en die 57% haalt en daarmee eerste was deze avond.
  • Bij invallers is er ook een objectieve vaststelling mogelijk. In de schaakwereld zijn er tabellen waarin staat dat je in een promotieklasse maar mag invallen met maximaal een bepaalde rating. Hiermee voorkom je competitievervalsing
  • Stel er valt een plaats vrij in een competitie, dan kun je deze opvullen met het team of paar met de hoogste rating (objectief).
  • Voor spelers met ambitie is dit ook leuk. Je ziet de stijging van je rating, je ziet je progressie. Je kunt werken met doelstellingen.
  • De elk kwartaal uitkomende ratinglijst binnen de schaakwereld zorgt altijd voor veel aandacht. Wie zijn de beste spelers, wie is de grootste stijger, hoe sta ik zelf ervoor, hoe doen de anderen binnen de club het?
  • Je kunt ook toernooien houden met maximale en minimale ratingeisen om meer een homogeen veld te krijgen. Sport is over het algemeen alleen maar leuk tegen ongeveer gelijke tegenstand. Dan moet je wel kunnen vaststellen hoe sterk iemand is.
  • Indien er zoals afgelopen jaar vanuit de Tweede Divisie extra promotieplaatsen nodig zijn, werd er nu gekeken naar de totaalscore. Beter is natuurlijk de plaatsen toe te kennen aan de sterkste Tweede Divisies.

Er zijn nog veel voordelen te benoemen en eigenlijk amper nadelen. Na het bouwen van een systeem dat dit automatisch berekent, ben je klaar. Uiteraard gaat zo'n systeem kinderziekten met zich meebrengen. Stel je haalt +30 in de butler en je verwachte score is +15, hoeveel punten moet je dan erbij krijgen? Stel er komt een speler op de club en die heeft twintig jaar niet gespeeld en wint achter elkaar de D, C, B en A-lijn, wat doe je met zijn of haar rating?

Ik heb dit systeem een aantal jaren geleden reeds voorgelegd aan de NBB en geen duidelijk antwoord gekregen waarom er niet gekozen wordt voor een objectieve speelsterkteaanduiding. Ook dit jaar heb ik weer geprobeerd deze discussie aan te zwengelen. De NBB is niet erg genegen te veranderen.

helenuh

Hier in England hebben we zins enkele jaren zo een objective rating. De rating is een getal tussen 0 en 100 en is een schatting van de percentage matchpoints die je zou winnen als je met een dorsnee Engelse partner in een gigantisch parentoernooi zou spelen waar alle Engelse bridgers zouden meedoen - de gemiddelde rating is dus 50. Het is een bayesiaans model, dwz je gaat a priori ervan uit dat de rating een bepaald kansverdeling heeft, en dan wordt deze kansverdeling geupdated aan de hand van je resultaten. De prior heeft een gemideelde onder de 50 omdat spelers met heel weinig data gemiddeld wat zwakker zijn dan spelers met veel data. Er wordt uiteraad rekening gehouden met de kracht van partner en van de tegenstanders, maar ik denk niet dat je compensatie krijgt voor het spelen met gelegenheidspartners. Hoewel de ratingschaal in matchpoints is worden IMP-resultaten ook gebruikt door een kwantiel-gebaseerd vertaling van IMP naar MP.

Veel slimme wiskundige en informatici hebben het nodige werk verricht bij het ontwikkellen van een wetenschappelijk verantwoorde ratingsysteem. Perfect wordt het echter nooit. Ik ben zelf maar een gemiddelde clubbridger maar heb toch een verrassend hoge rating. Ik zie daar twee redenen voor. Ten eerste heb ik soms met buitenlandse experts in Engeland gespeeld. Omdat mijn partner geen EBU rating had, worden onze resultaten voor een te groot deel aan mij toegerekend. Ten tweede heb ik vaak met erg zwakke spelers op de club-avond gespeeld. Als je partner een rating van 35 heeft en je toch 50 scoort door veel contracten naar je toe te trekken dan telt het aardig.

 

djeep

Ik heb aan de basis gestaan van de rating zoals die er nu is. Ik was toen lid van de spelersraad. Dat is zo rond 2000 geweest.

Onze overwegingen toen waren:

1) Veel spelen moet niet (al te veel) beloond worden. Topresultaten wel. Vandaar dat alleen de beste 10 resultaten in een seizoen tellen, met de eerste 5 dubbel. Dit is de Transfer Rating (lopende seizoen).

2) Resultaten uit het verleden moeten niet blijven voortduren. Jonge talentvolle spelers moeten binnen enkele jaren bovenaan de rating kunnen komen. Vandaar dat de afgelopen 4 seizoenen tellen voor de NBB rating. Het voorlaatste seizoen telt voor 100%, die ervoor voor 75%, enzovoorts.

3) Vergeet niet dat er minder schaakwedstrijden zijn, dus minder administratie. Ik zie vooral praktische bezwaren bij de administratie van een andere bridgerating. Toen was dat zeker het geval, nu nog steeds lijkt mij.

4) Niet onbelangrijk: door de rating te baseren op meesterpunten, was de NBB relatief eenvoudig mee te krijgen. In de jaren voor 2000 waren er al meer pogingen ondernomen om een rating op te stellen maar nooit gelukt onder andere doordat het te ingewikkeld was of niet interessant genoeg voor de NBB.

 

Gert-Jan Paulissen

Bassie

Gert Jan,

Heldere toelichting, dank. Maakt de discussie meteen overzichtelijk.

Mijn reactie op je punten:

1. De beste 10 resultaten tellen weliswaar, maar tegenwoordig is een resultaat weer opgebouwd uit x aantal resultaten. Veel spelers komen niet aan het aantal resultaten en verliezen daarom.nog steeds tegen de "veelspelers".

2. Nadeel hiervan is wel dat als iemand nu 1 jaar niey of weinig speelt dat 4 jaar meetelt. Bij een schaakrating stijg je niet en daal je niet. Bij een erg lange afwezigheid wordt je rating wel onbetrouwbaar en bij terugkeer in de actieve sport ga je sneller stijgen en dalen.

Ik denk dat een clubschaker en een clubbridger even veel wedstrijden spelen. Bij schaken heb je weekendtoernooien met 6 wedstrijden en zomertoernooien met 9 wedstrijden in 10 dagen. Dat mag m.i. geen bezwaar zijn. Met de huidige automatisering worden de meesterpunten automatisch toegekend. Ratingwinst/verlies gaat dus ook zonder dat er een mensenhand aan te pas komt. Alleen de startpositie bepalen kan veel werk zijn. Maar dat gaat ook weer uitmiddelen.

Punt 4 is erg interessant. M.i. wil bijna elke speler die bridge als sport ziet weten waar hoj/zij staat. Ook veel clubspelers gaan dit leuk vinden. Elke golfer weet de eigen handicap en is daar ook mee bezig. Ik ken te weinig mensen binnen de NBB. Heb dit aangekaart en hoop op medewerking. Ik ben maar ern spelertje en hoop op steun van.mensen met invloed. Ik vind dat echt een tekortkoming van onze mooie sport.

Bas Lodder

Heel goed idee. Onder de aanname dat de NBB het initiatief dit keer ondersteunt, nog wat kleine toevoegingen:

  • Het ratingsysteem moet zo worden opgezet dat de rating van nieuwe spelers de eerste n toernooien sterk kan fluctueren opdat ze snel de "juiste" rating hebben (weet niet hoe ELO in elkaar zit, maar ik ken een vergelijkbaar ratingsysteem dat zo werkt)
  • Ratings van tegenstanders en partner zouden in de eerste n toernooien van nieuwe spelers niet teveel door hun resultaten moeten worden beïnvloed
  • Als dat zo gemodelleerd kan worden, zou een speler die lang inactief is geweest geleidelijk als "nieuw" kunnen worden aangemerkt, d.w.z. hij begint met zijn "oude" rating, die echter zodra hij weer actief wordt meer fluctueert
  • Mij bevalt een 0-100 schaal goed, met 0 als zinvol minimum en 100 als een waarde die bijna onmogelijk te halen valt, maar overschreden mag worden (misschien niet om te zetten omdat zoals al eerder gezegd het gemiddelde na verloop van tijd onder de 50 gaat zakken)
  • Bij langdurige partnerships moeten ratings naar elkaar toe kunnen groeien
  • Toernooien moeten verschillend gewogen kunnen worden
  • Dit vraagt om een internationale opzet, omdat anders bij internationale toernooien veel spelers "nieuw" zijn

Score zou dus afhankelijk moeten zijn van

  • Rating-gecorrigeerd toernooiresultaat partnership
  • Ratingverdeling binnen partnership
  • "Nieuwheid" van alle betrokken spelers
  • Weging toernooi
  • Sterkte toernooi

Mooie uitdaging!

janvancleeff

Bas Lodders opmerking over internationale opzet is in het schaken met de FIDE Elo ranglijst mooi geslaagd. Met dat als voorbeeld kijken wij van NewInBridge.com naar de mogelijkheid zoiets op te pakken voor de mondiale bridgewereld. Zoiets zou natuurlijk in eerste instantie gedragen moeten worden door de Wereld Bridge Federatie. Ik ben echter bang dat dat een te stroperig proces zal gaan worden. Daarom kijkenm we nu naar een alternatief, namelijk het behalen van punten op de Grand Tour van NewInBridge (100+ aangesloten toernooien). Voorbeeld is het succesvolle Nationaal Toernooi Circuit IMP uit de jaren negentig.

mazzeltov

Volgens mij wordt een soortgelijk systeem al jaren op  bridgeclub Ruit te Amsterdam

gespeeld!  Bekijk het  maar  eens

 

groeten

 

hilbrand uiterwijk

janvancleeff

Interessant. Heb je een link Hilbrand?

mazzeltov
janvancleeff

Ziet er gelikt uit Hilbrand, alle complimenten. Alleen, de doelstelling van de Ruit Rating is begrijpelijkerwijs een radicaal andere dan de doelstelling van de ranking in deze discussie; namelijk het actueel bijhouden van juist wel de sterkste spelers. Maar nogmaals, ik vind dat jullie het mooi voor elkaar hebben,

ErikSl

Wij hebben geregeld botsingen met de NBB over de meesterpunten. Deelname aan dit , zoals al door Bassie is betoogd, oneerlijke systeem is namelijk vrijwillig en kost je geld. Aangezien bij ons niemand maalt om meesterpunten, doet onze club er niet aan mee en daar worden we, op zijn zachtst gezegd, door de NBB kwaad op aangekeken.

Het al eerder aangehaalde elo-systeem van het schaken is door de makers van Jack, voor het bridge geïntroduceerd bij Berry's Internet Club (BIC). Daar werkt het feilloos. Je ranking verandert ook niet als je een tijd niet gespeeld hebt. Dat maakt ook niet uit, want als je slecht speelt raak je die rating snel genoeg weer kwijt. In het huidige automatiseringstijdperk moet zoiets simpel in het rekenprogramma te bouwen zijn en dan vervolgens kostenloos en verplicht te maken. Da eens met de mannen van BIC praten zou ik zeggen.

Dat er behoefte is aan een eerlijk systeem is wel evident, maar zolang er met iets onzinnigs als meesterpunten gewerkt wordt hoeft het voor mij niet. Zeker niet omdat het een melkkoe van de NBB geworden is. Vroeger kostte heb vast een hoop tijd en mankracht om alles nauwkeurig bij te houden, maar nu gaat het vrijwel automatisch. Elk initiatief om daar een einde aan te maken wordt door mij van harte toegejuichd.

helenuh

Ik vind het problematisch om slechte resultaten negatief te laten tellen: het stimuleerd mensen om alleen maar te spelen als ze  fit zijn, niet met gelegenheidsspelers te spelen, en niet met  nieuwe systemen en conventies te experimenteren. Kortom, her wordt beter voor je ranking niet te spelen dan te spelen in situaties waar je verwachte score onder je gemiddelde is.

De NBB-benadering, dus de ranking op je n (zeg maar tien) betste resultaten  te baseren, is minder nauwkeurig maar geeft minder ongewenste  incitamenten. 

Bassie

Een aantal reacties: Helenuh....wat je schrijft is een onderbouwing van de kwantitatieve rating die er nu is... Slechte resultaten tellen niet en vaak spelen loont. Dus na de poulewestrijden van het WK voetbal, wordt er toch maar besloten dat ook Spanje doorgaat. Laatste 3 grote toernooien gewonnen en zo'n potje tegen Nederland tellen we niet mee.

In competitie tellen alle resultaten mee. Dus ook je slechte. Ik zie graag mijn held Federer ook weer graag op de nummer 1 plaats van de wereld, maar hij verliest tegenwoordig te vaak een potje, helaas. Uiteindelijk wordt hier de soep ook niet zo heet gegeten, want het is de wet van de grote getallen. Sommige avonden kaarten we geweldig en halen we de 50% niet en andere avonden lijkt het of Kerst en Sint samenvallen. Als je aan een fatsoenljk aantal resulataten komt krijg je een eerlijk speelsterkteaanduiding (rating). 

ErikSL, heeft uiteraard 100% gelijk met BIC, werkte voor mij enorm motiverend. Zat ik gedachtenloos bij te gooien en half te slapen was ik de volgende dag weer 30 punten kwijt.. Daarna toch weer opletten. Zo hoort het in sport ook te zijn, je best doen en daarvoor beloond worden en straf bij slecht spelen.

 

Bas Lodder komt met een aantal zeer interresante punten! Mijn mening hierover:

Eigenlijk worden al deze punten in de schaakrating automatisch meegenomen. Bij bridge ga je met een nieuwe partner spelen of gooi je je systeem om, bij schaken ga je een nieuwe opening spelen en wordt je weleens verrast door je tegenstander. Ikzelf wil af en toe wel eens spelen met een niet vast partner, maar bespreek vooraf aan de bar wel het hele systeem. omdat ik bridge als sport speel en geen zin heb mijn afspeeltechniek te testen in 3-1fitjes.. Die 10 puntjes die je dan verliest is niet erg met een goed werkend ratingsysteem, want de wet van de grote getallen doet hier zijn intrede. Stel ik verlies op een avondje hierdoor een keer 10 puntjes, jammer, ik win deze weer terug, mits ik het waard ben(!), in de reguliere competitie.

Bridge is als sport echter alleen serieus te nemen indien je met een vaste maat speelt.  Met invallers spelen beinvloed gewoon je score. Ik weet niet of je daar een correctiefactor op kunt loslaten, maar waar leg je dan de grens? Maar stel je kaart 100x per jaar en 6keer met een invaller en dat kost je elke wat punten, dan is je rating misschien iets te laag, maar je praat over marginale verschillen. Ook de rest van de bridgers speelt wel eens met een invaller, toch?

Toernooien dienen juist allemaal gelijk te wegen. Een goede prestatie op zondag in Utrecht moet toch even zwaar wegen als een goede prestatie in Tilburg op maandag?

Ratings hoeven bij langdurige parterships zeker niet naar elkaar toe te groeien. Bridgers gaan zo vaak vreemd en elke keer krijg je daardoor verschuivingen. Kleintjes weliswaar. Maar als een partnership bestaat uit een goede en een slechte speler en de een heeft 2.000 en wordt elk jaar beter en de ander 1.700 en heeft moeite de 1.700 vast te houden. Waarom moeten ze dan allebei 1.850 krijgen.

Tot slot is het basisidee van de schaakrating dat iedereen uiteindelijk ongeveer staat waar die hoort te staan. Soms heb je een keer pech en ga je 1 jaar 2x door je tijd in gewonnen positie en verlies je 3 partijen door juist in de opening van je tegenstander terecht te komen. Andere jaren gebeurt dat andersom. Je ziet spelers vaak over een periode van 4 jaar een kwartaalrating hebben van 2025 2040 2016 2000 1975 2013 2028 1999 2001 2030 2041 2022 enzovoort. Dit noem ik een degelijke/stabiele 2.000 speler... Daar zitten gelukspotjes bij in en pechpotjes..  Dit is een bewezen systeem. In schaken en dammen werkt dit al wel decennia lang. Bridge is ook een denksport, sluit je gewoon aan.

 

helenuh

Bassie, de anologie met Spanje en het WK klopt natuurlijk niet. In de poulewedstrijden speelt iedereen drie wedstrijden dus of vaak spelen beloond moet worden of niet is niet aan de oorde. En wat Federer betreft, zijn ranking is analoog aan de huidige NBB rating. Slechte resultaten tellen niet negatief bij de ATB ranking.

Bassie

Helenuh, akkoord :) Met dien verstande dat met bridge je spelers in de top 500 van Nederland ziet staan die nog nooit in de divisie of zelfs hoofdklasse hebben gekaart, maar daadwerkelijk 5-6keer per week spelen en soms zelfs pendelen tussen A en B groepen. Bij tennis spelen alle topspelers de 4 grandslams en nog 10 andere grote toernooien. Als je deze 14 toernooien allemaal finaleplaatsen haalt sta je bovenaan de ranglijst. Bij de andere toernooien zijn amper punten te verdienen. 

Mijn inziens is dit de essentie: Ik heb 2.000, mijn maatje ook. We spelen in een veld met gemiddeld 2.000 tegenstand. Wij halen 55% dan stijgt mijn rating en we halen 45% dan daalt mijn. rating. Blijven we lid van deze club en winnen we heel veel dan staat onze gemiddelde rating over een jaar op 2.100. Het veld heeft nog steeds een gemiddelde van 2.000. Onze opdracht is veel moeilijk geworden, wij moeten in een zwak veld (dat is het gelet op onze rating nu) 55,21% halen. Stel we halen 54%...dan kost dit een beetje zelfs:)

 

Peter Seij

<p>Yes,</p>
<p>Interessante discussie...</p>
<p>Ik ga proberen enige opmerkingen te maken die enig hout zouden kunnen snijden. De eerste is dat om te beginnen iedereen wereldwijd een uniek lidnummer moet krijgen om een soort&nbsp;rating voor elkaar te krijgen, de tweede dat het toekennen en wijzigen van&nbsp;die rating alleen kan plaatsvinden indien van elk paar beide lidnrs in de voor de berekening in te voeren eindstand van een wedstrijd worden meegenomen.&nbsp;Zonder nummers geen scores. En, hoogstwaarschijnlijk voorlopig alleen voor Nederlandse NBBleden met een lidnummer. Uiteindelijk lijkt iets dergelijks me op den duur onontkoombaar.</p>
<p>Daarna kunnen de resultaten van alle bij de NBB aangevraagde of edoor aangewezen competities leiden tot een telkens hernieuwde rating. Moeilijk hoeft dat niet te zijn, wel bewerkelijk, zeker omdat het aantal bridgers me aanzienlijk hoger lijkt dan het aantal schakers . Zo zou bijvoorbeeld moeten worden voorkomen dat&nbsp;zich enorme fluctuaties kunnen voordoen.&nbsp;</p>
<p>Het lijkt me dat inmiddels het systeem&nbsp;van BIC (Berry) goed doordacht is en dat het voor de NBB aanbeveling verdient dit ten minste te bestuderen.&nbsp;Met dat als basis zou bijvoobeeld een tijdje een schaduwboekhouding kunnen&nbsp;worden gevoerd om.na enige tijd tot een start-rating te komen. die dan weer aan het lidnr gekoppeld zal zijn. Het lijkt me ook zaak om internationaal&nbsp;de voelhorens uit&nbsp;te steken, maar eigenlijk kan ik me niet goed voorstellen dat dat niet al gebeurt. Het hanteren van een rating&nbsp;kan in vele opzichten een leuke stimulans zijn. Meesterpunten kan men wellicht handhaven door er eretitels mee toe te kennen. Ik zeg maar iets. Of aan bepaalde privileges te koppelen. Zo krijgt men eventueel twee verschillende pluimen op dezelfde hoed.</p>
<p>Nou ja, dit uitwerken is natuurlijk het echte probleem. Succes,</p>
<p>Peter Seij</p>
<p>&nbsp;</p>

Peter Seij

Sorry, een betje een mess

schipprs

Voor rating ben je wel een foutloos rekenprogramma nodig.

2 voorbeelden:

We halen een gedeelde 1e plaats, 335 MP, over 40 spellen doch de wedstrijd wordt opgedeeld in 16 en 24 spellen.

Resultaat: Beide 59.72%. Doch het rekenprogramma dat 6 jaren lagere school niet heeft doorlopen rekent een miniem verschil uit. Ver achter de komma vlgs de geleerden van het NBB. Afrondingsfouten? Nooit van gehoord!

Zomerdrive, voor ons doen een sterk veld.  Nr 1 moet minimaal 30 MP waard zijn. Doch Nr 2 krijgt 16. Veel spelers zijn niet geregistreerd of bndsnr niet nagevraagd.

Kortom: Men moet, als gezegd in zomergasten jl, niet op een moeras (onwetendheid) bouwen.

Willem

 

Go to top