La questione del ranking ai mondiali, spiegata bene.

Sul web è pieno di articoli dove questioni spinose o complicate vengono “spiegate bene”, per cui non potevamo esimerci dal fare un titolo del genere. Anche se immaginiamo che alla fine della lettura ne saprete esattamente quanto prima e disprezzerete l’idea del ranking anche più di prima.

Il ranking è stato oggetto di una quantità di discussioni infinita, probabilmente superiori a quelle sulla nuova regola del cutting. Qualcuno più temerario si è avventurato nel tentativo di comprensione del famigerato “linear regression on loge score ratio”, ma qui eviteremo di toccarlo come fosse il mouthguard di qualcun’altra.

In sintesi, da un lato abbiamo gli organizzatori che dicono “così abbiamo fatto in modo di far partecipare tutte le squadre e farle giocare un numero sufficiente di volte” e dall’altra gli spettatori che dicono, laconicamente, “non c’abbiamo capito un c***o”.

La questione è, spero converrete con me a fine articolo, che hanno ragione entrambi: vediamo perchè.

Un po’ di storia

Il 15 novembre 2017 sul sito della Roller Derby World Cup compariva un chilometrico post intitolato “TEAM PAIRINGS, STRUCTURE FOR THE ROLLER DERBY WORLD CUP”, cui veniva annunciata la struttura del torneo e i primi accoppiamenti, e veniva introdotto il famigerato “linear regression on loge score ratio”. Ci sono volute in paio di letture del post per capire di cosa si stesse parlando, sicuramente avere familiarità con il ranking di flattrackstats.com ha aiutato nella comprensione.

La struttura prevedeva una sorta di ranking iniziale basato sulle risposte delle squadre a una serie di domande sul loro livello; sulla base di queste venivano fatti degli accoppiamenti per cui ogni squadra avrebbe giocato due bout da 30′ il primo giorno, che avrebbero prodotto un nuovo ranking calcolato rispetto al rapporto tra risultato effettivo e previsione del bout predictor (come funziona questa cosa ve la spiego nel dettaglio più avanti). Sulla base di questo sono stati fatti dei nuovi accoppiamenti per cui ogni squadra avrebbe giocato altri due bout (stavolta di durata regolamentare), da cui sarebbe uscita una nuova classifica. Le prime 8 sarebbero andate poi a giocarsi la vittoria. Ok, respirate, ho finito.

Perchè il ranking

Molta gente ha chiesto perchè non si è usata una formula analoga a quella dei mondiali di calcio o a quelli di Dallas del 2014, ovvero: gironi all’italiana composti da squadre divise per fasce (una di prima fascia, una di seconda, ecc.), al termine del quale sarebbero dovute uscire le squadre che avrebbero preso parte alle eliminatorie all’interno di un tabellone tipo tennis. Il motivo è semplice: sarebbero servite troppe partite.

Una delle prime discussioni, che è stata messa ai voti tra i rappresentanti delle squadre (dunque si tratta di una decisione presa “dal basso” e non imposta), è stata appunto quella di scegliere tra:

Una formula, quella del ranking, che avrebbe permesso a tutte le squadre iscritte di partecipare, e di giocare un numero sufficiente di partite; e che avrebbe inoltre garantito, almeno nei piani, che a giocarsi le medaglie fossero effettivamente le squadre più forti.
Una formula più comprensibile, ma che avrebbe richiesto o delle eliminatorie dirette – con la possibilità che qualche squadra forte uscisse subito, e che le squadre più deboli avrebbero giocato una sola partita – o delle qualificazioni – che avrebbero comportato un numero ridotto di partecipanti rispetto alle squadre iscritte.

Le squadre hanno votato per la prima soluzione, quella che – in pieno spirito del roller derby – avrebbe garantito la maggiore inclusività. Nelle parole degli organizzatori, inoltre, questo è il miglior sistema per stabilire in maniera il più possibile esatta chi sia il migliore, avendo 4 giorni e 4 track a disposizione.

Come funziona il ranking

Il funzionamento del ranking è spiegato in maniera semplice, anche se un filo troppo entusiastica, in questo post in inglese uscito qualche giorno fa. Proviamo a sintetizzare; se non capite niente, sotto c’è un esempio. Se non ve ne frega niente, scendete ancora di più e leggete i pro vs i contro.

Gli organizzatori hanno creato una sorta di loop in cui ogni squadra è connessa ad altre due, a loro volta connesse ad altre due, fino ad avere una sorta di catena, che indica contro chi giocherà ogni squadra. I numeri in rosso e in blu sono i rapporti di forza iniziali (i cosiddetti “power rating”) previsti dagli organizzatori.

Come si legge? Sul post non lo spiegano ma proviamo a capirlo: l’Italia ha una freccia diretta verso l’Iran, il numerino di colore blu, positivo, indica che il rapporto di forza rispetto alla direzione della freccia è positivo, ovvero l’Italia è cosiderata più forte. Di quanto? Di un rapporto di punti equivalente a 1.31.

La freccia che dal Team Indigenous va verso l’Italia ha vicino un numerino negativo, rosso. Che significa? Che il Team Indigenous è considerato più debole, e che quindi – di nuovo – l’Italia è considerata più forte.

Come si modifica il ranking? Ottenendo un risultato migliore di quello previsto, si sale; ottenendo uno peggiore, si perdono punti. Il concetto di risultato migliore o peggiore è dato dal rapporto tra punti segnati e punti concessi agli avversari.

E se non vi sembrava già abbastanza complicato...

L’algoritmo, tra l’altro, non si limitava ad aggiornare il ranking delle due squadre alla fine di ogni bout, ma anche quello delle altre: paradossalmente, non importava nemmeno chi stesse giocando. Tutte le partite hanno contribuito a rendere più accurati i rapporti di forza. Poiché le squadre erano tutte collegate, ogni risultato diceva qualcosa su ogni squadra. Ad esempio, se la squadra A ha fatto meglio in una partita rispetto al Power Rating previsto, ciò non ha solo migliorato il rating nominale della squadra A; ha migliorato il rating nominale di ogni squadra che aveva battuto la Squadra A, perché la Squadra A era più forte di quanto fosse previsto.

Non ho capito niente, fammi un esempio

Nello scheduler presente sul sito www.rollerderbyworldcuplive.com c’era un bout predictor per ogni incontro, ovvero una proprozione di punti prevista tra le due squadre; questo era quello di Italia – Islanda.

Come si legge? Facendo la divisione 1052/81 = 12,99 si ottiene il rapporto di punti atteso. Un punteggio tipo 210-16 sarebbe stato in linea con la previsione. Per migliorare il ranking avremmo dovuto dunque avere un rapporto tra i punteggi superiore a 13.

Punteggio Italia / Punteggio Islanda = 12,99

In pratica, per ogni punto fatto dall’Islanda, noi dovevamo farne 13. L’obbiettivo, quindi, era far fare meno punti possibile alle avversarie, mentre noi dovevamo farne una valanga. Se vi ricordate, a metà del secondo period anzichè far girare le jammer, dal bench chiedevano di chiamare il jam ogni volta che avevamo la lead e la jammer avversaria effettuava il primo passaggio: proprio per evitare che facessero dei punti che ci avrebbero costretto a farne un sacco per recuperare. Ogni punto fatto dall’Islanda ci costringeva a fare TREDICI per recuperarlo.

Prima della partita con l’Islanda eravamo al 21° posto del ranking, per avvicinarci al 16° (primo posto utile per poter giocare anche la domenica) avremmo dovuto quindi fare un punteggio di parecchio superiore a quello previsto: tantissimi punti noi, pochissimi le avversarie. Cosa che siamo riusciti a fare durante buona parte del secondo period.

Al penultimo jam il punteggio era 365-27; il rapporto era:

365/27 = 13,52

superiore dunque al 12,99 previsto. In quel momento, quindi, stavamo avanzando in classifica.

**Il momento esatto in cui abbiamo avuto la possibilità di migliorare il nostro ranking: a 1’49” dal termne il rapporto tra il nostro punteggio e quello avversario era di 13,52.**

Purtroppo ci ha detto sfiga, la nostra jammer è finita al penalty box dopo aver preso la lead, il nostro wall non è riuscito a tenere la jammer avversaria e, approfittando della situazione di powerjam e dei due minuti, le Islandesi hanno messo a segno 8 punti, tantissimi purtroppo. Il risultato finale è stato 381-35: avremmo dovuto fare più di 450 punti per andare in pari col ranking.

381/35=10,88

Rapporto dunque di gran lunga inferiore alla previsione, infatti siamo scesi dal 19° al 23° posto nel ranking.

E’ un po’ più chiaro adesso?

Pro e contro

Ci sono tutta una serie di pro e di contro con questo sistema – che, lo ricordiamo, è stato votato dalle squadre iscritte. Proviamo a riassumerli, includendo anche alcune considerazioni già fatte.

Cosa va:

Il sistema di ranking ha funzionato bene, permettendo di stilare una classifica che rispecchia più o meno fedelmente i rapporti di forza tra le squadre. In particolare, nei primi otto posti ci sono le squadre che hanno meritato di più. A Dallas, per dire, la Spagna (nona quest’anno) è rimasta fuori dai giochi per le posizioni in alto perchè ha trovato un girone di ferro con Inghilterra, Irlanda e Germania ed è stata eliminata insieme ai tedeschi.
L’algoritmo del sistema di ranking è riuscito a esprimere i rapporti di forza all’incirca nell’ordine giusto, nonostante la pressochè totale mancanza di dati iniziali.
Se il sistema di ranking continuerà ad essere adottato in futuro, ci saranno molti più dati su cui basare le previsioni.
Tutte le squadre hanno giocato un numero di partite congruo rispetto al tempo e ai track a disposizione.
Tutte le nazionali iscritte hanno potuto partecipare, rispettando i principi di inclusione propri del roller derby
Ogni punto segnato ha il suo impatto sul ranking, per cui anche se stai perdendo ti spinge a non mollare mai (come l’Islanda, mannaggia a loro).
All’ERDT c’erano 9 squadre e l’eliminazione diretta, noi abbiamo avuto la sfiga di beccare un turno preliminare contro il Galles, il che ci ha tagliato fuori subito da qualunque sogno di gloria: siamo sicuri che sia meglio del ranking? In questo mondiale ci ha detto abbastanza culo nel sorteggio ma, qualunque squadra avessimo incontrato, l’importante sarebbe stato fare meglio del punteggio previsto, non necessariamente vincere. E su quello si basa la classifica dei ranking.

Cosa non va:

L’impatto su chiunque non abbia un minimo approfondito i meccanismi del ranking è devastante: impossibile, senza essersi letti un lungo post, capire come funziona il torneo, quando si gioca e come si fa a rientrare nei top 16. Il motivo per cui ho scritto questo articolo è proprio il fatto che mi ero stufato di dover spiegare i ranking spessissimo.
Già il roller derby è complicato di suo e difficile da seguire per qualcuno che non è avvezzo a questo sport: figuriamoci se lo spettatore casuale (che non è necessariamente un appassionato incallito) debba anche farsi dei calcoli per capire quando potrà rivedere la sua squadra (e il layout dello schedule sul sito non ha aiutato, anzi, ma su questo ci torneremo).
La comunicazione dei risultati e dei ranking è stata scarsa e poco dettagliata, generando confusione anche in quelli che si erano studiati il funzionamento.
Con tre partite vinte su quattro siamo arrivati ventitreesimi. Come a Dallas (dove ne avevamo vinta una su quattro).
Ogni punto segnato ha il suo impatto sul ranking, per cui anche se stai vincendo 700-0 continui a spingere perchè puoi avere un risultato ancora migliore. Ad esempio, l’Australia grazie a una serie di vittorie con larghissimo margine ha avuto un ranking più alto degli USA (che invece hanno subito parecchi punti dalla Francia, contrariamente alle previsioni).
In ogni partita devi schierare le line migliori, le giocatrici più forti, le jammer più attente a non fare falli: non puoi rilassarti, non puoi tirare un po’ il freno a mano, non puoi “avere pietà” degli avversari e non infierire. Tutto fa ranking, per cui sono usciti fuori risultati come Germania-Repubblica Ceca 610-99, Svezia-Russia 635-6, Ingilterra–Austria 591-6, Scozia-Islanda 604-16 e addirittura Canada-Grecia 795-7: siamo sicuri che risultati del genere rispecchino lo spirito del roller derby?
L’effetto collaterale del punto di cui sopra è che i coach devono appunto schierare sempre le line migliori e non possono permettersi il lusso di far giocare tutte le giocatrici convocate (come ad esempio succede, invece, nell’ultima partita del girone, quando solitamente i giochi sono fatti). Nel caso dell’Italia, tre giocatrici non sono mai state schierate sul track e due non sono proprio finite nei roster: anche qui, lo spirito del roller derby non è proprio presentissimo.
Paradossalmente, può accadere che una squadra perda quattro partite su quattro e abbia un buon ranking perchè ha perso con differenziali minori di quelli previsti (naturalmente dovrebbe essere sorteggiata per incontrare tutte squadre più forti).

[divider]

Riassumendo i pro e i contro

Il sistema di ranking permette di avere una classifica che per forza di cose si avvicina a rispettare le gerarchie di forza tra le squadre; viceversa, è un sistema complesso e non per tutti e che obbliga sempre a giocare al massimo. E’ positivo? E’ negativo? E’ entrambe le cose.

Ha i suoi pregi e i suoi difetti ma, per tirare le conclusioni, se la squadre nazionali hanno votato per un sistema che permetta a tutti di partecipare, è l’unico metodo possibile per garantire un numero minimo di partite.

Mi viene da aggiungere che questa edizione della coppa del mondo avrà dato un sacco di feedback agli organizzatori su come migliorare la gestione: il roller derby è uno sport ancora giovane e i margini di miglioramento sono ancora tanti. L’importante è che le decisioni vengano sempre prese dal basso: questo è lo spirito!

Un po’ di storia

Perchè il ranking

Come funziona il ranking

Non ho capito niente, fammi un esempio

Pro e contro

Riassumendo i pro e i contro

Eventi in programma

Tornano i tryout per il Team Italy!

I risultati del primo concentramento del campionato 2023/24

Annunciato il primo concentramento del campionato 2023/2024

Crowdfunding per un set Lego a tema roller derby!

Il racconto delle finali del campionato 2022/2023