I sondaggisti sulle elezioni americane? Non sono da bocciare, ma nemmeno da promuovere a pieni voti

Pubblicato su Luiss Open il 16 novembre 

Nelle ore immediatamente successive alla chiusura delle urne negli Stati Uniti, lo scorso 3 novembre, non è stato possibile attribuire subito la vittoria al candidato democratico Joe Biden né escludere a strettissimo giro una riconferma del Presidente uscente Donald J. Trump. Questa situazione, in parte inedita, ha fatto scattare in poche ore l’ennesimo processo ai sondaggi di opinione, giudicati ancora una volta fallimentari, soprattutto alla luce del fatto che non si era materializzata la prevista “ondata blu” a favore di Biden e dei Democratici. Prudenza avrebbe voluto, in realtà, che si aspettasse il sedimentarsi del risultato effettivo. A maggior ragione in una elezione come questa in cui, già prima dell’apertura delle urne, si attendeva un numero molto consistente di voti postali, i cui risultati sarebbero arrivati in coda allo scrutinio ufficiale. Ecco perché il momento migliore per valutare in maniera ponderata l’accuratezza dei sondaggi è adesso, con risultati praticamente definitivi.

Sondaggi della vigilia vs. risultati effettivi

Iniziamo, dunque, dal prendere visione dei dati, sintetizzati nella tabella qui di seguito (Tabella 1). Essi si riferiscono ai 17 Stati americani considerati “battleground”, cioè “contendibili”, dal sito RealClearPolitics. Questa testata ha elaborato una media dei principali sondaggi della vigilia, indicata per ogni Stato nella prima colonna da sinistra. Nella seconda colonna è indicata invece la differenza effettiva tra i voti ricevuti in ogni Stato da Biden e quelli ricevuti da Trump. Nella terza e ultima colonna, poi, è indicata la differenza tra i sondaggi e i risultati effettivi. Tale differenza può essere considerata all’interno del margine di errore dei sondaggi quando è uguale o inferiore a 3,1% (per semplicità, visto che questo è il margine di errore tipico di un sondaggio con 1000 intervistati; a voler essere precisi, non direttamente applicabile a queste “medie di sondaggi”, né a sondaggi con diverso numero di intervistati). In fondo alla tabella, infine, è presentato il dato nazionale.

Per semplificare la lettura sono evidenziati in giallo tutti i casi in cui la distanza tra sondaggio e risultato effettivo è stata superiore al normale margine di errore (in 7 Stati sui 17 considerati), in rosso invece gli errori più macroscopici (superiori al 6%).

Tab. 1 – Media sondaggi e risultati effettivi delle elezioni presidenziali USA. Fonte: RealClearPolitics

Cosa emerge? Sui 17 Stati considerati, in 15 casi i sondaggi hanno previsto correttamente l’assegnazione dello Stato al candidato Presidente, sbagliando dunque solo in due casi.

A livello nazionale, infine, i sondaggi prevedevano un distacco di 7,2 punti a favore di Biden; allo stato attuale del conteggio, il distacco è di 3,4 punti, meno della metà. La differenza, anche in questo caso, è di poco superiore al margine di errore normalmente considerato.

In definitiva, i sondaggi ci hanno preso oppure no? Potremmo rispondere “sostanzialmente sì”, se oltre ai numeri nudi e crudi consideriamo anche altri fattori.

I limiti di tutti i campioni dei sondaggi

Iniziamo da una precisazione sul concetto di “margine di errore”. A rigore applicare i “margini di errore” previsti dalla teoria statistica agli attuali sondaggi, negli Stati Uniti e non solo, non sarebbe possibile. Per applicare il margine di errore che abbiamo considerato, cioè il 3% circa per i sondaggi con 1.000 o più intervistati, infatti, il campione dovrebbe essere “probabilistico”: a essere intervistati ai fini del sondaggio dovrebbero essere soltanto individui estratti in modo casuale dall’intera popolazione di riferimento. Nella realtà, però, intervistare effettivamente le “prime scelte” del campione sarebbe impossibile o troppo costoso. Anzitutto, perché elenchi del tutto esaustivi degli elettori e dei loro recapiti non esistono o sono troppo costosi da realizzare. Poi, perché può capitare che una persona estratta sia tecnicamente – anche solo momentaneamente – irraggiungibile. Di conseguenza i sondaggisti la sostituiranno con una persona “simile”. Così facendo, però, viene compromessa la costruzione probabilistica del campione, e il margine di errore effettivo diventa di fatto sconosciuto. Alla luce di questo punto, in realtà dovremmo rovesciare le nostre considerazioni: con campioni non probabilistici, il fatto che i risultati effettivi delle elezioni rientrino quasi sempre nel margine di errore è paradossalmente un piccolo miracolo (!) e segna un punto a favore dei sondaggisti.

Le polemiche sull’“ondata blu”

Ma c’è stata o no l’“ondata blu”? Parliamone. Riportando la maggioranza assoluta dei voti, cioè superando il 50% dei consensi, Biden è risultato il candidato più votato della storia americana con 78,2 milioni di voti raccolti. Inoltre, Biden ha aumentato i suoi voti non facendo solo riferimento al proprio tradizionale elettorato concentrato nei Blue States (riconquistando tre Stati persi da Hillary Clinton nel 2016), ma addirittura strappando alcuni stati (Georgia e Arizona) che erano repubblicani da molti anni. Il risultato, in base allo stato attuale dello scrutinio, potrebbero essere addirittura 306 voti elettorali: se fosse così, sarebbe un risultato addirittura superiore a quello di Trump nel 2016, che aveva vinto 304 a 227 contro Hillary. Certamente, l’idea di una “ondata blu” di cui si era parlato alla vigilia suggeriva anche un successo ancora più netto dei democratici, con la possibilità di riconquistare il controllo del Senato (questione, comunque, attualmente appesa ai ballottaggi che ci saranno tra alcune settimane in Georgia). Tuttavia, con un risultato come quello che si è andato definendo in queste ore è difficile sostenere che la vittoria di Biden non sia stata chiara e inequivocabile, e su questo decisamente in linea con le previsioni della vigilia (ricordiamo che per Nate Silver, alla vigilia del 3 novembre, il candidato democratico aveva l’89% di possibilità di farcela).

Il fattore mobilitazione in America

C’è però una domanda legittima che potrebbe sorgere dalla lettura dei sondaggi di cui abbiamo parlato finora: passi per il margine di errore, passi pure per la vittoria inequivocabile di Biden, ma perché quasi tutti i sondaggi della vigilia tendevano a “sbagliare” in una direzione favorevole al candidato democratico? Per rispondere occorre considerare come il fattore “mobilitazione” degli elettori possa influenzare il risultato di una qualsiasi elezione, e come questo possa accadere in particolar modo negli Stati Uniti contemporanei. Già prima del voto, commentando i risultati di un nostro sondaggio (https://open.luiss.it/2020/10/29/non-saranno-strategie-basate-su-temi-concreti-ad-aiutare-trump-ecco-perche/) avevamo suggerito che di fronte al netto predominio di Biden sui vari temi di interesse dell’opinione pubblica, un eventuale successo inferiore alle aspettative o addirittura una vittoria di Trump avrebbero dovuto essere imputati a dinamiche legate alla mobilitazione elettorale. Il perché è presto spiegato: i sondaggi scattano un’istantanea dell’opinione pubblica, ma poi bisogna vedere quanti elettori dei due campi avversi vanno effettivamente a votare e quanti invece alla fine per vari motivi rinunciano. Le varie cronache arrivate dagli Stati Uniti ci hanno confermato che questo è stato uno dei fattori fondamentali: il campo di Trump, soprattutto negli ultimi giorni, si è mobilitato con forza per cercare di portare più elettori possibili al voto. Trump, che nel 2016 ottenne 62,9 milioni di voti, stavolta è riuscito a conquistare 72,8 milioni di elettori, quasi 10 milioni di voti in più rispetto a 4 anni fa: di fatto un’“ondata rossa” che ha tentato di contrastare e fermare una possibile “ondata blu”. Tuttavia, anche a fronte di questa ondata rossa, Biden è riuscito a mobilitare un’ondata ancora più ampia: aumentando di 12,4 milioni di voti il bottino dei Democratici rispetto al 2016 e, quindi, incrementando ulteriormente da 2,9 a 5,4 milioni di voti il distacco sullo sfidante repubblicano nel voto popolare. È in queste dinamiche che si cela il motivo principale delle differenze tra sondaggi e risultato finale. Nel momento in cui milioni e milioni di persone in più rispetto alle attese si recano alle urne, soprattutto persone con livelli di istruzione più bassa e in alcuni casi anche americani di origine ispanica, si palesa con maggior evidenza l’indiscutibile difficoltà dei sondaggisti contemporanei di intercettare alcuni gruppi demografici. Un limite su cui occorrerà necessariamente lavorare, anche ampliando campioni di intervistati, in alcuni casi sottodimensionati per Stati americani così combattuti e allo stesso tempo potenzialmente decisivi per l’assegnazione della Casa Bianca.