venerdì 29 aprile 2016

La definizione di probabilità

Ho già avuto modo di riflettere sul concetto di probabilità in un post precedente in relazione ai suoi aspetti poco intuitivi o addirittura controintuitivi che possono essere messi in evidenza in esempi concreti. Questi però non sono gli unici aspetti difficoltosi. La probabilità ad esempio rivela una certa complessità sin dal suo tentativo di definizione. In questo post prendo in considerazione proprio le definizioni di probabilità e le osservazioni che mi sono appuntato a seguito di letture interessanti sull'argomento, in particolare quella del libro di Paolo Agnoli e Francesco Piccolo "Probabilità e scelte razionali".

Parto da quella che spesso viene chiamata Definizione Classica: La probabilità P(A) di un evento A è il rapporto tra il numero N di casi "favorevoli" (cioè il manifestarsi di A) e il numero totale M di risultati ugualmente possibili e mutuamente escludentesi. La principale critica che si fa a questa definizione, che per certi versi sembra molto semplice e diretta e per questo si usa spessissimo, è che si tratta di una definizione in parte circolare in quanto assume il concetto di equiprobabilità per definire la probabilità. In genere la situazione di equiprobabilità viene desunta dalla simmetria del problema. Questa caratteristica del sistema è dunque fondamentale per applicare tale definizione. Un esempio classico è quello del dado da gioco, un cubo perfetto fatto di una sostanza omogenea che rende le sei facce indistinguibili (a parte il numero che c'è scritto sopra) e quindi equiprobabili. Vale lo stesso discorso anche per il "testa o croce" fatto con una moneta.

Un'altra definizione, di tipo più sperimentale, è la Definizione Frequentista: La probabilità di un evento è il limite cui tende la frequenza relativa di successo all'aumentare del numero di prove. Qui le critiche possono essere più d'una. Intanto si tratta di un'attribuzione di probabilità "a posteriori". La probabilità di un evento, stando a questa definizione, non è calcolabile a priori in nessun modo. Si può solo misurare a posteriori attraverso un esperimento (ma tale misura per sua natura sarà sempre imprecisa). Inoltre è applicabile solamente quando sia possibile ripetere numerose volte l'esperimento, anche se, trattandosi di un processo al limite, non è mai chiaro quante volte sia necessario ripeterlo. Tra l'altro non è neanche chiaro se questo limite esista sempre, e non c'è nessun argomento che lo garantisca. E' una definizione operativa che comporta la possibilità di applicarla concretamente al problema (quando il problema si presta a questo tipo di analisi). Gli esempi del dado e della moneta utilizzati per la definizione precedente si prestano altrettanto bene per questa.

Ovviamente proprio perchè in molti casi pratici si possono utilizzare indipendentemente entrambe le definizioni queste, almeno in tali casi pratici, dovranno necessariamente convergere. A garanzia di questa convergenza sta un principio generale chiamato legge dei grandi numeri: dato un evento che accade con probabilità p, la frequenza f(N) con cui questo evento accade in N prove indipendenti, nel limite di grandi N, tende a p. La legge dei grandi numeri è un risultato fondamentale, perchè in qualche modo fonda lo stesso concetto di probabilità (sebbene non la definisca), chiarendo il nesso tra la teoria matematica e la realtà empirica.

Quello che un po' disturba in tutto questo discorso è la limitatezza delle definizioni che sono state date a fronte dei tanti casi in cui queste definizioni non sono affatto applicabili e in cui però ha certamente senso parlare ancora di probabilità. Ad esempio in molti scenari di valutazione dei rischi parlare di probabilità ed attribuirne un valore in qualche modo agli eventi è ragionevole e pure molto importante ma certamente la definizione classica o quella frequentista non ci aiutano molto. In pratica stando alle due definizioni sopra sarà possibile parlare di probabilità solo in due casi, molto particolari e riduttivi, rispetto alla complessità del mondo reale.

Un'ulteriore definizione che si può introdurre è quella detta Definizione Assiomatica: La probabilità P(A) di un evento A è un numero compreso tra zero e uno. Con uno si intende la certezza dell'evento, con zero la sua impossibilità. Come si vede subito questa definizione non è legata a nessun procedimento operativo e non antepone ad essa nessun "concetto primitivo" di equiprobabilità. Ovviamente non dà neppure nessuna indicazione su come calcolare o misurare la probabilità così definita. Però questa definizione è un punto di partenza molto fecondo in quanto da essa si possono far seguire una serie di proprietà importanti della probabilità, come ad esempio la probabilità dell'evento complementare ad A (1-P(A)), cioè dell'evento "qualcosa di diverso da A", oppure la probabilità di A_and_B, o la probabilità di A_or_B, inoltre si possono introdurre i concetti di eventi mutuamente incompatibili, cioè eventi che non possono accadere entrambi, per cui si ha P(A_and_B)=0 e P(A_or_B)=P(A)+P(B), ed eventi mutuamente indipendenti (l'accadere dell'uno non influisce sull'accadere dell'altro) per cui si ha che P(A_and_B)=P(A)*P(B). A seguire ancora la definizione di probabilità condizionata, il teorema di Bayes, e così via.

Quindi una definizione così "asettica", cioè non legata ad aspetti pratici, puramente matematica, che coglie l'unico aspetto matematicamente importante della probabilità, quella cioè di essere semplicemente un numero compreso tra zero e uno (certezza e impossibilità) da affibbiare in qualche modo (non interessa come) a degli "eventi", è l'ideale per sviluppare tutte le proprietà formali importanti. C'è da notare che le due definizioni date precedentemente "rientrano" in quest'ultima, cioè entrambe possono fornire come risultati (del calcolo nella prima definizione o della misura nella seconda definizione) numeri compresi tra zero e uno con i rispettivi significati di impossibilità e certezza. Più precisamente la definizione assiomatica prescindendo dalla questione di come si calcola o come si misura la probabilità "include" virtualmente qualunque ulteriore definizione. In altre parole qualunque sia il modo in cui operativamente associo probabilità ad eventi la teoria delle probabilità funziona comunque.

Quest'ultima definizione ci ha proiettato in un mondo formale dove si può sviluppare indisturbati una teoria rigorosa e completa della probabilità. Rimane il fatto che uno può continare a domandarsi effettivamente di che cosa stiamo parlando, cioè di quale grandezza fisica stiamo parlando, che poi significa poter dire come misurarla con certezza e in modo univoco per qualunque evento reale.

Se però, come detto nel post già citato in precedenza, si ammette che la probabilità è una proprietà connessa alla quantità di informazioni che il soggetto ha sull'evento, o più in generale su tutto l'ambiente che concorre a determinare l'evento, allora può aver senso (ed essere anche interessante) introdurre un'ultima definizione di probabilità, chiamata Definizione Soggettiva: La probabilità di un evento A è la misura del grado di fiducia che un individuo coerente attribuisce, secondo le sue informazioni e opinioni, all'avverarsi di A. Qui ovviamente appaiono immediatamente almeno due punti molto delicati che possono essere difficili da digerire. Uno riguarda il sospetto che dentro il concetto di soggettività ci sia nascosto quello di arbitrarietà. L'altro è che occorre comunque accettare il fatto che la soggettività implica inevitabilmente che si possa arrivare a valutare probabilità soggettive diverse (ma ugualmente "corrette") rispetto ad uno stesso evento.

Riguardo alla prima questione (soggettività/arbitrarietà) viene in aiuto il concetto di individuo coerente, come citato dalla definizione. Per coerenza si intende una corretta applicazione delle norme di calcolo, cioè fondamentalmente la valutazione del soggetto deve essere fatta nel rispetto della regola che le probabilità associate agli eventi non devono essere modificate di volta in volta se le informazioni in possesso non mutano. Questa regola viene detta assioma di coerenza e serve a far sì che una persona non cambi la propria probabilità soggettiva per tornaconto personale. Di fatto la quantificazione della probabilità soggettiva è basata essenzialmente sul concetto di scommessa. Una volta fissate le quote di scommessa pro e contro l'evento, deve essere indifferente allo scommettitore il verso della scommessa. Il rapporto delle quote, in condizione di indifferenza sul verso da scegliere, è una valutazione del rapporto delle probabilità. Il termine soggettiva sta ad indicare che la valutazione di probabilità dipende dallo stato di informazione del soggetto che la esegue e, anche se basata su una credenza specifica, non è affatto arbitraria: il ruolo normativo della scommessa coerente obbliga a tenere conto di tutte le informazioni a disposizione.

Riguardo invece alla seconda questione (soggettività, dunque tante probabilità diverse per i diversi soggetti in relazione allo stesso evento) non si può fare molto altro che ingoiare il rospo. Se il punto è che il concetto di probabilità soggettiva dipende, in ultima analisi, dallo stato di informazione del soggetto che effettua la valutazione, non è possibile pretendere che ci sia concordanza tra soggetti indipendenti che valutano. Tra l'altro nulla viene specificato sul criterio di valutazione seguito dal soggetto. D'altra parte è pur vero che la definizione data parte dall'idea che il concetto di probabilità soggettiva dipende, in ultima analisi, dallo stato di informazione del soggetto che effettua la valutazione. L'oggettività è in un certo senso un fatto "accidentale" e si ottiene semplicemente quando tutti i soggetti sono d'accordo su di essa (cioè arrivano a valutarla allo stesso modo). Non potrebbe essere altrimenti visto che la principale caratteristica della definizione soggettiva è quella di presupporre che la probabilità non sia una caratteristica intrinseca di un evento.

Sicuramente la definizione soggettiva ha un significativo vantaggio: non soppianta le definizioni convenzionali (anzi le recupera e include come specifiche e legittime regole di valutazione della probabilità) e consente di ricercare un concetto di probabilità che si possa applicare a tutte le situazioni dell'agire umano. Il suo punto di forza sta proprio nella possibilità di fare affermazioni probabilistiche su qualsiasi evento. Il concetto di probabilità soggettiva è, in ultima analisi, basata unicamente sull'idea che la probabilità è legata allo stato di incertezza.

In sintesi, concludendo questo lungo (e faticoso) post, si può dire che la definizione assiomatica ci svincola dalla delicata questione di cosa sia fisicamente la probabilità consentendoci però di svilupparne tutte le proprietà puramente matematiche, su cui tutti sono d'accordo. Le altre definizioni (e tutte le controversie ad esse associate) si riducono alle questioni di interpretazione del concetto assiomatico, ovvero di determinare le proprietà, potremmo dire, "extramatematiche" di probabilità. Alla fine il problema del rapporto tra la teoria delle probabilità e il mondo reale non è altro che un caso particolare di quello, molto generale, tra la matematica e la fisica.

Nessun commento: