Probabilità: assiomatiche a confronto

A. Pagano

Pre-print a cura dell’autore. Originale pubblicato su: GIORNALE DI FISICA VOL. XLIII, N. 4, Ottobre‑Dicembre 2003. DOI 1O.1393/gdf/i2003-10009-9

INFN & Dipartimento di Fisica e di Astronomia dell’Università di Catania

1. Introduzione

Una mia breve nota dal titolo [1]: “Sul concetto di probabilità classica” ha suscitato interesse e curiosità tra insegnanti. Ciò mi ha convinto ad estendere alcune considerazioni che, in quella nota, furono semplicemente accennate. Infatti, il mio scopo era quello di richiamare la formulazione di Giuseppe Peano (1912) sul concetto di probabilità classica o a priori. Ma dovetti dare un cenno, per completezza di esposizione, alla formulazione del Kolmogorov (1932) che rappresenta, come è noto, il riferimento base più moderno per studi o per esposizioni didattiche sul concetto di probabilità. Nel far ciò accennai ad alcune osservazioni che la forma, troppo concisa, può far apparire come dogmatiche [2]. Ad esempio, scrissi tra l’altro: “… , fino a quando ci muoviamo nell’ambito di insiemi finiti di classi (di eventi), e cioè nella maggioranza dei problemi pratici, la struttura probabilistica dei Kolmogorov, con gli opportuni riferimenti a possibili modelli concreti, non apporta nulla di sostanzialmente nuovo rispetto all’impostazione classica o laplaciana, se si astrae dalla diversa impostazione assiomatica...”. E ciò, effettivamente, senza altri commenti può aver suscitato legittime perplessità. Vorrei meglio chiarire in questa nota quei punti di confronto servendomi di alcune semplici considerazioni. Pur riferendomi essenzialmente a quanto già esposto in nota [1] preferisco discutere l’argomento in modo auto consistente. Pertanto, nella sezione 2, richiamerò i punti essenziali delle due assiomatiche che metto a confronto, quella di Laplace-Peano e quella di Kolmogorov. Nella sezione 3 dedurrò delle conclusioni che spero possano essere di una qualche utilità.

2. Assiomatiche a confronto

Sono utili le seguenti premesse:

2.0 Il simbolo É interposto tra due classi si legge “implica” oppure “contiene”.

2.1 I simboli “A ,B, C,…” indicano classi o insiemi (la classe vuota si indica con il simbolo Æ).

2.2 I simboli x, y, z ,… a, b, c … x , h, z , indicano elementi.

2.3 La proposizione: “x è un elemento di A”, si scrive nel modo usuale: x Î A.

2.4 La “classe degli A che sono anche dei B”, si scrive AB.

2.5 La classe dei B oppure dei C, si scrive B U C.

2.6 Valgono tutti i teoremi del calcolo delle classi e della teoria dei numeri.

2.7 Se gli elementi di una classe A sono in numero finito, tale numero lo si indica con Num(A).

Definizione di probabilità secondo Peano-Laplace [4].

2.8 Siano A e B delle classi. Il numero di elementi della classe A sia finito.

2.9 La probabilità degli A che sono B, che indichiamo con la scrittura P(B, A), vale

che si legge: Se A e B sono classi, e il numero degli individui della classe A è finito, allora il simbolo P(B, A) vale il numero degli A che sono B, diviso per il numero totale degli A. Utilizzando il linguaggio comune si potrà dire: se A è la classe dei casi possibili, che si suppongono in numero finito, e B è la classe dei casi favorevoli, col simbolo P(B, A), che si legge: probabilità dell’avvenimento B fra gli avvenimenti A, si intende il rapporto fra il numero dei casi possibili, che sono favorevoli, al numero totale dei casi possibili. I teoremi fondamentali sulle probabilità assumono forma semplicissima come pure le loro dimostrazioni [5].

Definizione di probabilità secondo Kolmogorov [6].

Se assimiliamo il termine Classe del Peano con il termine Insieme usato dal Kolmogorov, valgono le premesse 2.1-2.7. Inoltre, riassumendo, quasi per intero la parte introduttiva dell’opera del Kolmogorov e seguendone l’impostazione si pongono le seguenti due definizioni:

2.10 Sia E una collezione di elementi che chiameremo eventi elementari.

2.11 Sia Γ un insieme di sottoinsiemi di E; gli elementi dell’insieme Γ li chiameremo eventi casuali.

E si danno i seguenti postulati:

2.12 Γ è un campo [7] di insiemi A.

2.13 Γ contiene l’insieme E.

2.14 A ciascun insieme A è assegnato un numero reale non-negativo P(A). Tale numero si dice la probabilità dell’evento A.

2.15 P(E) = 1.

2.16 Se AB = Æ, deve essere: P(A+B) = P(A) + P(B).

Seguendo il Kolmogorov, un sistema di insiemi, Γ, insieme con una definita assegnazione di numeri P(A), che soddisfi gli assiomi 2.12-2.16, sarà chiamato un campo di probabilità.

Dopo aver definito il campo di probabilità, Kolmogorov estende la sua formulazione, valida fino a quel punto per insiemi finiti di eventi, in modo da includere anche insiemi infiniti; e per fare ciò pone il seguente assioma di continuità:

2.17 Per una successione decrescente di eventi: A₁ É A₂ É…É A_n É… di Γ, per cui si abbia, A₁ A₂…A_n…= Æ, deve valere la condizione:

lim P(A_n) = 0.

n®¥

Kolmogorov, chiarisce che la posizione 2.17 segue banalmente dalle precedenti 2.12-2.16 nel caso che il campo Γ sia finito, ed osserva, molto opportunamente, che solo nel caso di campi infiniti l’assioma è logicamente indipendente dai precedenti. Pertanto, senz’altro aggiungere, definisce campo di probabilità generalizzato un sistema che includa l’assioma 2.17 tra gli assiomi della probabilità.

La parte fondamentale ed introduttiva viene completata definendo l’ulteriore concetto di probabilità condizionale, con la seguente posizione:

2.18 Se P(A) > 0, allora il rapporto

si chiama probabilità condizionale [8] degli eventi B sotto la condizione o l’ipotesi A. Compare dunque, il simbolo a due variabili che, invece, è esplicitamente introdotto dal Peano ab inizio nella sua definizione.

3. Confronto tra le due impostazioni [9]

Dalle definizioni sopra accennate, sono deducibili le seguenti osservazioni che danno un’idea precisa della differenza sia di sostanza che di forma tra le due formulazioni:

i) Nella definizione 2.9 di Laplace-Peano la probabilità, essendo per definizione un rapporto numerico che si assegna ad una classe rispetto ad una classe di riferimento, viene derivata dalla teoria delle classi e dalla teoria dei numeri (aritmetica, analisi, ecc.) senza più aggiungere assiomi particolari. La probabilità è una pura definizione e non ha bisogno di ulteriori postulati. In quanto grandezza misurabile, fa parte integralmente della teoria delle grandezze fisiche [10]. Nella proposta di Kolmogorov si parte invece dagli individui (elementi), come si vede da 2.10, pertanto è assolutamente necessario fornire assiomi ulteriori nella forma, ad esempio, 2.12 e 2.13 [11].

ii) La probabilità del Peano-Laplace è per definizione sempre una grandezza relativa e si nega esplicitamente che possa avere un qualche senso la nozione di probabilità assoluta. Ad esempio, l’assioma 2.15 di Kolmogorov, diventa, nella formulazione del Peano, il teorema banale,

All’interno della teoria classica del Laplace-Peano non ha alcun senso la ulteriore specializzazione di probabilità condizionali (come data dalla 2.18). Semplicemente, se vogliamo utilizzare un linguaggio vicino alle moderne impostazioni, la probabilità del Peano è sempre, per definizione, una probabilità condizionale. Naturalmente, se le formule vanno intese per quello che realmente esprimono (cioè oggettivamente), anche la probabilità del Kolmogorov (assiomi 2.12-2.17) è relativa, perché, per definizione, la si calcola sempre in riferimento con l’insieme costante, E; cioè si conviene una volta per tutte, che ogni altra probabilità deve essere ad essa riferita (assioma di normalizzazione 2.15). Ma, come già osservato in nota [1], ciò può dare l’illusione che si possa parlare di probabilità assoluta [12]. Nei libri di testo (ovviamente a partire dal testo di Kolmogorov citato), si suole definire le probabilità condizionale dopo quella introdotta con gli assiomi 2.12-2.17, che per contrasto dovrebbe chiamarsi assoluta, se a ciò non si opponesse il fatto che l’idea di una qualche probabilità assoluta porterebbe a non pochi problemi interpretativi [13]. Necessariamente, la nuova definizione produce un oggetto che obbedisce a tutti i postulati della probabilità precedentemente introdotti, e dunque, ne segue tutti i teoremi. Per esempio, la fondamentale relazione della probabilità che si abbia un A o un B sotto la condizione H, vale

P(AUB, H) = P (A, H) + P (B, H) - P (A ∩ B, H).

In sostanza, se nella 2.18 si sostituisce semplicemente il simbolo P(..) con il simbolo Num(..) , si ottiene, formalmente, la definizione 2.9 del Peano. Ovviamente, i due simboli risultano interscambiabili solo nel caso di campi finiti di probabilità, a conferma di quanto precedentemente asserito che, nel caso di campi finiti di insiemi, la formulazione del Kolmogorov non contiene nulla di più rispetto a quella di Lapalce-Peano. Mentre, non è, evidentemente possibile fare ulteriori confronti tra le due teorie nel caso di campi di probabilità generalizzati per un sistema che includa l’assioma 2.17 [14].

iii) Assumendo il punto di vista sopra esposto che la formulazione del Kolmogorov non differisce da quella del Peano-Laplace (dove sono confrontabili), sembra allora, del tutto lecito supporre che lo scopo (evidentemente, non dichiarato esplicitamente) degli assiomi 2.12-2.16 sia da ricercare nella necessità di preparare, per così dire, la strada per la successiva asserzione dell’assioma 2.17 (assioma VI del Kolmogorov) che, invocando l’esistenza di classi infinitesime apre la strada ai reticoli non atomici. Resta comunque il fatto che lo stesso Kolmogorov [15], dichiara il significato dell’assioma 2.17 di continuità essere “. . . almost impossibile to elucidate...” in relazione a modelli concreti [16].

In conclusione, ribadendo quanto già precedentemente affermato in nota [1], la formulazione del Laplace-Peano, che chiamiamo classica o a priori è un’applicazione fisica di concetti già noti di teoria dei numeri e delle classi. Essa è oggettiva, cioè essa è a priori nel senso astratto e preciso dato a questo termine dal Laplace. Operativamente, conviene introdurla, nella didattica, dopo aver fissato la particolare partizione i cui elementi (casi) siano giudicati ugualmente possibili; cioè, non più distinguibili per la ignoranza intrinsecamente connessa al grado di accuratezza dell’esperimento richiesto.

Da un punto di vista delle applicazioni concrete, e fino a quando ci muoviamo nell’ambito di classi finite (di eventi) l’assiomatica del Kolmogorov, non consente di ottenere nulla di più che non sia già dato dal calcolo delle probabilità del Peano-Laplace.

La differenza più forte tra le due formulazioni risiede (come assai spesso accade) nella scelta e nell’interpretazione degli assiomi, su questo piano le due formulazioni sono affatto inconciliabili. L’una, quello di Peano-Laplace, procede per astrazioni successive dai modelli fisici concepibili attraverso una serie incessante di applicazioni. La sua ossatura semantica è senz’altro di natura empirico formale in cui l’aspetto intuito riveste un ruolo importante. L’altra, quella del Kolmogorov, incarna la nobiltà ascetica dell’assiomatica che nella ossessiva ricerca di liberare la scienza dall’empirico quotidiano, si abbatte su di esso in modo devastante. L’empirico formale è sostituito da un edificio complesso di relazioni assiomatiche il cui significato non sempre è facile da chiarire in riferimento a modelli fisici concreti (spesso per ammissione degli stessi autori). È duro a credersi come in un concetto, apparentemente innocuo, come quello di probabilità, che parrebbe direttamente scaturire dalle applicazioni concrete, possa celarsi l’eterna contrapposizione tra modi molto diversi di concepire la ricerca scientifica!

Bibliografia

[1] PAGANO A., G. Fis. 43 (2002) 99.

[2] Sono molto riconoscente al prof. Sebastiano Manciagli del Liceo Scientifico Statale “Archimede” di Acireale (CT) per gli ottimi suggerimenti e la disponibilità ad approfondire lo studio tra insegnati e colleghi.

[3] Altre possibili definizioni della probabilità: Frequentistica con le sue molte varianti (Fisher, Von Mises, De Finetti,…), Logica (Carnai, Popper,...), ecc.. sono, del resto, con le opportune interpretazioni, tutte compatibili con l’assiomatica del Kolmogorov.

[4] PEANO G., Sulla definizione di probabilità, Acc. Lincei, S. 5, V. XXI (1912) 429.

[5] Vedi A. PAGANO, op. cit. nota [1], pag. 102 e pag. 104 e riferimenti ivi contenuti.

[6] La formulazione è del 1932; ma qui ci riferiamo a alla traduzione in lingua inglese: A. N. KOLMOGOROV, Foundations of the Theory of Probability, (Chelsea Pu. Co., 1956).

[7] La definizione di campo corrisponde qui alla definizione data da Hausdorff (come precisato in nota da Kolmogorov: Un sistema di insiemi costituisce un campo se la somma, il prodotto e la differenza di due insiemi del sistema appartengono allo stesso sistema. Ogni campo non vuoto contiene l’insieme vuoto.

[8] Si è preferito adottare la convenzione del Feller, esposta in W. FELLER, An introduction to Probability Theory and its Applications, III Edition Vol. 1 (John Wiley & Sons, Inc. New York, London, Sydney, 1967) pag. 115, piuttosto che quella originaria del Kolmgorov.

[9] Per la discussione di questo capitolo ho attinto liberamente dagli appunti di Lezioni di Didattica della Fisica, Scuola di Specializzazione in Fisica Università di Catania A. A. 1980-1981, non pubblicati, e di Fisica Superiore, Corso di laurea in Fisica Università di Catania A.A. 1990-1991, non pubblicati, discussi in aula dal compianto docente Chi.mo Prof. Salvatore Notarrigo (1929-1998) ordinario di Fisica Generale dell’Università di Catania (vedi: In ricordo di Salvatore Notarrigo, Atti del XVIII Congresso Nazionale di Storia della Fisica e Dell’Astronomia, Como 15-16 Maggio 1998, a cura di P. Tucci, (Ed. Istituto Fisica Generale e Applicata, Sez. Storia della Fisica - Università di Milano, 1999) pag. 79).

Chi scrive ha avuto il privilegio di essere stato suo allievo e poi suo collaboratore per molti anni.

[10] BUNGE M., A Mathematical Theory of theDimensions and Units of Physical Quantities, in Foundations and Philosophy of Science, Montreal/Canada, Spring 1971 (Unit McGill University, 1971) pag. 1, ISBN3-540-05490-1.

[11] In realtà questa non è la sola forma possibile e al lettore non sfuggirà il fatto che, in fin dei conti, la struttura formale, potrebbe essere interpretata da un’algebra di Boole, resa isomorfa al reticolo dei sottoinsiemi di E (come del resto, siamo autorizzati a pensare dopo l’esplicito riferimento alla definizione di campo di Hausdorff (1927), come suggerito dallo stesso Kolmogorov in una nota).

[12] Così , ad esempio, si esprime il Popper <<... Un altro dei miei motivi per scrivere questa nota era che volevo mostrare che quella che nel mio libro avevo chiamato “probabilità logica” è l’interpretazione logica di una “probabilità assolutà”, cioè a dire di una probabilità P(x,y) dove y è tautologica ……Quando scrissi questa nota non conoscevo il libro di Kolmogorov “Foundations of Probability”, che pure era stato pubblicato in tedesco nel 1933. Kolmogorov si proponeva scopi molto simili ai miei, ma il suo sistema è meno “formale” del mio, e perciò è suscettibile di un numero minore di interpretazioni……>>, KARL R. POPPER, Logica della scoperta scientifica, Appendice II, Nota sulla probabilità, 48 (Biblioteca Einaudi, 2002) pag. 352.

[13] Il Feller avverte probabilmente la difficoltà ed escogita una via di uscita a dir poco rocambolesca: <<For stylistic clarity probabilities in the original sample space are sometimes called absolute probabilities in contradistinction to conditional ones. Strictly speaking, the adjective “absolute” is redundant and will be omitted>>. W. FELLER, An introduction to Probability Theory and its Applications, III Edition, VoI. 1 (John Wiley & Sons, Inc. New York, London, Sydney, 1967) pag. 116.

[14] Mi limito ad osservare, cosa che certo non può sfuggire al lettore interessato a questo tipo di studi, che non pare giustificato restringere la struttura formale del Kolmogorov ai campi di insiemi. In fondo, l’assioma 2.14 si limita a dire che P(A) è un numero reale, con la sola condizione necessaria, data dall’assioma 2.15, che stabilisce l’unità di misura della grandezza probabilità. Pertanto la probabilità del Kolmogorov apre la strada a qualunque cosa possa obbedire agli assiomi della moderna teoria della misura.

[15] Vedi A. PAGANO op. cit. nota [1], pag. 101.

[16] Diamo un semplice esempio: assumendo gli assiomi 2.12-2.16 e la continuità 2.17, immaginiamo che la nostra collezione E sia costituita da tutti i punti della retta reale (eventi elementari). Si pongano i punti equiprobabili. Poiché deve porsi P(E) = 1 (per l’aasioma 2.15), ne segue che per un qualunque segmento finito di retta A , comunque grande, si deve avere P(A) = 0; lo spazio di probabilità avrà solo due tipi di eventi, gli eventi finiti con probabilità 0, e gli eventi infiniti con probabilità 1.