Probabilità: assiomatiche a confronto

 

A. Pagano

 

Pre-print a cura dell’autore. Originale pubblicato su: GIORNALE DI FISICA VOL. XLIII, N. 4,  Ottobre‑Dicembre 2003.    DOI 1O.1393/gdf/i2003-10009-9

 

 

INFN & Dipartimento di Fisica e di Astronomia dell’Università di Catania

 

 

1. Introduzione

 

Una mia breve nota dal titolo [1]: “Sul concetto di probabilità classica” ha susci­tato interesse e curiosità tra insegnanti. Ciò mi ha convinto ad estendere alcune considerazioni che, in quella nota, furo­no semplicemente accennate. Infatti, il mio scopo era quello di richiamare la formulazione di Giuseppe Peano (1912) sul concetto di probabilità classica o a prio­ri. Ma dovetti dare un cenno, per com­pletezza di esposizione, alla formulazione del Kolmogorov (1932) che rappresenta, come è noto, il riferimento base più mo­derno per studi o per esposizioni didattiche sul concetto di probabilità. Nel far ciò accennai ad alcune osservazioni che la forma, troppo concisa, può far appa­rire come dogmatiche [2]. Ad esempio, scrissi tra l’altro: “… , fino a quando ci muoviamo nell’ambito di insiemi fini­ti di classi (di eventi), e cioè nella mag­gioranza dei problemi pratici, la struttu­ra probabilistica dei Kolmogorov, con gli opportuni riferimenti a possibili model­li concreti, non apporta nulla di sostan­zialmente nuovo rispetto all’impostazione classica o laplaciana, se si astrae dalla diversa impostazione assiomatica...”. E ciò, effettivamente, senza altri commenti può aver suscitato legittime perplessità. Vorrei meglio chiarire in questa nota quei punti di confronto servendomi di alcune semplici considerazioni. Pur riferendomi essenzialmente a quanto già esposto in nota [1] preferisco discutere l’argomento in modo auto consistente. Pertanto, nel­la sezione 2, richiamerò i punti essenziali delle due assiomatiche che metto a con­fronto, quella di Laplace-Peano e quella di Kolmogorov. Nella sezione 3 dedurrò delle conclusioni che spero possano essere di una qualche utilità.

 

 

2. Assiomatiche a confronto

 

Sono utili le seguenti premesse:

2.0 Il simbolo É interposto tra due classi si legge “implica” oppure “contiene”.

2.1 I simboli “A ,B, C,…” indica­no classi o insiemi (la classe vuota si indica con il simbolo Æ).

2.2 I simboli x, y, z ,… a, b, c … x , h, z , indicano elementi.

2.3 La proposizione: “x è un elemento di A”, si scrive nel modo usuale: x Î A.

2.4 La “classe degli A che sono anche dei B”, si scrive AB.

2.5 La classe dei B oppure dei C, si scrive C.

2.6 Valgono tutti i teoremi del calcolo delle classi e della teoria dei numeri.

2.7 Se gli elementi di una classe A sono in numero finito, tale numero lo si indica con Num(A).

 

Definizione di probabilità secondo Peano­-Laplace [4].

 

2.8 Siano A e B delle classi. Il numero di elementi della classe A sia finito.

2.9 La probabilità degli A che sono B, che indichiamo con la scrittura P(B, A), vale

 

 

che si legge: Se A e B sono classi, e il numero degli individui della classe A è finito, allora il simbolo P(B, A) vale il numero degli A che sono B, diviso per il numero totale degli A. Utilizzando il linguaggio comune si potrà dire: se A è la classe dei ca­si possibili, che si suppongono in nu­mero finito, e B è la classe dei casi favorevoli, col simbolo P(B, A), che si legge: probabilità dell’avvenimento B fra gli avvenimenti A, si intende il rapporto fra il numero dei casi pos­sibili, che sono favorevoli, al numero totale dei casi possibili. I teoremi fon­damentali sulle probabilità assumono forma semplicissima come pure le loro dimostrazioni [5].

 

Definizione di probabilità secondo Kolmo­gorov [6].

 

Se assimiliamo il termine Classe del Peano con il termine Insieme usato dal Kolmogorov, valgono le premesse 2.1-2.7. Inoltre, riassumendo, quasi per intero la parte introduttiva dell’opera del Kol­mogorov e seguendone l’impostazione si pongono le seguenti due definizioni:

2.10 Sia E una collezione di elementi che chiameremo eventi elementari.

2.11 Sia Γ un insieme di sottoinsiemi di E; gli elementi dell’insieme Γ li chiameremo eventi casuali.

E si danno i seguenti postulati:

2.12 Γ è un campo [7] di insiemi A.

2.13 Γ contiene l’insieme E.

2.14 A ciascun insieme A è assegnato un numero reale non-negativo P(A). Tale numero si dice la probabilità dell’evento A.

2.15 P(E) = 1.

2.16 Se AB Æ, deve essere: P(A+B) = P(A) + P(B).

Seguendo il Kolmogorov, un sistema di insiemi, Γ, insieme con una definita as­segnazione di numeri P(A), che soddisfi gli assiomi 2.12-2.16, sarà chiamato un campo di probabilità.

Dopo aver definito il campo di pro­babilità, Kolmogorov estende la sua for­mulazione, valida fino a quel punto per insiemi finiti di eventi, in modo da inclu­dere anche insiemi infiniti; e per fare ciò pone il seguente assioma di continuità:

2.17 Per una successione decrescente di eventi: A1 É A2 ÉÉ An É di Γ, per cui si abbia, A1 A2…AnÆ, deve valere la condizione:

 

            lim P(An) = 0.

n®¥

 

 

Kolmogorov, chiarisce che la posizio­ne 2.17 segue banalmente dalle prece­denti 2.12-2.16 nel caso che il campo Γ sia finito, ed osserva, molto oppor­tunamente, che solo nel caso di cam­pi infiniti l’assioma è logicamente in­dipendente dai precedenti. Pertanto, senz’altro aggiungere, definisce cam­po di probabilità generalizzato un si­stema che includa l’assioma 2.17 tra gli assiomi della probabilità.

La parte fondamentale ed intro­duttiva viene completata definen­do l’ulteriore concetto di probabi­lità condizionale, con la seguente posizione:

2.18 Se P(A) > 0, allora il rapporto

 

 

si chiama probabilità condizionale [8] degli eventi B sotto la condizione o l’ipotesi A. Compare dunque, il sim­bolo a due variabili che, invece, è esplicitamente introdotto dal Peano ab inizio nella sua definizione.

 

 

3. Confronto tra le due impostazio­ni [9]

 

Dalle definizioni sopra accennate, so­no deducibili le seguenti osservazioni che danno un’idea precisa della differenza sia di sostanza che di forma tra le due formulazioni:

i) Nella definizione 2.9 di Laplace­-Peano la probabilità, essendo per defini­zione un rapporto numerico che si asse­gna ad una classe rispetto ad una classe di riferimento, viene derivata dalla teo­ria delle classi e dalla teoria dei numeri (aritmetica, analisi, ecc.) senza più ag­giungere assiomi particolari. La probabi­lità è una pura definizione e non ha biso­gno di ulteriori postulati. In quanto gran­dezza misurabile, fa parte integralmente della teoria delle grandezze fisiche [10]. Nella proposta di Kolmogorov si parte in­vece dagli individui (elementi), come si vede da 2.10, pertanto è assolutamente necessario fornire assiomi ulteriori nella forma, ad esempio, 2.12 e 2.13  [11].

ii) La probabilità del Peano-Laplace è per definizione sempre una grandez­za relativa e si nega esplicitamente che possa avere un qualche senso la nozio­ne di probabilità assoluta. Ad esempio, l’assioma 2.15 di Kolmogorov, diventa, nella formulazione del Peano, il teorema banale,

 

 

All’interno della teoria classica del Laplace-Peano non ha alcun senso la ul­teriore specializzazione di probabilità con­dizionali (come data dalla 2.18). Sem­plicemente, se vogliamo utilizzare un lin­guaggio vicino alle moderne impostazio­ni, la probabilità del Peano è sempre, per definizione, una probabilità condizionale. Naturalmente, se le formule vanno intese per quello che realmente esprimono (cioè oggettivamente), anche la probabilità del Kolmogorov (assiomi 2.12-2.17) è relati­va, perché, per definizione, la si calcola sempre in riferimento con l’insieme co­stante, E; cioè si conviene una volta per tutte, che ogni altra probabilità deve es­sere ad essa riferita (assioma di norma­lizzazione 2.15). Ma, come già osserva­to in nota [1], ciò può dare l’illusione che si possa parlare di probabilità asso­luta [12]. Nei libri di testo (ovviamente a partire dal testo di Kolmogorov cita­to), si suole definire le probabilità con­dizionale dopo quella introdotta con gli assiomi 2.12-2.17, che per contrasto do­vrebbe chiamarsi assoluta, se a ciò non si opponesse il fatto che l’idea di una qual­che probabilità assoluta porterebbe a non pochi problemi interpretativi [13]. Neces­sariamente, la nuova definizione produce un oggetto che obbedisce a tutti i postu­lati della probabilità precedentemente in­trodotti, e dunque, ne segue tutti i teo­remi. Per esempio, la fondamentale rela­zione della probabilità che si abbia un A o un B sotto la condizione H, vale

 

P(AUB, H) = P (A, H) + P (B, H) - P (A B, H).

 

In sostanza, se nella 2.18 si sostituisce semplicemente il simbolo P(..) con il sim­bolo Num(..) , si ottiene, formalmente, la definizione 2.9 del Peano. Ovviamente, i due simboli risultano interscambiabili so­lo nel caso di campi finiti di probabilità, a conferma di quanto precedentemente as­serito che, nel caso di campi finiti di insie­mi, la formulazione del Kolmogorov non contiene nulla di più rispetto a quella di Lapalce-Peano. Mentre, non è, eviden­temente possibile fare ulteriori confronti tra le due teorie nel caso di campi di pro­babilità generalizzati per un sistema che includa l’assioma 2.17 [14].

iii) Assumendo il punto di vista sopra esposto che la formulazione del Kolmo­gorov non differisce da quella del Peano-­Laplace (dove sono confrontabili), sem­bra allora, del tutto lecito supporre che lo scopo (evidentemente, non dichiarato esplicitamente) degli assiomi 2.12-2.16 sia da ricercare nella necessità di preparare, per così dire, la strada per la successiva asserzione dell’assioma 2.17 (assioma VI del Kolmogorov) che, invocando l’esisten­za di classi infinitesime apre la strada ai reticoli non atomici. Resta comunque il fatto che lo stesso Kolmogorov [15], di­chiara il significato dell’assioma 2.17 di continuità essere “. . . almost impossibile to elucidate...” in relazione a modelli concreti [16].

In conclusione, ribadendo quanto già precedentemente affermato in nota [1], la formulazione del Laplace-Peano, che chiamiamo classica o a priori è un’appli­cazione fisica di concetti già noti di teoria dei numeri e delle classi. Essa è oggettiva, cioè essa è a priori nel senso astratto e preciso dato a questo termine dal Lapla­ce. Operativamente, conviene introdur­la, nella didattica, dopo aver fissato la particolare partizione i cui elementi (ca­si) siano giudicati ugualmente possibili; cioè, non più distinguibili per la ignoran­za intrinsecamente connessa al grado di accuratezza dell’esperimento richiesto.

Da un punto di vista delle applicazio­ni concrete, e fino a quando ci muovia­mo nell’ambito di classi finite (di eventi) l’assiomatica del Kolmogorov, non con­sente di ottenere nulla di più che non sia già dato dal calcolo delle probabilità del Peano-Laplace.

La differenza più forte tra le due for­mulazioni risiede (come assai spesso ac­cade) nella scelta e nell’interpretazione degli assiomi, su questo piano le due formulazioni sono affatto inconciliabili. L’una, quello di Peano-Laplace, proce­de per astrazioni successive dai modelli fisici concepibili attraverso una serie in­cessante di applicazioni. La sua ossatura semantica è senz’altro di natura empiri­co formale in cui l’aspetto intuito rive­ste un ruolo importante. L’altra, quella del Kolmogorov, incarna la nobiltà asce­tica dell’assiomatica che nella ossessiva ricerca di liberare la scienza dall’empirico quotidiano, si abbatte su di esso in modo devastante. L’empirico formale è sosti­tuito da un edificio complesso di relazioni assiomatiche il cui significato non sempre è facile da chiarire in riferimento a mo­delli fisici concreti (spesso per ammissio­ne degli stessi autori). È duro a creder­si come in un concetto, apparentemente innocuo, come quello di probabilità, che parrebbe direttamente scaturire dalle ap­plicazioni concrete, possa celarsi l’eterna contrapposizione tra modi molto diversi di concepire la ricerca scientifica!

 

 

Bibliografia

 

[1] PAGANO A., G. Fis. 43 (2002) 99.

[2] Sono molto riconoscente al prof. Seba­stiano Manciagli del Liceo Scientifico Sta­tale “Archimede” di Acireale (CT) per gli ottimi suggerimenti e la disponibilità ad approfondire lo studio tra insegnati e colleghi.

[3] Altre possibili definizioni della probabi­lità: Frequentistica con le sue molte va­rianti (Fisher, Von Mises, De Finetti,…),   Logica (Carnai, Popper,...), ecc.. sono, del resto, con le opportune interpretazio­ni, tutte compatibili con l’assiomatica del Kolmogorov.

[4] PEANO G., Sulla definizione di probabilità, Acc. Lincei, S. 5, V. XXI (1912) 429.

[5] Vedi A. PAGANO, op. cit. nota [1], pag. 102 e pag. 104 e riferimenti ivi contenuti.

[6] La formulazione è del 1932; ma qui ci ri­feriamo a alla traduzione in lingua ingle­se: A. N. KOLMOGOROV, Foundations of the Theory of Probability, (Chelsea Pu. Co., 1956).

[7] La definizione di campo corrisponde qui alla definizione data da Hausdorff (come preci­sato in nota da Kolmogorov: Un sistema di insiemi costituisce un campo se la somma, il prodotto e la differenza di due insiemi del sistema appartengono allo stesso sistema. Ogni campo non vuoto contiene l’insieme vuoto.

[8] Si è preferito adottare la convenzione del Feller, esposta in W. FELLER, An intro­duction to Probability Theory and its Ap­plications, III Edition Vol. 1 (John Wi­ley & Sons, Inc. New York, London, Syd­ney, 1967) pag. 115, piuttosto che quella originaria del Kolmgorov.

[9] Per la discussione di questo capitolo ho at­tinto liberamente dagli appunti di Lezioni di Didattica della Fisica, Scuola di Specia­lizzazione in Fisica Università di Catania A. A. 1980-1981, non pubblicati, e di Fi­sica Superiore, Corso di laurea in Fisica Università di Catania A.A. 1990-1991, non pubblicati, discussi in aula dal compian­to docente Chi.mo Prof. Salvatore Notarri­go (1929-1998) ordinario di Fisica Generale dell’Università di Catania (vedi: In ricor­do di Salvatore Notarrigo, Atti del XVIII Congresso Nazionale di Storia della Fisi­ca e Dell’Astronomia, Como 15-16 Maggio 1998, a cura di P. Tucci, (Ed. Istituto Fisica Generale e Applicata, Sez. Storia della Fi­sica - Università di Milano, 1999) pag. 79).

Chi scrive ha avuto il privilegio di essere stato suo allievo e poi suo collaboratore per molti anni.

[10] BUNGE M., A Mathematical Theory of theDimensions and Units of Physical Quan­tities, in Foundations and Philosophy of Science, Montreal/Canada, Spring 1971 (Unit McGill University, 1971) pag. 1, ISBN3-540-05490-1.

[11] In realtà questa non è la sola forma possi­bile e al lettore non sfuggirà il fatto che, in fin dei conti, la struttura formale, potrebbe essere interpretata da un’algebra di Boole, resa isomorfa al reticolo dei sottoinsiemi di E (come del resto, siamo autorizzati a pen­sare dopo l’esplicito riferimento alla defini­zione di campo di Hausdorff (1927), come suggerito dallo stesso Kolmogorov in una nota).

[12] Così , ad esempio, si esprime il Popper <<... Un altro dei miei motivi per scrivere questa nota era che volevo mostrare che quella che nel mio libro avevo chiamato “probabilità logica” è l’interpretazione logi­ca di una “probabilità assolutà”, cioè a dire di una probabilità P(x,y) dove y è tautolo­gica ……Quando scrissi questa nota non conoscevo il libro di Kolmogorov “Founda­tions of Probability”, che pure era stato pubblicato in tedesco nel 1933. Kolmogorov si proponeva scopi molto simili ai miei, ma il suo sistema è meno “formale” del mio, e perciò è suscettibile di un numero minore di interpretazioni……>>, KARL R. POPPER, Logica della scoperta scientifica, Appendi­ce II, Nota sulla probabilità, 48 (Biblioteca Einaudi, 2002) pag. 352.

[13] Il Feller avverte probabilmente la difficoltà ed escogita una via di uscita a dir poco ro­cambolesca: <<For stylistic clarity probabi­lities in the original sample space are some­times called absolute probabilities in con­tradistinction to conditional ones. Strictly speaking, the adjective “absolute” is redun­dant and will be omitted>>. W. FELLER, An introduction to Probability Theory and its Applications, III Edition, VoI. 1 (John Wiley & Sons, Inc. New York, London, Sydney, 1967) pag. 116.

[14] Mi limito ad osservare, cosa che certo non può sfuggire al lettore interessato a questo tipo di studi, che non pare giustificato restringere la struttura formale del Kolmogo­rov ai campi di insiemi. In fondo, l’assioma 2.14 si limita a dire che P(A) è un numero reale, con la sola condizione necessaria, data dall’assioma 2.15, che stabilisce l’unità di misura della grandezza probabilità. Per­tanto la probabilità del Kolmogorov apre la strada a qualunque cosa possa obbedire agli assiomi della moderna teoria della misura.

[15] Vedi A. PAGANO op. cit. nota [1], pag. 101.

[16] Diamo un semplice esempio: assumendo gli assiomi 2.12-2.16 e la continuità 2.17, immaginiamo che la nostra collezione E sia costituita da tutti i punti della retta reale (eventi elementari). Si pongano i punti equiprobabili. Poiché deve porsi P(E) = 1 (per l’aasioma 2.15), ne segue che per un qualunque segmento finito di retta A , co­munque grande, si deve avere P(A) = 0; lo spazio di probabilità avrà solo due tipi di eventi, gli eventi finiti con probabilità 0, e gli eventi infiniti con probabilità 1.