Funzione di distribuzione

Nella teoria della probabilità , la funzione di distribuzione , o funzione di distribuzione cumulativa , di una variabile casuale reale X è la funzione F X che, a qualsiasi x reale , associa la probabilità di ottenere un valore minore o uguale:

.

Questa funzione è caratteristica della legge di probabilità della variabile casuale . Permette di calcolare la probabilità di ogni intervallo semiaperto a sinistra] a, b] dove a <b, by

.

La funzione di distribuzione di una misura di probabilità definita sulla tribù boreliana è la funzione F che a qualsiasi x reale si associa

Prime proprietà

La funzione di distribuzione di una variabile casuale reale è sempre crescente, continua a destra, con un limite zero in e un limite pari a 1 in .

Al contrario, qualsiasi funzione definita e che soddisfi queste quattro proprietà è la funzione di distribuzione di una variabile casuale.

Esempi di calcoli della funzione di distribuzione

Variabili di densità

La cdf F X di una variabile casuale X di densità di probabilità f X è un primitivo (in un senso piuttosto rilasciato, vedi sotto) di questa densità f X . Più precisamente, F X è definito, per ogni numero reale x , da:

Tuttavia, non è, in generale, un primitivo nel senso stretto del termine: si può solo affermare:

Ma ci sono molti “controesempi”: la funzione di distribuzione della legge uniforme su un intervallo, o quella della legge esponenziale , non sono differenziabili su tutto e quindi non sono, in senso stretto, primitive di densità di probabilità.

Si noti che, a differenza delle variabili discrete, la variabile di densità X controlla qualsiasi numero reale ha  : di conseguenza, la funzione di distribuzione della variabile di densità è continua in ogni punto. Infatti una variabile casuale reale X ha una densità di probabilità se e solo se la sua funzione di distribuzione è assolutamente continua su ogni intervallo limitato.

Variabili discrete

Una variabile casuale X si dice discreta se il suo supporto S è finito o numerabile , o, in modo equivalente, se esiste un insieme finito o numerabile A come:

La legge di X è determinata in modo univoco dai dati di ( p s ) s ∈ S o di ( p s ) s ∈ A , dove

Se, ad esempio, X è una variabile casuale reale , noi

dove 1 E è la funzione dell'indicatore del set E.

Per le variabili casuali discrete più comuni (ad esempio, le distribuzioni uniforme , binomiale , di Poisson ) S è un insieme ben ordinato  : possiamo quindi numerare i suoi elementi in modo crescente, pe s 1 ≤ s 2 ≤ s 3 ≤ ... e rinumerare la probabilità p s conseguenza, ad esempio mettendo p i = p s i , i ≥ 1 . Allora abbiamo, se x ∈ [ s i , s i + 1 [ ,

O, più in generale:

La funzione di distribuzione è quindi una funzione costante per intervalli e la sua rappresentazione grafica è a gradini . I salti da un gradino all'altro della scala si trovano sull'ascissa s i , e l'ampiezza del salto delle ascisse s è p s = F X ( s ) - F X ( s - ) . In particolare la funzione di distribuzione di una variabile discreta X è discontinua esattamente in punti s come Vedere la sezione Proprietà della funzione di distribuzione per una dimostrazione.

Caso speciale: funzione di distribuzione continua puramente singolare

La scala Cantor F è un esempio di funzione di distribuzione continua, ma la cui derivata è quasi ovunque nulla. Pertanto, le formule precedenti non sono più valide per la scala Cantor: ad esempio per x > 0 , non abbiamo

,

perché F assume valori strettamente positivi su ] 0, + ∞ [ , mentre l'integrale che costituisce il lato destro è identicamente zero. Anzi, il tutto

è di misura Lebesgue zero. Inoltre, la legge di probabilità associata alla scala di Cantor è diffusa (senza atomo), poiché F è una funzione continua su . La scala di Cantor è infatti un esempio di funzione di distribuzione continua ma che non è assolutamente continua su ogni intervallo: diciamo quindi che è puramente singolare continua.

Proprietà della funzione di distribuzione

Proprietà caratteristiche

Teorema  -  La funzione di distribuzione di una variabile casuale X ha le seguenti proprietà caratteristiche:

  1. F X sta aumentando  ;
  2. È ovunque continuo a destra;
  3.  ;
Dimostrazione

Il punto 1 deriva dalla proprietà di crescita delle misure di probabilità

Poiché F X è una funzione monotona , il punto 2 si riduce per dimostrarlo

o, equivalentemente,

Ma i Boreliani ] –∞, x +1/non[ formano una sequenza decrescente, e

quindi il punto 2 è una conseguenza degli assiomi delle probabilità . Poiché F X è monotono, il punto 3 può essere ridotto per dimostrarlo

Anche questa è una conseguenza degli assiomi delle probabilità , da allora

Il punto 4 segue, allo stesso modo, da

Come abbiamo detto, i punti da 1 a 4 sono caratteristici della funzione di distribuzione di una variabile casuale reale X  : data una funzione reale della variabile reale, indicata con F , soddisfacendo i punti da 1 a 4, possiamo costruire concretamente una variabile casuale reale X avente F per la funzione di distribuzione, vedi sotto il teorema del reciproco . Si noti che la costruzione che utilizza il teorema inverso viene utilizzata concretamente per produrre, su un computer, campioni di dimensioni arbitrarie con una legge di probabilità arbitraria, che è l'ingrediente di base dei metodi Monte-Carlo .

Nota

Possiamo quindi definire la nozione di funzione di distribuzione senza introdurre quella di variabile aleatoria: basta solo che soddisfi i precedenti punti da 1 a 4. Se a questo aggiungiamo la nozione di funzione aritmetica , arriviamo rapidamente alla teoria probabilistica dei numeri .

Altre proprietà

A causa dei punti 1, 3 e 4, F X è limitato, più precisamente

Come ogni funzione monotona limitata, F X ammette in qualsiasi punto x un limite sinistro F X ( x - ) , limite sinistro uguale o meno a F X ( x ) a seconda che F X sia continuo in x oppure no. F X è una funzione càdlàg .

La conoscenza della funzione di distribuzione consente di calcolare la probabilità di qualsiasi intervallo

e

Dimostrazione

Le ultime 5 proprietà derivano da per diverse scelte di A e B  :

Chiamiamo atomo della variabile casuale X una reale una per la quale . Quindi, in virtù dell'ultima proprietà nell'elenco sopra,

Proprietà  -  Gli atomi della variabile casuale X sono esattamente i punti di discontinuità della funzione di distribuzione.

La funzione di distribuzione di una variabile casuale X è quindi continua se e solo se X non ha atomi, cioè se e solo se

Diciamo quindi che la legge di X è diffusa , o senza atomo , e, per estensione, che la stessa variabile casuale X è diffusa o senza atomo . In particolare, le variabili casuali reali con densità di probabilità sono diffuse. Esistono, tuttavia, variabili aleatorie diffuse che non hanno una densità di probabilità, ad esempio con la variabile casuale la cui funzione di distribuzione è la scala di Cantore .

Si noti che l'insieme dei punti di discontinuità di F X è finito o numerabile , come nel caso di qualsiasi funzione monotona limitata:

Conseguenza  -  L'insieme S di atomi della variabile casuale X è finito o numerabile .

Caratterizzazione della legge dalla funzione di distribuzione

Teorema  -  La legge di probabilità di una variabile casuale reale è caratterizzata dalla sua funzione di distribuzione.

O ancora: se due variabili casuali reali hanno la stessa funzione di distribuzione, allora hanno la stessa legge (e viceversa).

Dimostrazione

Nell'ipotesi F X = F Y , possiamo dimostrare in modo elementare che non appena A è un Boreliano "semplice" (ad esempio, se A è un intervallo). D'altra parte, la dimostrazione generale (per ogni A boreliano ) è un caso particolare dell'unicità del lemma delle probabilità , esso stesso un corollario del lemma della classe monotonica , applicato alla classe

È necessario verificarlo

  1. la classe è stabile per intersezione finita,
  2. la tribù generata da contiene (ed in effetti è uguale a) la tribù Boreliana .

Il lemma di unicità delle probabilità ci permette quindi di concludere.

Verifichiamo 1. Sia io un sottoinsieme finito di . È l'elemento minimo di I . Allora

Controlliamo 2. La tribù generata da è annotata . La tribù boreliana è nota , come spesso. Nota

Abbiamo in virtù della stabilità delle tribù passando al complementare, quindi per definizione di tribù generata . Possiamo scambiarci e in quanto precede, quindi, per doppia inclusione,

Poiché fa parte della serie di aperture, lo deduciamo

Ma dobbiamo soprattutto dimostrare l'inclusione nella direzione opposta e, per questo, dimostrare che tutto ciò che è aperto di è in (quindi è una tribù contenente tutte le aperture di , mentre è la tribù più piccola contenente tutte le aperture di ). Un argomento veloce è notare che

Il primo punto risulta dal fatto che

Il secondo punto è quello

CQFD

In altre parole, se due variabili casuali reali, X e Y , soddisfano

quindi controllano anche che per qualsiasi A boreliano ,

Inoltre, controllano che per qualsiasi funzione misurabile φ ,

non appena uno dei due termini di uguaglianza ha un significato.

Teorema di reciprocità

Sia F una funzione di nel soddisfare le 4 proprietà caratteristiche. Indichiamo con G la funzione definita per ω ∈] 0; 1 [ di

Allora G è una variabile casuale reale definita sullo spazio probabilizzato dove e dove denota la restrizione a della misura di Lebesgue su . Il teorema afferma che:

Teorema  -  Nello spazio , la funzione di ripartizione G è F .

Quindi qualsiasi funzione F di nel soddisfare le quattro proprietà caratteristiche è una funzione della distribuzione di una variabile casuale reale (di G , per esempio), o anche di una misura di probabilità su (della legge di G , per esempio).

Dimostrazione

Per ω ∈ Ω =] 0; 1 [ , nota

Quindi G ( ω ) = inf A ω . A causa del punto 4 ,, e per il punto 3, A ω è limitato al di sotto, quindi G è ben definito.

Cominciamo con un semplice caso di formazione:

F è strettamente crescente continuo

Se F è continuo strettamente crescente oltre , allora F è una biiezione da in ] 0; 1 [ , e G è il reciproco di F (possiamo esserne convinti tracciando A ω usando il grafico di F ). In quanto tale, G è continuo e strettamente crescente oltre ] 0; 1 [ , e in particolare G è misurabile (è quindi una var). Abbiamo anche

pertanto

In tal modo

Caso generale

Nel caso generale, abbiamo anche

e quindi concludiamo esattamente nello stesso modo di prima, ma la dimostrazione dell'equivalenza di cui sopra è meno diretta. Primo, per ω ≤ ω ' , A ω' ⊂ A ω , e quindi G ( ω ) ≤ G ( ω ' ) . Poiché G è monotono, ne consegue che G è misurabile.

Abbiamo, per definizione di A ω e G ( ω ) ,

Il contrario deriva dal fatto che { G ( ω ) ∈ A ω } , cioè { ω ≤ F ( G ( ω ))} , che con { G ( ω ) ≤ x } comporta, per crescita di F , { F ( G ( ω )) ≤ F ( x )} , e infine { ω ≤ F ( x )} . Supponiamo infatti che G ( ω ) ∉ A ω , e consideriamo una successione strettamente decrescente ( x n ) n ≠ 0 di elementi di A ω tale che

Per continuità a destra di F ,

ma anche, per definizione di A ω ,

che porta a G ( ω ) ∈ A ω , quindi una contraddizione (dimostrazione ampiamente presa da Sidney Resnick, A Probability Path ).

Osservazioni.

Conseguenze del teorema inverso

Simulazione di variabili aleatorie reali di distribuzione arbitraria

Se U denota una variabile casuale reale uniforme su [0; 1] , allora X = G ( U ) ha la funzione di distribuzione F .

Quindi in qualsiasi linguaggio di programmazione che abbia un generatore di numeri casuali, si può simulare una sequenza di lunghezza arbitraria di variabili indipendenti della stessa funzione di distribuzione F , a condizione che G sia noto: è quindi sufficiente chiamare ripetutamente questo generatore, e applicare la G funzione ai numeri prodotti da queste chiamate ripetute.

Esempi

Esempi
densità di probabilità funzione di distribuzione reciproco (generalizzato) codificato
Legge di Cauchy
Legge esponenziale
Legge uniforme su [ a , b ]
Legge di Bernoulli
Legge uniforme su {1,2, ..., n }
Distribuzione normale , distribuzione binomiale poiché non esiste una formula sufficientemente esplicita per la funzione di distribuzione, e ancor meno di una formula esplicita per il contrario di quest'ultima, il teorema è quindi inoperante.

Troverai tutto sull'arte di generare variabili casuali di leggi arbitrarie, ad esempio utilizzando variabili uniformi , in Non-Uniform Random Variate Generation , pubblicato da Springer, disponibile sul web.

Altre conseguenze del teorema inverso

Il contrario generalizzato di F è un esempio di var la cui funzione di distribuzione è F , ma è un ottimo esempio. I suoi usi sono numerosi, che vanno dalle proprietà dell'ordine stocastico , alle proprietà della distanza di Wasserstein  (in) , incluso il teorema di rappresentazione di Skorokhod , vedere la sezione successiva.

Convergenza nel diritto e funzione distributiva

Considera una sequenza di variabili casuali ( X n ) n ≥ 0 (risp. Una variabile casuale X ) definita su spazi probabilizzati (risp. ) Possibilmente differenti, ma tutte con valori nello stesso spazio metrico ( S , d ) . Diciamo che ( X n ) n ≥ 0 converge di diritto a X se, per ogni funzione continua limitata di ( S , d ) in ,

Abbiamo il seguente teorema:

Teorema  -  Nel caso di variabili casuali real ( ) includono ( F n ) n ≥ 0 , F distribuzioni funzioni ( X n ) n ≥ 0 e X . C'è quindi un'equivalenza tra le tre proposizioni seguenti:

  1. ( X n ) n ≥ 0 converge di diritto in X ,
  2. per ogni reale x in cui F è continua , ,
  3. esiste uno spazio probabilizzato , e, definite su questo spazio, variabili casuali reali ( X ' n ) n ≥ 0 e X' tali che, simultaneamente,
    1. X ' ha la stessa legge di X ,
    2. per ogni n , X n ' ha la stessa legge di X n ,
    3. ( X ' n ) n ≥ 0 converge quasi sicuramente a X' .

L'implicazione 1.⇒3. rimane vero quando le variabili casuali reali sono sostituite da variabili casuali con valori in uno spazio di Lusin ( S , d ) , cioè uno spazio metrizzabile abbastanza generale ( e ne sono esempi). L'implicazione 1.⇒3. quindi porta il nome di teorema di rappresentazione di Skorokhod .

Dimostrazione

Una possibile struttura per la dimostrazione è 3.⇒1.⇒2.⇒3.

3. implica 1.

Questa è la più semplice. Deve essere dimostrato che

o, equivalentemente,

Ma la continuità di f assicura che f ( X n ') converga quasi sicuramente in f ( X ') . Inoltre, | f | essendo limitati, ce l'abbiamo

per tutti n . Il teorema di convergenza dominata di Lebesgue può essere applicato qui e fornisce la conclusione desiderata.

1. implica 2.

Usiamo la famiglia delle funzioni continue limitate definite dal grafico a lato. Verificano, per qualsiasi variabile casuale reale Y ,

e specialmente

Notiamo quindi che, per ogni ε > 0 ,

e

Facendo tendere ε a 0, otteniamo

Quindi, non appena x è un punto di continuità di F ,

2. implica 3.

Nota ( G n ) n ≥ 0 , G , generalizzata reciproca ( F n ) n ≥ 0 , F . Per la terzina , scegli e prendi per la tribù dei Boreliani e la corrispondente misura di Lebesgue (cioè limitata a (0; 1) ). La scelta di X ' n = G n , X' = G soddisfa 3.1. e al 3.2. in virtù del teorema inverso . Inoltre, come risultato di 2, ( G n ) n ≥ 0 converge quasi sicuramente a G .

Note e riferimenti

  1. La versione pdf (gratuita e autorizzata) di (en) Luc Devroye , Non-Uniform Random Variate Generation , New York, Springer-Verlag ,1986, 1 °  ed. ( leggi online ) è disponibile, così come un resoconto umoristico dei litigi di Luc Devroye con il suo editore.
  2. [1]

Vedi anche

Articoli Correlati

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">