Capitolo 1 : Funzione di distribuzione cumulativa
Statisticamente e nell'ambito della probabilità, la funzione di distribuzione cumulativa (CDF) di una variabile casuale a valori reali , o semplicemente la funzione di distribuzione di , valutata a , è la probabilità che assumerà un valore minore o uguale a .
Ognuna delle distribuzioni di probabilità supportate da numeri reali, sia "mista" che "discreta" e "continua", è identificata in modo univoco da una funzione monotona crescente continua a destra (una funzione càdlàg) che soddisfa e .
Se la distribuzione è scalare e continua, allora, dà l'area sotto la funzione di densità di probabilità da meno infinito a .
Le variabili casuali multivariate possono anche avere le loro distribuzioni specificate per mezzo di funzioni di distribuzione cumulativa.
La funzione di distribuzione cumulativa di una variabile aleatoria a valori reali è la funzione data da: p.
77
dove il lato destro rappresenta la probabilità che la variabile casuale assuma un valore minore o uguale a .
La probabilità che giace nell'intervallo semichiuso , dove , è quindi: p.
84
Ciò che è definito sopra, indicatore di uguaglianza o disuguaglianza, "=", è un incontro formale, non un termine comunemente impiegato (ad es.
Il simbolo "") è comunemente usato nelle opere letterarie ungheresi, ma questa divergenza è cruciale.
Questa regola è fondamentale per l'interpretazione delle tabelle di distribuzione binomiale e di Poisson.
Inoltre, formule importanti come la formula di inversione di Paul Lévy per la funzione caratteristica si basano anche sulla formulazione "minore o uguale".
Se si trattano diverse variabili casuali , ecc.
I pedici sono formati utilizzando le lettere corrispondenti mentre, considerando la possibilità di doverne trattare una, è pratica comune omettere il pedice.
È convenzionale utilizzare un capitale per una funzione di distribuzione cumulativa, in contrasto con le minuscole utilizzate per le funzioni di densità di probabilità e le funzioni di massa di probabilità.
Questo vale quando si discute di distribuzioni generiche; alcune distribuzioni, tuttavia, hanno la loro notazione standard, per esempio la distribuzione normale usa e invece di e , rispettivamente.
Differenziando la funzione di distribuzione cumulativa utilizzando il teorema fondamentale del calcolo si ottiene la funzione di densità di probabilità di una variabile casuale continua; cioè
dato ,
fino a quando il derivato cessa di esistere.
La CDF di una variabile aleatoria continua può essere espressa come l'integrale della sua funzione di densità di probabilità come segue: p.
86
Nel caso di una variabile aleatoria la cui distribuzione ha una componente discreta ad un valore ,
Se è continuo in , questo è uguale a zero e non esiste alcuna componente discreta in .
Ogni funzione di distribuzione cumulativa non è decrescente: p.
79 che la rende una funzione càdlàg.
Inoltre
Qualsiasi funzione che soddisfi queste quattro condizioni è una funzione di distribuzione cumulativa (CDF), nel senso che qualsiasi variabile casuale può essere espressa in termini di essa.
Se è una variabile casuale puramente discreta, allora raggiunge valori con probabilità , e il CDF di sarà discontinuo nei punti :
Se la CDF di una variabile casuale a valori reali è continua, allora è una variabile casuale continua; se inoltre è assolutamente continua, allora esiste una funzione integrabile di Lebesgue tale che
per tutti i numeri reali e .
La funzione è uguale alla derivata di quasi ovunque, ed è chiamata funzione di densità di probabilità della distribuzione di .
Se ha una norma L1 finita, cioè l'aspettativa di è finita, allora l'integrale di Riemann-Stieltjes fornisce la previsione.
e per ogni ,
secondo l'illustrazione.
In questo ambito, abbiamo
A titolo illustrativo, supponiamo che sia distribuito uniformemente sull'intervallo unitario .
Allora il CDF di è dato da
Supponiamo invece che prenda solo i valori discreti 0 e 1, all'incirca alla stessa velocità.
Allora il CDF di è dato da
Supponiamo che sia distribuito in modo esponenziale.
Allora il CDF di è dato da
Qui ? > 0 è il parametro della distribuzione, comunemente indicato come costante di velocità.
Supponiamo che sia distribuito normalmente.
Allora il CDF di è dato da
Qui il parametro è la media o l'aspettativa della distribuzione; ed è la sua deviazione standard.
La tabella normale standard, nota anche come tabella normale unitaria o tabella Z, è una rappresentazione comunemente usata della funzione di distribuzione cumulativa (CDF) della distribuzione normale nella pratica statistica.
Supponiamo che sia binomiale distribuito.
Allora il CDF di è dato da
Qui è la probabilità di successo e la funzione denota la distribuzione discreta di probabilità del numero di successi in una sequenza di esperimenti indipendenti, ed è il "pavimento" sotto , cioè
Il numero intero più grande minore o uguale a .
Esaminare la frequenza con cui la variabile casuale è maggiore di una soglia può essere istruttivo a volte. La definizione di distribuzione di coda, nota anche come funzione di distribuzione cumulativa complementare (ccdf), è la seguente:
Questo può essere utilizzato per i test di ipotesi in statistica, ad esempio, perché la probabilità di vedere una statistica di test almeno altrettanto estrema di quella vista è ciò che misura il valore p unilaterale.
Quindi, assumendo la significatività statistica, T, distribuzione che è continua, il valore p unilaterale è semplicemente dato dal ccdf: per un valore osservato della statistica del test
In teoria, l'analisi della sopravvivenza, è chiamata funzione di sopravvivenza e denotata , sebbene la frase funzione di affidabilità sia ampiamente utilizzata nella comunità ingegneristica.
Proprietà
La disuguaglianza di Markov sostiene che per ogni variabile casuale continua che ha un'aspettativa e non è negativa,
Come , e di fatto a condizione che sia finito. Dimostrazione:Assumendo ha una funzione di densità , per ogni
Dopo un'ulteriore realizzazione
, riorganizzare i concetti,
come affermato.
Una distribuzione di probabilità con un'aspettativa associata,
poiché il secondo termine è sempre zero per le variabili casuali che non sono negative. Questo è come dire: "se la variabile casuale può accettare solo valori interi non negativi, allora
Mentre il grafico di una distribuzione cumulativa ha spesso una forma simile a S, la distribuzione cumulativa piegata, nota anche come grafico della montagna, è un altro esempio, che inverte la metà superiore del grafico, cioè
dove denota la funzione dell'indicatore e la seconda somma è la funzione del sopravvissuto, che impiega un sistema a doppia scala, due, una per l'inclinazione e una per il declino.
La mediana è evidenziata in questo stile di diagramma, la propagazione (più precisamente, deviazione mediana, asimmetria e dispersione sono tutti termini che si riferiscono alla dispersione dei dati o alla distribuzione dei risultati empirici.
Se il CDF F è strettamente crescente e continuo, allora è l'unico numero reale tale che .
La funzione quantilica, o il suo inverso, la funzione di distribuzione inversa, è così definita.
Alcune distribuzioni non hanno un'inversa univoca (ad esempio if for all , che causa una costante).
Qui, però, uno strumento comune è la funzione di distribuzione di probabilità inversa, vale a dire,
Esempio 1: la mediana è .
Esempio 2: Put .
Quindi chiamiamo il 95° percentile.
Nella definizione della funzione di distribuzione inversa generalizzata, la cdf inversa conserva molte delle sue qualità utili:
non è decrescente
se e solo se
Se ha una distribuzione, allora viene distribuito come .
Questo è un prerequisito per il metodo di campionamento della trasformata inversa, che viene utilizzato per generare numeri casuali.
Se è un insieme di variabili casuali distribuite indipendenti definite sullo stesso spazio campionario, allora esistono variabili casuali tali che sono distribuite come e con probabilità 1 per ogni .
L'inverso della funzione di distribuzione cumulativa (cdf) può essere utilizzata per estrapolare dalla distribuzione uniforme ad altre distribuzioni.
La funzione di distribuzione cumulativa che ha prodotto i punti campione è stimata tramite la funzione di distribuzione empirica. Si avvicina a quella distribuzione sottostante con una probabilità di 1. La convergenza della funzione di distribuzione empirica con la sottostante funzione di distribuzione cumulativa è stata quantificata in diversi modi.
La funzione di distribuzione cumulativa congiunta può essere definita anche quando si lavora con più variabili casuali contemporaneamente.
Ad esempio, per una coppia di variabili aleatorie , la CDF congiunta è data da: p.
89
dove il lato destro rappresenta la probabilità che la variabile casuale assuma un valore minore o uguale a e che assuma un valore minore o uguale a .
Un'illustrazione della funzione di distribuzione combinata:
Rispetto a X e Y, due variabili continue:
Ecco un esempio di come costruire una tabella di probabilità e...