Capítulo 1 : Función de distribución acumulativa
Estadísticamente y en el ámbito de la probabilidad, la función de distribución acumulativa (CDF) de una variable aleatoria de valor real , o simplemente la función de distribución de , evaluada en , es la probabilidad que tomará un valor menor o igual que .
Todas y cada una de las distribuciones de probabilidad soportadas por números reales, tanto "mixtas" o "discretas" como "continuas", se identifican de forma única mediante una función creciente monótona continua-derecha (una función càdlàg) que satisface y .
Si la distribución es escalar y continua, entonces, da el área bajo la función de densidad de probabilidad desde menos infinito hasta .
Las variables aleatorias multivariadas también pueden tener sus distribuciones especificadas por medio de funciones de distribución acumulativa.
La función de distribución acumulativa de una variable aleatoria de valor real es la función dada por: p.
77
donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual que .
La probabilidad que se encuentra en el intervalo semicerrado , donde , es, por lo tanto: p.
84
Lo que se define arriba, indicador de igualdad o desigualdad, "=", es una reunión formal, no un término comúnmente empleado (p. ej.
El símbolo "") se usa comúnmente en las obras literarias de Hungría, sin embargo, para distribuciones discretas, esta divergencia es crucial.
Esta regla es crucial para interpretar tablas de distribución binomiales y de Poisson.
Además, fórmulas importantes como la fórmula de inversión de Paul Lévy para la función característica también se basan en la formulación "menor o igual que".
Si se trata de varias variables aleatorias , etc.
Los subíndices se forman utilizando las letras correspondientes, mientras que, considerando la posibilidad de tener que tratar uno, es una práctica común omitir el subíndice.
Es convencional usar un capital para una función de distribución acumulativa, en contraste con las minúsculas que se usan para las funciones de densidad de probabilidad y las funciones de masa de probabilidad.
Esto es cierto cuando se habla de distribuciones genéricas; ciertas distribuciones, sin embargo, tienen su propia notación estándar, por ejemplo, la distribución normal usa y en lugar de y , respectivamente.
Diferenciando la función de distribución acumulativa usando el teorema fundamental del cálculo se obtiene la función de densidad de probabilidad de una variable aleatoria continua; es decir,
dado ,
hasta que el derivado deje de existir.
La CDF de una variable aleatoria continua se puede expresar como la integral de su función de densidad de probabilidad de la siguiente manera: p.
86
En el caso de una variable aleatoria que tiene una distribución que tiene un componente discreto en un valor ,
Si es continuo en , esto es igual a cero y no hay ningún componente discreto en .
Toda función de distribución acumulativa es no decreciente: p.
79 lo que la convierte en una función càdlàg.
Además
Cualquier función que satisfaga estas cuatro condiciones es una función de distribución acumulativa (CDF), en el sentido de que cualquier variable aleatoria puede expresarse en términos de ella.
Si es una variable aleatoria puramente discreta, entonces alcanza valores con probabilidad , y la CDF de será discontinua en los puntos :
Si la CDF de una variable aleatoria de valor real es continua, entonces es una variable aleatoria continua; si además es absolutamente continua, entonces existe una función integrable de Lebesgue tal que
para todos los números reales y .
La función es igual a la derivada de casi todas partes, y se llama función de densidad de probabilidad de la distribución de .
Si tiene una norma L1 finita, es decir, la expectativa de es finita, entonces la integral de Riemann-Stieltjes proporciona el pronóstico.
y para cualquier ,
según la ilustración.
Dentro de este ámbito, tenemos
A modo de ilustración, supongamos que se distribuye uniformemente en el intervalo unitario .
Entonces el CDF de viene dado por
Supongamos, en cambio, que solo toma los valores discretos 0 y 1, aproximadamente a la misma velocidad.
Entonces el CDF de viene dado por
Supongamos que es exponencialmente distribuido.
Entonces el CDF de viene dado por
Aquí ? > 0 es el parámetro de la distribución, comúnmente conocido como la constante de tasa.
Supongamos que se distribuye normalmente.
Entonces el CDF de viene dado por
Aquí el parámetro es la media o expectativa de la distribución, y es su desviación estándar.
La tabla normal estándar, también conocida como tabla normal unitaria o tabla Z, es una representación comúnmente utilizada de la función de distribución acumulativa (CDF) de la distribución normal en la práctica estadística.
Supongamos que se distribuye un binomio.
Entonces el CDF de viene dado por
Aquí está la probabilidad de éxito y la función denota la distribución de probabilidad discreta del número de éxitos en una secuencia de experimentos independientes, y es el "piso" debajo de , es decir,
el mayor número entero menor o igual que .
Examinar la frecuencia con la que la variable aleatoria es mayor que un umbral puede ser instructivo a veces. La definición de la distribución de cola, también conocida como función de distribución acumulativa complementaria (ccdf), es la siguiente:
Esto se puede usar para la prueba de hipótesis en estadística, por ejemplo, porque la probabilidad de ver un estadístico de prueba al menos tan extremo como el que se vio es lo que mide el valor p unilateral.
Por lo tanto, asumiendo la significación estadística, T, distribución que es continua, el valor p unilateral es simplemente dado por el ccdf: para un valor observado del estadístico de prueba
Teóricamente, el análisis de supervivencia, se denomina función de supervivencia y se denota , aunque la frase función de confiabilidad es ampliamente utilizada en la comunidad de ingenieros.
Propiedades
La desigualdad de Markov argumenta que para cualquier variable aleatoria continua que tenga una expectativa y no sea negativa,
Como , y de hecho siempre que sea finito. Prueba: Suponiendo que tiene una función de densidad , para cualquier
A partir de la realización posterior
, reorganizando conceptos,
como se afirma.
Una distribución de probabilidad con una expectativa asociada,
ya que el segundo término siempre es cero para las variables aleatorias que no son negativas. Esto es lo mismo que decir: "si la variable aleatoria solo puede aceptar valores enteros no negativos, entonces
Si bien el gráfico de una distribución acumulativa a menudo tiene una forma de S, la distribución acumulativa plegada, también conocida como diagrama de montaña, es otro ejemplo, esto invierte la mitad superior del gráfico, es decir,
donde denota la función indicadora y el segundo sumando es la función superviviente, empleando un sistema de doble escala, dos, una para la inclinación y otra para la disminución.
La mediana se resalta en este estilo de diagrama, propagación (más precisamente, la desviación de la mediana, la asimetría y la dispersión son términos que se refieren a la dispersión de datos o a la distribución de resultados empíricos.
Si el CDF F es estrictamente creciente y continuo, entonces el número real único es tal que .
La función cuantil, o su inversa, la función de distribución inversa, se define así.
Algunas distribuciones no tienen un inverso único (por ejemplo, si para todo , haciendo que sea constante).
Aquí, sin embargo, una herramienta común es la función de distribución de probabilidad inversa, es decir,
Ejemplo 1: La mediana es .
Ejemplo 2: Poner .
Entonces llamamos al percentil 95.
En la definición de la función de distribución inversa generalizada, la cdf inversa conserva muchas de sus cualidades útiles:
no es decreciente
si y solo si
Si tiene una distribución, entonces se distribuye como .
Este es un requisito previo para el método de muestreo de transformación inversa, que se utiliza para generar números aleatorios.
Si es una colección de variables aleatorias independientes distribuidas definidas en el mismo espacio muestral, entonces existen variables aleatorias tales que se distribuyen como y con probabilidad 1 para todas .
La inversa de la función de distribución acumulativa (cdf) se puede utilizar para extrapolar de la distribución uniforme a otras distribuciones.
La función de distribución acumulativa que produjo los puntos de muestreo se estima a través de la función de distribución empírica. Se aproxima a esa distribución subyacente con una probabilidad de 1. La convergencia de la función de distribución empírica a la función de distribución acumulativa subyacente se ha cuantificado de varias maneras.
La función de distribución acumulativa conjunta también se puede definir cuando se trabaja con múltiples variables aleatorias simultáneamente.
Por ejemplo, para un par de variables aleatorias , la CDF conjunta viene dada por: p.
89
donde el lado derecho...