Capítulo 1 : Função de distribuição cumulativa
Estatisticamente e no domínio da probabilidade, a função de distribuição cumulativa (CDF) de uma variável aleatória de valor real , ou apenas função de distribuição de , avaliada em , é a probabilidade que terá um valor menor ou igual a .
Cada uma das distribuições de probabilidade suportadas por números reais, tanto "mista" ou "discreta" quanto "contínua", é identificada exclusivamente por uma função crescente monótona contínua à direita (uma função càdlàg) satisfatória e .
Se a distribuição é escalar e contínua, então, dá a área sob a função de densidade de probabilidade de menos infinito a .
Variáveis aleatórias multivariadas também podem ter suas distribuições especificadas por meio de funções de distribuição cumulativa.
A função de distribuição cumulativa de uma variável aleatória de valor real é a função dada por: p.
77
em que o lado direito representa a probabilidade de a variável aleatória assumir um valor inferior ou igual a .
A probabilidade que reside no intervalo semi-fechado , onde , é, portanto: p.
84
Aquilo que é definido acima, indicador de igualdade ou desigualdade, "=", é uma reunião formal, não um termo comumente empregado (por exemplo,
O símbolo "") é comumente usado em obras literárias da Hungria, Para distribuições discretas, no entanto, esta divergência é crucial.
Esta regra é crucial para interpretar tabelas de distribuição binomial e de Poisson.
Além disso, fórmulas importantes como a fórmula de inversão de Paul Lévy para a função característica também dependem da formulação "menor que ou igual".
Se tratando várias variáveis aleatórias etc.
Os subscritos são formados usando as letras correspondentes, enquanto, considerando a possibilidade de apenas ter que tratar um, é prática comum omitir o subscrito.
É convencional usar um capital para uma função de distribuição cumulativa, em contraste com as minúsculas usadas para funções de densidade de probabilidade e funções de massa de probabilidade.
Isso vale quando se discute distribuições genéricas, certas distribuições, no entanto, têm sua própria notação padrão, por exemplo, os usos normais de distribuição e em vez de e , respectivamente.
Diferenciando a função de distribuição cumulativa usando o teorema fundamental do cálculo, obtém-se a função de densidade de probabilidade de uma variável aleatória contínua; ou seja,
dado ,
até que o derivado deixe de existir.
O CDF de uma variável aleatória contínua pode ser expresso como a integral de sua função de densidade de probabilidade da seguinte forma:: p.
86
No caso de uma variável aleatória que tem distribuição com um componente discreto a um valor ,
Se for contínuo em , isso é igual a zero e não há nenhum componente discreto em .
Toda função de distribuição cumulativa não está diminuindo: p.
79, o que a torna uma função càdlàg.
Além disso,
Qualquer função que satisfaça estas quatro condições é uma função de distribuição cumulativa (CDF), no sentido de que qualquer variável aleatória pode ser expressa em termos dela.
Se é uma variável aleatória puramente discreta, então ela atinge valores com probabilidade , e o CDF de será descontínuo nos pontos :
Se o CDF de uma variável aleatória de valor real é contínuo, então é uma variável aleatória contínua, se, além disso , é absolutamente contínua, então existe uma função integrável por Lebesgue tal que
para todos os números reais e .
A função é igual à derivada de quase todos os lugares, e é chamada de função de densidade de probabilidade da distribuição de .
Se tem norma L1 finita, isto é, a expectativa de é finita, então a integral de Riemann-Stieltjes fornece a previsão.
e para qualquer ,
de acordo com a ilustração.
Neste âmbito, temos
Como ilustração, suponha que esteja uniformemente distribuído no intervalo unitário .
Em seguida, o CDF de é dado por
Suponha, em vez disso , que tome apenas os valores discretos 0 e 1, aproximadamente na mesma taxa.
Em seguida, o CDF de é dado por
Suponha que é distribuído exponencialmente.
Em seguida, o CDF de é dado por
Aqui ? > 0 é o parâmetro da distribuição, comumente referido como a constante de taxa.
Suponha que é normal distribuído.
Em seguida, o CDF de é dado por
Aqui o parâmetro é a média ou expectativa da distribuição, e é o seu desvio padrão.
A tabela normal padrão, também conhecida como tabela normal unitária ou tabela Z, é uma representação comumente usada da função de distribuição cumulativa (CDF) da distribuição normal na prática estatística.
Suponha que é binomial distribuído.
Em seguida, o CDF de é dado por
Aqui está a probabilidade de sucesso e a função denota a distribuição de probabilidade discreta do número de sucessos em uma sequência de experimentos independentes, e é o "chão" sob , ou seja,
o maior número inteiro menor ou igual a .
Examinar com que frequência a variável aleatória é maior do que um limiar pode ser instrutivo às vezes. A definição da distribuição da cauda, também conhecida como função de distribuição cumulativa complementar (ccdf), é a seguinte:
Isso pode ser usado para testes de hipóteses em estatísticas, por exemplo, porque a probabilidade de ver uma estatística de teste pelo menos tão extrema quanto a vista é o que o valor p unilateral mede.
Assim, assumindo a significância estatística, T, distribuição que é contínua, o valor p unilateral é simplesmente dado pelo ccdf: para um valor observado da estatística do teste
Teoricamente, a análise de sobrevivência, é chamada de função de sobrevivência e denotada , embora a expressão função de confiabilidade seja amplamente utilizada na comunidade de engenharia,.
Propriedades
A desigualdade de Markov argumenta que, para qualquer variável aleatória contínua que tenha uma expectativa e não seja negativa,
Como , e de facto desde que seja finito. Prova:Supondo que tem uma função de densidade , para qualquer
Após a realização adicional
, reorganizando conceitos,
como alegado.
Uma distribuição de probabilidade com uma expectativa associada,
como o segundo termo é sempre zero para variáveis aleatórias que não são negativas. Isto é o mesmo que dizer, "se a variável aleatória só pode aceitar valores inteiros não negativos, então
Enquanto o gráfico de uma distribuição cumulativa muitas vezes tem uma forma semelhante a S, A distribuição cumulativa dobrada, também conhecida como gráfico de montanha, é outro exemplo, Isso inverte a metade superior do gráfico, ou seja,
onde denota a função indicador e a segunda soma é a função sobrevivente, empregando um sistema de escala dupla, dois, um para a inclinação e outro para o declínio.
A mediana é destacada neste estilo de diagrama, propagação (mais precisamente, desvio mediano, assimetria e dispersão são todos termos que se referem à dispersão de dados ou à distribuição de resultados empíricos.
Se o CDF F é estritamente crescente e contínuo, então é o número real único tal que .
A função quantílica, ou o seu inverso, a função de distribuição inversa, é assim definida.
Algumas distribuições não têm um inverso único (por exemplo, se para todos , fazendo com que seja constante).
Aqui, porém, uma ferramenta comum é a função de distribuição de probabilidade inversa, ou seja,
Exemplo 1: A mediana é .
Exemplo 2: Coloque .
Então chamamos o percentil 95.
Na definição da função de distribuição inversa generalizada, o cdf inverso mantém muitas de suas qualidades úteis:
não é decrescente
se e somente se
Se tem uma distribuição, então é distribuído como .
Este é um pré-requisito para o método de amostragem por transformada inversa, que é utilizado para gerar números aleatórios.
Se é uma coleção de variáveis aleatórias independentes -distribuídas definidas no mesmo espaço amostral, então existem variáveis aleatórias tais que são distribuídas como e com probabilidade 1 para todos .
O inverso da função de distribuição cumulativa (cdf) pode ser usado para extrapolar da distribuição uniforme para outras distribuições.
A função de distribuição cumulativa que produziu os pontos de amostra é estimada através da função de distribuição empírica. Aproxima-se dessa distribuição subjacente com uma probabilidade de 1. A convergência da função de distribuição empírica para a função de distribuição cumulativa subjacente foi quantificada de várias maneiras.
A função de distribuição cumulativa conjunta também pode ser definida ao trabalhar com várias variáveis aleatórias simultaneamente.
Por exemplo, para um par de variáveis aleatórias , o CDF conjunto é dado por: p.
89
em que o lado direito representa a probabilidade de a variável aleatória assumir um valor inferior ou igual a e que assumir um valor inferior ou igual a .
Uma ilustração da função de distribuição combinada:
Com...