Chapitre 1 : Fonction de distribution cumulative
Statistiquement et dans le domaine des probabilités, la fonction de distribution cumulative (CDF) d'une variable aléatoire à valeurs réelles , ou simplement fonction de distribution de , évaluée en , est la probabilité de prendre une valeur inférieure ou égale à .
Chacune des distributions de probabilité supportées par des nombres réels, à la fois « mixte » ou « discrète » et « continue », est identifiée de manière unique par une fonction croissante monotone continue à droite (une fonction de càdlàg) satisfaisant et .
Si la distribution est scalaire et continue, alors, elle donne l'aire sous la fonction de densité de probabilité de moins l'infini à .
Les distributions des variables aléatoires multivariées peuvent également être spécifiées au moyen de fonctions de distribution cumulatives.
La fonction de distribution cumulative d'une variable aléatoire à valeurs réelles est la fonction donnée par : p.
77
où le membre de droite représente la probabilité que la variable aléatoire prenne une valeur inférieure ou égale à .
La probabilité qui réside dans l'intervalle semi-fermé , où , est donc : p.
84
Ce qui est défini ci-dessus, l'indicateur d'égalité ou d'inégalité, « = », est une réunion formelle, et non un terme couramment employé (par ex.
Le symbole « ») est couramment utilisé dans les ouvres littéraires hongroises, mais pour les distributions discrètes, cette divergence est cruciale.
Cette règle est cruciale pour l'interprétation des tables de distribution binomiale et de Poisson.
De plus, des formules importantes comme la formule d'inversion de Paul Lévy pour la fonction caractéristique reposent également sur la formulation « inférieur ou égal ».
Si le traitement de plusieurs variables aléatoires , etc.
Les indices sont formés à l'aide des lettres correspondantes tandis que, compte tenu de la possibilité d'avoir à en traiter un, il est courant d'omettre l'indice.
Il est conventionnel d'utiliser une majuscule pour une fonction de distribution cumulative, contrairement aux minuscules utilisées pour les fonctions de densité de probabilité et les fonctions de masse de probabilité.
C'est le cas lorsqu'on parle de distributions génériques ; certaines distributions, cependant, ont leur propre notation standard, par exemple la distribution normale utilise respectivement et au lieu de et .
La dérivation de la fonction de distribution cumulative à l'aide du théorème fondamental du calcul donne la fonction de densité de probabilité d'une variable aléatoire continue ; c.-à-d.
étant donné ,
jusqu'à ce que le dérivé cesse d'exister.
La CDF d'une variable aléatoire continue peut être exprimée comme l'intégrale de sa fonction de densité de probabilité comme suit : p.
86
Dans le cas d'une variable aléatoire dont la distribution a une composante discrète à une valeur ,
Si est continu en , cela est égal à zéro et il n'y a pas de composante discrète en .
Toute fonction de distribution cumulative est non décroissante : p.
79, ce qui en fait une fonction càdlàg.
En outre
Toute fonction satisfaisant ces quatre conditions est une fonction de distribution cumulative (CDF), en ce sens que toute variable aléatoire peut être exprimée en fonction de celle-ci.
Si est une variable aléatoire purement discrète, alors elle atteint des valeurs avec une probabilité , et la CDF de sera discontinue aux points :
Si la CDF d'une variable aléatoire à valeurs réelles est continue, alors est une variable aléatoire continue ; si en outre est absolument continue, alors il existe une fonction intégrable de Lebesgue telle que
pour tous les nombres réels et .
La fonction est égale à la dérivée de presque partout, et on l'appelle fonction de densité de probabilité de la distribution de .
Si a une norme L1 finie, c'est-à-dire que l'espérance de est finie, alors l'intégrale de Riemann-Stieltjes fournit la prévision.
et pour tout ,
selon l'illustration.
Dans ce cadre, nous avons
À titre d'illustration, supposons que est uniformément distribué sur l'intervalle unitaire .
Alors la CDF de est donnée par
Supposons plutôt que ne prenne que les valeurs discrètes 0 et 1, à peu près au même taux.
Alors la CDF de est donnée par
Supposons que est distribué exponentiellement.
Alors la CDF de est donnée par
Ici, ? > 0 est le paramètre de la distribution, communément appelé constante de vitesse.
Supposons que est normal distribué.
Alors la CDF de est donnée par
Ici, le paramètre est la moyenne ou l'espérance de la distribution, et est son écart-type.
La table normale standard, également connue sous le nom de table normale unitaire ou table Z, est une représentation couramment utilisée de la fonction de distribution cumulative (CDF) de la distribution normale dans la pratique statistique.
Supposons que est distribué binomial.
Alors la CDF de est donnée par
Ici est la probabilité de succès et la fonction désigne la distribution de probabilité discrète du nombre de succès dans une suite d' expériences indépendantes, et est le « plancher » sous , i.e.
le plus grand entier inférieur ou égal à .
Il peut parfois être instructif d'examiner la fréquence à laquelle la variable aléatoire est supérieure à un seuil. La définition de la distribution de queue, également connue sous le nom de fonction de distribution cumulative complémentaire (ccdf), est la suivante :
Cela peut être utilisé pour les tests d'hypothèses en statistiques, par exemple, car la probabilité de voir une statistique de test au moins aussi extrême que celle que l'on a vue est ce que mesure la valeur p unilatérale.
Ainsi, en supposant la signification statistique, T, distribution continue, la valeur p unilatérale est simplement donnée par la fonction ccdf : pour une valeur observée de la statistique de test
Théoriquement, l'analyse de survie, est appelée fonction de survie et notée , bien que l'expression fonction de fiabilité soit largement utilisée dans la communauté des ingénieurs.
Propriétés
L'inégalité de Markov soutient que pour toute variable aléatoire continue qui a une espérance et qui n'est pas négative,
Comme , et en fait à condition que soit fini. Démonstration :En supposant a une fonction de densité , pour tout
Après réalisation ultérieure
, la réorganisation des concepts,
comme prétendu.
Une distribution de probabilité avec une espérance associée,
car le deuxième terme est toujours zéro pour les variables aléatoires qui ne sont pas négatives. Cela revient à dire : « si la variable aléatoire ne peut accepter que des valeurs entières non négatives, alors
Alors que le graphique d'une distribution cumulative a souvent une forme en forme de S, la distribution cumulative pliée, également connue sous le nom de graphique de montagne, est un autre exemple, cela inverse la moitié supérieure du graphique, c'est-à-dire
où désigne la fonction indicatrice et la seconde somme est la fonction survivante, employant un système à deux échelles, deux, une pour l'inclinaison et une pour la baisse.
La médiane est mise en évidence dans ce style de diagramme, la propagation (plus précisément, l'écart médian, l'asymétrie et la dispersion sont tous des termes qui font référence à la dispersion des données ou à la distribution des résultats empiriques.
Si la CDF F est strictement croissante et continue, alors est le nombre réel unique tel que .
La fonction quantile, ou son inverse, la fonction de distribution inverse, est ainsi définie.
Certaines distributions n'ont pas d'inverse unique (par exemple si pour tout , ce qui rend constant).
Ici, cependant,, Un outil courant est la fonction de distribution de probabilité inverse, c'est-à-dire,
Exemple 1 : La médiane est .
Exemple 2 : Mettre .
Ensuite, nous appelons le 95e centile.
Dans la définition de la fonction de distribution inverse généralisée, la cdf inverse conserve bon nombre de ses qualités utiles :
n'est pas décroissante
si et seulement si
Si a une distribution, alors est distribué comme .
C'est une condition préalable à la méthode d'échantillonnage par transformée inverse, qui est utilisée pour générer des nombres aléatoires.
Si est un ensemble de variables aléatoires indépendantes définies sur le même espace d'échantillonnage, alors il existe des variables aléatoires telles que distribuées comme et avec une probabilité de 1 pour tout .
L'inverse de la fonction de distribution cumulative (cdf) peut être utilisé pour extrapoler de la distribution uniforme à d'autres distributions.
La fonction de distribution cumulative qui a produit les points d'échantillonnage est estimée via la fonction de distribution empirique. Il s'approche de cette distribution sous-jacente avec une probabilité de 1. La convergence de la fonction de distribution empirique avec la fonction de distribution cumulative sous-jacente a été quantifiée de plusieurs façons.
La fonction de distribution...