Dans tout ce chapitre, on se donne un espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\) sur lequel toutes les variables aléatoires envisagées sont définies. Pour toute application \(X\) de \(\Omega\) dans \(\mathbb{R}\), on note :
- \([X \leqslant x]=\{\omega \in \Omega, X(\omega) \leqslant x\}\)
- pour tout réel \(x\), \([X>x]=\{\omega \in \Omega, X(\omega)>x\}\)
- pour tout réel \(x\), \([X \in I]=\{\omega \in \Omega, X(\omega) \in I\}\)
- pour tout intervalle \(I\) de \(\mathbb{R}\), …
Notions de variable aléatoire
Variable aléatoire : définition et propriétés élémentaires
Définition
On appelle variable aléatoire réelle sur \((\Omega, \mathcal{A})\) toute application de \(\Omega\) dans \(\mathbb{R}\) telle que, pour tout \(x \in \mathbb{R}\), \([X \leqslant x]\) appartient à \(\mathcal{A}\) (i.e. est un événement).
Tout intervalle \(I\) de \(\mathbb{R}\) pouvant s’écrire comme union et intersection finies d’ensembles de la forme \(]-\infty, x]\) et de leurs complémentaires, si \(X\) est une variable aléatoire réelle sur \((\Omega, \mathcal{A})\), alors \([X \in I]\) est un événement pour tout intervalle \(I\) de \(\mathbb{R}\).
Propriétés
Si \(X_1, \ldots, X_n\) sont des variables aléatoires \(\operatorname{sur}(\Omega, \mathcal{A})\), alors :
- pour tous réels \(\lambda_1, \ldots, \lambda_n, \lambda_1 X_1+\cdots+\lambda_n X_n\) est une variable aléatoire sur \((\Omega, \mathcal{A})\),
- \(X_1 X_2 \cdots X_n\) est une variable aléatoire sur \((\Omega, \mathcal{A})\),
- l’application \(Y=\inf (X_1, \ldots, X_n)\) définie par, pour tout \(\omega \in \Omega, Y(\omega)=\min (X_1(\omega), \ldots, X_n(\omega))\) est une variable aléatoire \(\operatorname{sur}(\Omega, \mathcal{A})\),
- l’application \(Z=\sup (X_1, \ldots, X_n)\) définie par, pour tout \(\omega \in \Omega, \ Z(\omega)=\max (X_1(\omega), \ldots, X_n(\omega))\) est une variable aléatoire sur \((\Omega, \mathcal{A})\).
Fonction de répartition : définition et propriétés
Définition
Soit \(X\) une variable aléatoire. On appelle fonction de répartition de \(X\) la fonction \(F_X\) définie sur \(\mathbb{R}\) par : \[ \forall x \in \mathbb{R}, \ F_X(x)=\mathbb{P}(X \leqslant x) \]
Propriétés
Soit \(X\) une variable aléatoire et \(F_X\) sa fonction de répartition.
- \(F_X\) est croissante sur \(\mathbb{R}\),
- \(F_X\) tend vers \( 0 \) en \(-\infty\) et vers \( 1 \) en \(+\infty\),
- \(F_X\) est continue à droite en tout point,
- \( F_X\) est continue en tout point \(a\) tel que \(\mathbb{P}(X=a)=0\).
Pour tout couple \((a, b)\) de réels tels que \(a<b\), on a :
- \( \mathbb{P}(X>a)=1-F_X(a)\)
- \( \mathbb{P}(a<X \leqslant b)=F_X(b)-F_X(a)\)
- \( \displaystyle \mathbb{P}(X<a)=\lim _{x \rightarrow a^{-}} F_X(x)\)
- \( \displaystyle \mathbb{P}(a \leqslant X \leqslant b)=F_X(b)-\lim _{x \rightarrow a^{-}} F_X(x)\)
- \( \displaystyle \mathbb{P}(a \leqslant X<b)=\lim _{x \rightarrow b^{-}} F_X(x)-\lim _{x \rightarrow a^{-}} F_X(x)\)
- \( \displaystyle \mathbb{P}(a<X<b)=\lim _{x \rightarrow b^{-}} F_X(x)-F_X(a)\)
- \( \displaystyle \mathbb{P}(X=a)=F_X(a)-\lim _{x \rightarrow a^{-}} F_X(x)\)
Familles de variables aléatoires
Vecteur aléatoire : définitions et propriétés
Vecteur aléatoire : définition
On appelle vecteur aléatoire à valeurs dans \(\mathbb{R}^n\) tout \(n\)-uplet \(\left(X_1, \ldots, X_n\right)\) de variables aléatoires réelles. Si de plus \(X_1, \ldots, X_n\) sont des variables aléatoires discrètes, on dit que le vecteur \(\left(X_1, \ldots, X_n\right)\) est un vecteur aléatoire discret.
Loi d’un vecteur aléatoire, lois marginales
Le cas général
Soit \(\left(X_1, \ldots, X_n\right)\) un vecteur aléatoire à valeurs dans \(\mathbb{R}^n\).
- On appelle loi du vecteur \(\left(X_1, \ldots, X_n\right)\) la donnée de la fonction \(F_{\left(X_1, \ldots, X_n\right)}\) définie par : \[ \forall\left(x_1, \ldots, x_n\right) \in \mathbb{R}^n, F_{\left(X_1, \ldots, X_n\right)}\left(x_1, \ldots, x_n\right)=\mathbb{P} \! \left(\bigcap_{i=1}^n\left[X_i \leqslant x_i\right]\right) \]
- Les lois de \(X_1, \ldots, X_n\) sont appelées lois marginales du vecteur \(\left(X_1, \ldots, X_n\right)\).
Le cas des vecteurs aléatoires discrets
Si \(\left(X_1, \ldots, X_n\right)\) est un vecteurs aléatoire discret, sa loi est caractérisée par la donnée des probabilités \[ \mathbb{P} \! \left(\bigcap_{i=1}^n\left[X_i=x_i\right]\right) \] pour tout \(\left(x_1, \ldots, x_n\right)\) appartenant à \(X_1(\Omega) \times \cdots \times X_n(\Omega)\).
Fonctions de vecteurs aléatoires
Soit \(\left(X_1, \ldots, X_n\right)\) et \(\left(Y_1, \ldots, Y_n\right)\) deux vecteurs aléatoires.
Si \(\left(X_1, \ldots, X_n\right)\) et \(\left(Y_1, \ldots, Y_n\right)\) ont la même loi alors, pour toute fonction \(g\) continue sur \(\mathbb{R}^n\) et à valeurs dans \(\mathbb{R} \), \( g(X_1, \ldots, X_n)\) et \(g(Y_1, \ldots, Y_n)\) ont la même loi.
Variables aléatoires indépendantes : définition et propriétés
Définition
On dit que \(X_1, \ldots, X_n\) sont mutuellement indépendantes si : \[ \forall\left(x_1, \ldots, x_n\right) \in \mathbb{R}^n, \ F_{\left(X_1, \ldots, X_n\right)}\left(x_1, \ldots, x_n\right)=\prod_{k=1}^n F_{X_k}\left(x_k\right) \]
Propriétés
Soit \(\left(X_1, \ldots, X_n\right)\) un vecteur aléatoire.
- \(X_1, \ldots, X_n\) sont mutuellement indépendantes si et seulement si on a, pour tous intervalles \(I_1, \ldots, I_n\) : \[ \mathbb{P} \! \left(\bigcap_{k=1}^n\left[X_k \in I_k\right]\right)=\prod_{k=1}^n \mathbb{P}(X_k \in I_k) \]
- Si \(X_1, \ldots, X_n\) est un vecteur aléatoire discret, alors \(X_1, \ldots, X_n\) sont mutuellement indépendantes si et seulement si : \[ \forall\left(x_k\right)_{1 \leqslant i \leqslant n} \in \mathbb{R}^n, \ \mathbb{P} \! \left(\bigcap_{k=1}^n\left[X_k=x_k\right]\right)=\prod_{k=1}^n \mathbb{P} (X_k=x_k ) \]
Lemme des coalitions
- Si \(X_1, \ldots, X_n\) sont mutuellement indépendantes et si \(p\) est un entier tel que \(2 \leqslant p \leqslant n-1\), alors toute variable aléatoire fonction de \(X_1, \ldots, X_p\) est indépendante de toute variable aléatoire fonction de \(X_{p+1}, \ldots, X_n\).
- Plus généralement, si \(X_1, \ldots, X_n\) sont mutuellement indépendantes alors, pour toute permutation \(\sigma\) de \(\left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right] \) et pour toute famille \(\left(i_1, \ldots, i_p\right)\) d’entiers vérifiant \(1 \leqslant i_1<i_2<\cdots<i_p \leqslant n\), toute famille de variables aléatoires de la forme \( \left( f_1(X_{\sigma(1)}, \ldots, X_{\sigma( i_1 )}), \ldots, f_p(X_{\sigma (i_{p-1}+1)}), \ldots, X_{\sigma(i_p)})\right)\) est formée de variables aléatoires mutuellement indépendantes.
Propriétés de l’espérance
Linéarité de l’espérance
Soit \(\left(X_1, \ldots, X_n\right)\) un vecteur aléatoire à valeurs dans \(\mathbb{R}^n\). Si \(X_1, \ldots, X_n\) admettent une espérance, alors \(X_1+\cdots+X_n\) admet une espérance et : \[ \mathbb{E} \! \left(\sum_{k=1}^n X_k\right)=\sum_{k=1}^n \mathbb{E}(X_k) \]
Croissance de l’espérance
Soit \((X, Y)\) un couple de variables aléatoires admettant une espérance. Si, presque sûrement, \(X \leqslant Y\), alors : \(\mathbb{E}(X) \leqslant \mathbb{E}(Y)\).
Théorème de domination
Soit \((X, Y)\) un couple de variables aléatoires tel que, presque sûrement, \(|X| \leqslant Y\). Si \(Y\) admet une espérance, alors \(X\) admet une espérance et : \[ |\mathbb{E}(X)| \leqslant \mathbb{E}(Y) \]
Espérance d’un produit
Soit \(\left(X_1, \ldots, X_n\right)\) un vecteur aléatoire à valeurs dans \(\mathbb{R}^n\). Si \(X_1, \ldots, X_n\) sont mutuellement indépendantes et admettent une espérance, alors \(X_1 X_2 \cdots X_n\) admet une espérance et : \[ \mathbb{E} \! \left(\prod_{k=1}^n X_k\right)=\prod_{k=1}^n \mathbb{E}(X_k) \]
Covariance et coefficient de corrélation linéaire
Covariance : définition et propriétés
Définition
Si \(X\) et \(Y\) admettent un moment d’ordre 2, on appelle covariance de \((X, Y)\) le réel \[ \operatorname{Cov}(X, Y)=\mathbb{E}((X-\mathbb{E}(X))(Y-\mathbb{E}(Y))) \]
Formule de Huygens
Si \(X\) et \(Y\) admettent un moment d’ordre 2, alors : \[ \operatorname{Cov}(X, Y)=\mathbb{E}(X Y)-\mathbb{E}(X) \, \mathbb{E}(Y) \]
Propriétés
La covariance est une forme bilinéaire symétrique et positive sur l’espace vectoriel des variables aléatoires discrètes définies \(\operatorname{sur}(\Omega, \mathcal{A}, \mathbb{P})\) et admettant un moment d’ordre 2.
Autrement dit, si \(X, Y\) et \(Z\) sont trois variables aléatoires discrètes sur \((\Omega, \mathcal{A}, \mathbb{P})\) admettant un moment d’ordre 2 et si \(a\) et \(b\) sont deux réels, alors :
- \(\operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X)\),
- \(\operatorname{Cov}(a X+b Y, Z)=a \operatorname{Cov}(X, Z)+b \operatorname{Cov}(Y, Z)\),
- \(\operatorname{Cov}(X, a Y+b Z)=a \operatorname{Cov}(X, Y)+b \operatorname{Cov}(X, Z)\),
- \(\operatorname{Cov}(X, X) \geqslant 0\).
Lien entre indépendance et covariance
Si \(X\) et \(Y\) sont indépendantes et admettent un moment d’ordre 2, alors : \[ X \text { et } Y \text { sont indépendantes } \Longrightarrow \operatorname{Cov}(X, Y)=0 \]
Coefficient de corrélation linéaire : définition et propriétés
Définition
Si \(X\) et \(Y\) admettent toutes deux une variance non nulle, on appelle coefficient de corrélation linéaire de \((X, Y)\) le réel \[ \rho(X, Y)=\frac{\operatorname{Cov}(X, Y)}{\sigma(X) \sigma(Y)} \]
Propriétés
Si \(X\) et \(Y\) admettent chacune une variance non nulle, alors :
- \(|\rho(X, Y)| \leqslant 1\) (inégalité de Cauchy-Schwarz),
- \(|\rho(X, Y)|=1 \Longleftrightarrow \exists(a, b) \in \mathbb{R} / \mathbb{P}(Y=a X+b)=1\).
Lien entre indépendance et coefficient de corrélation linéaire
Si \(X\) et \(Y\) admettent chacune une variance non nulle, alors : \[ X \text { et } Y \text { sont indépendantes } \Longrightarrow \rho(X, Y)=0 \]
Variance d’une somme de variables aléatoires
- Soit \((X, Y)\) un couple de variables aléatoires admettant un moment d’ordre \(2 \). \( X+Y\) admet une variance et : \[ \mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y)+2 \operatorname{Cov}(X, Y) \]
- Si \( (X, Y)\) est un couple de variables aléatoires indépendantes admettant une variance, \(X+Y\) admet une variance et : \[ \mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y) \]
- Plus généralement, si \(n\) est un entier naturel supérieur ou égal à 2, si \(X_1, \ldots, X_n\) sont \(n\) variables aléatoires discrètes mutuellement indépendantes admettant une variance, alors, pour tout \(n\)-uplet \(\left(a_1, \ldots, a_n\right.\) de réels : \[ \mathbb{V}\! \left(\sum_{k=1}^n a_k X_k\right)=\sum_{k=1}^n a_k^2 \mathbb{V}(X_k) \]