Connectez-vous pour consulter le corrigé.
Toutes les variables aléatoires sont définies sur le même espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\).
Si \(Z\) est une variable aléatoire réelle, on note \(\mathbb{E}(Z)\) son espérance et \(\mathbb{V}(Z)\) sa variance, si elles existent.
On note \(\varphi\) et \(\Phi\) les fonctions définies pour tout \(x \in \mathbb{R}\) par :
\[\varphi(x)=\frac{1}{\sqrt{2 \pi}} \, \exp \! \left(-\frac{x^2}{2}\right) \quad \text{et} \quad \Phi(x)=\int_{-\infty}^x \varphi(t) \, \mathrm{d} t\]
On rappelle que la fonction Gamma est définie pour tout réel \(x>0\) par : \[\Gamma(x)=\int_0^{+\infty} t^{x-1} \,\mathrm{e}^{-t} \, \mathrm{d} t\]
et vérifie, pour tout réel \(x>0, \Gamma(x+1)=x \, \Gamma(x)\).
Pour les programmes Python, on dispose d’un petit
formulaire à la fin du sujet. On importe aussi les bibliothèques
suivantes :
import numpy as np import matplotlib.pyplot as plt import numpy.random as rd
Le mot FIN marque la fin de l’énoncé.
Soit \(\left(X_i\right)_{i \in \mathbb{N}^*}\) une famille de variables aléatoires mutuellement indépendantes, chacune de loi normale \(\mathcal{N}(0,1)\). On suppose que \(X_i(\omega) \neq 0\) pour tout \(i \in \mathbb{N}^*\) et tout \(\omega \in \Omega\). On définit, pour tout entier \(n \in \mathbb{N}^*, \ \displaystyle S_n=\sum_{i=1}^n X_i^2\).
La loi de \(S_n\) est appelée loi du khi-deux à \(n\) degrés de liberté, et on notera \(S_n \hookrightarrow \chi^2(n)\). On pose aussi, pour tout entier \(n \in \mathbb{N}^*, \ \displaystyle W_n=\frac{1}{2} \, S_n\).
Montrer que pour tout \(n \in \mathbb{N}^*, \ S_n\) admet une espérance et calculer \(\mathbb{E}(S_n)\). On admet que \(\mathbb{E}(S_n^2)\) existe pour tout \(n \in \mathbb{N}^*\).
Écrire une fonction Python simul(n) qui
renvoie une réalisation de \(S_n\)
lorsqu’on lui fournit un entier naturel non nul \(n\) en entrée.
On exécute ensuite le programme suivant :
def f(n,N):
t=0
for k in range(N):
t = t + simul(n)**2
return t/N - n**2
A = np.arange (1,10)
B =np.zeros(9)
for n in A:
B[n-1]=f(n,50000)
plt.plot(A, B, "*k")
plt.grid()
plt.show()
On obtient la figure ci-contre.
Que peut-on conjecturer sur la variable aléatoire \(S_n\) ? Expliquer ce qui motive votre conjecture.
Montrer que \(W_1\) est une variable aléatoire à densité et déterminer une densité de \(W_1\).
En déduire la valeur de \(\Gamma \! \displaystyle \left(\frac{1}{2}\right)\).
En déduire que pour tout \(n \in \mathbb{N}^*, \ W_n\) suit la loi gamma \(\displaystyle \gamma \! \left(\frac{n}{2}\right)\).
Retrouver alors la valeur de \(\mathbb{E}(S_n)\) et déterminer la valeur de \(\mathbb{V}(S_n)\).
Montrer que, pour tout entier \(n, \ n \geqslant 3, \ \displaystyle \frac{1}{W_n}\) admet une espérance et que :
\[\mathbb{E} \! \left(\frac{1}{W_n}\right)=\frac{\Gamma\left(\frac{n}{2}-1\right)}{\Gamma\left(\frac{n}{2}\right)}\]
En déduire que \(\displaystyle \mathbb{E} \! \left(\frac{1}{S_n}\right)=\frac{1}{n-2}\).
Déduire de la question précédente que, pour tout entier \(n, \ n \geqslant 3, \ \frac{1}{\sqrt{S_n}}\) admet une espérance.
Soit \(Y\) une variable aléatoire indépendante des \(\left(X_k\right)_{k \geqslant 1}\) et de loi \(\mathcal{N}(0,1)\). Pour tout \(n \geqslant 1\), on pose :
\[T_n=\frac{Y}{\sqrt{S_n / n}}\]
La loi de \(T_n\) est appelée loi de Student de paramètre \(n\) et on note \(T_n \hookrightarrow \mathcal{T}(n)\).
On admet que \(T_n\) est une variable aléatoire à densité possédant une densité strictement positive et continue sur \(\mathbb{R}\).
Soit \(\alpha \in \left] 0,1\right[\). Montrer l’existence et l’unicité d’un réel \(t_{n, \alpha}\) tel que \(\mathbb{P}(\left|T_n\right| \leqslant t_{n, \alpha})=1-\alpha\).
Montrer que, pour tout \(n\) entier, \(n \geqslant 3, \ \mathbb{E}(T_n)\) existe et vaut 0.
Montrer que, pour tout \(n\) entier, \(n \geqslant 3, \ \mathbb{V}(T_n)\) existe et vaut \(\displaystyle \frac{n}{n-2}\).
En déduire que, pour tout \(n\) entier, \(n \geqslant 3, \ \displaystyle \mathbb{E}(\left(T_n-Y\right)^2)=\frac{2 n-2}{n-2}-\sqrt{2 n} \, \mathbb{E} \! \left(\frac{1}{\sqrt{W_n}}\right)\).
Pour tout \(n\) entier, \(n \geqslant 2\), on pose : \(\displaystyle u_n=\mathbb{E} \! \left(\frac{1}{\sqrt{W_n}}\right)\).
Montrer que la suite \(\left(u_n\right)_{n \geqslant 2}\) est décroissante et déterminer la valeur de \(u_2\).
Montrer que, pour tout entier \(n, n \geqslant 2\), on a \(\displaystyle u_{n+1} \cdot u_n=\frac{2}{n-1}\).
Écrire une fonction Python d’entête
suite_u(n) qui renvoie sous la forme d’un tableau
numpy les \(\mathrm{n}-1\)
valeurs \(u_2, u_3, \ldots,
u_n\).
On exécute ensuite le programme suivant :
U = suite_u(80) V = np.arange (2,81) plt.plot(V,V*U**2,",k") plt.grid() plt.show()
On obtient la figure suivante :
Que peut-on conjecturer concernant la suite \(\left(u_n\right)_{n \geqslant 2}\) ?
Montrer que \(\displaystyle u_n \underset{n \rightarrow+\infty}{\sim} \sqrt{\frac{2}{n}}\).
Montrer que la suite \(\left(T_n\right)_{n \geqslant 2}\) converge en probabilité vers \(Y\).
Dans cette partie, on démontre le résultat suivant :
Théorème : Soient \(X, Y\) deux variables aléatoires indépendantes, chacune de loi normale \(\mathcal{N}(0,1)\). Les variables aléatoires \(\displaystyle \frac{X+Y}{\sqrt{2}}\) et \(\displaystyle \frac{X-Y}{\sqrt{2}}\) sont alors indépendantes et de loi normale \(\mathcal{N}(0,1)\).
Pour la preuve, on fera appel au résultat suivant qu’on utilisera sans preuve :
Théorème : Soient \(X, Y\) deux variables aléatoires indépendantes, de densités respectives \(f\) et \(g\). Soit \(\mathcal{A} \subset \mathbb{R}^2\) une partie fermée. Alors : \[\mathbb{P}((X, Y) \in \mathcal{A})=\int_{-\infty}^{+\infty}\left(\int_{-\infty}^{+\infty} 1\kern-0.35em1_{\mathcal{A}}(x, y) f(x) \,\mathrm{d}x\right) g(y) \,\mathrm{d}y\]
où \(1\kern-0.35em1_{\mathcal{A}}(x, y)\) vaut 1 si \((x, y) \in \mathcal{A}\) et vaut 0 sinon.
Soient \(a, b \in \mathbb{R}\) fixés jusqu’à la fin de cette partie. On considère la partie \(\mathcal{A} \subset \mathbb{R}^2\) définie par :
\[\mathcal{A}=\left\{(x, y) \in \mathbb{R}^2 \mid x+y \leqslant a \quad \text { et } \quad x-y \leqslant b\right\}\]
On pose également \(\displaystyle c=\frac{a+b}{2}, \ d=\frac{a-b}{2}\).
Soient \(X\) et \(Y\) deux variables aléatoires indépendantes, chacune de loi normale \(\mathcal{N}(0,1)\).
On pose \(\displaystyle W=\frac{X+Y}{\sqrt{2}}\) et \(\displaystyle Z=\frac{X-Y}{\sqrt{2}}\).
Dessiner la partie \(\mathcal{A}\) dans le cas où \(a=2, b=-1\).
Soit \(y\) un réel tel que \(y \geqslant d\).
Montrer que \((x, y) \in \mathcal{A}\) si et seulement si \(x \in \left] -\infty, a-y \right]\).
En déduire que
\[\int_{-\infty}^{+\infty} 1\kern-0.35em1_{\mathcal{A}}(x, y) \, \varphi(x) \,\mathrm{d}x=\Phi(a-y)\]
Montrer de la même façon que pour tout \(y \leqslant d\) on a
\[\int_{-\infty}^{+\infty} 1\kern-0.35em1_{\mathcal{A}}(x, y) \, \varphi(x) \,\mathrm{d}x=\Phi(b+y)\]
Montrer que \(\mathcal{A}\) est une partie fermée de \(\mathbb{R}^2\).
Montrer que
\[\mathbb{P}((X, Y) \in \mathcal{A})=\int_0^{+\infty}(\varphi(d+z)+\varphi(d-z)) \, \Phi(c-z) \,\mathrm{d}z\]
Montrer que :
\[\mathbb{P}((X, Y) \in \mathcal{A})=\int_0^{+\infty}\left(\int_{-\infty}^c(\varphi(d+z)+\varphi(d-z)) \, \varphi(t-z) \,\mathrm{d}t\right) \mathrm{d}z\]
On admet pour la suite que l’on peut changer l’ordre d’intégration dans la formule précédente, c’est-à-dire que l’on a :
\[\mathbb{P}((X, Y) \in \mathcal{A})=\int_{-\infty}^c\left(\int_0^{+\infty}(\varphi(d+z)+\varphi(d-z)) \, \varphi(t-z) \mathrm{d}z \right) \mathrm{d}t\]
Montrer que pour tous \(u, v\) réels on a : \(\displaystyle \varphi(u) \, \varphi(v)=\varphi\! \left(\frac{u+v}{\sqrt{2}}\right) \varphi \! \left(\frac{u-v}{\sqrt{2}}\right)\).
Montrer que :
\[\mathbb{P}((X, Y) \in \mathcal{A})=\frac{1}{\sqrt{2}} \int_{-\infty}^c\left( \varphi \! \left(\frac{t+d}{\sqrt{2}}\right) \Phi \! \left(\frac{t-d}{\sqrt{2}}\right)+\varphi\! \left(\frac{t-d}{\sqrt{2}}\right) \Phi \! \left(\frac{t+d}{\sqrt{2}}\right)\right) \mathrm{d}t\]
Montrer que :
\[\mathbb{P}((X, Y) \in \mathcal{A})=\Phi \! \left(\frac{c+d}{\sqrt{2}}\right) \Phi \! \left(\frac{c-d}{\sqrt{2}}\right)\]
Conclure quant à l’objectif de cette partie.
Soit \(n \in \mathbb{N}\) tel que \(n \geqslant 2\). On munit l’espace vectoriel \(\mathbb{R}^n\) du produit scalaire euclidien standard que l’on notera \(\left \langle \cdot , \cdot \right \rangle\). On considère une base orthonormée \(\left(a_1, \ldots, a_n\right)\) de \(\mathbb{R}^n\) telle que \(\displaystyle a_1=\frac{1}{\sqrt{n}} \left( 1, \ldots, 1 \right)\).
Soit \(x=\left(x_1, \ldots, x_n\right) \in \mathbb{R}^n\). On pose \(\displaystyle \overline{x}=\frac{x_1+\cdots+x_n}{n}\).
Montrer que : \(\displaystyle \sum_{k=2}^n\left\langle x, a_k\right\rangle a_k=\left(x_1-\overline{x}, \ldots, x_n-\overline{x}\right)\).
En déduire que : \(\displaystyle \sum_{k=2}^n\left\langle x, a_k\right\rangle^2=\sum_{i=1}^n\left(x_i-\overline{x}\right)^2\).
Soient \(X_1, \ldots, X_n\) des variables aléatoires mutuellement indépendantes, chacune de loi normale \(\mathcal{N}(0,1)\). On pose \(X=\left(X_1, \cdots, X_n\right)\). Pour \(k \in \left[\!\left[1, n\right]\!\right]\), on note \(\left\langle X, a_k\right\rangle\) la variable aléatoire \(Y_k\) définie pour tout \(\omega \in \Omega\) par \(Y_k(\omega)=\left\langle X(\omega), a_k\right\rangle\). Quitte à modifier les \(Y_k\) sur un ensemble de probabilité nulle, on peut supposer que \(Y_k(\omega) \neq 0\) pour tout \(\omega \in \Omega\) et tout \(k \in \left[\!\left[1, n\right]\!\right]\).
Dans le reste du problème on utilisera sans preuve le théorème de Cochran :
Théorème: Les variables aléatoires \(Y_1, \ldots, Y_n\) sont mutuellement indépendantes, chacune de loi normale \(\mathcal{N}(0,1)\).
Retrouver le résultat de la deuxième partie à l’aide du théorème de Cochran.
Soit \(\left(\beta_1, \beta_2\right) \in \mathbb{R}^2-\{(0,0)\}\).
Montrer que les variables aléatoires \(R_1=X_1+X_2\) et \(R_2=\beta_1 X_1+\beta_2 X_2\) sont indépendantes si et seulement si \(\operatorname{Cov}(R_1, R_2)=0\).
On introduit les variables aléatoires :
\[\overline{X}=\frac{X_1+\cdots+X_n}{n}, \quad U=\sum_{i=1}^n\left(X_i-\overline{X}\right)^2\]
Donner la loi de \(\overline{X}\).
Exprimer \(\overline{X}\) et \(U\) à l’aide des variables aléatoires \(Y_k, \ k \in \left[\!\left[1, n\right]\!\right]\).
Montrer que \(\overline{X}\) et \(U\) sont indépendantes et que \(U\) suit la loi \(\chi^2(n-1)\).
On suppose pour la fin de ce problème que \(Z=\left(Z_1, \ldots, Z_n\right)\) est un \(n\)-uplet de variables aléatoires mutuellement indépendantes, chacune de loi normale \(\mathcal{N}(\mu, \sigma^2)\) avec \(\sigma>0\) où \(\left(\mu, \sigma^2\right)\) est inconnue. On pose :
\[\overline{Z}=\frac{Z_1+\cdots+Z_n}{n}, \quad V=\sum_{i=1}^n\left(Z_i-\overline{Z}\right)^2\]
Comme précédemment, on pourra supposer que \(V(\omega) \neq 0\) pour tout \(\omega \in \Omega\).
Pour \(i \in \left[\!\left[1, n\right]\!\right]\), on pose \(\displaystyle X_i=\frac{Z_i-\mu}{\sigma}\). On pose de plus \(\displaystyle \overline{X}=\frac{X_1+\cdots+X_n}{n}\) et \(\displaystyle U=\sum_{i=1}^n\left(X_i-\overline{X}\right)^2\). Exprimer \(V\) en fonction de \(U\) et \(\sigma\).
En déduire que \(\displaystyle \frac{1}{n-1} \, V\) est un estimateur sans biais de \(\sigma^2\).
Montrer que \(\displaystyle \frac{\overline{Z}-\mu}{\sqrt{\frac{V}{n(n-1)}}}\) suit la loi de Student \(\mathcal{T}(n-1)\).
Soit \(\alpha \in \left] 0,1\right[\) et \(t_{n-1, \alpha}\) le réel tel que \(\mathbb{P}(|T| \leqslant t_{n-1, \alpha})=1-\alpha\) lorsque \(T \hookrightarrow \mathcal{T}(n-1)\).
Construire, en fonction de \(\overline{Z}, V, n\) et \(t_{n-1, \alpha}\), un intervalle de confiance de \(\mu\) au niveau de confiance \(1-\alpha\).
Dans la pratique, les valeurs \(t_{n-1, \alpha}\) sont tabulées et permettent ainsi la construction d’intervalles de confiance non asymptotiques pour des modèles gaussiens.
import numpy as np
| {\tt np.pi} | Renvoie une valeur approchée de $\pi$ |
|---|---|
np.linspace(a,b,n) | Crée une matrice ligne de $n$ valeurs |
| uniformément réparties entre a et b (inclus). | |
np.zeros([n,m]) | Crée la matrice nulle de taille $n \times m$. |
np.zeros(n) | Crée la matrice ligne nulle de taille $n$. |
np.arange(a,b,eps) | Renvoie la liste des flottants de $a$ à $b$ (non compris) |
de pas constant eps. | |
np.shape(M) | Donne la taille de la matrice $M$ sous forme d'un tuple. |
| (couple). |
import numpy.random as rd
rd. exponential(a,[q, r]) | Simule une réalisation d'une matrice (resp. d'un vecteur) |
|---|---|
rd.exponential(a,n) | aléatoire de dimension $(q, r)$ (resp. $n$) dont les coefficients |
| sont des variables aléatoires indépendantes | |
| qui suivent la loi $\mathcal{E}(\frac{1}{a})$. | |
rd.normal(m,d,[q,r]) | Simule une réalisation d'une matrice (resp. d'un vecteur) |
rd.normal(m,d,n) | aléatoire de dimension $( q, r)$ (resp. $n$) dont les coefficients |
| sont des variables aléatoires indépendantes | |
| qui suivent la loi $\mathcal{N}(m, d^2)$ | |
rd.gamma(m,a,[q,r]) | Simule une réalisation d'une matrice (resp. d'un vecteur) |
rd.gamma(m,a,n) | aléatoire de dimension $( q, r)$ (resp. $n$) dont les coefficients |
| sont des variables aléatoires indépendantes | |
| qui suivent la loi $\Gamma(m, a)$. |
import matplotlib.pyplot as plt
plt.plot(X,Y,options) | Génère la courbe des points définis par les listes $X$ et $Y$ suivant les |
|---|---|
| options graphiques définies par la chaine de caractère options. | |
plt.grid() | Affiche le quadrillage |
plt.show() | Affiche le graphique. |
FIN
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.
Dans l'ensemble un sujet très complet et intéressant.
On peut néanmoins regretter que la partie 2 soit souvent très lourde en calculs.