Connectez-vous pour consulter le corrigé.
Toutes les variables aléatoires qui interviennent dans ce problème sont supposées définies sur le même espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\). Sous réserve d’existence, on note \(\mathbb{E}(X)\) et \(\mathbb{V}(X)\) respectivement, l’espérance et la variance d’une variable aléatoire réelle \(X\) quelconque. Pour toute variable aléatoire réelle \(X\) admettant une densité sur \(\mathbb{R}\), notée \(f_{X}\), on note \(\mathcal{D}_{X}\) l’ensemble des réels \(s\) pour lesquels la variable aléatoire \(\mathrm{e}^{s X}\) admet une espérance, et on note \(\Phi_{X}\) la fonction définie sur \(\mathcal{D}_{X}\) par : \(\Phi_{X}(s)=\mathbb{E}(\mathrm{e}^{s X})\)
On admet les résultats suivants :
si deux variables aléatoires \(X\) et \(Y\) sont telles que \(\Phi_{X}\) et \(\Phi_{Y}\) coïncident sur un intervalle ouvert non vide, alors \(X\) et \(Y\) ont la même loi;
si \(n\) est un entier naturel non nul, et \(X_{1}, X_{2}, \ldots, X_{n}\) des variables aléatoires réelles quelconques, mutuellement indépendantes, alors, pour tout entier \(p\) de \(\left[\!\left[1, n-1\right]\!\right]\) et pour toutes fonctions réelles continues \(\varphi_{1}\) et \(\varphi_{2}\), les variables aléatoires \(\varphi_{1}(X_{1}, \ldots, X_{p})\) et \(\varphi_{2}(X_{p+1}, \ldots, X_{n})\) sont indépendantes ;
si \(X\) et \(Y\) sont des variables aléatoires indépendantes admettant une espérance, alors \(X Y\) admet une espérance, et \(\mathbb{E}(X Y)=\mathbb{E}(X) \,\mathbb{E}(Y)\).
La fonction exponentielle est également notée exp. On rappelle que : \(\displaystyle \int_{-\infty}^{+\infty} \exp \left(\frac{-x^{2}}{2}\right) \, \mathrm{d}x=\sqrt{2 \pi}\).
Dans tout le problème, \(U\) désigne une variable aléatoire qui suit la loi normale centrée réduite.
On rappelle que, pour tout \(s\) de \(\mathcal{D}_{X}\), on a : \(\displaystyle \Phi_{X}(s)=\int_{-\infty}^{+\infty} \exp (s x) f_{X}(x) \, \mathrm{d}x\).
Soit \(a\) un réel non nul et \(b\) un réel quelconque.
Montrer que l’intégrale \(\displaystyle \int_{-\infty}^{+\infty} \exp \! \left(-a x^{2}\right) \mathrm{d}x\) est convergente si et seulement si \(a>0\), et vaut alors \(\sqrt{\frac{\pi}{a}}\).
En déduire que l’intégrale \(\displaystyle \int_{-\infty}^{+\infty} \exp\! \left(-a x^{2}+b x\right) \mathrm{d}x\) est convergente si et seulement si \(a>0\), puis montrer que dans ces conditions, on a : \(\displaystyle \int_{-\infty}^{+\infty} \exp \!\left(-a x^{2}+b x\right) \mathrm{d}x=\sqrt{\frac{\pi}{a}} \exp \! \left(\frac{b^{2}}{4 a}\right)\).
Déterminer \(\mathcal{D}_{U}\); pour tout \(s\) de \(\mathcal{D}_{U}\), calculer \(\Phi_{U}(s)\).
On pose : \(Z=U^{2}\). Établir que : \(\mathcal{D}_{Z}=\left]-\infty, \frac{1}{2} \right[\) ; montrer, à l’aide du théorème de transfert, que pour tout réel \(s\) de \(\mathcal{D}_{Z}\), on a : \(\Phi_{Z}(s)=(1-2 s)^{-1 / 2}\).
Soit \(X\) une variable aléatoire réelle à densité, et soit \(\mu\) et \(\beta\) deux réels quelconques.
Montrer qu’un réel \(s\) appartient à \(\mathcal{D}_{\mu X+\beta}\) si et seulement si \(\mu s\) appartient à \(\mathcal{D}_{X}\), et que dans ce cas, on a : \(\Phi_{\mu X+\beta}(s)=\exp (\beta s) \, \Phi_{X}(\mu s)\).
On suppose que \(X\) suit une loi \(\gamma\) de paramètre \(\nu\), où \(\nu\) est un réel strictement positif.
Montrer que : \(\mathcal{D}_{X}=\left]-\infty, 1\right[\); pour tout \(s\) de \(\mathcal{D}_{X}\), établir la formule : \(\Phi_{X}(s)=(1-s)^{-\nu}\). De même, déterminer \(\mathcal{D}_{2 X}\); pour tout \(s\) de \(\mathcal{D}_{2 X}\), calculer \(\Phi_{2 X}(s)\).
Pour tout couple \((b,\nu)\) de réels strictement positifs, on dit qu’une variable aléatoire \(X\) suit la loi \(\Gamma\) de paramètres \((b,\nu)\) si elle admet pour densité la fonction \(f_{b,\nu}\) définie par : \[f_{b,\nu}(x)= \begin{cases} \displaystyle \frac{1}{b^\nu \Gamma(\nu)} \times \displaystyle x^{\nu-1} \times \exp \! \left(- \frac{x}{b}\right) & \text { si } x>0 \\ \hfill 0 \hfill & \text { si } x \leqslant 0 \rule[0pt]{0pt}{20pt}\end{cases}\]
Soit \(r\) un entier supérieur ou égal à 1. On considère une variable aléatoire \(X_{r}\) suivant la loi \(\Gamma\) de paramètres \(\left(2, \frac{r}{2}\right)\), c’est-à-dire que \(X_{r}\) possède une densité \(f_{X_{r}}\) donnée par : \[f_{X_{r}}(x)= \begin{cases} \displaystyle \frac{1}{2^{\frac{r}{2}} \times \Gamma \! \left(\frac{r}{2}\right)} \times \displaystyle x^{\frac{r}{2}-1} \times \exp \! \left(-\frac{x}{2}\right) & \text { si } x>0 \\ \hfill 0 \hfill & \text { si } x \leqslant 0 \rule[0pt]{0pt}{20pt}\end{cases}\]
On dit aussi que \(X_{r}\) suit une loi du \(\chi^{2}\) (« chi deux ») centré à \(r\) degrés de liberté, et on note : \(X_{r} \hookrightarrow \chi^{2}(r)\).
Étudier les variations de \(f_{X_{4}}\) et tracer sa courbe représentative dans un repère orthogonal du plan.
Montrer que la variable aléatoire \(\frac{X_{r}}{2}\) suit une loi \(\gamma\) de paramètre \(\frac{r}{2}\). En déduire \(\mathbb{E}\! \left(X_{r}\right)\) et \(\mathbb{V}\! \left(X_{r}\right)\).
Dans la suite, on pourra admettre que l’on prouverait de même que, si \(Y\) est une variable aléatoire suivant la loi \(\gamma\) de paramètre \(\frac{r}{2}\), alors \(2Y\) est une variable aléatoire suivant la loi \(\Gamma\) de paramètres \(\left( 2,\frac{r}{2} \right)\).
Déterminer \(\mathcal{D}_{X_{r}}\); pour tout \(s\) de \(\mathcal{D}_{X_{r}}\), calculer \(\Phi_{X_{r}}(s)\).
Soit \(n\) un entier de \(\mathbb{N}^{*}\). On considère \(n\) variables aléatoires indépendantes \(U_{1}, U_{2}, \ldots, U_{n}\) de même loi que \(U\). Pour tout \(i\) de \(\left[\!\left[1, n\right]\!\right]\), on pose : \(Z_{i}=U_{i}^{2}\).
Vérifier que \(X_{1}\) et \(U^{2}\) sont de même loi.
On pose : \(\displaystyle W_{n}=\sum_{i=1}^{n} Z_{i}\). Quelle est la loi de probabilité de \(W_{n}\) ? On pourra utiliser le résultat admis dans la question 5a.
Déterminer \(\mathcal{D}_{W_{n}}\), et pour tout \(s\) de \(\mathcal{D}_{W_{n}}\), exprimer \(\Phi_{W_{n}}(s)\) en fonction de \(s\) et de \(n\). Établir une relation entre \(\Phi_{W_{n}}(s)\) et \(\Phi_{Z_{1}}(s), \Phi_{Z_{2}}(s), \ldots, \Phi_{Z_{n}}(s)\).
Soit \(T\) une variable aléatoire qui suit la loi normale centrée, de variance \(\sigma^{2}\) inconnue, \(\sigma\) étant un réel strictement positif. Pour \(n\) entier supérieur ou égal à 2, on dispose d’un \(n\)-échantillon indépendant, identiquement distribué (i.i.d.), \(T_{1}, T_{2}, \ldots, T_{n}\) de la loi de \(T\). On considère la variable aléatoire \(S_{n}\) définie par : \(\displaystyle S_{n}=\frac{1}{n} \sum_{i=1}^{n} T_{i}^{2}\).
Montrer que \(S_{n}\) est un estimateur sans biais et convergent du paramètre \(\sigma^{2}\).
Soit \(\alpha\) un réel tel que \(0<\alpha<1\) et \(k_{\alpha}\) le réel strictement positif tel que : \(\mathbb{P}(W_{n} \geqslant k_{\alpha} )=1-\alpha\). Montrer que l’intervalle \(\left] 0, \frac{n S_{n}}{k_{\alpha}}\right]\) est un intervalle de confiance de \(\sigma^{2}\) au risque \(\alpha\).
On considère une suite \(\left(M_{j}\right)_{j \geqslant 1}\) de variables aléatoires définies sur un espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\), mutuellement indépendantes, telles que pour tout \(j\) de \(\mathbb{N}^{*}, M_{j}\) suive la loi normale d’espérance \(m_{j}\) \(\left(m_{j} \in \mathbb{R}\right)\) et de variance égale à 1.
Pour \(n\) entier de \(\mathbb{N}^{*}\), on pose : \(\displaystyle Y_{n}=\sum_{j=1}^{n} M_{j}^{2}\) et \(\displaystyle \lambda_{n}=\sum_{j=1}^{n} m_{j}^{2}\).
On dit que \(Y_{n}\) suit une loi du \(\chi^{2}\) décentré à \(n\) degrés de liberté, de paramètre de décentrage \(\lambda_{n}\), et on note : \(\displaystyle Y_{n} \hookrightarrow \chi^{2}\left(n, \lambda_{n}\right)\).
Dans cette question uniquement, on suppose que l’entier \(n\) est égal à 1.
Montrer les deux égalités suivantes : \(\mathbb{E}(U^{3})=0\) et \(\mathbb{E}(U^{4})=3\).
En déduire, en fonction de \(\lambda_{1}\), les valeurs respectives de \(\mathbb{E}(Y_{1})\) et de \(\mathbb{V}(Y_{1})\).
Montrer que : \(\mathcal{D}_{Y_{1}}=\left] -\infty, \frac{1}{2} \right[\) et établir, pour tout réel \(s\) de \(\mathcal{D}_{Y_{1}}\), la formule suivante : \[\Phi_{Y_{1}}(s)=(1-2 s)^{-1 / 2} \times \exp \! \left(\frac{s \lambda_{1}}{1-2 s}\right)\]
Soit \(n\) un entier de \(\mathbb{N}^{*}\).
Calculer \(\mathbb{E}(Y_{n})\) et \(\mathbb{V}(Y_{n})\) en fonction de \(n\) et \(\lambda_{n}\).
On admet que l’on a : \(\mathcal{D}_{Y_{n}}=\left] -\infty, \frac{1}{2}\right[\). Pour tout \(s\) de \(\mathcal{D}_{Y_{n}}\), exprimer \(\Phi_{Y_{n}}(s)\) en fonction de \(s, n\) et \(\lambda_{n}\).
Sur un espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\), on considère une variable aléatoire \(X\) à valeurs dans \(\mathbb{R}\) admettant une espérance \(\mathbb{E}(X)\), et une variable aléatoire \(K\) à valeurs dans \(\mathbb{N}\). On note \(N_{K}\) l’ensemble des entiers naturels \(k\) vérifiant \(\mathbb{P}( K=k )>0\), et on suppose que pour tout entier \(k\) de \(N_{K}\), la variable aléatoire \(X\) admet une espérance pour la probabilité conditionnelle \(\mathbb{P}_{[K=k]}\), notée \(\mathbb{E}(X \,\vert \, K=k)\).
On admet alors l’égalité suivante : \[\mathbb{E}(X)=\sum_{k \in N_{K}} \mathbb{E}(X \,\vert \, K=k) \,\mathbb{P}( K=k ) \tag{$\star$}\]
Soit \(g\) l’application définie sur \(\mathbb{N}\) par : \(g(k) = \begin{cases} \mathbb{E}(X \,\vert \, K=k) & \text { si } k \in N_{K} \\ \hfill 0 \hfill & \text { sinon } \end{cases}\).
Vérification de la formule \((\star)\) sur un exemple.
Soit \(\left(J_{i}\right)_{i \geqslant 1}\) une suite de variables aléatoires définies sur \((\Omega, \mathcal{A},\mathbb{P})\), indépendantes et de même loi uniforme sur l’intervalle \([0,1]\). Pour tout \(k\) de \(\mathbb{N}^{*}\), on pose : \(\displaystyle X_{k}=\sup _{1 \leqslant i \leqslant k}\left(J_{i}\right)\); autrement dit, pour tout \(\omega\) de \(\Omega\), \(\displaystyle X_{k}(\omega)=\max _{1 \leqslant i \leqslant k} J_{i}(\omega)\). Soit \(K\) une variable aléatoire définie sur \((\Omega, \mathcal{A}, \mathbb{P})\) qui suit la loi uniforme discrète sur \(\left[\!\left[1, n\right]\!\right]\) \(\left(n \in \mathbb{N}^{*}\right)\). On suppose que \(K\) est indépendante des variables aléatoires de la suite \(\left(J_{i}\right)_{i \geqslant 1}\).
Pour tout \(\omega\) de \(\Omega\), on pose : \(\displaystyle X(\omega)=\max _{1 \leqslant i \leqslant K(\omega)} J_{i}(\omega)\), et on admet que \(X\) est une variable aléatoire définie sur \((\Omega, \mathcal{A}, \mathbb{P})\).
Établir, pour tout entier \(k\) de \(\left[\!\left[1, n\right]\!\right]\) et pour tout réel \(x\), la relation : \[\mathbb{P}_{[K=k]}( X \leqslant x )=\mathbb{P}( X_{k} \leqslant x )\]
Déterminer la fonction de répartition \(F_{X}\) de la variable aléatoire \(X\).
En déduire que \(X\) est une variable aléatoire à densité, qui admet une espérance \(\mathbb{E}(X)\) que l’on exprimera en fonction de \(\displaystyle \sum_{k=1}^{n} \frac{k}{k+1}\).
Vérifier l’égalité \((\star)\) : \(\displaystyle \mathbb{E}(X)= \mathbb{E}(g(K))\).
Soit \(\left(U_{i}\right)_{i \geqslant 1}\) une suite de variables aléatoires indépendantes qui suivent la loi normale centrée réduite. Soit \(K\) une variable aléatoire indépendante des variables aléatoires de la suite \(\left(U_{i}\right)_{i \geqslant 1}\), qui suit la loi de Poisson de paramètre \(\dfrac{\lambda}{2}\) strictement positif.
Pour \(n\) entier de \(\mathbb{N}^{*}\), on pose : \(H_{n}=U_{1}^{2}+U_{2}^{2}+\cdots+U_{n+2 K}^{2}\). On admet que \(H_{n}\) est une variable aléatoire à densité à valeurs positives, et que \(\mathcal{D}_{H_{n}}=\left] -\infty, \frac{1}{2} \right[\).
Soit \(s\) un réel de \(\left] -\infty, \frac{1}{2} \right[\).
Montrer que pour tout \(k\) de \(\mathbb{N}\), la loi conditionnelle de \(H_{n}\) sachant \([K=k]\) est la loi de la variable aléatoire \(W_{n+2 k}\) définie dans la question I.6.b.
En posant : \(X= \mathrm{e}^{s H_{n}}\), déterminer, pour tout entier \(k\) de \(\mathbb{N}\), l’expression de \(g(k)\) en fonction de \(k\).
Établir la formule suivante : \[\mathbb{E}(g(K))=(1-2 s)^{-n / 2} \times \exp \! \left(\frac{\lambda s}{1-2 s}\right)\]
En utilisant l’égalité \((\star)\), admise au début de cette partie, avec \(X= \mathrm{e}^{s H_{n}}\), déterminer la loi de \(H_{n}\).
À l’aide de la question III.11.a, montrer que pour tout entier \(n\) supérieur ou égal à 3, on a : \[\mathbb{E}\! \left(\frac{1}{H_{n}}\right)=\mathbb{E}\! \left(\frac{1}{n-2+2 K}\right)\]
Soit \(p\) un entier supérieur ou égal à 3. On suppose qu’un modèle aléatoire défini sur \((\Omega, \mathcal{A}, \mathbb{P})\) comporte \(p\) paramètres réels inconnus \(\theta_{1}, \ldots, \theta_{p}\) non tous nuls. Un échantillon d’observations statistiques permet d’exhiber des estimateurs \(\widehat{\theta_{1}}, \ldots, \widehat{\theta_{p}}\) sans biais des paramètres \(\theta_{1}, \ldots, \theta_{p}\) respectivement. On suppose que les variables aléatoires \(\widehat{\theta_{1}}, \ldots, \widehat{\theta_{p}}\) sont indépendantes et suivent une loi normale de variance égale à 1.
On pose : \(\theta=\left(\theta_{1}, \ldots, \theta_{p}\right), \widehat{\theta}=(\widehat{\theta_{1}}, \ldots, \widehat{\theta_{p}})\), \(\displaystyle B_{p}=\sum_{j=1}^{p}{\widehat{\theta_{j}}}^{2}\) et \(\displaystyle b_{p}=\sum_{j=1}^{p} \theta_{j}^{2}\).
On dit que le vecteur aléatoire \(\widehat{\theta}\) est un estimateur sans biais du paramètre vectoriel \(\theta\), et \(\mathbb{E}(\widehat{\theta})\) est alors le vecteur \(\theta\).
On définit le risque quadratique scalaire d’un estimateur \(\theta^{*}\) de \(\theta\), noté \(R\left(\theta^{*}, \theta\right)\), par :
\[R(\theta^{*}, \theta)= \mathbb{E}\!\left(\sum_{j=1}^{p}\left(\theta_{j}^{*}-\theta_{j}\right)^{2}\right)\]
Dans cette partie, on cherche un estimateur \(\theta^{*}\) de \(\theta\), représenté par un vecteur aléatoire \(\left(\theta_{1}^{*}, \ldots, \theta_{p}^{*}\right)\), dont le risque \(R\left(\theta^{*}, \theta\right)\) est strictement inférieur à \(R(\widehat{\theta}, \theta)\).
Justifier que la variable aléatoire \(B_{p}\) suit la loi \(\chi^{2}\left(p, b_{p}\right)\), et qu’elle constitue un estimateur biaisé de \(b_{p}\).
On pose : \(\displaystyle \theta^{*}=\left(1-\frac{c}{B_{p}}\right) \times \widehat{\theta}\), où \(c\) est un paramètre réel strictement positif. Soit \(K\) une variable aléatoire qui suit la loi de Poisson de paramètre \(\displaystyle \frac{b_{p}}{2}\).
En admettant que l’on a : \(\displaystyle \mathbb{E}\!\left(\frac{1}{B_{p}} \sum_{j=1}^{p} \theta_{j} \widehat{\theta_{j}}\right)= \mathbb{E}\!\left(\frac{2 K}{p-2+2 K}\right)\), établir l’égalité suivante : \[R(\theta^{*}, \theta)-R(\widehat{\theta}, \theta)=\left[ c^{2}-2 c \left( p-2 \right)\right] \times \mathbb{E}\!\left(\frac{1}{p-2+2 K}\right)\]
Montrer que l’inégalité : \(R(\theta^{*}, \theta)<R(\widehat{\theta}, \theta)\), est vérifiée si et seulement si : \(0<c<2 \left( p-2 \right)\).
Déterminer en fonction de \(p\), la valeur de \(c\) pour laquelle \(R(\theta^{*}, \theta)-R(\widehat{\theta}, \theta)\) est minimale.
Comment s’écrit alors l’estimateur \(\theta^{*}\) ?
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.