Connectez-vous pour consulter le corrigé.
Dans tout le problème :
toutes les variables aléatoires introduites sont supposées définies sur le même espace probabilisé \((\Omega,\mathcal{A},\mathbb{P})\) ;
on note \(\theta\) un paramètre réel.
On admettra le théorème de Slutsky : si \((X_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en loi vers \(X\) et si \((Y_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en probabilité vers une constante réelle \(c\), alors : \[X_n+Y_n \overset{\mathscr L}{\longrightarrow}X+c \quad \text{et} \quad X_nY_n \overset{\mathscr L}{\longrightarrow}cX\]
Pour tout \(n\in\mathbb{N}^\ast\), soit \(h_n\) la fonction définie par : \[\forall x\in [0,1],\ h_n(x) = \left( \left( 1-x \right) \mathrm{e}^x \right)^n\]
Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(I_n=\displaystyle\int_0^1 h_n(x)\,\mathrm{d}x\).
À l’aide du changement de variable \(u=n \left( 1-x \right)\), montrer que : \[\forall n \in \mathbb{N}^\ast,\ I_n= \frac{\mathrm{e}^n}{n^{n+1}} \int_0^n u^n \mathrm{e}^{-u}\,\mathrm{d}u\]
Montrer que pour tout \(x\in \left[0,1\right[\), on a : \(x+\ln(1 -x) \leqslant -\dfrac{x^2}{2}\).
En se référant à une densité de la loi normale centrée réduite, en déduire que : \[\forall n \in \mathbb{N}^\ast,\ 0 \leqslant I_n \leqslant \sqrt{\frac{\pi}{2n}}\]
On note \(h_n^\ast\) la restriction à l’intervalle \(]0,1[\) de la fonction \(h_n\).
On pose, pour tout \(x\in \left] 0,1\right[\) : \[h_n^\ast(x) = \exp\!\left( -\frac{nx^2}{2}\,H(x) \right) \quad\text{et}\quad g(x) = \left( 1-x \right) \ln(1-x) + x- \frac{x^2}{2}\]
Montrer que \(H\) est prolongeable par continuité en \(0\). On note encore \(H\) la fonction ainsi prolongée.
Montrer que la fonction \(g\) est convexe et strictement positive sur \(]0,1[\).
En déduire que la fonction \(H\) réalise une bijection strictement croissante de \([0,1[\) sur \([1,{+\infty}[\).
Soit \((u_n)_{n\in\mathbb{N}^\ast}\) une suite convergente de limite nulle telle que : \[\lim\limits_{n\to+\infty}u_n \sqrt{n}={+\infty}\quad \text{et} \quad \forall n \in \mathbb{N}^\ast,\ 0<u_n<1\]
Donner un exemple d’une telle suite \((u_n)_{n\in\mathbb{N}^\ast}\).
Soit \((v_n)_{n\in\mathbb{N}^\ast}\) la suite définie par : \(\forall n \in \mathbb{N}^\ast,\ v_n=H(u_n)\). Montrer que la suite \((v_n)_{n\in\mathbb{N}^\ast}\) est convergente et préciser sa limite.
Établir pour tout \(n\in\mathbb{N}^\ast\), l’encadrement : \[I_n \geqslant \int_0^{u_n} h_n(x)\,\mathrm{d}x\geqslant \frac{1}{\sqrt{nv_n}} \int_0^{u_n\sqrt{nv_n}} \exp\!\left( -\frac{y^2}{2} \right) \mathrm{d}y\]
Déduire des questions 1.c) et 3.c), un équivalent de \(I_n\) lorsque \(n\) tend vers \({+\infty}\).
Soit \((T_n)_{n\in\mathbb{N}^\ast}\) une suite de variables aléatoires définies sur \((\Omega,\mathcal{A},\mathbb{P})\), mutuellement indépendantes et de même loi exponentielle de paramètre \(1\). Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(S_n=T_1+T_2+\cdots + T_n\).
Rappeler la loi suivie par la variable aléatoire \(S_n\) et montrer que : \[\lim\limits_{n\to+\infty}\mathbb{P}([S_n \leqslant n])=\dfrac{1}{2}\]
Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(U_n = \dfrac{T_{n+1}}{\sqrt{n}}\). Montrer que la suite \((U_n)_{n\in\mathbb{N}^\ast}\) converge en probabilité vers la constante \(0\).
En déduire que \(\lim\limits_{n\to+\infty}\mathbb{P}([S_{n+1} \leqslant n]) = \dfrac{1}{2}\).
Montrer que \(n! \underset{n\to+\infty}{\sim}n^n \mathrm{e}^{-n} \sqrt{2\pi n}\) (formule de Stirling).
On rappelle que la fonction \(\mathrm{Arctan}\) est la fonction réciproque de la restriction à l’intervalle ouvert \(\left] - \dfrac{\pi}{2},\dfrac{\pi}{2} \right[\) de la fonction \(\tan\), qu’elle est de classe \(\mathcal{C}^\infty\) sur \(\mathbb{R}\), admettant pour dérivée la fonction \(x\mapsto \dfrac{1}{1+x^2}\) pour tout \(x\in\mathbb{R}\) et qu’elle réalise une bijection de \(\mathbb{R}\) sur \(\left] - \dfrac{\pi}{2},\dfrac{\pi}{2} \right[\).
Montrer que la fonction \(\mathrm{Arctan}\) est impaire.
Justifier l’existence d’un développement limité à l’ordre \(3\) de la fonction \(\mathrm{Arctan}\) en \(0\) et le déterminer.
Établir pour tout \(x\in\mathbb{R}^+\), l’encadrement : \(0\leqslant \mathrm{Arctan}(x) \leqslant x\).
Montrer que pour tout \(x\in\mathbb{R}_+^\ast\), on a : \(\mathrm{Arctan}(x) + \mathrm{Arctan}\!\left( \dfrac{1}{x} \right) = \dfrac{\pi}{2}\).
Montrer que la fonction \(x\mapsto \dfrac{1}{\pi}\times \dfrac{1}{1+(x-\theta)^2}\) est une densité de probabilité sur \(\mathbb{R}\).
Dans toute la suite du problème, on note \(X\) une variable aléatoire à valeurs réelles, de densité \(f_X\) telle que : \[\forall x\in\mathbb{R},\ f_X(x) = \dfrac{1}{\pi}\times \dfrac{1}{1+(x-\theta)^2}\]
On dit que \(X\) suit une loi de Cauchy de paramètre \(\theta\) et on note : \(X\hookrightarrow \mathcal{C}_\theta\).
La variable aléatoire \(X\) admet-elle une espérance ?
Pour \(\theta = 0\), tracer la courbe représentative de \(f_X\) dans le plan rapporté à un repère orthogonal.
On note \(F_X\) la fonction de répartition de \(X\). Pour tout \(x\in\mathbb{R}\), calculer \(F_X(x)\).
Montrer que l’équation \(F_X(x)=\dfrac{1}{2}\) d’inconnue \(x\), admet une unique solution que l’on déterminera.
Cette solution est la médiane théorique de \(X\).
Pour tout \(n\in\mathbb{N}^\ast\) et pour tout \(x\in\mathbb{R}\), soit \(\varphi_{n,x}\) la fonction définie sur \(\mathbb{R}\) par : \[\forall t\in\mathbb{R},\ \varphi_{n,x}(t) = \frac{1}{(1+t^2) \left(1+ (x-nt)^2 \right)}\]
On admet l’existence d’un unique quadruplet \((\alpha,\beta,\gamma,\delta)\) de réels indépendants de \(t\) pour lesquels on a : \[\forall t\in\mathbb{R},\ \varphi_{n,x}(t) = \frac{\alpha t+ \beta}{1+t^2} + \frac{\gamma t+ \delta}{1+(x-nt)^2}\]
Pour tout \(n\in\mathbb{N}^\ast\) et pour tout \(x\in\mathbb{R}\), on pose : \[\sigma_{n,x} = \left( x^2 + (n+1)^2 \right) \left( x^2 + (n-1)^2 \right)\]
On admet sans démonstration que : \[\alpha = \dfrac{2nx}{\sigma_{n,x}},\quad \beta = \frac{1+x^2-n^2}{\sigma_{n,x}},\quad \gamma = -\frac{2n^3x}{\sigma_{n,x}},\quad \delta= \frac{n^2 \left( 3x^2+n^2-1 \right)}{\sigma_{n,x}}\]
Établir la convergence de l’intégrale \(\displaystyle\int_{-\infty}^{+\infty}\varphi_{n,x}(t)\,\mathrm{d}t\).
À l’aide d’une primitive de la fonction \(\psi_{n,x} : t\mapsto \dfrac{2t}{1+t^2} - \dfrac{2n \left( nt-x \right)}{1+(x-nt)^2}\), montrer que \(\displaystyle\int_{-\infty}^{+\infty}\psi_{n,x}(t)\,\mathrm{d}t= 0\).
Établir la relation : \(\forall n \in \mathbb{N}^\ast,\ \forall x\in\mathbb{R},\ \displaystyle\int_{-\infty}^{+\infty}\varphi_{n,x}(t)\,\mathrm{d}t= \dfrac{\left( n+1 \right) \pi}{x^2 + (n+1)^2}\).
On pose : \(Y=X-\theta\). Pour \(n\) entier de \(\mathbb{N}^\ast\), soit \((Y_1,Y_2,\dots,Y_n)\) un \(n\)-échantillon de variables aléatoires indépendantes et de même loi que \(Y\).
Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(S_n=\displaystyle\sum_{i=1}^n Y_i\) et \(\overline{Y_n} = \dfrac{S_n}{n}\) (moyenne empirique de l’échantillon \((Y_1,Y_2,\dots,Y_n)\)).
Déterminer la fonction de répartition \(F_Y\) de \(Y\). Quelle est la loi de \(Y\) ?
Quelle est la fonction de répartition de \(S_2\) ? En déduire la loi de \(\overline{Y_2}\).
Déterminer, pour tout \(n\in\mathbb{N}^\ast\), la loi de la variable aléatoire \(\overline{Y_n}\).
La loi faible des grands nombres s’applique-t-elle à la suite \((\overline{Y_n})_{n\in\mathbb{N}^\ast}\) ? Pourquoi ?
Soit \((N,n)\in(\mathbb{N}^{\ast})^2\). On veut
simuler \(N\) réalisations de la
moyenne empirique \(\overline{Y_n}\).
On suppose qu’un programme Python débute par
les instructions suivantes :
import numpy as np import numpy.random as rd import matplotlib.pyplot as plt
Soit \(M\) une matrice de \(\mathcal{M}_{N,n}(\mathbb{R})\) avec \((N,n)\in \mathbb{N}^{\ast 2}\). On
rappelle que dans le langage Python :
la commande np.sum(M) retourne la somme
de tous les éléments de \(M\)
;
la commande np.sum(M,0) retourne un
vecteur ligne de \(\mathcal{M}_{1,n}(\mathbb{R})\) contenant
les sommes des éléments de \(M\)
calculées colonne par colonne ;
la commande np.sum(M,1) retourne un
vecteur colonne de \(\mathcal{M}_{N,1}(\mathbb{R})\) contenant
les sommes des éléments de \(M\)
calculées ligne par ligne ;
la commande np.linspace(a,b,m) retourne
un vecteur ligne de \(m\) valeurs
régulièrement espacées entre \(a\) et
\(b\) et l’on obtient le même vecteur
avec la commande np.arange(a,b,r) en prenant
\(r= \dfrac{b-a}{m-1}\) ;
la commande plt.hist(data,bins=y)
permet de représenter les éléments du vecteur
data sous la forme d’un histogramme ; les
classes de l’histogramme sont définies par le vecteur strictement
croissant y : si ce vecteur contient \(m\) éléments
y(1),y(2),…,y(m) tels que
y(1)<y(2)<\(\cdots\) <y(m),
alors la première classe de l’histogramme est l’intervalle
[y(1),y(2)] et les autres classes sont les
intervalles ]y(i),y(i+1)] pour \(2\leqslant i \leqslant m\).
Soit \(X\) une variable aléatoire suivant la loi \(\mathcal{C}_0\).
Montrer que la fonction de répartition \(F_X\) de \(X\) est bijective de \(\mathbb{R}\) sur \(]0,1[\) et déterminer sa réciproque \(F_X^{-1}\).
Déterminer la loi de \(F_X(X)\).
Compléter la fonction cauchy suivante,
en langage Python, pour qu’elle retourne une
matrice \(A\in\mathcal{M}_{N,n}(\mathbb{R})\),
réalisation d’une famille \((Y_{i,j})_{\substack{ 1 \leqslant i \leqslant N \\
1\leqslant j \leqslant n}}\) de variables aléatoires
indépendantes de loi \(\mathcal{C}_0\)
:
def cauchy(N,n):
u=rd.random(.....)
return ..........
Compléter le programme Python suivant
afin que la matrice MoyEmp contienne \(12000\) réalisations de la moyenne
empirique \(\overline{Y}_{200}\).
N=12000 n=200 A=cauchy(N,n) MoyEmp=.......... x=np.arange(-8,8,0.5) plt.hist(MoyEmp,bins=x,density=True) # histogramme 1 plt.hist(A[:,0],bins=x,density=True) # histogramme 2
histogramme 1
histogramme 2
Les histogrammes 1 et 2 ont été obtenus à l’aide de ce programme. Expliquer en quoi ce couple d’histogrammes illustre le résultat de la question 10.c).
Dans les questions 13, 14 et 15, on suppose que le paramètre \(\theta\) est inconnu.
On rappelle que \(X\hookrightarrow \mathcal{C}_\theta\). Pour \(n\) entier de \(\mathbb{N}^\ast\), on note \((X_1,X_2,\dots,X_{2n+1})\) un \((2n+1)\)-échantillon de variables aléatoires indépendantes et de même loi que \(X\).
On admet l’existence de \((2n+1)\) fonctions \(g_1,g_2,\dots,g_{2n+1}\) continues sur \(\mathbb{R}^{2n+1}\) à valeurs réelles, telles que les variables aléatoires \(\widehat{X}_1,\widehat{X}_2,\dots,\widehat{X}_{2n+1}\) définies par : \[\forall k\in\left[\kern-0.15em\left[ {1,2n+1} \right]\kern-0.15em\right],\ \widehat{X}_k = g_k(X_1,X_2,\dots,X_{2n+1})\]
soient des variables aléatoires à densité et que, pour tout \(\omega\in \Omega\), les réels \(\widehat{X}_1(\omega),\widehat{X}_2(\omega),\dots,\widehat{X}_{2n+1}(\omega)\) soient un réarrangement par ordre croissant de \({X}_1(\omega),{X}_2(\omega),\dots,{X}_{2n+1}(\omega)\) : \[\forall \omega \in \Omega,\ \widehat{X}_1(\omega) \leqslant \widehat{X}_2(\omega) \leqslant \cdots \leqslant \widehat{X}_{2n+1}(\omega)\]
En particulier, la variable aléatoire \(\widehat{X}_{n+1}\) est la médiane empirique de l’échantillon \((X_1,X_2,\dots,X_{2n+1})\).
Pour tout \(h\in\mathbb{R}_+^\ast\) et pour tout \(x\in\mathbb{R}\), on note \(Z\) la variable aléatoire discrète définie par : \[\forall \omega\in\Omega,\ Z(\omega) = \mathrm{Card}\{ i \in\left[\kern-0.15em\left[ {1,2n+1} \right]\kern-0.15em\right] ; \ x< X_i(\omega) < x+h \}\]
On note \(A\) et \(B\) les deux événements suivants : \[A=[x < \widehat{X}_{n+1} \leqslant x+h ] \quad\text{et}\quad B= A\cap [Z=1]\]
Établir la relation : \[\mathbb{P}(B) = (n+1) \binom{2n+1}n \left( F_X(x) \right)^n \left(F_X(x+h) - F_X(x) \right) \left( 1-F_X(x+h) \right)^n\]
On suppose que le réel \(x\) est fixé. Montrer qu’il existe un réel \(K\) indépendant de \(h\) pour lequel on a : \[0 \leqslant \mathbb{P}(A) - \mathbb{P}(B) \leqslant K \left( F_X(x+h) - F_X(x) \right)^2\]
Montrer que \(\widehat{X}_{n+1}\) admet une densité \(f_{\widehat{X}_{n+1}}\) donnée par : \[\forall x\in\mathbb{R},\ f_{\widehat{X}_{n+1}}(x) = (n+1) \binom{2n+1}n \left( F_X(x) \right)^n \left( 1-F_X(x) \right)^n f_X(x)\]
Établir l’équivalence suivante : \[x f_{\widehat{X}_{n+1}}(x) \;\underset{x\to {+\infty}}{\sim}\;(n+1) \binom{2n+1}n \dfrac{1}{\pi^{n+1}} \times \dfrac{1}{x^{n+1}}\]
En déduire l’existence de l’espérance \(\mathbb{E}(\widehat{X}_{n+1})\) de la variable aléatoire \(\widehat{X}_{n+1}\).
Justifier que \(\widehat{X}_{n+1}\) est un estimateur du paramètre \(\theta\). Calculer \(\mathbb{E}(\widehat{X}_{n+1} - \theta)\). Conclure.
À quelle condition nécessaire et suffisante portant sur \(n\), la variable aléatoire \(\widehat{X}_{n+1}\) admet-elle une variance ?
On note \(F_{\widehat{X}_{n+1}}\) la fonction de répartition de \(\widehat{X}_{n+1}\). Soit \(\varepsilon\) un réel strictement positif.
Établir la relation : \(\forall t\in\mathbb{R},\ f_{\widehat{X}_{n+1}}(2\theta - t) = f_{\widehat{X}_{n+1}}(t)\). En déduire que : \[\mathbb{P}\!\left(\left[ \left| \widehat{X}_{n+1} - \theta \right| \geqslant \varepsilon \right]\right) = 2\,F_{\widehat{X}_{n+1}}(\theta - \varepsilon)\]
Montrer que la suite d’estimateurs \((\widehat{X}_{n+1})_{n\in\mathbb{N}^\ast}\) converge en probabilité vers \(\theta\).
La suite \((\widehat{X}_{n+1})_{n\in\mathbb{N}^\ast}\) converge-t-elle en loi vers la variable aléatoire certaine \(\theta\) ?
Pour tout entier \(n\geqslant 2\), on pose : \(W_{n+1} = \dfrac{2\sqrt{2n+1}}{\pi}\left( \widehat{X}_{n+1} - \theta \right)\).
On note \(f_{W_{n+1}}\) la densité continue sur \(\mathbb{R}\) de \(W_{n+1}\). Montrer que : \begin{align*} &\forall x\in\mathbb{R},\ f_{W_{n+1}}(x) \\ &= \frac{n+1}{2\sqrt{2n+1}} \binom {2n+1}n \left[ \frac{1}{4} - \frac{1}{\pi^2} \left( \mathrm{Arctan}\!\left( \dfrac{\pi x}{2\sqrt{2n+1}} \right) \right) ^2 \right]^n \left( 1+ \frac{\pi^2 x^2}{4 \left( 2n+1 \right)} \right)^{-1} \end{align*}
Montrer que pour tout \(x\in\mathbb{R}\), on a : \[\lim\limits_{n\to+\infty}f_{W_{n+1}}(x) = \frac{1}{\sqrt{2\pi}} \,\exp\!\left( -\frac{x^2}{2} \right).\]
On admet que ce résultat implique la convergence en loi de la suite de variables aléatoires \((W_{n+1})_{n\geqslant 2}\) vers une variable aléatoire \(T\) qui suit la loi normale centrée réduite.
On note \(\Phi\) la fonction de répartition de \(T\). Soit \(\alpha\) un réel vérifiant \(0<\alpha <1\) ; on pose \(t_\alpha = \Phi^{-1}\!\left( 1- \dfrac{\alpha}{2}\right)\).
Déterminer un intervalle de confiance asymptotique pour \(\theta\), centré sur \(\widehat{X}_{n+1}\), au niveau de confiance \(1-\alpha\).
Dans le langage Python la fonction
np.sort permet de trier les éléments d’une
matrice réelle \(A\) :
la commande np.sort(A,0) renvoie une
copie de \(A\) triée colonne par
colonne, par ordre croissant (chaque colonne est triée indépendamment
des autres) ;
la commande gsort(A,1) renvoie une
copie de \(A\) triée ligne par ligne,
par ordre croissant (chaque ligne est triée indépendamment des
autres).
On suppose que \(\theta=0\) et on considère \(p\) réalisations \((p\geqslant 10^4\)) de \((X_1,X_2,\dots,X_{2n+1})\).
Recopier et compléter le code suivant, en langage
Python, afin que son exécution affecte au
vecteur MedianeEmp \(p\) réalisations de la médiane \(\widehat{X}_{n+1}\), puis au vecteur
W \(p\)
réalisations de \(W_{n+1}\).
A=cauchy(p,2*n+1) S=.............. MedianeEmp=..... W=..............
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.