En partenariat avec
Annale

HEC, ESCP 2017 Maths 2Maths approfondies

Connectez-vous pour consulter le corrigé.

Accès complet à tous les corrigés avec un abonnement.
Essai gratuit 48h — accès immédiat, sans CB.

ÉcoleHEC, ESCP
Année2017
ÉpreuveMaths 2
OptionECS
Thème principalProbabilités
ChapitresSuites, Fonctions, Calcul intégral, Intégrales impropres, Vecteurs aléatoires quelconques, Variables aléatoires à densité, Convergence et approximation, Estimation, Informatique

Dans tout le problème :

  • toutes les variables aléatoires introduites sont supposées définies sur le même espace probabilisé \((\Omega,\mathcal{A},\mathbb{P})\) ;

  • on note \(\theta\) un paramètre réel.

On admettra le théorème de Slutsky : si \((X_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en loi vers \(X\) et si \((Y_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en probabilité vers une constante réelle \(c\), alors : \[X_n+Y_n \overset{\mathscr L}{\longrightarrow}X+c \quad \text{et} \quad X_nY_n \overset{\mathscr L}{\longrightarrow}cX\]

Partie I. Une démonstration probabiliste de la formule de Stirling

Pour tout \(n\in\mathbb{N}^\ast\), soit \(h_n\) la fonction définie par : \[\forall x\in [0,1],\ h_n(x) = \left( \left( 1-x \right) \mathrm{e}^x \right)^n\]

Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(I_n=\displaystyle\int_0^1 h_n(x)\,\mathrm{d}x\).

    1. À l’aide du changement de variable \(u=n \left( 1-x \right)\), montrer que : \[\forall n \in \mathbb{N}^\ast,\ I_n= \frac{\mathrm{e}^n}{n^{n+1}} \int_0^n u^n \mathrm{e}^{-u}\,\mathrm{d}u\]

    2. Montrer que pour tout \(x\in \left[0,1\right[\), on a : \(x+\ln(1 -x) \leqslant -\dfrac{x^2}{2}\).

    3. En se référant à une densité de la loi normale centrée réduite, en déduire que : \[\forall n \in \mathbb{N}^\ast,\ 0 \leqslant I_n \leqslant \sqrt{\frac{\pi}{2n}}\]

  1. On note \(h_n^\ast\) la restriction à l’intervalle \(]0,1[\) de la fonction \(h_n\).

    On pose, pour tout \(x\in \left] 0,1\right[\) : \[h_n^\ast(x) = \exp\!\left( -\frac{nx^2}{2}\,H(x) \right) \quad\text{et}\quad g(x) = \left( 1-x \right) \ln(1-x) + x- \frac{x^2}{2}\]

    1. Montrer que \(H\) est prolongeable par continuité en \(0\). On note encore \(H\) la fonction ainsi prolongée.

    2. Montrer que la fonction \(g\) est convexe et strictement positive sur \(]0,1[\).

    3. En déduire que la fonction \(H\) réalise une bijection strictement croissante de \([0,1[\) sur \([1,{+\infty}[\).

  2. Soit \((u_n)_{n\in\mathbb{N}^\ast}\) une suite convergente de limite nulle telle que : \[\lim\limits_{n\to+\infty}u_n \sqrt{n}={+\infty}\quad \text{et} \quad \forall n \in \mathbb{N}^\ast,\ 0<u_n<1\]

    1. Donner un exemple d’une telle suite \((u_n)_{n\in\mathbb{N}^\ast}\).

    2. Soit \((v_n)_{n\in\mathbb{N}^\ast}\) la suite définie par : \(\forall n \in \mathbb{N}^\ast,\ v_n=H(u_n)\). Montrer que la suite \((v_n)_{n\in\mathbb{N}^\ast}\) est convergente et préciser sa limite.

    3. Établir pour tout \(n\in\mathbb{N}^\ast\), l’encadrement : \[I_n \geqslant \int_0^{u_n} h_n(x)\,\mathrm{d}x\geqslant \frac{1}{\sqrt{nv_n}} \int_0^{u_n\sqrt{nv_n}} \exp\!\left( -\frac{y^2}{2} \right) \mathrm{d}y\]

    4. Déduire des questions 1.c) et 3.c), un équivalent de \(I_n\) lorsque \(n\) tend vers \({+\infty}\).

  3. Soit \((T_n)_{n\in\mathbb{N}^\ast}\) une suite de variables aléatoires définies sur \((\Omega,\mathcal{A},\mathbb{P})\), mutuellement indépendantes et de même loi exponentielle de paramètre \(1\). Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(S_n=T_1+T_2+\cdots + T_n\).

    1. Rappeler la loi suivie par la variable aléatoire \(S_n\) et montrer que : \[\lim\limits_{n\to+\infty}\mathbb{P}([S_n \leqslant n])=\dfrac{1}{2}\]

    2. Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(U_n = \dfrac{T_{n+1}}{\sqrt{n}}\). Montrer que la suite \((U_n)_{n\in\mathbb{N}^\ast}\) converge en probabilité vers la constante \(0\).

    3. En déduire que \(\lim\limits_{n\to+\infty}\mathbb{P}([S_{n+1} \leqslant n]) = \dfrac{1}{2}\).

  4. Montrer que \(n! \underset{n\to+\infty}{\sim}n^n \mathrm{e}^{-n} \sqrt{2\pi n}\) (formule de Stirling).

Partie II. Quelques propriétés de la loi de Cauchy

  1. On rappelle que la fonction \(\mathrm{Arctan}\) est la fonction réciproque de la restriction à l’intervalle ouvert \(\left] - \dfrac{\pi}{2},\dfrac{\pi}{2} \right[\) de la fonction \(\tan\), qu’elle est de classe \(\mathcal{C}^\infty\) sur \(\mathbb{R}\), admettant pour dérivée la fonction \(x\mapsto \dfrac{1}{1+x^2}\) pour tout \(x\in\mathbb{R}\) et qu’elle réalise une bijection de \(\mathbb{R}\) sur \(\left] - \dfrac{\pi}{2},\dfrac{\pi}{2} \right[\).

    1. Montrer que la fonction \(\mathrm{Arctan}\) est impaire.

    2. Justifier l’existence d’un développement limité à l’ordre \(3\) de la fonction \(\mathrm{Arctan}\) en \(0\) et le déterminer.

    3. Établir pour tout \(x\in\mathbb{R}^+\), l’encadrement : \(0\leqslant \mathrm{Arctan}(x) \leqslant x\).

    4. Montrer que pour tout \(x\in\mathbb{R}_+^\ast\), on a : \(\mathrm{Arctan}(x) + \mathrm{Arctan}\!\left( \dfrac{1}{x} \right) = \dfrac{\pi}{2}\).

    1. Montrer que la fonction \(x\mapsto \dfrac{1}{\pi}\times \dfrac{1}{1+(x-\theta)^2}\) est une densité de probabilité sur \(\mathbb{R}\).

      Dans toute la suite du problème, on note \(X\) une variable aléatoire à valeurs réelles, de densité \(f_X\) telle que : \[\forall x\in\mathbb{R},\ f_X(x) = \dfrac{1}{\pi}\times \dfrac{1}{1+(x-\theta)^2}\]

      On dit que \(X\) suit une loi de Cauchy de paramètre \(\theta\) et on note : \(X\hookrightarrow \mathcal{C}_\theta\).

    2. La variable aléatoire \(X\) admet-elle une espérance ?

    3. Pour \(\theta = 0\), tracer la courbe représentative de \(f_X\) dans le plan rapporté à un repère orthogonal.

    1. On note \(F_X\) la fonction de répartition de \(X\). Pour tout \(x\in\mathbb{R}\), calculer \(F_X(x)\).

    2. Montrer que l’équation \(F_X(x)=\dfrac{1}{2}\) d’inconnue \(x\), admet une unique solution que l’on déterminera.

      Cette solution est la médiane théorique de \(X\).

Partie III. La loi de la moyenne empirique

  1. Pour tout \(n\in\mathbb{N}^\ast\) et pour tout \(x\in\mathbb{R}\), soit \(\varphi_{n,x}\) la fonction définie sur \(\mathbb{R}\) par : \[\forall t\in\mathbb{R},\ \varphi_{n,x}(t) = \frac{1}{(1+t^2) \left(1+ (x-nt)^2 \right)}\]

    On admet l’existence d’un unique quadruplet \((\alpha,\beta,\gamma,\delta)\) de réels indépendants de \(t\) pour lesquels on a : \[\forall t\in\mathbb{R},\ \varphi_{n,x}(t) = \frac{\alpha t+ \beta}{1+t^2} + \frac{\gamma t+ \delta}{1+(x-nt)^2}\]

    Pour tout \(n\in\mathbb{N}^\ast\) et pour tout \(x\in\mathbb{R}\), on pose : \[\sigma_{n,x} = \left( x^2 + (n+1)^2 \right) \left( x^2 + (n-1)^2 \right)\]

    On admet sans démonstration que : \[\alpha = \dfrac{2nx}{\sigma_{n,x}},\quad \beta = \frac{1+x^2-n^2}{\sigma_{n,x}},\quad \gamma = -\frac{2n^3x}{\sigma_{n,x}},\quad \delta= \frac{n^2 \left( 3x^2+n^2-1 \right)}{\sigma_{n,x}}\]

    1. Établir la convergence de l’intégrale \(\displaystyle\int_{-\infty}^{+\infty}\varphi_{n,x}(t)\,\mathrm{d}t\).

    2. À l’aide d’une primitive de la fonction \(\psi_{n,x} : t\mapsto \dfrac{2t}{1+t^2} - \dfrac{2n \left( nt-x \right)}{1+(x-nt)^2}\), montrer que \(\displaystyle\int_{-\infty}^{+\infty}\psi_{n,x}(t)\,\mathrm{d}t= 0\).

    3. Établir la relation : \(\forall n \in \mathbb{N}^\ast,\ \forall x\in\mathbb{R},\ \displaystyle\int_{-\infty}^{+\infty}\varphi_{n,x}(t)\,\mathrm{d}t= \dfrac{\left( n+1 \right) \pi}{x^2 + (n+1)^2}\).

  2. On pose : \(Y=X-\theta\). Pour \(n\) entier de \(\mathbb{N}^\ast\), soit \((Y_1,Y_2,\dots,Y_n)\) un \(n\)-échantillon de variables aléatoires indépendantes et de même loi que \(Y\).

    Pour tout \(n\in\mathbb{N}^\ast\), on pose : \(S_n=\displaystyle\sum_{i=1}^n Y_i\) et \(\overline{Y_n} = \dfrac{S_n}{n}\) (moyenne empirique de l’échantillon \((Y_1,Y_2,\dots,Y_n)\)).

    1. Déterminer la fonction de répartition \(F_Y\) de \(Y\). Quelle est la loi de \(Y\) ?

    2. Quelle est la fonction de répartition de \(S_2\) ? En déduire la loi de \(\overline{Y_2}\).

    3. Déterminer, pour tout \(n\in\mathbb{N}^\ast\), la loi de la variable aléatoire \(\overline{Y_n}\).

    4. La loi faible des grands nombres s’applique-t-elle à la suite \((\overline{Y_n})_{n\in\mathbb{N}^\ast}\) ? Pourquoi ?

  3. Soit \((N,n)\in(\mathbb{N}^{\ast})^2\). On veut simuler \(N\) réalisations de la moyenne empirique \(\overline{Y_n}\). On suppose qu’un programme Python débute par les instructions suivantes :

    import numpy as np
    import numpy.random as rd
    import matplotlib.pyplot as plt
    
    

    Soit \(M\) une matrice de \(\mathcal{M}_{N,n}(\mathbb{R})\) avec \((N,n)\in \mathbb{N}^{\ast 2}\). On rappelle que dans le langage Python :

    • la commande np.sum(M) retourne la somme de tous les éléments de \(M\) ;

    • la commande np.sum(M,0) retourne un vecteur ligne de \(\mathcal{M}_{1,n}(\mathbb{R})\) contenant les sommes des éléments de \(M\) calculées colonne par colonne ;

    • la commande np.sum(M,1) retourne un vecteur colonne de \(\mathcal{M}_{N,1}(\mathbb{R})\) contenant les sommes des éléments de \(M\) calculées ligne par ligne ;

    • la commande np.linspace(a,b,m) retourne un vecteur ligne de \(m\) valeurs régulièrement espacées entre \(a\) et \(b\) et l’on obtient le même vecteur avec la commande np.arange(a,b,r) en prenant \(r= \dfrac{b-a}{m-1}\) ;

    • la commande plt.hist(data,bins=y) permet de représenter les éléments du vecteur data sous la forme d’un histogramme ; les classes de l’histogramme sont définies par le vecteur strictement croissant y : si ce vecteur contient \(m\) éléments y(1),y(2),…,y(m) tels que y(1)<y(2)<\(\cdots\) <y(m), alors la première classe de l’histogramme est l’intervalle [y(1),y(2)] et les autres classes sont les intervalles ]y(i),y(i+1)] pour \(2\leqslant i \leqslant m\).

      1. Soit \(X\) une variable aléatoire suivant la loi \(\mathcal{C}_0\).

        • Montrer que la fonction de répartition \(F_X\) de \(X\) est bijective de \(\mathbb{R}\) sur \(]0,1[\) et déterminer sa réciproque \(F_X^{-1}\).

        • Déterminer la loi de \(F_X(X)\).

      2. Compléter la fonction cauchy suivante, en langage Python, pour qu’elle retourne une matrice \(A\in\mathcal{M}_{N,n}(\mathbb{R})\), réalisation d’une famille \((Y_{i,j})_{\substack{ 1 \leqslant i \leqslant N \\ 1\leqslant j \leqslant n}}\) de variables aléatoires indépendantes de loi \(\mathcal{C}_0\) :

        def cauchy(N,n):
            u=rd.random(.....)
            return ..........
        
        
    1. Compléter le programme Python suivant afin que la matrice MoyEmp contienne \(12000\) réalisations de la moyenne empirique \(\overline{Y}_{200}\).

      N=12000
      n=200
      A=cauchy(N,n)
      MoyEmp=..........
      x=np.arange(-8,8,0.5)
      plt.hist(MoyEmp,bins=x,density=True) # histogramme 1
      plt.hist(A[:,0],bins=x,density=True) # histogramme 2
      

      histogramme 1

      histogramme 2

    2. Les histogrammes 1 et 2 ont été obtenus à l’aide de ce programme. Expliquer en quoi ce couple d’histogrammes illustre le résultat de la question 10.c).

Partie IV. La loi de la médiane empirique

Dans les questions 13, 14 et 15, on suppose que le paramètre \(\theta\) est inconnu.

On rappelle que \(X\hookrightarrow \mathcal{C}_\theta\). Pour \(n\) entier de \(\mathbb{N}^\ast\), on note \((X_1,X_2,\dots,X_{2n+1})\) un \((2n+1)\)-échantillon de variables aléatoires indépendantes et de même loi que \(X\).

On admet l’existence de \((2n+1)\) fonctions \(g_1,g_2,\dots,g_{2n+1}\) continues sur \(\mathbb{R}^{2n+1}\) à valeurs réelles, telles que les variables aléatoires \(\widehat{X}_1,\widehat{X}_2,\dots,\widehat{X}_{2n+1}\) définies par : \[\forall k\in\left[\kern-0.15em\left[ {1,2n+1} \right]\kern-0.15em\right],\ \widehat{X}_k = g_k(X_1,X_2,\dots,X_{2n+1})\]

soient des variables aléatoires à densité et que, pour tout \(\omega\in \Omega\), les réels \(\widehat{X}_1(\omega),\widehat{X}_2(\omega),\dots,\widehat{X}_{2n+1}(\omega)\) soient un réarrangement par ordre croissant de \({X}_1(\omega),{X}_2(\omega),\dots,{X}_{2n+1}(\omega)\) : \[\forall \omega \in \Omega,\ \widehat{X}_1(\omega) \leqslant \widehat{X}_2(\omega) \leqslant \cdots \leqslant \widehat{X}_{2n+1}(\omega)\]

En particulier, la variable aléatoire \(\widehat{X}_{n+1}\) est la médiane empirique de l’échantillon \((X_1,X_2,\dots,X_{2n+1})\).

  1. Pour tout \(h\in\mathbb{R}_+^\ast\) et pour tout \(x\in\mathbb{R}\), on note \(Z\) la variable aléatoire discrète définie par : \[\forall \omega\in\Omega,\ Z(\omega) = \mathrm{Card}\{ i \in\left[\kern-0.15em\left[ {1,2n+1} \right]\kern-0.15em\right] ; \ x< X_i(\omega) < x+h \}\]

    On note \(A\) et \(B\) les deux événements suivants : \[A=[x < \widehat{X}_{n+1} \leqslant x+h ] \quad\text{et}\quad B= A\cap [Z=1]\]

    1. Établir la relation : \[\mathbb{P}(B) = (n+1) \binom{2n+1}n \left( F_X(x) \right)^n \left(F_X(x+h) - F_X(x) \right) \left( 1-F_X(x+h) \right)^n\]

    2. On suppose que le réel \(x\) est fixé. Montrer qu’il existe un réel \(K\) indépendant de \(h\) pour lequel on a : \[0 \leqslant \mathbb{P}(A) - \mathbb{P}(B) \leqslant K \left( F_X(x+h) - F_X(x) \right)^2\]

    3. Montrer que \(\widehat{X}_{n+1}\) admet une densité \(f_{\widehat{X}_{n+1}}\) donnée par : \[\forall x\in\mathbb{R},\ f_{\widehat{X}_{n+1}}(x) = (n+1) \binom{2n+1}n \left( F_X(x) \right)^n \left( 1-F_X(x) \right)^n f_X(x)\]

    1. Établir l’équivalence suivante : \[x f_{\widehat{X}_{n+1}}(x) \;\underset{x\to {+\infty}}{\sim}\;(n+1) \binom{2n+1}n \dfrac{1}{\pi^{n+1}} \times \dfrac{1}{x^{n+1}}\]

    2. En déduire l’existence de l’espérance \(\mathbb{E}(\widehat{X}_{n+1})\) de la variable aléatoire \(\widehat{X}_{n+1}\).

    3. Justifier que \(\widehat{X}_{n+1}\) est un estimateur du paramètre \(\theta\). Calculer \(\mathbb{E}(\widehat{X}_{n+1} - \theta)\). Conclure.

    4. À quelle condition nécessaire et suffisante portant sur \(n\), la variable aléatoire \(\widehat{X}_{n+1}\) admet-elle une variance ?

  2. On note \(F_{\widehat{X}_{n+1}}\) la fonction de répartition de \(\widehat{X}_{n+1}\). Soit \(\varepsilon\) un réel strictement positif.

    1. Établir la relation : \(\forall t\in\mathbb{R},\ f_{\widehat{X}_{n+1}}(2\theta - t) = f_{\widehat{X}_{n+1}}(t)\). En déduire que : \[\mathbb{P}\!\left(\left[ \left| \widehat{X}_{n+1} - \theta \right| \geqslant \varepsilon \right]\right) = 2\,F_{\widehat{X}_{n+1}}(\theta - \varepsilon)\]

    2. Montrer que la suite d’estimateurs \((\widehat{X}_{n+1})_{n\in\mathbb{N}^\ast}\) converge en probabilité vers \(\theta\).

    3. La suite \((\widehat{X}_{n+1})_{n\in\mathbb{N}^\ast}\) converge-t-elle en loi vers la variable aléatoire certaine \(\theta\) ?

  3. Pour tout entier \(n\geqslant 2\), on pose : \(W_{n+1} = \dfrac{2\sqrt{2n+1}}{\pi}\left( \widehat{X}_{n+1} - \theta \right)\).

    1. On note \(f_{W_{n+1}}\) la densité continue sur \(\mathbb{R}\) de \(W_{n+1}\). Montrer que : \begin{align*} &\forall x\in\mathbb{R},\ f_{W_{n+1}}(x) \\ &= \frac{n+1}{2\sqrt{2n+1}} \binom {2n+1}n \left[ \frac{1}{4} - \frac{1}{\pi^2} \left( \mathrm{Arctan}\!\left( \dfrac{\pi x}{2\sqrt{2n+1}} \right) \right) ^2 \right]^n \left( 1+ \frac{\pi^2 x^2}{4 \left( 2n+1 \right)} \right)^{-1} \end{align*}

    2. Montrer que pour tout \(x\in\mathbb{R}\), on a : \[\lim\limits_{n\to+\infty}f_{W_{n+1}}(x) = \frac{1}{\sqrt{2\pi}} \,\exp\!\left( -\frac{x^2}{2} \right).\]

      On admet que ce résultat implique la convergence en loi de la suite de variables aléatoires \((W_{n+1})_{n\geqslant 2}\) vers une variable aléatoire \(T\) qui suit la loi normale centrée réduite.

    3. On note \(\Phi\) la fonction de répartition de \(T\). Soit \(\alpha\) un réel vérifiant \(0<\alpha <1\) ; on pose \(t_\alpha = \Phi^{-1}\!\left( 1- \dfrac{\alpha}{2}\right)\).

      Déterminer un intervalle de confiance asymptotique pour \(\theta\), centré sur \(\widehat{X}_{n+1}\), au niveau de confiance \(1-\alpha\).

  4. Dans le langage Python la fonction np.sort permet de trier les éléments d’une matrice réelle \(A\) :

    • la commande np.sort(A,0) renvoie une copie de \(A\) triée colonne par colonne, par ordre croissant (chaque colonne est triée indépendamment des autres) ;

    • la commande gsort(A,1) renvoie une copie de \(A\) triée ligne par ligne, par ordre croissant (chaque ligne est triée indépendamment des autres).

    On suppose que \(\theta=0\) et on considère \(p\) réalisations \((p\geqslant 10^4\)) de \((X_1,X_2,\dots,X_{2n+1})\).

    Recopier et compléter le code suivant, en langage Python, afin que son exécution affecte au vecteur MedianeEmp \(p\) réalisations de la médiane \(\widehat{X}_{n+1}\), puis au vecteur W \(p\) réalisations de \(W_{n+1}\).

    A=cauchy(p,2*n+1)
    S=..............
    MedianeEmp=.....
    W=..............

Tu veux le corrigé détaillé ?

Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.

error: Ce contenu est protégé !