En partenariat avec
Annale

HEC 2017Maths appliquées

Connectez-vous pour consulter le corrigé.

Accès complet à tous les corrigés avec un abonnement.
Essai gratuit 48h — accès immédiat, sans CB.

ÉcoleHEC
Année2017
OptionECE
Thème principalAlgèbre, Probabilités
ChapitresCalcul matriciel, Espaces vectoriels, Applications linéaires, Diagonalisation, Intégrales impropres, Vecteurs aléatoires quelconques, Variables aléatoires à densité, Convergence et approximation, Informatique

Exercice

Pour tout \(n \in \mathbb{N}^*\), on note \({\cal M}_n(\mathbb{R})\) l’ensemble des matrices carrées à \(n\) lignes et \(n\) colonnes à coefficients réels et \({\cal B}_n(\mathbb{R})\) l’ensemble des matrices carrées de \({\cal M}_n(\mathbb{R})\) dont tous les coefficients sont égaux à \(0\) ou à \(1\).

  1. Exemple 1. Soit \(A\) la matrice de \({\cal B}_2(\mathbb{R})\) définie par : \(A=\begin{pmatrix}0&1\\1&0\end{pmatrix}\).

    1. Calculer \(A^2\).

    2. Quelles sont les valeurs propres de \(A\)?

    3. La matrice \(A\) est-elle diagonalisable?

  2. Exemple 2. Soit \(B\) la matrice de \({\cal B}(\mathbb{R})\) définie par : \(B=\begin{pmatrix}0&1&0\\1&0&0\\0&0&1\end{pmatrix}\).
    On considère les instructions et la sortie Python suivantes :

    1. Déduire les valeurs propres de \(B\) de la séquence Python précédente.

    2. Donner une base de chacun des sous-espaces propres de \(B\).

    1. Combien existe-t-il de matrices appartenant à \({\cal B}_n(\mathbb{R})\) ?

    2. Combien existe-t-il de matrices de \({\cal B}_n(\mathbb{R})\) dont chaque ligne et chaque colonne comporte exactement un coefficient égal à 1?

  3. Dans cette question, \(n\) est un entier supérieur ou égal à \(2\) et \(A\) est une matrice de \(\mathcal{M}_n(\mathbb{R})\). Pour toute matrice \(M\) de \(\mathcal{M}_n(\mathbb{R})\), on assimile la matrice \(M\) à l’endomorphisme \(f:X\mapsto MX\) de \(\mathcal{M}_{n,1}(\mathbb{R})\), ce qui signifie que l’on peut noter \(\mathrm{Ker}(M)\) le noyau de \(f\) et \(\mathrm{Im}(M)\) l’image de \(f\).

    On note :

    • \(\mathrm{I}_n\) la matrice identité de \(\mathcal{M}_n(\mathbb{R})\) ;

    • \(F\) le noyau de \(A+ \mathrm{I}_n\) et \(G\) le noyau de \(A-\mathrm{I}_n\);

    • \(p\) la dimension de \(F\) et \(q\) la dimension de \(G\).

    On suppose que \(A^2=\mathrm{I}_n\).

    1. Justifier que l’image de \(A-\mathrm{I}_n\) est incluse dans \(F\).

    2. En déduire l’inégalité : \(p+q \geqslant n\).
      On suppose désormais que \(1 \leqslant p < q\). Soit \((X_1,X_2, \ldots,X_p)\) une base de \(F\) et \((Y_1,Y_2, \ldots,Y_q)\) une base de \(G\).

    3. Justifier que \(( X_1,X_2, \ldots,X_p, Y_1,Y_2, \ldots,Y_q)\) est une base de \(\mathcal{M}_{n,1}(\mathbb{R})\).

    4. Calculer \(A \left( Y_1-X_1 \right)\) et \(A \left( Y_1+X_1 \right)\).

    5. Montrer que \(A\) est semblable à une matrice appartenant à \({\cal B}_n(\mathbb{R})\).

Problème

Les tables de mortalité sont utilisées en démographie et en actuariat pour prévoir l’espérance de vie des individus d’une population. On s’intéresse dans ce problème à un modèle qui permet d’ajuster la durée de vie à des statistiques portant sur les décès observés au sein d’une génération.

Dans tout le problème, on note :

  • \(a\) et \(b\) deux réels strictement positifs;

  • \((\Omega,\mathcal{A},\mathbb{P})\) un espace probabilisé sur lequel sont définies toutes les variables aléatoires du problème;

  • \(G_{a,b}\) la fonction définie sur \(\mathbb{R}_+\) par : \(G_{a,b}(x)=\exp \! \left(-ax-\dfrac{b}2 \, x^2\right)\).

Partie I. Loi exponentielle linéaire

    1. Montrer que la fonction \(G_{a,b}\) réalise une bijection de \(\mathbb{R}_+\) sur l’intervalle \(]0,1]\).

    2. Pour tout réel \(y>0\), résoudre l’équation d’inconnue \(x \in \mathbb{R}\) : \(ax+\dfrac{b}2 \ x^2=y\).

    3. On note \(G^{-1}_{a,b}\) la bijection réciproque de \(G_{a,b}\). Quelle est, pour tout \(u \in [0,1[\), l’expression de \(G^{-1}_{a,b}(1-u)\) ?

    1. Justifier la convergence de l’intégrale \(\displaystyle \int_0^{+\infty} G_{a,b}(x) \,\mathrm{d}x\).

    2. Soit \(f\) la fonction définie sur \(\mathbb{R}\) par : \(f(x)=\sqrt{\dfrac{b}{2\pi}}\times \exp\left(-\dfrac{1}{2} \, b \left(x+\dfrac{a}{b}\right)^2\right)\).

      Montrer que \(f\) est une densité d’une variable aléatoire suivant une loi normale dont on précisera les paramètres (espérance et variance).

    3. Soit \(\Phi\) la fonction de répartition de la loi normale centrée réduite. Déduire de la question 2.b), l’égalité : \[\int_0^{+\infty} G_{a,b}(x) \,\mathrm{d}x= \sqrt{\dfrac{2\pi}{b}} \times \exp \! \left(\dfrac{a^2}{2b}\right) \times \Phi\left(-\ \dfrac{a}{\sqrt{b}}\right)\]

  1. Pour tout \(a>0\) et pour tout \(b>0\), on pose : \(f_{a,b}(x)=\begin{cases}(a+bx) \, \exp \! \left(-ax-\dfrac{b}{2} \, x^2 \right)&\hbox{ si } x\geqslant 0\\ 0&\hbox{ si }x <0\end{cases}\).

    1. Justifier que \(f_{a,b}\) est une densité de probabilité.

      On dit qu’une variable aléatoire suit la loi exponentielle linéaire de paramètres \(a\) et \(b\), notée \({\cal E}_{\ell}(a,b)\) si elle admet \(f_{a,b}\) pour densité.

    2. Soit \(X\) une variable aléatoire suivant la loi \({\cal E}_{\ell}(a,b)\). À l’aide d’une intégration par parties, justifier que \(X\) admet une espérance telle que : \(\mathbb{E}( X)=\displaystyle \int_0^{+\infty} G_{a,b}(x) \,\mathrm{d}x\).

  2. Soit \(Y\) une variable aléatoire suivant la loi exponentielle de paramètre \(1\).

    On pose \(X=\dfrac{-a+\sqrt{a^2+2bY}}{b}\).

    1. Justifier que pour tout réel \(x \in \mathbb{R}_+\), on a : \(\mathbb{P}(X \geqslant x)=G_{a,b}(x)\).

    2. En déduire que \(X\) suit une loi \({\cal E}_{\ell}(a,b)\).

    3. On note \(U\) une variable aléatoire suivant la loi uniforme sur \([0,1[\). Déterminer la loi de la variable aléatoire \(G^{-1}_{a,b}(1-U)\).

  3. La fonction Python suivante génère des simulations de la loi exponentielle linéaire.

    import numpy.random as rd
    import numpy as np
    def linexp(a,b,n):
        u=rd.random(n)
        y=..........
        return (-a+np.sqrt(a**2+2*b*y))/b
    
    1. Quelle est la signification de la ligne de code (4) ?

    2. Compléter la ligne de code (4) pour que la fonction linexp génère les simulations désirées.

  4. De quel nombre réel peut-on penser que les six valeurs générées par la boucle Python suivante fourniront des valeurs approchées de plus en plus précises et pourquoi ?

Dans la suite du problème, on note \((X_n)_{n \in \mathbb{N}^*}\) une suite de variables aléatoires indépendantes suivant chacune la loi exponentielle linéaire \({\cal E}_{\ell}(a,b)\) dont les paramètres \(a>0\) et \(b>0\) sont inconnus.
Soit \(h\) un entier supérieur ou égal à \(2\). On suit pendant une période de \(h\) années une « cohorte » de \(n\) individus de même âge au début de l’étude et on modélise leurs durées de vie respectives à partir de cette date par les variables \(X_1\), \(X_2\), …, \(X_n\).

Partie II. Premier décès et intervalle de confiance de \(a\)

Pour tout \(n \in \mathbb{N}^*\), on définit les variables aléatoires \(M_n\), \(H_n\) et \(U_n\) par : \[M_n=\min(X_1,X_2,\ldots,X_n), \quad H_n=\min(h,X_1,X_2, \ldots,X_n) \quad \hbox{ et } \quad U_n=nH_n\]

  1. Calculer pour tout \(x \in \mathbb{R}_+\), la probabilité \(\mathbb{P}( M_n \geqslant x)\). Reconnaître la loi de la variable aléatoire \(M_n\).

  2. Pour tout \(n \in \mathbb{N}^*\), on note \(F_{U_n}\) la fonction de répartition de la variable aléatoire \(U_n\).

    1. Montrer que pour tout \(x \in \mathbb{R}\), on a : \(F_{U_n}(x)=\begin{cases}\hfill 0 \hfill &\hbox{ si }x<0\\1-\exp\! \left(-ax-\dfrac{b}{2n}\, x^2\right) &\hbox{ si } 0\leqslant x <nh\\ \hfill 1 \hfill &\hbox{ si } x \geqslant nh\end{cases}\).

    2. Étudier la continuité de la fonction \(F_{U_n}\).

    3. La variable aléatoire \(U_n\) admet-elle une densité ?

    4. Montrer que la suite de variables aléatoires \((U_n)_{n \in \mathbb{N}^*}\) converge en loi vers une variable aléatoire dont on précisera la loi.

  3. Soit \(\alpha \in \left] 0,1 \right[\). On appelle intervalle de confiance asymptotique de \(a\) au niveau de confiance \(1-\alpha\) (ou au risque \(\alpha\)) toute suite \(([U_n,V_n])_{n\in\mathbb{N}^\ast}\) (où \(U_n\) et \(V_n\) sont des variables aléatoires) telle qu’il existe une suite \((\alpha_n)_{n\in\mathbb{N}^\ast}\) vérifiant : \[\forall n \in \mathbb{N}^\ast,\ \mathbb{P}(U_n \leqslant a \leqslant V_n) \geqslant 1-\alpha_n \quad\text{et}\quad\lim\limits_{n\to+\infty}\alpha_n=\alpha\] Par abus de langage, on dira aussi que \([U_n,V_n]\) est un intervalle de confiance asymptotique de \(a\).

    1. Soit \(Y\) une variable aléatoire qui suit la loi exponentielle de paramètre \(1\).

      Trouver deux réels \(c\) et \(d\) strictement positifs tels que : \[\mathbb{P}( c \leqslant Y \leqslant d) =1-\alpha \quad \hbox{ et } \quad \mathbb{P}( Y \leqslant c ) =\dfrac{\alpha}2\]

    2. Montrer que \(\left[\dfrac{c}{U_n},\dfrac{d}{U_n}\right]\) est un intervalle de confiance asymptotique de \(a\), de niveau de confiance \(1-\alpha\).

Partie III. Nombre de survivant et estimateur convergent de \(b\)

Pour tout \(i \in \mathbb{N}^*\), soit \(S_i\) et \(D_i\) les variables aléatoires telles que : \[S_i=\begin{cases}1&\hbox{ si } X_i \geqslant h\\0&\hbox{ sinon}\end{cases} \quad \hbox{ et } \quad D_i=\begin{cases}1&\hbox{ si } X_i \leqslant 1\\0&\hbox{ sinon}\end{cases}\] Pour tout \(n \in \mathbb{N}^*\), on pose : \(\overline{S}_n=\displaystyle \dfrac1n \sum_{i=1}^n S_i\) et \(\overline{D}_n=\displaystyle \dfrac1n \sum_{i=1}^n D_i\).

    1. Justifier que pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), on a \(\mathbb{E}( S_i)=G_{a,b}(h)\) et calculer \(\mathbb{E}( S_iD_i)\).

    2. Pour quels couples \((i,j) \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]^2\), les variables \(S_i\) et \(D_j\) sont-elles indépendantes ?

    3. Déduire des questions précédentes l’expression de la covariance \(\mathrm{Cov}(\overline{S}_n,\overline{D}_n)\) de \(\overline{S}_n\) et \(\overline{D}_n\) en fonction de \(n\), \(G_{a,b}(h)\) et \(G_{a,b}(1)\). Le signe de cette covariance était-il prévisible ?

    1. Montrer que \(\overline{S}_n\) est un estimateur du paramètre \(G_{a,b}(h)\). Calculer son espérance et prouver que : \[\forall \varepsilon \in\mathbb{R}_+^\ast,\ \lim\limits_{n\to+\infty}\mathbb{P}\! \left( \left| \overline{S}_n - G_{a,b}(h) \right| \geqslant \varepsilon \right) = 0\]

    2. Déterminer l’espérance \(m\) de \(\overline{D}_n\) puis prouver que \(\overline{D}_n\) est un estimateur de \(m\) vérifiant : \[\forall \varepsilon \in\mathbb{R}_+^\ast,\ \lim\limits_{n\to+\infty}\mathbb{P}\! \left( \left| \overline{D}_n- m \right| \geqslant \varepsilon \right) = 0\]

  1. On pose : \(z(a,b)= \ln(G_{a,b}(1))\) et \(r(a,b)=\ln(G_{a,b}(h))\).

    Pour tout \(n \in \mathbb{N}^*\), on pose \(Z_n=\ln \! \left(1-\overline{D}_n+\dfrac1n\right)\) et \(R_n=\ln \! \left(\overline{S}_n+\dfrac1n\right)\).

    On admet que \(Z_n\) et \(R_n\) sont des estimateurs de \(z(a,b)\) et \(r(a,b)\) respectivement, vérifiant : \[\forall \varepsilon \in\mathbb{R}_+^\ast,\ \lim\limits_{n\to+\infty}\mathbb{P}\! \left( \left| Z_n - z(a,b) \right| \geqslant \varepsilon \right) =\lim\limits_{n\to+\infty}\mathbb{P}\! \left( \left| R_n - r(a,b) \right| \geqslant \varepsilon \right) = 0\]

    1. Soit \(\varepsilon\), \(\lambda\) et \(\mu\) des réels strictement positifs.

      1. Justifier l’inclusion suivante : \[\left[ \left|\left(\lambda Z_n - \mu R_n \right) - \left(\lambda z(a,b)-\mu r(a,b)\right) \right| \geqslant \varepsilon \right] \subset \left[\lambda \left|Z_n-z(a,b)\right| + \mu \left|R_n-r(a,b)\right| \geqslant \varepsilon \right]\]

      2. En déduire l’inégalité suivante : \[\begin{gathered} \mathbb{P}\! \left( \left|\left(\lambda Z_n - \mu R_n \right) - \left(\lambda z(a,b)-\mu r(a,b)\right) \right| \geqslant \varepsilon \right) \leqslant \mathbb{P}\! \left( \left|Z_n-z(a,b)\right| \geqslant \dfrac{\varepsilon}{2 \lambda} \right) \\ + \mathbb{P}\! \left( \left|R_n-r(a,b)\right| \geqslant \dfrac{\varepsilon}{2 \mu} \right) \end{gathered}\]

    2. Pour tout \(n \in \mathbb{N}^*\), on pose : \(B_n=\dfrac{2}{h-1} \, Z_n- \dfrac{2}{h(h-1)} \, R_n\). Montrer que \(B_n\) est un estimateur du paramètre \(b\) vérifiant : \[\forall \varepsilon \in\mathbb{R}_+^\ast,\ \lim\limits_{n\to+\infty}\mathbb{P}\! \left( \left| B_n-b \right| \geqslant \varepsilon \right) = 0\]

Tu veux le corrigé détaillé ?

Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.

error: Ce contenu est protégé !