En partenariat avec
Annale

ESSEC 2019 Maths 2Maths appliquées

Connectez-vous pour consulter le corrigé.

Accès complet à tous les corrigés avec un abonnement.
Essai gratuit 48h — accès immédiat, sans CB.

ÉcoleESSEC
Année2019
ÉpreuveMaths 2
OptionECE
Thème principalProbabilités
ChapitresFonctions, Calcul intégral, Intégrales impropres, Variables aléatoires discrètes, Vecteurs aléatoires discrets, Vecteurs aléatoires quelconques, Variables aléatoires à densité, Informatique
Commentaire

Un sujet intéressant en théorie, mais qui devient vite pénible tant les notations et calculs sont lourds sur la fin.

Les deux premières parties constituent cependant un bon entraînement.

Un modèle probabiliste d’une expérience aléatoire représente dans un certain sens le désordre qui intervient dans l’expérience et il est donc naturel que des outils soient introduits qui permettent de mesurer l’intensité de ce désordre. C’est le cas de la notion d’entropie qui fait l’objet du présent problème. On considérera différentes situations et notamment la façon dont on mesure l’information que deux variables aléatoires s’apportent mutuellement.

Dans la première partie on étudie le cas plus simple techniquement de variables dont la loi admet une densité. Les deuxièmes et troisièmes parties sont consacrées au cas discret. Dans la deuxième partie, on introduit les différentes notions d’entropie pour le cas de variables discrètes et dans la troisième partie, on examine comment on peut mesurer l’information apportée mutuellement par deux variables aléatoires.

Toute les variables aléatoires intervenant dans le problème sont définies sur un espace probabilisé \((\Omega,{\cal A},\mathbb{P})\).

Pour toute variable aléatoire \(Y\), on notera \(\mathbb{E}( Y)\) son espérance lorsqu’elle existe.

Partie I : entropie différentielle d’une variable à densité

  1. La fonction logarithme de base \(2\), notée \(\log_2\) est définie sur \(\mathbb{R}_+^\ast\) par \(\log_2(x)=\dfrac{\ln(x)}{\ln(2)}\).

    1. Montrer que pour tout \((x,y) \in \mathbb{R}_+^\ast\times \mathbb{R}_+^\ast\), on a \(\log_2(xy)=\log_2(x)+\log_2(y)\).

    2. Vérifier que pour tout réel \(\alpha\), \(\log_2(2^\alpha)=\alpha\).

    3. Montrer que la fonction \(\log_2\) est concave sur \(\mathbb{R}_+^\ast\).

  2. Soit \(X\) une variable aléatoire réelle à densité et soit \(f\) une densité de \(X\). On appelle support de \(f\) l’ensemble \(I=\{x \in \mathbb{R}, \ f(x)>0\}\), et on suppose que \(I\) est un intervalle de \(\mathbb{R}\) d’extrémités \(a\) et \(b\) (\(a<b\), \(a\) et \(b\) finis ou infinis). L’entropie différentielle de \(X\) est, sous réserve d’existence, le réel \[h(X)=-\int_a^b f(x) \log_2(f(x)) \,\mathrm{d}x\] Montrer que \(h(X)=-\mathbb{E}( \log_2(f(X))\).

  3. Soit \(X\) une variable aléatoire de densité \(f\), de support \(I\), intervalle de \(\mathbb{R}\) d’extrémités \(a\) et \(b\). On suppose que \(X\) admet une entropie différentielle.

    1. Soit \(c\) un réel, et soit \(Y\) la variable aléatoire définie par \(Y=c+X\).

      1. Déterminer une densité de \(Y\).

      2. Justifier l’existence de l’entropie différentielle \(h(Y)\), et la déterminer en fonction de \(h(X)\).

    2. Soit \(\alpha\) un réel strictement positif , et soit \(Z\) la variable aléatoire définie par \(Z=\alpha X\).

      1. Déterminer une densité de \(Z\).

      2. Justifier l’existence de l’entropie différentielle \(h(Z)\), et la déterminer en fonction de \(h(X)\).

  4. On détermine dans cette question l’entropie différentielle de quelques variables aléatoires suivant des lois classiques.

    1. Soit \(a>0\). On considère \(X\) une variable aléatoire de loi uniforme sur \([0,a]\).

      1. Donner une densité de \(X\).

      2. Justifier l’existence de l’entropie différentielle \(h(X)\), et la déterminer.

      3. Déterminer une condition nécessaire et suffisante sur \(a\) pour que \(h(X)>0\).

    2. On considère \(Y\) une variable aléatoire de loi normale centrée réduite. Montrer que \(Y\) admet une entropie différentielle et que \(h(Y)=\dfrac12 \log_2(2 \pi \mathrm{e})\).

    3. On considère \(Z\) une variable aléatoire de loi exponentielle de paramètre \(\lambda \ (\lambda >0)\). Montrer que \(Y\) admet une entropie différentielle \(h(Z)\) et la déterminer.

    4. Soit \(f\) la fonction définie sur \(\mathbb{R}\) par \(f(x)=\dfrac\lambda 2 \, \mathrm{e}^{-\lambda |x|}\) (\(\lambda >0\)).

      1. Montrer que \(f\) est une densité de probabilité sur \(\mathbb{R}\).

      2. Soit \(W\) une variable aléatoire de densité \(f\). Justifier l’existence de l’entropie différentielle \(h(W)\) et la déterminer.

  5. On dit qu’un couple \((X,Y)\) de variables aléatoires est un couple gaussien centré si, pour tout \((\alpha,\beta) \in \mathbb{R}^2\), \(\alpha X + \beta Y\) est une variable de loi normale centrée, c’est à dire qu’il existe \(\gamma \in \mathbb{R}\) et une variable \(Z\) de loi normale centrée réduite tels que \(\alpha X + \beta Y\) a même loi que \(\gamma Z\). On considère un tel couple \((X,Y)\) et on note \(\sigma^2\) la variance de \(X\). On suppose que \(\sigma^2 >0\).

    1. Montrer que \(X\) suit une loi normale centrée.

    2. Calculer \(h(X)\).

    3. On suppose désormais que \(X\) et \(Y\) suivent la même loi normale centrée de variance \(\sigma^2\) et on admet que les propriétés de l’espérance des variables discrètes se généralisent aux variables aléatoires quelconques.

      1. Montrer que \(\mathbb{E}( XY)\) existe.

      2. Montrer de plus que, pour tout réel \(\lambda\), \(\lambda^2 \, \mathbb{E}( Y^2)+2 \lambda \, \mathbb{E}( XY)+ \mathbb{E}( X^2) \geqslant 0\).

      3. En déduire que \(\mathbb{E}( XY)^2 \leqslant \mathbb{E}( X^2) \, \mathbb{E}( Y^2)\).

      4. On pose \(\rho=\dfrac{\mathbb{E}( XY)}{\sigma^2}\). Montrer que \(\rho \in [-1,1]\).

      5. Que vaut \(\rho\) si \(X\) et \(Y\) sont indépendantes ?

    4. On suppose \(|\rho| <1\). On appelle entropie jointe du couple \((X,Y)\) le réel \[h(X,Y)=\log_2 \! \left(2 \pi \,\mathrm{e}\, \sigma^2 \sqrt{1-\rho^2} \right)\]

      1. À quelle condition \(h(X,Y)\) est-elle nulle ?

      2. L’information mutuelle de \(X\) et \(Y\) est définie par \[I(X,Y)=h(X)+h(Y)-h(X,Y)\] Calculer \(I(X,Y)\).

      3. Montrer que \(I(X,Y) \geqslant 0\)

      4. Quelle est la limite de \(I(X,Y)\) quand \(\rho\) tend vers \(1\).

Partie II : généralités sur l’entropie des variables discrètes

Soit \(A\) un ensemble fini non vide. On dit que \(X\) est une variable aléatoire dont la loi est à support \(A\), si \(X\) est à valeurs dans \(A\) et si pour tout \(x \in A\), \(\mathbb{P}(X=x)>0\).

  1. Soit \(X\) une variable de loi à support \(\{0,1,2, \ldots, n\}\)\(n\) est un entier naturel. On appelle entropie de \(X\) le réel \[H(X)=-\sum_{k=0}^n \mathbb{P}(X=k) \log_2(\mathbb{P}(X=k))\]

    1. On définit la fonction \(g : \{0,1,2, \ldots, n\} \rightarrow \mathbb{R}\) en posant \(g(k)=\log_2(\mathbb{P}(X=k))\) pour \(k\) élément de \(\{0,1,2, \ldots, n\}\). Montrer que \(H(X)=-\mathbb{E}( g(X))\).

    2. Montrer que \(H(X) \geqslant 0\).

    3. Soit \(p\) un réel tel que \(0<p<1\). On suppose dans cette question que \(X\) suit la loi de Bernoulli \({\cal B}(p)\).

      1. Calculer \(H(X)\) en fonction de \(p\). On note \(\psi\) la fonction qui, à \(p\), associe \(H(X)\).

      2. Montrer que \(\psi\) est concave sur \(]0,1[\).

      3. Déterminer la valeur \(p_0\)\(\psi\) est maximale.

    4. On suppose dans cette question que la loi de \(X\) est à support \(\{0,1,2,3\}\) avec les probabilités \[\mathbb{P}(X=0)=\dfrac12 \quad \quad \mathbb{P}(X=1)=\dfrac14 \quad \quad \mathbb{P}(X=2)=\mathbb{P}(X=3)=\dfrac18\] Calculer \(H(X)\).

  2. On souhaite écrire une fonction en Python pour calculer l’entropie d’une variable \(X\) dont le support de la loi est de la forme \(A=\{0,1,2,\ldots,n\}\)\(n\) est un entier naturel. On suppose que le vecteur P de Python est tel que pour tout \(k\) de \(A\), P(k+1)\(=\mathbb{P}(X=k)\). Compléter la fonction ci-dessous d’argument P qui renvoie l’entropie de \(X\), c’est à dire \(\displaystyle -\sum_{k=0}^n \mathbb{P}(X=k)\log_2(\mathbb{P}(X=k))\).

    import numpy as np
    def Entropie(P):
        .....
        return h

    Si nécessaire, on pourra utiliser l’instruction np.size(P) qui donne le nombre d’éléments de P.

On souhaite maintenant démontrer quelques inégalités concernant l’entropie.

  1. On commence par une inégalité générale, appelée inégalité de Jensen.

    1. Soit \(N \geqslant 2\). Soit \(X\) une variable aléatoire de loi à support \(\{x_1,x_2, \ldots,x_N\}\), où les \(x_i\) sont des éléments distincts de \(\mathbb{R}^+\). On pose \(\mathbb{P}(X=x_i)=p_i\). Montrer que pour tout \(1 \leqslant i \leqslant N\), on a \(p_i<1\).

      On désire démontrer par récurrence la propriété suivante :

      \({\cal P}(N)\) : Pour toute \(\varphi\) fonction convexe sur \(\mathbb{R}^+\), si \(X\) est une variable aléatoire à support \(A \subset \mathbb{R}^+\) avec \(\mathrm{Card}(A)=N\), on a \(\mathbb{E}( \varphi(X)) \geqslant \varphi(\mathbb{E}( X))\).

    2. Montrer que \({\cal P}(2)\) est vraie.

    3. Soit \(N \geqslant 3\). On suppose que \({\cal P}(N-1)\) est vérifiée. Soit \(x\) une variable aléatoire de loi à support \(A=\{x_1,x_2,\ldots,x_N\}\) où les \(x_i\) sont des éléments distincts de \(\mathbb{R}^{+}\). On pose \(\mathbb{P}(X=x_i)=p_i\).
      Pour \(i\) tel que \(1 \leqslant i \leqslant N-1\), on pose \(p'_i=\dfrac{p_i}{1-p_N}\).

      1. Montrer que \(\displaystyle \sum_{i=1}^{N-1} p'_i=1\) et \(0<p'_i<1\) pour \(1 \leqslant i \leqslant N-1\).

      2. Soit \(Y\) une variable aléatoire de loi à support \(\{x_1,\ldots,x_{N-1})\) telle que \(\mathbb{P}(Y=x_i)=p'_i\) pour \(1\leqslant i \leqslant N-1\). Montrer que \(\displaystyle \sum_{i=1}^{N-1} p'_i \, \varphi(x_i) \geqslant \varphi \! \left(\displaystyle \sum_{i=1}^{N-1} p'_i x_i \right)\).

      3. Montrer que \(\mathbb{E}( \varphi(X)) \geqslant \varphi(\mathbb{E}( X))\).

    4. Montrer que si \(\varphi\) est concave sur \(\mathbb{R}^+\), on a \(\mathbb{E}( \varphi(X)) \leqslant \varphi(\mathbb{E}( X))\).

  2. Soit \(X\) une variable aléatoire à support \(\{0,1,\ldots,n\}\). On pose, pour \(k\) tel que \(0 \leqslant k \leqslant n\), \(p_k=\mathbb{P}(X=k)\).

    1. Montrer que \(\displaystyle \sum_{k=0}^n p_k \log_2 \! \left(\dfrac1{\left( n+1 \right) p_k}\right) \leqslant \log_2 \! \left(\sum_{k=0}^n \dfrac{p_k}{\left( n+1 \right) p_k}\right) =0\).

    2. Montrer que \(\displaystyle \sum_{k=0}^n p_k \log_2 \! \left[\left( n+1 \right) p_k\right]=\log_2(n+1)-H(X)\).

    3. Montrer que \(H(X) \leqslant \log_2(n+1)\).

    4. On suppose que \(X\) suit une loi uniforme sur \(\{0,1, \ldots,n\}\). Calculer \(H(X)\).

  3. Soit \(X\) et \(Y\) deux variables aléatoires de même loi à support \(\{0,1,\ldots,n\}\). On suppose en outre \(X\) et \(Y\) indépendantes.

    1. Montrer que \(\mathbb{P}(X=Y)=\displaystyle \sum_{k=0}^n \left(\mathbb{P}(X=k)\right)^2\).

    2. On pose \(v(k)=\mathbb{P}(X=k)\) pour tout \(k\) élément de \(\{0,1,\ldots,n\}\). Montrer que \[2^{\mathbb{E}( \log_2(v(X)))} \leqslant \mathbb{E}\!\left(2^{\log_2(v(X))}\right)=\mathbb{E}( v(X))\]

    3. En déduire que \(2^{-H(X)} \leqslant \mathbb{P}(X=Y)\).

    4. Donner un exemple de loi où l’inégalité précédente est une égalité.

Partie III : entropie jointe et information mutuelle de deux variables discrètes

Soient \(X\) et \(Y\) deux variables aléatoires à support \(\{0,1, \ldots,n\}\). On appelle entropie jointe de \(X\) et \(Y\) le réel \[H(X,Y)=- \sum_{k=0}^n \sum_{j=0}^n \mathbb{P}\! \left([X=k] \cap [Y=j]\right) \log_2 \! \left(\mathbb{P}([ X=k]\cap [Y=j])\right)\] avec la convention \(0 \log_2(0)=0\)

    1. On définit la fonction \(g: \{0,1, \ldots,n\}^2 \rightarrow \mathbb{R}\cup \{-\infty\}\) en posant pour \((k,j) \in \{0,1, \ldots,n\}^2\) \[g(k,j)=\log_2 \! \left(\mathbb{P}([ X=k] \cap [Y=j])\right)\] Montrer que \(H(X,Y)=-\mathbb{E}( g(X,Y))\).

    2. Montrer que \(H(X,Y)=H(Y,X)\).

    3. Pour tout \(k\) tel que \(0\leqslant k \leqslant n\), on pose : \[H(Y \,\vert \, X=k)=-\sum_{j=0}^n \mathbb{P}_{[X=k]}(Y=j)\log_2 \! \left(\mathbb{P}_{[X=k]}(Y=j)\right)\] On appelle entropie conditionnelle de \(Y\) sachant \(X\) le réel \[H(Y \,\vert \, X)=\sum_{k=0}^n \mathbb{P}(X=k) \, H \! \left(Y \,\vert \, X=k \right)\] Montrer que \(H(X,Y)=H(X)+H(Y \,\vert \, X)\).

    4. Montrer que pour tout couple de variables aléatoires \(X\) et \(Y\)de lois à support \(\{0,1,\ldots,n\}\), on a : \[H(X)-H(X \,\vert \, Y)=H(Y)-H(Y \,\vert \, X)\]

  1. On considère dans cette question deux variables aléatoires \(X\) et \(Y\), de lois à support \(\{0,1,2,3\}\). On suppose que la loi conjointe de \((X,Y)\) est donnée par le tableau suivant :

    \diagbox{$j$}{$k$}0123
    01/81/161/321/32
    11/161/81/321/32
    21/161/161/161/16
    31/4000

    On lit dans la \(k\)-ième colonne et la \(j\)-ième ligne la valeur de \(\mathbb{P}([ X=k] \cap [Y=j])\).

    1. Déterminer la loi de \(X\) et montrer que \(H(X)=\dfrac74\).

    2. Déterminer la loi de \(Y\) et calculer \(H(Y)\).

    3. Montrer que \(H(X \,\vert \, Y)=\dfrac{11}8\).

    4. Que vaut \(H(Y \,\vert \, X)\) ?

    5. Calculer \(H(X,Y)\)

  2. Soient \(X\) et \(Y\) deux variables aléatoires à support \(\{0,1, \ldots,n\}\). On appelle information mutuelle de \(X\) et \(Y\) le réel : \[I(X,Y)= \sum_{k=0}^n \sum_{j=0}^n \mathbb{P}\! \left([X=k] \cap [Y=j]\right) \log_2 \! \left(\dfrac{\mathbb{P}([ X=k]\cap [Y=j])}{\mathbb{P}(X=k) \, \mathbb{P}(Y=j)}\right)\]

    1. Montrer que \(I(X,Y)=I(Y,X)\)

    2. Montrer que \(I(X,Y)=H(X)-H(X \,\vert \, Y)\).

    3. Montrer que \(I(X,X)=H(X)\)

    4. Que vaut \(I(X,Y)\) si \(X\) et \(Y\) sont indépendantes ?

  3. Soient \(X\) et \(Y\) deux variables aléatoires à support \(\{0,1, \ldots,n\}\). On fixe \(0 \leqslant k \leqslant n\). Pour \(0 \leqslant j \leqslant n\), on pose \(p_j=\dfrac{\mathbb{P}([ X=k] \cap [Y=j])}{\mathbb{P}(X=k)}\).

    On suppose \(p_j>0\) pour tout \(0 \leqslant j \leqslant n\) et on pose \(x_j= \dfrac{\mathbb{P}(X=k) \, \mathbb{P}(Y=j)}{\mathbb{P}([ X=k]\cap [Y=j])}\).

    1. Montrer que \(\displaystyle \sum_{j=0}^n p_j=1\).

    2. Soit \(Z_k\) une variable aléatoire de support \(\{x_0,\ldots, x_n\}\) telle que \(\mathbb{P}(Z_k=x_j)=p_j\) pour \(0 \leqslant j \leqslant n\). Montrer que : \[\mathbb{E}( \log_2(Z_k)) \leqslant 0\]

    3. En déduire que \(I(X,Y) \geqslant 0\).

Tu veux le corrigé détaillé ?

Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.

error: Ce contenu est protégé !