Connectez-vous pour consulter le corrigé.
Dans ce problème, on s’intéresse à des opérations de transport dans des situations déterministes ou aléatoires, modélisées de manière discrète ou continue, dans le but de trouver un programme de transport optimal dont le coût serait le plus faible possible.
Les parties I, II et III sont largement indépendantes.
Toutes les variables aléatoires considérées dans ce problème sont supposées définies sur le même espace probabilisé \((\Omega,\mathcal{A},\mathbb{P})\).
Sous réserve d’existence, on note \(\mathbb{E}(Z)\) l’espérance d’une variable aléatoire \(Z\).
Pour tout entier \(N\) supérieur ou égal à 1 , on note \(\mathcal{E}_{N}\) l’ensemble des applications de \(\left[\!\left[1, N\right]\!\right]\) dans \(\left[\!\left[1, N\right]\!\right]\).
Soit \(N\) un entier supérieur ou égal à 2.
Quel est le nombre d’éléments de l’ensemble \(\mathcal{E}_{N}\) ?
Parmi les éléments de \(\mathcal{E}_{N}\), quel est le nombre d’applications injectives et parmi celles-ci, combien sont strictement monotones?
(Les réponses aux questions 1a et 1b seront données sans démonstration).
Soit \(p\) un réel vérifiant \(0<p<1\).
On considère une variable aléatoire \(X\) suivant la loi exponentielle de paramètre 1 .
Pour tout \(\omega \in \Omega\), on pose : \(Y(\omega)=\lfloor p X(\omega)\rfloor\), où \(\left\lfloor \cdot \right\rfloor\) désigne la fonction partie entière.
Vérifier que \(Y\) est une variable aléatoire discrète. Calculer pour tout \(n \in \mathbb{N}\), la probabilité \(\mathbb{P}( [Y=n])\).
Montrer que la variable aléatoire \(Y+1\) suit une loi géométrique dont on précisera le paramètre.
Établir les inégalités strictes : \(0< \mathbb{E}(Y)<p\).
Pour tout couple \((r, s) \in \mathbb{N}^{2}\), montrer que l’intégrale \(\displaystyle \int_{0}^{1} x^{r}(\ln x)^{s} \,\mathrm{d}x\) est convergente.
(on pourra utiliser le changement de variable \(u=-\ln (x)\) après avoir justifié précisément sa validité)
Établir pour tout couple \((r, s) \in \mathbb{N}^{2}\), l’égalité : \(\displaystyle \int_{0}^{1} x^{r}(\ln x)^{s} \,\mathrm{d}x=\frac{(-1)^{s} s !}{(r+1)^{s+1}}\).
On dit que la loi d’une variable aléatoire \(Y\) est accessible depuis une variable aléatoire \(X\), s’il existe une application \(T: X(\Omega) \to \mathbb{R}\) telle que la variable aléatoire \(T(X)\) suit la même loi que \(Y\).
L’application \(T\) est alors appelée une fonction de transport de la variable aléatoire \(X\) vers la loi de \(Y\).
On associe à \(T\) un coût de transport \(C(T)\) défini, sous réserve d’existence, par : \(C(T)= \mathbb{E}\!\left((X-T(X))^{2}\right)\).
Dans toute cette partie, \(X\) désigne une variable aléatoire vérifiant \(X(\Omega) = \left] 0,1 \right[\) et suivant la loi uniforme sur \(] 0,1 [\), c’est-à-dire admettant pour densité la fonction \(f_{X}\) définie par:
\[f_{X}(x)= \begin{cases}1 & \text { si } x \in \left] 0,1 \right[ \\ 0 & \text { sinon }\end{cases}\]
Soit \(p\) un réel vérifiant \(0<p<1\). Pour tout réel \(a \in[0,1-p]\), on note dans cette question, \(T_{a}\) la fonction définie sur \(] 0,1[\) par :
\[T_{a}(x)= \begin{cases}1 & \text { si } x \in|a, a+p| \\ 0 & \text { sinon }\end{cases}\]
Calculer la probabilité \(\mathbb{P}\left(\left[T_{a}(X)=1\right]\right)\) et en déduire que les fonctions \(T_{a}\) sont des fonctions de transport de \(X\) vers une même loi que l’on précisera.
Vérifier que le coût de transport \(C(T_a)\) est égal à \(\displaystyle \frac{1}{3}+p \left( 1-p \right)-2 a p\).
En déduire la valeur de a qui minimise \(C(T_a)\) et exprimer le coût minimal correspondant en fonction de \(p\).
Soit \(T_{1}\) et \(T_{2}\) les applications définies sur \(]0,1[\) par \(T_{1}(x)=-\ln (x)\) et \(T_{2}(x)=-\ln (1-x)\).
Vérifier que \(T_{1}\) et \(T_{2}\) sont des fonctions de transport de \(X\) vers une loi que l’on précisera.
En utilisant les résultats de la question 3, comparer les coûts de transport \(C(T_{1})\) et \(C(T_{2})\).
À l’aide de la question 2, montrer que toutes les lois géométriques sont accessibles depuis \(X\).
Dans cette question, \(Y\) désigne une variable aléatoire admettant une densité \(f_{Y}\) continue et strictement positive sur \(\mathbb{R}\).
Justifier que la fonction de répartition \(F_{Y}\) de \(Y\) réalise une bijection de \(\mathbb{R}\) sur l’intervalle \(] 0,1[\).
On note \(F_{Y}^{-1}\) la bijection réciproque de \(F_{Y}\).
Montrer que \(F_{Y}^{-1}\) est une fonction de transport de la variable aléatoire \(X\) vers la loi de \(Y\).
Cas particulier : on suppose que \(Y\) suit la loi normale centrée réduite.
On note \(F_{Y}\) la fonction de répartition de \(Y\) et \(\varphi\) la densité continue sur \(\mathbb{R}\) de \(Y\).
Établir la convergence de l"intégrale \(\displaystyle \int_{-\infty}^{+\infty} y F_{Y}(y) \, \varphi(y) \, \mathrm{d} y\).
A l’aide d’une intégration par parties, montrer que \(\displaystyle \int_{-\infty}^{+\infty} y F_{Y}(y) \, \varphi(y) \, \mathrm{d} y=\frac{1}{2 \sqrt{\pi}}\).
Montrer que l’intégrale \(\displaystyle \int_{-\infty}^{+\infty}\left(y-F_{Y}(y)\right)^{2} \varphi(y) \, \mathrm{d} y\) est convergente et la calculer.
En déduire que le coût de transport \(C(F_{Y}^{-1})\) est égal à \(\displaystyle \frac{4}{3}-\frac{1}{\sqrt{\pi}}\).
Dans toute cette partie, \(N\) désigne un entier supérieur on égal à 2 .
On considère \(N\) réels \(d_{1}, d_{2}, \ldots, d_{N}\) (appelés points de départ) et \(N\) réels \(a_{1}, a_{2}, \ldots, a_{N}\) (appelés points d’arrivée) vérifiant \(d_{1}<d_{2}<\cdots<d_{N}\) et \(a_{1}<a_{2}<\cdots<a_{N}\).
On pose : \(D=\left\{d_{1}, d_{2}, \ldots, d_{N}\right\}\) et \(A=\left\{a_{1}, a_{2}, \ldots, a_{N}\right\}\).
Montrer que pour tout couple \((k, \ell) \in \left[\!\left[1, N\right]\!\right]^{2}\), on a : \(d_{k} a_{k} \geqslant d_{k} a_{\ell}+d_{\ell} a_{k}-d_{\ell} a_{\ell}\).
En déduire à l’aide d’une double sommation que pour tout \(N\)-uplet \(\left(p_{1}, p_{2}, \ldots, p_{N}\right) \in \mathbb{R}_{+}^{N}\) tel que \(\displaystyle \sum_{k=1}^{N} p_{k}=1\), on a :
\[\sum_{k=1}^{N} p_{k} d_{k} a_{k} \geqslant\left(\sum_{k=1}^{N} p_{k} d_{k}\right) \times\left(\sum_{k=1}^{N} p_{k} a_{k}\right) \tag{1}\]
Soit \(t \in \mathcal{E}_{N}\). On réordonne la liste \((t(1), t(2), \ldots, t(N))\) selon les valeurs croissantes et on note alors \((\widehat{t}(1), \widehat{t}(2), \ldots, \widehat{t}(N))\) la liste ordonnée obtenue. On a donc : \(\widehat{t}(1) \leqslant \widehat{t}(2) \leqslant \cdots \leqslant \widehat{t}(N)\).
Justifier pour tout \(n \in \left[\!\left[1, N\right]\!\right]\), l’inégalité : \(\displaystyle \sum_{k=n}^{N} a_{t(k)} \leqslant \sum_{k=n}^{N} a_{\widehat{t}(k)}\).
On pose \(d_{0}=0\). Justifier l’égalité : \(\displaystyle \sum_{n=1}^{N} d_{n} a_{t(n)}=\sum_{n=1}^{N}\left(\left(d_{n}-d_{n-1}\right) \sum_{k=n}^{N} a_{t(k)}\right)\).
Établir l’inégalité : \[\sum_{n=1}^{N} d_{n} a_{t(n)} \leqslant \sum_{n=1}^{N} d_{n} a_{\widehat{t}(n)} \tag{2}\]
On appelle programme de transport, toute bijection \(T\) de \(D\) sur \(A\), et coût d’un programme de transport \(T\), la somme \(c(T)\) définie par : \(\displaystyle c(T)=\sum_{k=1}^{N}\left(d_{k}-T\left(d_{k}\right)\right)^{2}\).
Soit \(\widehat{T}\) le programme de transport défini par : pour tout \(k \in \left[\!\left[1, N\right]\!\right]\), \(\widehat{T}\left(d_{k}\right)=a_{k}\).
Déduire des questions précédentes que le programme \(\widehat{T}\) est optimal, c’est-à-dire que pour tout programme de transport \(T\), on a \(: c(T) \geqslant c(\widehat{T})\).
Interprétation probabiliste des inégalités (1) et (2).
Soit \(h\) une application croissante de \(\mathbb{R}\) dans \(\mathbb{R}\).
En utilisant l’inégalité (1), établir pour toute variable aléatoire discrète \(X\) ne prenant qu’un nombre fini de valeurs. l’inégalité : \(\mathbb{E}(X h(X)) \geqslant \mathbb{E}(X) \,\mathbb{E}(h(X))\).
Que peut-on en déduire pour le coefficient de corrélation linéaire de \(X\) et \(h(X)\) lorsque les variances de \(X\) et \(h(X)\) sont strictement positives?
En utilisant l’inégalité (2), montrer que si \(X\) est une variable aléatoire discrète suivant la loi uniforme sur \(\left[\!\left[1, N\right]\!\right]\) et \(t\) un élément de \(\mathcal{E}_{N}\), on a : \(\mathbb{E}(h(X) \, t(X)) \leqslant \mathbb{E}(h(X) \, \widehat{t}(X))\).
Les définitions de fonction de transport et de coût de transport sont identiques à celles données dans le préambule de la partie \(I\).
Dans toute cette partie, \(U\) désigne une variable aléatoire vérifiant \(U(\Omega)=[0,1]\) et suivant la loi uniforme sur le segment \([0,1]\).
Soit \(Y\) une variable aléatoire admettant une densité \(f_{Y}\) nulle hors d’un segment \([\alpha, \beta]\) \((\alpha<\beta)\) et dont la restriction à ce segment est continue et strictement positive. On note \(F_{Y}\) la fonction de répartition de \(Y\).
On suppose l’existence d’une fonction \(g\) de classe \(\mathcal C^{1}\) sur \([0,1]\), à valeurs dans \([\alpha, \beta]\), telle que la variable aléatoire \(Z=g(U)\) suit la même loi que \(Y\).
Pour tout entier \(N \geqslant 1\), on pose pour tout \(\omega \in \Omega\) :
\[X_{N}(\omega)=\begin{cases} \lfloor 1+N U(\omega)\rfloor & \text { si } 0 \leqslant U(\omega)<1 \\ \hfill N \hfill & \text { si } U(\omega)=1 \end{cases} \quad \text{et} \quad Y_{N}(\omega)=g \!\left(\frac{X_{N}(\omega)}{N}\right)\]
Trouver la loi de la variable aléatoire \(X_{N}\).
Établir l’existence d’une constante \(\lambda>0\), indépendante de \(N\) telle que : \[\forall \omega \in \Omega, \ \left|Z(\omega)-Y_{N}(\omega)\right| \leqslant \frac{\lambda}{N}\]
Montrer que pour tout réel \(y\), on a : \(F_{Y} \!\left(y-\frac{\lambda}{N}\right) \leqslant \mathbb{P}\!\left(\left[Y_{N}<y\right]\right)\).
Pour tout \(k \in \left[\!\left[1, N\right]\!\right]\), on pose : \(t_{N}(k)=g \! \left(\frac{k}{N}\right)\). On définit alors \(\widehat{t}_{X}\) à partir de \(t_{X}\) comme \(\widehat{t}\) à partir de \(t\) dans la question 9.
Établir pour tout \(k \in \left[\!\left[1, N\right]\!\right]\), les inégalités : \(F_{\mathrm{Y}} \! \left(\widehat{t}_{N}(k)-\frac{\lambda}{N}\right) \leqslant \mathbb{P}\!\left(\left[Y_{N}<\widehat{t}_{N}(k)\right]\right)<\frac{k}{N}\).
On note \(F_{Y}^{-1}\) la fonction réciproque de la restriction à \([\alpha, \beta]\) de la fonction \(F_{Y}\).
Montrer que pour tout entier \(N \geqslant 1\), on a : \[\frac{1}{N} \sum_{k=1}^{N} \frac{k}{N} \, g \! \left(\frac{k}{N}\right) \leqslant \frac{1}{N} \sum_{k=1}^{N} \frac{k}{N}\left(F_{Y}^{-1} \! \left(\frac{k}{N}\right)+\frac{\lambda}{N}\right)\]
En déduire l’inégalité : \(\mathbb{E}(U g(U)) \leqslant \mathbb{E}\! \left(U F_{Y}^{-1}(U)\right)\).
Parmi les fonctions de transport de classe \(\mathcal C^{2}\) de \(U\) vers la loi de \(Y\), trouver une fonction de transport \(T^{*}\) de coût minimal.
On suppose que \(Y=|4 U-2|\). Déterminer \(T^{*}\) et \(C(T^{*})\)
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.