Connectez-vous pour consulter le corrigé.
Dans ce problème, toutes les variables aléatoires sont supposées définies sur un même espace probabilisé \((\Omega,\mathcal{A},\mathbb{P})\). Si \(X\) est une variable aléatoire, on note respectivement \(\mathbb{E}(X)\) et \(\mathbb{V}(X)\) son espérance et sa variance, sous réserve d’existence.
Le but de ce problème est de mettre en évidence quelques résultats asymptotiques liés au modèle du collectionneur de vignettes.
Dans chaque paquet de céréales se trouve une vignette et il y a en tout des vignettes de \(n\) types différents, où \(n\) est un entier supérieur ou égal à \(1\). Chacun des \(n\) types de vignettes se retrouve avec la même fréquence dans les paquets de céréales. Une collection est alors complète lorsqu’elle comporte \(n\) vignettes de types différents.
On modélise le nombre total de paquets de céréales qu’il est nécessaire d’acheter pour obtenir la collection complète de \(n\) vignettes de types différents par la variable aléatoire notée \(C_{n}\).
On pose par convention \(C_{0}=0\) et, pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), on note \(C_{i}\) le nombre d’achats de paquets de céréales nécessaires pour obtenir \(i\) vignettes de types différents.
De même, pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), on pose \(X_{i}=C_{i}-C_{i-1}\), qui représente le nombre d’achats supplémentaires de paquets de céréales qu’il est nécessaire d’effectuer pour obtenir une nouvelle vignette d’un type différent des \(i-1\) vignettes de types différents déjà obtenues. Par convention, on pose \(X_{1}=C_{1}=1\).
On suppose que les variables aléatoires \(X_{1}, \ldots, X_{n}\) sont mutuellement indépendantes. Enfin, on pose : \[V_{n}=\frac{C_{n}}{n}-\ln (n)\]
Montrer que: \[C_{n}=X_{1}+\cdots+X_{n}=\sum_{i=1}^{n} X_{i}\]
Justifier que pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), la variable aléatoire \(X_{i}\) suit la loi géométrique \(\mathcal{G}\left(\frac{n-i+1}{n}\right)\).
Pour tout entier \(n \geqslant 1\), on pose : \[H_{n}=\sum_{k=1}^{n} \frac{1}{k} \quad \text{et} \quad S_{n}=\sum_{k=1}^{n} \frac{1}{k^{2}}\] Nous allons démontrer la convergence de la suite \(\left(S_{n}\right)_{n \geqslant 1}\) et déterminer une valeur approchée de sa limite \(S\).
Montrer que pour tout entier \(k \geqslant 2\), on a l’encadrement : \[\frac{1}{k}-\frac{1}{k+1} \leqslant \frac{1}{k^{2}} \leqslant \frac{1}{k-1}-\frac{1}{k}\]
Montrer que pour tout entier \(n \geqslant 2\), on a : \[\frac{3}{2}-\frac{1}{n+1} \leqslant S_{n} \leqslant 2-\frac{1}{n}\]
Montrer que la suite \(\left(S_{n}\right)_{n \geqslant 1}\) est convergente et donner un encadrement de sa limite \(S\).
Montrer que pour tout entier \(n \geqslant 1\), on a l’encadrement: \[\frac{1}{n+1} \leqslant S-S_{n} \leqslant \frac{1}{n}\]
En déduire un programme Python qui permet d’obtenir une valeur approchée de \(S\) à \(10^{-7}\) près.
Pour tout entier \(n \geqslant 1\), on pose \(u_{n}=H_{n}-\ln (n)\).
Montrer que pour tout entier \(n \geqslant 1\), on a l’encadrement: \[\frac{1}{n+1} \leqslant \ln \! \left(\frac{n+1}{n}\right) \leqslant \frac{1}{n}\]
Montrer que pour tout entier \(n \geqslant 1\), on a : \(0 \leqslant u_{n} \leqslant 1\).
Montrer que la suite \(\left(u_{n}\right)_{n \geqslant 1}\) converge vers une certaine limite \(\gamma \in[0,1]\).
Justifier l’existence de l’espérance de \(C_{n}\) et montrer que \(\mathbb{E}(C_{n} )=n H_{n}\).
Justifier l’existence de la variance de \(C_{n}\) et exprimer \(\mathbb{V}(C_{n} )\) en fonction de \(n, S_{n}\) et \(H_{n}\).
Montrer que pour tout réel \(a>0\), on a : \[\mathbb{P}\left(\left|C_{n}-n H_{n}\right| \geqslant a n\right) \leqslant \frac{S}{a^{2}}\]
Montrer que pour tout réel \(c>1\), on a : \[\mathbb{P}\! \left(\left|\frac{C_{n}}{n}-\ln (n)\right| \geqslant c\right) \leqslant \frac{S}{(c-1)^{2}}\]
Pour cette question, on suppose que \(n=10^{6}\) et on donne l’approximation \(\ln (n) \approx 13.816\).
Montrer que : \[\mathbb{P}\! \left(\frac{C_{n}}{n} \in[7.81,19.92]\right) \geqslant 0.92\]
Soit \(T_{1}, \ldots, T_{n}, n\) variables aléatoires mutuellement indépendantes de même loi exponentielle \(\mathcal{E}(1)\). On pose : \[M_{n}=\max _{1 \leqslant i \leqslant n} T_{i}\] Montrer que \(M_{n}\) suit la loi de densité \(f_{n}\) donnée par : \[\forall x \in \mathbb{R}, \ f_{n}(x)= \begin{cases}n \, \mathrm{e}^{-x}\left(1-\mathrm{e}^{-x}\right)^{n-1} & \text { si } x>0 \\ 0 & \text { si } x \leqslant \hfill 0 \hfill \end{cases}\]
Soit \(Z\) une variable aléatoire de loi exponentielle \(\mathcal{E}(n+1)\) et indépendante de \(M_{n}\). On note \(g\) la densité de la loi de \(Z\) qui est nulle sur \(] -\infty, 0]\) et continue sur \(] 0,+\infty[\). Montrer que pour tout \(x>0\) et tout \(t \in \left] 0, x \right[\), on a : \[f_{n}(t) \,g(x-t)= \left( n+1 \right) \mathrm{e}^{-(n+1) x} n \, \mathrm{e}^{t}\left(\mathrm{e}^{t}-1\right)^{n-1}\]
Soit \(\left(Z_{i}\right)_{i \geqslant 1}\) une suite de variables aléatoires mutuellement indépendantes telle que pour tout entier \(i \geqslant 1, Z_{i}\) est de loi exponentielle \(\mathcal{E}(i)\). Montrer que pour tout entier \(n \geqslant 1\), la variable aléatoire \(\sum\limits_{i=1}^{n} Z_{i}\) suit la loi de densité \(f_{n}\).
On définit la fonction \(f: \mathbb{R} \rightarrow \mathbb{R}_{+}\) par : \[\forall x \in \mathbb{R}, \quad f(x)=\mathrm{e}^{-x} \mathrm{e}^{-\mathrm{e}^{-x}}\] Montrer que \(f\) est une densité de probabilité sur \(\mathbb{R}\). La loi de densité \(f\) est appelée loi de Gumbel.
Soit \(\left(Z_{i}\right)_{i \geqslant 1}\) la suite de variables aléatoires introduite précédemment. On pose : \[W_{n}=\sum\limits_{i=1}^{n} Z_{i}-\ln (n)\]
Montrer que la fonction de répartition \(F_{W_{n}}\) de \(W_{n}\) est donnée par : \[\forall x \in \mathbb{R}, \quad F_{W_{n}}(x)= \begin{cases} \left(1-\frac{e^{-x}}{n}\right)^{n} & \text {si } x>-\ln (n)\\ \hspace{0.7cm} 0 & \text {si } x \leqslant -\ln (n) \rule[0pt]{0pt}{15pt}\end{cases}\]
Montrer que la suite de variables aléatoires \(\left(W_{n}\right)_{n \geqslant 1}\) converge en loi vers une variable aléatoire de loi de Gumbel.
On suppose avoir écrit les commande suivantes au début d’un programme Python :
import numpy as np import numpy.random as rd import matplotlib.pyplot as plt
L’instruction rd.geometric(p) permet alors la simulation
d’une variable aléatoire suivant la loi géométrique de paramètre \(p\). De plus, si
x est un vecteur ligne contenant les données
d’une série statistique, la commande
plt.plot(V,range(-1,10),bins=21) permet de
renvoyer l’histogramme de la série (en ne conservant que les données
comprises entre \(-1\) et \(10\), les données étant regroupées en \(21\) classes de même longueur).
Écrire une fonction d’en-tête
def simulV(n) qui pour un entier
n fourni en entrée, renvoie une simulation de la variable
aléatoire \(V_{n}\) définie en
introduction de ce problème.
À la suite de la fonction simulV, écrire un
programme Python qui construit un vecteur-ligne
V contenant 1000 simulations indépendantes de
la variable aléatoire \(V_{n}\) pour un
certain entier \(n\) entré par
l’utilisateur.
On complète ce programme par le code suivant :
plt.hist(V,range=(-1,10),bins=21)
def f(x):
return np.exp(-x)*np.exp(-np.exp(-x))
absc=np.linspace(-1,10,100)
plt.plot(absc,f(absc))
On obtient les sorties graphique suivantes en exécutant le programme pour \(n=5\), \(n=10\) puis \(n=50\) :
Que peut-on observer sur ces figures ? Quelle conjecture peut-on en déduire pour la suite \(\left(V_{n}\right)_{n \geqslant 1}\) ?
Soit \(p \in \left] 0,1 \right[\) et soit \(U\) une variable aléatoire de loi exponentielle \(\mathcal{E}(p)\). On pose \(\alpha=-\frac{p}{\ln (1-p)}\).
Montrer que la variable aléatoire \(V=\lfloor\alpha \, U\rfloor+1\) est de loi géométrique \(\mathcal{G}(p)\). On rappelle que \(\lfloor t\rfloor\) désigne la partie entière du réel \(t\).
Montrer que la variable aléatoire \(V-\alpha \, U\) est à valeurs dans \([0,1]\). En déduire que \(\mathbb{V}(V-\alpha U) \leqslant 1\).
Soit \(X\) et \(Y\) deux variables aléatoires admettant une variance. Montrer que : \[\mathbb{V}(X+Y) \leqslant 2 \left[ \mathbb{V}(X)+ \mathbb{V}(Y) \right]\] On pourra calculer \(\mathbb{V}(X+Y)\) et \(\mathbb{V}(X-Y)\).
En déduire que : \[\mathbb{V}(V-U) \leqslant 2+\frac{ 2 \left( 1-\alpha \right)^{2}}{p^{2}}\]
Dans cette question, on suppose que \(n \geqslant 2\). Soit \(Y_{1}, \ldots, Y_{n}, n\) variables aléatoires mutuellement indépendantes telles que, pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right], Y_{i}\) suive la loi exponentielle \(\mathcal{E}\left(\frac{n-i+1}{n}\right)\).
On pose d’une part : \[\alpha_{1}=0 \quad \text{et} \quad \forall i \in \left[\kern-0.15em\left[ {2,n} \right]\kern-0.15em\right],\ \alpha_{i}=-\frac{n-i+1}{n} \times \frac{1}{\ln \! \left(\frac{i-1}{n}\right)}\]
et d’autre part : \[X_{1}^{\prime}=1 \quad \text{et} \quad \forall i\in\left[\kern-0.15em\left[ {2,n} \right]\kern-0.15em\right],\ X_{i}^{\prime}=\left\lfloor\alpha_{i} Y_{i}\right\rfloor+1\]
De plus, on pose : \[W_{n}^{\prime}=\frac{Y_{1}+\cdots+Y_{n}}{n}-\ln (n) \quad \text{et} \quad V_{n}^{\prime}=\frac{X_{1}^{\prime}+\cdots+X_{n}^{\prime}}{n}-\ln (n)\]
Montrer que: \[\mathbb{V}\left(V_{n}^{\prime}-W_{n}^{\prime}\right) \leqslant \frac{1}{n^{2}}+\frac{2}{n^{2}} \sum_{i=2}^{n}\left[\left(\frac{n}{n-i+1}\right)^{2}\left(1-\alpha_{i}\right)^{2}+1\right]\]
Montrer que la fonction \(\phi: \left] 0,1 \right[ \rightarrow \mathbb{R}\) définie par : \[\forall z \in \left]0,1 \right[, \ \phi(z)=\frac{1}{(1-z)^{2}}\left[ 1+\frac{1-z}{\ln (z)}\right]^{2}\] peut être prolongée en une fonction continue sur le segment \([0,1]\).
En déduire qu’il existe un réel \(A>0\) tel que: \[\lim _{n \rightarrow +\infty} \frac{1}{n} \sum_{i=2}^{n}\left(\frac{n}{n-i+1}\right)^{2}\left(1-\alpha_{i}\right)^{2}=A\]
Montrer que la suite de variables aléatoires \(\left(V_{n}^{\prime}-W_{n}^{\prime}\right)_{n \geqslant 2}\) converge en probabilité vers \(0\).
Montrer que la suite de variables aléatoires \(\left(V_{n}^{\prime}\right)_{n \geqslant 2}\) converge en loi vers une variable aléatoire de loi de Gumbel.
On pourra admettre et utiliser le théorème de Slutsky : si \((X_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en loi vers \(X\) et si \((Y_n)_{n\in\mathbb{N}^\ast}\) est une suite de variables aléatoires convergeant en probabilité vers une constante réelle \(c\), alors la suite \((X_n+Y_n)_{n\geqslant 1}\) converge en loi vers \(X+c\).
On donne les valeurs numériques suivantes : \(\mathrm{e}^{-\mathrm{e}^{-x}} \approx 0.96\) si \(x=3.20\) et \(\mathrm{e}^{-\mathrm{e}^{-x}} \approx 0.04\) si \(x=-1.17\). Lorsque \(n=10^{6}\), montrer que : \[\mathbb{P}\! \left(\frac{C_{n}}{n} \in[12.65,17.02]\right) \approx 0.92\] Comparer avec le résultat de la première partie et commenter.
Dans cette partie, on suppose que \(n \geqslant 2\). On suppose de plus que les vignettes sont numérotées de 1 à \(n\). Pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\) et tout entier \(m \geqslant 1\), on note \(A_{i, m}\) la variable aléatoire donnant le nombre de vignettes numérotées \(i\) obtenues dans les \(m\) premiers paquets de céréales achetés.
Justifier que pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), la variable aléatoire \(A_{i, m}\) suit la loi binomiale \(\mathcal{B}\left(m, \frac{1}{n}\right)\).
Calculer la covariance \(\operatorname{Cov}\left(A_{1, m}, m-A_{1, m}\right)\).
À l’aide d’un raisonnement par l’absurde, en déduire que les variables aléatoires \(A_{1, m}, \ldots, A_{n, m}\) ne sont pas mutuellement indépendantes.
Montrer que si \(\left(E_{i}\right)_{i \geqslant 1}\) est une famille d’événements, alors pour tout entier \(r \geqslant 1\) : \[\mathbb{P}\left(\bigcup_{i=1}^{r} E_{i}\right) \leqslant \sum_{i=1}^{r} \mathbb{P}\left(E_{i}\right)\]
Montrer que: \[\mathbb{P}\left(C_{n}>m\right) \leqslant n\left(1-\frac{1}{n}\right)^{m} \leqslant n \mathrm{e}^{-\frac{m}{n}}\]
Soit \(c\) un réel strictement positif. Montrer qu’on a la majoration : \[\mathbb{P}\left(C_{n}>c n \ln (n)\right) \leqslant n^{1-c}\]
Montrer que pour tout réel \(x>-\ln (n)\), on a : \[\mathbb{P}\left(V_{n}>x\right) \leqslant \mathrm{e}^{-x}\]
Dans la suite de cette partie, on introduit un modèle légèrement différent : le nombre \(N\) de paquets achetés est décrit par une variable aléatoire \(N\) de loi de Poisson \(\mathcal{P}(\lambda)\) avec \(\lambda>0\). On cherche à calculer la probabilité de compléter, à partir des \(N\) vignettes obtenues, la collection de vignettes. On suppose toujours que les vignettes sont numérotées de 1 à \(n\). On note \(\widetilde{A}_{i}\) la variable aléatoire donnant le nombre de vignettes numérotées \(i\) obtenues dans les \(N\) paquets de céréales achetés.
Soit \(p \in \mathbb{N}^\ast\). Justifier que pour tout \(i \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), la loi conditionnelle de \(\widetilde{A}_{i}\) conditionnée par l’événement \([N=p]\) est la loi binomiale \(\mathcal{B}\left(p, \frac{1}{n}\right)\) et en déduire que la variable aléatoire \(\tilde{A}_{i}\) suit une loi de Poisson dont on déterminera le paramètre.
Soit \(p \in \mathbb{N}^\ast\). Montrer que pour tout \(n\)-uplet \(\left(k_{1}, \ldots, k_{n}\right)\) avec \(k_{i} \in \mathbb{N}\) et \(k_{1}+\cdots+k_{n}=p\), on a: \[\mathbb{P}_{[N=p]} \! \left(\left[\tilde{A}_{1}=k_{1}\right] \cap \cdots \cap\left[\tilde{A}_{n}=k_{n}\right]\right)=\frac{p !}{k_{1} ! \cdots k_{n} !} \times \frac{1}{n^{p}}\]
Montrer que pour tout \(n\)-uplet \(\left(k_{1}, \ldots, k_{n}\right)\) avec \(k_{i} \in \mathbb{N}\), on a: \[\mathbb{P}\! \left(\left[\tilde{A}_{1}=k_{1}\right] \cap \cdots \cap\left[\tilde{A}_{n}=k_{n}\right]\right)=\prod_{i=1}^{n} \frac{\mathrm{e}^{-\frac{\lambda}{n}}\left(\frac{\lambda}{n}\right)^{k_{i}}}{k_{i} !}\]
Montrer que les variables aléatoires \(\tilde{A}_{1}, \ldots, \widetilde{A}_{n}\) sont mutuellement indépendantes. Commenter en comparant avec le résultat de la question 15c.
Soit \(D_{n}\) l’événement « à l’issue des \(N\) achats de paquets de céréales, la collection de vignettes est complète».
Montrer que : \[\mathbb{P}\left(D_{n}\right)=\left(1-\mathrm{e}^{-\frac{\lambda}{n}}\right)^{n}\]
On admet le résultat suivant : pour tout \(p \in \mathbb{N}^{*}\), \(\mathbb{P}_{[N=p]} (D_{n} )=\mathbb{P}\left(C_{n} \leqslant p\right)\).
Montrer que : \[\mathbb{P}\left(D_{n}\right)=\sum_{p=0}^{\infty} \mathbb{P}\left(C_{n} \leqslant p\right) \mathbb{P}(N=p)\]
On suppose maintenant que \(\lambda>1\). Soit \(a \in \left] \sqrt{\lambda}, \lambda\right[\). On pose \(k_{1}=\lfloor\lambda-a\rfloor\) et \(k_{2}=\lfloor\lambda+a\rfloor+1\).
Montrer que: \[\sum_{p=k_{1}}^{k_{2}} \mathbb{P}(N=p) \geqslant 1-\frac{\lambda}{a^{2}}\]
Montrer l’encadrement: \[\mathbb{P}\left(C_{n} \leqslant k_{1}\right)\left(1-\frac{\lambda}{a^{2}}\right) \leqslant \mathbb{P}\left(D_{n}\right) \leqslant \mathbb{P}\left(C_{n} \leqslant k_{2}\right)+\frac{\lambda}{a^{2}}\]
Soit \(\left(c_{n}\right)_{n \geqslant 1}\) une suite convergente de nombres réels. Montrer que pour tout entier \(n\) suffisamment grand, on a l’encadrement: \[\mathbb{P}\! \left(V_{n} \leqslant c_{n}-\frac{1}{n^{1 / 3}}-\frac{1}{n}\right)\left(1-\frac{\ln (n)+c_{n}}{n^{1 / 3}}\right) \leqslant \left(1-\frac{\mathrm{e}^{-c_{n}}}{n}\right)^{n} \leqslant \mathbb{P}\! \left(V_{n} \leqslant c_{n}+\frac{1}{n^{1 / 3}}+\frac{1}{n}\right)+\frac{\ln (n)+c_{n}}{n^{1 / 3}} .\] On pourra appliquer la question précédente avec \(\lambda=n \ln (n)+c_{n} n\) et a \(=n^{2 / 3}\).
Retrouver alors la convergence en loi de la suite \(\left(V_{n}\right)_{n \geqslant 1}\) vers une variable aléatoire de loi de Gumbel.
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.