Connectez-vous pour consulter le corrigé.
L’objet du problème est d’étudier quelques propriétés d’un estimateur du paramètre \(p\) d’une loi géométrique.
Pour tout couple \((n, r)\) d’entiers naturels tels que \(0 \leqslant r \leqslant n\), on rappelle la formule du « triangle de Pascal » : \[\binom{n}{r}=\binom{n-1}{r-1}+\binom{n-1}{r}\]
Montrer que pour tout entier \(r\) de \(\left[\!\left[1, n\right]\!\right]\), on a : \[\binom{n}{r}=\sum_{k=r}^{n}\binom{k-1}{r-1}\]
Soit \((n, r)\) un couple d’entiers naturels, tels que \(1 \leqslant r \leqslant n\). Pour tout réel \(x\) de \(] 0,1[\), on définit la fonction \(f_{r, n}\) par : \[f_{r, n}(x)=\sum_{k=r}^{n}\binom{k}{r} x^{k}\]
Montrer, pour tout réel \(x\) de \(] 0,1[\), l’égalité : \(\displaystyle \left( 1-x \right) f_{r, n}(x)=x f_{r-1, n-1}(x)-\binom{n}{r} x^{n+1}\).
On suppose l’entier \(r\) fixé. Montrer, lorsque \(n\) tend vers \(+\infty\), l’équivalence : \(\displaystyle \binom{n}{r} \sim \frac{n^{r}}{r!}\).
Soit \(x\) un réel fixé de \(] 0,1 [\) et soit \(r\) un entier naturel fixé. On veut établir l’existence de la limite de \(f_{r, n}(x)\) lorsque \(n\) tend vers \(+\infty\), et déterminer la valeur de cette limite.
Justifier l’existence et donner la valeur de \(\displaystyle \lim _{n \rightarrow+\infty} f_{0, n}(x)\) et \(\displaystyle \lim _{n \rightarrow+\infty} f_{1, n}(x)\).
Soit \(r\) un entier naturel non nul. On suppose que, pour tout réel \(x\) de \(] 0,1[\), on a : \[\lim _{n \rightarrow+\infty} f_{r-1, n}(x)=\frac{x^{r-1}}{(1-x)^{r}}\]
Montrer que, pour tout réel \(x\) de \(] 0,1[\), \(\displaystyle \lim _{n \rightarrow+\infty} f_{r, n}(x)=\frac{x^{r}}{(1-x)^{r+1}}\).
Ainsi, \(\displaystyle \sum_{k=r}^{\infty}\binom{k}{r} x^{k}=\frac{x^{r}}{(1-x)^{r+1}}\).
Soit \(x\) un réel de \(] 0,1[\).
Montrer, pour tout entier \(n\) de \(\mathbb{N}^{*}\), l’égalité : \(\displaystyle \int_{0}^{x} \frac{1-t^{n}}{1-t} \, \mathrm{d}t=\sum_{k=1}^{n} \frac{x^{k}}{k}\).
À l’aide d’un encadrement simple, montrer que \(\displaystyle \lim _{n \rightarrow+\infty} \int_{0}^{x} \frac{t^{n}}{1-t} \, \mathrm{d}t=0\).
En déduire la convergence de la série de terme général \(\displaystyle \frac{x^{k}}{k}\) ainsi que l’égalité : \(\displaystyle \sum_{k=1}^{\infty} \frac{x^{k}}{k}=-\ln (1-x)\).
Toutes les variables aléatoires qui interviennent dans cette partie sont définies sur un même espace probabilisé \((\Omega,\mathcal{A},\mathbb{P})\).
Soit \(p\) un réel de \(] 0,1[\). On pose \(q=1-p\), et on considère une variable aléatoire \(X\) à valeurs dans \(\mathbb{N}^{*}\), qui suit la loi géométrique de paramètre \(p\). On rappelle que pour tout entier \(k\) de \(\mathbb{N}^{*}, \ \mathbb{P}(X=k)=p q^{k-1}\).
Calculer la valeur de l’espérance \(\mathbb{E}(X)\) et de la variance \(\mathbb{V}(X)\) de la variable aléatoire \(X\).
On considère la variable aléatoire \(Y\) définie par \(\displaystyle Y=\frac{1}{X}\).
Déterminer l’ensemble des valeurs prises par \(Y\) ainsi que la loi de probabilité de \(Y\).
Montrer que \(Y\) admet une espérance \(\mathbb{E}(Y)\), que l’on calculera en fonction de \(p\) et \(q\).
Pour tout entier \(i\) supérieur ou égal à 2, établir l’existence du moment \(\mathbb{E}(Y^{i})\) d’ordre \(i\) de \(Y\).
Soit \(X_{1}\) et \(X_{2}\) deux variables aléatoires indépendantes, à valeurs dans \(\mathbb{N}^{*}\), qui suivent la même loi géométrique de paramètre \(p\). On pose : \(S_{1}=X_{1}, \ S_{2}=X_{1}+X_{2}, \ \displaystyle Y_{2}=\frac{2}{S_{2}}\).
Déterminer la loi de probabilité de chacune des variables aléatoires \(S_{2}\) et \(Y_{2}\).
Établir l’existence de l’espérance \(\mathbb{E}(Y_{2})\) de la variable aléatoire \(Y_{2}\).
Calculer cette espérance en fonction de \(p\) et \(q\).
On considère une suite \(\left(X_{n}\right)_{n \in \mathbb{N}^{*}}\) de variables aléatoires à valeurs dans \(\mathbb{N}^{*}\), indépendantes, de même loi géométrique de paramètre \(p\). Pour tout \(n\) de \(\mathbb{N}^{*}\), on pose \(\displaystyle S_{n}=\sum_{k=1}^{n} X_{k}\).
Calculer l’espérance \(\mathbb{E}( S_{n})\) et la variance \(\mathbb{V}(S_{n})\) de la variable aléatoire \(S_{n}\).
Montrer que la loi de probabilité de la variable aléatoire \(S_{n}\) est donnée, pour tout entier \(s\) de \(\mathbb{N}^{*}\), par : \[\mathbb{P}( S_{n}=s )= \begin{cases} \hfill 0 \hfill & \text { si } s<n \\ \displaystyle \binom{s-1}{n-1} p^{n} q^{s-n} &\text { si } s \geqslant n \end{cases}\]
Pour tout entier \(n\) de \(\mathbb{N}^{*}\), on pose \(\displaystyle Y_{n}=\frac{n}{S_{n}}\).
Préciser l’ensemble des valeurs prises par la variable aléatoire \(Y_{n}\), ainsi que la loi de probabilité de \(Y_{n}\).
Soit \(t\) un réel quelconque de \([0,1 [\). Montrer que, pour tout \(m\) de \(\mathbb{Z}\), la série de terme général \(s^{m} t^{s}\) (\(\displaystyle \sum_{s \geqslant 1} s^{m} t^{s}\)) est convergente.
En déduire, en particulier, l’existence des moments d’ordre 1 et \(2\), \(\mathbb{E}( Y_{n})\) et \(\mathbb{E}(Y_{n}^{2})\), de la variable aléatoire \(Y_{n}\).
Soit \(p\) un réel de \(] 0,1[\). Dans cette partie, on considère une variable aléatoire réelle \(X\) à valeurs dans \(\mathbb{N}^{*}\), qui suit une loi géométrique de paramètre \(p\) inconnu. On pose \(q=1-p\).
Pour tout entier naturel non nul \(n\), on considère un \(n\)-échantillon \(( X_{1}, X_{2}, \ldots, X_{n} )\) de variables aléatoires à valeurs dans \(\mathbb{N}^{*}\), indépendantes, de même loi que \(X\).
Les variables aléatoires \(X, X_{1}, X_{2}, \ldots, X_{n}\) sont définies sur un même espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\).
On pose \(\displaystyle \overline{X}_{n}=\frac{S_{n}}{n}=\frac{1}{Y_{n}}\).
Montrer que \(\overline{X}_{n}\) est un estimateur pour le paramètre \(\displaystyle \frac{1}{p}\), d’espérance égale à \(\dfrac{1}{p}\).
Quelle est la variance de \(\overline{X}_{n}\) ?
Pour tout entier \(n\) de \(\mathbb{N}^{*}\), on note \(h_{n}\) et \(\varphi_{n}\) les applications définies sur \([0,1[\) à valeurs dans \(\mathbb{R}\) telles que : \[h_{n}(t)=\sum_{s=n}^{\infty} \frac{1}{s}\binom{s-1}{n-1} t^{s}, \quad \varphi_{n}(t)=\sum_{s=n}^{\infty} \frac{1}{s^{2}}\binom{s-1}{n-1} t^{s}\]
On admet dans toute la suite du problème, que \(h_{n}\) est de classe \(\mathcal C^{1}\) et que pour tout réel \(t\) de \([0,1[\), la dérivée \(h_{n}^{\prime}\) de \(h_{n}\) vérifie :
\[h_{n}^{\prime}(t)=\sum_{s=n}^{\infty}\binom{s-1}{n-1} t^{s-1}\]
On admet également que la fonction \(\varphi_{n}\) est dérivable sur \(] 0,1[\), de dérivée \(\varphi_{n}^{\prime}\), et que pour tout \(t\) de \(] 0,1[\), \(\displaystyle \varphi_{n}^{\prime}(t)=\frac{1}{t} \, h_{n}(t)\).
Montrer que \(\displaystyle \mathbb{E}( Y_{n})=n\left(\frac{p}{q}\right)^{n} h_{n}(q)\). Établir que, pour tout \(q\) de \([0,1[\), on a :
\[h_{n}(q)=\int_{0}^{q} \frac{t^{n-1}}{(1-t)^{n}} \, \mathrm{d}t\]
À l’aide du changement de variable \(\displaystyle y=\frac{t}{1-t}\), que l’on justifiera, montrer que pour tout \(q\) de \([0,1[\) : \[h_{n}(q)=\int_{0}^{q / p} \frac{y^{n-1}}{1+y} \,\mathrm{d}y\]
En déduire, en utilisant une intégration par parties, que l’on peut écrire pour tout \(q\) de \([0,1[\) : \[h_{n}(q)=\frac{q^{n}}{n p^{n-1}}+\frac{1}{n} \int_{0}^{q / p} \frac{y^{n}}{(1+y)^{2}} \,\mathrm{d}y\]
Pour tout \(n\) de \(\mathbb{N}^{*}\), soit \(b_{n}\) la fonction définie sur \(] 0,1[\) à valeurs réelles qui, à tout réel \(p\) de \(] 0,1[\), associe \(b_{n}(p)= \mathbb{E}(Y_{n})-p\) (\(b_{n}\) représente le biais de \(Y_{n}\) pour estimer \(p\)).
Montrer que \(\displaystyle b_{n}(p)=\left(\frac{p}{q}\right)^{n} \int_{0}^{q / p} \frac{y^{n}}{(1+y)^{2}} \,\mathrm{d}y\).
En déduire que la suite \(\left(b_{n}(p)\right)_{n \in \mathbb{N}^{*}}\) est convergente et préciser sa limite. Calculer \(\displaystyle \lim _{n \rightarrow+\infty} \mathbb{E}(Y_{n})\).
À l’aide d’une intégration par parties, montrer l’égalité : \(\displaystyle b_{n}(p)=\frac{p q}{n}+ \circ \! \left(\frac{1}{n}\right)\).
Le contexte de cette partie est identique à celui de la partie IV.
En utilisant la formule établie dans la question IV.13.b, montrer que, pour tout \(n\) de \(\mathbb{N}^{*}\), \(\displaystyle h_{n}(t) \sim \frac{t^{n}}{n}\) lorsque \(t\) tend vers 0 par valeurs supérieures.
En déduire que pour tout réel \(q\) de \(] 0,1 [\), l’intégrale \(\displaystyle \int_{0}^{q} \frac{h_{n}(t)}{t} \, \mathrm{d}t\) est convergente et que : \[\displaystyle \varphi_{n}(q)=\int_{0}^{q} \frac{h_{n}(t)}{t} \, \mathrm{d}t\]
Pour tout entier \(n\) de \(\mathbb{N}^{*}\), et pour tout réel \(t\) de \(] 0,1[\), on pose \(\displaystyle H_{n}(t)=\int_{0}^{t /(1-t)} \frac{y^{n}}{(1+y)^{2}} \, \mathrm{d}y\).
Montrer que, pour tout \(t\) de \(] 0,1[\), on a : \[\varphi_{n}^{\prime}(t)=\frac{1}{n}\left[\frac{t^{n-1}}{(1-t)^{n-1}}+\frac{H_{n}(t)}{t}\right]\]
Établir l’existence de l’intégrale \(\displaystyle \int_{0}^{q} \frac{H_{n}(t)}{t} \, \mathrm{d}t\), et en déduire l’égalité : \[\varphi_{n}(q)=\frac{1}{n}\left[\int_{0}^{q} \frac{t^{n-1}}{(1-t)^{n-1}} \, \mathrm{d}t+\int_{0}^{q} \frac{H_{n}(t)}{t} \, \mathrm{d}t\right]\]
Établir l’encadrement suivant : \(\displaystyle 0 \leqslant \int_{0}^{q} \frac{H_{n}(t)}{t} \, \mathrm{d}t\leqslant \frac{h_{n+1}(q)}{n+1}\).
En déduire que \(\displaystyle \lim _{n \rightarrow+\infty} n\left(\frac{p}{q}\right)^{n} \int_{0}^{q} \frac{H_{n}(t)}{t} \, \mathrm{d}t=0\).
Montrer, pour tout réel \(q\) de \(] 0,1[\), l’égalité : \[\int_{0}^{q}\left(\frac{t}{1-t}\right)^{n-1} \, \mathrm{d}t=\frac{q^{n}}{n p^{n-2}}+\frac{2}{n} \int_{0}^{q / p} \frac{y^{n}}{(1+y)^{3}} \,\mathrm{d}y\]
En déduire que \(\displaystyle \lim _{n \rightarrow+\infty} n\left(\frac{p}{q}\right)^{n} \int_{0}^{q}\left(\frac{t}{1-t}\right)^{n-1} \, \mathrm{d}t=p^{2}\).
On désigne par \(\mathbb{V}(Y_{n})\) la variance de \(Y_{n}\). Calculer \(\displaystyle \lim _{n \rightarrow+\infty} \mathbb{V}(Y_{n})\).
Dans cette partie, le contexte est identique à celui des deux parties précédentes.
En utilisant le résultat de la question IV.14.c, montrer que, lorsque \(n\) tend vers \(+\infty\) :
\[\left[ \mathbb{E}(Y_{n})\right]^{2}=p^{2}+\frac{2 p^{2} q}{n}+\circ \! \left(\frac{1}{n}\right)\]
On admet que, lorsque \(n\) tend vers \(+\infty\) : \[\mathbb{E}( Y_{n}^{2} )=p^{2}+\frac{3 p^{2} q}{n}+\circ \! \left(\frac{1}{n}\right)\]
Établir que, lorsque \(n\) tend vers \(+\infty\), \(\mathbb{V}(Y_{n}) \sim \frac{p^{2} q}{n}\).
Pour tout entier \(n\) de \(\mathbb{N}^{*}\), on pose \(\displaystyle T_{n}=\frac{Y_{n}-p}{\sqrt{\frac{p^{2} q}{n}}}\).
On admet que la suite de variables aléatoires \(\left(T_{n}\right)_{n \in \mathbb{N}^{*}}\) converge en loi vers une variable aléatoire \(T\) qui suit la loi normale centrée, réduite.
Cette question a pour objectif la détermination, pour \(n\) assez grand, d’un intervalle de confiance du paramètre inconnu \(p\), au risque \(\alpha\) donné. Autrement dit, il s’agit de trouver des variables aléatoires \(I_{n}\) et \(J_{n}\), fonctions de \(Y_{n}\), telles que \(\displaystyle \mathbb{P}\! \left(I_{n} \leqslant p \leqslant J_{n}\right) \geqslant 1-\alpha\).
Soit \(a_{\alpha}\) le réel strictement positif tel que \(\displaystyle \mathbb{P}\! \left(T \geqslant a_{\alpha}\right)=\frac{\alpha}{2}\). Ainsi, pour \(n\) assez grand, on peut considérer que : \[\mathbb{P}\! \left(-a_{\alpha} \leqslant T_{n} \leqslant a_{\alpha}\right)=1-\alpha\]
En déduire l’égalité : \(\displaystyle \mathbb{P}\! \left(Y_{n}-a_{\alpha} p \sqrt{\frac{q}{n}} \leqslant p \leqslant Y_{n}+a_{\alpha} p \sqrt{\frac{q}{n}}\right)=1-\alpha\).
Montrer que l’on peut choisir les « statistiques » \(I_{n}\) et \(J_{n}\) de la façon suivante :
\[I_{n}=Y_{n}-\frac{2 a_{\alpha}}{3 \sqrt{3}} \times \frac{1}{\sqrt{n}} \text { et } J_{n}=Y_{n}+\frac{2 a_{\alpha}}{3 \sqrt{3}} \times \frac{1}{\sqrt{n}}\]
On suppose que \(n=900\). Un échantillon observé \(x_{1}, x_{2}, \ldots, x_{900}\) de réalisations des variables aléatoires \(X_{1}, X_{2}, \ldots, X_{900}\) a fourni le résultat suivant : \(\displaystyle \overline{x}_{900}=\frac{1}{900} \sum_{i=1}^{900} x_{i}=4\).
Calculer la réalisation \(y_{900}\) de la variable aléatoire \(Y_{900}\).
On se donne un niveau de risque \(\alpha=0.05\); le nombre \(a_{0.05}\) est à peu près égal à 2. Sachant que \(\frac{2}{45 \sqrt{3}} \approx 0.026\), trouver un intervalle de confiance réalisé qui contienne le paramètre inconnu \(p\) avec un niveau de confiance au moins égal à 0.95.
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.