Connectez-vous pour consulter le corrigé.
On considère un espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\).
Pour définir un graphe aléatoire non orienté \(G\) on se donne :
\(S=\left\{s_{1}, \ldots, s_{n}\right\}\), un ensemble fini de \(n \geqslant 2\) sommets ;
pour toute paire de sommets \(\left\{s_{i}, s_{j}\right\}\) avec \(i<j\), \(T_{i, j}\) est une variable de Bernoulli de paramètre \(p\) sur \((\Omega, \mathcal{A}, \mathbb{P})\);
Les arêtes du graphe sont les paires \(\left\{s_{i}, s_{j}\right\}\) telles que \(T_{i, j}=1\) avec \(i<j\). Les variables \(T_{i, j}\) sont supposées indépendantes.
Voici un exemple de graphe aléatoire avec \(S=\{a, b, c, d, e\}\) et \(p=0,4\) :
On peut considérer qu’un graphe aléatoire est un modèle très simplifié de réseau social à un instant donné.
Quel est le nombre maximal d’arêtes de \(G\) ?
Écrire une fonction Python listAdj(S,p)
qui génère la liste des listes d’adjacence d’un tel graphe aléatoire
ayant S pour liste de sommets.
Le graphe dessiné correspond à la liste des listes d’adjacence suivante
[[’c’,’e’],[’d’,’e’],[’a’, ’e’],[’b’,’e’],[’a’,’b’,’c’,’d’]]
avec la liste des sommets qui est
S=’abcde’
Pour tout \(k \in \left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]\), on considère la variable aléatoire \(D_{k}\) égale au degré du sommet \(s_{k}\). Déterminer la loi de \(D_{k}\).
On dit que \(s_{k}\) est isolé si \(D_{k}=0\) est réalisé. On note \(Z_{n}\) la variable aléatoire comptant les sommets isolés de \(G\) et \(X_{k}\) la variable aléatoire de Bernoulli qui vaut 1 si \(s_{k}\) est isolé et 0 sinon.
Montrer que : \(Z_{n}=\sum\limits_{k=1}^{n} X_{k}\). En déduire que \(\mathbb{E}(Z_{n})=n(1-p)^{n-1}\).
Montrer que : \(Z_{n}^{2}=\sum\limits_{k=1}^{n} X_{k}+2 \sum\limits_{1 \leqslant i<j \leqslant n} X_{i} X_{j}\).
Justifier que : \[\forall (i,j)\in\left[\kern-0.15em\left[ {1,n} \right]\kern-0.15em\right]^2,\ i\neq j,\ \mathbb{P} (\left[X_{i}=1\right] \cap\left[X_{j}=1\right] )=(1-p)^{2 n-3}\]
En déduire que : \[\mathbb{E}(Z_{n}^{2})=n(1-p)^{n-1}+n(n-1)(1-p)^{2 n-3}\]
On suppose désormais que \(p=p_{n}=c\, \dfrac{\ln (n)}{n}\), avec \(c>0\), \(c \neq 1\).
Écrire une fonction Python Z qui
renvoie le nombre de sommets isolés d’un graphe donné par sa liste de
listes d’adjacence lst. On importera les
bibliothèques numpy as np et
numpy.random as rd.
On souhaite estimer l’influence de la valeur de \(c\) sur le nombre de sommets isolés. En exécutant le script suivant :
on obtient [0.0,0.0,0.0,0.91,0.975,0.99]
après de longues minutes.
Quelle conjecture sur la valeur d’une probabilité pouvez-vous faire lorsque \(c<1\) et \(c>1\) ? Justifier.
Montrer que \(\left(1-p_{n}\right)^{n-1} \underset{n \rightarrow+\infty}{\sim}\left(1-p_{n}\right)^{n}\) puis que \(\left(1-p_{n}\right)^{n-1} \underset{n \rightarrow+\infty}{\sim} n^{-c}\).
On rappelle que l’inégalité de Markov affirme que si \(X\) est une variable aléatoire positive admettant une espérance et \(a>0\), alors : \[\mathbb{P}(X \geqslant a) \leqslant \frac{\mathbb{E}(X)}{a}\]
Si \(c>1\), en déduire la limite de \(\mathbb{P}(Z_{n} \geqslant 1)\) puis de \(\mathbb{P}( Z_{n}=0 )\), lorsque \(n\) tend vers \(+\infty\).
En utilisant l’inégalité de Bienaymé-Tchébichev, montrer que : \[\mathbb{P}( Z_{n}= 0) \leqslant \frac{\mathbb{V} (Z_{n} )}{ \left[ \mathbb{E}(Z_n) \right]^{2}}\]
En déduire que si \(c<1\), \(\mathbb{P} ( Z_{n}=0 )\) tend vers \(0\) quand \(n\) tend vers \(+\infty\).
Votre conjecture est-elle correcte?
On souhaite modéliser la loi de probabilité de la variable aléatoire \(T\) qui à une ville, choisie au hasard parmi les villes françaises, associe l’effectif de sa population. On note \(n\) le nombre de villes.
Pour 2018, on dispose d’un fichier
Data1.csv de données provenant de l’INSEE et
on utilise la bibliothèque Pandas. On exécute
les instructions suivantes :
ce qui produit le graphique suivant :
Expliquer pourquoi le programme et le graphique précédent justifient qu’il existe deux réels \(a\) et \(b\) tels que, pour toute ville, le réel \(\dfrac{a}{t^{b}}\), où \(t\) est l’effectif de celle-ci, est une approximation raisonnable du rang de celle-ci dans la liste des villes classées par ordre décroissant de population?
Quelle grandeur peut-on calculer pour confirmer ce que l’on constate graphiquement? Quelle méthode peut-on utiliser pour obtenir le meilleur couple \((a, b)\) en un certain sens?
On suppose que l’on a pour toutes les villes, \(r=\dfrac{a}{t^{b}}\), \(r\) étant le rang de cette ville, \(t\) son effectif, \(a\) et \(b\) deux réels strictement positifs identiques pour toutes les villes. Si \(x\) est l’effectif d’une des villes françaises, quelle est, en fonction de \(a, b, x\) et \(n\), la proportion de villes dont la population urbaine est supérieure ou égale à \(x\) ?
On suppose désormais que \(T\) suit la loi de Pareto de paramètre \(\theta>1\) et \(x_{0}>0\), c’est à dire qu’elle admet pour densité la fonction \(f\) définie par :
\[f(x)= \begin{cases} \theta \, \dfrac{x_{0}^{\theta}}{x^{\theta+1}} & \text {si } x \geqslant x_{0} \\ \hfill 0 \hfill &\text {sinon} \rule[0pt]{0pt}{20pt} \end{cases}\]
On note \(\operatorname{Par}\left(\theta, x_{0}\right)\) cette loi.
Déterminer la fonction de répartition \(F\) de \(T\).
En calculant \(\mathbb{P}(T \geqslant x)\), montrer que ce résultat est cohérent avec le résultat de la question 1 et exprimer \(x_{0}\) et \(\theta\) en fonction de \(a, b\) et \(n\).
Montrer que \(\mathbb{E}(T)\) existe et vaut \(\dfrac{\theta}{\theta-1} \, x_{0}\).
Soit \(x \geqslant x_{0}\), on note \(\mathbb{P}_{x}\) la probabilité conditionnelle sachant \([T>x]\).
Montrer que pour tout \(t \geqslant x \geqslant x_{0}\), \(\mathbb{P}_{x}(T>t)=\left(\dfrac{x}{t}\right)^{\theta}\).
On pose pour tout \(t \in \mathbb{R}\), \(F_{x}(t)=\mathbb{P}_{x}( T \leqslant t )\). De quelle loi \(F_{x}\) est-elle la fonction de répartition? Quelle est alors l’espérance de cette loi ?
Soit \(\delta \in \left] 1,+\infty \right[\).
On suppose que \(Y\) est une variable aléatoire à valeurs dans \(\left[ x_{0},+\infty\right[\) admettant une densité \(f_{Y}\) continue sur \(\left[x_{0},+\infty[\right.\), et on note \(F_{Y}\) sa fonction de répartition. On suppose que : \[\forall x \geqslant x_{0},\ \mathbb{P}( Y \geqslant x)>0\]
Soit \(x \geqslant x_{0}\). Montrer que la fonction \(G_{x}\) définie sur \(\mathbb{R}\) par \(G_{x}: t \mapsto \mathbb{P}_{[Y \geqslant x]}(Y \leqslant t)\) est la fonction de répartition d’une variable aléatoire à densité dont on déterminera une densité.
On suppose que pour tout \(x \geqslant x_{0}\), l’espérance d’une variable aléatoire de fonction de répartition \(G_{x}\) existe et vaut \(\delta x\).
En déduire que pour tout \(x \geqslant x_{0}, \ \left( \delta-1 \right) x f_{Y}(x)=\delta \left[ 1-F_{Y}(x)\right]\).
Résoudre l’équation différentielle \(\left( 1-\delta \right) x y^{\prime}-\delta y=0\) sur \(\left[x_{0},+\infty \right[\).
En conclure que \(Y\) suit une loi de Pareto dont on précisera les paramètres.
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.