Connectez-vous pour consulter le corrigé.
Dans les questions faisant intervenir des instructions en langage Python, on prendra soin d’importer les bibliothèques nécessaires lors de leur première utilisation.
Pour traiter les questions d’informatique, les candidats sont invités à se référer à l’annexe fournie en fin de sujet. Ils ne sont pas limités à l’utilisation des seules fonctions mentionnées dans cette annexe.
Soit \(p \in \left] 0,1 \right[\). On considère une pièce donnant Pile avec probabilité \(p\). On effectue une succession de lancers indépendants de cette pièce jusqu’à l’obtention du deuxième Pile.
On note alors \(X_{1}\) le rang d’apparition du premier Pile et \(X_{2}\) le nombre de lancers supplémentaires effectués après le premier Pile jusqu’à l’apparition du deuxième Pile.
Par exemple, si les lancers donnent dans cet ordre, Face, Pile, Face, Face, Face, Pile, alors \(\left[X_{1}=2\right]\) et \(\left[X_{2}=4\right]\) se réalisent.
Reconnaitre la loi de \(X_{1}\) et la loi de \(X_{2}\).
Déterminer la loi conjointe du couple \(\left(X_{1}, X_{2}\right)\).
En déduire que les variables aléatoires \(X_{1}\) et \(X_{2}\) sont indépendantes.
Montrer que, pour tout entier \(n \geqslant 2\) :
\[\mathbb{P}( X_{1}+X_{2}=n )= \left( n-1 \right) p^{2} \left( 1-p \right)^{n-2}\]
On note \(Y\) la variable aléatoire égale au nombre de Face obtenus sur toute l’expérience.
Recopier et compléter la fonction Python suivante, prenant en argument d’entrée le réel \(p\) de \(] 0,1[\), et renvoyant une simulation de la variable aléatoire \(Y\) :
Exprimer \(Y\) en fonction de \(X_{1}\) et \(X_{2}\).
En déduire l’espérance de \(Y\), la variance de \(Y\) et la loi de \(Y\).
Une fois le second Pile obtenu, si l’on a obtenu un nombre \(n\) de Face, alors on place \(n+1\) boules numérotées de 0 à \(n\) dans une urne. On effectue alors un unique tirage dans cette urne et on note \(U\) la variable aléatoire égale au numéro obtenu. On note également \(V=Y-U\).
Écrire une fonction Python simul_UV,
prenant en argument d’entrée la valeur du réel \(p\) de \(\left]
0,1 \right[\), et renvoyant une simulation du couple \((U, V)\). On pourra faire appel à la
fonction simul_Y définie à la question
5.
Justifier que \(U(\Omega)=\mathbb{N}\) et préciser \(V(\Omega)\).
Pour tout \(k \in \mathbb{N}\), déterminer \(\mathbb{P}(U=k)\).
Montrer que la variable aléatoire \(U+1\) suit une loi usuelle que l’on reconnaitra. En déduire l’espérance et la variance de \(U\).
Montrer que \(V\) suit la même loi que \(U\).
Montrer que \(U\) et \(V\) sont indépendantes.
En déduire la covariance du couple \((Y, U)\).
Montrer que le coefficient de corrélation linéaire du couple \((Y, U)\) est égal à \(\frac{\sqrt{2}}{2}\).
Soit \(f\) la fonction définie sur \(\mathbb{R}\) par :
\[\forall x \in \mathbb{R}, \ f(x)=x^{3}-3 x\]
On note \(\mathscr{C}\) la courbe représentative de \(f\).
Étudier la parité de \(f\) sur \(\mathbb{R}\).
Déterminer les variations de \(f\) sur \(\left[0,+\infty\right[\), et calculer \(\lim\limits_{x \rightarrow+\infty} f(x)\).
Montrer que \(f\) est convexe sur \(\left[0,+\infty\right[\) et justifier que le point d’abscisse 0 est un point d’inflexion de la courbe \(\mathscr{C}\).
On note \(T\) la tangente à la courbe \(\mathscr{C}\) au point d’abscisse 0 .
Déterminer une équation de \(T\) et préciser la position relative de \(\mathscr{C}\) par rapport à \(T\).
Tracer, sur une même figure, l’allure de la courbe \(\mathscr{C}\) (sur \(\mathbb{R}\) ) et de la droite \(T\).
Soit \(a\) un réel.
Montrer que, si \(|a|<2\), alors l’équation \(x^{3}-3 x+a=0\), d’inconnue \(x\), possède exactement trois solutions réelles.
Montrer que, si \(|a|>2\), alors l’équation \(x^{3}-3 x+a=0\), d’inconnue \(x\), possède une unique solution réelle.
Pour tout réel \(a\), on considère la matrice :
\[A_{a}= \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ -a & 3 & 0 \end{pmatrix}\]
Calculer \(A_{a}^{3}-3 A_{a}+a I_{3}\).
Soient \(\lambda\) un réel tel que \(\lambda^{3}-3 \lambda+a=0\), et soit \(X=\begin{pmatrix} 1 \\ \lambda \\ \lambda^{2}\ \end{pmatrix}\).
Exprimer \(A_{a} X\) en fonction de \(\lambda\) et de \(X\).
Déduire des deux questions précédentes que, pour tout réel \(\lambda\), \(\lambda\) est valeur propre de \(A_{a}\) si et seulement si \(\lambda^{3}-3 \lambda+a=0\).
Dans cette question uniquement, on suppose \(a=2\).
Déterminer les valeurs propres et une base de chaque sous-espace propre de \[A_{2}= \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ -2 & 3 & 0 \end{pmatrix}\]
La matrice \(A_{2}\) est-elle diagonalisable ?
Dans cette question uniquement, on suppose \(|a|>2\).
La matrice \(A_{a}\) est-elle diagonalisable ?
Indication: On pourra utiliser le résultat de la question 6.
Dans cette question uniquement, on suppose \(a \in \left] -2,2 \right[\).
Montrer que \(A_{a}\) est diagonalisable.
Indication: On pourra utiliser le résultat de la question 6.
On note \(\lambda, \mu, \nu\) les valeurs propres de \(A_{a}\). On considère les matrices \[D=\begin{pmatrix} \lambda & 0 & 0 \\ 0 & \mu & 0 \\ 0 & 0 & \nu \end{pmatrix} \quad \text{et} \quad P=\begin{pmatrix} 1 & 1 & 1 \\ \lambda & \mu & \nu \\ \lambda^{2} & \mu^{2} & \nu^{2} \end{pmatrix}\]
Justifier que \(P\) est inversible.
Exprimer \(A_{a}\) en fonction de \(D\) et \(P\).
Pour tout réel \(a\), on considère l’équation différentielle \(\left(\mathscr{E}_{a}\right)\) suivante, d’inconnue \(y: \mathbb{R} \to \mathbb{R}\) trois fois dérivable sur \(\mathbb{R}\) :
\[\left(\mathscr{E}_{a}\right): \quad y^{\prime \prime \prime}-3 y^{\prime}+a y=0\]
Dans cette question uniquement, on suppose que \(a=0\).
Soit \(y\) une solution de l’équation \((\mathscr{E}_0): y^{\prime \prime \prime}-3 y^{\prime}=0\). Déterminer la forme générale de la fonction \(y^{\prime}\).
En déduire l’ensemble des solutions de l’équation \(\left(\mathscr{E}_{0}\right)\).
Dans la suite de l’exercice, pour toute fonction \(y\) trois fois dérivable sur \(\mathbb{R}\), on note \(Y=\begin{pmatrix} y \\ y^{\prime} \\ y^{\prime \prime} \end{pmatrix}\) et \(Y^{\prime}=\begin{pmatrix} y^{\prime} \\ y^{\prime \prime} \\ y^{\prime \prime \prime} \end{pmatrix}\).
Montrer que, pour tout réel \(a\), \(y\) est solution de l’équation différentielle \(\left(\mathscr{E}_{a}\right)\) si et seulement si \(Y^{\prime}=A_{a} Y\).
Dans cette question uniquement, on suppose \(a \in \left] -2,2 \right[\).
Montrer qu’une fonction \(y: \mathbb{R} \to \mathbb{R}\) est solution de l’équation différentielle \(\left(\mathscr{E}_{a}\right)\) si et seulement si \(Z^{\prime}=D Z\), où \(Z=P^{-1} Y\), où \(D\) et \(P\) sont définies à la question 10b.
Montrer que les solutions de l’équation différentielle \(\left(\mathscr{E}_{a}\right)\) sont les fonctions \(y\) définies par une expression de la forme: \[\forall x \in \mathbb{R}, \ y(x)=\alpha_{1} \,\mathrm{e}^{\lambda x}+\alpha_{2} \,\mathrm{e}^{\mu x}+\alpha_{3} \,\mathrm{e}^{\nu x}\]
où \(\alpha_{1}, \alpha_{2}, \alpha_{3}\) sont des réels.
Vérifier en particulier que les résultats de 11b et 13b sont cohérents.
Sur le marché des véhicules d’occasion, on observe en général une baisse du prix de revente (ou décote) d’un véhicule lorsque le nombre de kilomètres parcourus augmente. Une bonne estimation de cette baisse de prix permet au vendeur de fixer avec précision le prix de revente d’un véhicule.
Les trois parties de cet exercice sont indépendantes.
On dispose d’une base de données comportant deux tables
vehicule et annonce
décrites ci-dessous.
La table véhicule recense des informations
sur les modèles de véhicules en vente sur le marché. Elle est composée
des attributs suivants :
id_vehicule (de type
integer) : un code permettant d’identifier de
façon unique chaque référence de véhicule (marque et modèle),
marque (de type
text) : le nom du constructeur du
véhicule,
modele (de type
text) : le modèle du véhicule, un constructeur
proposant en général plusieurs modèles de véhicules à la vente,
prix_neuf (de type
integer) : le prix de vente du véhicule
neuf.
La table annonce regroupe des informations
sur un grand nombre d’annonces de véhicules d’occasion. Chaque
enregistrement correspond à une annonce et possède les attributs
suivants :
id_annonce (de type
integer) : un code permettant d’identifier
chaque annonce de façon unique,
id_vehicule (de type
integer) : l’identifiant du modèle de véhicule
vendu, qui correspond à l’identifiant utilisé dans la table
vehicule,
annee (de type
integer) : année de première mise en
circulation du véhicule,
km (de type
integer) : le nombre de kilomètres parcourus
par le véhicule au moment de la revente,
prix_occasion (de type
integer) : le prix de vente du véhicule
d’occasion.
En justifiant brièvement, identifier une clef primaire dans
chacune des tables vehicule et
annonce, ainsi qu’une clef étrangère dans la
table annonce.
Écrire une requête SQL permettant
d’extraire les noms de tous les modèles de véhicules mis en vente par le
constructeur Dubreuil Motors.
Expliquer le fonctionnement de la requête
SQL suivante et préciser l’effet éventuel de
cette requête sur chacune des tables vehicule
et annonce.
À l’aide d’une jointure, écrire une requête
SQL permettant d’obtenir, sur une même table,
la liste de toutes les annonces de la table
annonce avec les attributs suivants :
l’identifiant de l’annonce
id_annonce,
le kilométrage km,
le prix de vente du véhicule neuf
prix_neuf,
le prix de l’annonce d’occasion
prix_occasion.
Soit \(n \geqslant 1\) un entier. On suppose dans cette partie qu’on dispose des informations suivantes concernant \(n\) annonces de véhicules d’occasion.
Ces informations sont stockées sous forme de tableaux
Numpy à une dimension et à \(n\) éléments :
Le tableau Numpy nommé
km contient, pour chaque annonce, le nombre de
kilomètres parcourus par le véhicule vendu depuis sa mise en
circulation,
Le tableau Numpy nommé
rapport contient, pour chaque annonce, le
quotient du prix de revente d’occasion du véhicule par son prix de vente
neuf.
Ainsi, les éléments du tableau rapport sont
des flottants compris entre 0 et 1 .
Les données contenues dans ces variables sont classées dans le même
ordre. Ainsi, pour tout indice \(i\)
entre 0 et \(n-1\),
km[i] et rapport[i]
correspondent respectivement au kilométrage et au rapport de prix
occasion/neuf d’une même annonce.
Écrire une suite d’instructions Python permettant d’afficher le rapport de prix occasion/neuf du véhicule ayant le plus grand kilométrage parmi toutes les annonces (ou de l’un de ces véhicules si plusieurs annonces possèdent un kilométrage maximal).
Écrire une suite d’instructions Python permettant de représenter
graphiquement, sous forme de nuage de points, les points du plan de
coordonnées (km[i],rapport[i]), où \(i\) décrit l’ensemble des indices de \(0\) à \(n-1\).
Les instructions données à la question précédente permettent d’obtenir la figure représentée ci-dessous.
Une approximation par régression linéaire vous semble-t-elle pertinente pour modéliser l’évolution du prix des véhicules d’occasion (rapporté au prix neuf) en fonction de leur kilométrage ?
On calcule le coefficient de corrélation linéaire
rho de la série statistique double
(km,rapport). Parmi les quantités suivantes,
en justifiant votre réponse, indiquer la valeur obtenue.
rho=0.113,
rho=-0.406,
rho=-0.985,
rho=0.917.
Soit \(n \geqslant 1\) un entier. Dans cette partie, on étudie deux variables statistiques quantitatives \(x\) et \(r\). On souhaite expliquer la dépendance de \(r\) par rapport à \(x\) à l’aide d’une relation exponentielle de la forme : \[r=a \,\mathrm{e}^{-c x} \qquad (\ast)\]
où \(a\) et \(c\) sont des réels que l’on cherche à déterminer, avec \(a>0\). On dispose pour cela de deux séries statistiques \(\left(x_{1}, x_{2}, \ldots, x_{n}\right)\) et \(\left(r_{1}, r_{2}, \ldots, r_{n}\right)\) représentant des mesures des variables \(x\) et \(r\) respectivement.
On pose \(y=\ln( r)\). Montrer que les variables \(x\) et \(r\) vérifient la relation \((\ast)\) si et seulement si \(x\) et \(y\) vérifient une relation de la forme : \[y=\alpha x+\beta\]
où \(\alpha\) et \(\beta\) sont des paramètres réels que l’on exprimera en fonction de \(a\) et \(c\).
On rappelle que la droite de régression linéaire de \(y=\left(y_{1}, \ldots, y_{n}\right)\) par rapport à \(x=\left(x_{1}, \ldots, x_{n}\right)\) a pour équation :
\[y=\frac{s_{x, y}}{s_{x}^{2}} \left( x-\overline{x} \right)+\overline{y}\]
où :
\(s_{x, y}\) désigne la covariance empirique de la série statistique double \((x, y)\);
\(\overline{x}\) et \(\overline{y}\) désignent les moyennes des séries statistiques \(x\) et \(y\) respectivement ;
\(s_{x}^{2}\) désigne la variance de la série statistique \(x\).
Rappeler les formules mathématiques définissant \(\overline{x}\), \(s_{x}^{2}\) et \(s_{x, y}\) en fonction de \(n, x_{1}, \ldots, x_{n}\) et \(y_{1}, \ldots, y_{n}\). Rappeler les formules de Koenig et de Koenig-Huygens permettant de reformuler \(s_{x}^{2}\) et \(s_{x, y}\).
Exprimer \(a\) et \(c\) en fonction de \(\overline{x}\), \(\overline{y}\), \(s_{x}^{2}\) et \(s_{x, y}\).
Recopier et compléter la fonction suivante pour qu’elle renvoie la covariance empirique des séries statistiques \(\mathrm{x}\) et y fournies en argument d’entrée sous forme de tableaux Numpy à une dimension.
Recopier et compléter la fonction suivante, prenant en arguments
d’entrée les séries statistiques \(\left(x_{1}, x_{2}, \ldots, x_{n}\right)\)
et \(\left(r_{1}, r_{2}, \ldots,
r_{n}\right)\) (sous forme de tableaux
Numpy à une dimension
x et r
respectivement), pour qu’elle renvoie des valeurs approchées des
paramètres \(a\) et \(c\) qui interviennent dans la relation
\((*)\).
La bibliothèque numpy.
Exemple d’importation :
import numpy as np.
Les opérations +,-,*,/,**, lorsqu’elles
sont possibles, peuvent être réalisées entre deux tableaux
Numpy de dimensions compatibles et agissent
alors coefficient par coefficient.
Les fonctions np.log (logarithme
népérien) et np.exp (fonction exponentielle)
s’appliquent à une quantité numérique ou à un tableau
Numpy de nombres. Dans ce dernier cas, les
fonctions sont appliquées à chaque élément du tableau donné en argument
d’entrée.
La fonction np.mean, prend en argument
d’entrée un tableau Numpy de nombres, et
renvoie la moyenne des éléments du tableau.
La bibliothèque matplotlib.pyplot.
Exemple d’importation :
import matplotlib.pyplot as plt.
La fonction plt.plot prend en arguments
d’entrée deux tableaux Numpy
x et y à une ligne
et de même longueur, et renvoie une figure constituée de la ligne brisée
joignant les points du plan de coordonnées \(\left(x_{i}, y_{i}\right)\), où \(x_{i}\) et \(y_{i}\) sont respectivement les
coefficients des tableaux x et
y.
La fonction plt.scatter prend en
arguments d’entrée deux tableaux Numpy
x et y à une
dimension et de même longueur, et produit un nuage de points composé de
tous les points du plan de coordonnées \(\left(x_{i}, y_{i}\right)\), où \(x_{i}\) et \(y_{i}\) sont respectivement les
coefficients des tableaux x et
y.
La fonction plt.show, employée sans
argument d’entrée, permet l’affichage d’une figure préalablement tracée,
par exemple avec les fonctions plt.plot ou
plt.scatter.
Le module numpy.random.
Exemple d’importation :
import numpy.random as rd.
La fonction rd.random, appelée sans
argument d’entrée, renvoie une réalisation aléatoire de la loi uniforme
sur l’intervalle \([0,1[\). Il est
également possible de spécifier les dimensions d’un tableau
Numpy en argument d’entrée pour obtenir un
tableau dont les coefficients sont des réalisations indépendantes de la
loi uniforme sur \([0,1[\).
La fonction rd.randint prend deux
entiers \(n\) et \(p\) (avec \(p>n\) ) en arguments d’entrée et renvoie
une réalisation aléatoire de la loi uniforme discrète sur \(\left[\kern-0.15em\left[ {n,p-1}
\right]\kern-0.15em\right]\).
Le corrigé pas à pas, les aides et les explications sont disponibles dans la plateforme.