Méthodes

Comment savoir si une fonction de plusieurs variables admet des extrémums globaux ?

Les questions essentielles pour savoir si une fonction de plusieurs admet des extremums globaux... sans nécessairement les déterminer.

Thème : Analyse

Chapitre : Fonctions de plusieurs variables

Année : ECG2

Option : Maths approfondies

On s'intéresse ici à l'existence d'extremums globaux pour une fonction de plusieurs variables. L’objectif n’est donc pas nécessairement de déterminer les extrémums globaux, mais d’étudier s’ils peuvent exister.

Questions réflexes

Les questions réflexes suivantes permettent de procéder méthodiquement pour savoir si une fonction de plusieurs variables admet des extremums globaux.

Peut-on calculer une limite ?

La fonction est-elle continue sur une partie fermée bornée ?

La matrice hessienne de \( f \) est-elle simple ?

A-t-on trouvé des extremums locaux ?

Peut-on calculer une limite ?

Démarche

Avant de se lancer dans des calculs compliqués pour savoir si une fonction de plusieurs variables admet des extremums globaux, il est souvent utile d’écarter les cas les plus simples.

Le premier réflexe doit donc être d’étudier les limites des applications partielles aux bornes de leur domaine de définition.

Concrètement, on fixe toutes les variables sauf une, puis on fait varier celle-ci. Par exemple, pour une fonction \((x,y)\mapsto f(x,y)\), on peut fixer \(y\) et faire tendre \(x\) vers \(+\infty\) ou vers \(-\infty\).

Si l’on peut obtenir une limite égale à \(+\infty\), alors \(f\) n’est pas majorée et ne peut donc pas admettre de maximum global.
Si l’on peut obtenir une limite égale à \(-\infty\), alors \(f\) n’est pas minorée et ne peut donc pas admettre de minimum global.

Cette vérification permet souvent d’exclure immédiatement l’existence de certains extremums globaux.

Erreur classique.

Penser que l’on peut conclure lorsque les limites trouvées sont finies.

Le fait que les applications partielles admettent des limites finies ne suffit pas à montrer que la fonction est bornée sur tout son domaine.

Exemple

On considère la fonction \( f \) définie sur \( \mathbb{R}^2 \) par :

\[ f(x,y)=x^2y-y^3+x \]

La fonction \( f \) admet-elle des extremums globaux ?

On étudie une fonction partielle en fixant \(x=0\) et en faisant varier \(y\). On a :

\[ \forall y \in \mathbb{R},\ f(0,y)=-y^3 \]

On a ainsi :
\[ \lim_{y \to + \infty} f(0,y) = -\infty \]

Ainsi la fonction \( f \) n’est pas minorée sur \(\mathbb{R}^2\), donc elle n'admet pas de minimum global sur \(\mathbb{R}^2\).
On a de même :\[ \lim_{y \to - \infty} f(0,y) = +\infty \]

Ainsi la fonction \( f \) n’est pas majorée sur \(\mathbb{R}^2\), donc elle n'admet pas de maximum global sur \(\mathbb{R}^2\).

La fonction est-elle continue sur une partie fermée bornée ?

Démarche

Lorsque le domaine d’étude est un ensemble fermé et borné, l’existence d’extremums globaux est souvent une conséquence directe du théorème des bornes atteintes.

On procède alors en deux temps :

vérifier que le domaine \(K\) est fermé, borné et non vide,
vérifier que \(f\) est continue sur \(K\)

Dans ce cas, \(f\) admet un minimum global et un maximum global sur \(K\). Il reste alors à déterminer où ils sont atteints.

Remarques.

Conformément au programme, le fait que \(K\) est fermé est en général donné ou admis dans l’énoncé.
En pratique, lorsque l’on veut déterminer les extremums sur une partie fermée bornée, on commence par étudier \(f\) à l’intérieur de l’ensemble (en retirant la frontière, on travaille sur un ouvert et les méthodes usuelles s’appliquent), puis on étudie \(f\) sur la frontière, et enfin on compare les valeurs obtenues à l’intérieur et sur la frontière.

Exemple

On considère la fonction \( f \) définie sur \( \mathbb{R}^2 \) par :

\[ f(x,y)=x^2y-y^3+x \]

Montrer que \( f \) admet un maximum global et un minimum global sur \(D=\{(x,y)\in\mathbb{R}^2\mid x^2+y^2\le 1\}\).

\(D\) est une partie fermée et bornée et non vide de \( \mathbb{R}^2 \) (c'est une boule fermée),
\(f\) est continue sur \(\mathbb{R}^2\), donc sur \(D\), en tant que fonction polynôme.

Le théorème des bornes atteintes garantit donc l’existence d’un minimum global et d’un maximum global sur \(D\).

La matrice hessienne de \( f \) est-elle simple ?

Démarche

On se place sur un ouvert convexe \(\mathcal{O}\subset\mathbb{R}^n\) et on suppose \(f\) de classe \(\mathcal{C}^2\) sur \(\mathcal{O}\).

Pour obtenir un extremum global sur \(\mathcal{O}\) à partir d’un point critique, on peut utiliser un critère suffisant fondé sur le signe des valeurs propres de la matrice hessienne.

Soit \(a\in\mathcal{O}\) tel que \(\nabla f(a)=0\). Alors :

si \(\forall x\in\mathcal{O}\) les valeurs propres de \(\nabla^2 f(x)\) sont toutes positives ou nulles, alors \(f(a)\) est un minimum global de \(f\) sur \(\mathcal{O}\)
si \(\forall x\in\mathcal{O}\) les valeurs propres de \(\nabla^2 f(x)\) sont toutes négatives ou nulles, alors \(f(a)\) est un maximum global de \(f\) sur \(\mathcal{O}\)

Autrement dit, si la hessienne a un signe constant sur tout \(\mathcal{O}\), tout point critique fournit un extremum global.

Remarque

En pratique cette méthode n'est réaliste que si la matrice hessienne de \( f\) est assez simple pour être étudiée en tout point.

Erreur classique

Oublier que, pour une condition suffisante d’extremum global, il faut étudier la matrice \(\nabla^2 f(x)\) en tout point \(x\in\mathcal{O}\), et pas seulement au point critique \(a\).

Exemple

Soit \(\mathcal{O}=(\mathbb{R}_+^*)^2\) et \(f:\mathcal{O}\to\mathbb{R}\) définie par

\[ \forall (x,y)\in(\mathbb{R}_+^*)^2,\quad f(x,y)=x\ln(x)+y\ln(y) \]

On admet que \( \mathcal{O} \) est ouvert convexe. Déterminer les extremums globaux éventuels de \(f\) sur \(\mathcal{O}\).

L’ensemble \(\mathcal{O}=(\mathbb{R}_+^*)^2\) est un ouvert convexe de \(\mathbb{R}^2\).
Les fonctions \((x,y)\mapsto x\) et \((x,y)\mapsto y\) sont de classe \(\mathcal{C}^2\) sur \(\mathcal{O}\) (fonctions polynômes), à valeurs dans \(\mathbb{R}_+^*\), et la fonction \(t\mapsto t\ln(t)\) est de classe \(\mathcal{C}^2\) sur \(\mathbb{R}_+^*\). Donc, par composition et somme, \(f\) est de classe \(\mathcal{C}^2\) sur \(\mathcal{O}\).
On commence par déterminer les points critiques. On calcule les dérivées partielles d’ordre 1 :
\[ \forall (x,y)\in(\mathbb{R}_+^*)^2,\quad \partial_1 f(x,y)=\ln(x)+1 \quad \text{et} \quad \partial_2 f(x,y)=\ln(y)+1 \]

On résout \(\nabla f(x,y)=0\). Pour tout \((x,y)\in(\mathbb{R}_+^*)^2\),

\[ \begin{align*} \nabla f(x,y)=0 &\Longleftrightarrow \begin{cases} \ln(x)+1=0\\ \ln(y)+1=0 \end{cases}\\[6pt] &\Longleftrightarrow \begin{cases} \ln(x)=-1\\ \ln(y)=-1 \end{cases}\\[6pt] &\Longleftrightarrow \begin{cases} x=\mathrm{e}^{-1}\\ y=\mathrm{e}^{-1} \end{cases} \end{align*} \]

Le seul point critique est donc

\[ a=\left(\mathrm{e}^{-1},\mathrm{e}^{-1}\right) \]
On utilise maintenant une condition suffisante d’ordre 2 d’extremum global. On calcule la matrice hessienne de \(f\).
On calcule les dérivées partielles secondes :

\[ \forall (x,y)\in(\mathbb{R}_+^*)^2,\quad \partial_{1,1}^2 f(x,y)=\dfrac{1}{x}, \qquad \partial_{1,2}^2 f(x,y)=\partial_{2,1}^2 f(x,y)=0, \qquad \partial_{2,2}^2 f(x,y)=\dfrac{1}{y} \]

On a ainsi :

\[ \forall (x,y)\in(\mathbb{R}_+^*)^2,\quad \nabla^2 f(x,y)= \begin{pmatrix} \dfrac{1}{x} & 0\\ 0 & \dfrac{1}{y} \end{pmatrix} \]

Les valeurs propres de \(\nabla^2 f(x,y)\) sont \(\dfrac{1}{x}\) et \(\dfrac{1}{y}\), toutes deux positives ou nulles, et ceci pour tout \((x,y)\in(\mathbb{R}_+^*)^2\).

Comme \(a\) est un point critique et que la hessienne est définie positive sur tout \(\mathcal{O}\), on en déduit que

\[ f \text{ admet un minimum global sur } \mathcal{O} \text{ en } a=\left(\mathrm{e}^{-1},\mathrm{e}^{-1}\right) \]

A-t-on trouvé des extremums locaux ?

Démarche

Supposons que l’on ait trouvé un extremum local de \(f\) en un point \(a\in\mathcal{O}\).

Pour savoir s’il s’agit en réalité d’un extremum global, on peut revenir à la définition et étudier le signe de

\[ f(x)-f(a)\quad \text{pour tout } x\in\mathcal{O} \]

si \(f(x)-f(a)\ge 0\) pour tout \(x\in\mathcal{O}\), alors \(a\) est un minimum global
si \(f(x)-f(a)\le 0\) pour tout \(x\in\mathcal{O}\), alors \(a\) est un maximum global

En pratique, cette méthode est rarement utilisable directement, car il est difficile de contrôler le signe de cette différence pour tout \(x\).

Cependant, dans certains cas simples, elle peut fonctionner :

si \(f\) est une fonction polynôme, on peut parfois utiliser des identités remarquables pour faire apparaître une somme de carrés
si \(f\) est une fonction de deux variables, on peut parfois étudier les variations de la fonction partielle \(x\mapsto f(x,y)\), déterminer des extremums dépendant de \(y\), puis étudier les variations des fonctions obtenues

Exemple

Soit \(f:\mathbb{R}^2\to\mathbb{R}\) définie par

\[ \forall (x,y)\in\mathbb{R}^2,\quad f(x,y)=2x^4+3y^4+2x^2y^2-2x^2 \]

Montrer que \( f \) admet un unique extremum local sur \( \mathbb{R}^2 \). La fonction \( f\) admet-elle des extremums globaux ?

L’ensemble \(\mathbb{R}^2\) est un ouvert.
La fonction \(f\) est une fonction polynôme, donc elle est de classe \(\mathcal{C}^2\) sur \(\mathbb{R}^2\).
On commence par déterminer les points critiques. On calcule les dérivées partielles d’ordre 1 :
\[ \forall (x,y)\in\mathbb{R}^2,\quad \partial_1 f(x,y)=8x^3+4xy^2-4x \quad \text{et} \quad \partial_2 f(x,y)=12y^3+4x^2y \]

On résout \(\nabla f(x,y)=0\). Pour tout \((x,y)\in\mathbb{R}^2\),

\[ \begin{align*} \nabla f(x,y)=0 &\Longleftrightarrow \begin{cases} 8x^3+4xy^2-4x=0\\ 12y^3+4x^2y=0 \end{cases}\\[6pt] &\Longleftrightarrow \begin{cases} 4x(2x^2+y^2-1)=0\\ 4y(3y^2+x^2)=0 \end{cases}\\[6pt] &\Longleftrightarrow \begin{cases} x=0 \ \text{ou}\ 2x^2+y^2-1=0\\ y=0 \ \text{ou}\ 3y^2+x^2=0 \end{cases} \end{align*} \]

Or \(3y^2+x^2=0\) implique \(x=0\) et \(y=0\), donc la seconde ligne équivaut à \(y=0\) et :

On obtient alors, avec \(y=0\),

\[ \begin{align*} \nabla f(x,0)=0 &\Longleftrightarrow \begin{cases} 4x(2x^2-1)=0\\ y=0 \end{cases} \\ &\Longleftrightarrow \begin{cases} x=0 \ \text{ou}\ x=\dfrac{1}{\sqrt{2}}\ \text{ou}\ x=-\dfrac{1}{\sqrt{2}}\\ y=0 \end{cases} \end{align*} \]

Les points critiques sont donc

\[ (0,0), \quad \left(\dfrac{1}{\sqrt{2}},0\right), \quad \left(-\dfrac{1}{\sqrt{2}},0\right) \]

On étudie maintenant l'existence d'extremum local en chacun des points critiques avec la matrice hessienne.

On calcule les dérivées partielles secondes :

\[ \forall (x,y)\in\mathbb{R}^2,\quad \partial_{1,1}^2 f(x,y)=24x^2+4y^2-4, \qquad \partial_{1,2}^2 f(x,y)=\partial_{2,1}^2 f(x,y)=8xy, \qquad \partial_{2,2}^2 f(x,y)=36y^2+4x^2 \]

Au point \(a=\left(\dfrac{1}{\sqrt{2}},0\right)\), on a

\[ \nabla^2 f(a)= \begin{pmatrix} 8 & 0\\ 0 & 2 \end{pmatrix} \]

Les valeurs propres de \(\nabla^2 f(a)\) sont \(8\) et \(2\), toutes deux strictement positives, donc \(f(a)\) est un minimum local.

Par symétrie, \(f \) admet aussi un minimum local en \(b=\left(-\dfrac{1}{\sqrt{2}},0\right)\).

Il reste à étudier le point critique \((0,0)\).

On a

\[ f(0,0)=0 \]

La matrice hessienne en \((0,0)\) vaut

\[ \nabla^2 f(0,0)= \begin{pmatrix} -4 & 0\\ 0 & 0 \end{pmatrix} \]

Comme \(0\) est valeur propre, le test hessien ne permet pas de conclure. On revient donc à la définition, en étudiant le signe de \(f(x,y)-f(0,0)\) le long de directions simples.

Le long de l’axe des abscisses, pour tout \(x\in\mathbb{R}\),

\[ f(x,0)-f(0,0)=2x^4-2x^2=2x^2(x^2-1) \]

Donc, pour tout \(x\in\,]0,1[\), on a \(f(x,0)-f(0,0)<0\).

Le long de l’axe des ordonnées, pour tout \(y\in\mathbb{R}\),

\[ f(0,y)-f(0,0)=3y^4 \]

Donc, pour tout \(y\in\,]0,1[\), on a \(f(0,y)-f(0,0)>0\).

On a donc, dans tout voisinage de \((0,0)\), des points où \(f-f(0,0)\) est négatif (sur l’axe \(y=0\)) et des points où \(f-f(0,0)\) est positif (sur l’axe \(x=0\)).

Ainsi, l’application \((x,y)\mapsto f(x,y)-f(0,0)\) n’est de signe constant sur aucun voisinage de \((0,0)\), et \(f\) n’admet pas d’extrémum local en \((0,0)\).

Comme \( f(a) = f(b) = \frac{1}{2} \), on a donc prouvé que \( f \) admet un unique extremum local (qui est un minimum), atteint exactement deux fois.

On passe maintenant à l’étude globale en revenant à la définition, en étudiant le signe de \(f(x,y)-f(a)\).
On calcule

\[ f\left(\dfrac{1}{\sqrt{2}},0\right)=2\left(\dfrac{1}{\sqrt{2}}\right)^4-2\left(\dfrac{1}{\sqrt{2}}\right)^2 =\dfrac{1}{2}-1=-\dfrac{1}{2} \]

Pour tout \((x,y)\in\mathbb{R}^2\), on a :

\[ \begin{align*} f(x,y)-f(a) &=2x^4+3y^4+2x^2y^2-2x^2+\dfrac{1}{2}\\[6pt] &=\Big(2x^4-2x^2+\dfrac{1}{2}\Big)+2x^2y^2+3y^4\\[6pt] &=2\left(x^2-\dfrac{1}{2}\right)^2+2x^2y^2+3y^4 \\ &\geqslant 0 \end{align*} \]

Autrement dit

\[ \forall (x,y)\in\mathbb{R}^2,\quad f(x,y)\ge -\dfrac{1}{2} \]

On en déduit que \(f\) admet un minimum global sur \(\mathbb{R}^2\), atteint en

\[ \left(\dfrac{1}{\sqrt{2}},0\right) \quad \text{et} \quad \left(-\dfrac{1}{\sqrt{2}},0\right) \]