Théorème d'inertie de Sylvester

On a le théorème suivant :

ThéorèmeThéorème d'inertie de Sylvester

Soit \(E\) un R-espace vectoriel de dimension \(n\) et \(f\) une forme bilinéaire symétrique sur \(E\).

  1. Il existe une partition de \(\{1,2,\ldots,n\}\)par des parties \(I_1,I_2,I_3\) de \(\{1,2,\ldots,n\}\) et une base \((e_1,e_2,\ldots,e_n)\) de \(E\) telles que :

    \(i\neq j\Rightarrow f(e_i,e_j)=0\)

    \(e\in I_1\Rightarrow f(e_i,e_i)=1\)

    \(i\in I_2\Rightarrow f(e_i,e_i)=-1\)

    \(i\in I_3\Rightarrow f(e_i,e_i)=0\)

  2. Si \(I_1',I_2',I_3'\) est une autre partition de \(\{1,2,\ldots,n\}\) et \((e_1',e_2',\ldots,e_n')\) une base de \(E\) vérifiant les même conditions, alors pour tout \(i\) compris entre 1 et 3, \(I_i\) et \(I_i'\) ont le même nombre d'éléments.

Plusieurs cas sont possibles qui peuvent être résumés dans le tableau suivant :

\(I_1\)

\(I_2\)

\(I_3\)

Expression explicite de \(f(x,y)\)

Matrice associée à \(f\) dans la base

\((e_1,\ldots,e_n\)

\(\varnothing\)

\(\varnothing\)

\(\varnothing\)

\(0\)

\((0)\)

\(\varnothing\)

\(\varnothing\)

\(\neq\varnothing\)

\(0\)

\((0)\)

\(\varnothing\)

\(\neq\varnothing\)

\(\varnothing\)

\(f(x,y)=-\displaystyle\sum_{i\in I_2}x_iy_i\)

\(-I_n\)

\(\varnothing\)

\(\neq\varnothing\)

\(\neq\varnothing\)

\(f(x,y)=-\displaystyle\sum_{i\in I_2}x_iy_i\)

\(\left(\begin{array}{cccccc}-1&0&\ldots&&&0\\0&\ddots&&&&\vdots\\\vdots&\ddots&-1&&&\\&&&0&&\\&&&&\ddots&0\\0&\ldots&&&0&0\end{array}\right)\)

\(\neq\varnothing\)

\(\varnothing\)

\(\varnothing\)

\(f(x,y)=\displaystyle\sum_{i\in I_1}x_iy_i\)

\(I_n\)

\(\neq\varnothing\)

\(\varnothing\)

\(\neq\varnothing\)

\(f(x,y)=\displaystyle\sum_{i\in I_1}x_iy_i\)

\(\left(\begin{array}{cccccc}1&0&\ldots&&&0\\0&\ddots&&&&\vdots\\\vdots&\ddots&1&&&\\&&&0&&\\&&&&\ddots&0\\0&\ldots&&&0&0\end{array}\right)\)

\(\neq\varnothing\)

\(\neq\varnothing\)

\(\varnothing\)

\(f(x,y)=\displaystyle\sum_{i\in I_1}x_iy_i-\displaystyle\sum_{i\in I_2}x_iy_i\)

\(\left(\begin{array}{cccccc}1&0&\ldots&&&0\\0&\ddots&&&&\vdots\\\vdots&\ddots&1&&&\\&&&-1&&\\&&&&\ddots&0\\0&\ldots&&&0&-1\end{array}\right)\)

\(\neq\varnothing\)

\(\neq\varnothing\)

\(\neq\varnothing\)

\(f(x,y)=\displaystyle\sum_{i\in I_1}x_iy_i-\displaystyle\sum_{i\in I_2}x_iy_i\)

\(\left(\begin{array}{ccccccccc}1&0&\ldots&&&&&&0\\0&\ddots&\ddots&&&&&\\\vdots&\ddots&1&&&\\&&&-1&&\\&&&&\ddots&\\&&&&&-1\\&&&&&&0&\ddots&\vdots\\&&&&&&\ddots&\ddots&0\\0&\ldots&&&&&\ldots&0&0\end{array}\right)\)

PreuvePreuve du théorème de Sylvester (stalone)

La démonstration est faite dans le cas où \(f\) est non nulle, le résultat étant évident si \(f\) est nulle. On suppose aussi \(I_1\) et \(I_2\) non vides, la démonstration des autres cas se faisant de la même façon. Pour la démonstration de la partie 2 du théorème, on supposera aussi que \(I_1'\)et \(I_2'\) sont non vides.

Rappelons tout d'abord ce que signifie l'hypothèse : les parties \(I_1,I_2,I_3\) de \(\{1,2,\ldots,n\}\) forment une partition de \(\{1,2,\ldots,n\}\) si et seulement si elles sont disjointes deux à deux et si \(I_1\cup I_2\cup I_3=\{1,2,\ldots,n\}\).

La première partie est une conséquence immédiate de l'existence d'une base orthogonale pour \(f\). En effet si \(f\) est non nulle et si \(B=(\epsilon_1,2,\ldots,\epsilon_3)\) est une base orthogonale de \(E\), on a, pour tout \(x=x_1\epsilon_1+x_2\epsilon_2+\ldots+x_n\epsilon_n\) et \(y=y_1\epsilon_1+y_2\epsilon_2+\ldots+y_n\epsilon_n\):

\(f(x,y)=\alpha_1x_1y_1+\ldots+\alpha_px_py_p-\alpha_{p+1}x_{p+1}y_{p+1}-\ldots-\alpha_rx_ry_r+0x_{r+1}y_{r+1}+\ldots+0x_ny_n\)

ou bien si \(r=n\), \(f(x,y)=\alpha_1x_1y_1+\ldots+\alpha_px_py_p-\alpha_{p+1}x_{p+1}y_{p+1}-\ldots-\alpha_nx_ny_n\)

avec pour tout \(i\), \(\alpha_i\) strictement positif.

Alors en définissant \(I_1,I_2,I_3\) par \(I_1=\{1,2,\ldots,p\}\), \(I_2=\{p+1,\ldots,r\}\), \(I_3=\{r+1,\ldots,n\}\)( \(I_3\) peut être vide) et la base \((e_1,e_2,\ldots,e_n)\) par :

\(\forall i\in I_1\cup I_2\), \(e_i=\frac{\epsilon_i}{\sqrt{\alpha_i}}\)

\(\forall i\in I_3, e_i=\epsilon_i\)

on a tous les éléments de la conclusion 1 du théorème et ils satisfont aux conditions voulues car :

\(\forall i\in I_1\), \(f(e_i,e_i)=f(\frac{\epsilon_i}{\sqrt{\alpha_i}},\frac{\epsilon_i}{\sqrt{\alpha_i}})=\frac{1}{\alpha_1}f(\epsilon_i,\epsilon_i)=\frac{\alpha_i}{\alpha_i}=1\)

\(\forall i\in I_2\), \(f(e_i,e_i)=f(\frac{\epsilon_i}{\sqrt{\alpha_i}},\frac{\epsilon_i}{\sqrt{\alpha_i}})=\frac{1}{\alpha_1}f(\epsilon_i,\epsilon_i)=\frac{-\alpha_i}{\alpha_i}=-1\)

\(\forall i\in I_3\), \(f(e_i,e_i)=0\)

Deuxième partie :

On sait déjà que le nombre de coefficients non nuls est égal au rang de la forme bilinéaire symétrique. C'est le nombre d'éléments de \(I_1\cup I_2\) ou de \(I_1'\cup I_2'\) donc le nombre d'éléments de \(I_3\) ou de \(I'_3\) est le même (ne dépend que de \(f\)) et est égal à \(n-r\). On note \(p\) (respectivement \(p'\)) le nombre d'éléments de \(I_1\) respectivement \(I_1'\)), s (respectivement \(s'\)) le nombre d'éléments de \(I_2\), (respectivement \(I_2'\)) et \((e_1,e_2,\ldots,e_n)\) (respectivement \((e_1',e_2',\ldots,e_n')\)) les bases de \(E\) satisfaisant aux conditions du (1).

Soit \(F\) le sous-espace vectoriel engendré par les vecteurs \(e_i\) pour \(i\) appartenant à \(I_1\) et \(G'\) le sous-espace vectoriel engendré par les vecteurs \(e_i'\) pour \(i\) appartenant à \(I_2'\cup I_3'\). Alors \(F\) est de dimension \(p\) et \(G'\) de dimension \(n-p'\).

Montrons que \(F+G'\) est une somme directe.

Soit \(x\) un élément de \(F\cap G'\). Comme \(x=\displaystyle\sum_{i\in I_1}x_ie_i\) puisque \(x\) appartient à \(F\), \(q(x)=f(x,x)=\displaystyle\sum_{i\in I_1}x_i^2\).

Comme \(x=\displaystyle\sum_{i\in I'_2\cup I'_3}x'_ie'_i\) appartient à \(G'\), \(q(x)=f(x,x)=-\displaystyle\sum_{i\in I'_2}(x^t_i)^2\).

L'égalité \(\displaystyle\sum_{i\in I_1}x_i^2=-\sum_{i\in I_2'}(x^t_i)^2\) implique alors que : \(\forall i\in I_1\), \(x_i=0\).

Donc \(x=0\). On a donc démontré que \(F\cap G'=\{0\}\) et donc que \(F\cap G'=F\oplus G'\).

Comme \(F\oplus G'\) est un sous-espace vectoriel de \(E\), sa dimension est inférieure ou égale à \(n\) et par conséquent on a l'inégalité : \(\dim F+\dim G'\leq n\)

Donc \(p+n-p'\leq n\) et par conséquent \(p\leq p'\).

Le même raisonnement peut être fait en considérant \(F'\) le sous-espace vectoriel engendré par les vecteurs \(e'_i\) pour \(i\) appartenant à \(I_i'\) et \(G\) le sous-espace vectoriel engendré par les vecteurs \(e_i\) pour \(i\) appartenant à \(I_2\cup I_3\). Il conduit à l'inégalité \(p'\leq p\).

D'où \(p'=p\).

Comme \(p+s=p'+s'=r\)\(r\) est le rang de la forme quadratique, on en déduit que \(s=s'\) ce qui achève la démonstration.

Le corollaire suivant, très utile dans la pratique, s'en déduit immédiatement.

CorollaireNombre de coefficients positifs et de coefficients négatifs dans une « décomposition en carrés »

Soit \(q\) une forme quadratique sur un R-espace vectoriel de type fini.

Quelle que soit la décomposition de \(q\) en combinaison linéaire de carrés de formes linéaires indépendantes, le nombre de coefficients strictement positifs est indépendant de la décomposition, de même que le nombre de coefficients strictement négatifs, et leur somme est égale au rang de la forme quadratique.

La preuve en est immédiate. Si \(q\) est non nulle et de rang \(r\) et si l'on a une décomposition de \(q\) en carrés, quitte à changer l'ordre des coefficients, on peut l'écrire :

Si \(r<n\) \(q(x)=\alpha_1x_1^2+\ldots+\alpha_px_p-\alpha_{p+1}x_{p+1}^2-\ldots-\alpha_{r}x_{r}^2+0x^2_{r+1}+\ldots+0x_n^2\)

Si \(r=n\) \(q(x)=\alpha_1x_1^2+\ldots+\alpha_px_p-\alpha_{p+1}x_{p+1}^2-\ldots-\alpha_{n}x_{n}^2\)

Alors, si \(r<n\):

\(q(x)=(\sqrt{\alpha_1}x_1)^2+\ldots+(\sqrt{\alpha_p}x_p)^2-(\sqrt{\alpha_{p+1}}x_{r})^2-\ldots-(\sqrt{\alpha_{r}}x_{r})^2+0x^2_{r+1}+\ldots+0x_n^2\).

Si \(r=n\):

\(q(x)=(\sqrt{\alpha_1}x_1)^2+\ldots+(\sqrt{\alpha_p}x_p)^2-(\sqrt{\alpha_{p+1}}x_{p+1})^2-\ldots-(\sqrt{\alpha_{n}}x_{n})^2\).

On est donc dans la situation du théorème et donc le nombre de signe +, de signe – et de termes nuls est constant.