Existence de bases orthogonales
La première question qui se pose est celle de l'existence de telles bases.
La réponse est positive pour l'existence d'une base orthogonale, mais il faut des conditions supplémentaires pour l'existence d'une base orthonormale.
Théorème : Existence d'une base orthogonale relativement à une forme bilinéaire symétrique (ou à une forme quadratique)
Soit \(E\) un \(K\)-espace vectoriel de dimension \(n\) et \(f\) une forme bilinéaire symétrique non nulle de rang \(r\) (\(r\) est donc strictement positif). Alors il existe une base \(B=(\epsilon_1,\epsilon_2,\ldots,\epsilon_n)\) de \(E\) satisfaisant aux conditions suivantes :
\(i\neq j\Rightarrow f(\epsilon_i,\epsilon_j)=0\)
\(1\leq i\leq r\Rightarrow f(\epsilon_i,\epsilon_i)\neq0\)
si \(r<n\) et \(r<i\leq n \Rightarrow f(\epsilon_i,\epsilon_i)=0\)
Complément : Conséquence immédiate
La matrice associée à \(f\) dans une telle base est de la forme :
\(\left(\begin{array}{cccccc}a_1&0&\ldots&\ldots&\ldots&0\\0&\ddots&0&&&\vdots\\\vdots&\ddots&a_r&\ddots&&\\\vdots&&&0&\ddots&\\\ddots&&&&\ddots&\vdots\\0&\ldots&\ldots&\ldots&0&0\end{array}\right)\) si \(r\) est strictement inférieur à \(n\),
ou : \(\left(\begin{array}{cccc}a_1&0&\ldots&0\\0&\ddots&\ddots&\vdots\\\vdots&\ddots&\ddots&0\\0&\ldots&0&a_n\end{array}\right)\) si \(r=n\), les \(a_i\) étant des scalaires non nuls.
Corollaire :
Si \(B=(\epsilon_1,\epsilon_2,\ldots,\epsilon_n)\) est une base \(f\)-orthogonale, le nombre d'indices \(i\) tels que \(f(\epsilon_i,\epsilon_i)\) soit non nul est égal au rang de \(f\).
Autrement dit, déterminer explicitement une base orthogonale relativement à \(f\) et déterminer la matrice associée à \(f\) dans cette base permet de trouver explicitement le rang d'une forme bilinéaire symétrique.
Preuve : Preuve du théorème
On procède par récurrence sur la dimension de \(E\).
Pour \(n=1\), il n'y a rien à dire.
Supposons la propriété vraie pour tout espace de dimension \(n-1\).
Démontrons la pour un espace de dimension \(n\).
Soit \(\epsilon_1\) un vecteur tel que \(f(\epsilon_1,\epsilon_1)\neq 0\); (un tel vecteur existe puisque \(f\) étant non nulle, la forme quadratique associée est non nulle).
Considérons la forme linéaire définie sur \(E\) par
\(f_{\epsilon_1}:E\rightarrow K\)
\(x\mapsto f(\epsilon_1,x)\)
C'est une forme linéaire non nulle donc elle est surjective, son rang est égal à 1 et par conséquent d'après le théorème du rang, son noyau est de dimension \(n-1\). Donc \(\dim(\ker f_{\epsilon_1})=n-1\). De plus comme est non nul, le vecteur \(\epsilon_1\) n'appartient pas à \(\ker f_{\epsilon_1}\) et donc \(K\epsilon_1\cap\ker f_{\epsilon_1}=\{0\}\).
On déduit de ces deux résultats l'égalité \(E=K\epsilon_1\oplus\ker f_{\epsilon_1}\).
Il est clair que la restriction à \(\ker f_{\epsilon_1}\) de la forme bilinéaire symétrique \(f\) est une forme bilinéaire symétrique sur \(\ker f_{\epsilon_1}\). On peut donc appliquer l'hypothèse de récurrence.
Il existe donc une base \((\epsilon_2,\ldots,\epsilon_n)\) de \(\ker f_{\epsilon_1}\) orthogonale pour la restriction de \(f\) à \(\ker f_{\epsilon_1}\). Il est évident que ces vecteurs sont orthogonaux pour \(f\).
En résumé :
comme \(E=K\epsilon_1\oplus\ker f_{\epsilon_1}\), \((\epsilon_1,\epsilon_2,\ldots,\epsilon_n)\)est une base de \(E\)
d'après la définition de \(f_{\epsilon_1}\), pour tout \(i\), \(2\leq i\leq n\), \(f(\epsilon_1,\epsilon_i)\) et donc le vecteur \(\epsilon_1\) est orthogonal à tous les vecteurs \(\epsilon_i\), pour \(i\) compris entre \(2\) et \(n\).
d'après les propriétés des vecteurs \(\epsilon_i\), pour \(i\) compris entre \(2\) et \(n\) on a :
\(\forall i, 2\leq i\leq n, \forall j, 2\leq j\leq n, i\neq j\) \(f(\epsilon_i,\epsilon_j)=0\)
L'ensemble de ces propriétés prouve que \((\epsilon_1,\epsilon_2,\ldots,\epsilon_n)\) est une base \(f\)-orthogonale de \(E\).
La matrice associée à \(f\) dans cette base est une matrice diagonale de rang \(r\), le rang de la forme bilinéaire symétrique. Ce rang est égal au nombre de scalaires non nuls sur la diagonale principale. Quitte à renuméroter les vecteurs on peut supposer que ce sont les \(r\) premiers et on a donc le résultat.
Pour illustrer cette dernière phrase on peut reprendre l'exemple (2) vu ci-dessus. La base canonique \(B=(a_1,a_2,a_3,a_4)\) est une base orthogonale pour la forme quadratique \(\phi\) considérée et la matrice associée à \(\phi\) dans cette base est \(\left(\begin{array}{cccc}1&0&0&0\\0&2&0&0\\0&0&0&0\\0&0&0&1\end{array}\right)\). Alors la base \(B'=(e_1,e_2,e_4,e_3)\) est une base \(\phi\)-orthogonale satisfaisant aux conditions du théorème.
Complément :
Interprétation des vecteurs \(v_1,v_2,\ldots,v_n\) lorsque \(B=(v_1,v_2,\ldots,v_n)\) est une base \(f\)-orthogonale satisfaisant aux conditions du théorème
On suppose \(f\) de rang strictement inférieur à \(n\). Soit une base orthogonale de \(E\) telle que :
(a) \(i\neq j\Rightarrow f(v_i,v_j)=0)\)
(b) \(1\leq i\leq r \Rightarrow f(v_i,v_j)\neq 0\)
(c) \(r+1\leq i\leq n\Rightarrow f(v_i,v_i)=0\)
alors, \((v_{r+1},v_{r+2},\ldots,v_n)\)est une base de \(E^\bot\)(orthogonal de \(E\) relativement à la forme bilinéaire symétrique \(f\)).
Preuve :
En effet, d'après la propriété (a) pour tout \(k\) compris entre 1 et \(n-r\), \(f(\epsilon_{r+k},\epsilon_j)=0)\); d'après la propriété (c), \(f(\epsilon_{r+k}, \epsilon_{r+k})=0\).
Le vecteur \(\epsilon_{r+k}\) est donc orthogonal à tous les vecteurs d'une base de \(E\), et par conséquent à tous les vecteurs de \(E\). Il en résulte que le vecteur \(\epsilon_{r+k}\) appartient à \(E^\bot\). Les vecteurs \(\epsilon_{r+1},\epsilon_{r+2},\ldots,\epsilon_n\) forment une famille de \(n-1\) vecteurs de \(E^\bot\). C'est une famille extraite d'une famille libre, donc elle est libre. De plus \(E^\bot\) est de dimension \(n-r\). Donc \((\epsilon_{r+1},\epsilon_{r+2},\ldots,\epsilon_n)\) est une base de \(E^\bot\).
On peut donner une traduction matricielle du théorème.
Proposition : Traduction matricielle
Soit \(A\) une matrice carrée symétrique à coefficients dans \(K\) (avec \(K=R\) ou \(K=C\)). Alors il existe une matrice inversible \(P\) et une matrice diagonale \(D\) telle que \(^tPAP=D\).
Cela résulte, d'une part de l'isomorphisme entre espace vectoriel des matrices symétriques et espace vectoriel des formes bilinéaires symétriques, et d'autre part, de la formule de changement de base pour les matrices associées à une forme bilinéaire symétrique.
Attention :
ce théorème ne prouve pas que la matrice A est diagonalisable. En effet, en général, la matrice \(^tP\) est différente de la matrice \(P^{-1}\).
Le problème de la diagonalisation des matrices symétriques réelles est étudié dans le cadre des espaces euclidiens.
Problème des bases orthonormales
Le problème de l'existence d'une base orthonormale est moins simple.
Une condition nécessaire d'existence d'une base orthonormale pour une forme bilinéaire symétrique \(f\) est que \(f\) soit de rang \(n\).
En effet toutes les matrices associées à une forme bilinéaire symétrique ont le même rang. Or s'il existe une base orthonormale, la matrice associée à \(f\) dans cette base est \(I_n\) qui est de rang \(n\).
Mais cette condition n'est pas suffisante. Pour s'en convaincre on va étudier l'exemple suivant : soit \(q\) la forme quadratique définie sur \(R^2\) par \((x,y)\mapsto x^2-y^2\). La matrice qui lui est associée dans la base canonique est \(\left(\begin{array}{cc}1&0\\0&-1\end{array}\right)\). S'il existe une base orthonormale, il existe une matrice inversible \(P\) telle que \(^tPI_2P=\left(\begin{array}{cc}1&0\\0&-1\end{array}\right)=^tPP\).
Si \(P=\left(\begin{array}{cc}a&b\\c&d\end{array}\right)\), alors \(^tPP=\left(\begin{array}{cc}a&c\\b&d\end{array}\right)\left(\begin{array}{cc}a&b\\c&d\end{array}\right)=\left(\begin{array}{cc}a^2+c^2&ab+cd\\ba+dc&b^2+d^2\end{array}\right)=\left(\begin{array}{cc}1&0\\0&-1\end{array}\right)\).
Ceci implique, entre autres, l'égalité \(b^2+d^2=-1\) ce qui est absurde dans \(R\). Il n'existe donc pas de base orthonormale relativement à \(q\).
On peut donner cependant un exemple où l'on sait construire une base orthonormale à partir d'une base orthogonale pour une forme quadratique de rang \(n\). Il s'agit des formes quadratiques de rang \(n\) sur un espace de dimension \(n\) sur le corps des nombres complexes.
En effet si \(q\) est une telle forme et \(B=(e_1,e_2,\ldots,e_n)\) est une base orthogonale relative à \(q\),
on a \(q(x)=q(x_1e_1+x_2e_2+\ldots+x_ne_n)=\alpha_1x_1^2+\alpha_2x^2_2+\ldots+\alpha_nx_n^2\) où les \(\alpha_i\) sont des nombres complexes non nuls.
Soit \(\beta_i\) des nombres complexes tels que, pour tout \(i\) compris entre \(1\) et \(n\), \(\alpha_i=\beta_i^2\) et les vecteurs \(e'_i\) définis, pour tout \(i\) compris entre \(1\) et \(n\), par \(e'_1=\frac{\beta_i}{e_i}\). Alors \(B'=(e'_1,e'_2,\ldots,e'_n))\) est une base (les nombres complexes \(\beta_i\)sont non nuls) et elle est orthonormale relativement à \(q\) puisque \(x=x'_1e'_1+x'_2e'_2+\ldots+x'_ne'_n\), avec \(\forall i, 1\leq i\leq n\) \(x'_i=\beta_ix_i\) et donc \(q(x)=(x'_{1})^{2}+(x'_{2})^{2}+\ldots+(x'_{n})^{2}\).
D'où la propriété :
Proposition : Existence de base orthonormale relativement à une forme quadratique sur un espace vectoriel sur le corps des nombres complexes C
Soit \(E\) un \(C\)-espace vectoriel de dimension \(n\) et \(q\) une forme quadratique sur \(E\). Une condition nécessaire et suffisante pour qu'il existe une base \(q\)-orthonormale est que \(q\) soit de rang \(n\).
On a de manière immédiate un résultat très utile sur la matrice de passage d'une base orthonormale à une autre base orthonormale.
Proposition : Matrice de passage d'une base orthonormale à une autre base orthonormale
Soit \(f\) une forme bilinéaire symétrique sur un espace vectoriel de type fini, telle qu'il existe au moins une base \(f\)-orthonormale.
Alors la matrice \(P\) de passage d'une base \(f\)-orthonormale à une autre base \(f\)-orthonormale vérifie la relation \(^tPP=I_n\). On dit d'une telle matrice qu'elle est orthogonale.
Preuve :
La matrice associée à une forme bilinéaire symétrique par rapport à une base orthonormale est la matrice unité d'ordre \(n\). Si on a deux bases orthonormales, la formule de changement de base donne donc : \(^tPI_nP=I_n\) et donc \(^tPP=I_n\).