Première méthode : méthode vectorielle utilisant la triangularisation

Cette méthode, est faite, dans le cadre de ce cours, pour une matrice à coefficients réels que l'on considère, quand cela est utile, comme un élément de \(M_n(\mathbb C)\).

Elle nécessite la proposition suivante :

PropositionCondition nécessaire et suffisante de triangularisation

Soit \(f\) un endomorphisme d'un \(\mathbf K\)-espace vectoriel de dimension finie \(n\quad(n\ge 1)\) de matrice \(M\) dans une base \(B_E\) de \(E\) (ou bien \(M\) une matrice carrée d'ordre \(n\), matrice d'un endomorphisme \(f\) de \(\mathbf K^n\) dans la base canonique). Les propriétés suivantes sont équivalentes :

  1. L'endomorphisme \(f\) ou la matrice \(M\) est triangularisable (c'est-à-dire qu'il existe une base de \(E\) dans laquelle la matrice associée à \(f\) est triangulaire ou bien \(M\) est semblable à une matrice triangulaire)

  2. Le polynôme caractéristique de \(f\) ou de \(M\) se factorise en un produit de polynômes de degré \(1\) dans \(\mathbf K[X]\), autrement dit est scindé dans \(\mathbf K[X]\).

PreuvePreuve de la condition nécessaire et suffisante pour qu'une matrice (ou un endomorphisme) soit triangularisable

Il est immédiat que 1. implique 2. (calcul du polynôme caractéristique d'une matrice triangulaire)

Montrons que 2. implique 1. par récurrence sur la dimension \(n\) de l'espace considéré.

Si \(n=1,f\) est une homothétie et est évidemment triangularisable.

Supposons le résultat valable à l'ordre \(n-1\) et soit \(E\) un espace vectoriel de dimension \(n\) et \(f\) un endomorphisme de \(E\) vérifiant la propriété 2.

D'après l'hypothèse 2., \(f\) admet des valeurs propres. Soit \(\lambda\) une valeur propre de \(f\). Il existe donc un vecteur non nul \(v\) tel que \(f(v)=\lambda v\). La partie \(\{v\}\) est libre. Donc d'après le théorème de la base incomplète, on peut compléter cette partie de manière à obtenir une base de \(E\), de la forme : \((v,\epsilon_2,\cdots,\epsilon_n)\).

La matrice associée à \(f\) par rapport à cette base est donc de la forme \(M=\left(\begin{array}{cc}\lambda&N\\0_{n-1,1}&M'\end{array}\right)\)\(M\) est une matrice carrée d'ordre \(n-1, N\) une matrice ligne à \(n-1\) colonnes et \(0_{n-1,1}\) la matrice à \(n-1\) lignes et une colonne dont tous les coefficients sont nuls.

D'une manière générale, \(0_{p,q}\) désigne la matrice nulle de \(M_{p,q}(\mathbf K)\).

On a donc \(P_{\textrm{car},f}(X)=P_{\textrm{car},M}(X)=(\lambda-X)P_{\textrm{car},M'}(X)\).

Comme \(P_{\textrm{car},M}(X)\) se décompose en produit de polynômes de degré \(1,P_{\textrm{car},M'}(X)\) aussi.

Or \(M'\) est la matrice d'un endomorphisme de \(\mathbf K^{n-1}\), qui est bien un espace vectoriel de dimension \(n-1\). L'hypothèse de récurrence peut donc être appliquée et \(M'\) est triangularisable.

Il existe donc une matrice inversible \(Q\) et une matrice triangulaire \(T'\) , appartenant toutes les deux à \(M_{n-1}(\mathbf K)\), telles que \(Q^{-1}M'Q=T'\).

On a alors l'égalité matricielle

\(\displaystyle{\left(\begin{array}{cc}\lambda&NQ\\0_{n-1,1}&T'\end{array}\right)=\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q^{-1}\end{array}\right)\left(\begin{array}{cc}\lambda&N\\0_{n-1,1}&M'\end{array}\right)\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q\end{array}\right)}\)

Soit \(\displaystyle{\left(\begin{array}{cc}\lambda&NQ\\0_{n-1,1}&T'\end{array}\right)=\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q^{-1}\end{array}\right)M\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q\end{array}\right)}\).

La matrice \(\displaystyle{\left(\begin{array}{cc}\lambda&NQ\\0_{n-1,1}&T'\end{array}\right)}\) est triangulaire, les deux matrices \(\displaystyle{\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q\end{array}\right)}\) et \(\displaystyle{\left(\begin{array}{cc}1&0_{1,n-1}\\0_{n-1,1}&Q^{-1}\end{array}\right)}\) sont inverses l'une de l'autre. Donc \(M\) est triangularisable.

Le corollaire suivant est une conséquence immédiate de cette proposition lorsque \(\mathbf K=\mathbb C\), puisque, \(\mathbb C\) étant algébriquement clos, la propriété 2. est toujours satisfaite dans \(\mathbb C(X)\).

CorollaireImportant

Tout endomorphisme d'un \(\mathbb C\)-espace vectoriel, ou toute matrice carrée à coefficients complexes, est triangularisable.

MéthodePrincipe de la première méthode

  • Première étape : le corollaire précédent et un calcul simple montrent qu'il suffit de démontrer le théorème pour les matrices triangulaires de \(M_n(\mathbb C)\).

  • Deuxième étape : Alors si \(\lambda_1,\lambda_2,\cdots,\lambda_n\) sont les éléments de la diagonale principale d'une matrice triangulaire \(N\) de \(M_n(\mathbb C)\), il s'agit de montrer que \((N-\lambda_1I_n)(N-\lambda_2I_n)\cdots(N-\lambda_nI_n)=0\).

  • Troisième étape : Pour ce faire, on introduit l'endomorphisme \(g\) de \(\mathbb C^n\) dont la matrice dans la base canonique \((e_1,e_2,\cdots,e_n)\) est égale à \(N\) et on montre que \((g-\lambda_1Id_{\mathbb C^n})\bigcirc(g-\lambda_2Id_{\mathbb C^n})\bigcirc\cdots\bigcirc(g-\lambda_nId_{\mathbb C^n})=0_{L(\mathbb C^n)}\).

DémonstrationDémonstration complète de la première méthode

Première étape

Soit \(M\) un élément de \(M_n(\mathbb R)\) que l'on considère comme un élément de \(M_n(\mathbb C)\). Alors dans \(M_n(\mathbb C), M\) est triangularisable ; il existe donc une matrice inversible \(Q\) appartenant à \(M_n(\mathbb C)\) telle que \(Q^{-1}MQ\) soit une matrice triangulaire \(N\) appartenant à \(M_n(\mathbb C)\).

Puisque les matrices \(M\) et \(N\) sont semblables, elles ont même polynôme caractéristique, \(P_{\textrm{car},M}(X)=P_{\textrm{car},N}(X)\)

Comme \((Q^{-1}MQ)^k=Q^{-1}M^kQ\), on a

\(Q^{-1}P_{\textrm{car},M}(M)Q=P_{\textrm{car},M}(Q^{-1}MQ)=P_{\textrm{car},N}(N)\).

Pour montrer que \(P_{\textrm{car},M}(M)=0\), il suffit donc de prouver que \(P_{\textrm{car},N}(N)=0\) . On s'est donc ramené à démontrer le théorème pour une matrice triangulaire.

Deuxième étape

Soient \(\lambda_1,\lambda_2,\cdots,\lambda_n\) les éléments (non nécessairement distincts) de la diagonale principale de \(N\). Le polynôme caractéristique de \(N\) s'écrit \(P_{\textrm{car},N}(X)=(\lambda_1-X)(\lambda_2-X)\cdots(\lambda_n-X)\),

soit \(P_{\textrm{car},N}(X)=(-1)^n(X-\lambda_1)(X-\lambda_2)\cdots(X-\lambda_n)\).

Il s'agit donc de montrer que \((N-\lambda_1I_n)(N-\lambda_2I_n)\cdots(N-\lambda_nI_n)=0\).

Troisième étape

Soit \(g\) l'endomorphisme de \(\mathbb C^n\) dont la matrice dans la base canonique \((e_1,e_2,\cdots,e_n)\) est égale à \(N\). On veut donc prouver que \((g-\lambda_1Id_{\mathbb C^n})\bigcirc(g-\lambda_2Id_{\mathbb C^n})\bigcirc\cdots\bigcirc(g-\lambda_nId_{\mathbb C^n})=0_{L(\mathbb C^n)}\).

Soit \(\beta_{r,s}\) le terme général de la matrice \(N\). Comme cette matrice est triangulaire (supérieure) et admet comme éléments diagonaux les \(\lambda_i\), on a

\(\displaystyle{\begin{array}{cccccc}\forall r&,&\beta_{r,r}=\lambda_r\\\forall r> s&,&\beta_{r,s}=0\end{array}}\)

c'est-à-dire :

\(\displaystyle{N=\left(\begin{array}{ccccc}\lambda_1&\beta_{1,2}&\beta_{1,3}&\cdots&\beta_{1,n}\\0&\lambda_2&\beta_{2,3}&\cdots&\beta_{2,n}\\0&0&\lambda_3&\cdots&\beta_{3,n}\\\vdots&\vdots&\vdots&\vdots&\vdots\\0&0&0&\cdots&\lambda_n\end{array}\right)}\)

Cela signifie pour l'endomorphisme \(g\) les égalités suivantes :

\(\forall k,1\leq k\leq n,\quad g(e_k)=\beta_{1,k}e_1+\cdots+\beta_{k-1,k}e_{k-1}+\lambda_ke_k\),

d'où, pour tout \(k\) supérieur ou égal à \(2\)

\(\forall s,1\leq s\leq k-1\quad(g-\lambda_kId_{\mathbb C^n})(e_s)=\beta_{1,s}e_1+\cdots+\beta_{s-1,s}e_{k-1}+(\lambda_s-\lambda_k)e_s\)

\((*)\)

\(s=k\quad(g-\lambda_kId_{\mathbb C^n})(e_k)=\beta_{1,k}e_1+\cdots+\beta_{k-1,k}e_{k-1}\)

Et pour \(k=1\)

\((g-\lambda_1Id_{\mathbb C^n})(e_1)=0\)

Alors, si \(E_k\) est le sous espace vectoriel engendré par \(\{e_1,e_2,\cdots,e_{k-1},e_k\}\), il en résulte les inclusions suivantes :

\(\displaystyle{\begin{array}{cccccc}\forall k,2\leq k\leq n,&(g-\lambda_kId_{\mathbb C^n})(E_k)&\subset&E_{k-1}\\k=1&(g-\lambda_1Id_{\mathbb C^n})(E_1)&=&\{0\}\end{array}}\).

Des inclusions \((g-\lambda_nId_{\mathbb C^n})(E_n)\subset E_{n-1}\) et \((g-\lambda_{n-1}Id_{\mathbb C^n})(E_{n-1})\subset E_{n-2}\), on déduit :

\((g-\lambda_{n-1}Id_{\mathbb C^n})\bigcirc(g-\lambda_nId_{\mathbb C^n})(E_n)\subset E_{n-2}\)

En continuant ainsi,

\((g-\lambda_1Id_{\mathbb C^n})\bigcirc\cdots\bigcirc(g-\lambda_{n-1}Id_{\mathbb C^n})\bigcirc(g-\lambda_nId_{\mathbb C^n})(E_n)\subset(g-\lambda_1Id_{\mathbb C^n})(E_1)\)

et comme on a l'égalité : \((g-\lambda_1Id_{\mathbb C^n})(E_1)=\{0\}\)

il vient finalement :

\((g-\lambda_1Id_{\mathbb C^n})\bigcirc\cdots\bigcirc(g-\lambda_{n-1}Id_{\mathbb C^n})\bigcirc(g-\lambda_nId_{\mathbb C^n})(E_n)=\{0\}\)

Comme \(E_n=E\), cela prouve que :

\((g-\lambda_1Id_{\mathbb C^n})\bigcirc\cdots\bigcirc(g-\lambda_{n-1}Id_{\mathbb C^n})\bigcirc(g-\lambda_nId_{\mathbb C^n})(E_n)=0\)