Condition nécessaire et suffisante faisant intervenir le polynôme caractéristique

Le résultat essentiel de cette ressource est le théorème suivant :

ThéorèmeCondition nécessaire et suffisante de diagonalisation faisant intervenir le polynôme caractéristique

Soit \(f\) un endomorphisme d'un \(\mathbf K\)-espace vectoriel \(E\) de dimension \(n\), (ou \(M\) une matrice carrée d'ordre \(n\) à coefficients dans \(\mathbf K\)).

Pour que \(f\) (respectivement \(M\)) soit diagonalisable, il faut et il suffit que les deux conditions suivantes soient satisfaites :

  1. Le polynôme caractéristique de \(f\) (respectivement de \(M\)) se factorise en un produit de polynômes du premier degré (non nécessairement distincts) à coefficients dans \(\mathbf K\).

  2. Pour chaque valeur propre, la dimension du sous-espace propre associé est égale à son ordre de multiplicité en tant que racine du polynôme caractéristique.

Vocabulaire

La propriété précédente prouve l'intérêt des deux entiers liés à une valeur propre : son ordre de multiplicité en tant que racine du polynôme caractéristique et la dimension du sous-espace propre qui lui est associé. Il peut être commode d'introduire le vocabulaire suivant, classique dans ce domaine.

DéfinitionOrdre de multiplicité algébrique et ordre de multiplicité géométrique d'une valeur propre

Soit \(f\) un endomorphisme d'un \(\mathbf K\)-espace vectoriel \(E\) de dimension \(n\), (respectivement \(M\) une matrice carrée d'ordre \(n\) à coefficients dans \(\mathbf K\)) et \(\lambda\) une valeur propre de \(f\) (respectivement de \(M\))

L'ordre de multiplicité de \(\lambda\) en tant que racine du polynôme caractéristique est appelé ordre de multiplicité algébrique de \(\lambda\). La dimension du sous-espace propre associé à \(\lambda\) est appelé ordre de multiplicité géométrique de \(\lambda\).

ExempleQue signifie la condition 1. du théorème ?

Cela veut dire que le polynôme caractéristique de \(f\) (respectivement de \(M\)) s'écrit ,

\(P_{\textrm{car},f}(X)=(-1)^n(X-\lambda_1)^{n_{\lambda_1}}\cdots(X-\lambda_r)^{n_{\lambda_r}}\)

les éléments de \(\mathbf K,\lambda_1,\cdots,\lambda_r\) étant distincts deux à deux. Ce sont les valeurs propres de \(f\).

Si un polynôme vérifie la condition 1., on dit qu'il est scindé dans \(\mathbf K\).

Par exemple, les polynômes

\((X-1)^2(X+1),\quad-(X-\pi)(X-1)(X-3)\)

sont scindés dans \(\mathbb R\) alors que le polynôme \(X^2+1\) ne l'est pas.

On peut remarquer que tout polynôme à coefficients dans le corps \(\mathbb C\) des nombres complexes est scindé dans \(\mathbb C\).

PreuvePreuve du théorème

La démonstration est faite dans le cadre vectoriel, donc pour un endomorphisme. La traduction dans le cadre matriciel est immédiate d'après ce qui a été vu précédemment.

  • Condition nécessaire :

    Supposons \(f\) diagonalisable. On note \(\lambda_1,\cdots,\lambda_r\) les valeurs propres de \(f\) (cela sous-entend que les \(\lambda_i\) sont distincts deux à deux).

    Il existe donc une base de vecteurs propres. En regroupant les vecteurs propres associés à une même valeur propre, on obtient une base dans laquelle la matrice associée à \(f\) est diagonale de la forme , \(\left(\begin{array}{cccc}\lambda_1I_{m_1}&0&\cdots&0\\0&\ddots&\ddots&\vdots\\\vdots&\ddots&\ddots&0\\0&\cdots&0&\lambda_rI_{m_r}\end{array}\right)\), où \(m_k\) est la dimension de \(E_{\lambda_k}\). En calculant le polynôme caractéristique de \(f\) à partir de cette matrice, on obtient \(\displaystyle{P_{\textrm{car},f}(X)=(-1)^n\prod_{k=1}^{k=r}(X-\lambda_k)^{m_k}}\). Cela prouve à la fois que le polynôme caractéristique de \(f\) est scindé dans \(\mathbf K\), et d'autre part que l'ordre de multiplicité de la valeur propre \(\lambda_k\) est \(m_k\) qui est la dimension de \(E_{\lambda_k}\).

  • Condition suffisante :

    La première hypothèse se traduit par \(P_{\textrm{car},f}(X)=(-1)^n(X-\lambda_1)^{n_{\lambda_1}}\cdots(X-\lambda_r)^{n_{\lambda_r}}\), où les éléments de \(\mathbf K,\lambda_1,\cdots,\lambda_r\), distincts deux à deux, sont les valeurs propres de \(f\). On en déduit immédiatement, puisque le degré du polynôme caractéristique est égal à la dimension de l'espace vectoriel, l'égalité \(\displaystyle{\sum_{k=1}^{k=r}n_{\lambda_k}=n}\).

    On a vu précédemment que la somme des sous-espaces propres est directe. Compte tenu des propriétés de la dimension d'une somme directe on a donc

    \(\displaystyle{\textrm{dim }(E_{\lambda_1}\oplus\cdots\oplus E_{\lambda_r})=\sum_{k=1}^{k=r}\textrm{dim }(E_{\lambda_k})}\) et donc d'après la deuxième hypothèse

    \(\displaystyle{\textrm{dim }(E_{\lambda_1}\oplus\cdots\oplus E_{\lambda_r})=\sum_{k=1}^{k=r}n_{\lambda_k}=n}\).

    Donc \(E_{\lambda_1}\oplus\cdots\oplus E_{\lambda_r}\) est un sous-espace vectoriel de \(E\), qui a même dimension que \(E\) et par conséquent, \(E_{\lambda_1}\oplus\cdots\oplus E_{\lambda_r}=E\) . Cela prouve que \(f\) est diagonalisable.

Exemple

Soit \(E\) un espace vectoriel réel de dimension \(3\) et \((e_1,e_2,e_3)\) une base de \(E\). Soit \(f\) l'endomorphisme de \(E\) défini par :

\(\displaystyle{\begin{array}{cccccc}f(e_1)&=&3e_1+2e_2+e_3\\f(e_2)&=&-e_1-e_3\\f(e_1)&=&e_1+e_2+2e_3\end{array}}\)

La matrice associé à \(f\) dans la base \((e_1,e_2,e_3)\) est \(A=\left(\begin{array}{ccc}3&-1&1\\2&0&1\\1&-1&2\end{array}\right)\).

  • Première étape : détermination du polynôme caractéristique de \(f\).

    On a \(P_{\textrm{car},f}(X)=\left|\begin{array}{ccc}3-X&-1&1\\2&-X&1\\1&-1&2-X\end{array}\right|\), d'où en remplaçant la troisième colonne \(c_3\) par la somme de la deuxième et de la troisième, soit par \(c_3+c_2\), on obtient :

    \(P_{\textrm{car},f}(X)=\left|\begin{array}{ccc}3-X&-1&0\\2&-X&1-X\\1&-1&1-X\end{array}\right|=(1-X)\left|\begin{array}{ccc}3-X&-1&0\\2&-X&1\\1&-1&1\end{array}\right|\)

    et donc en remplaçant \(l_2\) par \(l_2-l_3\) on obtient :

    \(P_{\textrm{car},f}(X)=(1-X)\left|\begin{array}{ccc}3-X&-1&0\\1&-X+1&0\\1&-1&1\end{array}\right|=(1-X)[(3-X)(-X+1)+1]\).

    D'où \(P_{\textrm{car},f}(X)=(1-X)(X-2)^2\)

    Le polynôme caractéristique de \(f\) est scindé dans \(\mathbb R\). Les valeurs propres sont \(2\) qui est une valeur d'ordre de multiplicité \(2\), et \(1\) qui est une racine simple.

  • Deuxième étape : détermination de la dimension des sous-espaces propres.

    La dimension du sous-espace associé à une valeur propre simple est égale à \(1\), donc la dimension de \(E_1\) est égale à \(1\).

    Déterminer le sous-espace propre associé à la valeur propre \(2\) revient à déterminer les vecteurs \(v=x_1e_1+x_2e_2+x_3e_3\) de \(E\) tels que

    \(\displaystyle{(A-2I_3)\left(\begin{array}{cc}x_1\\x_2\\x_3\end{array}\right)=\left(\begin{array}{cccccc}1&-1&1\\2&-2&1\\1&-1&0\end{array}\right)\left(\begin{array}{cc}x_1\\x_2\\x_3\end{array}\right)=\left(\begin{array}{c}0\\0\\0\end{array}\right)}\)

    Cette équation matricielle équivaut au système : \(\left\{\begin{array}{ccccccc}x_1&-&x_2&+&x_3&=&0\\2x_1&-&2x_2&+&x_3&=&0\\x_1&-&x_2&&&=&0\end{array}\right.\)

    qui est équivalent au système \(\left\{\begin{array}{cccccccc}x_1&-&x_2&+&x_3&=&0\\x_1&-&x_2&&&=&0\\x_1&-&x_2&&&=&0\end{array}\right.\quad l_2\gets l_2-l_1\)

    Ce qui équivaut à \(x_1=x_2,\quad x_3=0\) soit \(v=x_1(e_1+e_2)\).

    Donc la dimension de \(E_2\) est égale à \(1\). Or \(2\) est une valeur propre double, donc l'endomorphisme \(f\) n'est pas diagonalisable.

Exemple

Soit la matrice à coefficients dans \(\mathbb R,\quad A=\left(\begin{array}{ccc}1&1&1\\1&1&1\\1&1&1\end{array}\right)\)

  • Première étape : Détermination du polynôme caractéristique de \(A\).

    On a \(P_{\textrm{car},A}(X)=\left|\begin{array}{ccc}1-X&1&1\\1&1-X&1\\1&1&1-X\end{array}\right|\), d'où en remplaçant la ligne \(l_1\) par \(l_1+l_2+l_3\) on obtient : \(P_{\textrm{car},A}(X)=\left|\begin{array}{ccc}3-X&3-X&3-X\\1&1-X&1\\1&1&1-X\end{array}\right|=(3-X)\left|\begin{array}{ccc}1&1&1\\1&1-X&1\\1&1&1-X\end{array}\right|\)

    et donc en remplaçant successivement \(c_2\) par \(c_2-c_1\) et \(c_3\) par \(c_3-c_1\) on obtient : \(P_{\textrm{car},A}(X)==(3-X)\left|\begin{array}{ccc}1&0&0\\1&-X&0\\1&0&-X\end{array}\right|=(3-X)X^2\). Le polynôme caractéristique de \(A\) est scindé dans \(\mathbb R\). Les valeurs propres sont \(0\) qui est une valeur d'ordre de multiplicité \(2\), et \(3\) qui est une racine simple.

  • Deuxième étape : détermination de la dimension des sous-espaces propres.

    La dimension du sous-espace associé à une valeur propre simple est égale à \(1\), donc la dimension de \(E_3\) est égale à \(1\).

    Déterminer le sous-espace propre associé à la valeur propre \(0\) revient à déterminer les vecteurs \(v=(x,y,z)\) de \(\mathbb R^3\) tels que \(\left(\begin{array}{ccc}1&1&1\\1&1&1\\1&1&1\end{array}\right)\left(\begin{array}{c}x\\y\\z\end{array}\right)=\left(\begin{array}{c}0\\0\\0\end{array}\right)\). Cette équation matricielle équivaut à l'équation \(x+y+z=0\). Donc la dimension de \(E_0\) est égale à \(2\).

    Donc pour chaque valeur propre, la dimension du sous-espace propre associé est égale à son ordre de multiplicité en tant que racine du polynôme caractéristique. La matrice est donc diagonalisable.

  • Troisième étape : recherche d'une base de vecteurs propres.

    • Les éléments \(v=(x,y,z)\) de \(E_0\) sont tels que \(x+y+z=0\) , ou encore \(z=-x-y\) . Donc \(v=(x,y,-x-y)=x(1,0,-1)+y(0,1,-1)\). Les deux vecteurs \(\epsilon_1=(1,0,-1)\) et \(\epsilon_2=(0,1,-1)\) engendrent \(E_0\) , et sont linéairement indépendants car non colinéaires. Donc \((\epsilon_1,\epsilon_2)\) est une base de \(E_0\) .

    • Les éléments \(v=(x,y,z)\) de \(E_3\) sont tels que

      \((A-3I_3)\left(\begin{array}{c}x\\y\\z\end{array}\right)=\left(\begin{array}{ccc}-2&1&1\\1&-2&1\\1&1&-2\end{array}\right)\left(\begin{array}{c}x\\y\\z\end{array}\right)=\left(\begin{array}{c}0\\0\\0\end{array}\right)\)

      ce qui équivaut au système

      \(\left\{\begin{array}{cccccccc}-2x&-&y&+&z&=&0\\x&-&2y&+&z&=&0\\x&+&y&-&2z&=&0\end{array}\right.\)

      On résout ce système par la méthode du pivot de Gauss et l'on obtient une base de \(\lambda_2\) formée du vecteur \(\epsilon_3=(1,1,1)\).

      On a donc \(A=P\left(\begin{array}{ccc}0&0&0\\0&0&0\\0&0&3\end{array}\right)P^{-1}\) avec \(P=\left(\begin{array}{ccc}1&0&1\\0&1&1\\-1&-1&1\end{array}\right)\)

Remarque

Nous avons suivi dans cet exemple la méthode standard.

On aurait aussi pu obtenir certains résultats par des remarques faites en observant la matrice et en utilisant des résultats généraux d'algèbre linéaire.

Soit \(f\) l'endomorphisme de \(E=\mathbb R^3\) dont la matrice dans la base canonique est égale à \(A\).

La matrice \(A\) ayant trois colonnes égales, est évidemment de rang \(1\). Donc \(f\) est de rang \(1\) et son noyau est de dimension \(2\) (application du théorème du rang). Cela prouve que \(0\) est valeur propre, que la dimension du sous-espace propre associé est égale à \(2\). Par conséquent, \(0\) a un ordre de multiplicité algébrique supérieur ou égal à \(2\). Comme pour un polynôme à coefficients réels, le polynôme caractéristique a, ou bien une seule racine réelle, ou bien trois (pas forcément distinctes), on est sûr ici qu'il y en aura trois et il y a deux cas possibles pour \(P_{\textrm{car},f}(X)\): ou bien \(0\) est racine triple de \(P_{\textrm{car},f}(X)\), ou bien il y a une autre racine qui sera simple. Pour en décider deux façons :

  • Première façon :

    en désignant par \((e_1,e_2,e_3)\) la base canonique de \(\mathbb R^3\), on peut écrire, pour tout \(i\) compris entre \(1\) et \(3\) :\(f(e_i)=e_1+e_2+e_3\) d'où on déduit

    \(f(e_1+e_2+e_3)=3(e_1+e_2+e_3)\).

    Comme le vecteur \(e_1+e_2+e_3\) n'est pas nul, cela prouve que \(3\) est une valeur propre de \(f,e_1+e_2+e_3\) étant un vecteur propre associé.

  • Deuxième façon :

    on a vu que le coefficient de \(X^{n-1}\) du polynôme caractéristique est égal à \((-1)^{n-1}\textrm{tr}(A)\).

    Or ici, on peut écrire \(P_{\textrm{car},f}(X)=-(X-\lambda)X^2\), et l'on sait que la trace de \(A\) est égale à \(3\). Donc on a \((-1)^23=\lambda\) (coefficient de \(X^2\)). Par conséquent, \(3\) est valeur propre.

    Donc \(P_{\textrm{car},f}(X)=-(X-3)X^2\) et d'après le théorème \(f\) et donc \(A\) sont diagonalisables. On a obtenu directement une base de \(E_3\), à savoir le vecteur \(e_1+e_2+e_3\). Tout ceci a pu être fait sans calculs. Pour avoir une base de \(E_0\), on utilise le fait que \(f(e_1)=f(e_2)=f(e_3)\)

    En effet, cela prouve que les vecteurs \(e_1-e_2,e_1-e_3\) sont dans le noyau de \(f\) (qui est égal à \(E_0\)). Or ces deux vecteurs sont linéairement indépendants, et \(E_0\) est de dimension \(2\). Ils déterminent donc une base de \(E_0\).

    Finalement on a obtenu tous les résultats sans faire de calculs. Tout a été basé sur les relations \(f(e_1)=f(e_2)=f(e_3)\).

Exemple

Soit \(A\) la matrice appartenant à \(M_4(\mathbb R)\) donnée par \(A=\left(\begin{array}{cccc}2&0&0&0\\1&1&-1&1\\0&0&0&1\\0&0&-1&0\end{array}\right)\).

Première étape : détermination du polynôme caractéristique de \(A\).

On a \(P_{\textrm{car},f}(X)=\left|\begin{array}{ccccccc}2-X&0&0&0\\1&1-X&-1&1\\0&0&-X&1\\0&0&-1&-X\end{array}\right|=\left|\begin{array}{ccccc}2-X&0\\1&1-X\end{array}\right|\times\left|\begin{array}{cccc}-X&1\\-1&-X\end{array}\right|\).  D'où \(P_{\textrm{car},f}(X)=(2-X)(1-X)(X^2+1)\) .

Le calcul ci-dessus utilise les règles de calcul par blocs des déterminants mais il est aussi possible de développer le déterminant par rapport à la première ligne, puis le déterminant d'ordre \(3\) obtenu par rapport à la première colonne.

Ce polynôme n'est pas scindé dans \(\mathbb R\), puisque le polynôme \(X^2+1\) n'est pas factorisable dans \(\mathbb R\).

La matrice \(A\) de \(M_4(\mathbb R)\) n'est donc pas diagonalisable (dans \(\mathbb R\)).

Mais si on la considère comme une matrice à coefficients dans \(\mathbb C\), son polynôme caractéristique peut alors s'écrire \(P_{\textrm{car},A}(X)=(2-X)(1-X)(i-X)(X+i)\). Il est scindé dans \(\mathbb C\) et admet \(4\) racines simples. La matrice \(A\), en tant qu'élément de \(M_4(\mathbb R)\), est donc diagonalisable ; elle est semblable (dans \(M_4(\mathbb R)\)) à la matrice

\(\left(\begin{array}{cccc}1&0&0&0\\0&2&0&0\\0&0&-i&0\\0&0&0&-i\end{array}\right)\)

En résolvant les systèmes qui permettent de déterminer les sous-espaces propres (on sait d'avance qu'ils sont de dimension \(1\)) on trouve que :

\(A=P\left(\begin{array}{cccc}1&0&0&0\\0&2&0&0\\0&0&i&0\\0&0&0&-i\end{array}\right)P^{-1}\) avec \(P=\left(\begin{array}{cccc}0&1&0&0\\1&1&1+i&1-i\\0&0&1+i&1-i\\0&0&-1+i&-1-i\end{array}\right)\)

On peut interpréter simplement la trace d'une matrice à l'aide de ses valeurs propres.

Propriété

Soit \(A\) une matrice carrée d'ordre \(n\) à coefficients dans \(\mathbf K\). On suppose que son polynôme caractéristique est scindé dans \(\mathbf K\). Alors la trace de \(A\) est égale à la somme des valeurs propres de \(A\), comptées autant de fois que l'exige leur ordre de multiplicité en tant que racine du polynôme caractéristique.

Comme le polynôme caractéristique est scindé, il s'écrit

\(P_{\textrm{car},A}(X)=(-1)^n(X-\lambda_1)^{n_{\lambda_1}}\cdots(X-\lambda_r)^{n_{\lambda_r}}\)

D'autre part, on a déjà vu que \(P_{\textrm{car},A}(X)=(-1)^nX^n+(-1)^{n-1}(\textrm{tr}(A))X^{n-1}+\cdots+\textrm{det}A\) . Le résultat est obtenu en comparant les coefficients \(X^{n-1}\) dans ces deux expressions.