Polynôme minimal d'un endomorphisme, ou d'une matrice, valeurs propres et diagonalisation

ThéorèmeValeurs propres et polynôme minimal

Soit \(f\) un endomorphisme d'un \(\mathbf K\)- espace vectoriel de dimension finie \(n,n\ge 1\) . Un scalaire \(\lambda\) est valeur propre de \(f\) si et seulement si \(\lambda\) est racine du polynôme minimal de \(f\).

Preuve

  • Soit \(\lambda\) une valeur propre de \(f\) et \(P_{\textrm{min},f}(X)=b_sX^s+b_{s-1}X^{s-1}+\cdots+b_0\) le polynôme minimal de \(f\). Il existe donc un vecteur \(v\) non nul tel que \(f(v)=\lambda v\). Une récurrence immédiate prouve que pour tout entier strictement positif \(k,f^k(v)=\lambda^kv ,\) d'où on déduit que pour tout polynôme \(P\) à coefficients dans \(\mathbf K,(P(f))(v)=P(\lambda)v\). En appliquant ce résultat avec le polynôme minimal, on obtient \((P_{\textrm{min},f}(f))(v)=(P_{\textrm{min},f}(\lambda))(v)=0\). Comme le vecteur \(v\) est non nul on en déduit que \(P_{\textrm{min},f}(\lambda)=0\).

  • Réciproquement, soit \(\lambda\) une racine de \(P_{\textrm{min},f}(X)\). Le polynôme \(X-\lambda\) divise donc \(P_{\textrm{min},f}(X)\); cela prouve l'existence d'un polynôme \(Q\) tel que \(P_{\textrm{min},f}(X)=(X-\lambda)Q(X)\). Alors on a \(P_{\textrm{min},f}(f)=(f-\lambda Id_E)\bigcirc Q(f)=0\). Comme le degré de \(Q\) est strictement inférieur au degré de \(P_{\textrm{min},f}(X), Q\) n'est pas un polynôme annulateur de \(f\). Il en résulte que \(Q(f)\) n'est pas nul et que \(f-\lambda Id_E\) n'est pas injective. Son noyau n'est pas réduit à \(0\) et par conséquent \(\lambda\) est une valeur propre de \(f\).

Remarque

Le polynôme minimal a donc les mêmes racines que le polynôme caractéristique.

ThéorèmeCondition nécessaire et suffisante de diagonalisation faisant intervenir le polynôme minimal

Soit \(f\) un endomorphisme d'un \(\mathbf K\)-espace vectoriel \(E\) de dimension \(n,n\ge 1\) (ou soit \(M\) une matrice carrée d'ordre \(n\) à coefficients dans \(\mathbf K\)).

Pour que \(f\) (respectivement \(M\)) soit diagonalisable, il faut et il suffit que les deux conditions suivantes soient satisfaites :

  1.  Le polynôme minimal de \(f\) (respectivement de \(M\)) se factorise en un produit de polynômes unitaires du premier degré à coefficients dans \(\mathbf K\) (autrement dit est scindé dans \(\mathbf K\)).

  2. Ces polynômes sont tous distincts. Autrement dit le polynôme minimal de \(f\) (respectivement de \(M\)) n'a que des racines simples.

RemarqueRemarque importante

Ce théorème est fondamental dans cette théorie. Il permet en effet de déterminer si un endomorphisme est ou n'est pas diagonalisable, dans des situations où les hypothèses ne permettraient pas de le faire avec la caractérisation faisant intervenir le polynôme caractéristique.

Par contre, ce théorème n'est pas effectif et ce procédé ne permet pas d'obtenir une base de vecteurs propres.

De plus, le calcul du polynôme minimal est moins systématique que celui du polynôme caractéristique. Toutefois la connaissance du théorème de Cayley Hamilton facilite beaucoup la détermination du polynôme minimal. Cela est traité dans une autre ressource.

ExempleExemple illustrant cette remarque

Soit \(f\) un endomorphisme d'un espace vectoriel complexe de dimension finie \(n,n\ge 1\) . On suppose qu'il existe un entier \(k,k\ge 1\) tel que \(f^k=Id_E\). Alors \(f\) est diagonalisable. En effet, le polynôme \(X^k-1\) est un polynôme annulateur de \(f\), donc est divisible par le polynôme minimal de \(f\). Dans \(\mathbb C\), corps algébriquement clos, le polynôme \(X^k-1\) est scindé et n'a que des racines simples (les \(k\) racines \(k\)-ième de l'unité) et par conséquent tout polynôme qui le divise aussi.

Donc, d'après le théorème, \(f\) est diagonalisable.

Ce qu'il faut particulièrement remarquer dans cet exemple c'est que l'on ne connaît ni le polynôme minimal de \(f\), ni son polynôme caractéristique ni ses valeurs propres et évidemment encore moins ses sous-espaces-propres, mais que l'on a su justifier qu'il était diagonalisable.

PreuvePreuve de la condition nécessaire et suffisante

Supposons que \(f\) soit diagonalisable. Soient \(\lambda_1,\lambda_2,\cdots,\lambda_r\) les valeurs propres distinctes de \(f\) et \(E_{\lambda_1},E_{\lambda_2},\cdots,E_{\lambda_r}\) les sous-espaces propres associés. Si l'on considère le polynôme \(P(X)=(X-\lambda_1)(X-\lambda_2)\cdots(X-\lambda_r)\) à coefficients dans \(\mathbf K\), il est scindé dans \(\mathbf K\) et n'a que des racines simples.

Les polynômes \(X-\lambda_i\) sont premiers entre eux deux à deux ce qui permet d'utiliser le lemme des noyaux, d'où

Ker\(P(f)\)=Ker\((f-\lambda_1Id_E)\oplus\)Ker\((f-\lambda_2Id_E)\oplus\cdots\oplus\)Ker\((f-\lambda_rId_E)\)

Or, \(f\) étant diagonalisable, on a

\(\displaystyle{\begin{array}{cccccc}E&=&E_{\lambda_1}\oplus E_{\lambda_2}\oplus\cdots\oplus E_{\lambda_r}\\&=&\textrm{Ker}(f-\lambda_1Id_E)\oplus\textrm{Ker}(f-\lambda_2Id_E)\oplus\cdots\oplus\textrm{Ker}(f-\lambda_rId_E)\end{array}}\)

Il en résulte que \(E=\)Ker\(P(f)\) et donc que \(P(f)=0\). Le polynôme \(P\) est donc un polynôme annulateur de \(f\) et par conséquent c'est un multiple du polynôme minimal de \(f\). Mais comme les valeurs propres de \(f\) sont racines du polynôme minimal d'après la propriété vue précédemment, le polynôme minimal de \(f\) est un multiple du polynôme

\(P(X)=(X-\lambda_1)(X-\lambda_2)\cdots(X-\lambda_r)\)

Comme ils sont unitaires tous les deux, ils sont égaux et par conséquent , \(P_{\textrm{min},f}(X)=(X-\lambda_1)(X-\lambda_2)\cdots(X-\lambda_r)\) polynôme qui n'a en effet que des racines simples.

Réciproquement, supposons que \(P_{\textrm{min},f}(X)=(X-\alpha_1)(X-\alpha_2)\cdots(X-\alpha_r)\) où les \(\alpha_i\) sont tous distincts. Les racines du polynôme minimal étant les valeurs propres de \(f,\alpha_1,\alpha_2,\cdots,\alpha_r\) sont les valeurs propres de \(f\).

De plus comme \(P_{\textrm{min},f}(f)=0,E=\)Ker\((P_{\textrm{min},f}(f))\) et d'après le théorème des noyaux :

\(\displaystyle{\begin{array}{cccccc}E&=&\textrm{Ker}(f-\alpha_1Id_E)\oplus\textrm{Ker}(f-\alpha_2Id_E)\oplus\cdots\oplus\textrm{Ker}(f-\alpha_rId_E)\\&=&E_{\alpha_1}\oplus E_{\alpha_2}\oplus\cdots\oplus E_{\alpha_r}\end{array}}\)

Donc \(f\) est diagonalisable.

Exemple

Reprenons les exemples vus précédemment.

  1. Soit \(E\) un espace vectoriel réel de dimension \(2\) et \((e_1,e_2)\) une base de \(E\).

    • On considère l'endomorphisme \(f\) de \(E\) défini par

      \(f(e_1)=e_2,f(e_2)=0\).

      On a vu que \(P_{\textrm{min},f}(X)=X^2\).

      Ce polynôme est bien scindé dans \(\mathbb R\), mais il n'a pas que des racines simples et donc \(f\) n'est pas diagonalisable.

    • On considère l'endomorphisme \(g\) de \(E\) défini par \(g(e_1)=e_2,g(e_2)=-e_1\).

      On a vu que \(P_{\textrm{min},g}(X)=X^2+1\).

      Ce polynôme n'est pas scindé dans \(\mathbb R\), et donc \(g\) n'est pas diagonalisable.

    • On considère l'endomorphisme \(h\) de \(E\) défini par \(h(e_1)=e_2,h(e_2)=e_1\).

      Il est alors immédiat que \(h^2(e_1)=e_1,h^2(e_2)=e_2\) et par conséquent \(h^2=Id_E\), soit \(h^2-Id_E=0\).

      On a vu que le polynôme minimal de \(h\) est \(X^2-1\). Il est scindé dans \(\mathbb R\), et n'a que des racines simples ; donc \(h\) est diagonalisable.

  2. Soit \(n\) un entier supérieur ou égal à \(1\) et \(E\) l'espace vectoriel :

    \(E=\{P\in\mathbf K[T],P=0\) ou deg \(P\leq n \}\)

    Soit \(D\) l'endomorphisme de \(E\) défini par :

    \(D(P(T))=P'(T)\)

    On a vu que \(P_{\textrm{min},D}(X)=X^{n+1}\).

    Ce polynôme est scindé dans \(\mathbf K\) mais n'a pas que des racines simples, donc \(D\) n'est pas diagonalisable.