Polynômes symétriques

Rappels sur le groupe symétrique

Définition

  • groupe des bijections de 1…n

  • transposition \((i,j)\)

  • cycle \((i,\sigma(i),\sigma^2(i),...)\) en groupant par orbite

Proposition

  • \(\gS_n\) engendré par les transpositions

  • toute permutation s’écrit de manière unique (à l’ordre près) comme produit de cycles à support disjoint, de plus ces cycles commutent deux à deux.

Signature

\[1 \to \cA_n \to \gS_n \to \set{\pm1} \to 1\]

\(\epsilon(\sigma)=(-1)^k\) si \(\sigma\) est produit de \(k\) transpositions.

Démonstration

il faut vérifier que la parité du nombre de transpositions est constante, c’est aussi la parité du nombre d’inversions \(i<j,\sigma(i)>\sigma(j)\).

Anneaux de polynômes en n indéterminées

monômes, degré total d’un monôme, d’un polynôme deg(fg) = deg(f)+deg(g)

Théorème

factorisation unique en irréductibles

Démonstration

Idée : si \(A\) est factoriel, \(A[x]\) l’est, c’est la même démonstration que celle donnée pour \(\Z[x]\), le point important est que dans un anneau factoriel les irréductibles sont premiers, ce qui permet d’avoir un quotient intègre et de démontrer le lemme de Gauss.

Polynômes symétriques élémentaires

Définition

Un polynôme en \(x_1,\dots x_n\) est dit symétrique si invariant par permutation de \(x_1...x_n\).

Définition

polynômes symétriques élémentaires \(s_1,\dots s_n\)

\[\sigma_k = \sum_{1\leq i_1 \lt \cdots i_k \leq n} x_{i_1}\cdots x_{i_k}\]

Théorème

\[\prod(x-x_i) = \sum (-1)^i s_i x^{n-i}\]

exemples: deg 2, 3

Définition

sommes de Newton \(N_k = \sum x_i^k\)

Proposition

\[\sum_{i=0}^{k} (-1)^i\sigma_{k-i}N_{i+1} = (k+1)\sigma_{k+1}\]

Théorème

Un polynôme symétrique est un polynôme en \(s_1,\dots s_n\)

Démonstration

  • ordre sur les monômes : l’ordre lexicographique pondéré par le degré total alors il n’existe qu’un nb fini de monômes inférieurs à un monôme donné, on peut faire des récurrences

  • soit P symétrique : on regarde son monôme de plus haut poids \(x_1^{a_1}\dots x_n^{a_n}\), alors par symétrie \(a_1\geq a_2\geq a_n\).

    On pose

    \[f_1=a\sigma_1^{\alpha_1-\alpha_2}\sigma_2^{\alpha_2-\alpha_3}\dots\sigma_n^{\alpha_n}\]

    qui est de même coefficient dominant.

    Alors \(P-f_1\) est un polynôme symétrique de degré strictement inférieur pour notre ordre bien fondé, ce qui assure qu’en un nombre fini d’étapes on aboutit au polynôme nul : on a alors écrit \(P\) comme un poynôme en les \(\sigma_i\).

  • Unicité : admise

Exemple

  • \(\sum sym x_1^4x_2x_3^2\)

  • premières sommes de Newton

Théorème

\(x_1\dots x_n\) sont entièrement déterminés par \(s_1,\dots s_n\)

en effet, racines du polynôme obtenu. cf ab et a+b déterminent a et b.

Théorème

Soient \(P\in K[x]\) et \(a_1,\dots a_n\) les racines dans L. Alors pour tout polynôme \(Q(x_1,\dots x_n)\) symétrique, on a \(Q(a_1\dots a_n)\in K\).

Démonstration

on écrit Q comme pol en \(s_1\dots s_n\), lesquels sont dans K.

Exemple

soient \(a_1,a_2,a_3\) les racines complexes de \(x^3+2x^2+x+7\). (rem: irred via mod 2), alors le pol ayant pour racines \(a_1+a_2, a_1+a_3 et a_2+a3\) est à coefficients dans Q.

Remarque

ce pol vaut \(x^3+4x^2+5x-5\)

Le discriminant

Définition

Soient \(x_1,\dots x_n\), on pose \(\delta = \prod_{i<j} (x_i-x_j)\) et \(\Delta = \delta^2\). \(\Delta\) est le discriminant de \(x_1,\dots x_n\).

Proposition

on a \(\Delta=0\) ssi les \(x_i\) ne sont pas tous deux à deux distincts.

Proposition

\(\Delta\) est un polynôme symétrique en \(x_1,\dots x_n\), tandis que \(\delta\) vérifie \(\sigma.\delta=\epsilon(\sigma)\delta\).

Proposition

  • \(\delta = \det( (x_i^j) )\)

  • \(\Delta = \det( N_{i+j} )\)

discriminant d'un polynôme

Soit \(P=\prod_{i=1}^n(x-x_i)\) unitaire, on pose \(∆(P)=∆(x_1,\dots x_n)\). On a la formule

\[Δ(P)=(-1)^{\frac{n(n-1)}2}\det Sylv(P,P')\]

Démonstration

On démontre plus généralement que pour \(P=\prod x-x_i\) et \(Q=\prod x-y_i\) de degrés \(m\) et \(n\), le déterminant de la matrice de Sylvester vaut \(\prod_{i,j} (y_j - x_i)\).

Notons \(E_m\) l’espace vectoriel de dimension \(m\) des polynômes de degré inférieur à \(m\) strictement, et muni de la base \(1,x,\dots x^{m-1}\).

Pour \(P,Q\) de degrés \(m\) et \(n\), on a l’application de Bezout \(\phi:E_n\times E_m\to E_{m+n}\) définie par \(\phi(U,V)=PU+QV\).

Cette application est surjective ssi elle est bijective, et donc de déterminant non nul ssi \(P\) et \(Q\) sont premiers entre eux, ssi \(x_i\neq y_j\) pour tous \(i,j\).

Puisque \(\Q[x_1,\dots x_m, y_1,\dots y_n]\) est factoriel, on en déduit que \(\prod_{i,j}(y_j-x_i)\) divise ce déterminant. En examinant le degré en chaque \(x_i\), on voit qu’il ne reste qu’une constante à déterminer, qui se récupère via le terme dominant en \(x_1\).

On applique ensuite ce résultat à \(P\) et \(P'\).

Exemple

si \(P(x)=x^3+px+q\), on trouve

\[\begin{split}Δ= (-1)^3\left[\begin{array}{ccccc} 1&&3&&\\ 0&1&0&3\\ p&0&p&0&3\\ q&p&&p&0\\ &q&&&p \end{array}\right]=-4p^3+-27q^2\end{split}\]

Application 1 : le théorème fondamental de l’algèbre

Définition

corps algébriquement clos, clôture algébrique

Théorème

tout \(P\in\C[x]\) non constant a une racine

Démonstration

suivant Euler

  • étape 1: suffit de le faire pour \(P\in\R[x]\) car \(P\overline P\) a les mêmes racines.

  • étape 2: on sait que tout \(P\) de degré impair a une racine réelle, donc complexe, par théorème des valeurs intermédiaires

  • étape 3: tout polynôme de degré 2 de \(\C[x]\) a deux racines complexes.

    argument: Soit P de degré \(n\), on écrit \(n=2^km\) avec m impair. Par récurrence sur \(k\)

    • si k=0, c’est bon car le degré est impair

    • on suppose le résultat vrai pour tout k”<k.

      • Il existe un corps L contenant \(\C\) dans lequel \(P\) est scindé et s’écrit \(P(x) = \prod_{i=1}^n(X-\alpha_i)\)

      • Pour tout \(\lambda\in\R\), on définit le polynôme

        \[g_\lambda(x) = \prod_{i\lt j}(x-\alpha_i-\alpha_j +\lambda\alpha_i\alpha_j)\]

        Les racines sont à priori dans \(L\), toutefois

        • c’est un polynôme de degré \(\binom n2=2^{k-1}[m(2^km-1)]=2^{k-1}m'\) avec \(m'\) impair.

        • il est symétrique en \(\alpha_1,\dots \alpha_n\) donc à coefficients dans \(\R\).

        Ainsi, par hypothèse de récurrence, ce polynôme a une racine complexe, donc il existe \(i<j\) tel que \(\alpha_i+\alpha_j-\lambda\alpha_i\alpha_j\in \C\)

        De plus, ceci est vrai pour l’infinité de valeurs \(\lambda\in\R\), donc il existe deux valeurs \(\lambda\neq\lambda'\) pour lesquelles le même couple \(i<j\) fournit \(\alpha_i+\alpha_j-\lambda\alpha_i\alpha_j\in \C\) et \(\alpha_i+\alpha_j-\lambda'\alpha_i\alpha_j\in \C\). En résolvant, on en déduit que \(\alpha_i+\alpha_j\) et \(\alpha_i\alpha_j\) sont complexes, donc \(\alpha_i\) et \(\alpha_j\) s’obtiennent comme racines d’un polynôme complexe du secod degré, donc sont complexes.

        Ainsi, \(P\) a une racine complexe (et même deux, et d’ailleurs toutes), ce qui achève de démontrer la récurrence et le théorème.

Application 2 : résolution de l’équation de degré 4

Soit \(P(x)=x^4-ax^3+bx^2-cx+d=(x-x_1)(x-x_2)(x-x_3)(x-x_4)\) une équation de degré \(4\).

On attaque l’équation avec le principe suivant :

  • on connaît toutes les expressions symétriques en \(x_1,\dots x_4\)

  • si une expression n’est pas symétrique, on peut construire le polynôme symétrisé dont elle est racine

  • on pourra calculer cette expression si l’expression prend au plus 3 valeurs par symétrie, comme racine d’un polynôme de degré \(\leq 3\).

  • on cherche donc des expressions « assez symétriques mais pas complètement », que l’on appelle résolvantes

Il existe une résolvante particulièrement intéressante pour le degré 4 :

\[R = x_1x_2+x_3x_4\]

elle est invariante par le sous-groupe d’ordre 8

\[H = \set{ (1), (12), (34), (12)(34), (13)(24), (14)(23), (1324), (1423) }\]

et prend deux autres valeurs par symétrie,

\[R' = (23).R = x_1x_3+x_2x_4\]

qui est fixe par le conjugué \(H' = (23)^{-1}H(23)\), et \(R'' = (24)R = x_1x_4 + x_2x_3\) fixe par \(H''=(24)^{-1}H(24)\).

Ainsi,

\[Q(x) = (x-R)(x-R')(x-R'') = x^3-Ax^2+Bx-C \in \Q(a,b,c,d)\]

et on peut calculer ses coefficients par l’algorithme de Gauss

\[\begin{split}A = \sigma_2 \\ B = \sigma_1\sigma_3-4\sigma_4 \\ C = \sigma_1^2\sigma4+\sigma_3^2-4\sigma_2\sigma4\end{split}\]

La résolution de l’équation \(Q\) permet de calculer \(R,R',R''\), on a cassé \(\sigma_2\).

On peut poursuivre en regardant l’expression \(S=x_1x_2\), qui sous l’action de \(H\) est stabilisée par le sous-groupe \(K=\set{ (1), (12), (34), (12)(34) }\) d’indice 2 dans \(H\), et qui prend l’autre valeur \(S'=x_3x_4\).

Alors le polynôme de degré \(2\)

\[(x-S)(x-S') = x^2-Rx+\sigma_4\]

permet de calculer \(S\) et \(S'\).

Pour isoler les racines \(x_1\) et \(x_2\), on calcule de même \(x_1+x_2\) qui est racine de

\[(x-x_1-x_2)(x-x_3-x_4) = x^2-\sigma_1x+(x_1x_3+x_1x_4+x_2x_3+x_2x_4)\]

où le terme constant vaut \(R'+R''=\sigma_2-R\).

Enfin, \(x_1\) et \(x_2\) sont racines de

\[x^2-(x_1+x_2)x+x_1x_2\]

tandis que \(x_3,x_4\) sont racines de

\[x^2 - (\sigma_1-x_1-x_2)x+\frac{\sigma_4}{x_1x_2}\]

On voit que cette idée a fonctionné parce qu’on a trouvé une expression invariante par un sous-groupe d’indice \(3\) de \(\sigma_4\).

Pour résoudre en général l’équation de degré \(5\), on arrive à trouver une expression invariante par \(\cA_n\) d’indice \(2\), puis au mieux une expression invariante par un sous-groupe d’indice \(6\) de \(\cA_5\)… le degré ne descend pas, ce n’est pas exploitable.