Comptes Rendus MATh.en.JEANS 99-12
Au cours de cet exposé, je voudrais vous présenter un outil qu'on utilise très souvent en mathématiques, qui s'appelle un invariant.
Bien sûr, cela ne ressemble pas à un marteau ou à un tournevis.
Il s'agit d'un outil théorique.
Disons que c'est une façon de raisonner qu'on utilise souvent en recherche dans des domaines assez différents.
Cet exposé comportera trois parties.
Dans la première, je vais essayer de vous expliquer ce qu'est un invariant.
Dans la seconde, je vous montrerai à quoi cela peut servir.
Enfin, je terminerai par un exemple d'invariant que j'utilise parfois pour mes travaux de recherche.
A. Blocs logiques
On va commencer par retourner quelques années en arrière, puisque je vous ai apporté des objets, qu'on peut considérer comme des objets mathématiques très simples, et que vous avez certainement manipulés quand vous étiez à l'école maternelle.
|
|
![]()
|
Est-ce que vous pouvez les décrire ?
On constate qu'ils ont différentes formes, couleurs, tailles...
Essayons d'être un peu plus précis.
|
Vous êtes tous d'accord avec moi que si on connait la forme, la couleur et la taille de l'un de ces objets, on sait exactement duquel il s'agit ?
Si je vous dit que j'en ai gardé un dans mon sac, et qu'il est grand, carré et jaune, vous ne le voyez pas, mais vous savez très bien comment il est.
Et quand je vous le
montre,
il ressemble exactement à ce que vous attendiez.
D'une certaine façon, on peut dire qu'à un bloc de l'ensemble que je vous ai présenté, on peut associer trois invariants : sa taille (grande ou petite), sa forme (ronde, carrée ou triangle) et sa couleur (bleue, jaune ou rouge).
Cette idée est une idée fondamentale en mathématiques, et qui intervient très souvent, dans différents domaines :
Cela ne fonctionne pas toujours, mais
et on peut ainsi continuer à travailler. . . |
Je vais
maintenant vous expliquer plus précisément à
quoi servent ces invariants à l'aide d'un autre exemple.
B. Coniques
On appelle conique une courbe obtenue en prenant l'intersection d'un cône avec un plan. |
![]() |
Ces courbes peuvent avoir différentes formes, suivant la direction du plan. |
![]() |
![]() |
![]() |
|
|
|
Ces trois exemples sont fondamentaux, puisqu'on peut montrer qu'une conique est toujours de la même forme que l'une de celles-là [note 1]. Bien sûr, elle peut être plus ou moins allongée, orientée différemment... Mais c'est quand même toujours une ellipse, une hyperbole ou une parabole.
Je viens donc
de vous présenter une famille d'objets mathématiques,
qu'on appelle la famille des coniques.
[Équations des coniques]
Quand on choisit un repère cartésien, une conique est définie par une équation.
Choisir un repère, c'est se donner une origine O, deux axes, et une unité sur chacun des deux axes. |
![]() |
A ce moment là, un point du plan est déterminé par la donnée de ses coordonnées x et y. |
Par exemple, pour cette ellipse, ![]() |
si on se place dans le repère qui est dessiné ![]() |
l'équation est x2+2xy+3y2=1, c'est-à-dire que l'ellipse est l'ensemble des points du plan dont les coordonnées x et y vérifient cette équation. |
De même, l'hyperbole a pour équation ![]() |
et la parabole ![]()
|
D'une manière générale, l'équation d'une conique est de la forme
(1) ax2+bxy+cy2+dx+ey+f = 0 .
La famille à laquelle on s'intéresse est donc la famille des courbes du plan ayant une équation de cette forme là. On connait assez bien cette famille. On sait que chacune de ces courbes est soit une parabole, soit une ellipse, soit une hyperbole.
Maintenant,
je vais essayer de vous expliquer à quoi servent les
invariants à partir de cet exemple.
[Un invariant pour les coniques]
Imaginons qu'en cherchant à résoudre un problème, qui peut être un problème de mathématiques, de physique, ou autre, on se retrouve nez à nez avec une courbe de cette famille.
Par exemple, vous étudiez le mouvement d'un objet qui se déplace dans un plan. Si vous notez x et y les coordonnées de la position de l'objet, vous constatez, en regardant quelles sont les forces qui agissent sur lui, que ces coordonnées vérifient une équation de la forme (1) ci-dessus.
Vous êtes d'accord avec moi que l'on n'est pas encore entièrement satisfaits? On aimerait bien savoir si la courbe en question est une parabole, une hyperbole ou une ellipse.
Bien sûr, pour le savoir, on peut faire l'expérience, ou encore tracer la courbe, soit à la main, soit avec un ordinateur.
Mais je vais vous donner un moyen encore plus simple :
[Théorème] il suffit de calculer le nombre 4ac-b2.
|
Vérifions-le ensemble sur les exemples précédents.
x2+2xy+3y2=1, ![]() |
x2-2y =1 ![]() |
x2+4xy+2y2=1. ![]() |
ce nombre [4ac-b2] vaut 8 |
[4ac-b2] vaut bien 0 |
[4ac-b2] vaut -8. |
Voilà donc un exemple d'invariant, associé à la courbe [vue comme son équation]. On vient de constater ensemble qu'il nous donne des renseignements importants sur sa nature !
En fait, la partie significative de l'équation est la première partie,
Ce morceau d'équation définit ce qu'on appelle une forme quadratique, et le nombre qu'on a calculé tout à l'heure est la signature de cette forme quadratique. [note 2]
Dans le cas particulier où b est nul, la première partie de l'équation est de la forme ax2+cy2.
Dans ce cas, l'invariant qu'on vient de calculer vaut 4ac.
Il est positif si a et c ont le même signe, et négatif si a et c sont de signes contraires, c'est-à-dire si l'un des deux est positif et l'autre négatif.
Donc la courbe est une ellipse si a et c sont de même signe, et une hyperbole si a et c sont de signes contraires.
[Les quadriques]
On peut faire la même chose en dimension 3.
C'est-à-dire qu'on va se placer dans l'espace, et choisir un repère. |
![]() |
Cette fois-ci, un point est déterminé par trois coordonnées, que l'on va noter x, y et z. |
Les surfaces qui généralisent les coniques s'appellent les quadriques.
On va s'intéresser ici à celles qui ont une équation de la forme
(3) ax2+by2+cz2 = 1 .
C'est ce que l'on appelle une équation réduite. [note 3]
On va supposer en plus que les coefficients a, b et c sont non nuls.
[Théorème] On a alors 3 cas différents. |
Si a, b et c sont tous les trois positifs, la quadrique est ce qu'on appelle un ellipsoîde. ![]() Cela ressemble un peu à un oeuf. |
Est-ce que vous pouvez deviner la courbe qu'on obtient quand on la coupe par un plan? C'est une ellipse. |
Si maintenant l'un des trois coefficients [a, b et c] est positif, et les deux autres sont négatifs, la surface est ce qu'on appelle un hyperboloïde à deux nappes. | |
|
Quand on la coupe par un plan, on obtient une courbe qui est soit une ellipse soit une hyperbole, [soit une parabole ] suivant la direction du plan. |
Enfin, si l'un des trois est positif, et les deux autres sont négatifs, on obtient un hyperboloïde à une nappe, comme sur ce dessin. | |
![]() |
[ Quand on la coupe par un plan, on obtient une courbe qui est soit une ellipse soit une hyperbole, soit une parabole suivant la direction du plan. ] |
Vous voyez, à nouveau, c'est ce qu'on appelle la signature de la forme, qui est donnée par les signes des coefficients, qui nous donne la nature de la surface. |
C. Algèbres de quaternions
Venons-en à la troisième partie de cet exposé. Je voudrais vous montrer un invariant dont je me sers parfois pour mes travaux de recherche.
Les objets auxquels on va s'intéresser sont un petit peu plus compliqués qu'auparavant. Mais ne vous inquiétez pas si vous ne comprenez pas très bien leur définition, vous pourrez quand même constater que le principe du raisonnement est toujours le même.
L'objet en question s'appelle
une algèbre de quaternions.
[Une algèbre de quaternions]
On la définit de la manière suivante.
Je vais commencer par choisir deux nombres a et b.
Pour que la situation soit intéressante, je les choisis rationnels, c'est-à-dire qu'ils s'écrivent chacun comme un quotient de deux nombres entiers.
L'algèbre de quaternions Q, c'est un ensemble, qui contient deux éléments que je vais noter i et j qui vérifient i2=a et j2=b. [note 4]
On peut faire le produit de deux éléments quelconques de Q, mais ce qui est assez inhabituel, c'est que quand on fait le produit de deux éléments dans un sens et dans l'autre, on n'obtient en général pas le même résultat. En particulier, on a i j = -j i . On dit que cette algèbre est non commutative. [note 5]
![]() ![]() ![]() ![]() |
Dans
certains cas, suivant la valeur des nombres a et b que
l'on choisit, cet ensemble a une propriété remarquable
: c'est que tout élément non nul est inversible. Autrement dit, pour tout xQ,
x
0, on
peut trouver un élément y
Q
tel que le produit des deux vaut 1. Dans
ce cas, on dit que c'est une algèbre à division. [note 6]
C'est une propriété qui est très intéressante, mais qui n'est pas toujours facile à détecter.
Pour le faire, les mathématiciens ont utilisé un invariant.
[Un invariant : la forme norme]
A l'algèbre de quaternions Q, on associe une forme quadratique, comme tout à l'heure. Cette forme, on l'appelle la forme norme.
Elle s'écrit
(5) N(x,y,z) = -ax2-by2+abz2
On peut montrer que
[Théorème] l'algèbre de quaternions Q est une algèbre à division si et seulement si la forme norme ne prend pas la valeur 0 en dehors du point (0,0,0), c'est-à-dire s'il n'existe pas de triplet (x,y,z) différent de (0,0,0) tel que N(x,y,z) = 0. |
Par exemple,
Cette forme prend toujours la valeur 0 [en dehors du point (0,0,0)] puisque N(0,1,1) = 0.
Ceci prouve que l'algèbre Q associée à (1,b) n'est pas à division, et ce quelle que soit la valeur de b.
Celle-ci n'a pas de solution autre que (0,0,0).
Ceci prouve que
l'algèbre Q associée à (-1,-1) est à division.
En guise de conclusion
Je voudrais quand même, pour terminer, vous dire que j'ai bien entendu choisi avec soin les exemples que je vous ai montrés. Je me suis placée dans des cas relativement simples, dans lesquels les invariants sont assez faciles à calculer, et nous donnent pas mal de renseignements sur l'objet qu'on étudie.
Mais dans la pratique, on n'est pas toujours dans cette situation là. En particulier, on peut se heurter aux deux problèmes suivants.
Trouver un intermédiaire entre les deux n'est pas toujours facile... [note 8]
1. En fait, lorsque le plan de coupe passe par le sommet du cône, la conique se réduit alors à deux droites (sécantes, voire confondues) ou à un point : on dit qu'elle est dégénérée. Les coniques dont il est questions ici sont supposées non dégénérées.
retour à l'appel de cette note
2. De manière générale, une
forme
quadratique des variables
x,y,z,... est une somme de monômes du second degré formés avec ces
variables. La signature
d'une forme quadratique est définie par les signes
de certaines expressions qui se calculent à partir des
coefficients de ces monômes. Ici, en toute rigueur, la
signature de la forme ax2+bxy+cy2 désigne le signe de
l'expression 4ac-b2.
retour à l'appel de cette note
3. De manière générale, une quadrique est une surface de l'espace tridimensionnel définie par une équation du second degré ayant pour variables les 3 coordonnées d'un point. Comme pour les coniques, ces quadriques peuvent être "dégénérées" ou "impropres" (par exemple, elle peut être réduite à un cône, un cylindre, deux plans ou à un paraboloïde etc.]. Seules les quadriques "propres" sont ici décrites : leur équation dans un repère bien choisi peut se mettre sous forme réduite.
retour à l'appel de cette note
4. Le "corps des quaternions" fut introduit par Hamilton comme un ensemble de
"nouveaux nombres" généralisant les nombres
complexes (qui eux-mêmes généralisent les
nombres réels). Hamilton opérait à partir de
nombres réels. Le même principe de construction,
appliquée à des nombres rationnels produit les
algèbres de
quaternions dont il est
question ici.
Détaillons un peu ce principe : ces algèbres vont
être obtenues en combinant les nombres rationnels usuels avec
deux nouveaux objets, i et
j, à l'aide d'opérations, appelées
encore addition et
multiplication, qui généralisent l'addition et
la multiplication usuelles grâce au respect de quelques
règles simples.
Les définitions vont dépendre de deux paramètres
arbitraires a et b (rationnels non nuls) : à chaque choix de
valeurs pour a et b va correspondre une algèbre de quaternion
particulière Qab,
noté ici simplement Q . On
procède essentiellement en trois étapes
1) On définit la valeur des produits des
éléments de base.
2) On convient que la nouvelle addition sera associative et
commutative et que 0 sera son élément neutre. Elle sera
noté +.
3) On convient que la nouvelle multiplication sera associative,
qu'elle sera distributive par rapport à la nouvelle addition
et que 1 (l'élément unité des nombres
rationnels) sera son élément unité. Le produits
de deux éléments A et B sera noté par simple
juxtaposition sous la forme AB.
En fait compte tenu de 2) et 3), il suffira pour l'étape 1)
d'introduire un nouvel élément ij
(symbole qui , par définition, représente le
produit de i par
j) et de définir ji,
i2 et
j2
à partir des éléments déjà
définis et des paramètres a et b. Quatre
éléments vont alors pouvoir servir d'éléments de base : 1, i,
j et ij. En
multipliant ces éléments de base par des nombres
rationnels x, y, z, t et en les ajoutant on obtient alors la forme
générale d'un élément de l'algèbre
: x1+yi+zj+tij ou, sous
forme simplifiée x+yi+zj+tij.
retour à l'appel de cette note
5. Ici les "quaternions" i,
j et ij
sont introduits de
manière abstraite : ce sont de nouveaux symboles sur
lesquels on définit de nouvelles opérations. En fait,
comme l'avait montré Hamilton, on pourrait donner de ces
quaternions une interprétation géométrique en
utilisant des rotations dans
l'espace (on observera que, la "multiplication" de rotations,
définie par la composition
de fonctions, n'est pas
commutative : le produit de deux rotations d'axes concourants
mais différents dépend de l'ordre dans lequel les
rotations sont successivement effectuées).
retour à l'appel de cette note
6. Dans ce contexte, algèbre à division est synomyme de corps.
retour à l'appel de cette note
7. Tel est le cas pour les quaternions d'Hamilton, qui s'obtient en étendant aux nombres réels la construction faite ici avec les nombres rationnels.
retour à l'appel de cette note
8. On trouvera dans les références suivantes d'autres exemples d'invariants :
Ateliers MATh.en.JEANS des
collèges Pierre de Ronsard et l'Ardillière de
Nézant, de Saint Brice sous Forêt, Les culbutos NEWS, in MATH.en.JEANS à l'École, Actes
MATh.en.JEANS 1993, AMeJ,
Paris, 1994, pp; 169-173. [ ] Version PDF
46Ko 18-Nov-2002 (une
série de culbutes permettra-t-elle d'amener un cube à
la case voulue avec l'orientation voulue ? Non, tout dépen,d
de la valeur d'un certain invariant.)
E. Bayer-Fluckiger, Le noeud
de trèfle ne se dénoue pas, Comptes Rendus MATh.en.JEANS n° 00-12
(année 2000), AMeJ, Paris, 2004.
(Article de professionnel : grâce au calcul d'un invariant
"oui-non" (oui, on peut colorer un dessin du noeud ou non, on ne peut
pas) on montre que le noeud de trèfle ne peut pas être
dénoué.)
retour à l'appel de cette note
INVARIANT MATHÉMATIQUE BLOCS LOGIQUES ÉQUATION COURBE CONIQUES ELLIPSE PARABOLE HYPERBOLE QUADRIQUES SIGNATURE D'UNE FORME QUADRATIQUE NORME ALGEBRE DE QUATERNIONS
Comptes Rendus MATh.en.JEANS 99-12 |
© MATh.en.JEANS 2004. Tous droits réservés. |