Introduction

Nous avons déjà vu qu'une application affine bijective de A dans A transforme une droite en une droite.
Moyennant certaines restrictions que nous allons illustrer par quelques contre-exemples, la réciproque est vraie.
Commençons donc par étudier quelques cas où la réciproque est fausse.

Exemple 1

Si la dimension de A est égale à 1. Toute application conserve l'alignement, or il est clair que toute bijection de ℝ dans ℝ n'est pas affine (ex: x → x3).

Exemple 2

Le cas de la caractéristique 2 est particulier. Toute droite est constituée d'exactement 2 points. Il en résulte que toute application bijective d'un espace affine sur K=ℤ/2ℤ conserve l'alignement. Prenons alors A=K3, A comporte donc 8 points, et le nombre des bijections de A dans A (permutations de A) est donc 8!= 40320.
Les applications linéaires de A dans A identifiées par leurs matrices dans la base canonique sont au nombre de 29=512. Le nombre des translations est égal à 8. Donc le nombre maximum d'applications affines de A dans A est 8×512=4096. Toutes les bijections de A dans A ne peuvent donc être affines.

Exemple 3

Prenons K= et A=K2.
Considérons l'application f: A → A (z1,z2) → ( z 1 ¯ , z 2 ¯ ) , alors f transforme toute droite d'équation uz1+vz2+w=0 en la droite d'équation uz1+vz2+w=0.
Montrons que f n'est pas affine.
Dans le cas contraire il existerait des scalaires complexes α,β,γ,δ,a, b tels que ∀ (z1,z2) ∈ A, on aurait :
{ z 1 ¯ = α z 1 + β z 2 + a z 2 ¯ = γ z 1 + δ z 2 + b
Voir par exemple cette page pour un rappel.
En prenant z1=z2=0, il vient immédiatement a=b=0.
En prenant z1=1 et z2=0, il vient immédiatement α=1 et γ=0.
En prenant z1=0 et z2=1, il vient immédiatement β=0 et δ=1.
Donc pour finir, on aurait z1=z1 et z2=z2 ∀ (z1,z2) ∈ A, ce qui est absurde. Avant de poursuivre nous aurons besoin d'un petit rappel d'algèbre.

Applications semi-linéaires

Un automorphismes d'un corps K est une application σ: K → K qui :

Exemples

Il existe un résultat important dans le cas du corps des réels.
Le seul automorphisme de ℝ est l'identité.

En effet si σ est un tel automorphisme il résulte de la définition de σ(0)=0 et σ(1)=1.
Nous en concluons que pour tout entier positif σ(p)=σ(1+ ... +1)=σ(1)+ ... +σ(1)= 1 + ... + 1 =p
par ailleurs σ(1/q + .... +1/q)= qσ(1/q)=σ(1)=1, d'où σ(1/q)=1/q pour q positif.
L'égalité σ(p/q)=p/q s'étend en fait à tous les rationnels positifs ou négatif à cause de l'additivité de σ
La restriction de σ à ℚ est donc l'identité.
σ est en outre positive. En effet si x > 0 alors x=y2 donc σ(x)=σ(y)2 > 0.
Il en résulte de σ est croissante car si x > y x-y > 0 donc σ(x-y) > 0 d'où σ(x) > σ(y).
De sorte que si x est un réel non rationnel. Il suffit de construire une suite de rationnels gn croissante tendant vers x et une suite de rationnels hn décroissante tendant vers x. Alors σ est l'identité sur chacune des deux suites donc on a forcément σ(x)=x à cause de la variation de σ.
Une application f d'un K-espace vectoriel E dans lui-même est dite 'semi-linéaire' relativement à un automorphisme σ de K si elle vérifie :
f(x+y)=f(x)+f(y) ∀ (x,y) ∈ K2
f(λx)=σ(λ)f(x) ∀ x ∈ E et ∀ λ ∈ K
f: A → A est dite 'semi-affine' s'il existe une application semi-linéaire u : E → E (E espace vectoriel associé à A) telle que : f(M+x)=f(M)+u(x) pour tout point M et tout vecteur x.
Nous sommes maintenant en mesure d'énoncer une des formes du théorème fondamental de la géométrie affine.

Le théorème

Soit A un espace affine sur un corps K supposé de caractéristique différente de 2.
On suppose que la dimension (finie) de A est au moins égale à 2.
Dans ces conditions une bijection de A dans A conserve les alignements des systèmes de 3 points si et seulement si elle est semi-affine.
Nous aurons besoin pour cela de quelques résultats préliminaires (lemmes).
Une partie B de A est une variété linéaire si et seulement si à chaque fois qu'elle contient deux points elle contient la droite joignant ces deux points.
Il suffit en effet d'appliquer le résultat de cet exercice
Il résulte de ce qui précède que si X est une partie finie de A et si f est une bijection qui conserve les alignements alors si V(X) est la variété engendrée par X et V(f(X)) la variété engendrée par son image on a f(V(X))=V(f(X)).

En effet, par le théorème d'associativité des barycentres, tout point de V(X) peut être construit par alignements à partir des points de X.
Ceci est vrai en particulier si X est un système de points affinement indépendants de A supposé de dimension n, disons X={M0,M1, ...,Mn}. f(X)={f(M0), f(M1), ... ,f(Mn)} doit également être un système de n+1 points affinements indépendants de A, sinon f ne pourrait être bijective.
Le lemme suivant en découle rapidement :
Si B est une variété linéaire de dimension p de A et si f conserve les alignements alors f(B) est une variété de dimension p.

Soit en effet F le sous espace directeur de B. Choisissons une base de F { x 1 , x 2 , . . . , x p } , que nous complétons en une base de E, soit { x 1 , x 2 , . . . , x p , x p + 1 , . . . , x n }
Alors si on M0 est un point quelconque de B et si on pose Mi=M0+ x i
{M0,M1, ... ,Mn} sont n+1 points affinements indépendants de A et il en est de même de leurs images f(M0), f(M1), ... , f(Mn) en vertu de ce qui précède. On peut donc dire la même chose de f(M0), f(M1), ... , f(Mp), d'où la démonstration de notre nouveau lemme.
Voici maintenant un nouveau lemme :
Dans les hypothèses du théorème, toute application bijective qui conserve l'alignement transforme deux droites parallèles en deux droites parallèles.

Soient en effet D1 et D2 deux droites parallèles. Leurs images sont deux droites D'1 et D'2. La variété engendrée par D1 et D2 est un plan, donc également la variété engendrée par D'1 et D'2. En outre D1 et D2 étant sans point commun il en est forcément de même pour D'1 et D'2.
De là et de la caractérisation des parallélogrammes, nous tirons :
Dans les hypothèses du théorème, l'image par f d'un parallélogramme est un parallélogramme.
Soit maintenant O une origine quelconque dans A, tout revient à prouver que l'application u: OMO'M' est semi-linéaire relativement à un certain automorphisme σ de K. Comme d'habitude on a ici noté O'=f(O) et M'=f(M).
Montrons déjà l'additivité de u.

Soit x et y deux vecteurs. On suppose d'abord qu'ils sont non colinéaires. Dans ce cas la figure formée par les quatre points OACB est un parallélogramme si A=O+x B=O+y, C=x+y. Donc O'A'C'B' est aussi un parallélogramme. Nous en tirons que u(x+y)=x+y.
Si maintenant x et y sont colinéaires, faisons intervenir un vecteur z non colinéaire à x et à y. Soit alors t le vecteur x+y. t est encore aligné avec x et y. On peut écrire t=(x+z)+(y-z) . Les deux vecteurs x+z et y-zne peuvent d'après nos hypothèses être colinéaires. Nous en tirons donc que :
u(t)=u(x+z)+u(y-z).
Nous en tirons donc que u(t)=u(x)+u(z)+u(y)+u(-z). De sorte qu'il suffit maintenant de voir qu'on a u(-z)=-u(z).
Mais on fait la figure formée par les 4 points O+(x+z) , O+x-z,O-x+z, O-x-z est un parallélogramme de centre O. Son image est également un parallélogramme et le centre de ce parallélogarmme est O' car comme f conserve les alignements O' doit être à l'intersection des images des diagonales. Il en résulte bien que u(-z)=-u(z) et que u est additive.
Nous déterminons maintenant l'automorphisme σ par rapport auquel u sera semi-linéaire.
Pour tout vecteur x non nul et tout scalaire λ nous posons σx(λ)=u(λx)/u(x)
Nous définissons ainsi une application σx : K → K, dont nous allons montrer dans un premier temps qu'elle ne dépend pas de x.

Soient donc x et x deux vecteurs non nuls distincts supposées non colinéaires, de sorte que les droites d'origine O et de vecteurs directeurs x et y sont distinctes tout comme leurs images qui se coupent en O', comme on l'a vu plus haut.
Nous avons par additivité de u :
u ( λ ( x + y ) ) = σ x + y ( λ ) u ( x + y ) = σ x + y ( λ ) u ( x ) + σ x + y ( λ ) u ( y )
mais aussi :
u ( λ ( x + y ) ) = u ( λ x + λ y ) = u ( λ x ) + u ( λ y ) = σ x ( λ ) u ( x ) + σ y ( λ ) u ( y )
Mais comme les vecteurs u(x) et u(y) sont indépendants, nous pouvons en conclure :
σ x + y = σ x = σ y
Si les vecteurs x et y sont maintenant supposés colinéaires, choisissons un vecteur z non colinéaire à x et à y. Le même raisonnement que précédemment donne σ x = σ z et σ y = σ z donc σ x = σ y
Nous voyons maintenant que σx ne dépend pas de x. Nous la noterons simplement σ.
Il s'agit maintenant de montrer que σ est un automorphisme de K.

Montrons que σ est additive, en utilisant l'additivité de u :
Soit x un vecteur non nul, de sorte que u(x) est non nul également.
u((λ+μ)x)=σ(λ+μ)u(x)=u(λx)+u(μx)=(σ(λ)+σ(μ))x, d'où σ(λ+μ)=σ(λ)+σ(μ) puis u(x) n'est pas nul.
D'autre part :
u((λμ)x)=σ(λμ)u(x)=σ(λ)u(μx)=σ(λ)σ(μ)u(x) par application de la définition de σ et des axiomes de définition des espaces vectoriels.
Ce qui achève la démonstration du théorème.
Ce résultat admet en particulier le corollaire suivant :
Si K=ℝ et si dim(A)>1 alors toute bijection qui conserve l'alignement est affine.
Il suffit d'appliquer le résultat précédent conjointement avec le fait que le seul automorphisme de ℝ est l'identité.