1. Mappe affini

(Cfr.)1

(1.1) Definizione. Siano $X$ e $Y$ due spazi affini sullo stesso campo $K$. Una funzione $f\from X \to Y$ si dice affine (anche, mappa affine o trasformatione affine) se per ogni $x\in X$ la funzione indotta sugli spazi vettoriali sottostanti $\overrightarrow {X}\to \overrightarrow {Y}$ definita da

\[ \vv \in \overrightarrow {X} \mapsto f(x+\vv ) - f(x) \in \overrightarrow {Y} \]

è lineare.

(1.2) Esempio. Se $X=Y=K=\RR $, allora le mappe affini sono le mappe che si possono scrivere come $x \mapsto ax + b$.

(1.3) Esempio. Se $f\from X \to Y$ è una mappa costante, allora è affine. L’identità è anche una mappa affine.

(1.4) Esempio. Tutte le traslazioni $x\mapsto x+\vv $ sono mappe affini.

(1.5) Una funzione $f\from X \to Y$ tra spazi affini su campo $K$ è una mappa affine se esiste $x_0\in X$ per cui la funzione \[ L_{x_0}\from \vv \in \overrightarrow {X} \mapsto f(x_0+\vv ) - f(x_0) \in \overrightarrow {Y} \] è lineare. In questo caso la funzione $L_{x}$ non dipende da $x$ e si indica con $\overrightarrow {f}$.

Dim. Dobbiamo dimostrare che per ogni $x\in X$ la funzione indotta $\vv \mapsto f(x+\vv ) - f(x)$ è lineare $\overrightarrow {X} \to \overrightarrow {Y}$. Sia dunque $x\in X$ arbitrario. Supponiamo che esista $x_0$ come nell’enunciato, e quindi sia $L\from \overrightarrow {X} \to \overrightarrow {Y}$ la funzione lineare (omomorfismo di spazi vettoriali) definita da \[ L(\vv ) = \vv \mapsto f(x_0+\vv ) - f(x_0). \] Dal momento che per ogni $v\in \overrightarrow {X}$ \[ f( x+ \vv ) - f(x) = f\left( x_0 + \overrightarrow {x_0x} +\vv \right) - f\left( x_0 + \overrightarrow {x_0x} \right), \] si ha \[ \begin{aligned} f( x+ \vv ) - f(x) & = f\left( x_0 + \overrightarrow {x_0x} + \vv \right) - f\left( x_0 \right) \\ & - \left( f\left( x_0 + \overrightarrow {x_0x} \right) - f\left( x_0 \right) \right) \\ & = L( \overrightarrow {x_0x} + \vv ) - L( \overrightarrow {x_0x} ) \\ & = L( \overrightarrow {x_0x} ) + L(\vv ) - L(\overrightarrow {x_0x} ) \\ & = L(v)\\ \end{aligned} \] che è quindi lineare in $\vv $.
QED

(1.6) Definizione. Una mappa affine $f\from X \to Y$ tra spazi affini su campo $K$ si dice isomorfismo affine se è una mappa affine biunivica. Se $X=Y$, allora si dice automorfismo affine o anche affinità.

(1.7) Nota. Se $f\from X \to Y$ è biunivoca, allora deve essere biunivoca anche l’applicazione lineare associata $\overrightarrow {f} \from \overrightarrow {X} \to \overrightarrow {Y}$. Ma allora $\overrightarrow {f}$ è invertibile, e quindi anche l’inversa $f^{-1} \from Y \to X$ è una mappa affine (esercizio!). Dato che l’identità è una affinità, la composizione di affinità è una affinità, e l’inversa di affinità è una affinità, allora l’insieme di tutte le affinità costituisce un gruppo rispetto alla composizione.

(1.8) Definizione. Il gruppo di tutte le affinità su uno spazio affine $X$ (con campo $K$ sottostante) si indica con $GA(X)$.

(1.9) Teorema. Sia $X$ uno spazio affine su campo $K$ di dimensione $n$. La scelta di un riferimento affine induce un isomorfismo di spazi affini $X \cong \AA ^ n(K)$. Quindi due spazi affini su campo $K$ con la stessa dimensione sono sempre tra loro isomorfi.

Dim. Se $x_0$, $x_1$, ... $x_ n$ è un riferimento affine per $X$, allora si può definire la mappa $f\from \AA ^ n(K) \to X$ definita da \[ (\lambda _1, ... , \lambda _ n) \mapsto x_0 + \sum _{i=1}^ n \lambda _ i \overrightarrow {x_0x_ i} \in X. \] Non è difficile verificare che $f$ è una mappa affine. Dato che i punti $x_0$, ... , $x_ n$ costituiscono un riferimento affine, la giacitura \[ \langle \overrightarrow {x_0x_1}, ... , \overrightarrow {x_0x_ n} \rangle \] ha dimensione $n$, e quindi la funzione lineare indotta $f(\boldsymbol {0}+\vv ) - f(\boldsymbol {0})$ è un isomorfismo di spazi vettoriali. Da cui segue che $f$ è bijettiva.
QED

(1.10) Teorema. Ogni mappa affine $f\from \AA ^ d(K) \to \AA ^ n(K)$ (nel sistema di riferimento affine standard) si scrivere in modo unico come \[ f(x) = Ax +b = A(x-0) + (b-0), \] dove $A$ è una matrice $n\times d$ e $b$ un vettore di $K^ n$.

Dim. Basta considerare il punto $z=(0, ... ,0) \in \AA ^ d(K)$. Per definizione la mappa $f(z+\vv ) - f(z)$ è lineare, e dunque esiste $A\from K^ d \to K^ n$ (rappresentata come matrice nella base standard) tale che $f(z+\vv ) - f(z) = A\vv $. Ponendo $f(z) = b-0$ si ha \[ f(z+\vv ) = A\vv + b, \] cioè $f(x)=Ax + b$ in coordinate di $K^ d$.
QED

(1.11) Corollario. Sia $X$ uno spazio affine di dimensione $n$ e $Y$ uno spazio affine di dimensione $d$. Se $p_0,p_1, ... ,p_ n$ sono un riferimento affine per $X$, allora per ogni scelta di $n+1$ punti $q_0,q_1, ... , q_ n$ in $Y$ esiste una unica mappa affine $f\from X \to Y$ tale che $f(p_ i) = q_ i$ per ogni $i=0, ... , n$.

Dim. Sia $X\cong \AA ^ n(K)$ l’isomorfismo indotto dalla scelta del riferimento affine. Il riferimento corrispondente nello spazio affine $\AA ^ n(K)$ è $0,e_1, ... ,e_ n$, dove gli $e_ i$ sono i versori canonici di $K^ n$. Scelto un qualsiasi riferimento affine per $Y$, l’applicazione affine cercata si può scrivere come $f(x) = Ax + b$, dove $A$ è la matrice che ha per colonne le coordinate dei vettori $q_1-q_0$, ... , $q_ n-q_0$, mentre il termine noto $b$ è il vettore colonna delle coordinate di $q_0$. Infatti, se $A_{i,j}$ indicano le componenti di $A$ e $b_ i$ le componenti di $b$, si ha (nelle coordinate scelte) per ogni $i=1 ... n$ \[ f(p_ i) = A e_ i + b = \begin{bmatrix} A_{1,i} + b_1 \\ A_{2,i} + b_2 \\ \vdots \\ A_{d,i} + b_ d \\ \end{bmatrix} \] e $f(p_0) = b$. Questo determina i coefficienti $A_{i,j}$ in modo unico, come indicato sopra.
QED

(1.12) Teorema.[Equazioni cartesiane] Sia $S\subset X = \AA ^ n(K)$ un sottospazio affine di dimensione $d$. Allora esiste una mappa affine e suriettiva $f\from X \to \AA ^{n-d}(K)$ per cui \[ S = \{ x \in X : f(x) = 0 \} . \] Viceversa, per ogni mappa affine suriettiva $f\from X \to \AA ^{n-d}(K)$ l’insieme $ \{ x \in X : f(x) = 0 \} $ è un sottospazio affine di $X$ di dimensione $d$.

Dim. Sia $W$ la giacitura di $S$ e $P$ un punto di $S$, in modo tale che

\[ S = P + W. \]

È sempre possibile trovare un completamento $W’$ di $W$ in $\overrightarrow {X}$, cioè un sottospazio vettoriale $W’$ di $\overrightarrow {X}$ tale che

\[ \overrightarrow {X} = W \oplus W’. \]

Se $\dim (W) = d$, allora $\dim (W’) = n-d$. Per ogni $x\in X$ il vettore $x-P$ si scrive in modo unico come

\[ x-P = w + w’ \]

con $w\in W$ e $w’\in W’$, ed è possibile definire la proiezione (lineare) $L\from \overrightarrow {X} \to W’$ tale che $L(w+w’)=w’$. Il nucleo di $L$ è $\ker L = W$. Scelta una base per $W’$, è dato un isomorfismo $W’ \cong K^{n-d}$. Si consideri quindi (mediante l’identificazione naturale tra $\AA ^{n-d}(K)$ e $K^{n-d}$) la funzione $f\from X \to \AA ^{n-d}(K)$ definita da

\[ f(x) = 0 + L(x-P) \in \AA ^{n-d}(K) \]

(dove $0$ appartiene a $K^{n-d}$). È facile vedere che è una mappa affine e che

\[ \begin{aligned} f(x) = 0 & \iff x-P \in W \\ & \iff x \in P + W \\ & \iff x \in S,\\ \end{aligned} \]

e dunque $S = \{ x\in X : f(x) = 0 \} $.

Viceversa, sia $f\from X \to \AA ^{n-d}(K)$ una mappa affine e suriettiva. Sia $S=\{ x\in X : f(x) = 0 \} $ e $x_0\in S$. L’applicazione $L\from \overrightarrow {X} = K^ n \to K^{n-d}$ definita da $Lv = f(x_0+v) - f(x_0)$ è lineare e suriettiva, ha quindi un nucleo $W\subset K^ n$ di dimensione $n - (n-d) = d$. Dal momento che $x_0\in S$, per definizione $f(x_0) = 0$, e quindi un elemento $x_0 + v$ appartiene a $S$ se e solo se

\[ f(x_0 + v ) = 0 \iff L v = 0 \iff v \in W, \]

e quindi $S = x_0 + W$, dove $W$ ha dimensione $d$.

QED

(1.13) Esempio. In dimensione $2$ e $3$, si ritrovano le equazioni cartesiane delle rette in $\AA ^2(\RR )$ ($ax + by + c = 0$ ), dei piani in $\AA ^3(\RR )$ ($ax + by + cz + d = 0 $) e delle rette in $\AA ^3(\RR )$ (viste come zeri di una funzione $\AA ^3(\RR ) \to \AA ^2(\RR )$.

\[ \begin{cases} ax + by + cz + d = 0 \\ a’x + b’y + c’z + d’ = 0 \\ \end{cases} \]


(1.14) Proposizione. Se $f\from X \to Y$ è una mappa affine, allora l’immagine di una retta è una retta (o un punto). Più in generale, l’immagine di un sottospazio affine di $X$ è un sottospazio affine di $Y$ e la controimmagine di un sottospazio affine di $Y$ è un sottospazio affine di $X$.

Dim. Sia $S\subset X$ un sottospazio affine con giacitura $\overrightarrow {S}$ e passante per $p\in X$: $S=p + \overrightarrow {S}$. Allora, se $\overrightarrow {f}\from \overrightarrow {X} \to \overrightarrow {Y}$ denota l’omomorfismo indotto da $f$ ($\overrightarrow {f}(v) = f(x_0+v)-f(x_0)$), si ha \[ \begin{aligned} f(S) & = \{ f(p+s) : s\in \overrightarrow {S} \} \\ & = \{ f(p+s) - f(p) + f(p) : s\in \overrightarrow {S} \} \\ & = \{ \overrightarrow {f}(s) + f(p) : s\in \overrightarrow {S} \} \\ & = \{ f(p) + w : w\in \overrightarrow {f}(\overrightarrow {S})\subset \overrightarrow {Y} \} . \end{aligned} \] Dal momento che $\overrightarrow {f}$ è lineare, l’immagine $\overrightarrow {f}(\overrightarrow {S}) \subset \overrightarrow {Y}$ è un sottospazio vettoriale, da cui segue la tesi. In modo analogo si dimostra la seconda parte (vedi esercizio 8.20).
QED

(1.15) Proposizione. Sia $f\from X \to Y$ una mappa affine. Allora $f$ manda terne di punti allineati in terne di punti allineati. Non solo: se $A,B,C \in X$ hanno rapporto $\rho = \overrightarrow {AC}:\overrightarrow {AB}$ , allora se $A’=f(A)$, $B’=f(B)$ e $C’=f(C)$ si ha \[ \overrightarrow {A’C’} : \overrightarrow {A’B’} = \rho , \] cioè $f$ conserva il rapporto tra terne di punti affini.

Dim. Con una scelta di riferimenti affini, sia $f\from \AA ^ n(K) \to \AA ^ m(K)$ definita da $f (\vx ) = F \vx + \vb $, con $F$ matrice e $\vb $ vettore. Dato che \[ C = A + \rho (B-A), \] si ha \[ \begin{aligned} C’ & = F ( A + \rho (B-A) ) + \vb \\ & = FA + \vb + \rho (FB - FA) \\ & = (FA+\vb ) + \rho ( FB + \vb - FA - \vb ) \\ & = A’ + \rho (B’ - A’), \end{aligned} \] cioè $C’-A’ = \rho (B’-A’)$.
QED

La seguente proposizione dà la proposizione inversa dalla proposizione (1.15).

(1.16) Proposizione. Se $f\from X \to Y$ è una bijezione tra due spazi affini su campo $K$ (di caratteristica $\neq 2$2) che conserva il rapporto di terne di punti allineati, cioè tale che per ogni $A,B,C \in X$ allineati si ha che $A’,B’,C’$ sono allineati e \[ \overrightarrow {A’C’}:\overrightarrow {A’B’} = \overrightarrow {AC}:\overrightarrow {AB} \] con $f(A)=A’$, $f(B)=B’$ e $f(C)=C’$, allora $f$ è una mappa affine.

Dim. La funzione $f$ manda rette in rette (per definizione). Sia $O\in X$ un punto qualsiasi, fissato, cui corrisponde la funzione

\[ \overrightarrow {f}(\vv ) = f(O+\vv ) - f(O) \]

con $\vv \in \overrightarrow {X}$. Dobbiamo dimostrare che $\overrightarrow {f}$ è una funzione lineare, cioè un omomomorfismo di spazi vettoriali $\overrightarrow {X} \to \overrightarrow {Y}$ (cioè che è additiva e omogenea di grado $1$). Siano $\alpha \in K$ uno scalare e $\vv \in \overrightarrow {X}$ un vettore arbitrari. Allora $O$, $O+\vv $ e $O+\alpha \vv $ sono allineati, e il rapporto è

\[ ( O+\alpha \vv -O ) : ( O+\vv - O) = \alpha , \]

quindi deve essere

\[ (f(O+\alpha \vv ) - f(O) ): ( f(O+\vv ) - f(O) ) = \alpha , \]

cioè

\[ f(O+\alpha \vv ) = f(O) + \alpha ( f(O+\vv )-f(O), \]

da cui segue che

\[ \overrightarrow {f}(\alpha \vv ) = f(O+\alpha \vv ) - f(O) = \alpha (f(O+\vv )-f(O) ) = \alpha \overrightarrow {f}(\vv ). \]

Se $\vv ,\vw \in \overrightarrow {X}$ sono due vettori qualsiasi, allora $O+2\vv $, $O+\vv +\vw $ e $O+2\vw $ sono tre punti allineati di $X$, con rapporto $2$:

\[ \left( (O+2\vw ) - (O+2\vv ) \right) : \left( (O+\vv +\vw ) - ( O+2\vv ) \right) = 2 \]\[ \iff O+2\vw = (O+2\vv ) + 2 ( (O+\vv +\vw ) - (O+2\vv )). \]

Lo stesso rapporto devono avere le loro immagini:

\begin{multline*} f(O+2\vw ) - f(O+2\vv ) = 2 \left( f(O+\vv +\vw ) - f(O+2\vv ) \right), \\ \iff f(O+2\vw ) -f(O) - \left( f(O+2\vv ) - f(O) \right) \\ = 2 \left( f(O+\vv +\vw ) -f(O) - \left( f(O+2\vv ) - f(O)\right) \right), \\ \iff \overrightarrow {f}(2\vw ) - \overrightarrow {f}(2\vv ) = 2 \overrightarrow {f}(\vv +\vw ) - 2 \overrightarrow {f}(2\vv ) \\ \iff 2\overrightarrow {f}(\vv +\vw ) = \overrightarrow {f}(2\vv ) + \overrightarrow {f}(2\vw ) = 2 \overrightarrow {f}(\vv ) + 2 \overrightarrow {f}(\vw ) \\ \iff \overrightarrow {f}(\vv +\vw ) = \overrightarrow {f}(\vv ) + \overrightarrow {f}(\vw ), \end{multline*}

cioè $\overrightarrow {f}$ è lineare, e quindi $f$ è una mappa affine.

QED

(1.17) Teorema.[Teorema fondamentale della geometria affine] Sia $d\geq 2$. Se $f\from \AA ^ d(\RR ) \to \AA ^ d(\RR )$ è una bijezione che manda terne di punti allineati in terne di punti allineati, allora $f$ è una affinità.

Dim. Si veda l’esercizio 8.26.
QED

(1.18) Nota. Cosa succede in $\AA ^ d(\KK )$ con $\KK \neq \RR $? Le cose si complicano, perché la dimostrazione (per passi) data nell’esercizio 8.26 non regge. L’idea della dimostrazione per $K=\RR $ è infatti di costruire una funzione $\varphi \from K \to K$ (che viene chiamata automorfismo del campo), e mostrare che è l’identità. Potrebbe capitare che un campo abbia automorfismi non banali (come $z\mapsto \overline{z}$ in $\CC $), per cui non solo la dimostrazione non regge, ma l’enunciato del teorema è falso. Consideriamo infatti $K=\CC $, e $f\from \AA ^2(K) \to \AA ^2(K)$ definita ponendo

\[ f(x,y) = (\overline{x},\overline{y}). \]

Tre punti $A=(a_1,a_2)$, $B=(b_1,b_2)$, $C=(c_1,c_2)$ sono allineati se e soltanto se

\[ \det \begin{bmatrix} b_1-a_1 & c_2-a_1 \\ b_2-a_2 & c_2 - a_2 \end{bmatrix} = 0, \]

e quindi $f$ manda terne di punti allineati in terne di punti allineati. Ma non è un’affinità: l’applicazione $L: \CC ^2 \to \CC ^2$ definita da $f(x_0+\vv ) - f(x_0)$, cioè

\[ L(v_1,v_2) = (\overline{v}_1 ,\overline{v}_2) \]

non è $\CC $-lineare: per esempio

\[ L(i,0) = (-i,0) \neq (i,0) = i L(1,0) = L(i,0). \]



Footnotes

  1. Cfr: Nacinovich, Cap V, §3 [2].
  2. Serve davvero questa ipotesi?