2. Angoli e proiezioni ortogonali

(2.1) Definizione. Con il prodotto scalare definito su uno spazio euclideo non solo si possono misurare le distanze tra punti, e quindi in generale lunghezze, ma anche gli angoli (orientati) tra vettori, mediante la formula

\[ \cos \theta = \dfrac {\langle v, w \rangle }{|v| |w|}. \]

Questo consente di calcolare l’angolo, per esempio in $A$, di un triangolo $ABC$, moltiplicando (mediante prodotto scalare) i vettori $\overrightarrow {AB}$ e $\overrightarrow {AC}$.

Occorre notare che l’angolo è definito cosí a meno di segno (cioè non è l’angolo orientato) e a meno di $2k\pi $ (non c’è differenza tra angolo nullo e angolo giro). Non si tratta della definizione della geometria elementare di misura di un angolo.

(2.2) Nota. Ricordiamo che in uno spazio metrico $X$ la distanza tra un punto $p$ e un sottoinsieme $S\subset X$ è definita con l’estremo inferiore delle distanze $d(p,x)$, al variare di $p$ in $S$. In particolare, se $X$ è uno spazio euclideo, si può definire la distanza di un punto $p\in X$ da una retta, da un piano, ... , da un sottospazio affine $S\subset X$ proprio come l’estremo inferiore delle distanze tra punti di $S$ e il punto $p$.

(2.3) Definizione. Due sottospazi $U, W$ di uno spazio vettoriale euclideo $E$ si dicono ortogonali se per ogni $u\in U$, per ogni $v\in V$ i vettori $u$ e $v$ sono ortogonali, cioè il prodotto scalare $\langle u, v \rangle $ è nullo.

Sia $U\subset E$ un sottospazio, e $\ve _1,\ldots , \ve _ k$ una sua base ortonormale. La funzione

\[ \pi \from E \to U \]

definita da

\[ \pi (\vv ) = \sum _{j=1}^ k \langle \vv , \ve _ j \rangle \ve _ j \]

gode delle seguenti proprietà:

  1. $\pi $ è un omomorfismo di spazi vettoriali (cioè è lineare).

  2. $\vv \in U \implies \pi (\vv ) = \vv $.

  3. $\ker \pi = \{ \vv \in E : \forall \vu \in U, \langle \vu , \vv \rangle = 0 \} $

  4. $\ker \pi $ è il complemento ortogonale di $U$: $U \oplus \ker \pi = E$.

Si ha

\[ \begin{aligned} \pi (a \vv + b \vw ) & = \sum _{j=1}^ k \langle a\vv +b \vw , \ve _ j \rangle \ve _ j \\ & = \sum _{j=1}^ k (a\langle \vv ,\ve _ j\rangle +b \langle \vw , \ve _ j \rangle ) \ve _ j \\ & = a \sum _{j=1}^ k \langle \vv ,\ve _ j\rangle \ve _ j +b \sum _{j=1}^ k \langle \vw , \ve _ j \rangle \ve _ j \\ & = a \pi (\vv ) + b \pi (\vw ). \end{aligned} \]

Inoltre se $\vu \in U$, allora $\vu = \sum _{i=1}^ k u_ i \ve _ i$ e quindi

\[ \begin{aligned} \pi ( \vu ) & = \sum _{j=1}^ k \langle \vu , \ve _ j \rangle \ve _ j \\ & = \sum _{j=1}^ k \langle \sum _{i=1}^ k u_ i \ve _ i , \ve _ j \rangle \ve _ j \\ & = \sum _{j=1}^ k \sum _{i=1}^ k u_ i \langle \ve _ i , \ve _ j \rangle \ve _ j \\ & = \sum _{i=1}^ k u_ i \sum _{j=1}^ k \langle \ve _ i , \ve _ j \rangle \ve _ j \\ & = \sum _{i=1}^ k u_ i \ve _ i = \vu \end{aligned} \]

Infine, $\vv \in \ker \pi $ se e soltanto se $\langle \vv , \ve _ j \rangle = 0$ per ogni $j=1,\ldots , k$. Quindi se $\vu \in U$ e $\vv \in \ker \pi $, si ha $u= \sum _{j=1}^ k u_ j \ve _ j$ e quindi

\[ \begin{aligned} \langle \vv , \vu \rangle & = \langle \vv , \sum _{j=1}^ k u_ j \ve _ j \rangle \\ & = \sum _{j=1}^ k u_ j \langle \vv , \ve _ j \rangle \\ & = \sum _{j=1}^ k u_ j 0 = 0, \end{aligned} \]

e dunque $ \vv $ e $\vu $ sono ortogonali. Cioè se $\vv \in \ker \pi $, allora $\vv $ è ortogonale a tutti gli elementi di $U$. Viceversa, se $\vv $ è ortogonale a tutti gli elementi di $U$, in particolare è ortogonale ai $k$ elementi $\ve _1$, …, $\ve _ k$, e quindi $\pi (\vv ) = \boldsymbol {0}$. Per finire: per ogni $\vv \in E$ si ha

\[ \vv = \pi (\vv ) + ( \vv - \pi (\vv ) ), \]

dove $\vu = \pi (\vv ) \in U$ e

\[ \begin{aligned} \pi ( \vv - \pi (\vv ) ) & = \pi ( \vv - \vu ) \\ & = \pi (\vv ) - \pi (\vu ) \\ & = \vu - \vu = \boldsymbol {0}. \end{aligned} \]

Da questo segue che $U + \ker \pi = E$. La somma è diretta, perché se ci fosse $\vu \in U \cap \ker \pi $, si avrebbe $\pi (\vu ) = \boldsymbol {0}$ e anche $\pi (\vu ) = \vu $, da cui $\vu = \boldsymbol {0}$.

(2.4) Definizione. Sia $S\subset \EE ^ n$ un sottospazio affine di uno spazio affine euclideo con giacitura $\overrightarrow {S}\subset \RR ^ n$. Sia $W$ il complemento ortogonale di $\overrightarrow {S}$ in $\RR ^ n$, cioè l’unico sottospazio ortogonale a $\overrightarrow {S}$ tale che $\overrightarrow {S}\oplus W = \RR ^ n$. Allora per ogni $x\in \EE ^ n$ si può definire la proiezione su $S$ parallela al complemento ortogonale $W$, seguendo la definizione (2.10)

\[ p_{S,W}\from \EE ^ n \to S. \]

Questa proiezione si chiama proiezione ortogonale di $\EE ^ n$ su $S\subset \EE ^ n$. Dal momento che il complemento ortogonale $W$ esiste ed è unico, la proiezione è unicamente determinata da $S$.

(2.5) Sia $r\subset \EE ^ n$ una retta (sottospazio affine di dimensione $1$) di uno spazio affine euclideo con giacitura $\overrightarrow {S} = \langle \vv \rangle \subset \RR ^ n$ e $A$ un punto di $r$. Allora la proiezione di un punto $x\in \EE ^ n$ sulla retta $r$ si scrive come \[ p_ S(x) = A + \dfrac {\langle x-A, \vv \rangle }{\langle \vv , \vv \rangle } \vv . \]

Dim. La proiezione di $x$ su $r$ è un punto $Q$ di $r$ per cui $Q-x$ è ortogonale a $r$. È facile vedere che tale punto $Q$ è unico (altrimenti si formerebbe un triangolo con due lati di $90^\circ $). Dobbiamo trovare un punto $Q$ per cui \[ \langle x - Q , \vv \rangle = 0 \] e quindi, dato che $Q = A + t\vv $ per un certo $t\in \RR $, tale che $\langle x - (A+tv) , \vv \rangle = 0$, ovvero \[ \langle x-A , \vv \rangle - t \langle \vv , \vv \rangle = 0. \] Ma allora per $t=\dfrac {\langle x-A, \vv \rangle }{\langle \vv , \vv \rangle }$ ($v\neq 0$!) si ottiene il punto cercato \[ p_ S(x) = Q = A + \dfrac {\langle x-A, \vv \rangle }{\langle \vv , \vv \rangle } \vv \] come annunciato.
QED

(2.6) Definizione. Se $p_ S$ è la proiezione ortogonale

\[ p_ S\from \EE ^ n \to S\subset \EE ^ n \]

definita sopra, allora si può definire come in (2.11) l’isometria (i.e. trasformazione ortogonale)

\[ r_ S \from x \mapsto p_ S(x) + (p_ S(x) - x ), \]

chiamata riflessione attorno a $S$1. È una involuzione (cioè $r_ S^2$ è la trasformazione identica, l’identità) che fissa $S$.

(2.7) Sia $S\subset \EE ^ n$ un sottospazio affine di uno spazio affine euclideo, e $p\in \EE ^ n$ un punto non di $S$. Allora la distanza di $p$ da $S$ è uguale alla distanza di $p$ dall’unico punto $q$ di $S$ per cui il vettore $p-q$ è ortogonale a $S$ (cioè la proiezione ortogonale di $p$ su $S$ – dove $q$ è il punto di $S$ con minima distanza da $p$).

Dim. Supponiamo che la distanza di $p$ sulla sua proiezione $q$ sia maggiore di quella tra $p$ e un terzo punto $A$. Dal momento che $\overrightarrow {qp}$ per definizione è ortogonale a $S$, è ortogonale anche al vettore $\overrightarrow {qA}$, che appartiene a $\overrightarrow {S}$ (dato che sia $q$ che $A$ appartengono a $S$). Ma allora, visto che $\overrightarrow {Ap} = \overrightarrow {Aq} + \overrightarrow {qp}$, \[ \begin{aligned} d(A,p)^2 & = |\overrightarrow {Ap}|^2 \\ & = \langle \overrightarrow {Ap}, \overrightarrow {Ap} \rangle \\ & = \langle \overrightarrow {Aq} + \overrightarrow {qp}, \overrightarrow {Aq} + \overrightarrow {qp} \rangle \\ & = \langle \overrightarrow {Aq}, \overrightarrow {Aq} \rangle + \langle \overrightarrow {Aq}, \overrightarrow {qp} \rangle + \langle \overrightarrow {qp}, \overrightarrow {Aq} \rangle + \langle \overrightarrow {qp}, \overrightarrow {qp} \rangle \\ & = | \overrightarrow {Aq} |^2 + 0 + 0 + | \overrightarrow {qp} |^2 \\ & \geq |\overrightarrow {qp}|^2 \\ & = d(q,p)^2, \end{aligned} \] cioè $q$ realizza la minima distanza (è facile vedere che il minimo si ottiene per $|\overrightarrow {Aq}|^2 = 0$, cioè quando $A=q$).
QED

Ripetendo la dimostrazione del teorema (1.12), si può dimostrare il seguente teorema:

(2.8) Teorema. Se $S\subset \EE ^ n$ è un sottospazio affine passante per $A$, allora esiste un sottospazio vettoriale $W\subset \RR ^ n$ (il complemento ortogonale di $\overrightarrow {S}$ in $\RR ^ n$) per cui i punti di $S$ sono tutti e soli i punti $x$ di $\EE ^ n$ tali che $x-A$ è ortogonale a $W$. Se $S$ è un iperpiano (cioè un sottospazio di dimensione $n-1$ in $\EE ^ n$), allora la dimensione di $W$ è $1$, per cui i punti di $S$ sono tutti i punti tali che $x-A$ è ortogonale ad un vettore fissato non nullo $\vn $ di $W$ (che si può chiamare vettore normale a $S$): \[ S = \{ x \in \EE ^ n : \langle x - A , \vn \rangle = 0 \} . \]

(2.9) Nota. Dato che $\langle x - A , \vn \rangle = 0$ se e solo se $\langle x , \vn \rangle = \langle A, \vn \rangle $, ritorniamo a vedere che l’equazione di un iperpiano è

\[ a_1 x_2 + a_2 x_2 + ... + a_ n x_ n = b, \]

dove $b= \langle A, \vn \rangle $. Per sottospazi generici (cioè non solo di dimensione $n-1$, basta prendere una base del complemento ortogonale $W$ (e questi saranno vettori ortogonali a $S$) e, nello stesso modo, scrivere $S$ come luogo delle soluzioni di un sistema di equazioni.

(2.10) Esempio. Torniamo all’esempio (1.5): qual è il polinomio di grado $2$ a coefficienti reali che è più vicino (nel senso della distanza tra funzioni indotta dalla norma indotta dal prodotto scalare $\langle p,q\rangle = \int _0^1 p(t) q(t) \, dt$) alla funzione $e^ x$? Qual è quello di grado $n$?

Footnotes

  1. Di solito si chiama riflessione una trasformazione isometrica di questo tipo solo quando la dimensione di $S$ è uguale a $n-1$ – come se $S$ fosse uno specchio. Per esempio, se $S$ è un punto, quello che si trova è una inversione centrale, per cui la scelta del nome non sembrerebbe appropriata. Se $S$ è un punto e $n=2$ si ottiene la rotazione di $180^\circ $.