Dispense AnalisiFunzionale 09

Post on 10-Dec-2015

18 views 3 download

description

analisi

transcript

INTRODUZIONE ALLA

ANALISI FUNZIONALE

Dispensa del Corso di

Metodi Matematici della Fisica(versione ridotta, gennaio 2009)

Prof. Marco Boiti

a.a. 2008-2009

2

Indice

1 Spazi Metrici 51.1 Insiemi Aperti. Insiemi Chiusi. Intorni. . . . . . . . . . . . . . . . . . . . . . 51.2 Convergenza. Successioni di Cauchy. Completezza. . . . . . . . . . . . . . . . 81.3 Completamento di uno Spazio metrico . . . . . . . . . . . . . . . . . . . . . . 12

2 Spazi Normati. Spazi di Banach 152.1 Spazio Vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2 Spazio Normato. Spazio di Banach . . . . . . . . . . . . . . . . . . . . . . . . 182.3 Ulteriori Proprieta degli Spazi Normati . . . . . . . . . . . . . . . . . . . . . . 202.4 Spazi Normati Finito Dimensionali e Sottospazı . . . . . . . . . . . . . . . . . 202.5 Compattezza e Dimensioni Finite . . . . . . . . . . . . . . . . . . . . . . . . . 242.6 Operatori Lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.7 Spazi Lineari di Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.8 Operatori Lineari Limitati e Continui . . . . . . . . . . . . . . . . . . . . . . 302.9 Funzionali Lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.10 Operatori Lineari e Funzionali su Spazi Finito Dimensionali . . . . . . . . . . 382.11 Spazi Normati di Operatori. Spazio Duale . . . . . . . . . . . . . . . . . . . . 41

3 Spazi con Prodotto Scalare. Spazi di Hilbert 453.1 Breve Orientamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453.2 Spazi con Prodotto Scalare, Spazio di Hilbert . . . . . . . . . . . . . . . . . . 463.3 Ulteriori Proprieta degli Spazi con Prodotto Scalare . . . . . . . . . . . . . . 483.4 Definizione Equivalente di Spazio con Prodotto Scalare . . . . . . . . . . . . . 503.5 Completamento di uno Spazio con Prodotto Scalare . . . . . . . . . . . . . . 523.6 Complemento Ortogonale e Somma Diretta . . . . . . . . . . . . . . . . . . . 523.7 Insiemi e Successioni Ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . 583.8 Serie Collegate a Successioni e Insiemi Ortonormali . . . . . . . . . . . . . . . 613.9 Basi Ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643.10 Rappresentazione di Funzionali su Spazi di Hilbert . . . . . . . . . . . . . . . 683.11 Operatori Aggiunti di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.12 Operatori Autoaggiunti, Unitari e Normali . . . . . . . . . . . . . . . . . . . . 75

4 Teoremi per gli Spazi Normati e di Banach 794.1 Breve Orientamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.2 Lemma di Zorn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.3 Alcune Applicazioni del Lemma di Zorn . . . . . . . . . . . . . . . . . . . . . 804.4 Teorema di Hahn–Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 814.5 Operatore Duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

3

4 INDICE

4.6 Spazi Riflessivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 904.7 Teorema della Categoria e della Uniforme Limitatezza . . . . . . . . . . . . . 924.8 Convergenza Forte e Debole . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.9 Convergenza di Successioni di Operatori e di Funzionali . . . . . . . . . . . . 984.10 Teorema dell’Applicazione Aperta . . . . . . . . . . . . . . . . . . . . . . . . 101

5 Teoria Spettrale degli Operatori Lineari 1075.1 Teoria Spettrale in Spazi Normati Finito Dimensionali . . . . . . . . . . . . . 1075.2 Concetti Basilari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1105.3 Proprieta Spettrali degli Operatori Lineari Limitati . . . . . . . . . . . . . . . 1105.4 Ulteriori Proprieta del Risolvente e dello Spettro . . . . . . . . . . . . . . . . 1145.5 Uso dell’Analisi Complessa nella Teoria Spettrale . . . . . . . . . . . . . . . . 117

Capitolo 1

Spazi Metrici

Uno spazio metrico e un insieme X dotato di una metrica. La metrica associa ad ogni coppiadi elementi (punti) di X una distanza. La metrica e definita assiomaticamente, gli assiomiessendo suggeriti da alcune proprieta semplici della distanza, cosı com’e familiarmente defi-nita fra punti della retta reale R o del piano complesso C. Si tratta come mostrano alcuniesempi basilari di un concetto molto generale. Un’importante proprieta aggiuntiva che unospazio metrico puo possedere e la completezza. Un altro concetto di interesse teorico e pra-tico e la separabilita di uno spazio metrico. Gli spazi metrici separabili sono piu semplici diquelli non separabili.

1.1 Definizione (Spazio Metrico, Metrica)Uno spazio metrico e una coppia (X, d), dove X e un insieme e d una metrica su X (odistanza su X), cioe una funzione definita su X ×X tale che per ogni x, y, z ∈ X si abbia

M1 d e a valori reali, finito e non negativo.

M2 d(x, y) = 0 se e solo se x = y.

M3 d(x, y) = d(y, x) (Simmetria)

M4 d(x, y) ≤ d(x, z) + d(z, y) (Disuguaglianza Triangolare)

Alcuni termini di uso corrente sono i seguenti. X e normalmente chiamato l’insiemesottostante a (X, d). I suoi elementi sono chiamati punti. Per x, y fissati il numero nonnegativo d(x, y) si chiama distanza fra x e y. Le proprieta da (M1) a (M4) sono gli assio-mi della metrica. Il nome “disuguaglianza triangolare” e preso a prestito dalla geometriaelementare.

Un sottoinsieme (Y, d) di (X, d) si ottiene prendendo un sottoinsieme Y ⊂ X erestringendo d a Y × Y ; allora la metrica su Y e data dalla restrizione

d = d|Y×Y .

d si chiama la metrica indotta su Y da d.

1.1 Insiemi Aperti. Insiemi Chiusi. Intorni.

V’e un considerevole numero di concetti ausiliari che giocano un ruolo in connessione congli spazi metrici. Quelli di cui avremo bisogno sono inclusi in questa sezione. Percio questa

5

6 CAPITOLO 1. SPAZI METRICI

sezione contiene molti concetti, ma il lettore notera che molti di loro divengono familiariquando vengono applicati agli spazi euclidei.

Consideriamo dapprima alcuni importanti sottoinsiemi di un dato spazio metrico X =(X, d).

1.2 Definizione (Palla e Sfera)Dato un punto x0 ∈ X ed un numero reale r > 0 definiamo tre tipi di insiemi

(a) B(x0; r) = {x ∈ X|d(x, x0) < r} (Palla Aperta)

(b) B(x0; r) = {x ∈ X|d(x, x0) ≤ r} (Palla Chiusa)

(c) S(x0; r) = {x ∈ X|d(x, x0) = r} (Sfera)

In tutti e tre i casi x0 e chiamato il centro ed r il raggio.Attenzione. Lavorando con gli spazi metrici e assai utile utilizzare una terminologia

analoga a quella della geometria Euclidea. Tuttavia bisogna essere coscienti di quanto siapericoloso assumere che palle e sfere in uno spazio metrico arbitrario soddisfino alle medesimeproprieta soddisfatte da palle e sfere in R3. Ad esempio una possibile proprieta inusuale eche una sfera puo essere vuota. Un’altra possibile proprieta inusuale sara citata piu in la.

1.3 Definizione (Insiemi Aperti, Insiemi Chiusi)Un sottoinsieme M di uno spazio metrico X e detto aperto se contiene una palla centratain ciascuno dei suoi punti. Un sottoinsieme K e detto chiuso se il suo complemento (in X)e aperto, cioe se KC = X −K e aperto.

La dizione aperta e chiusa utilizzata nella definizione precedente e coerente con questadefinizione di insieme aperto e chiuso. Infatti, utilizzando la diseguaglianza triangolare, efacile vedere che per ogni punto x1 ∈ B(x0; r) la palla B(x1; r1) centrata in x1 e di raggior1 = r−d(x1, x0) e contenuta in B(x0; r) e quindi B(x0; r) e un insieme aperto. Che B(x0; r)sia chiuso si dimostra per assurdo. Sia infatti per assurdo il complemento di B(x0; r) nonaperto. Allora esiste ameno un punto x1 esterno a B(x0; r), ossia per cui d(x1, x0) > r, taleche ogni palla centrata in x1 contiene almeno un punto x ∈ B(x0; r). Consideriamo ora lapalla B(x1; r1) centrata in x1 di raggio r1 = d(x1, x0) − r. Per l’ x comune a B(x0; r) eB(x1; r1) abbiamo d(x1, x0) ≤ d(x1, x) + d(x, x0) < r1 + r = d(x1, x0), che e impossibile.

Una palla aperta B(x0; ε) di raggio ε e spesso chiamata un ε–intorno di x0. Per unintorno di x0 si intende un qualunque sottoinsieme di X che contiene un ε–intorno di x0.

Vediamo direttamente dalla definizione che ciascun intorno di x0 contiene x0; in altreparole x0 e un punto di ciascuno dei suoi intorni. Se N e un intorno di x0 e N ⊂ M, alloraanche M e un intorno di x0.

Chiamiamo x0 un punto interno di un insieme M ⊂ X se M e un intorno di x0.L’interno di M e l’insieme di tutti i punti interni a M e puo essere indicato con M0 o conInt(M). Int(M) e aperto ed e l’insieme aperto piu grande contenuto in M.

Non e difficile mostrare che la collezione di tutti i sottoinsiemi aperti di X, che possiamochiamare T , ha le seguenti proprieta

T1 ∅ ∈ T , X ∈ T .

T2 L’unione di membri di T e un membro di T .

T3 L’intersezione di un numero finito di membri di T e un membro di T .

1.1. INSIEMI APERTI. INSIEMI CHIUSI. INTORNI. 7

Dimostrazione. (T1) segue dall’osservazione che ∅ non ha elementi e, ovviamente, X e aper-to. Proviamo (T2). Un punto qualunque x dell’unione U degli insiemi aperti appartiene ad(almeno) uno di questi insiemi, sia M, ed M contiene una palla B di x poiche M e aperto.Allora B ⊂ U per definizione di unione. Cio prova (T2). Infine se y e un punto qualunquedell’intersezione degli insiemi aperti M1, · · · ,Mn allora ciascun Mj contiene una palla di ye la piu piccola di queste palle e contenuta nell’intersezione. Cio prova (T3).

Osserviamo che le proprieta da (T1) a (T3) sono cosı fondamentali che vengono di normainserite in un contesto piu generale. Precisamente si definisce come uno spazio topologico(X, T ) un insieme X ed una collezione T che soddisfa gli assiomi da (T1) a (T3). L’insiemeT e chiamato una topologia per X. Da questa definizione segue che

Uno spazio metrico e uno spazio topologico.Gli insiemi aperti giocano anche un ruolo in connessione con le applicazioni continue,

dove la continuita e una naturale generalizzazione della continuita conosciuta dall’analisi ede definita come segue.

1.4 Definizione (Applicazione Continua)Siano X = (X, d) e Y = (Y, d) due spazi metrici. Un’applicazione T : X → Y e dettacontinua nel punto x0 ∈ X se per ogni ε > 0 v’e un δ > 0 tale che

d(Tx, Tx0) < ε per ogni x che soddisfa a d(x, x0) < δ.

T e detta continua se e continua in ogni punto di X.

E importante ed interessante che le applicazioni continue possano essere caratterizzatein termini di insiemi aperti come segue.

1.5 Teorema (Applicazioni Continue)Un’applicazione T di uno spazio metrico X in uno spazio metrico Y e continua se e solo sel’immagine inversa di un qualunque sottoinsieme aperto di Y e un sottoinsieme aperto diX.

Dimostrazione. (a) Supponiamo che T sia continua. Sia S ⊂ Y aperto ed S0 l’immagineinversa di S. Se S0 = ∅ e aperto. Sia S0 6= ∅. Per un qualunque x0 ∈ S0 sia y0 = Tx0. PoicheS e aperto contiene un ε–intorno N di y0. Poiche T e continua x0 ha un δ–intorno N0 chee applicato in N. Poiche N ⊂ S abbiamo che N0 ⊂ S0 cosı che S0 e aperto perche x0 ∈ S0

era arbitrario.(b) Viceversa assumiamo che l’immagine inversa di ogni insieme aperto in Y sia un

insieme aperto in X. Allora per ogni x0 ∈ X e qualunque ε–intorno N di Tx0 l’immagineinversa N0 di N e aperta, poiche N e aperto, e N0 contiene x0. Quindi anche N0 contieneun δ–intorno di x0 che e applicato in N poiche N0 e applicato in N. Di conseguenza, perdefinizione, T e continua in x0. Poiche x0 ∈ X era arbitrario ne segue che T e continua.

Introduciamo ora due altri concetti che sono collegati. Sia M un sottoinsieme di unospazio metrico X. Allora un punto x0 di X (che puo o puo non essere un punto di M) echiamato un punto di accumulazione di M (o punto limite di M ) se ogni intorno di x0

contiene almeno un punto y ∈ M distinto da x0. L’insieme costituito dai punti di M e daipunti di accumulazione di M e chiamato la chiusura di M ed e indicato con

M.

L’insieme M e chiuso, perche se non lo fosse il suo complemento non sarebbe aperto econterebbe quindi almeno un punto di accumulazione di M . Inoltre, allo stesso modo, simostra che M e il piu piccolo insieme chiuso che contiene M .

8 CAPITOLO 1. SPAZI METRICI

Prime di procedere menzioniamo un’altra proprieta inusuale delle palle in uno spaziometrico. Mentre in R3 la chiusura B(x0; r) di una palla aperta B(x0; r) e la palla chiusaB(x0; r), in un generico spazio metrico cio puo non essere valido.

Usando il concetto di chiusura vogliamo dare una definizione che risultera di particolareimportanza nel seguito.

1.6 Definizione (Insieme Denso, Spazio Separabile)Un sottoinsieme M di uno spazio metrico X e detto denso in X se

M = X.

X e detto separabile se ha un sottoinsieme numerabile che e denso in X.

Quindi se M e denso in X ogni palla in X, per quanto piccola, conterra punti di M ; o,in altre parole, non c’e punto x ∈ X che abbia un intorno che non contiene punti di M.

Vedremo nel seguito che gli spazi metrici separabili sono alquanto piu semplici di quellinon separabili.

1.2 Convergenza. Successioni di Cauchy. Completezza.

Sappiamo che le successioni di numeri reali giocano un ruolo importante in analisi ed e lametrica di R che permette di definire il concetto basilare di convergenza di una tale succes-sione. Lo stesso vale per le successioni di numeri complessi; in questo caso dobbiamo usarela metrica del piano complesso. In uno spazio metrico arbitrario X = (X, d) la situazione eassai simile, cioe possiamo considerare una successione (xn) di elementi x1, x2, · · · di X edusare la metrica d per definire la convergenza in maniera analoga a quella dell’analisi.

1.7 Definizione (Convergenza di una Successione, Limite)Una successione (xn) in uno spazio metrico X = (X, d) e detta convergere od essereconvergente se v’e un x ∈ X tale che

limn→∞

d(xn, x) = 0.

x e chiamato il limite di (xn) e si scrive

limn→∞

xn = x

o semplicementexn → x.

Diciamo che (xn) converge a x o ammette il limite x. Se (xn) non e convergente si dice chee divergente.

Come e stata usata la metrica d in questa definizione? d ha fornito la successione dinumeri reali an = d(xn, x) la cui convergenza definisce quella di (xn). Quindi se xn → x,dato un ε > 0, esiste un N = N(ε) tale che tutti gli xn con n > N giacciono in un ε–intornoB(x; ε) di x.

Per evitare incomprensioni osserviamo che il limite di una successione convergente deveessere un punto dello spazio X.

Mostriamo ora che due proprieta delle successioni convergenti (unicita del limite e li-mitatezza), che risultano familiari dall’analisi, si mantengono in questo contesto molto piugenerale.

1.2. CONVERGENZA. SUCCESSIONI DI CAUCHY. COMPLETEZZA. 9

Chiamiamo un sottoinsieme non vuoto M ⊂ X un insieme limitato se il suo diametro

δ(M) = supx,y∈M

d(x, y)

e finito. Chiamiamo una successione (xn) in X una successione limitata se l’insieme deisuoi punti e un sottoinsieme limitato di X.

Ovviamente se M e limitato allora M ⊂ B(x0; r), dove x0 ∈ X e un qualunque puntoed r e un numero reale (sufficientemente grande) e viceversa.

La nostra asserzione e allora formulata come segue.

1.8 Lemma (Limitatezza, Limite)Sia X = (X, d) uno spazio metrico. Allora

(a) Una successione convergente in X e limitata ed il suo limite e unico.

(b) Se xn → x e yn → y in X, allora d(xn, yn) → d(x, y).

Dimostrazione. (a) Supponiamo che xn → x. Allora prendendo ε = 1 possiamo trovare un Ntale che d(xn, x) < 1 per tutti gli n > N. Quindi per tutti gli n abbiamo che d(xn, x) < 1+adove

a = max{d(x1, x), · · · , d(xN , x)}.

Cio mostra che (xn) e limitata. Assumendo che xn → x e che xn → z abbiamo dalla (M4)

0 ≤ d(x, z) ≤ d(x, xn) + d(xn, z) → 0 + 0

e l’unicita x = z del limite segue dalla (M2).(b) Dalla (M4) abbiamo che

d(xn, yn) ≤ d(xn, x) + d(x, y) + d(y, yn).

Da cui otteniamod(xn, yn)− d(x, y) ≤ d(xn, x) + d(yn, y)

ed una diseguaglianza simile scambiando xn con x e yn con y e moltiplicando per −1. Assiemeforniscono

|d(xn, yn)− d(x, y)| ≤ d(xn, x) + d(yn, y) → 0

per n →∞.

Definiremo ora il concetto di completezza di uno spazio metrico, che risultera basilarenel seguito. La completezza non segue dagli assiomi (M1) sino a (M4), poiche vi sono spazimetrici incompleti. In altre parole, la completezza e una proprieta addizionale che gli spazimetrici possono avere o non avere. Essa ha varie conseguenze che rendono gli spazi metricicompleti “migliori e piu semplici” di quelli incompleti.

Ricordiamo dapprima dall’analisi che una successione (xn) di numeri reali o complessiconverge sulla retta reale R o nel piano complesso C se e solamente se soddisfa il criterio diconvergenza di Cauchy, cioe se e solo se per ogni ε > 0 v’e un N = N(ε) tale che

|xm − xn| < ε per tutti gli m,n > N.

10 CAPITOLO 1. SPAZI METRICI

Qui |xm − xn| e la distanza d(xm, xn) da xm a xn sulla retta reale R o nel piano complessoC. Quindi possiamo scrivere la diseguaglianza del criterio di Cauchy nella forma

d(xm, xn) < ε ( m,n > N).

Se una successione (xn) soddisfa alla condizione del criterio di Cauchy potremo chiamarlauna successione di Cauchy. Allora il criterio di Cauchy dice semplicemente che una succes-sione di numeri reali o complessi converge in R o C se e solamente se e una successione diCauchy. Sfortunatamente in spazi piu generali la situazione puo essere piu complicata e vipossono essere successioni di Cauchy che non convergono.

1.9 Definizione (Successione di Cauchy, Completezza)Una successione (xn) in uno spazio metrico X = (X, d) e detta di Cauchy (o fondamentale)se per ogni ε > 0 v’e un N = N(ε) tale che

d(xm, xn) < ε per ogni m,n > N. (1.1)

Lo spazio X e detto completo se ogni successione di Cauchy in X converge (cioe se ha unlimite che e un elemento di X).

A prescindere dalla completezza o meno di X la condizione (1.1) e necessaria per laconvergenza di una successione. Infatti si ottiene facilmente il risultato seguente.

1.10 Teorema (Successione Convergente)Ogni successione convergente in uno spazio metrico e una successione di Cauchy.

Dimostrazione. Se xn → x allora per ogni ε > 0 v’e un N = N(ε) tale che

d(xn, x) <ε

2per tutti gli n > N.

Quindi dalla disuguaglianza triangolare otteniamo per m, n > N

d(xm, xn) ≤ d(xm, x) + d(x, xn) <ε

2+

ε

2= ε.

Cio mostra che (xn) e di Cauchy.Se lo spazio X e completo la condizione di Cauchy (1.1) diventa necessaria e sufficiente

per la convergenza e si parla di criterio di Cauchy per la convergenza. Il teorema che affermala validita del criterio di Cauchy in R e in C puo essere riespresso in termini di completezzacome segue.

1.11 Teorema (Retta Reale, Piano Complesso)La retta reale ed il piano complesso sono spazi metrici completi.

Completiamo questa sezione con tre teoremi che sono legati alla convergenza e allacompletezza e che saranno necessari nel seguito.

1.12 Teorema (Chiusura, Insieme Chiuso)Sia M un sottoinsieme non vuoto di uno spazio metrico (X, d) e M la sua chiusura cosıcome definita nella sezione precedente. Allora

(a) x ∈ M se e solo se esiste una successione (xn) in M tale che xn → x.

(b) M e chiuso se e solo se ogni successione convergente (xn) di punti di M converge ad unpunto di M, ossia se e solo se per ogni successione di punti xn ∈ M tale che xn → xe x ∈ M.

1.2. CONVERGENZA. SUCCESSIONI DI CAUCHY. COMPLETEZZA. 11

Dimostrazione. (a) Sia x ∈ M. Se x ∈ M una successione di questo tipo e (x, x, · · · ). Sex /∈ M e un punto di accumulazione di M. Quindi per ogni n = 1, 2, · · · la palla B(x; 1/n)contiene un xn ∈ M e xn → x perche 1/n → 0 per n →∞.

Viceversa se (xn) e in M e xn → x allora se x ∈ M non v’e nulla da dimostrare. Sex /∈ M ogni intorno di x contiene punti xn 6= x, cosı che x ∈ M per definizione di chiusura.

(b) M e chiuso se e solo se M = M cosı che (b) segue facilmente da (a).

1.13 Teorema (Sottospazio Completo)Un sottospazio M di uno spazio metrico completo X e esso stesso completo se e solo sel’insieme M e chiuso in X.

Dimostrazione. Sia M completo. Grazie a 1.12(a) per ogni x ∈ M v’e una successione (xn)in M che converge in M, il limite essendo unico per l’ 1.8. Quindi x ∈ M. Questo prova cheM e chiuso perche x ∈ M era arbitrario.

Viceversa sia M chiuso e (xn) di Cauchy in M. Allora xn → x ∈ X cio che implica x ∈ Mper l’1.12(a) e x ∈ M poiche M = M per assunzione. Quindi la successione arbitraria diCauchy (xn) converge in M cio che prova la completezza di M.

Questo teorema e molto utile e ne avremo molto spesso bisogno nel seguito.L’ultimo dei tre teoremi annunciati mostra l’importanza della convergenza delle succes-

sioni in connessione con la continuita di un’applicazione.

1.14 Teorema (Applicazione Continua)Un’applicazione T : X → Y di uno spazio metrico (X, d) in uno spazio metrico (Y, d) econtinua in un punto x0 ∈ X se e solo se

xn → x0 implica Txn → Tx0.

Dimostrazione. Si assuma che T sia continua in x0. Allora per un dato ε > 0 v’e un δ > 0tale che

d(x, x0) < δ implica d(Tx, Tx0) < ε.

Sia xn → x0. Allora v’e un N tale che per ogni n > N sia

d(xn, x0) < δ.

Quindi per ogni n > Nd(Txn, Tx0) < ε.

Per definizione cio significa che Txn → Tx0.Viceversa assumiamo che

xn → x0 implichi Txn → Tx0

e proviamo che allora T e continua in x0. Supponiamo che cio sia falso. Allora v’e un ε > 0tale che per ogni δ > 0 v’e un x 6= x0 che soddisfa a

d(x, x0) < δ ma tale che d(Tx, Tx0) ≥ ε.

In particolare per δ = 1/n v’e un xn che soddisfa a

d(xn, x0) < 1n ma tale che d(Txn, Tx0) ≥ ε.

Chiaramente xn → x ma (Txn) non converge a Tx0. Cio contraddice Txn → Tx0 e prova ilteorema.

12 CAPITOLO 1. SPAZI METRICI

In particolare da questo teorema e dal Lemma 1.8 al punto b) segue la seguente propo-sizione.

1.15 Proposizione (Continuita della distanza)La distanza d(x, y) in X e continua in x ed in y.

1.3 Completamento di uno Spazio metrico

Sappiamo che la retta razionale Q non e completa ma puo essere “allargata” alla retta realeR che e completa. Questo “completamento” R di Q e tale che Q e denso in R. E moltoimportante che un arbitrario spazio metrico incompleto possa essere “completato” in unamaniera simile. Per una formulazione precisa e conveniente useremo i due concetti seguenticollegati fra loro e che hanno anche diverse altre applicazioni.

1.16 Definizione (Applicazione isometrica, Spazi Isometrici)Siano X = (X, d) e X = (X, d) spazi metrici. Allora

(a) Un’applicazione T di X in X e detta isometrica o una isometria se T conserva ledistanze, cioe se per ogni x, y ∈ X

d(Tx, Ty) = d(x, y),

dove Tx e Ty sono le immagini di x e y, rispettivamente.

(b) Lo spazio X e detto isometrico allo spazio X se esiste un’isometria biiettiva di X suX. Gli spazi X e X sono allora chiamati spazi isometrici.

Si noti che una isometria e sempre iniettiva.Due spazi isometrici possono differire al piu per la natura dei loro punti ma sono indi-

stinguibili dal punto di vista della metrica. In uno studio, in cui la natura dei punti nonabbia importanza, i due spazi si possono considerare identici — ovvero come due copie delmedesimo spazio “astratto”.

Possiamo ora formulare il teorema che asserisce che ogni spazio metrico puo essere com-pletato. Lo spazio X che appare in questo teorema e chiamato completamento dello spaziodato X.

1.17 Teorema (Completamento)Per ogni spazio metrico X = (X, d) esiste uno spazio metrico completo X = (X, d) che haun sottospazio W che e isometrico a X e che e denso in X. Questo spazio X e unico a menodi isometrie, cioe, se X e un qualunque spazio metrico completo che ha un sottospazio densoW isometrico a X, allora X e X sono isometrici.

Lo studente interessato puo trovare la dimostrazione di questo teorema nella versioneestesa delle dispense.

Problemi

1. Sia `∞ lo spazio delle successioni x =(ξj

)j∈N limitate di numeri complessi, ossia tali

che ∣∣ξj

∣∣ ≤ cx (j = 1, 2, . . . )

1.3. COMPLETAMENTO DI UNO SPAZIO METRICO 13

per ogni x. Mostrare ched (x, y) = sup

j∈N

∣∣ξj − ηj

∣∣

dove y =(ηj

) ∈ `∞ definisce una metrica su `∞.

2. Sia C [a, b] l’insieme di tutte le funzioni a valori reali x(t), y(t), . . . definite e continuenella variabile t sull’intervallo chiuso J = [a, b]. Mostrare che

d (x, y) = maxt∈J

|x (t)− y (t)|

definisce una metrica su C [a, b].

3. Sia `p (p ≥ 1) lo spazio delle successioni x =(ξj

)j∈N tali che

∞∑

j=1

∣∣ξj

∣∣p < ∞.

Mostrare che

d (x, y) =

∞∑

j=1

∣∣ξj − ηj

∣∣p

1/p

dove y =(ηj

) ∈ `p definisce una metrica su `p.

Suggerimento: Utilizzare la diseguaglianza di Minkowski

∞∑

j=1

∣∣ξj + ηj

∣∣p

1/p

∞∑

j=1

∣∣ξj

∣∣p

1/p

+

∞∑

j=1

∣∣ηj

∣∣p

1/p

.

4. Sia la distanza D (A,B) fra due sottoinsiemi non vuoti A e B di uno spazio metrico(X, d) definita essere

D (A,B) = infa∈Ab∈B

d (a, b) .

Mostrare che D (A,B) non definisce una metrica sull’insieme dei sottoinsiemi non vuotidi X.

5. Mostrare che lo spazio `∞ non e separabile.

Soluzione: Sia y = (η1, η2, . . . ) una successione di 0 e di 1. Allora y ∈ `∞ e due succes-sioni differenti di questo tipo distano 1. Essi possono essere messi in corrispondenzabiunivoca coi reali nell’intervallo [0, 1], giacche un qualunque reale nell’intervallo [0, 1]e rappresentabile in forma binaria come

η1

21+

η2

22+ · · ·+ ηn

2n+ . . .

Quindi non sono numerabili. Consideriamo ora le palle di raggio 1/3 centrate in questeparticolari successioni. Esse sono non numerabili ed hanno a due a due intersezionenulla. Quindi se esistesse un insieme M numerabile e denso in l∞ . . .

6. Mostrare che lo spazio `p (p ≥ 1) e separabile.

14 CAPITOLO 1. SPAZI METRICI

Soluzione: Sia M l’insieme delle successioni di `p della forma

y = (η1, η2, . . . , ηn, 0, 0, . . . )

con n intero positivo e le ηj razionali. M e numerabile. Si tratta di mostrare che edenso in `p. Sia dato un x =

(ξj

) ∈ `parbitrario. Per ogni ε > 0 esiste un n tale che

∞∑

j=n+1

∣∣ξj

∣∣p <εp

2.

Scegliamo un y ∈ M tale che

n∑

j=1

∣∣ξj − ηj

∣∣p <εp

2.

Quindi . . .

7. Mostrare che `∞ e completo.

Suggerimento: Sia (xm) una successione di Cauchy di `∞, dove (xm) =(ξ(m)1 , ξ

(m)2 , . . .

).

Mostrare che le successioni di numeri(ξ(m)j

)per ogni j fissato sono di Cauchy ed

quindi convergenti, ossia limm→∞ ξ(m)j = ξj . Mostrare infine che xm → x, dove

x = (ξ1, ξ2, . . . ) ∈ `∞.

8. Mostrare che `p e completo.

Suggerimento: Seguire la medesima via seguita nel caso precedente.

9. Mostrare che C [a, b] e completo.

10. Mostrare che l’insieme dei polinomi considerati come funzioni di t sull’intervallo [a, b]e con metrica definita come su C [a, b] non e completo.

11. Se (xn) e (x′n) in (X, d) soddisfano a d (xn, x′n) → 0 e (xn) ammette limite, mostrareche anche (x′n) converge ed ha il medesimo limite.

12. Se (xn) e (x′n) in (X, d) ammettono il medesimo limite, mostrare che d (xn, x′n) → 0.

Capitolo 2

Spazi Normati. Spazi di Banach

Si ottengono degli spazi metrici particolarmente utili ed importanti se si considera uno spaziovettoriale e si definisce in esso una metrica a mezzo di una norma. Lo spazio risultante echiamato spazio normato. Se uno spazio vettoriale normato e completo viene chiamatospazio di Banach. La teoria degli spazi normati, in particolare degli spazi di Banach, e lateoria degli operatori lineari definiti su di essi costituiscono la parte maggiormente sviluppatadell’analisi funzionale.

2.1 Spazio Vettoriale

2.1 Definizione (Spazio Vettoriale)Uno spazio vettoriale (o spazio lineare) su un campo K e un insieme non vuoto X di elementix, y, · · · (chiamati vettori) dotato di due operazioni algebriche. Queste operazioni sonochiamate somma vettoriale e moltiplicazione di vettori per scalari, cioe per elementi di K.

La somma vettoriale associa ad ogni coppia ordinata (x, y) di vettori un vettore x + ychiamato la somma di x e y, in tal modo che siano soddisfatte le seguenti proprieta. Lasomma vettoriale e commutativa ed associativa, cioe per tutti i vettori si ha che

x + y = y + x

x + (y + z) = (x + y) + z;

inoltre esiste un vettore 0, chiamato vettore nullo, e per ogni vettore x un vettore −x taliche per tutti i vettori si ha che

x + 0 = x

x + (−x) = 0.

Cioe X rispetto alla somma vettoriale e un gruppo additivo abeliano.La moltiplicazione per scalari associa ad ogni vettore x e scalare α un vettore αx

(scritto anche xα) chiamato il prodotto di α e x, in tal modo che per tutti i vettori x, y escalari α, β si ha che

α(βx) = (αβ)x1x = x

15

16 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

e le leggi distributive

α(x + y) = αx + βy

(α + β)x = αx + βx.

Dalla definizione vediamo che la somma vettoriale e un’applicazione X×X → X, mentrela moltiplicazione per scalari e un’applicazione K ×X → X.

K e chiamato il campo scalare (o campo dei coefficienti) dello spazio vettoriale X, eX e chiamato uno spazio vettoriale reale se K = R (il campo dei numeri reali) ed unospazio vettoriale complesso se K = C (il campo dei numeri complessi).

L’uso dello 0 sia per lo scalare 0 che per il vettore nullo non dovrebbe, in generale, creareconfusione. Se fosse desiderabile per ragioni di chiarezza, si puo indicare il vettore nullo con0.

Il lettore puo provare che per tutti i vettori e gli scalari

0x = 0

α0 = 0

e(−1)x = −x.

Un sottospazio di uno spazio vettoriale X e un sottoinsieme non vuoto Y di X tale cheper ogni y1, y2 ∈ Y e tutti gli scalari α, β si ha che αy1 + βy2 ∈ Y. Quindi Y stesso e unospazio vettoriale, le due operazioni algebriche essendo quelle indotte da X.

Uno speciale sottospazio di X e il sottospazio improprio Y = X. Ogni altro sottospaziodi X ( 6= {0}) e chiamato proprio.

Un altro sottospazio speciale di un qualunque spazio vettoriale X e Y = {0}.Una combinazione lineare dei vettori x1, · · · , xm di uno spazio vettoriale X e un’e-

spressione della formaα1x1 + α2x2 + · · ·+ αmxm

dove i coefficienti α1, · · · , αm sono scalari qualunque.Per ogni sottoinsieme non vuoto M ⊂ X l’insieme di tutte le combinazioni lineari di

vettori di M e chiamato l’inviluppo o lo span di M e si scrive

span M.

Ovviamente e un sottospazio Y di M e diciamo che Y e generato da M.Introduciamo ora due concetti fra di loro collegati che verranno usati molto spesso nel

seguito.

2.2 Definizione (Indipendenza Lineare, Dipendenza Lineare)L’indipendenza e la dipendenza lineare di un dato insieme M di vettori x1, · · · , xr (r ≥ 1)in uno spazio vettoriale X sono definite a mezzo dell’equazione

α1x1 + α2x2 + · · ·+ αrxr = 0, (2.1)

dove gli α1, · · · , αr sono scalari. Chiaramente l’equazione (2.1) vale per α1 = α2 = · · · =αr = 0. Se questa e la sola r–pla di scalari per cui la (2.1) e valida l’insieme M e det-to linearmente indipendente. M e detto linearmente dipendente se M non e linearmenteindipendente, cioe se (2.1) e anche valida per una r–pla di scalari non tutti zero.

2.1. SPAZIO VETTORIALE 17

Un sottoinsieme arbitrario M di X e detto linearmente indipendente se ogni sottoinsiemefinito non vuoto di M e linearmente indipendente. M e detto linearmente dipendente se none linearmente indipendente.

Una motivazione per questa terminologia proviene dal fatto che se M = {x1, · · · , xr} elinearmente dipendente almeno un vettore di M puo essere scritto come combinazione linearedegli altri; per esempio se (2.1) vale con un αr 6= 0 allora M e linearmente dipendente epossiamo risolvere (2.1) rispetto a xr e ottenere

xr = β1x1 + · · ·+ βr−1xr−1 (βj = −αj/αr).

Possiamo usare i concetti di dipendenza ed indipendenza lineare per definire la dimensionedi uno spazio vettoriale.

2.3 Definizione (Base di Hamel)Se X e uno spazio vettoriale qualunque e B e un sottoinsieme linearmente indipendente diX che genera X, allora B e chiamato una base (o base di Hamel) per X.

Uno spazio vettoriale X e detto finito dimensionale se ammette una base B di n vettorilinearmente indipendenti. In questo caso e facile dimostrare che ogni altra base contiene nvettori indipendenti. n e percio un numero caratteristico di X ed e chiamato la dimensionedi X e si scrive n = dim X. Per definizione X = 0 e finito dimensionale e dimX = 0.

Se dim X = n una n–pla qualunque di vettori {e1, · · · , en} di X linearmente indipendenticostituisce una base per X (o una base in X) ed ogni x ∈ X ha una rappresentazione unicacome combinazione lineare di questi vettori, ossia

x = α1e1 + · · ·+ αnen.

Se X non e finito dimensionale si dice infinito dimensionale.Anche nel caso infinito dimensionale ogni x ∈ X non nullo ha una rappresentazione unica

come combinazione lineare di (in numero finito!) elementi di B con coefficienti scalari nontutti nulli.

Ogni spazio vettoriale X 6= {0} ha una base di Hamel.Per spazi vettoriali arbitrari infinito dimensionali la prova richiede l’uso del lemma di

Zorn ed e rinviata a dopo che avremo introdotto questo lemma per altri propositi.Menzioniamo il fatto che anche le basi di un dato spazio vettoriale X infinito dimensio-

nale hanno lo stesso numero cardinale. Una prova richiederebbe alcuni strumenti piuttostoavanzati della teoria degli insiemi. Anche nel caso infinito dimensionale questo numero echiamato la dimensione di X.

Piu in la avremo bisogno del seguente semplice teorema.

2.4 Teorema (Dimensioni di un Sottospazio)Sia X uno spazio vettoriale n–dimensionale. Allora ogni sottospazio proprio Y di X hadimensioni minori di n.

Dimostrazione. Se n = 0 allora X = {0} e non ha sottospazı propri. Sia ora n > 0.Chiaramente dimY ≤ dim X = n. Se dim Y fosse n allora Y avrebbe una base di n elementi,che sarebbe anche una base per X perche dim X = n, cosı che X = Y. Cio mostra che unqualunque insieme di vettori linearmente indipendenti in Y deve avere meno di n elementie quindi dim Y < n.

18 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

2.2 Spazio Normato. Spazio di Banach

In molti casi uno spazio vettoriale X puo essere al medesimo tempo uno spazio metricoperche una metrica d e definita su X. Tuttavia se non v’e relazione fra la struttura algebricae la metrica non possiamo aspettarci una teoria utile ed applicabile che combini entrambii concetti. Per garantire una tale relazione fra gli aspetti “algebrici” e “geometrici” diX definiamo su X una metrica d in un modo speciale. Prima introduciamo un concettoausiliario, quello di norma, che usa le operazioni algebriche dello spazio vettoriale. Poiutilizziamo la norma per ottenere un metrica d del tipo desiderato. Questa idea conduce alconcetto di spazio normato.

2.5 Definizione (Spazio Normato, Spazio di Banach)Uno spazio normato X e uno spazio vettoriale dotato di una norma. Uno spazio di Banache uno spazio normato completo (completo nella metrica definita dalla norma). La normasu un spazio vettoriale (reale o complesso) X e una funzione a valori reali su X il cui valoread ogni x ∈ X e indicato con

||x|| (si legga “norma di x”)

ed ha le proprieta

(N1) ||x|| ≥ 0

(N2) ||x|| = 0 ⇐⇒ x = 0

(N3) ||αx|| = |α|||x||(N4) ||x + y|| ≤ ||x||+ ||y|| (Disuguaglianza Triangolare);

dove x e y sono vettori arbitrari in X e α e uno scalare qualunque.Una norma su X definisce una metrica d su X che e data da

d(x, y) = ||x− y|| (x, y ∈ X)

ed e chiamata la metrica indotta dalla norma. Lo spazio normato appena definito si indicacon (X, || · ||) o semplicemente con X.

2.6 Lemma (Invarianza per Traslazioni)Una metrica d indotta da una norma in uno spazio normato X soddisfa a

d(x + a, y + a) = d(x, y)d(αx, αy) = |α|d(x, y)

per tutti gli x, y, a ∈ X ed ogni scalare α.

Dimostrazione. Abbiamo

d(x + a, y + a) = ||x + a− (y + a)|| = ||x− y|| = d(x, y)

ed(αx, αy) = ||αx− αy|| = |α|||x− y|| = |α|d(x, y).

Convergenza di successioni e concetti collegati in uno spazio normato seguono facil-mente dalle corrispondenti definizioni 1.7 e 1.9 per gli spazi metrici e dal fatto che orad(x, y) = ||x− y||.

2.2. SPAZIO NORMATO. SPAZIO DI BANACH 19

(i) Una successione (xn) in uno spazio normato X e convergente se X contiene un x taleche

limn→∞

||xn − x|| = 0.

Allora scriviamo xn → x e chiamiamo x il limite di (xn).

(ii) Una successione (xn) in uno spazio normato e di Cauchy se per ogni ε > 0 esiste un Ntale che

||xm − xn|| < ε per tutti gli m,n > N.

Le successioni erano disponibili anche in un generico spazio metrico. In uno spazionormato possiamo fare un passo avanti ed usare le serie.

Le serie infinite possono ora essere definite in un modo analogo a quello dell’analisi.Infatti se (xk) e una successione in uno spazio normato X, possiamo associare a (xk) lasuccessione (sn) di somme parziali

sn = x1 + x2 + · · ·+ xn

dove n = 1, 2, · · · . Se (sn) e convergente

sn → s cioe ||sn − s|| → 0

allora la serie infinita o, per brevita, la serie

∞∑

k=1

xk

e detta convergere od essere convergente, s e chiamata la somma della serie e si scrive

s =∞∑

k=1

xk.

Se∑∞

k=1 ||xk|| converge la serie e detta assolutamente convergente. Tuttavia in unospazio normato la assoluta convergenza implica la convergenza se e solo se X e completo.

Possiamo ora estendere il concetto di combinazione lineare al caso di una successione(xn) e dire che x e combinazione lineare degli (xn) con coefficienti la successione di scalari(αn) se

x =∞∑

k=1

αkxk.

Analogamente si estende il concetto di indipendenza lineare alle successioni dicendo cheuna successione (xn) e linearmente indipendente se una qualunque sua combinazione linearenulla, anche infinita, ha necessariamente coefficienti tutti nulli.

E quindi naturale utilizzare la struttura di spazio topologico che in uno spazio normatoe aggiunta a quella di spazio vettoriale per dare una definizione di base, che e alternativa aquella di Hamel data sopra e che, per distinguerla da quella, chiameremo base senza ulteriorispecificazioni.

2.7 Definizione (Base)Sia M un sottoinsieme di uno spazio normato X (successione o famiglia di vettori). AlloraM si dice una base di X se ogni elemento x ∈ X si puo esprimere come combinazione lineare,eventualmente infinita, di vettori di M con coefficienti univocamente determinati.

20 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Si noti che ogni sottoinsieme finito o infinito numerabile di M e un insieme di vettorilinearmente indipendenti, nel senso sopra detto, e che lo span di M in generale non copreX, ma e denso in X, ossia

spanM = X.

Grazie a questa definizione possiamo costruirci delle basi molto meno ricche in elementidelle basi di Hamel e quindi maggiormente maneggiabili e soprattutto possiamo associarein maniera univoca ad ogni elemento x le sue “componenti” secondo i vettori della base, inmaniera analoga a quanto succede per gli spazi vettoriali finito dimensionali.

Se M e una successione (en), allora (en) e chiamata una base di Schauder per X. Inquesto caso per ogni x ∈ X v’e un’unica successione di scalari tali che

x =∞∑

k=1

αkek.

Se uno spazio normato X ha una base di Schauder allora e separabile. La dimostrazione esemplice e viene lasciata al lettore. Sorprendentemente l’inverso non e vero, cioe uno spaziodi Banach separabile non ha necessariamente una base di Schauder.

2.3 Ulteriori Proprieta degli Spazi Normati

Per definizione un sottospazio Y di uno spazio normato X e un sottospazio di X consideratocome uno spazio vettoriale con una norma ottenuta restringendo la norma su X ad Y. Questanorma su Y e detta indotta dalla norma su X. Se Y e chiuso in X allora Y e chiamato unsottospazio chiuso di X.

Per definizione un sottospazio Y di uno spazio di Banach X e un sottospazio di Xconsiderato come uno spazio normato. Quindi non richiediamo che Y sia completo.

A questo riguardo e utile il Teorema 1.13 perche fornisce immediatamente il seguenteteorema.

2.8 Teorema (Sottospazio di uno Spazio di Banach)Un sottospazio Y di uno spazio di Banach X e completo se e solo se l’insieme Y e chiusoin X.

Il seguente teorema assicura che ogni spazio normato puo essere completato secondouna procedura che e unica a meno di isometrie. Lo studente interessato puo trovare ladimostrazione nella versione estesa delle dispense.

2.9 Teorema (Completamento)Sia X = (X, || · ||) uno spazio normato. Allora esiste uno spazio di Banach X ed unaisometria A da X su un sottospazio W di X che e denso in X. Lo spazio X e unico a menodi isometrie.

2.4 Spazi Normati Finito Dimensionali e Sottospazı

Rozzamente parlando il seguente lemma stabilisce che nel caso di vettori linearmente indi-pendenti non e possibile trovare una combinazione lineare che coinvolge grandi scalari ed almedesimo tempo rappresenta un piccolo vettore.

2.4. SPAZI NORMATI FINITO DIMENSIONALI E SOTTOSPAZI 21

2.10 Lemma (Combinazione Lineare)Sia {x1, · · · , xn} un insieme di vettori linearmente indipendenti in uno spazio normato X(di dimensioni qualunque). Allora esiste un numero c > 0 tale che per ogni scelta degliscalari α1, · · · , αn abbiamo che

||α1x1 + · · ·αnxn|| ≥ c(|α1|+ · · ·+ |αn|) (c > 0). (2.2)

Dimostrazione. Scriviamo s = |α1| + · · · + |αn|. Se s = 0 tutti gli |αi| sono zero e allora la(2.2) e soddisfatta per ogni c. Sia s > 0. Allora la (2.2) e equivalente alla disuguaglianza chesi ottiene dalla (2.2) dividendo per s e scrivendo βj = αj/s, cioe

||β1x1 + · · ·+ βnxn|| ≥ c

n∑

j=1

|βj | = 1

. (2.3)

E quindi sufficiente provare l’esistenza di un c > 0 tale che la (2.3) vale per ogni n–pla discalari β1, · · · , βn con

∑nj=1 |βj | = 1.

Supponiamo che cio sia falso. Ossia supponiamo che per ogni c > 0 esista una n–pla discalari β1, · · · , βn con

∑nj=1 |βj | = 1 tali che ||β1x1 + · · ·βnxn|| < c. In corrispondenza della

successione c = 1/m esiste allora una successione (ym) di vettori

ym = β(m)1 x1 + · · ·+ β(m)

n xn

n∑

j=1

∣∣∣β(m)j

∣∣∣ = 1

tali che

||ym|| < 1m

e quindi tali cheym → 0 come m →∞.

Ora ragioniamo come segue. Poiche∑n

j=1

∣∣∣β(m)j

∣∣∣ = 1 abbiamo che∣∣∣β(m)

j

∣∣∣ ≤ 1. Quindi perogni fisso j la successione (

β(m)j

)=

(1)j , β

(2)j , · · ·

)

e limitata. Di conseguenza per il teorema di Bolzano–Weierstrass (β(m)1 ) ammette una

successione estratta (β(1,m)1 ) convergente. Sia γ1 il limite di questa successione estratta e sia

y1,m =n∑

j=1

β(1,m)j xj

la corrispondente successione estratta di (ym). Per il medesimo argomento (y1,m) ammetteuna successione estratta

y2,m =n∑

j=1

β(2,m)j xj

per cui la corrispondente successione estratta di scalari (β(2,m)2 ) converge; sia γ2 il limite.

Si noti che la successione (β(2,m)1 ) essendo estratta di una successione convergente converge

22 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

ancora a γ1. Continuando in questo modo dopo n passi si ottiene una successione estratta(yn,m) = (yn,1, yn,2, · · · ) di (ym) i cui termini sono della forma

yn,m =n∑

j=1

β(n,m)j xj

n∑

j=1

∣∣∣β(n,m)j

∣∣∣ = 1

con scalari β(n,m)j che soddisfano il limite β

(n,m)j → γj per m → ∞. Usando allora gli n

limiti γ1, · · · , γn definiamoy = γ1x1 + · · · γnxn.

e poiche

||yn,m − y|| =∥∥∥∥

n∑

j=1

(β(n,m)j − γj)xj

∥∥∥∥ ≤n∑

j=1

|β(n,m)j − γj | ||xj ||

per m →∞yn,m → y =

n∑

j=1

γjxj .

Essendo∑ ∣∣γj

∣∣ = 1 non tutti i γj possono essere zero ed essendo {x1, · · · , xn} un insiemelinearmente indipendente abbiamo che y 6= 0. D’altro lato poiche (yn,m) e una successioneestratta di (ym) che converge a zero dobbiamo avere yn,m → 0 cosı che y = 0. Cio contraddicey 6= 0 ed il lemma e provato.

Come prima applicazione del lemma proviamo il seguente teorema basilare.

2.11 Teorema (Completezza)Ogni sottospazio finito dimensionale Y di uno spazio normato X e completo. In particolareogni spazio normato finito dimensionale e completo.

Dimostrazione. Consideriamo un’arbitraria successione di Cauchy (ym) in Y e vogliamodimostrare che ammette limite y con y ∈ Y . Sia dim Y = n e {e1, · · · , en} una basequalunque di Y. Allora ciascun ym ha un’unica rappresentazione della forma

ym = α(m)1 e1 + · · ·+ α(m)

n en.

Poiche (ym) e una successione di Cauchy, per ogni ε > 0 v’e un N tale che ||ym − yr|| < εquando m, r > N. Da cio e dal Lemma 2.10 abbiamo che per qualche c > 0

ε > ||ym − yr|| =∥∥∥∥

n∑

j=1

(m)j − α

(r)j

)ej

∥∥∥∥ ≥ c

n∑

j=1

∣∣∣α(m)j − α

(r)j

∣∣∣ ,

dove m, r > N. Dividendo per c si ottiene∣∣∣α(m)

j − α(r)j

∣∣∣ ≤n∑

j=1

∣∣∣α(m)j − α

(r)j

∣∣∣ <ε

c(m, r > N).

Cio mostra che ciascuna delle n successioni

(α(m)j ) = (α(1)

j , α(2)j , · · · ) j = 1, · · · , n

e di Cauchy in R o in C. Quindi converge; sia αj il limite. Usando allora gli n limitiα1, · · · , αn definiamo

y = α1e1 + · · ·αnen.

2.4. SPAZI NORMATI FINITO DIMENSIONALI E SOTTOSPAZI 23

Chiaramente y ∈ Y. Inoltre

||ym − y|| =∥∥∥∥

n∑

j=1

(m)j − αj

)ej

∥∥∥∥ ≤n∑

j=1

∣∣∣α(m)j − αj

∣∣∣ ||ej ||.

A destra α(m)j → αj . Quindi ||ym−y|| → 0, cioe ym → y. Cio mostra che (ym) e convergente

in Y. Poiche (ym) era una successione di Cauchy in Y, cio prova che Y e completo.Da questo teorema e dal Teorema 1.13 si deriva il seguente teorema.

2.12 Teorema (Chiusura)Ogni sottospazio finito dimensionale Y di uno spazio normato X e chiuso in X.

Avremo bisogno di questo teorema in numerose occasioni nel seguito.Un’altra proprieta interessante di uno spazio vettoriale finito dimensionale X e che tutte

le norme su X portano alla medesima topologia per X, cioe gli insiemi aperti sono gli stessi,a prescindere dalla particolare scelta della norma in X. I dettagli sono i seguenti.

2.13 Definizione (Norme Equivalenti)Una norma || · ||1 su uno spazio vettoriale X e detta equivalente alla norma || · ||2 su X seesistono dei numeri positivi a e b tali che per ogni x ∈ X si ha

a||x||2 ≤ ||x||1 ≤ b||x||2. (2.4)

Questo concetto e motivato dal seguente fatto.Norme equivalenti su X definiscono la medesima topologia per X.Infatti cio segue dalla (2.4) e dal fatto che ogni intorno di un punto x secondo la norma

|| · ||1 e intorno anche secondo la norma || · ||2 e viceversa. Lasciamo i dettagli di una provaformale al lettore, che puo anche mostrare che le successioni di Cauchy in (X, || · ||1) e(X, || · ||2) sono le stesse.

Usando il Lemma 2.10 possiamo ora provare il seguente teorema (che non vale per glispazi infinito dimensionali).

2.14 Teorema (Norme Equivalenti)Su uno spazio vettoriale finito dimensionale X ogni norma || · ||1 e equivalente a qualsiasialtra norma || · ||2.Dimostrazione. Sia dim X = n e {e1, · · · , en} una base qualunque di X. Allora ogni x ∈ Xha un’unica rappresentazione

x = α1e1 + · · ·αnen.

Per il Lemma 2.10 esiste una costante positiva c tale che

||x||1 ≥ c(|α1|+ · · · |αn|).

D’altra parte la disuguaglianza triangolare da

||x||2 ≤n∑

j=1

|αj |||ej ||2 ≤ k

n∑

j=1

|αj | k = maxj||ej ||2.

Assieme danno a||x||2 ≤ ||x||1 dove a = c/k > 0. L’altra disuguaglianza in (2.4) si ottienescambiando il ruolo di || · ||1 e || · ||2 nelle considerazioni precedenti.

Questo teorema ha una notevole importanza pratica. Ad esempio implica che la con-vergenza o la divergenza di una successione in uno spazio vettoriale finito dimensionale nondipende dalla particolare scelta della norma su questo spazio.

24 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

2.5 Compattezza e Dimensioni Finite

Alcune altre proprieta basilari degli spazi normati finito dimensionali e dei loro sottospazısono legate al concetto di compattezza. Quest’ultima si definisce come segue.

2.15 Definizione (Compattezza)Uno spazio metrico X e detto compatto1 se ogni successione in X ha una successione estrattaconvergente. Un sottoinsieme M di X e detto compatto se M e compatto considerato comesottospazio di X, cioe se ogni successione in M ha una successione estratta convergente adun limite che e un elemento di M .

Una proprieta generale degli insiemi compatti e espressa nel seguente Lemma.

2.16 Lemma (Compattezza)Un sottoinsieme compatto M di uno spazio metrico X e chiuso e limitato.

Dimostrazione. Per ogni x ∈ M v’e una successione (xn) in M tale che xn → x; cf. 1.12(a).Poiche M e compatto x ∈ M. Quindi M e chiuso perche x ∈ M era arbitrario. Proviamoche M e limitato. Si noti che se supx,y∈M d(x, y) = ∞ e anche supx∈M d(x, b) = ∞ perun qualunque b fisso appartenente a X. Infatti se cosı non fosse avremmo sup d(x, y) ≤sup d(x, b) + sup d(b, y) < ∞ che non e possibile. Quindi se M fosse non limitato conter-rebbe una successione (yn) tale che d(yn, b) > n e quindi tale che limn→∞ d(yn, b) = ∞.Questa successione non potrebbe avere una successione estratta convergente perche allorad(yn, b) ammetterebbe una successione estratta convergente, cio che e impossibile perche edivergente.

L’inverso di questo lemma e in generale falso.

Dimostrazione. Per provare questo importante fatto consideriamo la successione (en) in l2,dove en = (δnj) ha l’n–mo termine 1 e tutti gli altri termini 0. Questa successione e limitataperche ||en|| = 1. Poiche e ||en − em|| =

√2 per ogni n e m (n 6= m), la successione non

ha punti di accumulazione. Quindi i suoi termini costituiscono un insieme di punti che echiuso perche non ha punti di accumulazione. Per la medesima ragione questo insieme none compatto.

Tuttavia per uno spazio normato finito dimensionale abbiamo il seguente Teorema.

2.17 Teorema (Compattezza)In uno spazio normato finito dimensionale X un qualsiasi sottoinsieme M ⊂ X e compattose e solo se M e chiuso e limitato.

Dimostrazione. La compattezza implica la chiusura e la limitatezza per il Lemma 2.16.Proviamo l’inverso. Sia M chiuso e limitato. Sia dim X = n e {e1, · · · , en} una base per X.Consideriamo una qualunque successione (xm) in M. Ciascun xm ha una rappresentazione

xm = ξ(m)1 e1 + · · ·+ ξ(m)

n en.

Poiche M e limitato lo e anche (xm), cioe ||xm|| ≤ k per tutti gli m. Per il Lemma 2.10

k ≥ ||xm|| =∥∥∥∥

n∑

j=1

ξ(m)j ej

∥∥∥∥ ≥ c

n∑

j=1

∣∣∣ξ(m)j

∣∣∣

1Piu precisamente sequenzialmente compatto; questo e il tipo piu importante di compattezza in analisi.Menzioniamo che ci sono due altri tipi di compattezza, ma per gli spazi metrici i tre concetti divengonoidentici.

2.5. COMPATTEZZA E DIMENSIONI FINITE 25

dove c > 0. Quindi la successione di numeri (ξ(m)j ) (j fisso) e limitata e, per il teorema di

Bolzano–Weierstrass, ha un punto di accumulazione ξj ; qui 1 ≤ j ≤ n. Come nella provadel Lemma 2.10 concludiamo che (xm) ha una successione estratta (zm) che converge az =

∑ξjej . Poiche M e chiuso z ∈ M. Cio mostra che la successione arbitraria (xm) in M

ha una successione estratta che converge in M. Quindi M e compatto.La nostra discussione mostra il seguente. In Rn (o in ogni altro spazio normato finito

dimensionale) i sottoinsiemi compatti sono precisamente i sottoinsiemi chiusi e limitati, cosıche questa proprieta (chiusura e limitatezza) puo essere usata per definire la compattezza.Tuttavia questo non puo piu essere fatto nel caso degli spazi normati infinito dimensionali.

Una sorgente di altri risultati interessanti e il seguente lemma di F. Riesz.

2.18 Lemma (F. Riesz)Siano Y e Z sottospazı di uno spazio normato X (di una dimensione qualunque) e suppo-niamo che Y sia chiuso e sia un sottospazio proprio di Z. Allora per ogni numero reale θnell’intervallo (0, 1) v’e un z ∈ Z tale che

||z|| = 1, ||z − y|| ≥ θ per ogni y ∈ Y.

Dimostrazione. Consideriamo un qualsiasi v ∈ Z − Y ed indichiamo la sua distanza da Ycon a, cioe

a = infy∈Y

||v − y||. (2.5)

Chiaramente a > 0 perche Y e chiuso. Prendiamo ora un qualunque θ ∈ (0, 1). Per ladefinizione di estremo inferiore v’e un y0 ∈ Y tale che

a ≤ ||v − y0|| ≤ a

θ(2.6)

(si noti che a/θ > a perche 0 < θ < 1). Sia

z = c(v − y0) dove c =1

||v − y0|| .

Allora ||z|| = 1 e mostriamo che ||z − y|| ≥ θ per ogni y ∈ Y. Abbiamo che

||z − y|| = ||c(v − y0)− y||= c||v − y0 − c−1y||= c||v − y1||

dovey1 = y0 + c−1y.

La forma di y1 mostra che y1 ∈ Y. Quindi ||v − y1|| ≥ a per definizione di a. Usando (2.5) e(2.6) otteniamo

||z − y|| = c||v − y1|| ≥ ca =a

||v − y0|| ≥a

a/θ= θ.

Poiche y ∈ Y era arbitrario cio completa la prova.

2.19 Teorema (Dimensioni Finite)Se uno spazio normato X ha la proprieta che la palla chiusa unitaria M = {x : ||x|| ≤ 1} ecompatta allora X e finito dimensionale.

26 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Dimostrazione. Assumiamo che M sia compatto ma che dim X = ∞ e mostriamo che cioporta ad una contraddizione. Scegliamo un qualunque x1 di norma 1. Questo x1 genera unosottospazio unidimensionale X1 di X, che e chiuso (cf. 2.12) ed e un sottospazio proprio diX perche dim X = ∞. Per il lemma di Riesz v’e un x2 ∈ X di norma 1 tale che

||x2 − x1|| ≥ θ =12.

Gli elementi x1, x2 generano un sottospazio X2 bidimensionale proprio e chiuso di X. Per illemma di Riesz v’e un x3 di norma 1 tale che per tutti gli x ∈ X2 abbiamo che

||x3 − x|| ≥ 12.

In particolare

||x3 − x1|| ≥ 12,

||x3 − x2|| ≥ 12.

Procedendo per induzione otteniamo una successione (xn) di elementi xn ∈ M tali che

||xm − xn|| ≥ 12

(m 6= n).

Ovviamente (xn) non puo avere una successione estratta convergente. Cio contraddice lacompattezza di M. Quindi la nostra assunzione dim X = ∞ e falsa e dim X < ∞.

Questo teorema ha varie applicazioni. Lo utilizzeremo come uno strumento basilare inconnessione con i cosiddetti operatori compatti.

Gli insiemi compatti sono importanti perche hanno un “buon comportamento”; essiammettono numerose proprieta basilari simili a quelle degli insiemi finiti e che non sonosoddisfatte dagli insiemi non compatti. In connessione con le applicazioni continue unaproprieta fondamentale e che gli insiemi compatti hanno immagini compatte.

2.20 Teorema (Applicazioni Continue)Siano X e Y spazi metrici e T : X → Y un’applicazione continua. Allora l’immagine di unsottoinsieme compatto M di X sotto T e compatto.

Dimostrazione. Per la definizione di compattezza e sufficiente mostrare che ogni successione(yn) nell’immagine T (M) ⊂ Y contiene una successione estratta che converge in T (M).Poiche yn ∈ T (M) abbiamo che yn = Txn per qualche xn ∈ M. Poiche M e compatto(xn) contiene una successione estratta (xnk

) che converge in M. L’immagine di (xnk) e una

successione estratta di (yn) che converge in T (M) per l’1.14 perche T e continua. QuindiT (M) e compatto.

Da questo teorema concludiamo che la seguente proprieta, ben nota dall’analisi per lefunzioni continue, si estende agli spazi metrici.

2.21 Corollario (Massimo e Minimo)Un’applicazione continua T di un sottoinsieme M compatto di uno spazio metrico X in Rassume un massimo ed un minimo in qualche punto di M.

Dimostrazione. T (M) ⊂ R e compatto per il Teorema 2.20 ed e chiuso e limitato per ilLemma 2.16 [applicato a T (M)], cosı che inf T (M) ∈ T (M), supT (M) ∈ T (M) e le immaginiinverse di questi due punti consistono dei punti di M in cui Tx e, rispettivamente, minimoe massimo.

2.6. OPERATORI LINEARI 27

2.6 Operatori Lineari

Nel caso degli spazi vettoriali ed in particolare degli spazi normati un’applicazione e chiamataun operatore.

Di speciale interesse sono gli operatori che “conservano” le due operazioni algebrichedegli spazi vettoriali, nel senso della seguente definizione.

2.22 Definizione (Operatori Lineari)Se X e Y sono due spazi vettoriali sul medesimo campo K, si dice operatore lineare Tun’applicazione T : X → Y tale che per tutti gli x, y ∈ X e scalari α

T (x + y) = Tx + TyT (αx) = αTx.

(2.7)

Si osservi la notazione Tx invece di T (x); questa semplificazione e standard in analisifunzionale.

Nel caso in cui lo spazio vettoriale X sia un sottospazio vettoriale di uno spazio vettorialepiu ampio lo si indica con D(T ) e si chiama dominio di T . L’immagine di T , ossia T (X),si indica con R(T ). Lo spazio nullo di T e l’insieme di tutti gli x ∈ X tali che Tx = 0 e siindica con N (T ). Un’altra denominazione per lo spazio nullo e “kernel”. Non adotteremoquesto termine perche dobbiamo riservarlo ad un altro scopo nella teoria delle equazioniintegrali.

Chiaramente (2.7) e equivalente a

T (αx + βy) = αTx + βTy. (2.8)

Prendendo α = 0 in (2.7) otteniamo la seguente formula di cui avremo bisogno moltevolte nel seguito

T0 = 0. (2.9)

2.23 Definizione (Operatore Identita)L’operatore identita IX : X → X e definito da IXx = x per tutti gli x ∈ X. Scriviamo anchesemplicemente I per IX ; cosı Ix = x.

2.24 Definizione (Operatore Zero)L’operatore zero 0 : X → Y e definito da 0x = 0 per tutti gli x ∈ X.

2.25 Teorema (Immagine e Spazio Nullo)Sia T un operatore lineare. Allora

(a) L’immagine R(T ) e uno spazio vettoriale.

(b) Se dim X = n < ∞, allora dimR(T ) ≤ n.

(c) Lo spazio nullo N (T ) e uno spazio vettoriale.

Dimostrazione. (a) Prendiamo due qualunque y1, y2 ∈ R(T ) e mostriamo che αy1 + βy2 ∈R(T ) per due scalari qualunque α e β. Poiche y1, y2 ∈ R(T ) abbiamo che y1 = Tx1ey2 = Tx2 per qualche x1, x2 ∈ X. Anche αx1 + βx2 ∈ X perche X e uno spazio vettoriale.La linearita di T da

T (αx1 + βx2) = αTx1 + βTx2 = αy1 + βy2.

28 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Quindi αy1 +βy2 ∈ R(T ). Poiche y1, y2 ∈ R(T ) erano arbitrari e cosı lo erano gli scalari cioprova che R(T ) e uno spazio vettoriale.

(b) Scegliamo n + 1 elementi y1, · · · , yn+1 di R(T ) in una maniera arbitraria. Alloraabbiamo y1 = Tx1, · · · , yn+1 = Txn+1 per qualche x1, · · · , xn+1 in X. Poiche dim X = nquesto insieme {x1, · · · , xn+1} deve essere linearmente dipendente. Quindi

α1x1 + · · ·+ αn+1xn+1 = 0

per degli scalari non tutti nulli. Poiche T e lineare e T0 = 0 applicando T ad entrambimembri si ottiene

T (α1x1 + · · ·+ αn+1xn+1) = α1y1 + · · ·+ αn+1yn+1 = 0.

Cio mostra che l’insieme {y1, · · · , yn+1} e linearmente dipendente perche gli αj non sonotutti nulli. Ricordando che questo sottoinsieme di R(T ) era stato scelto in una manieraarbitraria ne concludiamo che R(T ) non ammette sottoinsiemi linearmente indipendenti din + 1 o piu elementi. Per definizione cio significa che dimR(T ) ≤ n.

(c) Prendiamo due qualunque x1, x2 ∈ N (T ). Allora Tx1 = Tx2 = 0. Poiche T e lineareper scalari qualunque α, β abbiamo che

T (α1x1 + β2x2) = 0.

Cio mostra che α1x1 + β2x2 ∈ N (T ). Quindi N (T ) e uno spazio vettoriale.La seguente conseguenza immediata della parte (b) della dimostrazione e degna di nota.Gli operatori lineari conservano la dipendenza lineare.Occupiamoci ora dell’inverso di un operatore lineare. Ricordiamo dapprima che un’ap-

plicazione T : X → Y e detta iniettiva o biunivoca se punti differenti nel dominio hannoimmagini differenti, cioe se per ogni x1, x2 ∈ X

x1 6= x2 =⇒ Tx1 6= Tx2 (2.10)

o in maniera equivalente seTx1 = Tx2 =⇒ x1 = x2. (2.11)

In questo caso esiste l’applicazione

T−1 : R(T ) → Xy0 7−→ x0 (y0 = Tx0)

(2.12)

che applica ogni y0 ∈ R(T ) su quel x0 ∈ X per cui Tx0 = y0. L’applicazione T−1 e chiamatal’inversa di T.

Dalla (2.12) abbiamo chiaramente che

T−1Tx = x per tutti gli x ∈ X

TT−1x = x per tutti gli x ∈ R(T ).

In connessione con gli operatori lineari sugli spazi vettoriali la situazione e la seguente.L’inverso di un operatore lineare esiste se e solo se lo spazio nullo dell’operatore consiste sola-mente del vettore nullo. Piu precisamente abbiamo il seguente utile criterio che utilizzeremomolto frequentemente.

2.26 Teorema (Operatore Inverso)Siano X e Y spazi vettoriali entrambi reali o complessi. Sia T : X → Y un operatore linearecon immagine R(T ) ⊂ Y. Allora

2.6. OPERATORI LINEARI 29

(a) L’inverso T −1 : R(T ) → X esiste se e solo se

Tx = 0 =⇒ x = 0.

(b) Se T−1 esiste, e un operatore lineare.

(c) Se dim X = n < ∞ e T−1 esiste allora dimR(T ) = dim X.

Dimostrazione. (a) Supponiamo che Tx = 0 implichi x = 0. Sia Tx1 = Tx2. Poiche T elineare

T (x1 − x2) = Tx1 − Tx2 = 0

cosı che x1 − x2 = 0 per ipotesi. Quindi Tx1 = Tx2 implica x1 = x2 e T−1 esiste per la(2.11). Viceversa se T−1 esiste allora la (2.11) vale. Dalla (2.11) con x2 = 0 e dalla (2.9)otteniamo

Tx1 = T0 = 0 =⇒ x1 = 0.

Cio completa la dimostrazione di (a).(b) Assumiamo che T−1 esista e mostriamo che T−1 e lineare. Il dominio di T−1 e R(T )

ed e uno spazio vettoriale per il Teorema 2.25(a). Consideriamo degli x1,x2 ∈ X qualunquee le loro immagini

y1 = Tx1 e y2 = Tx2.

Allorax1 = T−1y1 e x2 = T−1y2.

T e lineare e cosı per degli scalari qualunque α e β abbiamo

αy1 + βy2 = αTx1 + βTx2 = T (αx1 + βx2).

Poiche xj = T−1yj cio implica che

T−1(αy1 + βy2) = αx1 + βx2 = αT−1y1 + βT−1y2

e prova che T−1 e lineare.(c) Abbiamo che dimR(T ) ≤ dim X per il Teorema 2.25(b) e dim X ≤ dimR(T ) per il

medesimo teorema applicato a T−1.

Menzioniamo infine una formula utile per l’inverso della composizione di operatori lineari.

2.27 Lemma (Inverso del Prodotto)Siano T : X → Y e S : Y → Z operatori lineari biiettivi, dove X, Y, Z sono spazi vettoriali.Allora l’inverso (ST )−1 : Z → X del prodotto (composizione) ST esiste e

(ST )−1 = T−1S−1. (2.13)

Dimostrazione. La dimostrazione e lasciata al lettore.

30 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

2.7 Spazi Lineari di Operatori

Consideriamo due spazi vettoriali qualunque X e Y (entrambi reali o complessi) e l’insieme

L(X, Y )

costituito da tutti gli operatori lineari da X in Y, cioe ciascuno di tali operatori e definitosu tutto X e la sua immagine giace in Y. Vogliamo mostrare che L(X,Y ) stesso puo esseredotato della struttura di spazio vettoriale.

Il tutto e molto semplice. L(X, Y ) diviene uno spazio vettoriale se, in maniera del tuttonaturale, definiamo la somma T1 + T2 di due operatori T1, T2 ∈ L(X,Y ) come

(T1 + T2)x = T1x + T2x

e il prodotto αT di T ∈ L(X, Y ) per uno scalare α come

(αT )x = αTx.

2.8 Operatori Lineari Limitati e Continui

Siamo ora interessati a definire una classe particolare di operatori lineari che ammettononorma e che costituiscono quindi essi stessi uno spazio normato.

2.28 Definizione (Operatori Lineari Limitati)Siano X e Y spazi normati e T : X → Y . L’operatore T e detto limitato se esiste unnumero reale c tale che per tutti gli x ∈ X

||Tx|| ≤ c||x||. (2.14)

In (2.14) la norma a sinistra e quella di Y e la norma a destra quella di X. Per semplicitaabbiamo indicato col medesimo simbolo ||·|| entrambe le norme, senza pericolo di confusione.La formula (2.14) mostra che un operatore limitato applica insiemi limitati in X in insiemilimitati in Y. Cio motiva il termine “operatore limitato”.

Attenzione. Si noti che il presente uso della parola “limitato” e differente da quello inanalisi, dove una funzione limitata e una funzione la cui immagine e un insieme limitato.

Qual e il piu piccolo c tale che la (2.14) e ancora valida per tutti gli x ∈ X che non sianonulli? [Possiamo escludere x = 0 perche Tx = 0 per x = 0.] Dividendo si ottiene

||Tx||||x|| ≤ c (x 6= 0)

e cio mostra che c deve essere almeno altrettanto grande che l’estremo superiore dell’espres-sione a sinistra considerata su X − {0}. Quindi il minimo possibile c nella (2.14) e questoestremo superiore. Questa quantita e indicata con ||T ||; cosı

||T || = supx∈Xx6=0

||Tx||||x|| . (2.15)

||T || e chiamato la norma dell’operatore T. Se X = {0} definiamo ||T || = 0; in questo caso(relativamente ininteressante) T = 0 perche T0 = 0.

2.8. OPERATORI LINEARI LIMITATI E CONTINUI 31

Si noti che la (2.14) con c = ||T || diventa

||Tx|| ≤ ||T || ||x||. (2.16)

Applicheremo questa formula piuttosto frequentemente.Naturalmente dovremmo giustificare l’uso del termine “norma” nel presente contesto.

Questo viene fatto nel seguente lemma.

2.29 Lemma (Norma)Sia T un operatore lineare limitato. Allora

(a) Una formula alternativa per la norma di T e

||T || = supx∈X||x||=1

||Tx||. (2.17)

(b) La norma definita dalla (2.15) soddisfa (N1) sino a (N4).

Dimostrazione. (a) Utilizzando la proprieta (N3) della norma in Y e la linearita di Totteniamo dalla (2.15)

||T || = supx∈Xx6=0

1||x|| ||Tx|| = sup

x∈Xx6=0

∥∥∥∥T

(1||x||x

)∥∥∥∥ = supy∈X||y||=1

||Ty||.

Scrivendo x invece di y a destra abbiamo la (2.17).(b) (N1) e ovvio e cosı ||0|| = 0. Da ||T || = 0 abbiamo che Tx = 0 per tutti gli x ∈ X,

cosı che T = 0. Quindi (N2) vale. Inoltre (N3) e ottenuto da

sup||x||=1

||αT || = sup||x||=1

|α| ||Tx|| = |α| sup||x||=1

||Tx||

dove x ∈ X. Infine (N4) segue da

sup||x||=1

||(T1 + T2)x|| = sup||x||=1

||T1x + T2x|| ≤ sup||x||=1

||T1x||+ sup||x||=1

||T2x||;

qui x ∈ X.

Si noti che l’operatore identita I : X → X e l’operatore zero 0 : X → X su uno spazionormato X sono operatori limitati ed hanno rispettivamente norma ||I|| = 1 e ||0|| = 0.

2.30 Teorema (Spazio B(X, Y ))Lo spazio vettoriale B(X, Y ) di tutti gli operatori limitati lineari da uno spazio normato Xin uno spazio normato Y e esso stesso uno spazio normato con norma definita da

||T || = supx∈Xx 6=0

||Tx||||x|| = sup

x∈X||x||=1

||Tx||. (2.18)

Esaminiamo ora alcune proprieta specifiche importanti degli operatori lineari limitati.

2.31 Teorema (Dimensioni Finite)Se uno spazio normato X e finito dimensionale allora ogni operatore lineare su X e limitato.

32 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Dimostrazione. Sia dim X = n e {e1, · · · , en} una base per X. Prendiamo un qualunquex =

∑ξjej e consideriamo un qualunque operatore lineare T su X. Poiche T e lineare

||Tx|| =∥∥∥∥∑

ξjTej

∥∥∥∥ ≤∑

|ξj | ||Tej || ≤ maxk||Tek||

∑|ξj |

(somme da 1 a n). All’ultima somma applichiamo il Lemma 2.10 con αj = ξj e xj = ej .Allora otteniamo ∑

|ξj | ≤1c

∥∥∥∥∑

ξjej

∥∥∥∥ =1c||x||.

Assieme danno

||Tx|| ≤ γ||x|| dove γ =1c

maxk||Tek||.

Da cio e dalla (2.14) vediamo che T e limitato.Consideriamo ora alcune importanti proprieta degli operatori lineari limitati.Gli operatori sono applicazioni, cosı che ad essi si applica la definizione di continuita.

E un fatto fondamentale che per gli operatori lineari continuita e limitatezza divengonoconcetti equivalenti. I dettagli sono i seguenti.

Sia T : X → Y un operatore qualunque non necessariamente lineare, dove X e Y sonospazi normati. Per la definizione 1.4 l’operatore T e continuo in un x0 ∈ X se per ogniε > 0 v’e un δ > 0 tale che

||Tx− Tx0|| < ε per tutti gli x ∈ X per cui ||x− x0|| < δ.

T e continuo se T e continuo in ogni x ∈ X.Ora se T e lineare abbiamo il rimarchevole teorema seguente.

2.32 Teorema (Continuita e limitatezza)Sia T : X → Y un operatore lineare e siano X e Y spazi normati. Allora

(a) T e continuo se e solamente se T e limitato.

(b) Se T e continuo in un singolo punto allora e continuo.

Dimostrazione. (a) Assumiamo che T sia limitato e dimostriamo che e continuo. Per T = 0l’affermazione e banale. Sia T 6= 0. Allora ||T || 6= 0. Consideriamo un qualunque x0 ∈ X.Sia dato un ε > 0 arbitrario. Allora poiche T e lineare per ogni x ∈ X otteniamo

||Tx− Tx0|| = ||T (x− x0)|| ≤ ||T || ||x− x0||.

Quindi per x tale che||x− x0|| ≤ ε

||T ||otteniamo

||Tx− Tx0|| ≤ ε.

Poiche x0 ∈ X era arbitrario cio mostra che T e continuo.Viceversa assumiamo che T sia continuo in un arbitrario x0 ∈ X. Allora dato un ε > 0

arbitrario v’e un δ > 0 tale che

||Tx− Tx0|| < ε per tutti gli x ∈ X per cui ||x− x0|| < δ. (2.19)

2.8. OPERATORI LINEARI LIMITATI E CONTINUI 33

Prendiamo ora un qualunque y 6= 0 in X e poniamo

x = x0 +δ

2||y||y. Allora x− x0 =δ

2||y||y.

Quindi ||x− x0|| = δ/2 cosı che possiamo usare la (2.19). Poiche T e lineare abbiamo

||Tx− Tx0|| = ||T (x− x0)|| =∥∥∥∥T

2||y||y)∥∥∥∥ =

δ

2||y|| ||Ty||

e (2.19) implicaδ

2||y|| ||Ty|| < ε. Cosı ||Ty|| < 2ε

δ||y||.

Cio puo essere scritto ||Ty|| ≤ c||y||, dove c = 2ε/δ. Quindi poiche c dipende da x0 e non day ne segue che T e limitato.

(b) La continuita di T in un punto implica la limitatezza di T per la seconda parte delladimostrazione di (a), che a sua volta implica la continuita di T per l’(a).

2.33 Corollario (Continuita, Spazio Nullo)Sia T un operatore lineare limitato. Allora

(a) xn → x, dove xn, x ∈ X, implica Txn → Tx.

(b) Lo spazio nullo N (T ) e chiuso.

Dimostrazione. (a) segue dal Teorema 2.32(a) e 1.14 o direttamente dalla (2.16) perche pern →∞

||Txn − Tx|| = ||T (xn − x)|| ≤ ||T || ||xn − x|| → 0.

(b) Per ogni x ∈ N (T ) v’e una successione (xn) in N (T ) tale che xn → x; cf. 1.12(a).Quindi Txn → Tx per la parte (a) di questo corollario. Anche Tx = 0 poiche Txn = 0 cosıche x ∈ N (T ). Poiche x ∈ N (T ) era arbitrario, N (T ) e chiuso.

E lasciata al lettore la semplice prova di un’altra utile formula

||T1T2|| ≤ ||T1|| ||T2||, ||Tn|| ≤ ||T ||n (n ∈ N) (2.20)

valida per operatori lineari limitati T2 : X → Y, T1 : Y → Z e T : X → X, dove X,Y, Zsono spazi normati.

Due operatori T1 e T2 sono definiti uguali, scrivendo

T1 = T2,

se hanno medesimo dominio D(T1) = D(T2) e se T1x = T2x per tutti gli x ∈ D(T1) = D(T2).La restrizione di un operatore T : X → Y ad un sottoinsieme B ⊂ X e indicato con

T |B

ed e l’operatore definito da

T |B : B → Y, T |Bx = Tx per tutti gli x ∈ B.

34 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Un’estensione di T definito in un sottospazio D(T ) ⊂ X ad un insieme M ⊃ D(T ) eun operatore

T : M → Y tale che T |D(T ) = T.

Se D(T ) e un sottoinsieme proprio di M, allora un dato T ha molte estensioni. Di in-teresse pratico sono quelle estensioni che conservano alcune proprieta basilari, per esempiola linearita (se T e lineare) o la limitatezza (se D(T ) giace in uno spazio normato e T elimitato). Il seguente importante teorema e tipico a questo riguardo. Concerne l’estensionedi un operatore lineare limitato T alla chiusura D(T ) del dominio tale che l’operatore estesosia nuovamente limitato e lineare e abbia anche la stessa norma. Cio include il caso dell’e-stensione da un insieme denso in uno spazio normato X a tutto X. Include anche il casodell’estensione da uno spazio normato X al suo completamento.

2.34 Teorema (Estensione Limitata Lineare)Sia

T : D(T ) → Y

un operatore limitato lineare, dove D(T ) giace in uno spazio normato X ed Y e uno spaziodi Banach. Allora T ha un’unica estensione continua alla chiusura di D(T )

T : D(T ) → Y.

Inoltre l’estensione T e un operatore limitato lineare di norma

||T || = ||T ||.

Dimostrazione. Consideriamo un qualunque x ∈ D(T ). Per il Teorema 1.12(a) v’e unasuccessione (xn) in D(T ) tale che xn → x. Poiche T e lineare e limitato abbiamo che

||Txn − Txm|| = ||T (xn − xm)|| ≤ ||T || ||xn − xm||.

Cio mostra che (Txn) e di Cauchy perche (xn) converge. Per ipotesi Y e completo cosı che(Txn) converge, ossia

Txn → y ∈ Y.

Quindi se l’estensione T esiste deve essere

T x = y.

Mostriamo che questa definizione non e ambigua, e cioe indipendente dalla particolare succes-sione scelta in D(T ) convergente a x. Supponiamo che xn → x e zn → x. Allora xn−zn → 0.Poiche T e lineare e limitato abbiamo che

||Txn − Tzn|| = ||T (xn − zn)|| ≤ ||T || ||xn − zn||

e le due successioni (Txn) e (Tzn) hanno il medesimo limite. Cio prova che T e univocamentedefinito per ogni x ∈ D(T ).

Chiaramente T e lineare e T x = Tx per ogni x ∈ D(T ), cosı che T e un estensione di T.Ora usiamo

||Txn|| ≤ ||T || ||xn||

2.9. FUNZIONALI LINEARI 35

e lasciamo n → ∞. Allora Txn → y = T x. Poiche x 7−→ ||x|| definisce un’applicazionecontinua otteniamo che

||T x|| ≤ ||T || ||x||.

Quindi T e limitato e ||T || ≤ ||T ||. Naturalmente ||T || ≥ ||T || perche la norma essendodefinita mediante un estremo superiore non puo decrescere in un’estensione. Assieme danno||T || = ||T ||.

2.9 Funzionali Lineari

Un funzionale e un operatore la cui immagine giace sulla linea reale R o nel piano complessoC. Inizialmente l’analisi funzionale era l’analisi dei funzionali. Questi ultimi appaiono cosıfrequentemente che viene usata una notazione specifica. Indichiamo i funzionali con le lettereminuscole f, g, h, · · · , il dominio di f con D(f), l’immagine con R(f) ed il valore di f in xcon f(x), con le parentesi.

I funzionali sono operatori cosicche si applicano le definizioni precedenti. Avremo inparticolare bisogno delle seguenti due definizioni perche la maggioranza dei funzionali checonsidereremo saranno lineari e limitati.

2.35 Definizione (Funzionale Lineare)Un funzionale lineare f e un operatore lineare definito in uno spazio vettoriale X conimmagine nel campo scalare K di X; cosı

f : X → K,

dove K = R se X e reale e K = C se X e complesso.Se X e un sottospazio lineare di uno spazio vettoriale piu ampio, si indica con D(f) e si

chiama dominio di definizione di f .

2.36 Definizione (Funzionali Limitati Lineari)Un funzionale limitato lineare f e un operatore limitato lineare (cf. Def. 2.28) con immaginenel campo scalare dello spazio normato X. Percio esiste un numero reale c tale che per tuttigli x ∈ X

|f(x)| ≤ c||x||. (2.21)

Inoltre la norma di f e (cf. (2.15) nella Sez. 2.8)

||f || = supx∈Xx 6=0

|f(x)|||x|| (2.22)

o||f || = sup

x∈X||x||=1

|f(x)|. (2.23)

La formula (2.16) nella Sez. 2.8 ora implica che

|f(x)| ≤ ||f || ||x||, (2.24)

ed il Teorema 2.32 viene riformulato nel modo seguente.

36 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

2.37 Teorema (Continuita e Limitatezza)Un funzionale lineare f con dominio D(f) in uno spazio normato e continuo se e solo se fe limitato.

Il lemma seguente valido sia nel caso finito ed che infinito dimensionale trova utile appli-cazione nel seguito. Un lemma simile per spazi normati arbitrari sara dato piu in la, nellasezione 4.10.

2.38 Lemma (Vettore Nullo)Sia X uno spazio vettoriale. Se x0 ∈ X ha la proprieta che f(x0) = 0 per tutti i funzionalilineari f su X allora x0 = 0.

Dimostrazione. Supponiamo per assurdo che x0 6= 0. Allora se X e finito dimensionale x0

si puo esprimere come combinazione lineare dei vettori di base, ossia x0 =∑n

j=1 ξjej , dovegli scalari ξj non sono tutti nulli. Sia ad esempio ξ1 6= 0. Se X e infinito dimensionalee necessario ammettere che esso sia dotato di una base di Hamel B, cio che dimostreremosolamente nel seguito utilizzando il Lemma di Zorn. Debbono esistere quindi vettori indi-pendenti in numero finito, che chiameremo ancora ej , appartenenti a B che generano x0 epossiamo ripetere l’argomentazione precedente. Consideriamo ora il funzionale lineare f1

che sui vettori della base B assume i valori

f1(e1) = 1f1(b) = 0 per ogni b ∈ B, b 6= e1

.

Esso viene esteso a tutti i vettori x ∈ X utilizzando la linearita ed il fatto che ogni x puoessere espresso come combinazione lineare di un numero finito di vettori della base B. E ora

f1(x0) = ξ1 6= 0,

ma cio contraddice l’ipotesi e quindi dall’assurdo segue che x0 = 0.

E di basilare importanza che l’insieme di tutti i funzionali lineari definiti su uno spaziovettoriale X possa esso stesso essere fatto spazio vettoriale. Questo spazio e denotato con X∗

ed e chiamato spazio duale algebrico1 di X. Le operazioni algebriche di spazio vettorialesono definite in maniera naturale nel modo seguente. La somma f1 + f2 di due funzionalif1 e f2 e il funzionale s il cui valore ad ogni x ∈ X e

s(x) = (f1 + f2)(x) = f1(x) + f2(x);

il prodotto αf di uno scalare α e di un funzionale f e il funzionale p il cui valore in x ∈ X e

p(x) = (αf)(x) = αf(x).

Si noti che cio concorda con il modo usuale di sommare funzioni e di moltiplicarle percostanti.

Possiamo fare ancora un passo innanzi e considerare il duale algebrico (X∗)∗ di X∗, i cuielementi sono i funzionali lineari definiti su X∗. Indichiamo (X∗)∗ con X∗∗ e lo chiamiamolo spazio biduale algebrico di X.

Perche consideriamo X∗∗? Il punto e che possiamo ottenere una relazione interessanteed importante fra X e X∗∗. Scegliamo la notazione

1Si noti che questa definizione non involve una norma. Il cosiddetto spazio duale X′ consistente di tuttii funzionali limitati lineari su X sara considerato nella Sez. 2.11.

2.9. FUNZIONALI LINEARI 37

Spazio Generico elemento Valore in un puntoX x −X∗ f f(x)X∗∗ g g(f)

Possiamo ottenere un g ∈ X∗∗, che e un funzionale lineare definito su X∗, scegliendo unx ∈ X fisso e ponendo

g(f) = gx(f) = f(x) (x ∈ X fisso, f ∈ X∗ variabile). (2.25)

L’indice x serve a ricordare che abbiamo ottenuto g coll’uso di un certo x ∈ X. Il lettoredeve tenere ben presente che qui f e la variabile mentre x e fisso. Tenendo cio in mente nondovrebbe avere difficolta a capire la nostra presente considerazione.

gx come definito dalla (2.25) e lineare. Cio puo essere visto dalla

gx(αf1 + βf2) = (αf1 + βf2)(x) = αf1(x) + βf2(x) = αgx(f1) + βgx(f2).

Quindi gx e un elemento di X∗∗, per definizione di X∗∗.A ciascun x ∈ X corrisponde un gx ∈ X∗∗. Cio definisce un’applicazione

C : X → X∗∗

x 7−→ gx.

C e chiamata l’applicazione canonica di X in X∗∗.C e lineare perche il suo dominio e uno spazio vettoriale ed abbiamo

(C(αx + βy)) (f) = gαx+βy(f)= f(αx + βy)= αf(x) + βf(y)= αgx(f) + βgy(f)= α(Cx)(f) + β(Cy)(f).

C e anche iniettiva. Infatti se Cx0 = 0 abbiamo che per tutti gli f ∈ X∗

(Cx0)(f) = gx0(f) = f(x0) = 0.

Cio implica x0 = 0 per il Lemma precedente e quindi dal Teorema 2.26 segue la iniettivitadella C.

C e chiamato l’immersione (embedding) canonica di X in X∗∗. Per comprendere e mo-tivare questo termine spieghiamo dapprima il concetto di “isomorfismo”, che e di interessegenerale.

Nel nostro lavoro ci occupiamo di diversi spazi. Comune a tutti loro e il fatto che essiconsistono di un insieme, chiamiamolo X, e di una “struttura” definita su X. Per uno spaziometrico questa e una metrica. Per uno spazio vettoriale le due operazioni algebriche formanola struttura. Per uno spazio normato la struttura consiste di queste due operazioni algebrichee della norma.

Dati due spazi X e X dello stesso tipo (ad esempio appunto due spazi metrici o vettorialio normati) e di interesse sapere quando essi possano essere considerati “essenzialmenteidentici”, cioe quando essi si possano considerare coincidenti per quanto riguarda la lorostruttura e differenti al piu per la natura dei loro punti, ossia quando essi possano essereconsiderati due realizzazioni del medesimo oggetto “astratto”.

38 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Una risposta matematicamente precisa e data dall’introduzione del concetto di isomor-fismo. Per definizione si tratta di un’applicazione biiettiva di X su X che conserva lastruttura.

Corrispondentemente un isomorfismo T di uno spazio metrico X = (X, d) su uno spaziometrico X = (X, d) e un’applicazione biiettiva che conserva la distanza, cioe per tutti glix, y ∈ X

d(Tx, Ty) = d(x, y).

X e allora detto isomorfo ad X. Cio non ci e nuovo ma si tratta semplicemente di un altronome per l’isometria introdotta nella Def. 1.16. Nuovo e il seguito.

Un isomorfismo T di uno spazio vettoriale X su uno spazio vettoriale X sul medesimocampo e un’applicazione biiettiva che conserva le due operazioni algebriche dello spaziovettoriale; cosı per tutti gli x, y ∈ X e scalari α

T (x + y) = Tx + Ty, T (αx) = αTx,

cioe T : X → X e un operatore biiettivo lineare. X e allora detto isomorfo ad X ed X e Xsono detti spazi vettoriali isomorfi.

Isomorfismi fra spazi normati sono isomorfismi fra spazi vettoriali che conservano anchele norme.

Al momento possiamo utilizzare il concetto di isomorfismo fra spazi vettoriali come segue.Poiche C e lineare e iniettiva e un isomorfismo di X sull’immagine R(C) ⊂ X∗∗.Se X e isomorfo ad un sottospazio di uno spazio vettoriale Y diciamo che X e immergi-

bile (embeddable) in Y. Quindi X e immergibile in X∗∗ e C e anche chiamato l’immersione(embedding) canonica di X in X∗∗.

Se C e surgettiva cosı che R(C) = X∗∗ allora X e detto algebricamente riflessivo.Proveremo nella prossima sezione che se X e finito dimensionale allora X e algebricamenteriflessivo.

Una discussione simile che involve le norme e che conduce al concetto di riflessivita di unospazio normato sara presentato nella Sez. 4.6 dopo avere sviluppato gli strumenti necessari(in particolare il famoso teorema di Hahn–Banach).

2.10 Operatori Lineari e Funzionali su Spazi Finito Di-mensionali

Siano X e Y spazi vettoriali finito dimensionali sul medesimo campo e T : X → Y unoperatore lineare. Scegliamo una base E = {e1, · · · , en} per X ed una base B = {b1, · · · , br}per Y . Allora ogni x ∈ X ha un’unica rappresentazione

x = ξ1e1 + · · ·+ ξnen. (2.26)

Poiche T e lineare x ha l’immagine

y = Tx = T

(n∑

k=1

ξkek

)=

n∑

k=1

ξkTek. (2.27)

Poiche la rappresentazione (2.26) e unica otteniamo il nostro primo risultato.T e unicamente determinato se le immagini yk = Tek degli n vettori di base sono

assegnate.

2.10. OPERATORI LINEARI E FUNZIONALI SU SPAZI FINITO DIMENSIONALI 39

Poiche y e yk = Tek sono in Y essi hanno un’unica rappresentazione della forma

y =r∑

j=1

ηjbj (2.28)

Tek =r∑

j=1

τ jkbj . (2.29)

Sostituendo in (2.27) si ottiene

y =r∑

j=1

ηjbj =n∑

k=1

ξkTek =n∑

k=1

ξk

r∑

j=1

τ jkbj =r∑

j=1

(n∑

k=1

τ jkξk

)bj .

Poiche le bj formano un insieme linearmente indipendente, i coefficienti di ciascun bj a destrae a sinistra devono essere gli stessi, cioe

ηj =n∑

k=1

τ jkξk j = 1, · · · , r. (2.30)

Cio fornisce il nostro risultato successivo.L’immagine y = Tx =

∑ηjbj di x =

∑ξkek puo essere ottenuto dalla (2.30).

Si noti la posizione inusuale dell’indice di somma j di τ jk in (2.29), che e necessaria perarrivare alla posizione usuale dell’indice di somma nella (2.30).

I coefficienti nella (2.30) formano una matrice

TEB = (τ jk)

con r righe ed n colonne. Se sono assegnate una base E di X ed una base B di Y , allora lamatrice TEB e univocamente determinata dall’operatore lineare T. Diciamo che la matriceTEB rappresenta l’operatore T rispetto a queste basi.

Introducendo i vettori colonna x = (ξk) e y = (ηj) possiamo scrivere la (2.30) in notazionematriciale

y = TEBx. (2.31)

Analogamente anche (2.29) puo essere scritta in forma matriciale

Te = T>EBb (2.32)

dove Te e il vettore colonna con componenti Te1, · · · , T en (che sono essi stessi vettori) e b eil vettore colonna di componenti b1, · · · , br e dove dobbiamo usare il trasposto T>EB di TEB

perche nella (2.29) sommiamo su j che e il primo indice.Le nostre considerazioni mostrano che un operatore lineare T determina un’unica matrice

rappresentante T rispetto ad una data base per X ed ad una data base per Y . Viceversaogni matrice con r righe ed n colonne determina un operatore lineare che essa rappresentarispetto a basi date per X e Y.

Ritorniamo ora ai funzionali lineari su X, dove dim X = n e {e1, · · · , en} e una baseper X come prima. Questi funzionali costituiscono lo spazio algebrico duale X∗ di X comesappiamo dalla sezione precedente. Per ogni tale funzionale e per ogni x =

∑ξjej ∈ X

abbiamo

f(x) = f

n∑

j=1

ξjej

=

n∑

j=1

ξjf(ej) =n∑

j=1

ξjαj (2.33)

40 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

doveαj = f(ej) j = 1, · · · , n (2.34)

ed f e unicamente determinata dai suoi valori αj sugli n vettori di base di X.Viceversa ogni n–pla di scalari α1, · · · , αn determina un funzionale lineare su X per le

(2.33), (2.34). In particolare prendiamo le n–ple

(1, 0, 0, · · · 0, 0)(0, 1, 0, · · · 0, 0)· · · · · · · ·(0, 0, 0, · · · 0, 1).

Per le (2.33), (2.34) cio fornisce n funzionali che denotiamo f1, · · · , fn e che hanno valori

fk(ej) = δjk ={

0 se j 6= k1 se j = k; (2.35)

cioe fk ha il valore 1 al k–mo vettore di base e il valore 0 agli altri n − 1 vettori di base.δjk e chiamato la delta di Kroneker. {f1, · · · , fn} e chiamato la base duale della base{e1, · · · , en} per X. Cio e giustificato dal seguente teorema.

2.39 Teorema (Dimensioni di X∗)Sia X uno spazio vettoriale n–dimensionale ed E = {e1, · · · , en} una base per X. AlloraF = {f1, · · · , fn} data dalla (2.35) e una base per l’algebrico duale X∗.di X e dim X∗ =dim X = n.

Dimostrazione. F e un insieme linearmente indipendente perche

n∑

k=1

βkfk(x) = 0 (x ∈ X) (2.36)

per x = ej dan∑

k=1

βkfk(ej) =n∑

k=1

βkδjk = βj = 0,

cosı che tutte le βk in (2.36) sono zero. Mostriamo che ogni f ∈ X∗ puo essere rappresentatacome una combinazione lineare degli elementi di F in una maniera unica. Scriviamo comein (2.34) f(ej) = αj . Per la (2.33)

f(x) =n∑

j=1

ξjαj

per ogni x ∈ X. D’altra parte per la (2.35) otteniamo che

fj(x) = fj(ξ1e1 + · · · ξnen) = ξj .

Dal confronto

f(x) =n∑

j=1

αjfj(x).

Quindi la rappresentazione unica di un arbitrario funzionale lineare f su X in termini deifunzionali f1, · · · , fn e

f = α1f1 + · · ·αnfn.

2.11. SPAZI NORMATI DI OPERATORI. SPAZIO DUALE 41

Usando questo teorema ed il lemma 2.38 possiamo ottenere il seguente teorema.

2.40 Teorema (Riflessivita Algebrica)Ogni spazio vettoriale finito dimensionale e algebricamente riflessivo.

Dimostrazione. L’applicazione canonica C : X → X∗∗ considerata nella sezione precedentee lineare e iniettiva. Quindi dal Teorema 2.26 segue che l’applicazione C ha un inversolineare C−1 : R(C) → X, dove R(C) e l’immagine di C. Abbiamo anche per il medesimoteorema che dimR(C) = dim X. Ora per il Teorema 2.39

dim X∗∗ = dim X∗ = dim X.

Confrontando, dim R(C) = dim X∗∗. Quindi R(C) = X∗∗ perche, se R(C) fosse un sotto-spazio proprio di X∗∗, per il Teorema2.4 avrebbe dimensioni minori di X∗∗, che e impossibile.Cio prova la riflessivita algebrica.

2.11 Spazi Normati di Operatori. Spazio Duale

In che caso lo spazio normato B(X,Y ) delle applicazioni lineari limitate di X in Y e unospazio di Banach? Questa e una domanda centrale a cui si risponde nel seguente teorema. Erimarchevole che le ipotesi del teorema non coinvolgano X; ossia X puo essere o non esserecompleto.

2.41 Teorema (Completezza)Se Y e uno spazio di Banach allora B(X,Y ) e uno spazio di Banach.

Dimostrazione. Consideriamo una successione arbitraria di Cauchy (Tn) in B(X, Y ) e mo-striamo che (Tn) converge ad un operatore T ∈ B(X, Y ). Poiche (Tn) e di Cauchy, per ogniε > 0 v’e un N tale che

||Tn − Tm|| < ε (n, m > N).

Per tutti gli x ∈ X ed n,m > N otteniamo cosı [cf. (2.16) nella Sez. 2.8]

||Tnx− Tmx|| = ||(Tn − Tm)x|| ≤ ||Tn − Tm|| ||x|| < ε||x||. (2.37)

Ora per ogni x fisso e per un dato ε possiamo scegliere un ε = εx tale che εx||x|| < ε. Alloradalla (2.37) abbiamo ||Tnx − Tmx|| < ε e vediamo che (Tnx) e di Cauchy in Y. Poiche Y ecompleto (Tnx) converge, ossia Tnx → y. Chiaramente il limite y ∈ Y dipende dalla sceltadi x ∈ X. Cio definisce un operatore T : X → Y, dove y = Tx. L’operatore T e lineareperche

limTn(αx + βz) = lim(αTnx + βTnz) = α lim Tnx + β lim Tnz.

Proviamo che T e limitato e che Tn → T, ossia che ||Tn − T || → 0.Poiche la (2.37) vale per ogni m > N e Tmx → Tx possiamo fare m → ∞. Usando la

continuita della norma allora otteniamo dalla (2.37) per ogni n > N e per tutti gli x ∈ X

||Tnx− Tx|| = ||Tnx− limm→∞

Tmx|| = limm→∞

||Tnx− Tmx|| ≤ ε||x||. (2.38)

Cio mostra che (Tn − T ) con n > N e un operatore limitato. Poiche Tn e limitato T =Tn−(Tn−T ) e limitato, ossia T ∈ B(X, Y ). Inoltre se in (2.38) prendiamo l’estremo superioreper tutti gli x di norma 1 otteniamo

||Tn − T || ≤ ε (n > N).

42 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

Quindi ||Tn − T || → 0.

Questo teorema ha importanti conseguenze rispetto allo spazio duale X ′ di X, che edefinito come segue.

2.42 Definizione (Spazio Duale X ′)Sia X uno spazio normato. Allora l’insieme di tutti i funzionali lineari limitati su Xcostituisce uno spazio normato con norma definita da

||f || = supx∈Xx 6=0

|f(x)|||x|| = sup

x∈X||x||=1

|f(x)| (2.39)

[cf. (2.22) e (2.23) nella Sez. 2.9] che e chiamato la spazio duale2 di X ed e indicato conX ′.

Poiche un funzionale lineare su X applica X in R o C (i campi scalari di X) e poiche R eC presi colla metrica usuale sono completi vediamo che X ′ e B(X, Y ) con lo spazio completoY = R o C. Quindi il Teorema 2.41 e applicabile ed implica il basilare teorema seguente.

2.43 Teorema (Spazio Duale)Lo spazio duale X ′ di uno spazio normato X e uno spazio di Banach (lo sia o no X).

Costituisce un principio fondamentale dell’analisi funzionale che lo studio degli spazi siaspesso combinato con quello dei loro duali.

In particolare, ricordando la discussione sullo spazio algebrico biduale X∗∗ nella Sez.2.9, ci possiamo chiedere se sia utile considerare X ′′ = (X ′)′ lo spazio biduale di X. Larisposta e positiva ma dobbiamo posporre questa discussione alla Sez. 4.6 dove sviluppiamogli strumenti necessari per ottenere dei risultati sostanziosi in questa direzione.

Problemi

1. Mostrare che nello spazio delle n-ple x = (ξ1, ξ2, . . . , ξn) reali o complesse possibilinorme sono

||x||p = (|ξ1|p + |ξ2|p + . . . |ξn|p)1/p (1 ≤ p < +∞)||x||∞ = max (|ξ1| , |ξ2| , . . . |ξn|) .

2. Mostrare che lo spazio `p (1 ≤ p < +∞) delle n-ple infinite x = (ξ1, ξ2, . . . , ξn, . . . ),per le quali

∑∞j=1

∣∣ξj

∣∣p < ∞, ammette norma

||x|| =

∞∑

j=1

∣∣ξj

∣∣p

1/p

.

Suggerimento: Conviene considerare il caso p = 1 a parte e per p 6= 1 introdurre ql’esponente coniugato di p definito da

1p

+1q

= 1.

2Altri termini sono duale, spazio aggiunto e spazio coniugato. Si ricordi dalla Sez. 2.9 che lo spazio dualealgebrico X∗ e lo spazio vettoriale di tutti i funzionali lineari su X.

2.11. SPAZI NORMATI DI OPERATORI. SPAZIO DUALE 43

Per dimostrare la diseguaglianza triangolare conviene dapprima dimostrare la disegua-glianza ausiliaria

αβ ≤ αp

p+

βq

q

valida per α ≥ 0, β ≥ 0 qualunque ed utilizzarla per dimostrare la diseguaglianza diHolder

∞∑

j=1

∣∣ξjηj

∣∣ ≤

∞∑

j=1

∣∣ξj

∣∣p

1/p ( ∞∑

k=1

|ηk|q)1/q

.

Successivamente si dimostra la diseguaglianza di Minkowski

∞∑

j=1

∣∣ξj + ηj

∣∣p

1/p

∞∑

j=1

∣∣ξj

∣∣p

1/p

+

( ∞∑

k=1

|ηk|p)1/p

e quindi la diseguaglianza triangolare.

3. Nel caso in cui T sia una matrice n × n di elementi (τ jk), che opera sullo spazio Cn,mostrare che una possibile norma e data da

||T || =

n∑

j,k=1

|τ jk|2

1/2

,

norma che tuttavia, come vedremo al capitolo sugli spazi con prodotto scalare, noncorrisponde alla norma naturale definita dalla norma euclidea in Cn.

4. Nel caso in cui T sia una matrice n × n di elementi (τ jk), che opera sullo spazio Cn

della n-ple complesse x = (ξ1, ξ2, . . . , ξn) in cui sia introdotta la norma

||x|| =n∑

k=1

|ξk|,

mostrare che la norma naturale e data da

||T || = maxk

n∑

j=1

|τ jk|.

5. Mostrare che lo spazio `∞ delle n-ple infinite x = (ξ1, ξ2, . . . , ξn, . . . ), per le quali||x|| = supj∈N

∣∣ξj

∣∣ < ∞, ammette norma

||x|| = supj∈N

∣∣ξj

∣∣ .

6. Mostrare che lo spazio C[a, b] delle funzioni u (t) continue nell’intervallo [a, b] ammettenorma

||u|| = maxt∈[a,b]

|u (t)| .

7. Mostrare che gli spazi `p ed `∞ sono spazi di Banach.

Suggerimento: Mostrare che le componenti j-sime ξ(n)j di una successione di Cauchy

x(n) costituiscono una successione di Cauchy, che converge alla componente j-sima dellimite cercato della successione x(n).

44 CAPITOLO 2. SPAZI NORMATI. SPAZI DI BANACH

8. Mostrare che lo spazio `∞ non e separabile.

Suggerimento: Si consideri il sottoinsieme M di `∞ costituito dagli elementi y =(η1, η2, . . . , ηn, . . .

)con ηj = 0 o ηj = 1. Si osservi che la distanza fra due qualunque

elementi del sottoinsieme e 1 e che mediante la formula

y =η1

2+

η2

22+ · · ·+ ηn

2n+ . . .

si stabilisce una corrispondenza biiettiva fra M ed i numeri reali y dell’intervallo [0, 1].Poiche quindi l’insieme M non e numerabile . . .

9. Mostrare che lo spazio `p e separabile.

Suggerimento: Mostrare che lo spazio numerabile M di `p costituito dagli elementiy =

(η1, η2, . . . , ηn, 0, 0, . . .

)con n qualunque e ηj razionale o complesso razionale e

denso in `p.

10. Mostrare che la chiusura Y di un sottospazio vettoriale Y di uno spazio normato X eancora un sottospazio vettoriale.

11. Se dim Y < ∞ nel Lemma di Riesz mostrare che si puo anche scegliere θ = 1.

12. Sia X lo spazio dei polinomi x (t) in J = [0, 1] con norma

||x|| = maxt∈J

|x (t)|

e sia T : X → X l’operatore differenziazione Tx(t) = x′(t). Mostrare che T e linearenon e limitato.

Suggerimento: Considerare l’azione di T sui polinomi xn(t) = tn.

13. Si consideri l’operatore integrale T : x (t) ∈ C[0, 1] 7→ y (t) ∈ C[0, 1] definito da

y (t) =∫ 1

0

k (t, τ)x (τ) dτ

con k (t, τ) continua nel quadrato J × J . Mostrare che T e lineare e limitato e che||T || ≤ k0 con k0 = max(t,τ)∈J×J |k (t, τ)| .

14. Sia X = C[a, b]. Mostrare che

f (x) =∫ b

a

x (t) dt

e un funzionale lineare limitato e che ||f || = (b− a).

15. Sia X = C[a, b]. Mostrare chef(x) = x (t0) ,

dove t0 e un punto fisso di [a, b], e un funzionale lineare limitato e che ||f || = 1.

Capitolo 3

Spazi con Prodotto Scalare.Spazi di Hilbert

Gli spazi con prodotto scalare sono, come vedremo, degli speciali spazi normati. Storicamen-te sono piu vecchi degli spazi normati generali. La loro teoria e piu ricca e conserva moltidegli aspetti dello spazio euclideo, un concetto centrale essendo l’ortogonalita. In effetti glispazi con prodotto scalare sono la generalizzazione piu naturale dello spazio euclideo.

Questi spazi sono stati sino ad ora gli spazi piu utili nelle applicazioni pratiche dell’analisifunzionale.

3.1 Breve Orientamento sul Principale Contenuto dellaTeoria

Uno spazio con prodotto scalare X e uno spazio vettoriale dotato di prodotto scalare 〈x, y〉.Quest’ultimo generalizza il prodotto scalare di vettori nello spazio tridimensionale ed e usatoper definire

(I) una norma || · || con ||x|| = 〈x, x〉1/2.

(II) l’ortogonalita con 〈x, y〉 = 0.

Uno spazio di Hilbert H e uno spazio con prodotto scalare completo.La teoria degli spazi con prodotto scalare e degli spazi di Hilbert e piu ricca di quella

degli spazi normati generali e degli spazi di Banach. Ci occuperemo

(i) della rappresentazione di H come somma diretta di un sottospazio chiuso e del suocomplemento ortogonale,

(ii) degli insiemi e successioni ortogonali e corrispondenti rappresentazioni degli elementidi H,

(iii) della rappresentazione di Riesz dei funzionali limitati lineari mediante il prodottoscalare,

(iv) dell’operatore aggiunto di Hilbert T ∗ di un operatore limitato lineare.

Vedremo che gli insiemi e le successioni ortogonali sono veramente interessanti solo sesono totali e che gli operatori aggiunti di Hilbert possono essere usati per definire classi dioperatori (autoaggiunti, unitari, normali) che sono di grande importanza nelle applicazioni.

45

46 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

3.2 Spazi con Prodotto Scalare, Spazio di Hilbert

3.1 Definizione (Spazi con Prodotto Scalare)Uno spazio con prodotto scalare (o pre-hilbertiano) e uno spazio vettoriale X dotato diprodotto scalare. Un prodotto scalare su X e un’applicazione che associa ad ogni coppiadi vettori x e y uno scalare che viene scritto 〈x, y〉 ed e chiamato prodotto scalare (o prodottointerno) di x e y, tale che per tutti i vettori x, y, z e scalari α si ha

(IP1) 〈x, y + z〉 = 〈x, y〉+ 〈y, z〉(IP2) 〈x, αy〉 = α〈x, y〉(IP3) 〈x, y〉 = 〈y, x〉

(IP4)〈x, x〉 ≥ 0〈x, x〉 = 0 ⇐⇒ x = 0.

In (IP3) la barra indica il complesso coniugato. Di conseguenza se X e uno spaziovettoriale reale abbiamo semplicemente che

〈x, y〉 = 〈y, x〉 (Simmetria).

Un prodotto scalare su X definisce una norma su X data da

||x|| =√〈x, x〉 (≥ 0) (3.1)

e quindi una metrica su X data da

d(x, y) = ||x− y|| =√〈x− y, x− y〉. (3.2)

La prova che (3.1) soddisfa agli assiomi da (N1) a (N4) di una norma sara data all’iniziodella prossima sezione.

Quindi gli spazi con prodotto scalare sono spazi normati.

3.2 Definizione (Spazio di Hilbert)Uno spazio con prodotto scalare che sia completo (completo nella metrica definita dalprodotto scalare; cf. (3.2)) si dice spazio di Hilbert.

Da (IP1) a (IP3) otteniamo le formule

〈x, αy + βz〉 = α〈x, y〉+ β〈x, z〉 (3.3)〈αx, y〉 = α〈x, y〉 (3.4)

〈αx + βy, z〉 = α〈x, z〉+ β〈y, z〉 (3.5)

che useremo molto spesso. (3.3) mostra che il prodotto scalare e lineare nel secondo fattore.Poiche in (3.5) abbiamo a destra i numeri complessi coniugati α e β diciamo che il prodottoscalare e coniugato lineare nel primo fattore. Riferendosi ad entrambe le proprieta diciamoche il prodotto scalare e sesquilineare. Cio significa “1 1

2 volte lineare” ed e motivato dalfatto che “coniugato lineare” e anche noto come “semilineare”, un termine meno suggestivoche non useremo.

Il lettore puo mostrare con un semplice calcolo diretto che la norma in uno spazio conprodotto scalare soddisfa l’importante uguaglianza del parallelogramma

||x + y||2 + ||x− y||2 = 2(||x||2 + ||y||2). (3.6)

3.2. SPAZI CON PRODOTTO SCALARE, SPAZIO DI HILBERT 47

-

¸ *

R

x + y x− y

x

y

Figura 3.1: Uguaglianza del parallelogramma

Questo nome e suggerito dalla geometria elementare, come si vede dalla figura 3.1, se ri-cordiamo che la norma generalizza il concetto elementare di lunghezza di un vettore. Edel tutto rimarchevole che una tale equazione continui a valere nel nostro caso molto piugenerale.

Concludiamo che se una norma non soddisfa la (3.6) essa non puo essere ottenuta daun prodotto scalare con l’uso della (3.1). Queste norme effettivamente esistono. Possiamopercio dire che non tutti gli spazi normati sono spazi dotati di prodotto scalare.

Definiamo ora il concetto di ortogonalita che e basilare in tutta la teoria. Sappiamo chese il prodotto scalare di due vettori nello spazio tridimensionale e zero allora i vettori sonoortogonali, cioe sono perpendicolari o almeno uno di essi e il vettore nullo. Cio suggerisce emotiva la seguente definizione.

3.3 Definizione (Ortogonalita)Un elemento x di uno spazio X con prodotto scalare e detto ortogonale ad un elementoy ∈ X se

〈y, x〉 = 0.

Diciamo anche che x e y sono ortogonali e scriviamo x ⊥ y. Analogamente per sottoinsiemiA,B ⊂ X scriviamo x ⊥ A se x ⊥ a per tutti gli a ∈ A ed A ⊥ B se a ⊥ b per tutti glia ∈ A e per tutti i b ∈ B.

Per due elementi ortogonali x, y e facile ottenere la relazione di Pitagora

||x + y||2 = ||x||2 + ||y||2.

Piu in generale se {x1, · · · , xn} e un insieme ortogonale allora

||x1 + · · ·+ xn||2 = ||x1||2 + · · ·+ ||xn||2.

Infatti 〈xj , xk〉 = 0 se j 6= k e di conseguenza

∥∥∥∥∑

j

xj

∥∥∥∥2

=

⟨∑

j

xj ,∑

k

xk

⟩=

j

k

〈xj , xk〉 =∑

j

〈xj , xj〉 =∑

j

||xj ||2

(la somma va da 1 a n).Infine menzioniamo il seguente fatto interessante. Il prodotto scalare puo essere espresso

esplicitamente in funzione della norma data dalla (3.1). Infatti il lettore puo verificare conun calcolo diretto che per un prodotto scalare reale abbiamo

〈x, y〉 =14(||x + y||2 − ||x− y||2) (3.7)

48 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

e per un prodotto scalare complesso

<〈x, y〉 =14(||x + y||2 − ||x− y||2)

=〈x, y〉 =14(||x− iy||2 − ||x + iy||2)

(3.8)

dove <〈x, y〉 e =〈x, y〉 indicano la parte reale ed immaginaria. La formula (3.8) e talvoltachiamata identita di polarizzazione.

3.3 Ulteriori Proprieta degli Spazi con Prodotto Scalare

Prima di tutto dovremmo verificare che la (3.1) della sezione precedente definisce una norma.(N1) e (N2) seguono dalla (IP4). Inoltre (N3) e ottenuto coll’uso di (IP2) e (IP3); infatti

||αx||2 = 〈αx, αx〉 = αα〈x, x〉 = |α|2||x||2.

Infine (N4) e incluso nel seguente Lemma.

3.4 Lemma (Diseguaglianza di Schwarz, Diseguaglianza Triangolare)Un prodotto scalare e la corrispondente norma soddisfano la diseguaglianza di Schwarz e ladiseguaglianza triangolare secondo quanto segue.

(a) Abbiamo|〈x, y〉| ≤ ||x|| ||y|| (Diseguaglianza di Schwarz) (3.9)

dove il segno uguale vale se e solo se {x, y} e un insieme linearmente dipendente.

(b) Questa norma soddisfa anche

||x + y|| ≤ ||x||+ ||y|| (Disuguaglianza Triangolare) (3.10)

dove il segno d’eguale vale se e solo se1 y = 0 o x = cy (c reale e ≥ 0).

Dimostrazione. (a) Se y = 0 allora la (3.9) vale perche 〈x, 0〉 = 0. Sia y 6= 0. Per ogni scalareα abbiamo

0 ≤ ||x− αy||2 = 〈x− αy, x− αy〉= 〈x, x〉 − α〈x, y〉 − α[〈y, x〉 − α〈y, y〉].

Vediamo che l’espressione nella parentesi [· · · ] e zero se scegliamo α = 〈y, x〉/〈y, y〉. Ladisuguaglianza risultante e

0 ≤ 〈x, x〉 − 〈y, x〉〈y, y〉 〈x, y〉 = ||x||2 − |〈x, y〉|2

||y||2 ,

dove abbiamo usato 〈y, x〉 = 〈x, y〉. Moltiplicando per ||y||2, trasferendo l’ultimo termine asinistra e prendendo la radice si ottiene la (3.9).

L’uguaglianza vale in questa derivazione se e solo se y = 0 o 0 = ||x − αy||2, quindix− αy = 0, cosı che x = αy, che mostra la dipendenza lineare.

1Si noti che questa condizione per l’eguaglianza e perfettamente “simmetrica” in x e y perche x = 0 eincluso in x = cy (per c = 0) ed e pure y = kx, k = 1/c (per c > 0).

3.3. ULTERIORI PROPRIETA DEGLI SPAZI CON PRODOTTO SCALARE 49

(b) Proviamo la (3.10). Abbiamo

||x + y||2 = 〈x + y, x + y〉 = ||x||2 + 〈x, y〉+ 〈y, x〉+ ||y||2 = ||x||2 + 2Re〈x, y〉+ ||y||2.

Poiche Re〈x, y〉 ≤ |〈x, y〉| e a sua volta per la disuguaglianza di Schwarz

|〈x, y〉| ≤ ||x|| ||y||

otteniamo

||x + y||2 ≤ ||x||2 + 2|〈x, y〉|+ ||y||2≤ ||x||2 + 2||x|| ||y||+ ||y||2= (||x||+ ||y||)2.

Prendendo la radice di entrambi i membri abbiamo la (3.10).L’eguaglianza in questa derivazione vale se e solo se

Re〈x, y〉 = ||x|| ||y||.

Da cio e dalla (3.9)Re〈x, y〉 = ||x|| ||y|| ≥ |〈x, y〉|. (3.11)

Poiche la parte reale di un numero complesso non puo essere maggiore del suo modulodobbiamo avere l’uguaglianza. il che implica la dipendenza lineare per la parte (a), cioey = 0 o x = cy. Mostriamo che c e reale e ≥ 0. Dalla (3.11) col segno d’uguale abbiamoRe〈x, y〉 = |〈x, y〉|. Ma se la parte reale di un numero complesso e uguale al suo modulo laparte immaginaria deve essere zero. Quindi 〈x, y〉 = Re〈x, y〉 ≥ 0 per la (3.11) e c ≥ 0 segueda

0 ≤ 〈x, y〉 = 〈cy, y〉 = c||y||2.La disuguaglianza di Schwarz (3.9) e molto importante e sara utilizzata nelle dimostra-

zioni piu e piu volte.Un’altra proprieta frequentemente usata e la continuita del prodotto scalare.

3.5 Lemma (Continuita del Prodotto Scalare)Il prodotto scalare 〈y, x〉 con y fissato definisce un funzionale lineare f(x) = 〈y, x〉 su Xlimitato e quindi continuo, che ha norma ||f || = ||y||.Dimostrazione. Escludiamo il caso banale y = 0. Per la disuguaglianza di Schwarz e

|f(x)| = |〈y, x〉| ≤ ||y|| ||x|| (3.12)

e quindi f e limitata con norma ||f || ≤ ||y||. Essendo altresı

||f || = supx 6=0

|〈y, x〉|||x|| ≥ |〈y, y〉|

||y|| = ||y|| (3.13)

ne deduciamo che ||f || = ||y||.Dalla proprieta (IP3) segue immediatamente che il prodotto scalare 〈y, x〉 e continuo

anche in y. Si noti infine come il prodotto scalare sia in grado di discriminare fra due vettoridiversi. Cio e messo in evidenza dal seguente Lemma.

50 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

3.6 Lemma (Eguaglianza)Se 〈y, x1〉 = 〈y, x2〉 per tutti gli y in uno spazio con prodotto scalare X allora x1 = x2. Inparticolare 〈y, x〉 = 0 per tutti gli y ∈ X implica x = 0.

Dimostrazione. Per ipotesi per tutti gli y

〈y, x1 − x2〉 = 〈y, x1〉 − 〈y, x2〉 = 0.

Per y = x1 − x2 cio da ||x1 − x2||2 = 0. Quindi x1 − x2 = 0. In particolare 〈y, x〉 = 0 cony = x da ||x||2 = 0, cosı che x = 0.

Si noti come da questo Lemma si deduca immediatamente che i funzionali lineari f(x) suX siano in grado di discriminare fra due punti x1 ed x2 di X nel senso che se f(x1) = f(x2)per tutti gli f allora x1 = x2. Infatti fra tutti i possibili funzionali lineari vi sono quelliesprimibili come prodotto scalare e quindi si applica il Lemma precedente.

3.4 Definizione Equivalente di Spazio con Prodotto Sca-lare

Uno spazio pre-Hilbertiano (o con prodotto scalare) puo essere definito in maniera equiva-lente come segue.

3.7 Definizione (Spazio pre-Hilbertiano)Uno spazio normato X (reale o complesso) e chiamato spazio pre-hilbertiano se la sua normasoddisfa all’uguaglianza del parallelogramma

||x + y||2 + ||x− y||2 = 2(||x||2 + ||y||2). (3.14)

L’equivalenza di questa definizione con la definizione 3.1 e provata dal seguente teoremae suo corollario.

3.8 Teorema (Spazio pre-Hilbertiano Reale)Definiamo in uno spazio normato reale X, che soddisfa all’uguaglianza del parallelogramma,

〈x, y〉 =14(||x + y||2 − ||x− y||2). (3.15)

Allora 〈x, y〉 soddisfa a tutte le proprieta richieste al prodotto scalare, da (IP1) a (IP4).

Dimostrazione. (IP3) e (IP4) sono evidenti. Per ottenere la (IP1) osserviamo dapprima chedalla (3.15) segue

〈x, y〉+ 〈x, z〉 =14(||x + y||2 − ||x− y||2 + ||x + z||2 − ||x− z||2).

Se ora notiamo che

x± y =(

x± y + z

2

)± y − z

2

x± z =(

x± y + z

2

)∓ y − z

2

3.4. DEFINIZIONE EQUIVALENTE DI SPAZIO CON PRODOTTO SCALARE 51

otteniamo utilizzando l’uguaglianza del parallelogramma

〈x, y〉+ 〈x, z〉 =12

(∥∥∥∥x +y + z

2

∥∥∥∥2

−∥∥∥∥x− y + z

2

∥∥∥∥2)

ed infine per la (3.15)

〈x, y〉+ 〈x, z〉 = 2⟨

x,y + z

2

⟩. (3.16)

Se prendiamo y = 0 otteniamo 〈x, z〉 = 2⟨x, z

2

⟩, perche 〈x, 0〉 = 0 per la (3.15). Quindi

dalla (3.16) otteniamo (IP1). Dalla (IP1) segue che per m intero positivo qualunque

〈x, mz〉 = m〈x, z〉

e quindi la (IP2) vale per un numero razionale positivo qualunque α = mn , perche

〈x,z

n〉 =

n

n〈x,

z

n〉 =

1n〈x, z〉.

Poiche dalla definizione (3.15) segue che 〈x,−z〉 = −〈x, z〉, la (IP2) vale anche per un numerorazionale negativo qualunque.

In uno spazio normato ||x+αy||2 e ||x−αy||2 sono continui in α e quindi per la (3.15) an-che 〈x, αy〉 e continuo in α. Poiche ogni reale α si puo ottenere come limite di una successionedi numeri razionali, anche (IP2) e provata.

3.9 Corollario (Spazio pre-Hilbertiano Complesso)Definiamo in uno spazio normato complesso X, che soddisfa all’uguaglianza del parallelo-gramma,

〈x, y〉 = 〈x, y〉1 − i〈x, iy〉1 (3.17)

dove

〈x, y〉1 =14(||x + y||2 − ||x− y||2). (3.18)

Allora 〈x, y〉 soddisfa a tutte le proprieta richieste al prodotto scalare, da (IP1) a (IP4).

Dimostrazione. Poiche X e anche uno spazio pre-hilbertiano reale 〈x, y〉1 e 〈x, iy〉1 e quindi〈x, y〉 soddisfano a (IP1) e a (IP2) per α reale. Per la (3.18) abbiamo 〈y, x〉1 = 〈x, y〉1,〈ix, iy〉1 = 〈x, y〉1 e quindi 〈y, ix〉1 = 〈−iiy, ix〉1 = −〈iy, x〉1 = −〈x, iy〉1. Percio

〈y, x〉 = 〈y, x〉1 − i〈y, ix〉1 = 〈x, y〉1 + i〈x, iy〉1 = 〈x, y〉

e vale (IP3). Analogamente abbiamo

〈x, iy〉 = 〈x, iy〉1 − i〈x, iiy〉1 = 〈x, iy〉1 + i〈x, y〉1 = i〈x, y〉

e quindi abbiamo provato la (IP2) per α complesso. Infine vale la (IP4) perche

〈x, x〉1 = ||x||2 e 〈x, ix〉1 =14(|1 + i|2 − |1− i|2)||x||2 = 0.

52 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

3.5 Completamento di uno Spazio con Prodotto Scalare

Ogni spazio con prodotto scalare puo essere completato. Il completamento e uno spazio diHilbert ed e unico a meno di isomorfismi. La definizione di isomorfismo e qui la seguente(come suggerito dalla nostra discussione nella Sez. 2.9).

Un isomorfismo T di uno spazio con prodotto scalare X su uno spazio con prodottoscalare X sullo stesso campo e un operatore lineare biiettivo T : X → X che conserva ilprodotto scalare, cioe tale che per tutti gli x, y ∈ X

〈Tx, Ty〉 = 〈x, y〉,

dove per semplicita indichiamo con lo stesso simbolo il prodotto scalare su X e su X . Xe allora detto isomorfo ad X e X ed X sono detti spazi con prodotto scalare isomorfi. Siosservi che la biiettivita e la linearita garantiscono che T e un isomorfismo fra spazi vettorialidi X su X, cosı che T conserva l’intera struttura di spazio con prodotto scalare. T e ancheun’isometria di X su X perche le distanze in X e X sono determinate dalle norme definitea mezzo dei prodotti scalari in X ed X.

Il teorema sul completamento di spazi con prodotto scalare, la cui dimostrazione lostudente interessato puo trovare sulla versione estesa delle dispense, puo ora esser formulatocome segue.

3.10 Teorema (Completamento)Per un qualunque spazio con prodotto scalare X esiste uno spazio di Hilbert H ed unisomorfismo A da X su un sottospazio denso W ⊂ H. Lo spazio H e unico a meno diisomorfismi.

Un sottospazio Y di uno spazio con prodotto scalare X e definito come un sottospaziovettoriale di X preso con il prodotto scalare su X ristretto a Y × Y.

Analogamente un sottospazio Y di uno spazio di Hilbert H e definito come un sotto-spazio di H, considerato come uno spazio con prodotto scalare. Si noti che Y non e neces-sariamente uno spazio di Hilbert perche Y puo non essere completo. Infatti dai Teoremi 2.8e 2.11 ricaviamo immediatamente le affermazioni (a) e (b) del seguente teorema.

3.11 Teorema (Sottospazio)Sia Y un sottospazio di uno spazio di Hilbert H. Ne segue

(a) Y e completo se e solo se Y e chiuso in H.

(b) Se Y e finito dimensionale allora Y e completo.

(c) Se H e separabile lo e anche Y. Piu generalmente ogni sottoinsieme di uno spazio conprodotto scalare separabile e separabile.

La semplice dimostrazione di (c) e lasciata al lettore.

3.6 Complemento Ortogonale e Somma Diretta

In uno spazio metrico X la distanza δ di un elemento x ∈ X da un sottospazio non vuotoM ⊂ X e definita essere

δ = infy∈M

d(x, y) (M 6= ∅).

3.6. COMPLEMENTO ORTOGONALE E SOMMA DIRETTA 53

.........................

x

δ

M

Non v’e y

.......................

x

δ

yM

Un solo y

.........................

.........................

..........................

x

yy

δ δ

M

Infiniti y

Figura 3.2: Vettore minimizzante

In uno spazio normato cio diventa

δ = infy∈M

||x− y||. (3.19)

Vedremo che e importante sapere se v’e un y ∈ M tale che

δ = ||x− y||, (3.20)

ossia, parlando intuitivamente, se v’e un punto y ∈ M che sia il piu vicino ad un dato xe se, esistendo questo punto, esso sia unico. Questo e un problema di esistenza ed unicita.Esso e di fondamentale importanza sia teorica che applicativa, ad esempio in connessionecon l’approssimazione delle funzioni.

La figura 3.2 illustra il fatto che anche in uno spazio molto semplice come lo spazioeuclideo R3 vi puo non essere alcun y che soddisfa la (3.20) od anche uno solo o piu diuno. Possiamo aspettarci che in altri spazi, in particolare negli spazi multidimensionali,vi possano essere a questo riguardo situazioni anche piu complicate. Per un generico spazionormato questo e il caso (come si puo vedere), ma per gli spazi di Hilbert la situazione rimanerelativamente semplice. Questo fatto e sorprendente ed ha diverse conseguenze teoriche epratiche. Ed e una delle ragioni per cui la teoria degli spazi di Hilbert e piu semplice diquella dei generici spazi di Banach.

Per considerare il problema di esistenza ed unicita per gli spazi di Hilbert e per formulareil teorema chiave (3.12, qui di seguito) abbiamo bisogno di due concetti collegati, che sonodi interesse generale.

Il segmento che congiunge due dati elementi x e y di uno spazio vettoriale X e definitocome l’insieme di tutti gli z ∈ X della forma

z = (1− α)x + αy (α ∈ R, 0 ≤ α ≤ 1).

Un sottoinsieme M di X e detto convesso se per ogni x, y ∈ M il segmento che congiungex e y e contenuto in M.

54 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Per esempio ogni sottospazio Y di X e convesso e l’intersezione di spazi convessi econvesso.

Possiamo ora fornire il principale strumento di questa sezione.

3.12 Teorema (Vettore Minimizzante)Sia X uno spazio con prodotto scalare ed M 6= ∅ un sottoinsieme convesso completo (nellametrica indotta dal prodotto scalare). Allora per ogni dato x ∈ X esiste un unico y ∈ Mtale che

δ = infy∈M

||x− y|| = ||x− y||. (3.21)

Dimostrazione. (a) Esistenza. Per definizione di estremo inferiore v’e una successione (yn)in M tale che

δn → δ dove δn = ||x− yn||. (3.22)

Mostriamo che (yn) e di Cauchy. Ponendo yn − x = vn abbiamo yn − ym = vn − vm e perl’uguaglianza del parallelogramma

||yn − ym||2 = ||vn − vm||2 = −||vn + vm||2 + 2(||vn||2 + ||vm||2). (3.23)

Osserviamo che e che

||vn + vm|| = ||yn + ym − 2x|| = 2∣∣∣∣∣∣∣∣12(yn + ym)− x

∣∣∣∣∣∣∣∣ ≥ 2δ (3.24)

perche 12 (yn + ym) ∈ M , essendo M convesso. Ricordando che ||vn|| = δn, abbiamo quindi

dalle (3.23) e (3.24)||yn − ym||2 ≤ −(2δ)2 + 2(δ2

n + δ2m),

che per la (3.22) implica che (yn) e di Cauchy. Poiche M e completo (yn) converge, ossiayn → y ∈ M. Questo e l’y cercato. Infatti per la continuita della norma e per la (3.22)otteniamo che

||x− y|| = limn→∞

||x− yn|| = limn→∞

δn = δ.

(b) Unicita. Assumiamo che entrambi y ∈ M e y0 ∈ M soddisfino

||x− y|| = δ e ||x− y0|| = δ

e mostriamo che allora y0 = y. Per l’eguaglianza del parallelogramma

||y − y0||2 = ||(y − x)− (y0 − x)||2= 2||y − x||2 + 2||y0 − x||2 − ||(y − x) + (y0 − x)||2

= 2δ2 + 2δ2 − 22

∥∥∥∥12(y + y0)− x

∥∥∥∥2

.

A destra 12 (y + y0) ∈ M, cosı che

∥∥∥∥12(y + y0)− x

∥∥∥∥ ≥ δ.

Cio implica che il membro a destra e minore od uguale a 2δ2+2δ2−4δ2 = 0. Quindi abbiamola diseguaglianza ||y − y0||2 ≤ 0, ossia y0 = y.

3.6. COMPLEMENTO ORTOGONALE E SOMMA DIRETTA 55

Passando dagli spazi convessi arbitrari ai sottospazı otteniamo il lemma che generalizzal’idea familiare della geometria elementare che l’unico punto y in un sottospazio dato Y piuvicino ad un dato x viene trovato “tracciando una perpendicolare da x a Y ”.

3.13 Lemma (Ortogonalita)Nel teorema 3.12 sia M un sottospazio completo Y e sia x ∈ X fissato. Allora z = x− y eortogonale a Y.

Dimostrazione. Se z ⊥ Y fosse falso vi sarebbe un y1 ∈ Y tale che

〈y1, z〉 = β 6= 0. (3.25)

Chiaramente y1 6= 0 perche altrimenti 〈y1, z〉 = 0. Inoltre per ogni scalare α

||z − αy1||2 = 〈z − αy1, z − αy1〉= 〈z, z〉 − α〈z, y1〉 − α[〈y1, z〉 − α〈y1, y1〉]= 〈z, z〉 − αβ − α[β − α〈y1, y1〉].

L’espressione in parentesi e zero se scegliamo

α =β

〈y1, y1〉 .

Dalla (3.21) abbiamo ||z|| = ||x− y|| = δ cosı che la nostra equazione ora ci da

||z − αy1||2 = ||z||2 − |β|2〈y1, y1〉 < δ2.

Ma questo e impossibile perche abbiamo

z − αy1 = x− y2 dove y2 = y + αy1 ∈ Y,

cosı che ||z−αy1|| ≥ δ per definizione di δ. Quindi (3.25) non puo essere valida ed il lemmae dimostrato.

E sovente utile rappresentare uno spazio di Hilbert come somma diretta di due sotto-spazi. Questa decomposizione risulta essere particolarmente semplice e conveniente se vienerealizzata utilizzando l’ortogonalita. Per comprendere la situazione ed il problema intro-duciamo dapprima il concetto di somma diretta. Questo concetto ha senso per qualunquespazio vettoriale ed e definito come segue.

3.14 Definizione (Somma Diretta)Uno spazio vettoriale X e detto somma diretta di due sottospazi Y e Z di X e si scrive

X = Y ⊕ Z

se ciascun x ∈ X ha un’unica rappresentazione

x = y + z y ∈ Y, z ∈ Z.

Allora Z e chiamato un complemento algebrico di Y in X e viceversa, e Y,Z e chiamato unacoppia complementare di sottospazi in X.

Ad esempio Y = R e un sottospazio del piano euclideo R2. Chiaramente Y ha infiniti di-versi complementi algebrici in R2, ciascuno dei quali e una retta reale. Ma il piu convenientee un complemento che e perpendicolare.

56 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Analogamente nel caso di uno spazio generale di Hilbert H l’interesse principale ri-guarda le rappresentazioni di H come somma diretta di un sottospazio chiuso Y e del suocomplemento ortogonale

Y ⊥ = {z ∈ H : z ⊥ Y },

che e l’insieme di tutti i vettori ortogonali a Y. Questo e il maggior risultato in questa sezione,che e qualche volta chiamato il teorema della proiezione per ragioni che spiegheremo dopola dimostrazione.

3.15 Teorema (Somma Diretta)Sia Y un qualunque sottospazio di uno spazio di Hilbert H. Allora

H = Y ⊕ Z Z = Y ⊥. (3.26)

Dimostrazione. Poiche H e completo e Y e chiuso, Y e completo per il Teorema 1.13. PoicheY e convesso il Teorema 3.12 ed il Lemma 3.13 implicano che per ogni x ∈ H v’e un y ∈ Ytale che

x = y + z z ∈ Y⊥

. (3.27)

Notiamo ora che Y⊥

= Y ⊥ perche se v ⊥ Y , per la continuita del prodotto scalare, e anchev ⊥ Y .

Rimane quindi da provare l’unicita della decomposizione (3.27). Assumiamo sia

x = y + z = y1 + z1

dove y, y1 ∈ Y e z, z1 ∈ Z. Allora y − y1 = z1 − z. Poiche y − y1 ∈ Y mentre z1 − z ∈ Z =Y ⊥ = Y

⊥vediamo che y − y1 ∈ Y ∩ Y

⊥= {0}. Cio implica y = y1. Quindi anche z = z1.

In genere questo teorema si utilizza nel caso in cui Y e chiuso. E allora

H = Y ⊕ Y ⊥

e la decomposizione ortogonale di x si scrive

x = y + z y ∈ Y, z ∈ Y ⊥. (3.28)

y in (3.28) e chiamato, con terminologia presa a prestito dalla geometria elementare, laproiezione ortogonale di x su Y (o brevemente la proiezione di x su Y ).

L’equazione (3.28) definisce un’applicazione

P : H → Y

x 7−→ y = Px.

P e chiamato l’operatore di proiezione ortogonale di H su Y.L’operatore lineare P e limitato con norma ||P || = 1. Infatti, poiche y e z sono ortogonali,

abbiamo||Px|| = ||y|| ≤

√||y||2 + ||z||2 = ||x|| per ogni x ∈ H,

cioe P e limitato con norma ||P || ≤ 1. Per x = y e ||Py|| = ||y|| e quindi ||P || = 1.Si noti che la restrizione di P a Y e l’operatore identita su Y essendo

Py = y, per ogni y ∈ Y

3.6. COMPLEMENTO ORTOGONALE E SOMMA DIRETTA 57

e che P e idempotente, ossiaP 2 = P,

essendoP 2x = P (Px) = Py = y = Px, per ogni x ∈ H.

InoltrePz = 0, per ogni z ∈ Z = Y ⊥.

Un discorso perfettamente analogo si puo ripetere per l’operatore I−P che e il proiettoreortogonale su Z = Y ⊥.

Riportiamo ora alcune osservazioni sui complementi ortogonali, che saranno utili nelseguito. Sia M 6= ∅ un sottoinsieme (non necessariamente un sottospazio) di uno spazio conprodotto scalare X e sia M⊥ il suo complemento ortogonale, ossia l’insieme

M⊥ = {x ∈ X : 〈x, v〉 = 0, ∀v ∈ M}.

Si noti che M⊥ e uno spazio vettoriale poiche x, y ∈ M⊥ implica per tutti i v ∈ M e pertutti gli scalari α, β

〈v, αx + βy〉 = α〈v, x〉+ β〈v, y〉 = 0

e quindi αx + βy ∈ M⊥.M⊥ e inoltre chiuso come il lettore puo provare utilizzando la continuita del prodotto

scalare.Scriviamo M⊥⊥ per indicare (M⊥)⊥. In generale abbiamo

M ⊂ M⊥⊥. (3.29)

Infatti sex ∈ M =⇒ x ⊥ M⊥ =⇒ x ∈ (M⊥)⊥

cioe M ⊂ M⊥⊥. Inoltre se x ∈ M allora esiste una successione (xn) di M tale che xn → x.Per la continuita del prodotto scalare, poiche xn ⊥ M⊥ anche x ⊥ M⊥ e quindi x ∈ M⊥⊥.

Nel caso in cui M sia un sottospazio possiamo formulare il seguente lemma.

3.16 Lemma (Doppio Complemento Ortogonale)Se Y e un sottospazio di uno spazio di Hilbert H allora

Y = Y ⊥⊥. (3.30)

Dimostrazione. Y ⊂ Y ⊥⊥ per la (3.29). Mostriamo che Y ⊃ Y ⊥⊥. Sia x ∈ Y ⊥⊥. Allora peril teorema 3.15 possiamo scrivere per x la decomposizione ortogonale x = y + z , dove y ∈ Ye z ∈ Y ⊥. Ma x ∈ Y ⊥⊥ per assunzione ed y ∈ Y ⊥⊥ perche per la (3.29) Y ⊂ Y ⊥⊥ e quindi,poiche Y ⊥⊥ e uno spazio vettoriale, anche z = x− y ∈ Y ⊥⊥. Essendo z ∈ Y ⊥ abbiamo chez ⊥ z e quindi z = 0 cosı che x = y, ossia x ∈ Y . Poiche x ∈ Y ⊥⊥ era arbitrario cio provache Y ⊃ Y ⊥⊥.

Il Teorema 3.15 ed il Lemma conseguente 3.16 implicano facilmente una caratterizzazionedegli insiemi negli spazi di Hilbert il cui span e denso, che e la seguente.

58 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

3.17 Lemma (Insieme Denso)Per ogni sottoinsieme M 6= ∅ di uno spazio di Hilbert H lo span V di M e denso in H se esolo se M⊥ = {0}.Dimostrazione. (a) Assumiamo che V = span M sia denso in H, ossia assumiamo V = H.Essendo V ⊥ = V

⊥per il Teorema 3.15 possiamo scrivere H = V ⊥⊕V ⊥⊥, ma per il Lemma

3.16 e V ⊥⊥ = V e quindi, essendo H = V , ne segue che V ⊥ = {0}. Poiche V ⊥ ⊃ M⊥, ciomostra che M⊥ = {0}.

(b) Viceversa supponiamo che M⊥ = {0}. Se x ⊥ V allora x ⊥ M cosı che x ∈ M⊥

e x = 0. Quindi V ⊥ = {0}. Per il Teorema 3.15 abbiamo che H = V ⊕ V ⊥. Ma essendoV ⊥ = {0} otteniamo H = V , cioe V e denso in H.

3.7 Insiemi e Successioni Ortonormali

3.18 Definizione (Insiemi e Successioni Ortogonali)Un insieme ortogonale M in uno spazio con prodotto scalare X e un sottoinsieme M ⊂ Xi cui elementi sono a due a due ortogonali. Un insieme ortonormale M ⊂ X e un insiemeortogonale in X i cui elementi hanno norma 1, ossia per tutti gli x, y ∈ M

〈x, y〉 ={

0 se x 6= y1 se x = y.

(3.31)

Se un insieme ortogonale o ortonormale M e numerabile possiamo ordinarlo in unasuccessione (xn) e chiamarlo, rispettivamente, successione ortogonale o ortonormale.

Piu in generale un insieme con indice, o famiglia, (xα), α ∈ I, e chiamato ortogonale sexα ⊥ xβ per tutti gli α, β ∈ I, α 6= β. La famiglia e chiamata ortonormale se e ortogonale etutti gli xα hanno norma 1, cosı che per tutti gli α, β ∈ I abbiamo

〈xα, xβ〉 = δαβ ={

0 se α 6= β1 se α = β.

, (3.32)

dove δαβ e la delta di Kronecker.Consideriamo ora alcune semplici proprieta degli insiemi ortogonali e ortonormali.

3.19 Lemma (Indipendenza Lineare)Un insieme ortonormale e linearmente indipendente.

Dimostrazione. Sia {e1, · · · , en} ortonormale e consideriamo l’equazione

α1e1 + · · ·+ αnen = 0.

Moltiplicando per un ej fisso si ottiene⟨

ej ,∑

k

αkek

⟩=

k

αk〈ej , ek〉 = αj〈ej , ej〉 = αj = 0

cio che prova l’indipendenza lineare per ogni insieme finito o infinito ortonormale.Un grande vantaggio delle successioni ortonormali rispetto alle successioni arbitrarie

linearmente indipendenti e il seguente. Se sappiamo che un dato x puo essere rappre-sentato come una combinazione lineare di alcuni elementi di una successione ortonormale,allora la ortonormalita rende l’effettiva determinazione dei coefficienti molto facile. Infatti

3.7. INSIEMI E SUCCESSIONI ORTONORMALI 59

se {e1, · · · , en} e una successione ortonormale in uno spazio con prodotto scalare X e seabbiamo che x ∈ span{e1, · · · , en}, dove n e fisso, allora per la definizione di span

x =n∑

k=1

αkek, (3.33)

e se calcoliamo il prodotto scalare per un ej fisso otteniamo

〈ej , x〉 =

⟨ej ,

n∑

k=1

αkek

⟩=

n∑

k=1

αk〈ej , ek〉 = αj .

Con questi coefficienti la (3.33) diventa

x =n∑

k=1

〈ek, x〉ek. (3.34)

L’utilizzo di un insieme ortonormale risulta vantaggioso anche quando di un elemento x ∈span {e1, · · · , en+1} si conosca gia la proiezione x sul sottospazio span {e1, · · · , en} espressasecondo (3.34). E allora

x = x + αn+1en+1

con αn+1 = 〈en+1, x〉 e quindi per esprimere x come combinazione lineare degli ek rimaneda calcolare solamente questo coefficiente mentre gli altri rimangono invariati.

3.20 Teorema (Diseguaglianza di Bessel)Sia (ek) una successione ortonormale in uno spazio con prodotto scalare X. Allora per ognix ∈ X, il vettore y ∈ Yn = span{e1, · · · , en} che ha distanza minima da x e

y =n∑

k=1

〈ek, x〉ek, (3.35)

e vale ∞∑

k=1

|〈ek, x〉|2 ≤ ||x||2 (Diseguaglianza di Bessel). (3.36)

I prodotti scalari 〈ek, x〉 nella (3.36) sono chiamati i coefficienti di Fourier di x rispettoalla successione ortonormale (ek).

Dimostrazione. Per un generico y ∈ Yn

y =n∑

k=1

αkek

abbiamo, grazie all’ortonormalita degli ek,

||x− y||2 =

⟨x−

n∑

k=1

αkek, x−n∑

k=1

αkek

= ||x||2 −n∑

k=1

αk〈ek, x〉 −n∑

k=1

αk〈x, ek〉+n∑

k=1

|αk|2

= ||x||2 −n∑

k=1

|〈ek, x〉|2 +n∑

k=1

|〈ek, x〉 − αk|2.

60 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Quindi il vettore di Yn che ha distanza minima da x e quello definito in (3.35).Poiche ||x− y||2 ≥ 0 abbiamo per ogni n = 1, 2, · · ·

n∑

k=1

|〈ek, x〉|2 ≤ ||x||2. (3.37)

Questa somma ha termini non negativi e percio forma una successione monotona non de-crescente. Questa successione converge perche e limitata da ||x||2. Quindi la (3.37) implicala diseguaglianza di Bessel (3.36).

Si noti che la (3.35) si puo ottenere piu direttamente osservando che grazie al Teorema3.12 ed al Lemma 3.13 si puo scrivere per ogni x ∈ X

x =n∑

k=1

αkek + z (3.38)

ove y =∑n

k=1 αkek ha distanza minima da x e z ⊥ Yn. I coefficienti αk si ottengonocalcolando il prodotto scalare della (3.38) con ej (j = 1, 2, . . . n).

Si noti che se X e finito dimensionale allora ogni insieme ortonormale in X, essendolinearmente indipendente per il Lemma 3.19, deve essere finito. Quindi in questo caso in(3.36) abbiamo una somma finita.

Osserviamo infine che, grazie al Lemma 3.13, z = x − y⊥y. Cio si puo anche mostraredirettamente. Notiamo dapprima che per l’ortonormalita

||y||2 =

⟨n∑

k=1

〈ek, x〉ek,

n∑m=1

〈em, x〉em

⟩=

n∑

k=1

|〈ek, x〉|2. (3.39)

Quindi, usando questa formula, otteniamo

〈y, z〉 = 〈y, x− y〉 = 〈y, x〉 − 〈y, y〉

=

⟨n∑

k=1

〈ek, x〉ek, x

⟩− ||y||2

=n∑

k=1

〈ek, x〉〈ek, x〉 −n∑

k=1

|〈ek, x〉|2

= 0

ossia z ⊥ y.Abbiamo visto che le successioni ortonormali sono molto convenienti da utilizzare. Rima-

ne il problema pratico di come ottenere una successione ortonormale se e data un’arbitrariasuccessione linearmente indipendente. Cio si ottiene mediante un procedimento costruttivo,il processo di Gram-Schmidt per ortonormalizzare una successione linearmente indipen-dente (xj) in uno spazio con prodotto scalare. La successione ortonormale risultante (en)ha la proprieta che per ogni n

span{e1, · · · , en} = span{x1, · · · , xn}.

Il processo e il seguente.Primo passo. Il primo elemento di (en) e

e1 =1

||x1||x1.

3.8. SERIE COLLEGATE A SUCCESSIONI E INSIEMI ORTONORMALI 61

Secondo passo. x2 puo esser scritto

x2 = 〈e1, x2〉e1 + v2.

Allorav2 = x2 − 〈e1, x2〉e1

non e il vettore nullo perche (xj) e linearmente indipendente; inoltre v2 ⊥ e1 perche 〈e1, v2〉 =0 cosı che possiamo prendere

e2 =1

||v2||v2.

Passo n-mo. Il vettore

vn = xn −n−1∑

k=1

〈ek, xn〉ek (3.40)

non e nullo ed e ortogonale a e1, · · · , en−1. Quindi otteniamo

en =1

||vn||vn. (3.41)

Si noti che la somma che viene sottratta nel membro a destra della (3.40) e la proiezionedi xn sullo span{e1, · · · , en−1}. In altre parole ad ogni passo sottraiamo a xn la sua “com-ponente” nella direzione dei vettori precedentemente ortonormalizzati. Cio da vn che e poimoltiplicato per 1/||vn|| in modo da ottenere un vettore di norma uno. vn per n qualunquenon puo essere un vettore nullo. Infatti se n fosse il piu piccolo indice per cui vn = 0 allorala (3.40) mostrerebbe che xn sarebbe una combinazione lineare degli e1, · · · , en−1 e quindiuna combinazione lineare degli x1, · · · , xn−1 contraddicendo l’assunzione che {x1, · · · , xn}e linearmente indipendente.

3.8 Serie Collegate a Successioni e Insiemi Ortonormali

In questa sezione consideriamo dapprima le serie collegate alle successioni ortonormali e poiestendiamo i risultati ottenuti agli insiemi ortonormali non numerabili.

Data una successione ortonormale (en) in uno spazio di Hilbert H possiamo considerarela serie della forma ∞∑

k=1

αkek (3.42)

dove gli α1, α2, · · · sono scalari qualunque. In accordo con la definizione data nella Sez. 2.3una tale serie converge ed ha la somma s se esiste un s ∈ H tale che la successione (sn)delle somme parziali

sn = α1e1 + · · ·+ αnen

converge a s, ossia ||s− sn|| → 0 per n →∞.

3.21 Teorema (Convergenza)Sia (en) una successione ortonormale in uno spazio di Hilbert H. Allora

(a) La serie (3.42) converge se e solo se la seguente serie∞∑

k=1

|αk|2 (3.43)

62 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

converge.

(b) Se la (3.42) converge e si indica con x la sua somma, allora i coefficienti αk sono icoefficienti di Fourier 〈x, ek〉 di x e si puo scrivere

x =∞∑

k=1

〈ek, x〉ek. (3.44)

(c) Per qualsiasi x ∈ H la serie (3.42) con αk = 〈ek, x〉 converge (non necessariamente ax).

(d) Dato un qualsiasi x ∈ H condizione necessaria e sufficiente perche sia

x =∞∑

k=1

〈ek, x〉ek

e che sia

‖x‖2 =∞∑

k=1

|〈ek, x〉|2 . (3.45)

Dimostrazione. (a) Siano

sn = α1e1 + · · ·+ αnen e σn = |α1|2 + · · ·+ |αn|2.

Allora a causa dell’ortonormalita per qualsiasi m e n > m

||sn − sm||2 = ||αm+1em+1 + · · ·+ αnen||2= |αm+1|2 + · · ·+ |αn|2 = σn − σm.

Quindi (sn) e di Cauchy in H se e solo se (σn) e di Cauchy in R. Poiche H e R sono completine segue la prima affermazione del teorema.

(b) Sia αk un generico ma fisso coefficiente della serie. Prendendo il prodotto scalare diun qualunque sn con n ≥ k e di ek ed usando l’ortonormalita abbiamo che

〈ek, sn〉 = αk per ogni n ≥ k.

Per ipotesi sn → x. Poiche il prodotto scalare e continuo

αk = 〈ek, sn〉 → 〈ek, x〉

come si voleva dimostrare.(c) Dalla diseguaglianza di Bessel nel Teorema 3.20 segue la convergenza della serie

∞∑

k=1

|〈ek, x〉|2.

Da cio e da (a) concludiamo che (c) deve esser valido.(d) Se e x =

∑∞k=1〈ek, x〉ek allora per la norma di x possiamo scrivere

||x||2 =

⟨x,

∞∑

k=1

〈ek, x〉ek

⟩,

3.8. SERIE COLLEGATE A SUCCESSIONI E INSIEMI ORTONORMALI 63

da cui utilizzando la continuita del prodotto scalare otteniamo la (3.45). Se viceversa e‖x‖2 =

∑∞k=1 |〈ek, x〉|2 consideriamo

∥∥∥∥x−∞∑

k=1

〈ek, x〉ek

∥∥∥∥2

=

⟨x−

∞∑

k=1

〈ek, x〉ek, x−∞∑

j=1

〈ej , x〉ej

⟩.

Utilizzando la continuita del prodotto scalare e l’ortonormalita della successione {en} otte-niamo ∥∥∥∥x−

∞∑

k=1

〈ek, x〉ek

∥∥∥∥2

= ‖x||2 −∞∑

k=1

|〈ek, x〉|2

e quindi x =∑∞

k=1〈ek, x〉ek come volevasi dimostrare.Se una famiglia ortonormale (eτ ), τ ∈ I, in uno spazio con prodotto scalare X non

e numerabile (perche l’insieme di indici I non e numerabile) possiamo ancora formare icoefficienti di Fourier 〈eτ , x〉 di un x ∈ X. In questo caso possiamo provare il rimarchevoleTeorema seguente.

3.22 Teorema (Coefficienti di Fourier)Un qualsiasi x in uno spazio con prodotto scalare X puo avere, rispetto ad una famigliaortonormale (eτ ), τ ∈ I, in X, al piu una quantita numerabile di coefficienti di Fourier〈eτ , x〉 diversi da zero.

Se, per un qualsiasi x ∈ X considerato fisso, si ordinano gli eτ con 〈eτ , x〉 6= 0 inuna successione ortonormale (e1, e2, · · · ) si possono considerare le quantita considerate neiparagrafi precedenti. In particolare vale la diseguaglianza di Bessel

τ∈I

|〈eτ , x〉|2 ≤ ||x||2

e se X e uno spazio di Hilbert la serie∑

τ∈I

〈eτ , x〉eτ (3.46)

converge. Inoltre la sua somma non dipende dall’ordine secondo cui gli eτ con coefficientedi Fourier diverso da zero sono inseriti nella successione.

Dimostrazione. Per ciascun fissato m = 1, 2, · · · il numero dei coefficienti di Fourier tali che|〈eτ , x〉| > 1/m deve essere finito, perche, qualora cio non fosse, vi sarebbe una successioneortonormale di eτ per la quale la serie

∑τ∈I |〈eτ , x〉|2 sarebbe divergente in contraddizione

colla disuguaglianza di Bessel (3.36) del Teorema 3.20. Pertanto i coefficienti di Fourier〈eτ , x〉, che siano diversi da zero, risultano costituire un insieme che e l’unione di una colle-zione numerabile di insiemi ciascuno con un numero finito di elementi e sono quindi al piunumerabili.

La convergenza della serie (3.46) segue dal Teorema 3.21.Sia ora (wn) un riordinamento di (en). Per definizione questo significa che v’e un’ap-

plicazione biiettiva n → m(n) di N in se stesso tale che i termini corrispondenti delle duesuccessioni sono uguali, cioe wm(n) = en. Poniamo

αn = 〈en, x〉, βm = 〈wm, x〉

e

x1 =∞∑

n=1

αnen, x2 =∞∑

m=1

βmwm.

64 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Allora per il Teorema 3.21(b),

αn = 〈en, x〉 = 〈en, x1〉, βm = 〈wm, x〉 = 〈wm, x2〉.

Poiche en = wm(n) otteniamo

〈en, x1 − x2〉 = 〈en, x1〉 − 〈wm(n), x2〉= 〈en, x〉 − 〈wm(n), x〉 = 0

e analogamente 〈wm, x1 − x2〉 = 0. Cio implica

||x1 − x2||2 = 〈∞∑

n=1

αnen −∞∑

m=1

βmwm, x1 − x2〉

=∞∑

n=1

αn〈en, x1 − x2〉 −∞∑

m=1

βm〈wm, x1 − x2〉 = 0.

Di conseguenza x1 − x2 = 0. Poiche il riordino (wm) di (en) era arbitrario cio completa ladimostrazione.

3.9 Basi Ortonormali

Gli insiemi ortonormali veramente interessanti negli spazi di Hilbert sono quelli che consi-stono di un numero “sufficientemente grande” di elementi perche ogni elemento dello spaziopossa essere rappresentato o approssimato con sufficiente accuratezza utilizzando questi in-siemi ortonormali. Per gli spazi finito dimensionali n–dimensionali la situazione e semplice;tutto cio di cui abbiamo bisogno e un insieme ortonormale di n elementi. Il problema equello di stabilire come si debba procedere nel caso di uno spazio infinito dimensionale. Iconcetti principali sono i seguenti.

3.23 Definizione (Base Ortonormale)Si dice base ortonormale in uno spazio di Hilbert H un insieme ortonormale M ⊂ H(successione o famiglia) il cui span e denso in H, ossia tale che

spanM = H.

E importante notare che, a meno che H non sia finito dimensionale, la base qui definitanon e una base nel senso dell’algebra cosı come e definita in 2.3, dove H deve essere conside-rato esclusivamente come uno spazio vettoriale. Questa definizione, tuttavia, e coerente conla definizione 2.7 di base in uno spazio semplicemente normato. Mostreremo, in particolare,che proprio l’ortonormalita degli elementi di M e la completezza di H garantiscono che unabase ortonormale sia una base anche secondo la definizione 2.7.

Ogni spazio di Hilbert H 6= {0} ammette una base ortonormale.Per uno spazio finito dimensionale H cio e chiaro. Per uno spazio H infinito dimensionale

separabile (cf. 1.6) cio segue dal procedimento di Gram–Schmidt per induzione (ordinaria).Per uno spazio H non separabile una prova (non costruttiva) segue dal lemma di Zorn, comevedremo nella Sez. 4.2, dove introduciamo e spieghiamo il lemma per altri fini.

Tutte le basi ortonormali in un dato spazio di Hilbert H 6= {0} hanno la medesimacardinalita. Quest’ultima e chiamata la dimensione di Hilbert o la dimensione ortogonaledi H. (Se H = {0} questa dimensione e definita come 0).

3.9. BASI ORTONORMALI 65

Per un H finito dimensionale l’affermazione e evidente perche allora la dimensione diHilbert e la dimensione nel senso dell’algebra. Per un H infinito dimensionale separabilel’affermazione seguira facilmente dal Teorema 3.26 (qui di seguito), mentre per un genericoH la dimostrazione richiede degli strumenti piu avanzati dalla teoria degli insiemi.

Il seguente teorema mostra che una base ortonormale non puo essere aumentata acostituire un insieme ortonormale piu esteso aggiungendo dei nuovi elementi.

3.24 Teorema (Criterio del complemento ortogonale)Sia M un insieme ortonormale di uno spazio di Hilbert H. Allora M e una base se e solose M⊥ = {0}.Dimostrazione. Segue immediatamente dal Lemma 3.17.

Un altro importante criterio perche un insieme ortonormale M sia una base si desumedal seguente teorema.

3.25 Teorema (Criterio di Parseval)Un insieme ortonormale M in uno spazio di Hilbert H e una base se e solo se per tutti glix ∈ H vale la relazione di Parseval

k

|〈ek, x〉|2 = ||x||2, (relazione di Parseval) (3.47)

o, equivalentemente per il punto (d) del Teorema 3.21, se e solo se

x =∑

k

〈ek, x〉ek, (3.48)

dove nel caso M sia non numerabile la somma si intende estesa su tutti i coefficienti diFourier non nulli di x rispetto a M .

Dimostrazione. (a) Sia soddisfatta la (3.47) per ogni x e supponiamo per assurdo che Mnon sia una base. Per il Teorema 3.24 v’e un x ⊥ M in X non nullo. Poiche x ⊥ M in(3.47) abbiamo 〈ek, x〉 = 0 per tutti i k, cosı che il membro a sinistra in (3.47) e nullo mentre||x||2 6= 0. Cio mostra che la (3.47) non vale. Dalla contraddizione segue che M deve essereuna base in H.

(b) Viceversa si assuma che M sia una base in H. Si consideri un qualunque x ∈ H ed isuoi coefficienti di Fourier non nulli ordinati in una successione 〈e1, x〉, 〈e2, x〉, · · · , o scrittiin un definito ordine se sono in numero finito. Definiamo ora y mediante

y =∑

k

〈ek, x〉ek (3.49)

notando che nel caso di una serie infinita la convergenza segue dal Teorema 3.21. Mostriamoche x− y ⊥ M. Per ogni ej che appare in (3.49) abbiamo, usando l’ortonormalita,

〈ej , x− y, 〉 = 〈ej , x〉 −∑

k

〈ek, x〉〈ej , ek〉 = 〈ej , x〉 − 〈ej , x〉 = 0.

Inoltre per ogni v ∈ M non contenuto in (3.49) abbiamo 〈v, x〉 = 0, cosı che

〈v, x− y〉 = 〈v, x〉 −∑

k

〈x, ek〉〈v, ek〉 = 0− 0 = 0.

66 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Quindi x − y ⊥ M, cioe x − y ∈ M⊥. Poiche M e una base in H abbiamo da 3.17 cheM⊥ = {0}. Di conseguenza x− y = 0, cioe x = y. Quindi per il punto (d) del Teorema 3.21abbiamo

||x||2 =∑

k

|〈ek, x〉|2.

Cio completa la dimostrazione.

Da questo teorema e dal punto (b) del Teorema 3.21, che garantisce l’unicita dell’espan-sione (3.48), discende che una base ortonormale e una base anche secondo la definizione2.7.

Passiamo ora a considerare gli spazi di Hilbert che sono separabili. Per la Def. 1.6 untale spazio contiene un sottoinsieme numerabile che e denso nello spazio. Gli spazi di Hilbertseparabili sono piu semplici di quelli non separabili perche non possono contenere insiemiortonormali non numerabili secondo quanto indicato dal seguente teorema.

3.26 Teorema (Spazi di Hilbert Separabili)Sia H uno spazio di Hilbert. Ne segue

(a) se H e separabile ogni insieme ortonormale in H e numerabile,

(b) se H contiene una successione ortonormale che e una base in H allora H e separabile.

Dimostrazione. (a) Sia H separabile e sia B un qualunque insieme numerabile denso in Hed M un qualunque insieme ortonormale. Allora due qualunque elementi distinti x e y diM hanno distanza

√2 perche

||x− y||2 = 〈x− y, x− y〉 = 〈x, x〉+ 〈y, y〉 = 2.

Quindi gli intorni sferici Nx di x e Ny di y di raggio√

2/3 sono disgiunti. Poiche B e densoin H v’e un bx ∈ B in Nx ed un by ∈ B in Ny e bx 6= by perche Nx

⋂Ny = ∅. Quindi se

M fosse non numerabile avremmo un insieme non numerabile di intorni sferici a due a duedisgiunti (per ciascun x ∈ M uno di essi), cosı che B sarebbe non numerabile contraddicendola separabilita di H. Da cio concludiamo che M deve essere numerabile.

(b) Sia (ek) una base ortonormale in H ed A l’insieme di tutte le combinazioni lineari

γ(n)1 e1 + · · ·+ γ(n)

n en n = 1, 2, · · ·

dove γ(n)k = a

(n)k + ib

(n)k e a

(n)k e b

(n)k sono razionali (e b

(n)k = 0 se H e reale). Chiaramente

A e numerabile. Proviamo che A e denso in H mostrando che per ogni x ∈ H ed ε > 0 v’eun v ∈ A tale che ||x− v|| < ε.

Poiche la successione (ek) e una base in H v’e un n tale che Yn = span{e1, · · · , en}contiene un elemento

y =n∑

k=1

αkek, dove αk =< x, ek >,

la cui distanza da x e minore di ε/2. Quindi abbiamo

∥∥∥∥x−n∑

k=1

αkek

∥∥∥∥ <ε

2.

3.9. BASI ORTONORMALI 67

Poiche i razionali sono densi su R per ciasun αk v’e un γ(n)k (con parte reale ed immagi-

naria razionale) tale che ∣∣∣αk − γ(n)k

∣∣∣ <ε

2n

ed abbiamo allora ∥∥∥∥n∑

k=1

[αk − γ(n)k ]ek

∥∥∥∥ ≤n∑

k=1

∣∣∣αk − γ(n)k

∣∣∣ <ε

2.

Quindi v ∈ A definito da

v =n∑

k=1

γ(n)k ek

soddisfa

||x− v|| = ||x−∑

γ(n)k ek||

≤ ||x−∑

αkek||+ ||∑

αkek −∑

γ(n)k ek||

2+

ε

2= ε.

Cio prova che A e denso in H e quindi, poiche A e numerabile, H e separabile.Per concludere questa sezione vogliamo sottolineare che la nostra presente discussione

ha alcune conseguenze di importanza basilare che possono esser formulate in termini diisomorfismo di spazi di Hilbert.

Il fatto piu straordinario in questa discussione e che due spazi astratti di Hilbert sulmedesimo campo sono distinguibili solo per le loro dimensioni di Hilbert, una situazione chegeneralizza quella degli spazi euclidei. Questo e il significato del seguente teorema.

3.27 Teorema (Isomorfismo e Dimensione di Hilbert)Due spazi di Hilbert H e H , entrambi reali o complessi, sono isomorfi se e solo se hannola medesima dimensione di Hilbert.

Dimostrazione. (a) Se H e isomorfo ad H esiste un’applicazione lineare e biiettiva T : H →H che conserva il prodotto scalare e cioe tale che

〈Tx, Ty〉 = 〈x, y〉.

E immediato verificare che essa e limitata con norma ||T || = 1.Conservando T il prodotto scalare gli elementi ortonormali in H hanno immagini or-

tonormali sotto T. Sia quindi M una base ortonormale di H e mostriamo che l’insiemeortonormale immagine M = T (M), che ha la medesima cardinalita di M , e una base in H.Sia V = span M . Poiche T e lineare T (V ) = span M , poiche T e limitato e quindi continuoT

(V

)= T (V ) ed infine, essendo V = H perche M e una base, poiche T e biiettivo conclu-

diamo che T (V ) = T (H) = H, cioe T applica in modo biiettivo ogni base ortonormale inH in una base ortonormale in H.

(b) Viceversa supponiamo che vi sia in H una base ortonormale M ed in H una baseortonormale M e che esse abbiano la medesima cardinalita. Mostriamo che allora H ed Hsono isomorfi. Avendo le due basi ortonormali M ed M la medesima cardinalita, possiamoindicizzarle col medesimo insieme di indici {τ} e scrivere M = (eτ ) e M = (eτ ).

Per mostrare che H e H sono isomorfi costruiamo un isomorfismo di H su H. Per ognix ∈ H abbiamo

x =∑

τ

〈eτ , x〉eτ (3.50)

68 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

dove il membro a destra e una somma finita o una serie infinita (cf. 3.22) e∑

τ |〈eτ , x〉|2 < ∞per la diseguaglianza di Bessel. Introduciamo la serie

x =∑

τ

〈eτ , x〉eτ . (3.51)

Essa e convergente per il 3.21 e quindi definisce un x ∈ H che dipende univocamente da xe che possiamo quindi considerare immagine di x secondo un operatore T , ossia

x = Tx.

L’operatore T e lineare perche il prodotto scalare e lineare rispetto al secondo fattore. T eisometrico perche usando dapprima (3.51) e poi (3.50) otteniamo

||x||2 = ||Tx||2 =∑

τ

|〈eτ , x〉|2 = ||x||2.

Da cio e da (3.7), (3.8) nella Sez. 3.2 vediamo che T conserva il prodotto scalare. Inoltrel’isometria implica l’iniettivita. Infatti se Tx = Ty allora

||x− y|| = ||T (x− y)|| = ||Tx− Ty|| = 0,

cosı che x = y e T e iniettivo per il 2.26.Mostriamo infine che T e surgettivo. Dato un qualunque

x =∑

τ

ατ eτ

in H abbiamo che∑ |ατ |2 < ∞ per la diseguaglianza di Bessel. Quindi

∑τ

ατeτ

e una somma finita o una serie che converge ad un x ∈ H per il 3.21 ed ατ = 〈eτ , x〉 per ilmedesimo teorema. Abbiamo percio x = Tx per la (3.51). Poiche x ∈ H era arbitrario ciomostra che T e surgettivo.

(c) Rimane da mostrare che uno spazio di Hilbert H non puo avere due basi M ed M ′

con cardinalita diversa. Supponiamo per assurdo che ad esempio la cardinalita di M siainferiore a quella di M ′. Allora esiste un corrispondenza biiettiva fra M ed M $ M ′. Sia

ora V = span M e consideriamo V = H che essendo un sottospazio chiuso e uno spazio diHilbert H $ H. Dal punto (b) precedente segue che H ed H sono isomorfi, che e impossibile.Segue quindi che M ed M ′ hanno la medesima cardinalita.

3.10 Rappresentazione di Funzionali su Spazi di Hilbert

E di importanza pratica conoscere la forma generale dei funzionali lineari limitati su varispazi. Per spazi di Banach generici queste formule e la loro derivazione possono a volte esserecomplicate. Tuttavia per uno spazio di Hilbert la situazione e sorprendentemente semplice.

3.28 Teorema (Riesz. Funzionali su Spazi di Hilbert)Ogni funzionale lineare limitato f su uno spazio di Hilbert H puo essere rappresentato intermini di un prodotto scalare e precisamente come segue

f(x) = 〈z, x〉 (3.52)

3.10. RAPPRESENTAZIONE DI FUNZIONALI SU SPAZI DI HILBERT 69

dove z dipende da f, e univocamente determinato da f ed ha norma

||z|| = ||f ||. (3.53)

Dimostrazione. Proviamo che

(a) f ha una rappresentazione (3.52),

(b) z in (3.52) e unico,

(c) vale la formula (3.53).

I dettagli sono i seguenti.(a) Se f = 0 allora (3.52) e (3.53) sono validi se prendiamo z = 0. Sia f 6= 0. Per orientarci

nella dimostrazione chiediamoci che proprieta debba avere z se la rappresentazione (3.52)esiste. Prima di tutto z 6= 0 perche altrimenti f = 0. Inoltre 〈z, x〉 = 0 per tutti gli x per cuif(x) = 0, cioe per tutti gli x nello spazio nullo N (f) di f. Quindi z ⊥ N (f). Cio suggeriscedi considerare N (f) ed il suo complemento ortogonale N (f)⊥.

N (f) e uno spazio vettoriale per il 2.25 ed e chiuso per il 2.33. Inoltre f 6= 0 implicaN (f) 6= H, cosı che N (f)⊥ 6= {0} per il teorema della proiezione 3.15. Quindi N (f)⊥

contiene uno z0 6= 0. Poniamov = f(x)z0 − f(z0)x

dove x ∈ H e arbitrario. Applicando f otteniamo

f(v) = f(x)f(z0)− f(z0)f(x) = 0.

Cio mostra che v ∈ N (f). Poiche z0 ⊥ N (f) abbiamo

0 = 〈z0, v〉 = 〈z0, f(x)z0 − f(z0)x〉= f(x)〈z0, z0〉 − f(z0)〈z0, x〉.

Notando che 〈z0, z0〉 = ||z0||2 6= 0 possiamo risolvere rispetto a f(x). Il risultato e

f(x) =f(z0)〈z0, z0〉 〈z0, x〉.

Questo puo essere riscritto nella forma (3.52) dove

z =f(z0)〈z0, z0〉z0.

Poiche x ∈ H era arbitrario la (3.52) e provata.(b) Proviamo che z nella (3.52) e unico. Supponiamo che per tutti gli x ∈ H

f(x) = 〈z1, x〉 = 〈z2, x〉.

Ma allora per il Lemma 3.6 z1 − z2 = 0, ossia l’unicita.(c) Infine proviamo la (3.53). Se f = 0 allora z = 0 e la (3.53) e valida. Sia f 6= 0.

Allora z 6= 0. Dalla (3.52) con x = z e dalla (2.24) nella Sez. 2.9 otteniamo

||z||2 = 〈z, z〉 = f(z) ≤ ||f || ||z||.

70 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Dividendo per ||z|| 6= 0 si ottiene ||z|| ≤ ||f ||. Rimane da mostrare che ||f || ≤ ||z||. Dalla(3.52) e dalla diseguaglianza di Schwarz vediamo che

|f(x)| = |〈z, x〉| ≤ ||z|| ||x||.

Cio implica||f || = sup

||x||=1

|〈z, x〉| ≤ ||z||.

Si noti che la corrispondenza f ←→ z fra H ed il suo duale H ′ e surgettiva, conserva lanorma, cioe e isometrica, ma e coniugata lineare.

L’importanza pratica dei funzionali lineari limitati sugli spazi di Hilbert risulta in largamisura dalla semplicita della rappresentazione di Riesz (3.52).

Inoltre (3.52) e molto importante nella teoria degli operatori sugli spazi di Hilbert. Inparticolare per quanto riguarda l’operatore aggiunto di Hilbert T ∗ di un operatore linearelimitato T che definiremo nella prossima sezione. A questo scopo abbiamo bisogno di unapreparazione che e anche di interesse generale. Cominciamo con la seguente definizione.

3.29 Definizione (Forme Sesquilineari)Siano X e Y spazi vettoriali sul medesimo campo K (R o C). Allora una forma sesquilineare(o funzionale sesquilineare) h su X × Y e un’applicazione

h : X × Y → K

tale che per tutti gli x, x1, x2 ∈ X e y, y1, y2 ∈ Y e tutti gli scalari α, β

h(x, y1 + y2) = h(x, y1) + h(x, y2) (3.54)h(x1 + x2, y) = h(x1, y) + h(x2, y) (3.55)

h(x, αy) = αh(x, y) (3.56)h(βx, y) = βh(x, y). (3.57)

Quindi h e lineare nel secondo argomento e coniugato lineare nel primo argomento. Se X eY sono reali (K = R) allora (3.57) diviene semplicemente

h(βx, y) = βh(x, y)

e h e chiamata bilineare perche e lineare in entrambi gli argomenti.Se X e Y sono spazi normati e se esiste un numero reale c tale che per tutti gli x, y

|h(x, y)| ≤ c||x|| ||y||, (3.58)

allora h e detta limitata ed il numero

||h|| = supx∈X−{0}y∈Y−{0}

|h(x, y)|||x|| ||y|| = sup

||x||=1||y||=1

|h(x, y)| (3.59)

e chiamato la norma di h.

Ad esempio il prodotto scalare e sesquilineare e limitato di norma 1.Si noti che dalla (3.58) e dalla (3.59) abbiamo che

|h(x, y)| ≤ ||h|| ||x|| ||y||. (3.60)

3.10. RAPPRESENTAZIONE DI FUNZIONALI SU SPAZI DI HILBERT 71

Entrambi i termini “forma” e “funzionale” sono comuni. Forse e preferibile usare iltermine “forma” in questo caso a due variabili e riservare il termine “funzionale” al caso aduna variabile. E cio che noi faremo nel seguito.

E molto interessante che dal Teorema 3.28 si possa ottenere una generale rappresenta-zione delle forme sesquilineari su spazi di Hilbert.

3.30 Teorema (Rappresentazione di Riesz)Siano H1, H2 spazi di Hilbert e

h : H1 ×H2 → K

una forma sesquilineare limitata. Allora h ha la rappresentazione

h(x, y) = 〈x, Sy〉 (3.61)

dove S : H2 → H1 e un operatore lineare limitato. S e unicamente determinato da h ed hanorma

||S|| = ||h||. (3.62)

Dimostrazione. Consideriamo h(x, y). E lineare in x a causa della barra. Per poter applicareil Teorema 3.28 manteniamo y fisso. Allora questo teorema ci da una rappresentazione incui x e la variabile, ossia

h(x, y) = 〈z, x〉.

Quindih(x, y) = 〈x, z〉. (3.63)

Qui z ∈ H1 e unico ma dipende naturalmente dal nostro y ∈ H2 fisso. Ne segue che la (3.63)con la variabile y definisce un operatore

S : H2 → H1 dato da z = Sy.

Sostituendo z = Sy nella (3.63) abbiamo la (3.61).S e lineare. Infatti il suo dominio e lo spazio vettoriale H2 e dalla (3.61) e dalla

sesquilinearita otteniamo

〈x, S(αy1 + βy2)〉 = h(x, αy1 + βy2)= αh(x, y1) + βh(x, y2)= α〈x, Sy1〉+ β〈x, Sy2〉= 〈x, αSy1 + βSy2〉

per tutti gli x in H1, cosı che per il Lemma 3.6

S(αy1 + βy2) = αSy1 + βSy2.

S e limitato. Infatti lasciando da parte il caso banale S = 0 abbiamo dalla (3.59) e dalla(3.61)

||h|| = supx 6=0y 6=0

|〈x, Sy〉|||x|| ||y|| ≥ sup

y 6=0Sy 6=0

|〈Sy, Sy〉|||Sy|| ||y|| = sup

y 6=0

||Sy||||y|| = ||S||.

Cio prova la limitatezza. Inoltre e ||h|| ≥ ||S||.

72 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Otteniamo ora la (3.62) notando che ||h|| ≤ ||S|| segue dall’applicazione della disegua-glianza di Schwarz

||h|| = supx 6=0y 6=0

|〈x, Sy〉|||x|| ||y|| ≤ sup

x 6=0y 6=0

||x|| ||Sy||||x|| ||y|| = ||S||.

S e unico. Infatti se assumiamo che esista un operatore lineare T : H2 → H1 tale che pertutti gli x ∈ H1 e gli y ∈ H2 si abbia

h(x, y) = 〈x, Sy〉 = 〈x, Ty〉,

vediamo che per il Lemma 3.6 Sy = Ty per tutti gli y ∈ H2. Quindi S = T per definizione.

3.11 Operatori Aggiunti di Hilbert

I risultati della sezione precedente ci permettono ora di introdurre l’operatore aggiuntodi Hilbert di un operatore lineare limitato su uno spazio di Hilbert. Questo operatore estato suggerito dai problemi sulle matrici e sulle equazioni differenziali e integrali. Vedremoche esso aiuta anche a definire tre importanti classi di operatori (chiamati operatori auto-aggiunti, unitari e normali), che sono state ampiamente studiate perche giocano un ruolochiave in varie applicazioni.

3.31 Definizione (Operatore Aggiunto di Hilbert T ∗)Sia T : H1 → H2 un operatore lineare limitato, dove H1 e H2 sono spazi di Hilbert. Alloral’operatore aggiunto di Hilbert T ∗ di T e l’operatore

T ∗ : H2 → H1

tale che2 per tutti gli x ∈ H1 e gli y ∈ H2

〈Tx, y〉 = 〈x, T ∗y〉. (3.64)

o, equivalentemente, tale che per tutti gli x ∈ H1 e gli y ∈ H2

〈y, Tx〉 = 〈T ∗y, x〉 (3.65)

Naturalmente dobbiamo mostrare che questa definizione ha senso, dobbiamo cioe provareche per un dato T un tale T ∗ esiste.

3.32 Teorema (Esistenza)L’operatore aggiunto di Hilbert T ∗ di T esiste, e unico ed e un operatore lineare limitato connorma

||T ∗|| = ||T ||. (3.66)

Dimostrazione. La formulah(x, y) = 〈Tx, y〉 (3.67)

2Possiamo indicare i prodotti scalari su H1 e H2 col medesimo simbolo perche i fattori mostrano a qualespazio il prodotto scalare si riferisce.

3.11. OPERATORI AGGIUNTI DI HILBERT 73

definisce una forma sesquilineare su H2 ×H1 perche il prodotto scalare e sesquilineare e Te lineare. La linearita coniugata della forma si verifica direttamente come segue

h(αx1 + βx2, y) = 〈T (αx1 + βx2), y〉= 〈αTx1 + βTx2, y〉= α〈Tx1, y〉+ β〈Tx2, y〉= αh(x1, y) + βh(x2, y).

h e limitato. Infatti per la diseguaglianza di Schwarz

|h(x, y)| = |〈Tx, y〉| ≤ ||Tx|| ||y|| ≤ ||T || ||x|| ||y||.

Cio implica anche ||h|| ≤ ||T ||. Inoltre abbiamo ||h|| ≥ ||T || da

||h|| = supx6=0y 6=0

|〈Tx, y〉|||x|| ||y|| ≥ sup

x 6=0Tx 6=0

|〈Tx, Tx〉|||x|| ||Tx|| = ||T ||.

Dal confronto||h|| = ||T ||. (3.68)

Il Teorema 3.30 fornisce una rappresentazione di Riesz per h. Scrivendo T ∗ per S abbiamo

h(x, y) = 〈x, T ∗y〉 (3.69)

e sappiamo da questo teorema che T ∗ : H2 → H1 e un operatore lineare limitato unicamentedeterminato con norma [cf. (3.68)]

||T ∗|| = ||h|| = ||T ||.

Cio prova la (3.66). Inoltre 〈Tx, y〉 = 〈x, T ∗y〉 confrontando (3.67) e (3.69), cosı che abbiamola (3.64) e concludiamo che T ∗ e effettivamente l’operatore che stavamo cercando.

Nel nostro studio delle proprieta degli operatori aggiunti di Hilbert sara utile fare usodel seguente lemma.

3.33 Lemma (Operatore Nullo)Siano X e Y spazi con prodotto scalare e Q : X → Y un operatore lineare. Ne segue

(a) Q = 0 se e solo se 〈Qx, y〉 = 0 per tutti gli x ∈ X e y ∈ Y.

(b) Se Q : X → X, dove X e complesso, e 〈Qx, x〉 = 0 per tutti gli x ∈ X allora Q = 0.

Dimostrazione. (a) Q = 0 significa Qx = 0 per tutti gli x ed implica

〈Qx, y〉 = 〈0, y〉 = 0.

Viceversa 〈Qx, y〉 = 0 per tutti gli x e y implica Qx = 0 per tutti gli x per il 3.6, cosı cheQ = 0 per definizione.

(b) Per ipotesi 〈Qv, v〉 = 0 per ogni v = αx + y ∈ X, ossia

0 = 〈Q(αx + y), αx + y〉= |α|2〈Qx, x〉+ 〈Qy, y〉+ α〈Qx, y〉+ α〈Qy, x〉.

74 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

I primi due termini a destra sono zero per ipotesi. α = 1 da

〈Qx, y〉+ 〈Qy, x〉 = 0.

α = i da〈Qx, y〉 − 〈Qy, x〉 = 0.

Sommando 〈Qx, y〉 = 0 e Q = 0 segue dalla (a).Nella parte (b) di questo lemma e essenziale che X sia complesso. Infatti la conclusione

puo non essere valida se X e reale. Un controesempio e la rotazione Q del piano R2 di unangolo retto. Q e lineare e Qx ⊥ x, quindi 〈Qx, x〉 = 0 per tutti gli x ∈ R2, ma Q 6= 0.

Possiamo elencare e provare alcune proprieta generali degli operatori aggiunti di Hilbertche si usano frequentemente nelle applicazioni di questi operatori.

3.34 Teorema (Proprieta degli Operatori Aggiunti di Hilbert)Siano H1 e H2 spazi di Hilbert, S : H1 → H2 e T : H1 → H2 operatori lineari limitati ed αuno scalare qualunque. Allora abbiamo

a) (S + T )∗ = S∗ + T ∗ (3.70)b) (αT )∗ = αT ∗ (3.71)c) (T ∗)∗ = T (3.72)

d) ||T ∗T || = ||TT ∗|| = ||T ||2 (3.73)e) T ∗T = 0 ⇐⇒ T = 0 (3.74)

e assumendo S : H1 → H2 e T : H2 → H3

f) (TS)∗ = S∗T ∗. (3.75)

Dimostrazione. (a) Per la (3.64) per tutti gli x e y

〈x, (S + T )∗y〉 = 〈(S + T )x, y〉= 〈Sx, y〉+ 〈Tx, y〉= 〈x, S∗y〉+ 〈x, T ∗y〉= 〈x, (S∗ + T ∗)y〉.

Quindi (S + T )∗y = (S∗ + T ∗)y per tutti gli y per il 3.6 che e la (3.70) per definizione.(b) La formula (3.71) non deve essere confusa colla formula T ∗(αx) = αT ∗x. E ottenuta

dal seguente calcolo e dalla successiva applicazione del Lemma 3.33(a) a Q = (αT )∗ − αT ∗.

〈(αT )∗y, x〉 = 〈y, (αT )x〉= 〈y, α(T )x〉= α〈y, Tx〉= α〈T ∗y, x〉= 〈αT ∗y, x〉.

(c) (T ∗)∗ e scritto T ∗∗ ed e uguale a T perche per tutti gli x ∈ H1 ed y ∈ H2 abbiamodalla (3.65) e (3.64)

〈(T ∗)∗x, y〉 = 〈x, T ∗y〉 = 〈Tx, y〉

3.12. OPERATORI AUTOAGGIUNTI, UNITARI E NORMALI 75

e la (3.72) segue dal Lemma 3.33(a) per Q = (T ∗)∗ − T.(d) Notiamo che T ∗T : H1 → H1 ma TT ∗ : H2 → H2. Per la diseguaglianza di Schwarz

||Tx||2 = 〈Tx, Tx〉 = 〈T ∗Tx, x〉 ≤ ||T ∗Tx|| ||x|| ≤ ||T ∗T || ||x||2.

Prendendo l’estremo superiore per tutti gli x di norma 1 otteniamo ||T ||2 ≤ ||T ∗T ||. Appli-cando la (2.20), Sez. 2.8, e la (3.66) abbiamo cosı

||T ||2 ≤ ||T ∗T || ≤ ||T ∗|| ||T || = ||T ||2.

Quindi ||T ∗T || = ||T ||2. Sostituendo T con T ∗ ed usando di nuovo la (3.66) abbiamo anche

||T ∗∗T ∗|| = ||T ∗||2 = ||T ||2.

Ora T ∗∗ = T per la (3.72), cosı che la (3.73) e provata.(e) Dalla (3.73) otteniamo immediatamente la (3.74).(f) Un’applicazione ripetuta della (3.64) da

〈x, (TS)∗y〉 = 〈(TS)x, y〉 = 〈Sx, T ∗y〉 = 〈x, S∗T ∗y〉.

Quindi (TS)∗y = S∗T ∗y per il 3.6 che e la (3.75) per definizione.

3.12 Operatori Autoaggiunti, Unitari e Normali

Classi di operatori lineari limitati di grande importanza pratica possono essere definitiutilizzando l’operatore aggiunto di Hilbert.

3.35 Definizione (Operatori Autoaggiunti, Unitari e Normali)Un operatore lineare limitato T : H → H su uno spazio di Hilbert H e detto

autoaggiunto o hermitiano se T ∗ = Tanti-hermitiano se T ∗ = −Tunitario se T e biiettivo e T ∗ = T−1

normale se TT ∗ = T ∗T.

Se T e autoaggiunto, anti-hermitiano o unitario, T e normale.Cio puo essere immediatamente visto dalla definizione. Naturalmente un operatore

normale non e necessariamente autoaggiunto o unitario.I termini usati nella Def. 3.35 sono anche usati in connessione con le matrici. Vogliamo

spiegare le ragioni di cio e menzionare alcune importanti relazioni.

Esempio (Matrici). Consideriamo Cn col prodotto scalare definito da

〈x, y〉 = x>y, (3.76)

dove x e y sono scritti come vettori colonna e > significa trasposto; allora x> = (ξ1, · · · , ξn)ed usiamo l’ordinaria moltiplicazione fra matrici.

Sia T : Cn → Cn un operatore lineare (che e limitato per il Teorema 2.31). Essendo datauna base per Cn possiamo rappresentare T ed il suo aggiunto di Hilbert T ∗ con due matriciquadrate a n righe, siano A e B rispettivamente.

76 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

Usando la (3.76) e la regola familiare (Ax)> = x>A> per il trasposto di un prodottootteniamo

〈Tx, y〉 = (Ax)>

y = x>A>

y

e〈x, T ∗y〉 = x>By.

Per la (3.64), Sez. 3.11, i membri a sinistra sono uguali per tutti gli x, y ∈ Cn. Quindidobbiamo avere

B = A>

.

Il risultato e il seguente.Se e data una base per Cn ed un operatore lineare su Cn e rappresentato da una certa

matrice, allora il suo operatore aggiunto di Hilbert e rappresentato dal trasposto complessoconiugato di questa matrice.

Pertanto una matrice quadrata A = (αjk) e detta

hermitiana se A>

= A (quindi αkj = αjk)anti-hermitiana se A

>= −A (quindi αkj = −αjk)

unitaria se A>

= A−1

normale se AA>

= A>

A.Invece una matrice quadrata reale A = (αjk) e detta

(reale) simmetrica se A> = A (quindi αkj = αjk)(reale) anti-simmetrica se A> = −A (quindi αkj = −αjk)ortogonale se A> = A−1.

Quindi una matrice reale hermitiana e una matrice (reale) simmetrica. Una matrice realeanti–hermitiana e una matrice (reale) anti–simmetrica. Una matrice reale unitaria e unamatrice ortogonale.

Ritorniamo agli operatori lineari su un arbitrario spazio di Hilbert e enunciamo unimportante e piuttosto semplice criterio per la proprieta di autoaggiunto.

3.36 Teorema (Autoaggiunto)Sia T : H → H un operatore lineare limitato su uno spazio di Hilbert H complesso. Ne segueche T e autoaggiunto se e solo se 〈Tx, x〉 e reale per tutti gli x ∈ H.

Dimostrazione. (a) Se T e autoaggiunto allora per tutti gli x

〈Tx, x〉 = 〈x, Tx〉 = 〈Tx, x〉.

Quindi 〈Tx, x〉 e uguale al suo complesso coniugato, cioe e reale.(b) Se 〈Tx, x〉 e reale per tutti gli x allora

〈Tx, x〉 = 〈Tx, x〉 = 〈x, T ∗x〉 = 〈T ∗x, x〉

e T − T ∗ = 0 per il Lemma 3.33(b) poiche H e complesso.Si noti come per la sufficienza dell’asserto del teorema sia essenziale che H sia complesso.

Cio risulta chiaro dal fatto che per un H reale il prodotto scalare ha valori reali, cio cherende 〈Tx, x〉 reale senza bisogno di alcuna ulteriore assunzione sull’operatore lineare T.

Prodotti (composizioni) di operatori autoaggiunti appaiono spesso nelle applicazioni, cosıche il seguente teorema risultera essere utile.

3.12. OPERATORI AUTOAGGIUNTI, UNITARI E NORMALI 77

3.37 Teorema (Autoaggiunto di un Prodotto)Il prodotto di due operatori lineari limitati autoaggiunti S e T su uno spazio di Hilbert H eautoaggiunto se e solo gli operatori commutano

ST = TS.

Dimostrazione. Per la (3.75) nella Sez. 3.11 e per le ipotesi

(ST )∗ = T ∗S∗ = TS.

QuindiST = (ST )∗ ⇐⇒ ST = TS.

Cio completa la dimostrazione.Successioni di operatori autoaggiunti capitano in diversi problemi e per esse abbiamo il

seguente teorema.

3.38 Teorema (Successioni di Operatori Autoaggiunti)Sia (Tn) una successione di operatori lineari limitati autoaggiunti Tn : H → H su uno spaziodi Hilbert H. Supponiamo che (Tn) converga, ossia,

Tn → T, cioe ||Tn − T || → 0,

dove || · || e la norma sullo spazio B(H, H); cf. Sez. 2.8. Allora l’operatore lineare limitatoT limite della successione e autoaggiunto su H.

Dimostrazione. Dobbiamo mostrare che T ∗ = T ossia che ||T − T ∗|| = 0 od anche, equiva-lentemente, per la continuita della norma che limn→∞ ||Tn − T ∗|| = 0. Per provarlo bastaosservare che, essendo gli operatori Tn autoaggiunti, per il 3.34 ed il 3.32 abbiamo

||Tn − T ∗|| = ||T ∗n − T ∗|| = ||(Tn − T )∗|| = ||Tn − T ||.

Quindi poiche limn→∞ ||Tn − T || = 0 e ||T − T ∗|| = 0 e T ∗ = T.

Questi teoremi ci danno un’idea delle proprieta basilari degli operatori lineari autoaggiun-ti. Essi saranno anche utili nel nostro lavoro successivo, in particolare nella teoria spettraledi questi operatori, dove discuteremo ulteriori proprieta.

Ritorniamo ora agli operatori unitari e consideriamo alcune delle loro proprieta basilari.

3.39 Teorema (Operatori Unitari)Siano gli operatori U : H → H e V : H → H unitari su uno spazio di Hilbert H. Allora

(a) U e isometrico; quindi ||Ux|| = ||x|| per tutti gli x ∈ H;

(b) ||U || = 1, purche H 6= {0},(c) U−1(= U∗) e unitario,

(d) UV e unitario,

(e) U e normale.

Inoltre

78 CAPITOLO 3. SPAZI CON PRODOTTO SCALARE. SPAZI DI HILBERT

(f) Un operatore lineare limitato T su uno spazio di Hilbert complesso H e unitario se esolo se T e isometrico e surgettivo.

Dimostrazione. (a) puo essere visto da

||Ux||2 = 〈Ux, Ux〉 = 〈x,U∗Ux〉 = 〈x, Ix〉 = ||x||2.

(b) segue immediatamente da (a).(c) Poiche U e biiettivo lo e anche U−1 e per il 3.34

(U−1)∗ = U∗∗ = U = (U−1)−1.

(d) UV e biiettiva e 3.34 e 2.27 danno

(UV )∗ = V ∗U∗ = V −1U−1 = (UV )−1.

(e) segue da U−1 = U∗ e UU−1 = U−1U = I.(f) Supponiamo che T sia isometrico e surgettivo. L’isometria implica l’iniettivita, cosı

che T e biiettivo. Mostriamo che T ∗ = T−1. Per l’isometria

〈T ∗Tx, x〉 = 〈Tx, Tx〉 = 〈x, x〉 = 〈Ix, x〉.

Quindi〈(T ∗T − I)x, x〉 = 0

e T ∗T − I = 0 per il Lemma 3.33(b), cosı che T ∗T = I. Da cio

TT ∗ = TT ∗(TT−1) = T (T ∗T )T−1 = TIT−1 = I.

In conclusione TT ∗ = T ∗T = I. Quindi T ∗ = T−1 e T e unitario. L’inverso e immediatoperche T e isometrico per (a) e surgettivo per definizione.

Si noti che un operatore isometrico non e necessariamente unitario perche potrebbe nonessere surgettivo. Un esempio e l’operatore di traslazione a destra T : l2 → l2 dato da

(ξ1, ξ2, ξ3, · · · ) 7−→ (0, ξ1, ξ2, ξ3, · · · )

dove x = (ξj) ∈ l2.

Problemi

1. Mostrare che `2 ammette il prodotto scalare

< x, y >=∞∑

j=1

ξjηj

e che, dotato di tale prodotto scalare, `2 e uno spazio di Hilbert.

2. Mostrare che `p con p 6= 2 non ammette prodotto scalare.

Suggerimento: Si considerino i due elementi di `p, x = (1, 1, 0, 0, . . . ) ed y = (1,−1, 0, 0, . . . )e si mostri che essi non soddisfano all’eguaglianza del parallelogramma.

3. Mostrare che C[a, b] non ammette un prodotto scalare.

Capitolo 4

Teoremi Fondamentali per gliSpazi Normati e di Banach

Questo capitolo contiene, si puo dire, le basi di una teoria piu avanzata degli spazi normatie di Banach senza le quali l’utilita di questi spazi e le loro applicazioni sarebbero piuttostolimitate. I quattro teoremi importanti in questo capitolo sono il teorema di Hahn–Banach,il teorema della uniforme limitatezza, il teorema dell’applicazione aperta ed il teorema delgrafico chiuso.

4.1 Breve Orientamento sui Contenuti Principali

1. Teorema di Hahn–Banach 4.8. Questo e un teorema di estensione per i funzionali linearisugli spazi vettoriali. Noi considereremo la sua versione per gli spazi normati. Essa garantisceche uno spazio normato e sufficientemente dotato di funzionali lineari, perche si ottenga unateoria adeguata degli spazi duali (Sez. 4.5).

2. Teorema di uniforme limitatezza 4.20 di Banach e Steinhaus. Questo teorema forniscele condizioni sufficienti perche la successione (||Tn||) sia limitata, essendo i Tn operatorilineari limitati da uno spazio di Banach in uno spazio normato. Ha diverse applicazioni(semplici e piu profonde) in analisi, ad esempio in connessione con le serie di Fourier, laconvergenza debole, la sommabilita di successioni, l’integrazione numerica, etc.

3. Teorema dell’applicazione aperta 4.35. Questo teorema stabilisce che un operatorelineare limitato T da uno spazio di Banach su un altro spazio di Banach e un’applicazioneaperta, che cioe applica insiemi aperti su insiemi aperti. Quindi se T e biiettivo T−1econtinuo (“teorema dell’inverso limitato”).

4.2 Lemma di Zorn

Avremo bisogno del lemma di Zorn nella dimostrazione del teorema fondamentale di Hahn–Banach. Il lemma ha a che fare con gli insiemi parzialmente ordinati.

4.1 Definizione (Insieme Parzialmente Ordinato)Un insieme parzialmente ordinato e un insieme M su cui e definito un ordine parziale, cioeuna relazione binaria che si scrive ≤ e soddisfa le condizioni

(PO1) a ≤ a per ogni a ∈ M. (Riflessivita)

79

80 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

(PO2) Se a ≤ b e b ≤ a allora a = b. (Antisimmetria)

(PO3) Se a ≤ b e b ≤ c allora a ≤ c. (Transitivita)

La parola “parzialmente” mette in rilievo il fatto che M puo contenere elementi a e bper cui non vale ne a ≤ b ne b ≤ a. Allora a e b sono chiamati elementi inconfrontabili. Alcontrario due elementi a e b sono chiamati elementi confrontabili se soddisfano a a ≤ b o ab ≤ a (o ad entrambi).

La relazione d’ordine ≤ sopra introdotta e anche detta relazione d’ordine debole, mentrese a ≤ b e a 6= b si specifica che la relazione d’ordine fra a e b e forte e si scrive a < b.

4.2 Definizione (Catena)Un insieme totalmente ordinato o catena e un insieme parzialmente ordinato tale che dueelementi qualunque dell’insieme sono confrontabili. In altre parole una catena e un insiemeparzialmente ordinato che non ha elementi inconfrontabili.

4.3 Definizione (Limite superiore)Un limite superiore di un sottoinsieme W di un insieme parzialmente ordinato M e unelemento u ∈ M tale che

x ≤ u per ogni x ∈ W.

A seconda degli insiemi M e W che si considerano un tale u puo esistere o non esistere.

4.4 Definizione (Elemento massimale)Un elemento m di M e detto elemento massimale se

non esiste x ∈ M tale che m < x.

Di nuovo M puo avere o non avere elementi massimali. Si noti inoltre che un elementomassimale non e necessariamente un limite superiore, perche sara m ≥ x solamente per glielementi x di M confrontabili con m, che non sono necessariamente tutti gli elementi di M .

Possiamo ora formulare il lemma di Zorn, che consideriamo come un’assioma.1

4.5 Lemma (di Zorn o Principio di Induzione Transfinita)Sia M 6= ∅ un insieme parzialmente ordinato. Supponiamo che ogni catena C ⊂ M abbiaun limite superiore. Allora M ha almeno un elemento massimale.

Nemmeno per un analista e indispensabile conoscere la dimostrazione del lemma di Zorn,che si puo fare a partire dall’assioma della scelta. E invece essenziale comprenderne benel’enunciato e saperlo utilizzare. Il lemma di Zorn ha applicazioni numerose e molto impor-tanti in analisi; in particolare e uno strumento indispensabile per stabilire alcuni teoremi diesistenza. Puo essere considerato un principio di induzione transfinita che estende cioe ilprincipio di induzione ad insiemi non numerabili.

4.3 Alcune Applicazioni del Lemma di Zorn

4.6 Teorema (Base di Hamel)Ogni spazio vettoriale X 6= {0} ha una base di Hamel. (Cf. Sez. 2.1.)

1Il nome “lemma” e per ragioni storiche. Il lemma di Zorn puo essere derivato dall’assioma della scelta,che stabilisce che per ogni dato insieme E esiste un’applicazione c (“funzione di scelta”) dall’insieme potenzaP(E) in E tale che se B ⊂ E, B 6= ∅, allora c(B) ∈ B. Viceversa questo assioma segue dal lemma di Zorn,cosı che il lemma di Zorn e l’assioma della scelta possono essere considerati come assiomi equivalenti.

4.4. TEOREMA DI HAHN–BANACH 81

Dimostrazione. Sia M l’insieme di tutti i sottoinsiemi linearmente indipendenti di X. PoicheX 6= {0} v’e un elemento x 6= 0 e {x} ∈ M, cosı che M 6= ∅. L’inclusione fra insiemi definisceun ordine parziale su M.

Cominciamo col dimostrare che l’unione U dei sottoinsiemi B costituenti una catena C ⊂M e limite superiore di C. Essendo infatti per costruzione U ⊇ B per ogni B ∈ C e sufficientemostrare che ogni sottoinsieme finito {v1, v2, . . . , vn} di U e linearmente indipendente. Visono degli elementi della catena B1, B2, . . . , Bn tali che vi ∈ Bi per ogni i = 1, 2, . . . , n epoiche C e una catena ed i Bi sono in numero finito uno di essi deve contenere tutti gli altrie quindi tutti i v, che sono percio linearmente indipendenti.

Poiche ogni catena C ⊂ M ha un limite superiore, per il lemma di Zorn segue che Mha un elemento massimale F . Mostriamo che F e una base di Hamel per X. Sia Y =span F . Dimostriamo per assurdo che Y = X. Infatti, se cosı non fosse, esisterebbe unoz ∈ X, z /∈ Y e F

⋃{z} sarebbe un insieme linearmente indipendente contenente F comesottoinsieme proprio, in contrasto con la massimalita di F.

4.7 Teorema (Base Ortonormale)Ogni spazio di Hilbert H 6= {0} ammette una base ortonormale. (Cf. Sez. 3.9.)

Dimostrazione. Sia M l’insieme di tutti i sottoinsiemi ortonormali di H. Poiche H 6= {0}v’e un elemento x 6= 0 ed un sottoinsieme ortonormale di H e {y} dove y = ||x||−1x. QuindiM 6= ∅. L’inclusione fra insiemi definisce un ordine parziale su M. Possiamo utilizzare larelazione d’ordine totale esistente in una catena per dedurre, in maniera analoga a quantofatto nel teorema 4.6, che l’unione dei sottoinsiemi costituenti una catena e un sottoinsiemeortonormale. Quindi ogni catena C ⊂ M ha un limite superiore e precisamente l’unione ditutti i sottoinsiemi di H che sono elementi di C. Per il lemma di Zorn M ha un elementomassimale F. Proviamo che F e una base in H. Supponiamo che cio sia falso. Allora peril Teorema 3.24 esiste uno z ∈ H non nullo tale che z⊥F. Quindi F1 = F

⋃{e}, dove e =||z||−1z, e ortonormale ed F e un sottoinsieme proprio di F1. Cio contraddice la massimalitadi F.

4.4 Teorema di Hahn–Banach

Il teorema di Hahn–Banach e un teorema di estensione per i funzionali lineari. Vedremonella prossima sezione che il teorema garantisce che uno spazio normato e riccamente fornitodi funzionali lineari limitati, cio che rende possibile un’adeguata teoria degli spazi duali, chee una parte essenziale della teoria generale degli spazi normati. In questo modo il teoremadi Hahn–Banach diventa uno dei teoremi piu importanti in connessione con gli operatorilineari limitati.

Generalmente parlando, in un problema di estensione, si considera un oggetto matematico(per esempio un’applicazione) definito su un sottoinsieme Z di un dato insieme X e si vuoleestendere l’oggetto da Z all’intero insieme X in modo tale che alcune proprieta basilaridell’oggetto continuino a valere per l’oggetto esteso.

Nella variante del teorema di Hahn–Banach che considereremo l’oggetto da estendere eun funzionale lineare limitato f che e definito su un sottospazio Z di uno spazio normato X.Si richiede che l’estensione di f da Z a X avvenga senza perdere la linearita e la limitatezzae mantendo invariata la norma.

Lo studente interessato puo trovare nella versione estesa delle dispense una generalizza-zione del teorema agli spazi vettoriali reali e complessi non necessariamente normati.

82 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

4.8 Teorema (Hahn–Banach. Spazi Normati)Sia f un funzionale lineare limitato su un sottospazio Z di uno spazio normato X. Alloraesiste un funzionale lineare limitato f su X che e un’estensione di f a X e che ha la stessanorma

||f ||X = ||f ||Z (4.1)

dove||f ||X = sup

x∈X||x||=1

|f(x)|, ||f ||Z = supx∈Z||x||=1

|f(x)|

(e ||f ||Z = 0 nel caso banale Z = {0}).

Dimostrazione. Se Z = {0} allora f = 0 e l’estensione e f = 0. Sia Z 6= {0}.Cominciamocoll’osservare che per tutti gli x ∈ Z abbiamo

|f(x)| ≤ p(x). (4.2)

dove per comodita abbiamo introdotto

p(x) = ||f ||Z ||x||. (4.3)

Il funzionale p e definito su tutto X. Inoltre p e, come si dice, un funzionale subadditivo inquanto soddisfa per tutti gli x, y ∈ X

p(x + y) ≤ p(x) + p(y), (4.4)

poiche per la diseguaglianza triangolare

p(x + y) = ||f ||Z ||x + y|| ≤ ||f ||Z (||x||+ ||y||) = p(x) + p(y),

ed e assolutamente omogeneo in quanto per ogni scalare α ed x ∈ X

p(αx) = |α|p(x), (4.5)

perchep(αx) = ||f ||Z ||αx|| = |α|||f ||Z ||x|| = |α|p(x).

Consideriamo ora separatamente i due casi, quello in cui X e uno spazio vettoriale reale equello complesso.

Spazio vettoriale reale. Se X e reale allora (4.2), essendo p(x) ≥ 0, implica

f(x) ≤ p(x) (4.6)

per tutti gli x ∈ Z. Procediamo ora passo a passo provando che:(a) l’insieme E di tutte le estensioni lineari g di f dal sottospazio Z = D(f) al sottospazio

D(g) che soddisfano g(x) ≤ p(x) per ogni x ∈ D(g) puo essere parzialmente ordinato edammette un elemento massimale f ;

(b) f e definito sull’intero spazio X..Cominciamo con la parte (a).(a) Sia E l’insieme di tutte le estensioni lineari g di f che soddisfano la condizione

g(x) ≤ p(x) per tutti gli x ∈ D(g).

4.4. TEOREMA DI HAHN–BANACH 83

Chiaramente E 6= ∅ perche f ∈ E. Su E possiamo definire un ordine parziale con

g ≤ h significa h e un’estensione di g,

cioe per definizione D(h) ⊃ D(g) ed h(x) = g(x) per ogni x ∈ D(g).Per qualsiasi catena C ⊂ E di elementi g consideriamo

DC =⋃

g∈C

D(g)

che e uno spazio vettoriale perche C e una catena. Per ogni x ∈ DC esiste una g ∈ C taleche x ∈ D(g) e possiamo quindi definire su DC l’applicazione g con

g(x) = g(x) se x ∈ D(g) con g ∈ C.

La definizione di g non e ambigua. Infatti per un x ∈ D(g1)⋂D(g2) con g1, g2 ∈ C abbiamo,

poiche C e una catena, g1 ≤ g2 o g2 ≤ g1 e quindi g1(x) = g2(x). Per ogni x ∈ DC eg(x) ≤ p(x). Inoltre, sempre grazie al fatto che C e una catena, g e un funzionale lineare.

Chiaramente g ≤ g per tutti i g ∈ C. Quindi g e un limite superiore di C. Poiche C ⊂ Eera arbitrario il lemma di Zorn implica che E ha un elemento massimale f . Per definizionedi E questo e una estensione lineare di f che soddisfa

f(x) ≤ p(x) per x ∈ D(f). (4.7)

(b) Mostriamo ora che D(f) e tutto X. Supponiamo che cio sia falso. Allora possiamoscegliere un y1 ∈ X −D(f) e considerare il sottospazio Y1 di X generato da D(f) ed y1. Sinoti che y1 6= 0 perche 0 ∈ D(f). Qualsiasi x ∈ Y1 puo essere scritto

x = y + αy1 y ∈ D(f). (4.8)

Questa rappresentazione e unica. Infatti y + αy1 = y + βy1 con y ∈ D(f) implica y − y =(β − α)y1, dove y − y ∈ D(f) mentre y1 /∈ D(f), cosı che la sola soluzione e y − y = 0 eβ − α = 0. Cio significa l’unicita.

Consideriamo ora un funzionale g1 su Y1 definito da

g1(y + αy1) = f(y) + αc (4.9)

dove c e una qualsiasi costante reale. Non e difficile vedere che g1 e lineare. Inoltre perα = 0 abbiamo g1(y) = f(y). Quindi g1 e una estensione lineare di f ed e propria, percheD(f) e un sottoinsieme proprio di D(g1). Conseguentemente se possiamo provare che, perun opportuno c, l’estensione g1 e tale che

g1(x) ≤ p(x) per tutti gli x ∈ D(g1), (4.10)

allora g1 ∈ E e cio contraddira la massimalita di f , cosı che D(f) 6= X e falso e D(f) = Xe vero.

Consideriamo ora un qualunque w e z in D(f). Dalla linearita della f e da (4.7), (4.4) e(4.5) otteniamo

f(w)− f(z) = f(w − z) ≤ p(w − z)= p(w + y1 − y1 − z)≤ p(w + y1) + p(y1 + z).

84 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Portando l’ultimo termine a sinistra ed il termine f(w) a destra abbiamo

−p(y1 + z)− f(z) ≤ p(w + y1)− f(w), (4.11)

dove y1 e fisso. Poiche w non appare a sinistra e z non appare a destra l’ineguaglianzacontinua a valere se prendiamo l’estremo superiore sugli z ∈ D(f) a sinistra (chiamiamolom0) e l’estremo inferiore sui w ∈ D(f) a destra, chiamiamolo m1. Allora m0 ≤ m1 e per unc tale che m0 ≤ c ≤ m1 abbiamo dalla (4.11)

−p(y1 + z)− f(z) ≤ c per tutti gli z ∈ D(f) (4.12)

c ≤ p(w + y1)− f(w) per tutti i w ∈ D(f). (4.13)

Sostituendo in (4.12) z con y/α ed in (4.13) w con y/α otteniamo

−p(y1 +

y

α

)≤ f

( y

α

)+ c ≤ p

(y1 +

y

α

)(4.14)

ossia ∣∣∣f( y

α

)+ c

∣∣∣ ≤ p(y1 +

y

α

)(4.15)

e moltiplicando entrambi i membri per |α|, utilizzando la linearita di f , (4.5) e ricordandola (4.9) si ottiene (4.10).

Spazio vettoriale complesso. Sia X complesso. Allora anche Z e uno spazio vettorialecomplesso. Quindi f e a valori complessi e possiamo scrivere

f(x) = f1(x) + if2(x) x ∈ Z

dove f1 e f2 sono a valori reali. Per il momento consideriamo X e Z come spazi vettoriali realie li indichiamo con Xr e Zr rispettivamente; cio significa semplicemente che restringiamola moltiplicazione per scalari ai numeri reali (invece che ai numeri complessi). Poiche fe lineare su Z e f1 e f2 sono a valori reali, f1 e f2 sono funzionali lineari su Zr. Inoltref1(x) ≤ |f(x)| perche la parte reale di un numero complesso non puo essere maggiore delsuo modulo. Quindi per la (4.6)

f1(x) ≤ p(x) per tutti gli x ∈ Z.

Per quanto dimostrato nel caso degli spazi normati reali v’e un’estensione f1 di f1 da Zr aXr tale che

f1(x) ≤ p(x) per tutti gli x ∈ X. (4.16)

Cio per quanto riguarda f1. Occupiamoci ora di f2. Ritornando a Z ed usando f = f1 + if2,abbiamo per ogni x ∈ Z

i[f1(x) + if2(x)] = if(x) = f(ix) = f1(ix) + if2(ix).

Le parti reali dei due membri devono essere uguali

f2(x) = −f1(ix) x ∈ Z. (4.17)

Quindi se per tutti gli x ∈ X poniamo

f(x) = f1(x)− if1(ix) x ∈ X, (4.18)

vediamo dalla (4.17) che f(x) = f(x) su Z. Cio mostra che f e un’estensione di f da Z aX. Ci rimane da dimostrare che

4.4. TEOREMA DI HAHN–BANACH 85

(i) f e un funzionale lineare sullo spazio vettoriale complesso X,

(ii) f soddisfa la (4.2) su X.

Che la (i) sia valida puo essere visto dal seguente calcolo che usa la (4.18) e la linearitadella f1 sullo spazio vettoriale reale Xr, dove a + ib con a e b reali e un qualunque scalarecomplesso,

f((a + ib)x) = f1(ax + ibx)− if1(iax− bx)

= af1(x) + bf1(ix)− i[af1(ix)− bf1(x)]

= (a + ib)[f1(x)− if1(ix)]

= (a + ib)f(x).

Proviamo la (ii). Per un qualsiasi x tale che f(x) = 0 cio vale perche p(x) ≥ 0. Sia x

tale che f(x) 6= 0. Allora possiamo scrivere usando la forma polare delle quantita complesse

f(x) = |f(x)|eiθ e cosı |f(x)| = f(x)e−iθ = f(e−iθx).

Poiche |f(x)| e reale, l’ultima espressione e reale e quindi uguale alla sua parte reale. Quindiper la (4.16) e la (4.5)

|f(x)| = f(e−iθx) = f1(e−iθx) ≤ p(e−iθx) = |e−iθ|p(x) = p(x).

Cio completa la dimostrazione.Quindi possiamo concludere che esiste un funzionale lineare f su X che e un’estensione

di f e che soddisfa|f(x)| ≤ p(x) = ||f ||Z ||x|| x ∈ X.

Prendendo l’estremo superiore su tutti gli x ∈ X di norma 1 otteniamo la diseguaglianza

||f ||X = supx∈X||x||=1

|f(x)| ≤ ||f ||Z .

Poiche sotto un’estensione la norma non puo decrescere abbiamo anche ||f ||X ≥ ||f ||Z .Confrontando otteniamo la (4.1) ed il teorema e dimostrato.

In casi speciali la situazione puo diventare molto semplice. Gli spazi di Hilbert sono diquesto tipo. Infatti se Z e un sottospazio chiuso di uno spazio di Hilbert X = H, allora fha una rappresentazione di Riesz 3.28, ossia

f(x) = 〈z, x〉 z ∈ Z

dove ||z|| = ||f ||. Naturalmente poiche il prodotto scalare e definito su tutto H cio fornisceimmediatamente una estensione lineare f di f da Z a H, ed f ha la stessa norma di f perche||f || = ||z|| = ||f || per il Teorema 3.28. Quindi in questo caso l’estensione e immediata.

Possiamo, tuttavia, nel caso generale fare a meno del lemma di Zorn? Questa domandae di interesse in particolare perche il lemma non da un metodo di costruzione. Se nella (4.9)prendiamo f invece di f otteniamo per un conveniente c reale una estensione lineare g1 dif al sottospazio Z1 generato da D(f)

⋃{y1} e tale che g1 (x) ≤ p(x) per tutti gli x ∈ Z1,come si puo vedere dalla parte finale della dimostrazione con f sostituito con f. Se X = Z1

abbiamo concluso. Se X 6= Z1 possiamo prendere un y2 ∈ X − Z1 e ripetere il processo

86 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

per estendere f a Z2 generato da Z1 e y2, etc. Cio fornisce una successione di sottospaziciascuno contenente il precedente e tali che f puo essere esteso da ciascuno al successivo el’estensione gj soddisfa gj(x) ≤ p(x) per tutti gli x ∈ Zj . Se

X =n⋃

j=1

Zj

abbiamo concluso dopo n passi e se

X =∞⋃

j=1

Zj

possiamo usare l’ordinaria induzione. Tuttavia se X non ha una tale rappresentazioneabbiamo bisogno del lemma di Zorn qui presentato.

Dal Teorema 4.8 deriveremo ora un altro utile risultato che, in parole povere, mostra chelo spazio duale X ′ di uno spazio normato X consiste di un numero sufficiente di funzionalilineari limitati da poter distinguere fra punti di X. Cio diventera essenziale in connessionecon gli operatori duali e la cosiddetta convergenza debole.

4.9 Teorema (Funzionali Lineari Limitati)Sia X uno spazio normato e sia x0 6= 0 un elemento qualunque di X. Allora esiste unfunzionale lineare limitato f su X tale che

||f || = 1, f(x0) = ||x0||.

Dimostrazione. Consideriamo il sottospazio Z di X consistente di tutti gli elementi x = αx0

dove α e uno scalare. Su Z definiamo un funzionale lineare con

f(x) = f(αx0) = α||x0||. (4.19)

f e limitato ed ha norma ||f || = 1 perche

|f(x)| = |f(αx0)| = |α| ||x0|| = ||x||.

Il Teorema 4.8 implica che f ha una estensione lineare f da Z a X di norma ||f || = ||f || = 1.

Dalla (4.19) vediamo che f(x0) = f(x0) = ||x0||.Da questo Teorema segue il seguente Corollario, che evidenzia come i funzionali lineari

limitati siano in grado di discriminare fra due punti diversi.

4.10 Corollario (Norma, Vettore Nullo)Per ogni x in uno spazio normato X abbiamo

||x|| = supf∈X′f 6=0

|f(x)|||f || . (4.20)

Quindi se x0 e tale che f(x0) = 0 per tutti gli f ∈ X ′ allora x0 = 0.

Dimostrazione. Dal Teorema 4.9 abbiamo, scrivendo x per x0,

supf∈X′f 6=0

|f(x)|||f || ≥ |f(x)|

||f ||=||x||1

= ||x||

4.5. OPERATORE DUALE 87

-T

-

Kg

X

Y

-f

Figura 4.1: Pull back di g tramite T

e da |f(x)| ≤ ||f || ||x|| otteniamo

supf∈X′f 6=0

|f(x)|||f || ≤ ||x||.

Dal confronto segue la (4.20).

4.5 Operatore Duale

Ad un operatore lineare limitato T : X → Y su uno spazio normato X possiamo associareil cosiddetto operatore duale (o coniugato) T ′ di T. Una motivazione per T ′ viene dalla suautilita nella risoluzione delle equazioni che involvono operatori; tali equazioni intervengonoper esempio in fisica ed in altre applicazioni. Nella presente sezione definiamo l’operatoreduale T ′ e consideriamo alcune delle sue proprieta, inclusa la sua relazione con l’operatoreaggiunto di Hilbert T ∗ definito nella Sez. 3.11. E importante notare che la nostra presentediscussione dipende dal Teorema di Hahn–Banach (attraverso il Teorema 4.9) e che senza diesso non andremmo molto lontano.

Consideriamo un operatore lineare limitato T : X → Y, dove X e Y sono spazi normati,e vogliamo definire l’operatore duale T ′ di T. A questo scopo partiamo da un qualsiasifunzionale lineare limitato g su Y. Ponendo per ogni x ∈ X

f(x) = g(Tx) (4.21)

otteniamo un funzionale f su X, che e lineare dal momento che g e T sono lineari. In inglesesi chiama il funzionale “pull back” di g, e cioe il funzionale che si ottiene risospingendo gall’indietro su X, utilizzando l’applicazione T (vedi figura 4.1). Il funzionale f e limitatoperche

|f(x)| = |g(Tx)| ≤ ||g|| ||Tx|| ≤ ||g|| ||T || ||x||.

Prendendo l’estremo superiore su tutti gli x ∈ X di norma uno otteniamo la diseguaglianza

||f || ≤ ||g|| ||T ||. (4.22)

88 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Cio mostra che f ∈ X ′, dove X ′ e lo spazio duale di X definito in 2.42. Per ipotesi g ∈ Y ′.Conseguentemente per g ∈ Y ′ variabile la formula (4.21) definisce un operatore da Y ′ inX ′, che e chiamato l’operatore duale di T ed e indicato con T ′. Abbiamo cosı

XT−→ Y

Y ′ T ′−→ X ′(4.23)

Si porti particolare attenzione al fatto che T ′ e definito su Y ′ mentre l’operatore dato T edefinito su X. Possiamo riassumere enunciando la seguente definizione.

4.11 Definizione (Operatore Duale T ′)Sia T : X → Y un operatore lineare limitato, dove X e Y sono spazi normati. Alloral’operatore duale (o coniugato) T ′ : Y ′ → X ′ di T e definito da

f(x) = (T ′g)(x) = g(Tx) (g ∈ Y ′) (4.24)

dove X ′ e Y ′ sono rispettivamente gli spazi duali di X e di Y.

Il nostro primo obiettivo e di provare che l’operatore duale ha la medesima norma dell’o-peratore stesso. Questa proprieta e basilare, come vedremo piu innanzi. Per la dimostrazioneavremo bisogno del Teorema 4.9, che e stato derivato dal teorema di Hahn–Banach. Il teo-rema di Hahn–Banach e percio vitale per costruire una teoria soddisfacente degli operatoriduali, che a loro volta sono una parte essenziale della teoria generale degli operatori lineari.

4.12 Teorema (Norma dell’Operatore Duale)L’operatore duale T ′ nella Def. 4.11 e lineare, limitato e

||T ′|| = ||T ||. (4.25)

Dimostrazione. L’operatore T ′ e lineare perche il suo dominio Y ′ e uno spazio vettoriale edotteniamo facilmente

(T ′(αg1 + βg2))(x) = (αg1 + βg2)(Tx)= (αg1)(Tx) + (βg2)(Tx)= α(T ′g1)(x) + β(T ′g2)(x).

Proviamo la (4.25). Dalla (4.24) abbiamo f = T ′g e per la (4.22) ne segue che

||T ′g|| = ||f || ≤ ||g|| ||T ||.

Prendendo l’estremo superiore su tutte le g ∈ Y ′ di norma uno otteniamo la diseguaglianza

||T ′|| ≤ ||T ||.

Quindi per ottenere la (4.25) dobbiamo ora provare che ||T ′|| ≥ ||T ||. Il Teorema 4.9 implicache per ogni x ∈ X tale che Tx 6= 0 v’e un g ∈ Y ′ tale che

||g|| = 1 e g(Tx) = ||Tx||. (4.26)

4.5. OPERATORE DUALE 89

Possiamo quindi scrivere, per ||x|| 6= 0,

||T ′|| = supg∈Y ′g 6=0

||T ′g||||g|| ≥ ||T ′g||

||g|| =||f || ||x||||x||

≥ |f(x)|||x|| =

|g(Tx)|||x|| =

||Tx||||x|| ,

dove f = T ′g e sono state utilizzate le proprieta di g in (4.26). Poiche x e generico, prendendol’estremo superiore di entrambi i membri per ogni x 6= 0 otteniamo

||T ′|| ≥ ||T ||

e quindi ||T ′|| = ||T ||.Illustriamo la presente discussione con le matrici considerate come rappresentanti di

operatori.

Esempio (Matrici). Abbiamo mostrato nella Sez. 2.10 che, se X e uno spazio vettorialen–dimensionale, una volta scelta una base E = {e1, · · · , en} per X, i punti x di X possonoessere rappresentati da vettori colonna x = (ξ1, · · · , ξn)> ove

x =n∑

k=1

ξkek (4.27)

e gli operatori lineari T : X → X da matrici TE = (τ jk) ove

Tei =n∑

j=1

τ jiej (4.28)

in modo tale che, se y = Tx e rappresentato dal vettore colonna y = (η1, · · · , ηn)> ove

y =n∑

k=1

ηkek (4.29)

e se le matrici sono moltiplicate righe per colonne, allora

y = TEx, od in componenti ηj =n∑

k=1

τ jkξk. (4.30)

Sia ora F = {f1, · · · , fn} la base duale di E (cf. Sez. 2.10) ossia tale che

fj(ei) = δij . (4.31)

Questa e una base anche per X ′ (che e anche esso uno spazio n–dimensionale). Sia oraf = T ′g ed abbiano g ed f ∈ X ′ la rappresentazione

g = α1f1 + · · ·+ αnfn (4.32)f = β1f1 + · · ·+ βnfn (4.33)

ove

g(ej) = αj (4.34)f(ei) = βi (4.35)

90 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Dalla definizione di operatore duale otteniamo

f(ei) = g(Tei) =n∑

j=1

τ jig(ej).

Dalle (4.34) ed (4.35) abbiamo quindi

βi =n∑

j=1

τ jiαj .

Possiamo ora interpretare questa equazione come l’espressione in componenti di f = T ′Eg.Osservando che nel membro a destra si somma rispetto al primo indice (cosı che si sommasu tutti gli elementi di una colonna di TE) abbiamo il seguente risultato:

Se T e rappresentato da una matrice TE allora l’operatore duale T ′ e rappresentato daltrasposto di TE .

Lavorando con gli operatori duali sono utili le formule seguenti dalla (4.36) alla (4.38).La corrispondente prova e lasciata al lettore. Siano S, T ∈ B(X, Y ); cf. Sez. 2.8. Allora

(S + T )′ = S′ + T ′ (4.36)(αT )′ = αT ′. (4.37)

Siano X,Y, Z spazi normati e T ∈ B(X, Y ) e S ∈ B(Y, Z). Allora per l’operatore dualedel prodotto ST abbiamo

(ST )′ = T ′S′. (4.38)

Se T ∈ B(X, Y ) e T−1 esiste e T−1 ∈ B(Y, X) allora anche (T ′)−1 esiste, (T ′)−1 ∈B(X ′, Y ′) e

(T ′)−1 = (T−1)′. (4.39)

4.6 Spazi Riflessivi

La riflessivita algebrica di spazi vettoriali e stata discussa nella Sez. 2.9. La riflessivita dispazi normati e l’argomento della presente sezione.

Consideriamo uno spazio normato X, il suo spazio duale X ′ cosı come definito in 2.42ed inoltre lo spazio duale (X ′)′ di X ′. Questo spazio e indicato con X ′′ ed e chiamato lospazio biduale di X.

Esattamente come s’e fatto quando si sono discussi gli spazi duali e biduali algebricipossiamo definire un funzionale gx su X ′ scegliendo un x ∈ X fisso e ponendo

gx(f) = f(x) (f ∈ X ′ variabile). (4.40)

Cio definisce un’applicazione

C : X → X ′′ (4.41)x 7→ gx.

C e chiamata l’applicazione canonica di X in X ′′.Questa applicazione, cosı come per glispazi duali e biduali algebrici, e lineare e biiettiva di X su R(C) ⊂ X ′′. In questo casopossiamo aggiungere che gx e limitata e che l’applicazione C e un isometria, poiche abbiamoil seguente lemma basilare.

4.6. SPAZI RIFLESSIVI 91

4.13 Lemma (Norma di gx)Per ogni x fisso in uno spazio normato X il funzionale gx definito dalla (4.40) e un funzionalelineare limitato su X ′, cosı che gx ∈ X ′′ ed ha norma

||gx|| = ||x||. (4.42)

Dimostrazione. La linearita di gx e nota dalla Sez. 2.9 e la (4.42) segue dalla (4.40) e dalCorollario 4.10

||gx|| = supf∈X′f 6=0

|gx(f)|||f || = sup

f∈X′f 6=0

|f(x)|||f || = ||x||. (4.43)

Possiamo quindi esprimerci in termini di un isomorfismo di spazi normati come definitonella Sez. 2.11

4.14 Lemma (Applicazione Canonica)L’applicazione canonica C data dalla (4.41) e un isomorfismo dello spazio normato X sullospazio normato R(C), l’immagine di C.

X e detto immergibile (embeddable) in uno spazio normato Z se X e isomorfo adun sottospazio di Z. Cio e simile alla Sez. 2.9, ma si noti che qui abbiamo a che fare conun isomorfismo di spazi normati, cioe con un isomorfismo di spazi vettoriali che conserva lanorma (cf. Sez. 2.11). Il Lemma 4.14 mostra che X e immergibile in X ′′ e C e chiamatol’immersione canonica (embedding canonico) di X in X ′′.

In generale C non sara biiettivo, cosı che l’immagine R(C) sara un sottospazio propriodi X ′′. Il caso surgettivo quando R(C) e tutto X ′′ e sufficientemente importante da dargliun nome.

4.15 Definizione (Riflessivita)Uno spazio normato X e detto riflessivo se

R(C) = X ′′

dove C : X → X ′′ e l’applicazione canonica data dalla (4.41) e dalla (4.40).Se X e riflessivo e isomorfo (quindi isometrico) a X ′′ per il Lemma 4.14. E interessante

il fatto che l’inverso in generale non valga.Inoltre la completezza non implica la riflessivita ma viceversa abbiamo il seguente teo-

rema.

4.16 Teorema (Completezza)Se uno spazio normato X e riflessivo allora e completo (quindi uno spazio di Banach).

Dimostrazione. Poiche X ′′ e lo spazio duale di X ′ esso e completo per il Teorema 2.43. Lariflessivita di X significa che R(C) = X ′′. La completezza di X ora segue da quella di X ′′

per il Lemma 4.14.Ogni spazio normato X finito dimensionale e riflessivo. Infatti se dim X < ∞ allora ogni

funzionale lineare su X e limitato (cf. 2.31), cosı che X ′ = X∗ e la riflessivita algebrica diX implica allora il seguente teorema.

4.17 Teorema (Dimensioni Finite)Ogni spazio normato finito dimensionale e riflessivo.

Anche gli spazi di Hilbert risultano essere sempre riflessivi.

92 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

4.18 Teorema (Spazio di Hilbert)Ogni spazio di Hilbert e riflessivo.

Dimostrazione. Proviamo la surgettivita dell’applicazione canonica C : H → H ′′ mostrandoche per ogni g0 ∈ H ′′ v’e un x0 ∈ H tale che g0 = Cx0. Come preparazione definiamoA : H ′ → H con Af = z dove z e dato dalla rappresentazione di Riesz f(x) = 〈z, x〉 in 3.28.Dal Teorema 3.28 sappiamo che A e biiettivo ed isometrico. A e coniugato lineare come sivede ricordando che il prodotto scalare e coniugato lineare a sinistra. Ora H ′ e completoper il Teorema 2.43 e diviene uno spazio di Hilbert quando si introduce il prodotto scalaredefinito da

〈f1, f2〉 = 〈Af2, Af1〉.

Si noti il diverso ordine di f1, f2 nei due membri. (IP1) sino a (IP4) nella Sez. 3.2 sonofacilmente verificati. In particolare (IP2) segue dalla linearita coniugata di A

〈f1, αf2〉 = 〈A(αf2), Af1〉 = 〈αAf2, Af1〉 = α〈f1, f2〉.

Sia g0 ∈ H ′′ arbitrario. Sia la sua rappresentazione di Riesz

g0(f) = 〈f0, f〉 = 〈Af, Af0〉.

Ricordiamo ora che f(x) = 〈z, x〉 dove z = Af e sia x0 = Af0. Abbiamo allora

〈Af, Af0〉 = 〈z, x0〉 = f(x0).

Confrontando g0(f) = f(x0), ossia g0 = Cx0 per la definizione di C. Poiche g0 ∈ H ′′ eraarbitrario C e surgettivo e quindi H e riflessivo.

A volte separabilita e non separabilita possono giocare un ruolo nella prova che certispazi non sono riflessivi. Per approfondire questi temi lo studente interessato puo utilizzarela versione estesa delle dispense.

4.7 Teorema della Categoria e della Uniforme Limita-tezza

Il teorema di uniforme limitatezza (o principio di uniforme limitatezza) e spesso consideratocome una delle pietre d’angolo dell’analisi funzionale negli spazi normati, le altre essendoil teorema di Hahn–Banach, il teorema dell’applicazione aperta ed il teorema del graficochiuso. Al contrario del teorema di Hahn–Banach gli altri tre di questi quattro teoremirichiedono la completezza. Infatti essi caratterizzano alcune delle piu importanti proprietadegli spazi di Banach che in generale gli spazi normati possono non avere.

E molto interessante notare che tutti e tre i teoremi si ottengono da una sorgente comu-ne. Piu precisamente proveremo il cosiddetto teorema della categoria di Baire e deriveremoda esso sia il teorema di uniforme limitatezza (in questa sezione) che il teorema della appli-cazione aperta (nella Sez. 4.10). Lo studente interessato puo trovare il teorema del graficochiuso e la sua dimostrazione nella versione estesa delle dispense.

4.19 Teorema (Categoria di Baire. Spazi Metrici Completi)Se uno spazio metrico X 6= ∅ e completo e

X =∞⋃

k=1

Ak con tutti gli Ak chiusi, (4.44)

4.7. TEOREMA DELLA CATEGORIA E DELLA UNIFORME LIMITATEZZA 93

allora almeno un Ak contiene un sottoinsieme aperto non vuoto.

Dimostrazione. Supponiamo per assurdo che lo spazio metrico completo X 6= ∅ sia tale che

X =∞⋃

k=1

Mk (4.45)

con ciascun Mk chiuso non contenente un sottoinsieme aperto non vuoto. Costruiremo unasuccessione di Cauchy (pk) il cui limite p (che esiste per la completezza) non e in alcun Mk,contraddicendo percio la rappresentazione (4.45).

Per ipotesi M1 non contiene un insieme aperto non vuoto. Ma X sı (ad esempio Xstesso). Questo implica che M1 6= X. Quindi il complemento MC

1 = X −M1 di M1 e nonvuoto ed aperto. Possiamo cosı scegliere un punto p1 in MC

1 ed una palla chiusa di cui ecentro tale che

B1 = B(p1; r1) ⊂ MC1 r1 ≤ 1

2.

Per ipotesi anche M2 non contiene un insieme aperto non vuoto. Quindi non contiene la

palla aperta◦B1. Cio implica che MC

2

⋂ ◦B1 e non vuoto ed aperto, cosı che possiamo scegliere

una palla chiusa B2 in questo insieme tale che

B2 = B(p2; r2) ⊂ MC2

⋂ ◦B1 r2 ≤ 1

22.

Per induzione otteniamo cosı una successione di palle chiuse

Bk = B(pk; rk) rk ≤ 12k

tali che Bk

⋂Mk = ∅ e

Bk+1 ⊂ Bk k = 1, 2, · · · .

Poiche rk ≤ 2−k la successione (pk) dei centri e di Cauchy e converge, ossia pk → p ∈X perche X e completo per ipotesi. Inoltre per ogni m e n > m abbiamo B (pn; rn) ⊂B(pm; rm) cosı che

d(pm, p) ≤ d(pm, pn) + d(pn, p)≤ rm + d(pn, p)

e per n →∞d(pm, p) ≤ rm.

Ossia p ∈ Bm per ogni m. Poiche Bm ⊂ MCm, vediamo ora che p /∈ Mm per ogni m, cosı

che p /∈ X. Cio contraddice p ∈ X. Il teorema di Baire e dimostrato.Notiamo che l’inverso del teorema di Baire in generale non e vero.Dal teorema di Baire otterremo ora facilmente il teorema della uniforme limitatezza.

Questo teorema stabilisce che se X e uno spazio di Banach ed una successione di operatoriTn ∈ B(X,Y ) e limitata in ogni punto x ∈ X, allora la successione e uniformemente limitata.In altre parole la limitatezza puntiforme implica la limitatezza in un senso piu forte, ossia launiforme limitatezza. (Il numero reale cx nella (4.46), qui di seguito, varia in generale conx, un fatto che indichiamo coll’indice x; il punto essenziale e che cx non dipende da n.)

94 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

4.20 Teorema (Uniforme Limitatezza)Sia (Tn) una successione di operatori lineari limitati Tn : X → Y da uno spazio di BanachX in uno spazio normato Y tale che (||Tnx||) sia limitata per ogni x ∈ X, cioe

||Tnx|| ≤ cx n = 1, 2, · · · (4.46)

dove cx e un numero reale. Allora la successione di norme ||Tn|| e limitata, ossia v’e un ctale che

||Tn|| ≤ c n = 1, 2, · · · . (4.47)

Dimostrazione. Per ogni k ∈ N sia Ak ⊂ X l’insieme di tutti gli x tali che

||Tnx|| ≤ k per tutti gli n.

Ak e chiuso. Infatti per ogni x ∈ Ak v’e una successione (xj) in Ak che converge a x. Questosignifica che per ogni n fisso abbiamo ||Tnxj || ≤ k ed otteniamo ||Tnx|| ≤ k perche Tn econtinuo e cosı la norma in Y (cf. Sez. 2.2). Quindi x ∈ Ak e Ak e chiuso.

Per la (4.46) ciascun x ∈ X appartiene a qualche Ak. Quindi

X =∞⋃

k=1

Ak.

Poiche X e completo il teorema di Baire implica che qualche Ak contiene una palla aperta,sia

B0 = B(x0; r) ⊂ Ak0. (4.48)

Sia x ∈ X arbitrario e non nullo. Poniamo

z = x0 + γx γ =r

2||x|| . (4.49)

Allora ||z−x0|| < r, cosı che z ∈ B0. Per la (4.48) e dalla definizione di Ak0 abbiamo quindiche ||Tnz|| ≤ k0 per tutti gli n. Inoltre ||Tnx0|| ≤ k0 perche x0 ∈ B0. Dalla (4.49) otteniamo

x =1γ

(z − x0).

Cio fornisce per tutti gli n

||Tnx|| = 1γ||Tn(z − x0)|| ≤ 1

γ(||Tnz||+ ||Tnx0||) ≤ 4

r||x||k0.

Quindi per tutti gli n

||Tn|| = sup||x||=1

||Tnx|| ≤ 4rk0,

che e della forma (4.47) con c = 4k0/r.

4.8 Convergenza Forte e Debole

Sappiamo che in analisi si definiscono diversi tipi di convergenza (ordinaria, condizionale,assoluta ed uniforme). Cio fornisce maggiore flessibilita nella teoria e nelle applicazioni dellesuccessioni e delle serie. Nell’analisi funzionale la situazione e simile e vi sono una ancora

4.8. CONVERGENZA FORTE E DEBOLE 95

maggiore varieta di possibilita che risultano di interesse pratico. Nella presente sezione cioccupiamo principalmente della “convergenza debole”. Questo e un concetto basilare. Lopresentiamo ora perche la teoria della convergenza debole fa un uso essenziale del teorema diuniforme limitatezza discusso nella sezione precedente. Infatti e questa una delle maggioriapplicazioni di questo teorema.

La convergenza di successioni di elementi in uno spazio normato e stata definita nellaSez. 2.3 e d’ora innanzi sara chiamata convergenza forte per distinguerla dalla “convergenzadebole”.

Definiamo quindi dapprima la convergenza forte.

4.21 Definizione (Convergenza Forte)Una successione (xn) in uno spazio normato X e detta convergente fortemente (o convergentein norma) se v’e un x ∈ X tale che

limn→∞

||xn − x|| = 0.

Si scrivelim

n→∞xn = x

o semplicementexn → x.

x e chiamato il limite forte di (xn) e diciamo che (xn) converge fortemente a x.

La convergenza debole e definita in termini di funzionali lineari limitati su X come segue.

4.22 Definizione (Convergenza Debole)Una successione (xn) in uno spazio normato X e detta debolmente convergente se v’e un xtale che per ogni f ∈ X ′

limn→∞

f(xn) = f(x).

Si scrivexn

w→ x

o xn ⇀ x. L’elemento x e chiamato il limite debole di (xn) e diciamo che (xn) convergedebolmente a x.

Si noti che la convergenza debole significa la convergenza per la successione di numerian = f(xn) per ogni f ∈ X ′.

Il concetto illustra un principio basilare dell’analisi funzionale e precisamente il fatto chela studio degli spazi e spesso collegato a quello dei loro spazi duali.

Per applicare la convergenza debole abbiamo bisogno di conoscere alcune proprieta ba-silari, che enunciamo nel prossimo lemma. Il lettore notera che nella prova utilizziamo ilCorollario 4.10 ed il Lemma 4.13, che sono una diretta conseguenza del teorema di Hahn–Banach, ed il teorema di uniforme limitatezza. Cio mostra l’importanza di questi teoremiin connessione con la convergenza debole.

4.23 Lemma (Convergenza Debole)Sia (xn) una successione convergente debolmente in uno spazio normato X, ossia xn

w→ x.Allora

(a) Il limite debole x di (xn) e unico.

(b) Ogni sottosuccessione di (xn) converge debolmente a x.

96 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

(c) La successione (||xn||) e limitata.

Dimostrazione. (a) Supponiamo che xnw→ x e che del pari xn

w→ y. Allora f(xn) → f(x)e del pari f(xn) → f(y). Poiche (f(xn)) e una successione di numeri il suo limite e unico.Quindi f(x) = f(y), cioe per ogni f ∈ X ′ abbiamo

f(x)− f(y) = f(x− y) = 0.

Cio implica x− y = 0 per il Corollario 4.10 e mostra che il limite debole e unico.(b) segue dal fatto che (f(xn)) e una successione convergente di numeri, cosı che ogni

sottosuccessione di (f(xn)) converge ed ha il medesimo limite.(c) Poiche (f(xn)) e una successione convergente di numeri essa e limitata, cioe |f(xn)| ≤

cf per tutti gli n, dove cf e una costante che dipende da f ma non da n. Usando l’applicazionecanonica C : X → X ′′ (Sez. 4.6) possiamo definire gn ∈ X ′′ con

gn(f) = f(xn) f ∈ X ′.

(Scriviamo gn invece di gxn per evitare indici di indici.) Allora per tutti gli n

|gn(f)| = |f(xn)| ≤ cf ,

cioe la successione (|gn(f)|) e limitata per ogni f ∈ X ′. Poiche X ′ e completo per il 2.43e applicabile il teorema della uniforme limitatezza 4.20 e cio implica che (||gn||) e limitata.Ora ||gn|| = ||xn|| per il 4.13 e quindi (c) e provato.

Il lettore puo forse meravigliarsi del fatto che la convergenza debole non giochi un ruolonegli spazi Rn e Cn. La semplice ragione e che negli spazi normati finito dimensionali ladistinzione fra convergenza debole e forte scompare completamente. Proviamo questo fattoe giustifichiamo anche i termini “forte” e “debole”.

4.24 Teorema (Convergenza Forte e Debole)Sia (xn) una successione in uno spazio normato X. Ne segue

(a) La convergenza forte implica la convergenza debole col medesimo limite.

(b) L’inverso di (a) non e in generale vero.

(c) Se dim X < ∞ allora la convergenza debole implica la convergenza forte.

Dimostrazione. (a) Per definizione xn → x significa ||xn − x|| → 0 ed implica che per ognif ∈ X ′

|f(xn)− f(x)| = |f(xn − x)| ≤ ||f || ||xn − x|| → 0.

Cio mostra che xnw→ x.

(b) puo essere visto da una successione ortonormale (en) in uno spazio di Hilbert H.Infatti ogni f ∈ H ′ ha una rappresentazione di Riesz f(x) = 〈z, x〉. Quindi f(en) = 〈z, en〉.Ora la diseguaglianza di Bessel e (cf. 3.20)

∞∑n=1

|〈z, en〉|2 ≤ ||z||2.

4.8. CONVERGENZA FORTE E DEBOLE 97

Quindi la serie a sinistra converge, cosı che i suoi termini devono tendere a zero per n →∞.Cio implica

f(en) = 〈z, en〉 → 0.

Poiche f ∈ H ′ era arbitrario vediamo che enw→ 0. Tuttavia (en) non converge fortemente

perche||em − en||2 = 〈em − en, em − en〉 = 2 (m 6= n).

(c) Supponiamo che xnw→ x e che dim X = k. Sia {e1, · · · , ek} una base per X e sia

xn = α(n)1 e1 + · · ·+ α

(n)k ek

ex = α1e1 + · · ·+ αkek.

Per ipotesi f(xn) → f(x) per ogni f ∈ X ′. Prendiamo in particolare f1, · · · , fk definiti da

fj(ej) = 1, fj(em) = 0 (m 6= j).

(Ricordiamo che questa e la base duale di {e1, · · · , en}). Allora

fj(xn) = α(n)j , fj(x) = αj .

Quindi fj(xn) → fj(x) implica α(n)j → αj . Da cio otteniamo facilmente che

||xn − x|| =∥∥∥∥

k∑

j=1

(α(n)j − αj)ej

∥∥∥∥

≤k∑

j=1

|α(n)j − αj | ||ej || → 0

per n →∞. Cio mostra che (xn) converge fortemente a x.

E interessante notare che esistono anche spazi infinito dimensionali tali che i concetti diconvergenza forte e debole sono equivalenti. Un esempio e l1.

4.25 Teorema (Convergenza Debole)Se in uno spazio normato X

(a) la successione (||xn||) e limitata,

(b) per ogni elemento f di un sottoinsieme M ⊂ X ′ di vettori per cui e span M = X ′ si haf(xn) → f(x)

allora xnw→ x.

Dimostrazione. Consideriamo un qualunque f ∈ X ′ e mostriamo che f(xn) → f(x), chesignifica la convergenza debole per definizione.

Per (a) abbiamo che per un c sufficientemente largo ||xn|| ≤ c per tutti gli n e ||x|| ≤ c.Applicando la diseguaglianza triangolare otteniamo per una qualunque (fj) in span M

|f(xn)− f(x)| ≤ |f(xn)− fj(xn)|+ |fj(xn)− fj(x)|+ |fj(x)− f(x)|< ||f − fj || ||xn||+ |fj(xn)− fj(x)|+ ||fj − f || ||x||.

98 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Poiche per l’ipotesi (b) spanM = X ′, per ogni f ∈ X ′ v’e una successione (fj) in span Mtale che fj → f. Quindi per ogni dato ε > 0 possiamo trovare un j tale che

||fj − f || < ε

3c.

Inoltre poiche fj ∈ span M per l’ipotesi (b) v’e un N tale che per tutti gli n > N

|fj(xn)− fj(x)| < ε

3.

Usando queste due diseguaglianze otteniamo per n > N

|f(xn)− f(x)| ≤ ε

3cc +

ε

3+

ε

3cc = ε.

Poiche f ∈ X ′ era arbitrario cio mostra che la successione (xn) converge debolmente a x.

In conclusione consideriamo la convergenza debole in due spazi particolarmente impor-tanti.

Esempi

4.26 Teorema (Spazio di Hilbert)In uno spazio di Hilbert xn

w→ x se e solo se 〈z, xn〉 → 〈z, x〉 per tutti gli z nello spazio.

Dimostrazione. E evidente per il 3.28.

4.27 Teorema (Spazio lp.)Nello spazio lp, dove 1 < p < +∞, abbiamo xn

w→ x se e solo se

(a) La successione (||xn||) e limitata.

(b) Per ogni j fisso abbiamo ξ(n)j → ξj per n →∞, dove xn = (ξ(n)

j ) e x = (ξj).

Dimostrazione. Lo spazio duale di lp e lq, dove 1/p + 1/q = 1. Una base di Schauder di lq e(en) dove en = (δnj) ha 1 al posto n–mo e zero altrove. span(en) e denso in lq, cioe e unabase, cosı che la conclusione segue dal teorema 4.25.

4.9 Convergenza di Successioni di Operatori e di Fun-zionali

Per le successioni di operatori Tn ∈ B(X,Y ) tre tipi di convergenza risultano essere di rilievosia teorico che pratico. Essi sono

1. Convergenza in norma su B(X, Y ),

2. Convergenza forte di (Tnx) in Y,

3. Convergenza debole di (Tnx) in Y.

Le definizioni e la terminologia sono le seguenti.

4.28 Definizione (Convergenza di Successioni di Operatori)Siano X e Y spazi normati. Una successione di operatori (Tn) di operatori Tn ∈ B(X, Y ) edetta

4.9. CONVERGENZA DI SUCCESSIONI DI OPERATORI E DI FUNZIONALI 99

1. convergente uniformemente se (Tn) converge in norma su B(X, Y ),

2. convergente fortemente se (Tnx) converge fortemente in Y per ogni x ∈ X,

3. convergente debolmente se (Tnx) converge debolmente in Y per ogni x ∈ X.

In formule questo significa che v’e un operatore T tale che, rispettivamente,

||Tn − T || → 0 (4.50)||Tnx− Tx|| → 0 per tutti gli x ∈ X (4.51)|f(Tnx)− f(Tx)| → 0 per tutti gli x ∈ X e per tutti gli f ∈ Y ′. (4.52)

T e chiamato, rispettivamente, l’operatore limite uniforme, forte e debole.Abbiamo rilevato nella sezione precedente che anche in analisi, in una situazione molto

piu semplice, l’uso di diversi concetti di convergenza da una maggiore flessibilita. Cio nono-stante il lettore puo essere ancora sconcertato dai molti concetti di convergenza che abbiamoappena introdotto. Si puo chiedere se e proprio necessario avere tre concetti di convergenzaper le successioni di operatori. La risposta e che molti degli operatori che appaiono neiproblemi pratici sono dati come una sorta di limite di operatori piu semplici. E importantesapere che cosa si intende per “una sorta di” e sapere quali proprieta dell’operatore limitesono implicate dalle proprieta della successione. Inoltre all’inizio di una ricerca non sempreuno sa in che senso il limite esiste; quindi e utile avere una molteplicita di possibilita. Avolte in un problema specifico si e dapprima capaci di stabilire la convergenza in un sensomolto “dolce”, cosı che uno ha almeno qualcosa da cui partire, e solo successivamente e ingrado di sviluppare degli strumenti per provare la convergenza in un senso piu forte, cio chegarantisce “migliori” proprieta dell’operatore limite. Questa e una situazione tipica nelleequazioni alle derivate parziali.

Non e difficile mostrare che

(4.50) =⇒ (4.51) =⇒ (4.52)

(il limite essendo lo stesso), ma l’inverso in generale non e vero, come si puo vedere da alcuniesempi.

Per quanto riguarda gli operatori Tn ∈ B(X, Y ) ci chiediamo che cosa si possa diresull’operatore limite T : X → Y in (4.50)-(4.52).

Se la convergenza e uniforme T ∈ B(X,Y ); altrimenti ||Tn − T || non avrebbe senso. Sela convergenza e forte o debole T e ancora lineare ma puo non essere limitato se X non ecompleto.

Tuttavia se X e completo abbiamo il seguente lemma basilare.

4.29 Lemma (Convergenza Forte di Operatori)Sia Tn ∈ B(X, Y ) dove X e uno spazio di Banach ed Y uno spazio normato. Se (Tn) convergefortemente con limite T allora T ∈ B(X, Y ) e la successione (Tn) converge uniformementea T .

Dimostrazione. La linearita di T segue facilmente dalla linearita di Tn. Poiche Tnx → Txper ogni x ∈ X la successione (Tnx) e limitata per ogni x; cf. 1.8. Poiche X e completo(||Tn||) e limitato per il teorema della uniforme limitatezza, ossia ||Tn|| ≤ c per tutti glin. Da cio segue che ||Tnx|| ≤ ||Tn|| ||x|| ≤ c||x||. Cio implica ||Tx|| ≤ c||x||, ossia T e unoperatore limitato. Quindi anche Tn − T e limitato ed ha norma

||Tn − T || = sup||x||=1

||(Tn − T )x||

da cui otteniamo che la successione (Tn) converge uniformemente a T .

100 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Un utile criterio per la convergenza forte di operatori e il seguente.

4.30 Teorema (Convergenza Forte di Operatori)Sia data una successione (Tn) di operatori Tn ∈ B(X,Y ), dove X e normato ed Y e unospazio di Banach. Allora se

(a) la successione (||Tn||) e limitata e

(b) la successione (Tnx) converge in Y per ogni x in un sottoinsieme M tale che spanMe denso in X

la successione (Tn) e fortemente convergente

Dimostrazione. Sia c tale che ||Tn|| ≤ c per tutti gli n. Consideriamo un qualunque x ∈ X emostriamo che (Tnx) converge fortemente in Y. Dobbiamo mostrare che la successione (Tnx)e di Cauchy. Per un qualunque y ∈ span M possiamo scrivere applicando la diseguaglianzatriangolare

||Tnx− Tmx|| ≤ ||Tnx− Tny||+ ||Tny − Tmy||+ ||Tmy − Tmx||< ||Tn|| ||x− y||+ ||Tny − Tmy||+ ||Tm|| ||x− y||

Sia ε > 0 dato. Poiche span M e denso in X v’e un y ∈ span M tale che

||x− y|| < ε

3c.

Poiche y ∈ spanM la successione (Tny) e di Cauchy per (b). Quindi v’e un N tale che

||Tny − Tmy|| < ε

3(m,n > N).

Usando queste due diseguaglianze per m,n > N otteniamo

||Tnx− Tmx|| < cε

3c+

ε

3+ c

ε

3c= ε.

Poiche Y e completo (Tnx) converge in Y. Poiche x ∈ X era arbitrario cio prova la conver-genza forte di (Tn).

I funzionali lineari sono particolari operatori lineari (con immagine nei campi scalari Ro C), cosı che (4.50), (4.51) e (4.52) si applicano immediatamente. Tuttavia (4.51) e (4.52)ora diventano equivalenti per la seguente ragione. Abbiamo Tnx ∈ Y, ma ora abbiamofn(x) ∈ R (o C). Quindi la convergenza in (4.51) e (4.52) ora ha luogo in uno spaziofinito dimensionale (unidimensionale) R (o C) e l’equivalenza di (4.51) e (4.52) segue dalTeorema 4.24(c). I due concetti rimanenti sono chiamati convergenza forte e debole∗ (silegga “convergenza debole star”).

4.31 Definizione (Convergenza Forte e Debole∗ di una Successione di Funzionali)Sia (fn) una successione di funzionali lineari limitati su uno spazio normato X. Allora

(a) La convergenza forte di (fn) significa che v’e un f ∈ X ′ tale che ||fn−f || → 0. Si scrive

fn → f.

4.10. TEOREMA DELL’APPLICAZIONE APERTA 101

(b) La convergenza debole∗ di (fn) significa che v’e un f ∈ X ′ tale che fn(x) − f(x) → 0per tutti gli x ∈ X. Si scrive2

fnw∗→ f.

f in (a) e (b) e chiamato, rispettivamente, il limite forte e debole∗ di (fn).Vale il seguente teorema che e semplicemente una riformulazione del teorema 4.30 nel

caso dei funzionali lineari.

4.32 Teorema (Convergenza Debole∗ di Funzionali)Sia data una successione (fn) di funzionali lineari limitati su uno spazio normato X. Se

(a) la successione (||fn||) e limitata e

(b) la successione (fn(x)) converge per ogni x in un sottoinsieme M di X tale che spanM =X,

allora (fn) e convergente debolmente∗, il limite essendo un funzionale lineare limitatosu X.

4.10 Teorema dell’Applicazione Aperta

Vi sono applicazioni tali che l’immagine di un qualunque insieme aperto e un insieme aper-to. Ricordando la nostra discussione sull’importanza degli insiemi aperti nella Sez. 1.1comprendiamo che le applicazioni aperte sono di interesse generale. Come nel teorema diuniforme limitatezza abbiamo nuovamente bisogno della completezza ed il presente teoremamostra un’altra ragione per cui gli spazi di Banach sono piu soddisfacenti degli spazi norma-ti incompleti. Il teorema fornisce anche le condizioni per le quali l’inverso di un operatorelineare limitato e limitato. La dimostrazione del teorema dell’applicazione aperta si baserasul teorema di Baire enunciato e spiegato nella Sez. 4.7.

Incominciamo coll’introdurre il concetto di applicazione aperta.

4.33 Definizione (Applicazione Aperta)Siano X e Y spazi metrici. Allora T : X → Y e chiamata un’applicazione aperta se per ogniinsieme aperto in X l’immagine e un insieme aperto in Y.

Si noti che se l’applicazione non e surgettiva bisogna fare attenzione a distinguere fra leasserzioni che l’applicazione e aperta come un’applicazione dal suo dominio

(a) in Y,

(b) sulla sua immagine.

(b) e piu debole di (a). Per esempio se X ⊂ Y l’applicazione x 7−→ x di X in Y e apertase e solo se X e un sottoinsieme aperto di Y, mentre l’applicazione x 7−→ x di X sulla suaimmagine (che e X) e aperta in ogni caso.

Inoltre per evitare confusioni dovremmo ricordare che, per il Teorema 1.5, un’applica-zione continua T : X → Y ha la proprieta caratteristica che per ogni insieme aperto in Yl’immagine inversa e un insieme aperto in X. Cio non implica che T applichi insiemi aperti

2Questo concetto e alquanto piu importante di quello di convergenza debole di (fn), che per il 4.22significa g(fn) → g(f) per tutti i g ∈ X′′. La convergenza debole implica la convergenza debole∗ come sipuo vedere usando l’applicazione canonica definita nella Sez. 4.6.

102 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

in X su insiemi aperti in Y. Per esempio l’applicazione R→ R data da t 7−→ sin t e continuama applica (0, 2π) su [−1, 1].

Per dimostrare il teorema dell’applicazione aperta e necessario dapprima provare il se-guente lemma. Si noti che, grazie alla linearita dell’operatore T , la palla B0 puo essere presadi raggio qualunque senza che sia necessario cambiare l’enunciato del lemma e che pertantoil lemma si potrebbe parafrasare dicendo che un operatore lineare limitato surgettivo su unospazio di Banach e un operatore aperto nell’intorno dell’origine.

4.34 Lemma (Palla Unitaria Aperta)Un operatore lineare limitato T da uno spazio di Banach X su uno spazio di Banach Y ,ossia tale che T ∈ B(X, Y ) e Y = T (X), ha la proprieta che l’immagine T (B0) della pallaunitaria aperta B0 = B(0; 1) ⊂ X contiene una palla aperta di centro 0 ∈ Y.

Dimostrazione. Procedendo passo a passo proviamo

(a) La chiusura dell’immagine della palla aperta B1 = B(0; 1/2), ossia T (B1) contiene unapalla aperta V ∗ = B(y0; ε) non necessariamente centrata in 0 ∈ Y.

(b) T (B0) contiene una palla aperta V0 = B(0; ε) di centro 0 ∈ Y.

(c) T (B0) contiene la palla aperta V1 = B(0; ε/2) di centro 0 ∈ Y.

I dettagli sono i seguenti.(a) In connessione con i sottoinsiemi A ⊂ X scriveremo αA (α uno scalare) e A + w

(w ∈ X) per indicare

αA = {x ∈ X | x = αa, a ∈ A} (4.53)A + w = {x ∈ X | x = a + w, a ∈ A} (4.54)

ed analogamente per i sottoinsiemi di Y.Consideriamo la palla aperta B1 = B(0; 1/2) ⊂ X. Un qualunque x ∈ X fisso e in kB1

per k reale sufficientemente grande (k > 2||x||). Quindi

X =∞⋃

k=1

kB1.

Poiche T e lineare e surgettivo

Y = T (X) = T

( ∞⋃

k=1

kB1

)=

∞⋃

k=1

kT (B1) =∞⋃

k=1

kT (B1). (4.55)

Si noti che prendendo la chiusura non aggiungiamo alcun altro punto all’unione perchel’unione era gia l’intero spazio Y. Poiche Y e completo si applica il Teorema 4.19 di Baire.Quindi notando che (4.55) e simile a (4.44) del Teorema 4.19 concludiamo che almeno unkT (B1) deve contenere una palla aperta. Cio implica che anche T (B1) contiene una pallaaperta, sia V ∗ = B(y0; ε) ⊂ T (B1). Ne segue che

V0 = B(0; ε) = V ∗ − y0 ⊂ T (B1)− y0. (4.56)

(b) Proviamo che V0 ⊂ T (B0) dove B0 e la palla unitaria aperta. Poiche per la (4.56)sappiamo che V0 ⊂ T (B1)− y0 e sufficiente mostrare che

T (B1)− y0 ⊂ T (B0). (4.57)

4.10. TEOREMA DELL’APPLICAZIONE APERTA 103

Sia y ∈ T (B1) − y0. Allora y + y0 ∈ T (B1) e ricordiamo che anche y0 ∈ T (B1). Per ilteorema 1.12(a) vi sono due successioni un e vn in T (B1) tali che

un → y + y0, vn → y0.

Queste due successioni sono immagine per l’operatore T di due successioni wn e zn in B1,ossia e

un = Twn, vn = Tzn.

Poiche B1 ha raggio 1/2 ne segue che

||wn − zn|| ≤ ||wn||+ ||zn|| < 12

+12

= 1,

cosı che wn − zn ∈ B0. Da

T (wn − zn) = Twn − Tzn = un − vn → y

vediamo che y ∈ T (B0). Poiche y ∈ T (B1) − y0 era arbitrario cio prova la (4.57). Dalla(4.56) abbiamo cosı

V0 = B(0; ε) ⊂ T (B0). (4.58)

(c) Infine proviamo cheV1 = B(0; ε/2) ⊂ T (B0). (4.59)

Conviene introdurre le due seguenti successioni di palle aperte centrate nell’origine, rispet-tivamente in X ed in Y , nelle quali ciascuna palla contiene la palla successiva con raggioche tende a zero. Precisamente poniamo

Bn = B(0; 1/2n) ⊂ X

Vn = B(0; ε/2n) ⊂ Y.

Poiche T e lineare T (Bn) = 2−nT (B0) e quindi moltiplicando la (4.58) per 1/2n otteniamo

Vn = B(0; ε/2n) ⊂ T (Bn). (4.60)

Quindi per dimostrare la (4.59) e sufficiente mostrare che

T (B1) ⊂ T (B0).

costruendo per ogni y ∈ T (B1) una successione (zn) di X che converge ad un punto x ∈ B0

tale che y = Tx.Per il 1.12(a) vi deve essere un v ∈ T (B1) vicino a y, ossia ||y−v|| < ε/22. Ora v ∈ T (B1)

implica v = Tx1 per qualche x1 ∈ B1. e quindi per questo x1

||y − Tx1|| < ε

22.

Da cio e dalla (4.60) per n = 2 vediamo che y−Tx1 ∈ V2 ⊂ T (B2). Come prima concludiamoche v’e un x2 ∈ B2 tale che

||(y − Tx1)− Tx2|| < ε

23.

104 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Quindi (y − Tx1) − Tx2 ∈ V3 ⊂ T (B3) e cosı via. All’n–mo passo possiamo scegliere unxn ∈ Bn tale che ∥∥∥∥y −

n∑

k=1

Txk

∥∥∥∥ <ε

2n+1(n = 1, 2, · · · ). (4.61)

Osserviamo che una qualunque successione zn = x1 + · · ·+ xn costruita scegliendo xk ∈ Bk

converge a un x contenuto in B0. Infatti possiamo scrivere per n > m essendo ||xk|| < 1/2k

||zn − zm|| ≤n∑

k=m+1

||xk|| <n∑

k=m+1

12k

=n∑

k=1

12k−

m∑

k=1

12k

e quindi, poiche la serie∑∞

k=112k converge, la successione zn e di Cauchy e nello spazio

completo X converge a un x. Essendo

||x|| ≤∞∑

k=1

||xk|| <∞∑

k=1

12k

= 1. (4.62)

x ∈ B0 come affermato.Sia zn = x1 + · · ·+ xn. Per quanto sopra detto zn → x ove x ∈ B0. Poiche T e continuo

Tzn → Tx e la (4.61) mostra che Tx = y. Quindi y ∈ T (B0). Si noti infine, anche se cio einessenziale per la dimostrazione, che la successione (zn) ⊂ B0.

4.35 Teorema (Applicazione Aperta e Inverso Limitato)Un operatore lineare limitato T da uno spazio di Banach X su uno spazio di Banach Y eun’applicazione aperta. Inoltre se T e biiettivo T−1 e continuo, ossia limitato.

Dimostrazione. Proviamo che per ogni insieme aperto A ⊂ X l’immagine T (A) e aperta inY. Lo facciamo mostrando che per ogni y = Tx ∈ T (A) l’insieme T (A) contiene una pallaaperta di centro y = Tx.

Sia y = Tx ∈ T (A). Poiche A e aperto contiene una palla aperta di centro x. QuindiA − x contiene una palla aperta di centro 0; sia r il raggio della palla e poniamo k = 1/r.Allora k(A − x) contiene la palla unitaria aperta B(0; 1). Il Lemma 4.34 ora implica cheT (k(A − x)) = k[T (A) − Tx] contiene una palla aperta di centro 0 e cosı pure T (A) − Tx.Quindi T (A) contiene una palla aperta di centro Tx = y. Poiche y ∈ T (A) era arbitrarioT (A) e aperto.

Infine se T−1 : Y → X esiste e continuo per il Teorema 1.5 perche T e aperto. PoicheT−1 e lineare per il Teorema 2.26 esso e limitato per il Teorema 2.32.

Problemi

1. Siano Tn : `2 → `2 definiti da

Tn

(ξ1, ξ2, . . . , ξn, ξn+1, . . .

)= (0, 0, . . . , 0︸ ︷︷ ︸n zeri

, ξn, ξn+1, . . . ).

Mostrare che i Tn sono lineari e limitati con norma ||Tn|| = 1.. Mostrare che lasuccessione Tn converge a 0 fortemente, ma non uniformemente.

2. Siano Tn : `2 → `2 definiti da

Tn (ξ1, ξ2, . . . ) = (0, 0, . . . , 0︸ ︷︷ ︸n zeri

, ξ1, ξ2, . . . ).

4.10. TEOREMA DELL’APPLICAZIONE APERTA 105

Mostrare che i Tn sono lineari e limitati. Mostrare che la successione Tn converge a 0debolmente, ma non fortemente.

Suggerimento: Si utilizzi per un qualunque funzionale lineare limitato f su `2 larappresentazione di Riesz

f(x) =< z, x >=∞∑

j=1

ζjξj .

Allora

f(Tnx) =∞∑

k=1

ζn+kξk

e quindi . . . Per mostrare che la successione Tn non puo convergere fortemente siconsideri ||Tmx− Tnx|| per x = (1, 0, 0, . . . ).

106 CAPITOLO 4. TEOREMI PER GLI SPAZI NORMATI E DI BANACH

Capitolo 5

Teoria Spettrale degli OperatoriLineari in Spazi Normati

Breve orientamento sul principale contenuto del capitoloCominciamo con gli spazi finito dimensionali. La teoria spettrale in questo caso e essen-

zialmente la teoria degli autovalori delle matrici (Sez. 5.1) ed e molto piu semplice di quelladegli operatori negli spazi infinito dimensionali. I problemi degli autovalori delle matricisuggeriscono anche parte dell’approccio generale ed alcuni dei concetti della teoria spettralenegli spazi normati infinito dimensionali come definiti nella Sez. 5.2, sebbene il caso infinitodimensionale sia molto piu complicato di quello finito dimensionale.

Importanti proprieta dello spettro degli operatori lineari limitati su spazi normati e spazidi Banach sono discussi nelle Sez. 5.3 e 5.4.

Assunzioni generaliEscludiamo lo spazio vettoriale banale {0} ed assumiamo che tutti gli spazi siano com-

plessi a meno che non sia diversamente stabilito.

5.1 Teoria Spettrale in Spazi Normati Finito Dimensio-nali

Sia X uno spazio normato finito dimensionale e T : X → X un operatore lineare. La teoriaspettrale di tali operatori e piu semplice di quella degli operatori definiti su spazi infinitodimensionali. Infatti dalla Sez. 2.10 sappiamo che possiamo rappresentare T con dellematrici (che dipendono dalla scelta delle basi per X) e mostreremo che la teoria spettrale diT e essenzialmente la teoria degli autovalori delle matrici. Percio cominciamo colle matrici.

Osserviamo che la presente sezione e algebrica, ma faremo ben presto uso della norma apartire dalla prossima sezione.

Per una matrice data quadrata a n righe A = (αjk) i concetti di autovalori e di autovettorisono definiti in termini dell’equazione

Ax = λx (5.1)

come segue.

5.1 Definizione (Spettro, Insieme Risolvente di una Matrice)Un autovalore di una matrice quadrata A = (αjk) e un numero λ tale che la (5.1) ha unasoluzione x 6= 0. Questo x e chiamato un autovettore di A corrispondente all’autovalore λ. Gli

107

108 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

autovettori corrispondenti a questo autovalore λ ed il vettore nullo formano un sottospaziovettoriale di X che e chiamato l’autospazio di A corrispondente a questo autovalore λ.L’insieme σ(A) di tutti gli autovalori di A e chiamato lo spettro di A. Il suo complementoρ(A) = C− σ(A) nel piano complesso e chiamato l’insieme risolvente di A.

Cosa possiamo dire sull’esistenza degli autovalori di una matrice in generale?Per rispondere a questa domanda osserviamo dapprima che la (5.1) puo essere riscritta

(A− λI)x = 0 (5.2)

dove I e la matrice quadrata unita a n–righe. Questo e un sistema omogeneo di n equazionilineari in n incognite ξ1, · · · , ξn, le componenti di x. Il determinante dei coefficienti e det(A−λI) e deve essere zero affinche la (5.2) abbia una soluzione x 6= 0. Cio da l’equazionecaratteristica di A

det(A− λI) =

∣∣∣∣∣∣∣∣∣

α11 − λ α12 · · · α1n

α21 α22 − λ · · · α2n

......

. . ....

αn1 αn2 · · · αnn − λ

∣∣∣∣∣∣∣∣∣= 0. (5.3)

det(A−λI) e chiamato il determinante caratteristico di A. Sviluppandolo otteniamo unpolinomio in λ di grado n, il polinomio caratteristico di A.

Il nostro risultato e il teorema basilare seguente.

5.2 Teorema (Autovalori di una Matrice)Gli autovalori di una matrice quadrata a n–righe A = (αjk) sono dati dalle soluzioni dell’e-quazione caratteristica (5.3) di A. Quindi A ha almeno un autovalore (e al piu n autovalorinumericamente differenti).

La seconda affermazione vale perche, per il cosiddetto teorema fondamentale dell’algebraed il teorema della fattorizzazione, un polinomio di grado n e con coefficienti in C ha unaradice in C (ed al piu n radici numericamente differenti). Si noti che le radici possono esserecomplesse anche se A e reale.

Come possiamo applicare il nostro risultato ad un operatore lineare T : X → X suuno spazio normato X di dimensione n? Sia e = {e1, · · · , en} una base qualunque perX e Te = (αjk) la matrice che rappresenta T rispetto a questa base (i cui elementi sonodati in un ordine fissato). Allora gli autovalori della matrice Te sono chiamati autovaloridell’operatore T ed analogamente per lo spettro e per l’insieme risolvente. Cio e giustificatodal seguente teorema.

5.3 Teorema (Autovalori di un Operatore)Tutte le matrici che rappresentano un dato operatore lineare T : X → X su uno spazionormato finito dimensionale X rispetto alle varie basi per X hanno i medesimi autovalori.

Dimostrazione. Dobbiamo vedere che cosa capita nel passaggio da una base ad un’altra inX. Siano e = (e1, · · · , en) ed e′ = (e′1, · · · , e′n) due basi qualunque in X scritte come vettoririga. Per definizione di base ciascun ej e una combinazione lineare degli e′k e viceversa.Possiamo scrivere cioe

e′ = eC o e′> = C>e> (5.4)

dove C e una matrice quadrata a n–righe non singolare. Ogni x ha un’unica rappresentazionerispetto a ciascuna delle due basi, ossia

x = eξ =∑

ξjej = e′ξ′ =∑

ξ′ke′k

5.1. TEORIA SPETTRALE IN SPAZI NORMATI FINITO DIMENSIONALI 109

dove ξ = (ξj) e ξ′ = (ξ′k) sono vettori colonna. Da questa e dalla (5.4) abbiamo eξ = e′ξ′ =eCξ′. Quindi

ξ = Cξ′. (5.5)

Analogamente per Tx = y = eη = e′η′, dove η = (ηj) e η′ = (η′j), abbiamo

η = Cη′. (5.6)

Di conseguenza, se A e A′ denotano le matrici che rappresentano T rispetto ad e ed e′, allora

η = Aξ e η′ = A′ξ′.

Da cio e dalle (5.5) e (5.6) abbiamo

CA′ξ′ = Cη′ = η = Aξ = ACξ′.

Moltiplicando a sinistra per C−1 otteniamo la legge di trasformazione

A′ = C−1AC (5.7)

con C determinato dalle basi secondo la (5.4) (e indipendente da T ). Usando la (5.7) edet(C−1) det C = 1 possiamo mostrare ora che i determinanti caratteristici di A e A′ sonouguali

det(A′ − λI) = det(C−1AC − λC−1IC) (5.8)= det(C−1(A− λI)C)= det(C−1) det(A− λI) det C

= det(A− λI).

L’eguaglianza degli autovalori di A e di A′ segue ora dal Teorema 5.2.Menzioniamo di passaggio che possiamo anche esprimere i nostri risultati in termini del

seguente concetto, che e di interesse generale. Una matrice n × n A′ e detta similare aduna matrice n × n A se esiste una matrice C non singolare tale che vale la (5.7). A e A′

sono allora chiamate matrici similari. In termini di questo concetto la nostra dimostrazionemostra quanto segue.

(i) Due matrici rappresentanti il medesimo operatore lineare T su uno spazio normato finitodimensionale X relative a due basi qualunque per X sono similari.

(ii) Matrici similari hanno gli stessi autovalori.

Inoltre i Teoremi 5.2 e 5.3 implicano il seguente teorema.

5.4 Teorema (Esistenza degli Autovalori)Un operatore lineare su uno spazio normato complesso finito dimensionale X 6= {0} haalmeno un autovalore.

In generale non possiamo dire di piu.Inoltre la (5.8) con λ = 0 da detA′ = det A. Quindi il valore del determinante rappresenta

una proprieta intrinseca dell’operatore T, cosı che possiamo parlare senza ambiguita dellaquantita det T.

110 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

5.2 Concetti Basilari

Nella sezione precedente gli spazi erano finito dimensionali. In questa sezione consideriamospazi normati di dimensione qualunque e vedremo che negli spazi infinito dimensionali lateoria spettrale diventa molto piu complicata.

Sia X 6= {0} uno spazio normato complesso, T : X → X un operatore lineare eR(T ) ⊂ Xla sua immagine. A T associamo l’operatore

Tλ = T − λI (5.9)

dove λ e un numero complesso ed I e l’operatore identita su X. Indichiamo con R(Tλ)l’immagine di Tλ. Se l’operatore lineare Tλ : X → R(Tλ) ammette inverso lo indichiamocon Rλ(T ), cioe

Rλ(T ) = T−1λ = (T − λI)−1 (5.10)

e lo chiamiamo l’operatore risolvente di T o, semplicemente, il risolvente di T. Invecedi Rλ(T ) scriviamo semplicemente Rλ se e chiaro a quale operatore T ci si riferisce nellaspecifica discussione.

Il nome “risolvente” e appropriato perche Rλ(T ) aiuta a risolvere l’equazione Tλx = y.Infatti x = T−1

λ y = Rλ(T )y purche Rλ(T ) esista. Notiamo inoltre che Rλ(T ) e un operatorelineare per il Teorema 2.26(b).

Piu importante ancora e il fatto che lo studio delle proprieta di Rλ risulta basilare peruna comprensione dell’operatore T stesso. Naturalmente le proprieta di Rλ dipendono da λe la teoria spettrale ha appunto a che fare con queste proprieta.

Noi ci occuperemo solamente della teoria spettrale degli operatori lineari limitati definitisu spazi di Banach complessi. Lo studente interessato puo trovare nella versione estesa delledispense un breve introduzione al caso generale.

5.3 Proprieta Spettrali degli Operatori Lineari Limitati

Le proprieta dello spettro dipendono dal tipo di spazio su cui l’operatore e definito e daltipo di operatore che si considera. Questa situazione suggerisce di studiare separatamentelarghe classi di operatori con proprieta spettrali comuni ed in questa sezione ci occupiamodegli operatori lineari limitati T su uno spazio di Banach complesso X. Cosı T ∈ B(X,X),dove X e completo; cf. Sez. 2.11.

Nel caso degli operatori lineari limitati su uno spazio di Banach conviene distinguere iseguenti casi possibili:

Rλ(T ) esiste, R(Tλ) = Xdef⇐⇒ λ ∈ ρ(T )

Rλ(T ) non esiste def⇐⇒ λ ∈ σp(T )Rλ(T ) esiste, R(Tλ) X, Rλ(T ) limitato def⇐⇒ λ ∈ σc(T )Rλ(T ) esiste, R(Tλ) X, Rλ(T ) non limitato def⇐⇒ λ ∈ σr(T )

L’insieme ρ(T ) e chiamato l’insieme risolvente di T ed un λ ∈ ρ(T ) e chiamato un valoreregolare di T. Il suo complemento σ(T ) = C − ρ(T ) nel piano complesso C e chiamato lospettro di T ed un λ ∈ σ(T ) e chiamato un valore spettrale di T. Inoltre lo spettro σ(T ) epartizionato secondo la tabella sopra riportata in tre insiemi disgiunti.

L’insieme σp(T ) e chiamato lo spettro puntuale o spettro discreto di T e λ ∈ σp(T ) echiamato un autovalore di T .

5.3. PROPRIETA SPETTRALI DEGLI OPERATORI LINEARI LIMITATI 111

L’insieme σc(T ) e chiamato lo spettro continuo di T .L’insieme σr(T ) e chiamato lo spettro residuale di T .A questa tabella va aggiunta l’osservazione che se λ ∈ ρ(T ) allora, per il teorema

dell’inverso limitato 4.35, Rλ(T ) e limitato.Notiamo che i quattro insiemi della tabella sono disgiunti e che la loro unione e l’intero

piano complesso

C = ρ(T )⋃

σ(T )

= ρ(T )⋃

σp(T )⋃

σc(T )⋃

σr(T ).

Alcuni degli insiemi in questa definizione possono essere vuoti. Si tratta di un problema diesistenza che dovremo discutere. Per esempio σc(T ) = σr(T ) = ∅ nel caso finito dimensionalecome sappiamo dalla Sez. 5.1. Una motivazione per la partizione di σ(T )− σp(T ) in σc(T )e σr(T ) e data dal fatto che σr(T ) = ∅ per l’importante classe degli operatori autoaggiuntisugli spazi di Hilbert.

Poiche Rλ(T ) : R(Tλ) → X esiste se e solo se Tλx = 0 implica x = 0, cioe se lo spazionullo di Tλ e {0}, se Tλx = (T − λI)x = 0 per qualche x 6= 0 allora λ ∈ σp(T ) per defini-zione. In questo caso per analogia col caso finito dimensionale λ si dice autovalore di T edx autovettore di T (o autofunzione di T se X e uno spazio funzionale) corrispondenteall’autovalore λ. Il sottospazio di X consistente dello 0 e di tutti gli autovettori di T corri-spondenti ad un autovalore λ di T e chiamato l’autospazio di T corrispondente all’autovaloreλ.

Come nel caso finito dimensionale vale il seguente teorema, la cui dimostrazione rimaneinvariata rispetto al caso finito dimensionale.

5.5 Teorema (Indipendenza Lineare)Gli autovettori x1, · · · , xn corrispondenti ad autovalori differenti λ1, · · · , λn di un operatorelineare T in uno spazio vettoriale X costituiscono un insieme linearmente indipendente.

Dimostrazione. Assumiamo che {x1, · · · , xn} sia linearmente dipendente e deriviamo unacontraddizione. Sia xm il primo dei vettori che sia una combinazione lineare dei precedenti,ossia

xm = α1x1 + · · ·+ αm−1xm−1. (5.11)

Allora {x1, · · · , xm−1} e linearmente indipendente. Applicando T − λmI ad entrambi imembri della (5.11) otteniamo

(T − λmI)xm =m−1∑

j=1

αj(T − λmI)xj

=m−1∑

j=1

αj(λj − λm)xj .

Poiche xm e un autovettore corrispondente a λm il membro a sinistra e zero. Poiche i vettoria destra formano un insieme linearmente indipendente dobbiamo avere

αj(λj − λm) = 0, quindi αj = 0 (j = 1, · · · ,m− 1)

giacche λj − λm 6= 0. Ma allora xm = 0 per la (5.11). Cio contraddice il fatto che xm 6= 0perche xm e un autovettore e completa la dimostrazione.

Il teorema che segue e, come vedremo, un teorema chiave in varie parti della teoria.

112 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

5.6 Teorema (Inverso)Sia T ∈ B(X, X), dove X e uno spazio di Banach. Se ||T || < 1 allora I − T ha range X,(I − T )−1 esiste ed e un operatore lineare limitato su tutto lo spazio X e

(I − T )−1 =∞∑

j=0

T j = I + T + T 2 + · · · (5.12)

[dove la serie a destra e convergente secondo la norma su B(X,X)].

Dimostrazione. Abbiamo ||T j || ≤ ||T ||j per la (2.20), Sez. 2.8. Ricordiamo che la seriegeometrica

∑ ||T ||j converge per ||T || < 1. Quindi la serie nella (5.12) e assolutamenteconvergente per ||T || < 1. Poiche X e completo lo e pure B(X,X) per il Teorema 2.41.L’assoluta convergenza percio implica la convergenza come sappiamo dalla Sez. 2.3.

Indichiamo la somma della serie nella (5.12) con S e notiamo che questo operatore edefinito su tutto X cosı come T . Rimane da mostrare che S = (I − T )−1. A questo scopocalcoliamo

(I − T )(I + T + · · ·+ Tm) (5.13)= (I + T + · · ·+ Tm)(I − T )= I − Tm+1.

Lasciamo ora m →∞. Allora Tm+1 → 0 perche ||T || < 1. Otteniamo cosı

(I − T )S = S(I − T ) = I. (5.14)

Cio mostra che S e l’inverso destro e sinistro di (I − T ). Il fatto che S sia definito su tuttoX e sia l’inverso sinistro garantisce che la soluzione dell’equazione operatoriale (I−T )x = yper un y ∈ X qualunque sia data da x = Sy e quindi il range di I−T e X. Il fatto che S sial’inverso destro garantisce che l’equazione operatoriale Sx = y per un y ∈ X qualunque siadata da x = (I−T )y e quindi il range di S e X. S e dunque l’inverso di (I−T ) applicazionedi X su X.

Come prima applicazione di questo teorema proviamo l’importante fatto che il risolventeRλ si puo rappresentare mediante una serie di potenze in λ.

5.7 Teorema (Rappresentazione del Risolvente)Se T e un operatore lineare limitato su uno spazio di Banach complesso X, per ogni λ0 ∈ ρ(T )il risolvente Rλ(T ) esiste ed e limitato nel disco aperto centrato in λ0 e di raggio

r =1

||Rλ0 ||(5.15)

ed in questo disco ha la rappresentazione

Rλ =∞∑

j=0

(λ− λ0)jRj+1λ0

, (5.16)

la serie essendo assolutamente convergente per ogni λ nel disco aperto.

Dimostrazione. Per un λ0 ∈ ρ(T ) fisso ed un λ ∈ C qualsiasi abbiamo

T − λI = T − λ0I − (λ− λ0)I= (T − λ0I)[I − (λ− λ0)(T − λ0I)−1].

5.3. PROPRIETA SPETTRALI DEGLI OPERATORI LINEARI LIMITATI 113

Indicando l’operatore in parentesi [· · · ] con V possiamo scrivere

Tλ = Tλ0V dove V = I − (λ− λ0)Rλ0 , (5.17)

ove, poiche λ0 ∈ ρ(T ), l’operatore Rλ0 = T−1λ0

∈ B(X,X). Inoltre il Teorema 5.6 mostra cheV ha un inverso in B(X, X) definito su tutto X

V −1 =∞∑

j=0

[(λ− λ0)Rλ0 ]j =

∞∑

j=0

(λ− λ0)jRjλ0

(5.18)

per tutti i λ tali che ||(λ− λ0)Rλ0 || < 1, ossia

|λ− λ0| < 1||Rλ0 ||

. (5.19)

Poiche T−1λ0

= Rλ0 ∈ B(X, X) vediamo da cio e dalla (5.17) che per ogni λ che soddisfa la(5.19) l’operatore Tλ ha un inverso in B(X, X) definito su tutto X

Rλ = T−1λ = (Tλ0V )−1 = V −1Rλ0 . (5.20)

Quindi (5.19) rappresenta un intorno di λ0 consistente di valori regolari λ di T per i quali ilrisolvente ammette la rappresentazione (5.16).

Osservazione. Si osservi che se indichiamo con δ(λ0) la distanza di λ0 dallo spettro, ossiase

δ(λ0) = infs∈σ(T )

|λ0 − s| (5.21)

poiche il disco di raggio r centrato in λ0 contiene solo punti di regolarita ne segue che

r =1

||Rλ0 ||≤ δ(λ0)

e quindi||Rλ0(T )|| → ∞ come δ(λ0) → 0. (5.22)

Il teorema 5.7 sopra dimostrato ci permettera di applicare l’analisi complessa alla teoriaspettrale, come vedremo nella Sez. 5.5.

Inoltre da questo teorema segue immediatamente che lo spettro di un operatore linearelimitato e un insieme chiuso nel piano complesso (mostreremo che σ 6= ∅ in 5.15.).

5.8 Teorema (Spettro Chiuso)L’insieme risolvente ρ(T ) di un operatore lineare limitato T su uno spazio di Banach com-plesso X e aperto; quindi lo spettro σ(T ) e chiuso.

Come ulteriore conseguenza del Teorema 5.6 proviamo l’importante fatto che per unoperatore lineare limitato lo spettro e un insieme limitato nel piano complesso.

5.9 Teorema (Spettro)Lo spettro σ(T ) di un operatore limitato T : X → X su uno spazio di Banach complesso Xe compatto e giace nel disco dato da

|λ| ≤ ||T ||. (5.23)

Quindi l’insieme risolvente ρ(T ) di T e non vuoto. [in 5.15 mostreremo che σ(T ) 6= ∅.]

114 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

Dimostrazione. Sia λ 6= 0. Dal Teorema 5.6 otteniamo la rappresentazione

Rλ = (T − λI)−1 = − 1λ

(I − 1

λT

)−1

= − 1λ

∞∑

j=0

(1λ

T

)j

(5.24)

dove per il Teorema 5.6 la serie converge per tutti i λ tali che∥∥∥∥

T

∥∥∥∥ =||T |||λ| < 1 cioe |λ| > ||T ||.

Il medesimo teorema mostra anche che un qualunque tale λ e in ρ(T ). Quindi lo spettroσ(T ) = C − ρ(T ) deve giacere nel disco (5.23), cosı che σ(T ) e limitato. Inoltre σ(T ) echiuso per il Teorema 5.8. Quindi σ(T ) e compatto.

Poiche dal teorema appena dimostrato sappiamo che per un operatore lineare limitato Tsu uno spazio di Banach lo spettro e limitato sembra naturale chiedersi qual e il disco minimoattorno all’origine che contiene l’intero spettro. Questa domanda suggerisce il seguenteconcetto.

5.10 Definizione (Raggio Spettrale)Il raggio spettrale rσ(T ) di un operatore T ∈ B(X,X) su uno spazio di Banach complessoX e il raggio

rσ(T ) = supλ∈σ(T )

|λ|

del piu piccolo disco chiuso centrato nell’origine del piano complesso di λ che contiene σ(T ).Dalla (5.23) e ovvio che per il raggio spettrale di un operatore lineare limitato su uno

spazio di Banach complesso abbiamo

rσ(T ) ≤ ||T || (5.25)

e nella Sez. 5.5 proveremo che

rσ(T ) = limn→∞

(||Tn||)1/n. (5.26)

5.4 Ulteriori Proprieta del Risolvente e dello Spettro

Alcune ulteriori proprieta del risolvente interessanti e basilari al medesimo tempo sonoespresse nel seguente Teorema.

5.11 Teorema (Equazione del Risolvente, Commutativita)Siano X uno spazio di Banach complesso, T ∈ B(X, X) e λ, µ ∈ ρ(T ). Allora

(a) Il risolvente Rλ di T soddisfa alla identita di Hilbert o equazione del risolvente

Rµ −Rλ = (µ− λ)RµRλ [λ, µ ∈ ρ(T )]. (5.27)

(b) Rλ commuta con un qualunque S ∈ B(X, X) che commuta con T.

(c) AbbiamoRλRµ = RµRλ [λ, µ ∈ ρ(T )]. (5.28)

5.4. ULTERIORI PROPRIETA DEL RISOLVENTE E DELLO SPETTRO 115

Dimostrazione. (a) Poiche l’immagine di Tλ e tutto X, essendo λ regolare, abbiamo I =TλRλ dove I e l’operatore identita su X. E anche I = RµTµ. Di conseguenza

Rµ −Rλ = Rµ(TλRλ)− (RµTµ)Rλ

= Rµ(Tλ − Tµ)Rλ

= Rµ[T − λI − (T − µI)]Rλ

= (µ− λ)RµRλ.

(b) Per ipotesi ST = TS. Quindi STλ = TλS. Usando I = TλRλ = RλTλ otteniamo cosı

RλS = RλSTλRλ = RλTλSRλ = SRλ.

(c) Rµ commuta con T per (b). Quindi Rλ commuta con Rµ per (b).Il nostro prossimo risultato sara l’importante teorema dell’applicazione spettrale e par-

tiamo con una motivazione suggerita dalla teoria degli autovalori delle matrici.Se λ e un autovalore di una matrice quadrata A allora Ax = λx per qualche x 6= 0.

Applicando A si ottieneA2x = Aλx = λAx = λ2x.

Continuando in questa maniera abbiamo per ogni intero positivo m

Amx = λmx;

ossia se λ e un autovalore di A allora λm e un autovalore di Am. Piu generalmente allora

p(λ) = αnλn + αn−1λn−1 + · · ·+ α0

e un autovalore della matrice

p(A) = αnAn + αn−1An−1 + · · ·+ α0I.

Si puo mostrare che si ottengono cosı tutti gli autovalori della matrice p(A).E assai notevole che questa proprieta si estenda agli spazi di Banach complessi di dimen-

sioni qualunque, come dimostreremo. Nella dimostrazione useremo il fatto che un operatorelineare limitato ha uno spettro non vuoto. Questo lo mostreremo piu in la con i metodidell’analisi complessa.

Una notazione conveniente per formulare il teorema e

p(σ(T )) = {µ ∈ C | µ = p(λ), λ ∈ σ(T )}, (5.29)

cioe p(σ(T )) e l’insieme di tutti i numeri complessi µ tali che µ = p(λ) per qualche λ ∈ σ(T ).Useremo anche p(ρ(T )) con un significato simile.

5.12 Teorema (Applicazione Spettrale per i Polinomi)Sia X uno spazio di Banach complesso, T ∈ B(X, X) e

p(λ) = αnλn + αn−1λn−1 + · · ·+ α0 (αn 6= 0).

Alloraσ(p(T )) = p(σ(T )); (5.30)

116 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

ossia lo spettro σ(p(T )) dell’operatore

p(T ) = αnTn + αn−1Tn−1 + · · ·+ α0I

consiste precisamente di tutti quei valori che il polinomio p assume sullo spettro σ(T ) di T.

Dimostrazione. Assumiamo che σ(T ) 6= ∅; cio sara dimostrato in 5.15. Il caso n = 0 ebanale; allora p(σ(T )) = {α0} = σ(p(T )). Sia n > 0. Nella parte (a) proviamo che

σ(p(T )) ⊂ p(σ(T )) (5.31)

e nella parte (b) chep(σ(T )) ⊂ σ(p(T )), (5.32)

cosı che otteniamo la (5.30). I dettagli sono i seguenti.(a) Supponiamo per assurdo che esista un µ ∈ σ(p(T )) tale che non esista alcun λ ∈ σ(T )

per cui sia µ = p(λ).Per semplicita scriviamo S = p(T ) e

Sµ = p(T )− µI.

Poiche X e complesso il polinomio dato da sµ(λ) = p(λ)−µ deve fattorizzare completamentein termini lineari, ossia

sµ(λ) = p(λ)− µ = αn(λ− γ1)(λ− γ2) · · · (λ− γn), (5.33)

dove γ1, · · · , γn sono gli zeri di sµ (che dipendono naturalmente da µ), ossia

sµ(γj) = p(γj)− µ = 0

per ogni γj . Per l’ipotesi assurda fatta nessun λ ∈ σ(T ) puo essere radice di sµ (λ) e quindiciascun γj e in ρ(T ) e ciascun T − γjI ha un inverso limitato definito su tutto X. Incorrispondenza alla (5.33) abbiamo

Sµ = p(T )− µI = αn(T − γ1I)(T − γ2I) · · · (T − γnI).

e quindi per la (2.13) nella Sez. 2.6 S−1µ esiste e vale

S−1µ =

1αn

(T − γnI)−1 · · · (T − γ2I)−1(T − γ1I)−1.

Quindi in questo caso µ ∈ ρ(p(T )) in contraddizione con l’ipotesi assurda fatta. Da cioconcludiamo che

σ(p(T )) ⊂ p(σ(T )).

(b) Dimostriamo ora la (5.32)

p(σ(T )) ⊂ σ(p(T )). (5.34)

Supponiamo per assurdo che esista un κ ∈ p(σ(T )), ossia un κ per cui

κ = p(β) per qualche β ∈ σ(T ),

e tale che κ /∈ σ(p(T )), ossia tale che κ ∈ ρ(p(T )).

5.5. USO DELL’ANALISI COMPLESSA NELLA TEORIA SPETTRALE 117

Da κ = p(β) abbiamo p(β)− κ = 0. Quindi β e uno zero del polinomio

sκ(λ) = p(λ)− κ.

Ne segue che possiamo scrivere

sκ(λ) = p(λ)− κ = (λ− β)g(λ),

dove g(λ) denota il prodotto degli altri n − 1 fattori lineari e di αn. In corrispondenza aquesta rappresentazione abbiamo

Sκ(T ) = p(T )− κI = (T − βI)g(T ). (5.35)

Siccome i fattori di g(T ) commutano tutti con (T − βI) abbiamo anche

Sκ = g(T )(T − βI). (5.36)

Supponiamo per assurdo che κ ∈ ρ(p(T )) e che quindi Sκ abbia un inverso. Allora la (5.35)e la (5.36) ci danno

I = (T − βI)g(T )S−1κ = S−1

κ g(T )(T − βI)

che mostra che (T − βI) ha inverso destro e sinistro. Ma allora, per le medesime conside-razioni fatte nella dimostrazione del teorema 5.6, ne segue che per l’immagine di (T − βI)dobbiamo avere

R(T − βI) = X (5.37)

e (T − βI)−1 esiste ed e definito su tutto X, che contraddirebbe β ∈ σ(T ). Cio prova la(5.34). Il teorema e dimostrato.

5.5 Uso dell’Analisi Complessa nella Teoria Spettrale

Il risolvente Rλ e un operatore che dipende dal parametro complesso λ. Cio suggerisce chepossa essere utile estendere la teoria delle funzioni di variabile complessa a valori complessialle funzioni a valori vettoriali o funzioni operatoriali di una variabile complessa λ, ossiaalle applicazioni

S : Λ → B(X,X)λ 7→ Sλ

(5.38)

dove Λ e un sottoinsieme qualunque del piano complesso di λ. Scriviamo Sλ invece di S(λ)utilizzando la medesima notazione introdotta per Rλ.

Connessioni tra l’analisi complessa e la teoria spettrale possono essere ottenute mediantegli integrali complessi curvilinei e le serie di potenze. Noi useremo solamente le serie dipotenze.

Iniziamo col definire l’olomorfia per una funzione operatoriale.

5.13 Definizione (Olomorfismo)Sia Λ un sottoinsieme aperto di C ed X uno spazio di Banach complesso. Allora Sλ nella(5.38) e detto olomorfo nel punto λ0 ∈ Λ se ha una rappresentazione in serie di potenze

Sλ =∞∑

j=0

Sj(λ− λ0)j

con Sj ∈ B(X, X) e raggio di convergenza non nullo.

118 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

Da questa definizione e dal Teorema 5.7 segue immediatamente il seguente teorema.

5.14 Teorema (Olomorfia del Risolvente)Il risolvente Rλ(T ) di un operatore lineare limitato T : X → X su uno spazio di Banachcomplesso e olomorfo in ogni punto λ0 dell’insieme risolvente ρ(T ) di T .

E di grande importanza teorica e pratica il fatto che lo spettro di un operatore linearelimitato T su uno spazio di Banach complesso non possa mai essere un insieme vuoto.

5.15 Teorema (Spettro)Se X 6= {0} e uno spazio di Banach complesso e T ∈ B(X, X) allora σ(T ) 6= ∅.Dimostrazione. Per ipotesi X 6= {0}. Se T = 0 allora σ(T ) = {0} 6= ∅. Sia T 6= 0. Allora||T || 6= 0. Cominciamo col dimostrare che il risolvente Rλ ha norma limitata a grandi λ. Laserie (5.24), Sez. 5.3, e

Rλ = − 1λ

∞∑

j=0

(1λ

T

)j

(|λ| > ||T ||). (5.39)

Poiche questa serie converge per |λ| > ||T ||| essa converge assolutamente per |λ| > 2||T ||.Per questi λ per la formula della somma di una serie geometrica otteniamo

||Rλ|| ≤ 1|λ|

∞∑

j=0

∣∣∣∣∣∣∣∣1λ

T

∣∣∣∣∣∣∣∣j

=1

|λ| − ||T || ≤1||T || (|λ| > 2||T ||), (5.40)

e quindi la norma ||Rλ|| e limitata a grandi λ, come preannunciato.Mostriamo ora che l’assunzione σ(T ) = ∅ porta ad una contraddizione. σ(T ) = ∅ implica

ρ(T ) = C. Quindi Rλ e olomorfo per tutti i λ, per il 5.14. Di conseguenza per un x ∈ Xfisso ed un f ∈ X ′ fisso la funzione h definita da

h(λ) = f(Rλx)

e sviluppabile in serie di potenze nell’intorno di ogni λ ed e quindi olomorfa su C, ossia h euna funzione intera. Poiche l’olomorfia implica la continuita h e continua e cosı limitata suldisco compatto |λ| ≤ 2||T ||. Ma h e anche limitata per |λ| > 2||T || perche ||Rλ|| ≤ 1/||T ||per la (5.40) e

|h(λ)| = |f(Rλx)| ≤ ||f || ||Rλx|| ≤ ||f || ||Rλ|| ||x||≤ ||f || ||x||/||T ||.

Quindi h e limitata su C e percio costante, per il teorema di Liouville, che stabilisce che unafunzione intera che e limitata su tutto il piano complesso e una costante. Poiche x ∈ X edf ∈ X ′ in h erano arbitrari h = cost implica che Rλ e indipendente da λ e quindi ancheR−1

λ = T − λI. Ma cio e impossibile ed il teorema e dimostrato.Il seguente teorema determina il raggio di convergenza della serie di Laurent operatoriale

(5.24).

5.16 Teorema (Serie di Laurent per il risolvente)Se T e un operatore lineare limitato su uno spazio di Banach X allora il risolvente Rλ esviluppabile in serie di Laurent

Rλ = −∞∑

j=0

1λj+1

T j (5.41)

per |λ| > rσ(T ).

5.5. USO DELL’ANALISI COMPLESSA NELLA TEORIA SPETTRALE 119

Dimostrazione. Sappiamo dal Teorema 5.9 che la serie (5.41) converge per |λ| > ||T || equindi possiamo scrivere per ogni x ∈ X ed f ∈ X ′ e per |λ| > ||T ||, grazie alla continuitadella f ,

f(Rλx) = −∞∑

j=0

1λj+1

f(T jx) (5.42)

ottenendo cosı uno sviluppo in serie di Laurent per la funzione h(λ) = f(Rλx). Poiche lafunzione h(λ) per le proprieta di olomorfia di Rλ e olomorfa per |λ| > rσ(T ) ne segue che lasua serie di Laurent (5.42) converge per |λ| > rσ(T ) e quindi sempre per la continuita dellaf otteniamo

f(Rλx) = f

∞∑

j=0

1λj+1

T jx

, per |λ| > rσ(T ), (5.43)

da cui per il Corollario 4.10

Rλx = −∞∑

j=0

1λj+1

T jx, per |λ| > rσ(T ). (5.44)

Poiche X e di Banach possiamo applicare il Lemma 4.29 ed il teorema e dimostrato.Possiamo infine provare il seguente teorema.

5.17 Teorema (Raggio Spettrale)Se T e un operatore lineare limitato su uno spazio di Banach complesso allora per il raggiospettrale rσ(T ) di T abbiamo

rσ(T ) = limn→∞

||Tn||1/n = infk≥1

{||T k||1/k}. (5.45)

Dimostrazione. Dobbiamo dapprima dimostrare che il limite in (5.45) esiste e vale r =infk≥1{||T k||1/k}. E evidentemente per ogni n ≥ 1

r ≤ ||Tn||1/n. (5.46)

Dato un ε > 0 qualunque per definizione di inf esiste un m tale che ||Tm||1/m ≤ r + ε.Per un n arbitrario scriviamo n = pm + q dove 0 ≤ q ≤ m − 1. Allora, poiche ||AB|| ≤||A|| ||B||, otteniamo

||Tn||1/n ≤ ||Tm||p/n||T ||q/n ≤ (r + ε)mp/n||T ||q/n.

Ad m fisso per n → ∞ e q/n → 0 e quindi mp/n → 1. Percio abbiamo che la limitazionesuperiore di ||Tn||1/n tende a r + ε per n →∞ e quindi esiste un N tale che per n > N sia

||Tn||1/n ≤ (r + ε) + ε.

Da questa diseguaglianza e dalla (5.46) segue che limn→∞ ||Tn||1/n esiste ed e uguale ad r.Mostriamo ora che

rσ(T ) ≤ limn→∞

||Tn||1/n. (5.47)

Abbiamo σ(Tn) = [σ(T )]n per il teorema dell’applicazione spettrale 5.12, cosı che

rσ(Tn) = [rσ(T )]n.

120 CAPITOLO 5. TEORIA SPETTRALE DEGLI OPERATORI LINEARI

Dalla (5.25) nella Sez. 5.3 applicata a Tn invece che a T vediamo che

rσ(Tn) ≤ ||Tn||.

Dal confrontorσ(T ) = (rσ(Tn))1/n ≤ (||Tn||)1/n

per ogni n. Quindi segue la (5.47).Mostriamo infine che

rσ(T ) ≥ limn→∞

||Tn||1/n. (5.48)

Rλ e olomorfa in λ per |λ| > rσ(T ). Per il Teorema 5.16 sappiamo che la serie operatoriale

Rλ = − 1λ

∞∑

k=0

(T

λ

)k

(5.49)

e convergente per |λ| > rσ(T ) e quindi

limn→∞

∣∣∣∣∣∣∣∣Tn

λn

∣∣∣∣∣∣∣∣ = 0

per |λ| > rσ(T ), cosicche per ogni ε > 0 abbiamo

(rσ(T ) + ε)n ≥ ||Tn||

a grandi n. Cio prova la (5.48). Allora la (5.47) e la (5.48) implicano la (5.45).

Problemi

1. Sia X = C[0, 1] e sia T : X → X definito da

Tx (t) = v(t)x (t)

con v (t) ∈ X. Mostrare che T e lineare e limitato e studiarne lo spettro.

Suggerimento: E ||T || = ||v||. Tλ = v(t)−λ ammette inverso limitato Rλ = (v(t)− λ)−1

per tutti i λ, che non appartengono all’intervallo chiusoR (v) e quindi σ (T ) = σp (T ) =R (v).

2. Sia {αj}j∈N un insieme numerabile di reali denso nell’intervallo [0, 1]. Si consideril’operatore T : `2 → `2 definito da y = Tx dove se x =

(ξj

)risulta y =

(αjξj

).

Mostrare che T e lineare e limitato e studiarne lo spettro.

Suggerimento: Poiche∑∣∣αjξj

∣∣2 ≤ ∑∣∣ξj

∣∣2 abbiamo ||T || ≤ 1. Essendo

(T − λI) x = ((α1 − λ) ξ1, (α2 − λ) ξ2) , . . . )

l’inverso se esiste e

(T − λI)−1x =

((α1 − λ)−1

ξ1, (α2 − λ)−1ξ2

), . . . ).

5.5. USO DELL’ANALISI COMPLESSA NELLA TEORIA SPETTRALE 121

Se λ /∈ [0, 1] l’inverso Rλ esiste ed e definito su tutto `2. Infatti, se δ (λ) = mins∈[0,1] |λ− s|e la distanza di λ dall’intervallo, abbiamo

∑ ∣∣ξj

∣∣2

|αj − λ|2 ≤1

δ (λ)2∑∣∣ξj

∣∣2 .

Se λ ∈ [0, 1] allora Rλsicuramente non esiste per λ = αj . Quindi poiche σ (T ) e chiusosegue che σ (T ) = [0, 1]. Se λ 6= αj allora Rλcertamente esiste per tutti gli x ∈ `2

della forma (ξ1, ξ2, . . . , ξn, 0, 0. . . . ) che costituiscono un insieme denso in `2. Quindiσp (T ) = {αj}j∈N e σc (T ) = σ (T )− σp (T ).

3. Si consideri l’operatore T : `p → `p definito da y = Tx dove se x =(ξj

)risulta

y =(ξj+1

). Mostrare che T e lineare e limitato e studiarne lo spettro.

Suggerimento: E ||T || = 1 e quindi se |λ| > 1 segue che λ ∈ ρ (T ). Se |λ| < 1 gliautovalori di T , ossia tali che Tλx = 0 sono

x =(α, αλ, αλ2, . . .

)

con α ∈ C. Per |λ| < 1 essi appartengono a `p e quindi σ(T ) = {λ | |λ| ≤ 1}. Per|λ| = 1 invece x 6= `p e quindi l’inverso Rλ esiste. Poiche R (T ) = X l’operatore Rλ per|λ| = 1 non puo essere limitato e quindi σp (T ) e il disco aperto centrato nell’origine edi raggio 1 e σc (T ) e la circonferenza centrata nell’origine e di raggio 1.