Universita di Pisa
Facolta di Scienze Matematiche Fisiche e Naturali
Corso di Laurea Specialistica in Scienze Fisiche
Anno Accademico 2005 - 2006
Tesi di Laurea Specialistica
Convergenza all’equilibrio
per sistemi grandi
Candidato
Giuseppe De Nittis
Relatore
Chiar.mo Prof. Giovanni Morchio
A LaRa
Indice
1 Introduzione e risultati 1
2 Lo stato dei fondamenti della Meccanica Statistica all’equilibrio 11
2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Le idee generali sull’origine dell’equilibrio . . . . . . . . . . . . . . . 17
2.2.1 Ricorrenza e reversibilita . . . . . . . . . . . . . . . . . . . . 17
2.2.2 L’entropia di Boltzmann . . . . . . . . . . . . . . . . . . . . 21
2.2.3 Probabilita e tempi di soggiorno . . . . . . . . . . . . . . . . 23
2.3 Modelli per l’irreversibilita . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.1 Equazione di Boltzmann per gas diluiti . . . . . . . . . . . . 27
2.3.2 Le equazioni idrodinamiche . . . . . . . . . . . . . . . . . . 28
2.3.3 Il gas di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Necessita dei sistemi infiniti in Termodinamica . . . . . . . . . . . . 30
2.5 Conclusioni e prospettive . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Teoria ergodica e dinamica topologica 41
3.1 Teoria ergodica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1 I sistemi dinamici classici . . . . . . . . . . . . . . . . . . . . 42
3.1.2 Il Teorema di ricorrenza . . . . . . . . . . . . . . . . . . . . 48
3.1.3 Le medie temporali . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4 Ergodicita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.5 Mixing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Limiti della Teoria ergodica . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 Non unicita della misura invariante . . . . . . . . . . . . . . 58
3.2.2 Misure prodotto su sistemi infiniti . . . . . . . . . . . . . . . 67
3.3 Dinamica topologica . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.3.1 Sistemi dinamici topologici . . . . . . . . . . . . . . . . . . . 70
3.3.2 Dinamica topologica e dinamica misurabile . . . . . . . . . . 74
i
3.3.3 Sistemi minimali . . . . . . . . . . . . . . . . . . . . . . . . 75
3.3.4 Sistemi unicamente ergodici . . . . . . . . . . . . . . . . . . 78
3.3.5 Sottosistemi con un attrattore globale . . . . . . . . . . . . . 81
4 Il formalismo algebrico per i sistemi estesi 83
4.1 Formalismo ed interpretazione . . . . . . . . . . . . . . . . . . . . . 84
4.2 L’approccio algebrico allo studio dei sistemi estesi . . . . . . . . . . 86
4.2.1 Algebre quasi-locali di sistemi spazialmente estesi . . . . . . 88
4.2.2 Stati invarianti per traslazioni . . . . . . . . . . . . . . . . . 92
4.3 Abelianita e clustering nei sistemi estesi . . . . . . . . . . . . . . . 93
4.3.1 Abelianita asintotica uniforme . . . . . . . . . . . . . . . . . 94
4.3.2 Proprieta di cluster degli stati sui sistemi estesi . . . . . . . 97
5 I sistemi quantistici di spin 101
5.1 Aspetti cinematici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.2 Aspetti dinamici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.3 Modelli di sistemi di spin . . . . . . . . . . . . . . . . . . . . . . . . 111
6 Medie ergodiche e stati con statistica 114
6.1 Statistica sulle traslazioni e stati invarianti . . . . . . . . . . . . . . 114
6.1.1 Stati con statistica sulle traslazioni . . . . . . . . . . . . . . 115
6.1.2 Statistica sulle traslazioni e stati invarianti . . . . . . . . . . 118
6.1.3 Stati ergodici e stati non correlati . . . . . . . . . . . . . . . 119
6.2 Evoluzione dinamica ed invarianza per traslazioni . . . . . . . . . . 122
6.2.1 Dinamica invariante per traslazioni . . . . . . . . . . . . . . 122
6.2.2 Dinamica topologica sulla chiusura degli stati ergodici . . . . 123
6.2.3 Densita degli stati ergodici negli stati invarianti . . . . . . . 125
6.2.4 Dinamica su PKν
A senza compattezza . . . . . . . . . . . . . 128
6.3 Medie ergodiche su uno stato invariante . . . . . . . . . . . . . . . . 129
6.3.1 Le medie ergodiche . . . . . . . . . . . . . . . . . . . . . . . 129
6.3.2 Lo spazio vettoriale delle medie ergodiche . . . . . . . . . . 133
6.3.3 Costruzione dell’algebra delle medie ergodiche . . . . . . . . 135
6.3.4 Operatori di traslazioni sulle medie ergodiche . . . . . . . . 136
6.3.5 Estensione dello stato alle medie ergodiche . . . . . . . . . . 137
6.4 Le medie ergodiche come descrizione della statistica sulle traslazioni 138
6.4.1 Descrizione statistica delle medie ergodiche . . . . . . . . . . 138
6.4.2 Rappresentazione universale sugli stati ergodici . . . . . . . 139
ii
6.4.3 La C∗-algebra delle medie ergodiche . . . . . . . . . . . . . . 141
6.4.4 Lo spettro dell’algebra delle medie ergodiche . . . . . . . . . 143
6.5 Medie ergodiche e dinamica topologica . . . . . . . . . . . . . . . . 152
6.6 Conservazione dell’energia media . . . . . . . . . . . . . . . . . . . 153
6.7 Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
7 Modelli di dinamica topologica e sistemi infiniti 158
7.1 Un modello di sistema unicamente ergodico . . . . . . . . . . . . . 158
7.2 Il modello come sistema infinito con osservabili di singolo sito . . . 162
7.3 Un sistema infinito con convergenza all’equilibrio . . . . . . . . . . 166
7.4 Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
A Teoria ergodica 174
A.1 Lo schema Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . 174
A.2 La Teoria ergodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
A.2.1 I sistemi dinamici classici . . . . . . . . . . . . . . . . . . . . 179
A.2.2 Il Teorema di Birkhoff; convergenza puntuale . . . . . . . . . 181
A.2.3 Dinamica ergodica . . . . . . . . . . . . . . . . . . . . . . . 183
A.2.4 Dinamica mixing e debolmente mixing . . . . . . . . . . . . 185
A.3 La Teoria di Koopman . . . . . . . . . . . . . . . . . . . . . . . . . 186
A.3.1 I sistemi dinamici Hilbertiani . . . . . . . . . . . . . . . . . 187
A.3.2 Il Teorema di von Neumann; convergenza in norma . . . . . 190
A.3.3 Dinamica Hilbertiana ergodica . . . . . . . . . . . . . . . . . 191
A.3.4 Dinamica Hilbertiana mixing . . . . . . . . . . . . . . . . . 193
B La formulazione algebrica della Meccanica Quantistica 200
B.1 Il formalismo di base . . . . . . . . . . . . . . . . . . . . . . . . . . 200
B.1.1 C∗-algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
B.1.2 Classificazione degli elementi di una C∗-algebra . . . . . . . 202
B.1.3 Risolvente, spettro e raggio spettrale . . . . . . . . . . . . . 204
B.1.4 Elementi positivi . . . . . . . . . . . . . . . . . . . . . . . . 205
B.1.5 Rappresentazioni . . . . . . . . . . . . . . . . . . . . . . . . 207
B.1.6 Topologia debole e ∗-debole . . . . . . . . . . . . . . . . . . 209
B.1.7 Insiemi convessi . . . . . . . . . . . . . . . . . . . . . . . . . 215
B.1.8 Stati su una C∗-algebra . . . . . . . . . . . . . . . . . . . . 216
B.1.9 Stati e rappresentazioni . . . . . . . . . . . . . . . . . . . . 219
B.1.10 Dinamica sui sistemi C∗ . . . . . . . . . . . . . . . . . . . . 222
iii
B.2 Sviluppo del formalismo . . . . . . . . . . . . . . . . . . . . . . . . 231
B.2.1 Algebre di von Neumann (W ∗-algebre) . . . . . . . . . . . . 231
B.2.2 Stati su una W ∗-algebra . . . . . . . . . . . . . . . . . . . . 241
B.2.3 Dinamica sui sistemi W ∗ . . . . . . . . . . . . . . . . . . . . 245
B.3 Struttura quasi-locale . . . . . . . . . . . . . . . . . . . . . . . . . . 246
B.4 Decomposizione degli stati . . . . . . . . . . . . . . . . . . . . . . . 249
B.4.1 Rappresentazione integrale di insiemi convessi . . . . . . . . 249
B.4.2 Misure ortogonali . . . . . . . . . . . . . . . . . . . . . . . . 258
B.4.3 Decomposizione estremale . . . . . . . . . . . . . . . . . . . 261
B.4.4 Decomposizione centrale . . . . . . . . . . . . . . . . . . . . 262
B.5 Gruppi di simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . 264
B.5.1 Stati invarianti . . . . . . . . . . . . . . . . . . . . . . . . . 264
B.5.2 La decomposizione ergodica . . . . . . . . . . . . . . . . . . 267
B.5.3 Abelianita asintotica ed unicita della decomposizione . . . . 268
B.5.4 Stati ergodici e proprieta di mixing . . . . . . . . . . . . . . 273
B.6 Proprieta topologiche dei gruppi di simmetrie . . . . . . . . . . . . 275
B.6.1 Misure su gruppi localmente compatti . . . . . . . . . . . . . 276
B.6.2 Gruppi amenable . . . . . . . . . . . . . . . . . . . . . . . . 278
B.6.3 Il Teorema ergodico di von Neumann . . . . . . . . . . . . . 284
Bibliografia 286
iv
Capitolo 1
Introduzione e risultati
Questo lavoro di tesi riguarda il problema dei fondamenti della Meccanica Statis-
tica, ovvero il problema della convergenza all’equilibrio dei sistemi grandi .
Larga parte di questo lavoro non fa distinzione tra ambito quantistico ed ambito
classico, come d’altra parte richiede la generalita del problema che si vuole af-
frontare. Il lavoro si sviluppa fondamentalmente in due fasi: una fase “negativa”
di revisione e critica dei risultati noti e accettati; una fase “positiva” in cui si
approfondiscono gli aspetti “insoddisfacenti” con lo scopo di arrivare a definire un
quadro coerente, e sostanzialmente nuovo, del problema della convergenza all’e-
quilibrio. In pratica la prima fase si esaurisce con il Capitolo 2 e la prima parte del
Capitolo 3, anche se tutto il lavoro e scritto nello spirito di evidenziare gli aspetti
“migliorabili” e poco soddisfacenti degli approcci piu diffusi sul problema. La se-
conda fase occupa i restanti Capitoli. Al fine di snellire e compattare l’esposizione
si e convenuto di raccogliere nelle Appendici tutto il “macchinario matematico”
che entra, direttamente o indirettamente, nelle questioni trattate.
Tutto il lavoro mira ad impostare un quadro “concettualmente nuovo” del
problema dell’approccio all’equilibrio ed i risultati nuovi da un punto di vista
tecnico sono contenuti nei Capitoli 6 e 7.
Di seguito e esposto il percorso logico di questo lavoro.
Capitolo 2: Lo stato dei fondamenti della Meccanica Statistica all’equi-
librio
Storicamente la Meccanica Statistica nasce come il tentativo di spiegare gli aspetti
macroscopici della realta sulla base delle leggi dinamiche che governano i moti mi-
croscopici. La macrofisica ha in modo naturale due ambiti di ricerca: il primo
riguarda la descrizione dell’ equilibrio e degli aspetti ad esso connessi (Mecca-
1
nica Statistica all’equilibrio); il secondo riguarda “tutto il resto” compreso lo
studio dei meccanismi del raggiungimento dell’equilibrio a partire da stati di
non equilibrio (Meccanica Statistica fuori dall’equilibrio). La Meccanica
Statistica all’equilibrio contiene in particolare la giustificazione microscopica della
Termodinamica (Termostatica). La teoria che ne risulta e chiusa (grazie ai lavori
di Ruelle degli anni ’60 [Rue69]), pienamente compresa, matematicamente corretta
e di grande eleganza. Per gli stati di equilibrio l’apparato matematico produce pre-
visioni sperimentalmente verificate. Tuttavia questa teoria non e “auto-fondante”;
studia gli stati termici ma non spiega come o se essi vengono raggiunti. Se gli stati
di equilibrio (che esistono matematicamente sotto ipotesi molto generali) fossero
per qualche motivo irraggiungibili da ragionevoli classi di stati di non equilibrio,
la teoria dell’equilibrio sarebbe vuota. Al contrario, la Meccanica Statistica fuori
dall’equilibrio cerca di affrontare il problema “alla radice” cercando di spiegare
quali stati raggiungono l’equilibrio e sotto quali condizioni cio accade. Questi
quesiti costituiscono il problema dei fondamenti della Meccanica Statistica: se c’e
convergenza all’equilibrio allora gli stati di equilibrio si interpretano come gli
asintoti temporali dell’evoluzione (nel passato e nel futuro) per una certa classe
di stati di partenza. Sperimentalmente, la convergenza all’equilibrio sembra essere
un fenomeno molto generale, la cui spiegazione e ancora solo parziale. Infatti lo
stato attuale della Meccanica Statistica fuori dall’equilibrio e tutt’altro che quello
di una teoria chiusa. L’apparato concettuale attualmente accettato coincide, in
larga misura, con le idee proposte da Boltzmann a fine ’800, che possono essere
riassunte sostanzialmente in due punti:
• le configurazioni di equilibrio (macrostati) sono estremamente piu probabili
delle configurazioni di non equilibrio;
• l’approccio all’equilibrio e ottenuto tramite una dinamica macroscopicamente
irreversibile.
La giustificazione del primo punto richiede di considerare sistemi molto grandi;
infatti solo in questo limite sono risolti i paradossi di irreversibilita (Loschmidt)
e di ricorrenza (Zermelo). Viene introdotta “a priori” una nozione di probabilita,
che coincide con la misura microcanonica, la cui assunzione e giustificata dal fatto
che per sistemi ergodici e l’unica misura invariante assolutamente continua rispetto
alla misura di Liouville (Lebesgue). Gli stati di non equilibrio sono distribuzioni
(assolutamente continue rispetto alla misura di Lebesgue) che nel tempo evolvono
alla misura microcanonica. Tuttavia l’adozione di questo punto di vista richiede di
2
considerare sistemi grandi ma finiti; infatti per sistemi infiniti esso affermerebbe
che i soli stati con probabilita non nulla sono quelli di equilibrio, affermazione
evidentemente confutata dall’esperienza. Per sistemi infiniti, prodotto di (infini-
ti) sottosistemi finiti, si dimostra infatti che ogni misura assolutamente continua
rispetto alla misura definita dal prodotto delle misure di Lebesgue coincide iden-
ticamente con prodotto delle misure di Lebesgue e quindi, se si adottasse il prece-
dente punto vista, si affermerebbe che il sistema infinito esiste solo nello stato di
equilibrio!
La giustificazione del secondo punto di vista richiede la deduzione di equazioni
di evoluzione macroscopiche ed irreversibili (equazioni idrodinamiche, equazione di
Boltzmann) partendo dalla semplice descrizione Hamiltoniana del moto microscop-
ico. I risultati noti in questo senso coinvolgono il limite N → +∞ assieme a con-
siderazioni sul rapporto “dimensioni macroscopiche/dimensioni microscopiche”.
Le metodologie di ricerca derivanti dall’impostazione “alla Boltzmann” si rias-
sumono, quindi, nei seguenti punti
• il limite N → +∞ viene generalmente combinato con la nozione di variabile
macroscopica che presenta un certo grado di ambiguita e che sembra lim-
itare i risultati al solo confronto con la Termodinamica; in altre parole si
afferma che N e tanto grande da poter essere trattato analiticamente come
N = +∞, ma poi si presentano difficolta che costringono a mantenere N
finito
• le equazioni del moto vengono scritte relativamente a sistemi finiti e si cerca
di controllare gli asintoti temporali contemporaneamente al limite N → +∞,
secondo procedure “ad hoc”, dipendenti dal sistema in esame.
Entrambe queste metodologie di ricerca risultano percio insoddisfacenti e comun-
que insufficienti per formulare, prima ancora che risolvere, il problema nella ge-
neralita in cui e fisicamente rilevante.
Lo scopo di questo lavoro di tesi e quello di mostrare che e possibile adottare un
punto di vista alternativo, che ha il vantaggio della semplicita logica e che da origine
a criteri semplici ed univoci per il raggiungimento dell’equilibrio. Partendo da
considerazioni molto generali che mettono in luce il ruolo fondamentale del limite
N → +∞ in tutte le questioni rilevanti della Meccanica Statistica proponiamo
due ipotesi di lavoro.
1) Il limite N → +∞ deve essere formulato in generale e deve essere fatto prima
di ogni altra considerazione. In questo senso affermiamo che:
3
la Meccanica Statistica puo essere fondata direttamente per
sistemi infiniti, N = +∞.
2) Fondare la Meccanica Statistica significa ottenere gli stati termici dei
sistemi infiniti come limite a tempi grandi, su tutte le osservabili, di
classi di stati che devono essere “sufficientemente omogenei” da consentire
la definizione di una nozione di statistica sui sottosistemi.
Naturalmente fissare in partenza la condizione N = +∞ non e la stessa cosa che
considerare i vari limiti, sugli stati e sulle interazioni, che entrano nelle deduzioni
delle equazioni macroscopiche irreversibili (equazioni idrodinamiche, di Boltzmann,
etc.). Cio non rappresenta un limite, piuttosto consente di separare in un contesto
opportuno il problema della descrizione macroscopica (irreversibile) della dina-
mica dal problema, molto piu generale, dell’ approccio all’equilibrio. Sebbene
l’irreversibilita implichi l’equilibrio, non e detto che un’esplicita descrizione irre-
versibile sia necessaria per ottenerla. Tuttavia questo punto di vista pone subito
una questione. Si puo avere convergenza all’equilibrio senza irreversibilita? La
risposta e contenuta solamente in parte nella Teoria ergodica e l’analisi di questa
questione e il contenuto del Capitolo 3.
Capitolo 3: Teoria ergodica e dinamica Topologica
La meccanica classica, secondo lo schema Hamiltoniano, afferma che gli stati di
un sistema sono descritti dai punti di una varieta detta spazio delle fasi e
l’evoluzione temporale e descritta da un gruppo di diffeomorfismi (trasformazioni
invertibili e differenziabili assieme all’inversa) sullo spazio delle fasi chiamato flus-
so Hamiltoniano. Inoltre l’evoluzione temporale preserva i volumi dello spazio
delle fasi rispetto alla misura di Liouville del sistema (misura di Lebesgue sullo
spazio delle fasi). La generalizzazione piu rilevante di un sistema Hamiltoniano e
uno spazio topologico (compatto di Hausdorff), un gruppo di trasformazioni dello
spazio in se che definisce una dinamica ed una misura invariante rispetto a queste
trasformazioni. Questa struttura astratta e detta sistema dinamico classi-
co e la Teoria ergodica e lo studio del comportamento globale delle traiettorie
di questi sistemi. Nella prima parte del Capitolo 3 si illustrano i concetti ed i
risultati standard di questa teoria. Un aspetto rilevante dei sistemi misurabili e
il comportamento ricorrente della dinamica (Teorema di Poincare). Sotto l’ef-
fetto dell’evoluzione dinamica ogni punto del sistema percorre una traiettoria che
ritorna arbitrariamente vicina ad ogni punto raggiunto e questo succede infinite
4
volte. A questo comportamento fanno eccezione solamente un insieme di punti di
misura nulla (rispetto alla misura invariante). Evidentemente a causa della ricor-
renza non si puo descrivere la convergenza all’equilibrio direttamente in termini di
convergenza delle orbite di un sistema dinamico misurabile. Le nozioni di sistema
ergodico e sistema mixing sono un tentativo di conciliare la dinamica ricorrente
con il raggiungimento dell’equilibrio in termini di densita sullo spazio dei punti che
evolvono sotto l’effetto della dinamica.
Una considerazione importante e che la ricorrenza e conseguenza diretta della
presenza di una misura invariante. Per evitare la ricorrenza e necessario ricor-
rere ad una nozione dinamica che non parte dall’assunzione di una misura invari-
ante. I sistemi dinamici topologici sono strutture di questo tipo definite da
uno spazio topologico (compatto di Hausdorff) e da un gruppo di omeomorfismi
(trasformazioni invertibili continue con inverse continue) sullo spazio che descrive
la dinamica. Nella seconda parte del Capitolo 3 si illustrano le nozioni fondamen-
tali di questa teoria. L’idea di base e che la dinamica topologica e compatibile
con l’esistenza di un punto attrattore al quale convergono tutte le orbite del
sistema (sistemi unicamente ergodici) a tempi grandi. Un sistema di questo
tipo presenta in modo naturale una nozione di stato di equilibrio; lo stato di
equilibrio e descritto dall’attrattore ed e l’asintoto temporale (nel passato e nel
futuro) di tutti gli stati del sistema. Secondo questo schema esiste una nozione di
convergenza all’equilibrio che non richiede e non ha niente a che vedere con una
dinamica irreversibile. L’assunzione che facciamo come terza ipotesi di lavoro e
che:
3) la convergenza all’equilibrio dei sistemi infiniti puo essere de-
scritta in termini di sistemi dinamici topologici che hanno un
unico punto attrattore per tutte le orbite.
Questa ipotesi apre immediatamente alcune questioni rilevanti.
• In che modo nella descrizione di un sistema infinito nasce un sistema dinami-
co topologico sebbene la dinamica (microscopica) dei sistemi finiti sia di tipo
misurabile (Hamiltoniana)?
• E possibile esibire esempi concreti di sistemi per cui questo criterio e appli-
cabile?
• Come si caratterizzano i sistemi infiniti che presentano convergenza all’equi-
librio in questo senso?
5
La prima questione e studiata nel Capitolo 6 per una classe molto ampia di
sistemi (i sistemi quantistici di spin) mentre nel Capitolo 7 si costruisce un sem-
plice ma interessante modello che mostra come la costruzione fatta non sia vuota.
L’ultima questione rimane aperta.
Capitolo 4: Il formalismo algebrico per i sistemi estesi
L’assunzione che la Meccanica Statistica si occupa di sistemi infiniti (prima ipote-
si di lavoro), comporta la necessita di utilizzare un linguaggio che permetta un
trattamento agevole di questi sistemi. I sistemi infiniti di cui ci occuperemo sono,
generalmente, infinitamente estesi e costituiti da sottosistemi (microscopici) iden-
tici e localizzati in diverse regioni dello spazio. La strumentazione matematica
idonea a questo scopo e fornita dall’apparato matematico della formulazione alge-
brica della Meccanica Quantistica. Tipico di questo approccio e il fatto che esso,
piuttosto che caratterizzare una specifica teoria, da luogo ad uno sviluppo inte-
grato di questioni fisiche e macchinario matematico che copre una vasta gamma
di argomenti fisici, dalla Statistica alle Teorie di Campo, unificando in un solo lin-
guaggio teorie classiche e quantistiche. Inoltre questo approccio ha il vantaggio di
condurre ad una comprensione dettagliata dell’“anatomia” delle teorie mettendo in
luce le strutture che effettivamente entrano in gioco. In particolare la separazione
logica tra la nozione di osservabile e quella di stato permette di implementare in
modo consistente e controllabile il concetto di localita che e il nocciolo essen-
ziale per la descrizione dei sistemi infiniti (tipici della Meccanica Statistica o delle
Teorie di Campo). Il Capitolo 4 si apre con una parte introduttiva dove vengono
esposte, in modo sintetico, le differenze ed i vantaggi che l’approccio algebrico
presenta rispetto all’approccio standard alla Meccanica Quantistica. Fissate le
nozioni di base come C∗-algebra , stato, rappresentazione il resto del capitolo
e dedicato interamente alla presentazione della struttura quasi-locale dell’algebra
delle osservabili. Sinteticamente questa struttura si fonda sulla possibilita di saper
definire le osservabili (e le relative algebre) associate a regioni limitate di spazio
(le osservabili microscopiche). L’intera algebra si costruisce come unione delle
algebre locali e su questa struttura si esegue un’innocua operazione di chiusura
in norma. Osservabili associate a zone diverse del sistema (sottosistemi distinti)
risultano indipendenti nel senso che commutano reciprocamente. La simmetria
indotta dall’invarianza per traslazioni (il sistema e costituito da sottosistemi iden-
tici) si implementa nel linguaggio algebrico tramite l’introduzione di un gruppo di
automorfismi sull’algebra. Vengono esposte alcune proprieta rilevanti, caratteri-
6
stiche della struttura quasi-locale, come l’ abelianita asintotica e le condizioni
di cluster ; esse hanno implicazioni tecniche importanti per i risultati discussi nel
capitolo 6. Il Capitolo 4 non e autosufficiente in quanto molte delle nozioni rilevanti
e tutto l’apparato matematico della formulazione algebrica della Meccanica Quan-
tistica sono dati come noti. Tuttavia queste lacune sono colmate nell’Appendice
B dove viene presentato un quadro riassuntivo dei principali aspetti matematici,
funzionale a tutte le questioni trattate in questo lavoro. I fatti standard sono in
genere solamente enunciati e discussi, le dimostrazioni, spesso non banali, sono
reperibili nelle referenze puntualmente specificate.
Capitolo 5: I sistemi quantistici di spin
I sistemi quantistici di spin sono modelli idealizzati di sistemi fisici infiniti
ottenuti considerando un reticolo discreto ed infinito nei cui siti sono alloggiate
“particelle” (generalmente identiche) dotate di spin. L’ interazione e descritta
da una qualche legge sugli accoppiamenti degli spin. Storicamente lo studio di
questi sistemi nasce dal tentativo di ottenere modelli per il ferromagnetismo. Il
nostro interesse per loro si basa su diversi aspetti.
• Rendono esplicita la costruzione di una struttura quasi-locale e quindi di-
mostrano che la classe di questi sistemi non e vuota.
• Rappresentano degli ottimi “prototipi” su cui “testare” le idee della Mec-
canica Statistica. L’assunzione di una struttura discreta evita le compli-
cazioni tecniche connesse con il continuo e non influisce sostanzialmente sulle
proprieta derivanti dal fatto che il sistema e infinito.
• Sotto ipotesi molto generali questi sistemi ammettono una dinamica sull’in-
tero reticolo e cio li qualifica come gli unici modelli di sistemi infiniti su cui
si possono impostare e testare anche le idee che riguardano la convergenza
all’equilibrio.
Nel Capitolo 5 si discutono sia gli aspetti cinematici (costruzione delle algebre lo-
cali, dell’algebra quasi-locale e degli automorfismi che implementano le traslazioni)
sia degli aspetti dinamici (definizione e classificazione delle interazioni, derivazione
di una dinamica per il sistema infinito dalle dinamiche locali) e nell’ultimo para-
grafo vengono presentati i reticoli di spin 1/2.
Osserviamo, infine, che la “semplicita” dei sistemi di spin e solo apparente.
Praticamente non e possibile effettuare nessun calcolo esplicito, a parte pochi pas-
7
saggi iniziali, in quanto la complicazione computazionale cresce in modo non con-
trollabile. Anche le simulazioni al computer si limitano, percio, ad un numero
relativamente esiguo di siti del reticolo che invece, per gli scopi dei fondamenti
della Meccanica Statistica, e essenziale che sia molto grande.
Capitolo 6: Medie ergodiche e stati con statistica
Il Capitolo 6 costituisce il“nocciolo” del nostro percorso di indagine. Le ipotesi di
lavoro formulate vengono applicate alla struttura quasi-locale dei sistemi discreti
(a questo livello non interessa specificare se si tratti di spin) per mostrare che in
“termini statistici” e possibile descriverli in termini di sistemi dinamici topologici.
Il contenuto di questo capitolo e schematizzato nei punti seguenti.
• La “statistica rilevante” per i sistemi infiniti e definita in modo naturale
dalla statistica sui sottosistemi (per tutte le variabili microscopiche).
Una tale definizione e anche intrinseca nel senso che non necessita di nessun
concetto aggiuntivo come ad esempio quello di ensemble . Gli stati “sta-
tisticamente rilevanti” non sono in generale tutti ma solo una sottoclasse
di stati ragionevolmente, sufficientemente omogenei. Il linguaggio algebrico
adottato per la descrizione dei sistemi infiniti permette di definire in modo
preciso la nozione di stati con statistica sulla base della statistica sulle
traslazioni delle osservabili locali (microscopiche). Risulta che ogni stato
con statistica definisce uno stato invariante per traslazione ed in particolare
gli stati che non hanno correlazione a lunga distanza definiscono
gli stati ergodici del sistema. Quindi ai fini di una descrizione statistica
(sulle traslazioni) tutti e soli gli stati rilevanti sono gli stati invarianti per
traslazione.
• Nella rappresentazione ottenuta come somma diretta delle rappresentazioni
G.N.S. relativa agli stati ergodici del sistema (rappresentazione univer-
sale sugli stati ergodici) si possono costruire le medie ergodiche che
sono le chiusure, nella topologia operatoriale forte, di limiti per volumi in-
finiti di osservabili ottenute come medie locali (su volumi finiti) di osservabili
microscopiche. In questo spazio di rappresentazione la collezione di tutte le
medie ergodiche (che costituisce uno spazio vettoriale) puo essere immersa in
modo standard nella C∗-algebra generata, detta algebra delle medie er-
godiche , che risulta abeliana. Per l’isomorfismo di Gel’fand l’algebra delle
medie ergodiche e isomorfa alla C∗-algebra delle funzioni continue definite
8
sull’insieme degli stati puri dell’algebra (descrizione classica). Si mostra che
l’insieme degli stati ergodici del sistema di partenza coincide punto per punto
e come spazi topologici con un sottoinsieme denso dello spettro dall’algebra
delle medie ergodiche. L’unicita del completamento di questo spazio definisce
una biezione tra lo spettro dell’algebra delle medie ergodiche e la chiusura
dell’insieme degli stati ergodici che si dimostra coincidere con l’intero in-
sieme degli stati invarianti. Gli stati sulle medie ergodiche sono sufficienti
a riprodurre tutti i valori che gli stati invarianti assumono sulle osservabili
microscopiche e quindi descrivono tutte le statistiche per traslazioni delle os-
servabili microscopiche relative a tutti gli stati che hanno statistica. In questi
termini la C∗-algebra delle medie ergodiche (funzioni continue), assieme ai sui
stati (misure di probabilita), contiene tutta l’informazione fisica riguardante
la statistica sulle traslazioni del sistema di partenza. Le medie ergodiche,
quindi, si possono anche interpretare come le osservabili macroscopiche
del sistema, nella misura in cui la statistica sulle traslazioni corrisponde
ad un’osservazione macroscopica. Tale nozione e pero ben diversa da quel-
la, molto piu limitata, che identifica le variabili macroscopiche con quelle
termodinamiche.
• Se il sistema in esame ha una dinamica che commuta con le traslazioni
(cio ad esempio accade per i sistemi quantistici di spin) allora essa definisce
una dinamica topologica sullo spettro dell’algebra delle medie ergodiche.
L’evoluzione delle medie ergodiche e descritta dal valore che le funzioni
rappresentative assumono sulle traiettorie compiute dai punti dello spettro.
Poiche la dinamica e di tipo topologico puo non esserci ricorrenza. Se ac-
cade che vi e convergenza ad un’unico punto allora i valori di tutte la medie
ergodiche convergono verso i valori assunti sul particolare stato limite. I
risultati della statistica sulle traslazioni, di tutte le variabili microscopiche,
convergeranno ai valori assunti sugli stati di equilibrio termico (stati
della stessa classe di equivalenza dello stato invariante limite dell’evoluzione
temporale). Cio non significa che gli stati in questione convergeranno, ma
solo che la loro evoluzione si mantiene asintoticamente nella stessa classe
di equivalenza definita dalla statistica sulle traslazioni. In questo senso,
sebbene vi puo essere ancora evoluzione microscopica, l’effetto macroscop-
ico, cioe sulla statistiche sui sottosistemi , e stazionario. Questo e l’
equilibrio.
9
Il sistema dinamico topologico che nasce in questo modo e definito in termini
di una topologia ∗-debole (e non uniforme). Questo significa che la convergenza
all’equilibrio, se e quando c’e, usa in modo fondamentale il fatto che si guardano,
ogni volta, un numero finito di osservabili.
Capitolo 7: Modelli di dinamica topologica e sistemi infiniti
In questo capitolo vengono discussi alcuni modelli molto semplici che riproducono
un comportamento di convergenza all’equilibrio in base al meccanismo discusso nel
Capitolo 6. Pur non essendo del tutto realistici, questi modelli hanno l’importante
merito di dimostrare che la costruzione sviluppata in questo lavoro di tesi non e
vuota, ma al contrario e applicabile concretamente. Essi sono la prova che esistono
classi di sistemi in cui ha luogo la convergenza all’equilibrio senza necessita di
irreversibilita e sotto ipotesi semplici e chiare (sistema infinito, stati con statistica
regolare, proprieta della dinamica topologica risultante).
10
Capitolo 2
Lo stato dei fondamenti della
Meccanica Statistica all’equilibrio
Nella prima parte di questo capitolo viene presentato un breve sunto dell’evoluzione
storica delle idee che hanno portato alla “moderna” Meccanica Statistica. Si
definisce l’ambito di ricerca e si distingue la Meccanica Statistica all’equilibrio
dalla Meccanica Statistica fuori dall’equilibrio. In seguito viene discussa l’im-
postazione “alla Boltzmann” (opportunamente rivisitata) del problema della con-
vergenza all’equilibrio. A cio segue una breve esposizione dei risultati noti riguardo
al problema della derivazione rigorosa delle equazioni idrodinamiche (irreversibili)
dai principi Hamiltoniani (reversibili). L’ultima parte del capitolo e dedicata ad
una discussione attorno all’importanza della nozione di sistema infinito ed alla
necessita di introdurre questa nozione come fatto prioritario nelle questioni che
riguardano i fondamenti della Meccanica Statistica. Il materiale da cui e sta-
to selezionato il contenuto del presente capitolo puo essere rintracciato nei lavori
[Leb93a], [Leb93b], [LG03], [Gol01], [Rue99], [Uhl68], [Wig70] e nei testi [Khi49] e
[tH54].
2.1 Introduzione
Genesi storica della problematica
Una delle maggiori conquiste del pensiero scientifico dell ’800 fu il riconoscimento
e l’accettazione che la materia e costituita da atomi. L’affermazione della “teoria
atomico-molecolare della materia” non fu certamente indolore e diede adito ad un
11
intenso dibattito1 il quale, in forza delle sempre maggiori prove sperimentali, si
risolse in favore del riconoscimento della realta dei costituenti microscopici. Se si
accetta che l’universo che ci circonda possiede una struttura microscopica della
quale noi non possiamo avere esperienza diretta a causa dell’enorme differenza di
scala e se si accetta anche che le leggi fondamentali della natura sono in ultima
analisi le leggi che governano i costituenti microscopici allora diventa ragionevole
ed auspicabile cercare di fondare ogni legge fisica, anche macroscopica, su basi
puramente microscopiche. E esattamente in questa linea di pensiero che la Mec-
canica Statistica trae le sue origini. Quindi la Meccanica Statistica si propone
di fornire l’interpretazione microscopica delle proprieta macroscopiche
della natura .
Ambito di ricerca
In ragione della struttura corpuscolare2 della materia, la Meccanica Statistica
interpreta i sistemi termodinamici come sistemi meccanici composti da un grande
numero di costituenti elementari (che relativamente a scale distinte possono essere
cellule, molecole, atomi, particelle sub-atomiche, quarks). Tipicamente il numero
di costituenti microscopici di un sistema macroscopico e dell’ordine del numero di
Avogadro3 ed e uso comune parlare in questi casi di “sistemi ad un gran numero
di gradi di liberta”.
Le nozioni di spazio e tempo che generalmente vengono adottate nell’ambito
di ricerca sui fondamenti meccanici della Meccanica Statistica sono quelle New-
1Una delle piu serrate critiche alla concezione atomistica della realta fisica fu sostenuta
dal pensatore positivista E. Mach (1838-1916) il quale pur riconoscendo “il valore euristico e
didattico di questa intuitivita” riteneva indispensabile chiarire che l’atomo, cosı concepito, e solo
un ente speculativo. Secondo Mach il fatto atomo nella sua globalita non puo essere mai oggetto
di esperienza sensibile dato che i sensi, potenziati dagli strumenti di misura, ne possono cogliere
di volta in volta solo le diverse proprieta. In forza di queste idee egli sosteneva che “l’atomo sara
solo un mezzo per rappresentare i fenomeni, come le formule del matematico.” Le citazioni sono
tratte da [Mac96] pp. 428-429.2Sebbene l’idea di struttura corpuscolare della materia nasca in seno alle concezioni clas-
siche sulla realta fisica essa si e rivelata di portata tanto ampia da trovare piena applicabilita
anche nella moderna Teoria Quantistica di Campo. L’idea che oggi e comunemente accettata e
che ogni aspetto della realta e interpretabile in termini di interazioni elementari tra costituenti
a scala microscopica e a questa descrizione non sfuggono neanche fenomeni come la radiazione
elettromagnetica o la gravita.3Il numero di Avogadro e NA = 6, 0221 · 1023 e corrisponde al numero di atomi contenuti in
una mole di sostanza.
12
toniane, per cui gli stati di un sistema fisico ad istanti diversi sono connessi da
leggi fisiche fondamentali simmetriche rispetto alla direzione del tempo. Quindi si
ignorano tutte le complicazioni derivanti dalla relativita (sia ristretta che speciale)
ben sapendo che un tale approccio e in partenza incompleto. Tale atteggiamento
e giustificato dal fatto che i fenomeni macroscopici a cui si vuole dare un’inter-
pretazione meccanica (la convergenza all’equilibrio degli stati di non equilibrio o
l’esistenza stessa degli stati di equilibrio), sono gli stessi sia che si consideri il reale
universo relativistico sia che ci si limiti ad un piu semplice modello di universo
non-relativistico. L’ipotesi formulata contiene anche un’ulteriore limitazione ossia
l’assunzione di leggi fondamentali simmetriche rispetto alla direzione del tempo.
In realta una tale ipotesi non e universalmente verificata dato che le interazioni
deboli violano l’invarianza per inversione temporale. Tuttavia gli effetti macro-
scopici di questa asimmetria sembrano essere trascurabili nelle questioni in esame.
Il contesto Newtoniano appare percio il piu semplice possibile in cui formulare
e schematizzare i problemi fondamentali della Meccanica Statistica. L’ambito di
ricerca non e completamente definito fino a quando non si determina anche la mec-
canica che governa il moto microscopico. I possibili schemi sono due: da una parte
c’e la descrizione classica in termini di sistemi dinamici Hamiltoniani, dall’altra
c’e quella quantistica in cui la dinamica e prescritta dall’equazione di Schrodinger.
Infine converremo di trattare sempre sistemi isolati. Sebbene una tale situazione
non sia fisicamente vera per nessun sistema (una qualche forma di interazione con
l’esterno esiste sempre), tuttavia l’introduzione di interazioni con l’esterno, spo-
stando senza limite i confini del sistema in esame (ogni porzione di spazio che
contiene il sistema in esame e ancora un sistema macroscopico), introduce un’am-
biguita che non e compatibile con una posizione univoca e consistente dei problemi
della Meccanica Statistica.
Meccanica Statistica e Teoria della Probabilita
Storicamente la Meccanica Statistica ha avuto due tipi di obbiezioni: da una parte
coloro che non credevano nell’atomismo sostenevano che il tentativo di spiegare
il macroscopico dal microscopico fosse mera speculazione matematica; dall’altra
anche chi credeva nella realta degli atomi poteva ritenere non perseguibile il pro-
ponimento di dare un fondamento meccanico alla fisica dei fenomeni macroscop-
ici. Il dibattito sul modello atomico fu chiuso quasi subito a favore della realta
13
degli atomi grazie a numerose evidenze sperimentali4. L’altro genere di obbiezioni,
invece, condusse all’introduzione di nuove idee nella fisica di fine ’800.
Se si considera che ogni porzione di materia (solida, liquida o gassosa) e una
collezione di un grandissimo numero di costituenti microscopico allora l’apparato
Hamiltoniano si dimostra insufficiente per la descrizione dei sistemi macroscopici.
Il grandissimo numero di costituenti microscopici implica un numero altrettan-
to grande di equazioni differenziali e quindi una complessita computazionale cosı
elevata da rendere praticamente irrisolvibili le equazioni del moto. Inoltre alla
complessita computazionale si aggiunge l’impossibile di riuscire a determinare con
precisione assoluta lo stato istantaneo del sistema ed una tale informazione e indis-
pensabile per integrare le equazioni del moto e quindi rendere predittiva la teoria
di Hamilton.
La scarsita delle informazioni microscopiche rende inapplicabili gli strumenti
classici a sistemi macroscopici e pertanto diviene indispensabile introdurre nuovi
metodi capaci di aggirare questo ostacolo. Attualmente i metodi probabilistici e
statistici sono comunemente ritenuti gli strumenti matematici fondamentali per la
costruzione di una teoria fisica capace di interpretare il macroscopico partendo dalle
leggi meccaniche microscopiche. Tuttavia il contesto e le modalita di applicazione
di questi metodi all’interno della teoria sono ancora oggi oggetto di discussione e
talvolta di confusione.
Equilibrio e non equilibrio
La nascita della Meccanica Statistica e fatta risalire alle prime investigazioni
dovute a Maxwell (tra il 1859 ed il 1867) e Boltzmann (tra il 1866 ed il 1872)
sull’interpretazione microscopica dei fenomeni macroscopici. In questi lavori per
la prima volta si affiancano dei metodi statistici ai metodi puramente meccani-
ci anche se il tentativo di sintesi tra le due discipline non presenta ancora un
carattere sistematico. Il primo tentativo di fornire una esposizione sistematica e
generale dei fondamenti della Meccanica Statistica, con relative applicazioni alla
termodinamica, fu compiuto da Gibbs nel 1902 con la pubblicazione del lavoro
4La prima evidenza sperimentale dell’esistenza della struttura atomica della materia fu fornita
da Brown che nel 1827 osservo un moto continuo e disordinato di particelle sospese in un liquido.
Questi moti furono interpretati come il risultato degli urti subiti dalle particelle in sospensione
da parte degli atomi costituenti il mezzo e ad essi fu dato il nome di moti Browniani . Tuttavia
solo nel 1905, grazie al lavoro di Einstein [Ein05], la relazione esistente tra moto Browniano e
struttura atomica fu resa precisa.
14
[Gib02]. Il lavoro di Gibbs ha avuto il merito di fare chiarezza sulle problematiche
aperte riguardo ai fondamenti della Meccanica Statistica e quindi ha permesso una
differenziazione degli ambiti di ricerca. Attualmente all’interno della Meccanica
Statistica sono riconoscibili due distinti settori di interesse che si differenziano in
base alle domande a cui cercano di fornire una risposta.
• Meccanica Statistica fuori dall’equilibrio.
Come si puo spiegare l’evidente comportamento irreversibile dei sistemi ma-
croscopici in modo consistente con il comportamento reversibile della dinam-
ica microscopica?
• Meccanica Statistica dell’equilibrio.
Come possono i moti microscopici, altamente caotici, dei costituenti elemen-
tari generare fenomeni macroscopici che ammettono una descrizione deter-
ministica generalmente assai semplice? Perche questi fenomeni dipendono
molto poco dalla natura dei particolari costituenti?
Grazie ai lavori di Ruelle degli anni ’60 (C.f.r. [Rue69]), che concludono i pio-
nieristici lavori di Gibbs, la meccanica statistica all’equilibrio e attualmente una
teoria chiusa, pienamente compresa, matematicamente corretta e di grande ele-
ganza. Essa afferma che per una larghissima classe di sistemi interagenti esistono
gli stati termici (stati di equilibrio) nel limite termodinamico (nel limite in cui
il numero di costituenti N ed il volume del sistema V vengono mandati all’infini-
to mantenendo costante la densita N/V ). Noto lo stato di equilibrio l’apparato
matematico della teoria permette di costruire la termodinamica del sistema ed
i risultati della teoria risultano in perfetto accordo con le verifiche sperimentali.
Tuttavia la Meccanica Statistica all’equilibrio, sebbene ammetta e dimostri l’e-
sistenza degli stati di equilibrio, non spiega come essi possano essere raggiunti a
partire da stati di non equilibrio ne permette di decidere quali stati evolveranno
verso situazioni di equilibrio. La Meccanica Statistica dell’equilibrio descrive una
realta fisica in cui i sistemi sono all’equilibrio e ristretta a questo ambito la teoria
e predittiva. Tuttavia la realta si discosta da questa situazione dato che i sistemi
in non equilibrio che evolvono verso stati termici non sono fatti sporadici ma al
contrario costituiscono il modo piu consueto con cui la natura si manifesta. In
questo senso la Meccanica Statistica all’equilibrio non e “auto-fondante” e piut-
tosto si riduce ad un potente apparato matematico specializzato per il trattamento
dei fenomeni all’equilibrio.
15
La Meccanica Statistica fuori dall’equilibrio e ancora oggi un settore di ricerca
ben lontano dall’essere fondato. In buona parte presenta ancora gli stessi problemi
che presentava al tempo dei lavori di Maxwell e Boltzmann. Se da una parte si
sono ottenuti nuovi ed interessanti risultati questi, tuttavia, non sono quasi mai
di carattere generale ma riguardano piuttosto il comportamento di modelli op-
portunamente semplificato della realta (sfere rigide in una scatola etc.). Questa
teoria, tuttavia, ha nella sua impostazione il carattere dell’“auto-fondatezza” in
quanto si propone di dare una spiegazione diretta al fenomeno della convergenza
all’equilibrio tipico dei sistemi macroscopici senza fare nessuna assunzione sull’e-
sistenza di stati di equilibrio. Questi, infatti, dovrebbero entrare nella teoria solo
in un secondo momento come gli asintoti temporali dell’evoluzione degli stati di
non equilibrio.
Le risposte, spesso parziali, che caratterizzano entrambi gli ambiti di ricerca,
e che oggi sono comunemente accettate, coinvolgono una complicata mistura di
argomenti e di ipotesi che sinteticamente si basano sui seguenti fatti:
• il numero di costituenti microscopici N e talmente elevato che solo il limite
teorico N → +∞ puo fornire una risposta esauriente alle questioni della
Meccanica Statistica dell’equilibrio e del non equilibrio (limite termodinam-
ico);
• le orbite dei sistemi dinamici nello spazio delle fasi raggiungono tutti, o quasi
tutti, i punti dello spazio delle fasi permessi dalle leggi di conservazione
compatibili con il sistema (ipotesi ergodica);
• si ammette che le sole osservabili rilevanti per la Meccanica Statistica sono
le “osservabili macroscopiche” (anche se questo concetto rimane piuttosto
ambiguo).
Allo stato attuale la Meccanica Statistica e ben lontana dall’aver raggiunto i
propri intendimenti. Se e vero che alcuni eccellenti risultati sono stati ottenuti
(la formalizzazione completa della teoria all’equilibrio) e anche vero che la teoria e
incompleta proprio nei suoi fondamenti. Per questo motivo la Meccanica Statistica
e ancora attuale ed interessante (a tratti misteriosa!) e tutto cio che essa ha ancora
da rivelare fornira un arricchimento alla nostra comprensione della natura. Per tali
motivi personalmente non ritengo condividibile l’opinione di chi argomenta che i
16
risultati di questo tipo di studi devono necessariamente essere irrilevanti per la
soluzione dei problemi fondamentali5.
2.2 Le idee generali sull’origine dell’equilibrio
Il problema principale della Meccanica Statistica del non equilibrio e quello di
fornire una giustificazione dell’evidente comportamento irreversibile dei sistemi
macroscopici in termini della dinamica microscopica reversibile . Le idee general-
mente accettate sull’interpretazione della “freccia del tempo” sono essenzialmente,
ancora, le idee di Boltzmann. Una sintesi di queste idee, estrapolata essenzialmente
dai lavori [Leb93a], [Leb93b], [LG03], [Gol01] e presentata nei seguenti paragrafi.
E chiaro che il numero estremamente grande, al limite infinito, dei costituenti
microscopici costituisce l’ingrediente essenziale per la spiegazione della conver-
genza all’equilibrio, tuttavia questa idea viene generalmente combinata ad altre
nozioni che presentano un certo grado di ambiguita (come ad esempio quella di va-
riabile macroscopica) ed e formulata in modo non preciso (sistemi arbitrariamente
grandi ma finiti). In questo paragrafo viene esposto in modo sintetico l’approccio
comunemente accettato alla soluzione del problema della freccia del tempo.
2.2.1 Ricorrenza e reversibilita
Il primo tentativo di fornire una spiegazione dell’approccio all’equilibrio dei sistemi
macroscopici fu compiuto da Boltzmann con la pubblicazione del lavoro “Gastheo-
rie” del 1872 in cui e discusso il celebre Teorema H . Boltzmann considera sistemi
meccanici ad energia assegnata costituiti da particelle elementari (sfere rigide) che
5“Tra i fisici e abbastanza diffuso l’errore di credere che la fisica statistica sia un settore
meno fondato della fisica teorica. Si e soliti fare riferimento al fatto che alcune deduzioni della
statistica non sono dimostrate rigorosamente dal punto di vista matematico, dimenticando che
anche tutti gli altri settori della fisica teorica contengono dimostrazioni poco rigorose, il che
non si considera come segno di una insufficiente fondatezza di questi settori. [...] Nell’esporre
i fondamenti della statistica classica consideriamo sin dall’inizio la distribuzione statistica per
piccole parti dei sistemi (sottosistemi) e non per i sistemi isolati in blocco. Un tale metodo
corrisponde esattamente ai problemi ed agli scopi della statistica fisica e permette di evitare
completamente l’ipotesi ergodica e altre che, in realta, sono qui inessenziali.”
Tratto dalla prefazione alla prima edizione russa del libro [LL99a] pp. 12 (traduzione di
Aleksandr Machov).
17
interagiscono (tramite collisioni) ed introduce il funzionale H definito da
H (t) ≡∫
Ω
f(p,q, t) ln(f(p,q, t)) dp dq (2.1)
essendo f(p,q, t) una distribuzione per gli impulsi e le posizioni definita sullo
spazio delle fasi Ω di singola particella. Egli quindi dimostra che il funzionale H
verifica la condizioned
dtH 6 0 ∀ t > 0,
ossia il suo valore decresce nel tempo durante l’evoluzione del sistema fino al rag-
giungimento di un valore minimo. Lo stato del sistema corrispondente al minimo
di H e individuato da una distribuzione stazionaria (∂f0/∂t = 0) chiamata dis-
tribuzione di Maxwell-Boltzmann che viene interpretata da Boltzmann come
la distribuzione dello stato di equilibrio macroscopico del sistema. Nel caso in cui
il sistema non e soggetto a forze esterne la distribuzione di Maxwell-Boltzmann
non dipende dalle coordinate spaziali q ed e espressa dalla formula
f0(p) =n
(2πmkT )32
e−|p−p0|22mkT
con n = N/V , p0 impulso medio delle particelle, k la costante di Boltzmann e
T temperatura del sistema definita dall’energia cinetica media ε di ogni particella
tramite la relazione ε = (3/2)kT . Se la dimostrazione di Boltzmann fosse corretta
allora la conclusione a cui si giungerebbe sarebbe che in tutti i sistemi isolati,
in cui i costituenti microscopici interagiscono, la tendenza naturale e quella di
evolvere verso lo stato di equilibrio qualora questo non sia realizzato in partenza.
Cio risolverebbe il problema della giustificazione microscopica della “freccia del
tempo” realizzando, in buona parte, il programma della Meccanica Statistica del
non equilibrio.
La dimostrazione fornita da Boltzmann del Teorema H fa uso degli strumenti
della teoria cinetica dei gas e si basa fortemente su considerazioni riguardanti le
collisioni tra i costituenti microscopici. Per provate le affermazioni del teorema e
necessario formulare un’ipotesi opportuna, nota con il nome di Stosszahlansatz ,
sul numero di collisioni che ogni particella subisce durante un dato intervallo di
tempo. Gia pochi anni dopo la sua pubblicazione il risultato di Boltzmann fu
confutato. Loschmidt nel 1876 e Zermelo nel 1896 argomentarono a sfavore del
Teorema H presentando due paradossi derivanti dalla natura deterministica, re-
versibile e ricorrente del moto microscopico. Questi paradossi sono la prova che il
Teorema H nella sua “versione cinetica” non e corretto. Dato che il funzionale H
non puo decrescere costantemente segue che l’ipotesi di Stosszahlansatz, necessaria
affinche al tempo t valga ∂H /∂t 6 0, non puo essere verificata dai sistemi fisici a
tutti i tempi.
18
Il paradosso di reversibilita di Loschmidt
Consideriamo un sistema Hamiltoniano isolato. Fissiamo una successione di tempi t1 > . . . > tn
e associamo ad ognuno di essi il punto xj ≡ x(tj) = (p(tj),q(tj)) nello spazio delle fasi X che
descrive lo stato assunto dal sistema al dato tempo. Ogni stato del sistema rappresentato da
un punto x definisce, per un numero di particelle molto grande, una distribuzione f sullo spazio
delle fasi Ω di singola particella. In questo senso il funzionale H puo essere valutato lungo una
traiettoria nello spazio delle fasi X . Se indichiamo con il simbolo Hj ≡ H (x(tj)) il valore che
esso assume nel punto xj per cui transita il sistema al tempo tj allora dall’enunciato del Teorema
H deve seguire che
. . . > H1 > . . . > Hn > . . .
in cui il segno di uguaglianza vale solo se il sistema raggiunge la distribuzione di equilibrio. Il
sistema delle equazioni di Hamilton resta invariato in forma se si effettua una trasformazione
(p,q, t) → (−p,q,−t). Cio significa che se x(t) = (p(t),q(t)) e una curva soluzione del sistema
di Hamilton allora anche x′(t) = (−p(−t),q(−t)) e ancora una curva soluzione. Indichiamo
con il simbolo x′j il punto dello spazio delle fasi che si ottiene da xj invertendo gli impulsi. Se
all’istante tn il sistema si trova in x′n al trascorrere del tempo esso transitera rispettivamente
attraverso i punti x′n, . . . , x′1. Se indichiamo con H ′j il valore del funzionale H sul punto x′j
allora dal Teorema H segua anche che
. . . > H ′n > . . . > H ′
1 > . . .
I punti rappresentativi xj e x′j si differenziano solamente perche hanno il segno degli impulsi
invertiti e dalla (2.1) segue che il valore di H su questi stati e il medesimo, ossia Hj = H ′j per
ogni j = 1, . . . , N . Cio prova che per ogni moto in cui H decresce uniformemente da H1 a Hn
esiste un moto invertito in cui H decresce uniformemente da Hn a H1 e cio nega l’enunciato
del teorema H .
Il paradosso di ricorrenza di Zermelo
Questa argomentazione utilizza un risultato dovuto a Poincare noto come Teorema di ricor-
renza (c.f.r. Teorema 3.1.2) il quale afferma che se un sistema passa attraverso la sequenza
di punti x1, . . . , xn nei tempi t1 > . . . > tn allora la stessa sequenza si ripetera con precisione
arbitrariamente grande in un lasso di tempo finito. Dopo un tempo sufficientemente lungo ogni
punto xj della sequenza tornera in se stesso a meno di un’imprecisione ∆xj ; indichiamo questo
nuovo punto con il simbolo x′j . Quindi dopo un certo periodo il sistema percorrera la sequenza
x′1, . . . , x′n. Se indichiamo con Hj il valore assunto dal funzionale H sul punto xj e con H ′
j
quello assunto sul punto x′j come conseguenza del Teorema H deve accadere che
. . . > H1 > . . . > Hn > . . . H ′1 > . . . > H ′
n > . . .
Tuttavia ai tempi tj e t′j gli stati del sistema sono pressoche identici xj ' x′j e quindi anche
le relative distribuzioni indotte su Ω sono circa identiche. Cio implica che Hj ' H ′j e quindi
H ′i > Hj per qualche i, j ∈ 1 . . . n. Quando il sistema evolve da xj a x′i il funzionale H aumenta
contraddicendo il Teorema H .
19
In risposta all’obbiezione di Zermelo, Boltzmann fece osservare che i tempi di ricorrenza
sono straordinariamente lunghi. Egli stimo6 che il tempo necessario affinche un sistema gassoso
costituito da 1018 atomi contenuto in un volume di 1 cm3 e con velocita media 5 104 cm sec−1
riproduca uno stato nei limiti di precisione
|∆rj | 6 10−7 cm, |∆vj | 6 102 cm sec−1, j = 1, 2, 3,
avendo indicato con r = (rx, ry, rz) e v = (vx, vy, vz) posizione e velocita di una particella, deve
superare i 101019anni che e un tempo ben superiore all’eta dell’universo.
La stima fatta da Boltzmann mostra che i tempi di ricorrenza sono, general-
mente, incredibilmente grandi. Cio, tuttavia, non dipende dalla precisione con
cui ciascuna variabile deve essere riprodotta ma piuttosto dipende dal numero
molto grande di componenti microscopici, e percio di variabili, che si vogliono
osservare contemporaneamente . Consideriamo un sistema costituito da N
sfere rigide contenute in un volume V finito. Lo spazio delle fasi accessibile al
sistema e un sottoinsieme di R6N che, a meno di una normalizzazione, puo es-
sere assunto di volume 1. Supponiamo che all’istante iniziale il sistema si trovi
in una piccola regione cubica dello spazio delle fasi di volume ε6N (ε ¿ 1). In-
dichiamo con ∆t0 l’intervallo di tempo necessario affinche il volume ε6N abbandoni
completamente, per effetto della dinamica, la posizione occupata. Il tempo di ri-
correnza della celletta cubica deve essere confrontabile con il tempo necessario per
visitare l’intero spazio delle fasi ossia tR/∆t0 ∝ ε−6N . Quindi il rapporto tra il
tempo di ricorrenza tR ed il tempo microscopico ∆t0 cresce esponenzialmente in
N . Per sistemi macroscopici di cui si vuole osservare il moto di tutti i costituenti i
tempi di ricorrenza diventano quelli stimati da Boltzmann pressoche indipenden-
temente dalla precisione dell’osservazione indicata dal parametro ε. Tuttavia per
sistemi a pochi gradi di liberta, o equivalentemente quando si osserva solamente
l’evoluzione di un piccolo numero di parametri microscopici, i tempi di ricorrenza
non sono “astronomici”. Ad esempio il tempo di ricorrenza necessario affinche
una particella, indipendentemente dalle altre, torni ad occupare con precisione ε
la posizione spaziale che aveva nel volume V e stimato da V/ε3 che e un tempo
“fisicamente rilevante”. Quindi i tempi di ricorrenza dipendono fortemente dal nu-
mero di variabili che si vuole tenere sotto controllo contemporaneamente : sono
estremamente lunghi se riferiti ad “osservazioni uniformi” (osservazioni con-
temporanee di tutte le variabili) mentre sono fisicamente ragionevoli se riferiti ad
“osservazioni deboli” (osservazioni relative ad un piccolo numero di variabili).
6C.f.r. [Bol96]
20
2.2.2 L’entropia di Boltzmann
Le obbiezioni di Zermelo e Loschmidt, assieme ai contemporanei successi del-
l’approccio statistico di Maxwell, indussero Boltzmann ad insistere sugli aspetti
statistici7 del problema della convergenza all’equilibrio in termini molto generali .
Seguendo le idee di Boltzmann consideriamo un sistema di N particelle in-
teragenti. Lo stato di ognuna di queste particelle e individuato dal punto s(j) ≡(p(j),q(j)) (con j = 1, . . . , N) appartenente allo spazio delle fasi Ω di singola
particella. La configurazione dell’intero sistema e individuata dalla collezione
x ≡ s(1), . . . , s(N). Ripartiamo lo spazio Ω in cellette ω, tutte di uguale volume,
che indicizziamo ω1, ω2, . . . , ωn, . . .. Le cellette ω devono verificare due requisiti:
devono essere molto piccole rispetto alle dimensioni macroscopiche dell’intero si-
stema ma tuttavia devono essere sufficientemente grandi da contenere un grosso
numero di punti s(j). Indichiamo con Nk il numero di punti s(j) appartenenti
alla celletta ωk con k = 1, . . . , n. La collezione dei numeri di occupazione
N1, . . . , Nn definisce la configurazione macroscopica M del sistema. Valgono
i seguenti fatti:
1) ad ogni punto rappresentativo x (microstato) appartenente allo spazio delle
fasi X dell’intero sistema corrisponde una configurazione macroscopica M(x)
definita dai numeri di occupazione N1, . . . , Nn; diversi punti possono generare
una stessa configurazione;
2) fissata una configurazione N1, . . . , Nn l’insieme dei punti rappresentativi x ∈X che corrispondono alla data configurazione determinano una regione X (M)
nello spazio delle fasi, chiamata macrostato.
La prima affermazione e evidente. Per giustificare la seconda mostriamo che esistono due ope-
razioni che lasciano invariati i numeri di occupazione Nk. Come prima cosa ognuno degli N punti
s(j) puo essere rimpiazzato con ogni altro punto appartenente alla stessa celletta e quindi alla
collezione dei punti s(j) e associato volume |ω|N (|ω| indica il volume comune delle cellette) nello
spazio delle fasi X . In secondo luogo osserviamo che ogni permutazione degli Nk punti all’interno
di ogni celletta ωk preserva la configurazione M . Infine ognuna delle N ! permutazioni dei punti
s(1), . . . , s(N) preserva M ma sposta il volume |ω|N in N ! zone distinte dello spazio delle fasi
X . Segue che il volume X (M) del macrostato e dato da
|X (M)| = N !N1! . . . Nn!
|ω|N . (2.2)
7Grazie alle sue idee la teoria cinetica confluı gradualmente in quella disciplina oggi nota come
Meccanica Statistica . Tuttavia questo termine fu coniato solo alcuni decenni dopo da Gibbs
con la pubblicazione del suo famoso lavoro. C.f.r. [Gib02].
21
avendo sottinteso con | | la misura invariante di Liouville (Lebesgue) sullo spazio delle fasi. Dai
punti 1) e 2) segue che ogni stato microscopico x definisce una configurazione M(x) e quest’ultima
definisce un macrostato X (M(x)) ≡ X (x). Dato che ogni punto x determina univocamente il
proprio macrostato X (x) segue che i macrostati definiscono una partizione dello spazio delle fasi.
Tutti i punti di X (x) sono caratterizzati dal fatto di descrivere simili distribuzioni spaziali di
particelle e producono profili simili nelle distribuzioni di velocita.
Boltzmann stabilı il legame tra microstati e macrostati definendo la quantita
SB(x) ≡ k log |X (x)| (2.3)
nota come entropia di Boltzmann ; la costante di Boltzmann k fornisce il
legame tra scala macroscopica e scala microscopica.
Il nesso tra la (2.3) ed il problema dell’irreversibilita macroscopica e esplicitato
dal seguente esempio. Consideriamo un gas di N particelle, inizialmente costretto
in un volume V/2 per mezzo di una parete di separazione, che espande in tutto il
volume V in seguito alla rimozione della parete. Inizialmente il sistema si trova in
una configurazione di equilibrio M1 a cui e associato il macrostato X1 ≡ X (M1).
Quando la parete e rimossa le particelle sono libere di espandere in tutto il volume e
la zona dello spazio delle fasi accessibile al sistema aumenta di un fattore 2N (un fat-
tore 2 per ogni particella) che per sistemi realmente macroscopici (N = 1020) ha un
valore tipico di 21020. Quando il gas espande il punto rappresentativo x(t) abban-
dona il macrostato di equilibrio X1 e, ragionevolmente, evolve verso l’enorme parte
dello spazio delle fasi che e divenuto accessibile. Al macrostato X (x(t)) daranno
contributo tutti i punti “macroscopicamente equivalenti” a x(t) appartenenti alla
nuova regione accessibile dello spazio delle fasi. E naturale aspettarsi che quando
la parete e rimossa l’evoluzione del punto x(t) sara tale per cui |X (x(t))| > |X1|con un rapporto che e sensatamente stimato da |X (x(t))|/|X1| ∝ 101020
. Quindi
monitorando l’evoluzione temporale della configurazione M(x(t)) e ragionevole as-
pettarsi che essa tipicamente produrra un aumento della quantita SB(x(t)). In base
a queste considerazioni Boltzmann identifico la quantita SB, che e una funzione
definita microscopicamente, con l’ entropia (termodinamica) di Clausius S,
che e una funzione estensiva del sistema in equilibrio, definita macroscopicamente
e misurabile operazionalmente a meno di costanti additive. In effetti lo stesso
Boltzmann mostro che per un sistema di N costituenti in equilibrio con energia E
e volume V vale la relazione
S(E, N, V ) ' SB(Meq) (2.4)
22
indicando con Meq = Meq(E, N, V ) la configurazione che corrisponde al sistema in
equilibrio per data energia E e volume V . Il simbolo “'” indica che l’uguaglianza
e vera solo per grandi N (quando il sistema e realmente macroscopico), ovvero solo
a meno di termini che vanno velocemente a zero se N → +∞.
Discutendo l’esempio del gas che espande abbiamo stimato che il rapporto tra
i volumi dei macrostati relativi all’equilibrio finale X2 ed a quello iniziale X1 e
ordine |X2|/|X1| ∝ 101020(maggiore del rapporto tra il volume stimato dell’uni-
verso e quello occupato da un protone). Un rapporto cosı sfavorevole implica che
la regione dello spazio delle fasi accessibile dopo la rimozione del muro di sepa-
razione consiste quasi interamente di punti appartenenti al macrostato finale X2
con pochissime eccezioni dell’ordine di 10−1020. Quindi, a meno che la dinamica che
governa il sistema non sia “irragionevolmente speciale”, e naturale aspettarsi che
il punto rappresentativo x(t) venga evoluto rapidamente nel macrostato relativo
all’equilibrio finale e che in questo macrostato trascorri un lungo periodo di tempo
(ordine tempi di ricorrenza).
Tuttavia questa interpretazione dell’irreversibilita macroscopica si basa forte-
mente sull’affermazione che gli stati di non equilibrio sono “fatti eccezionali”. Di
conseguenza N e assunto essere molto grande ma deve, in ogni caso, essere finito:
la condizione N → +∞ implicherebbe |X1|/|X2| = 0 ovvero negherebbe, assumen-
do la validita stretta delle considerazioni probabilistiche, l’esistenza degli stati di
non equilibrio!
Inoltre, in questo schema interpretativo, i tempi di rilassamento all’equilibrio
dipendono solo dai parametri che identificano le celle e quindi sono, in un certo
senso, universali e assunti “a priori”. Cio si confronta male con la realta dei fatti
dato che i tempi di rilassamento possono essere molto diversi per sistemi macro-
scopici distinti e in ultima analisi devono dipendere dalla natura delle interazioni
microscopiche.
2.2.3 Probabilita e tempi di soggiorno
Le idee di Boltzmann introducono nelle leggi della natura il concetto di proba-
bilita ad un livello poco formale come e evidente da espressioni tipo “e naturale”,
“tipicamente”, etc. Queste nozioni necessitano una formalizzazione. Una teoria
quantitativa si ottiene introducendo la distribuzione microcanonica di Gibbs.
Sia ∆ una regione contenuta nell’ipersuperficie isoenergetica XE ⊂ X a fissata
energia E (si assume che il sistema e isolato e quindi E costante). Indichiamo
23
con |∆|E il volume della regione ∆ (ottenuto tramite la proiezione della misura
di Liouville su XE) e fissiamo per convenzione la normalizzazione |XE|E = 1. La
distribuzione microcanonica afferma che la probabilita di trovare un punto di fase
in ∆ e data da |∆|E e per questo motivo l’introduzione della distribuzione mi-
crocanonica e nota come assunzione delle uguali probabilita “a priori” ,
infatti regioni di uguale volume sono ugualmente probabili. Effettivamente l’uti-
lizzo dell’ensemble microcanonico da una descrizione quantitativamente corretta
dei comportamenti dei sistemi macroscopici all’equilibrio (nel limite N → +∞) e
permette di quantificare espressioni come “e naturale”, “tipicamente”, etc.
Il nesso tra l’assunzione delle uguali probabilita a priori e l’irreversibilita macro-
scopica si ottiene (secondo l’idea introdotta da Ehrenfest) assumendo che il il tem-
po medio di soggiorno t(M) in cui il sistema realizza il macrostato X (M) e
dato
t(M) = |X (M)|E (2.5)
essendo |X (M)|E l’area della superficie individuata dall’intersezione del macrosta-
to X (M) con l’ipersuperficie isoenergetica XE. Il tempo medio di soggiorno di un
punto di fase x nella regione ∆ definisce la probabilita di trovare il sistema in un
microstato appartenente a ∆ in seguito ad una misura istantanea. Se si giustifica
la (2.5) allora si giustifica anche l’uso della distribuzione microcanonica. Inoltre,
assumendo che il volume del macrostato di equilibrio occupa quasi interamente
l’ipersuperficie isoenergetica, dalla (2.5) seguirebbe che il sistema e quasi sempre
nello stato di equilibrio e solo durante una piccolissima frazione di tempo realizza
stati di non equilibrio. Quindi un sistema fuori dall’equilibrio convergerebbe ve-
locemente verso lo stato di equilibrio e l’equilibrio sarebbe preservato nel tempo
salvo sporadiche fluttuazioni.
Questo quadro, tuttavia, non si puo ritenere totalmente soddisfacente. La
statistica non viene definita in modo intrinseco alla natura del sistema e anche
assumendo che la dinamica sia ergodica (condizione sufficiente affinche valga la
(2.5)) la distribuzione microcanonica e solo “relativamente la piu naturale”. Infat-
ti l’ergodicita permette di affermare che la misura microcanonica e l’unica misura
invariante assolutamente continua rispetto alla misura di Liouville ma non afferma
affatto che e l’unica misura invariante. In generale i sistemi dinamici possono am-
mettere infinite misure invarianti (Paragrafo 3.2.1) e l’ergodicita implica che queste
misure sono reciprocamente disgiunte, ossia descrivono statistiche totalmente dis-
tinte. Quindi, in ogni caso, il problema della scelta della statistica resta, in un
certo senso, un fatto arbitrario.
24
All’interno del formalismo probabilistico la convergenza all’equilibrio viene stu-
diata interpretando gli stati del sistema come delle generiche distribuzioni di
probabilita (ossia come delle misure normalizzate assolutamente continue rispet-
to alla misura microcanonica) che, sotto l’effetto della dinamica Hamiltoniana,
evolvono alla “speciale” distribuzione microcanonica. L’associazione dello stato
del sistema con una densita viene giustificata come conseguenza dell’“ignoranza”
riguardo allo stato microscopico del sistema. Questo modo di affrontare il proble-
ma dell’approccio all’equilibrio e molto diffuso e costituisce la premessa di molti
lavori come ad esempio il testo di Mackey [Mac92]. In questo schema le nozioni di
ergodicita e mixing entrano in modo essenziale per giustificare il raggiungimen-
to dell’equilibrio. L’ergodicita, ovvero l’assenza delle costanti del moto che non
siano funzione dell’Hamiltoniana, garantisce che la distribuzione microcanonica e
l’ unica distribuzione di equilibrio. Tuttavia l’assunzione di ergodicita non e suf-
ficiente per dimostrare la convergenza all’equilibrio di una generica distribuzione.
Per provare che ogni distribuzione converge al passare del tempo alla distribuzione
microcanonica e necessario supporre che il sistema sia mixing. La proprieta di mix-
ing equivale ad assumere che la dinamica sia capace di sparpagliare piu o meno
uniformemente su tutta la superficie isoenergetica ogni sottoinsieme (di misura
non nulla) M⊂ XE in un tempo sufficientemente lungo.
Tuttavia questa logica non puo essere soddisfacente per diversi motivi. Per
prima cosa ignora il fatto che i sistemi di cui si interessa la Meccanica Statistica
devono essere grandi e sembra applicarsi universalmente, indipendentemente dal
numero di gradi di liberta! Inoltre il formalismo discusso non si estende ai sistemi
infiniti, infatti l’associazione tra stati del sistema e misure assolutamente continue
rispetto alla misura microcanonica conduce ad affermazioni paradossali quando si
considerano sistemi di questo tipo. Ad esempio nel caso di sistemi prodotto si
verifica che l’unica misura assolutamente continua rispetto al prodotto delle mis-
ure microcanoniche e proprio il prodotto delle misure microcanoniche (Paragrafo
3.2.2) ed in questo caso il formalismo precedente affermerebbe che l’unico stato
con probabilita non nulla per il sistema e lo stato di equilibrio. Evidentemente
una tale affermazione e paradossale e non confrontabile con la realta. L’ipotesi
ergodica (e quindi l’ipotesi di mixing che implica l’ergodicita) pone dei problemi
relativi alle scale temporali in gioco. L’ergodicita implica l’uguaglianza tra le mis-
ure (microcanoniche) dei sottoinsiemi dell’ipersuperficie isoenergetica ed i relativi
tempi medi di soggiorno. Tuttavia questa uguaglianza e realizzata su scale di tem-
pi confrontabili con i tempi di ricorrenza di Poincare (per stimare un tempo medio
25
di soggiorno e necessario che l’orbita ripassi numerose volte per un dato sottoin-
sieme), che come abbiamo visto, variano in modo enorme a seconda della classe di
variabili che si considerano. D’altra parte e un’evidenza sperimentale che ogni sis-
tema macroscopico raggiunge l’equilibrio in un proprio tempo caratteristico, detto
tempo di rilassamento, che deve essere molto piu piccolo dei tempi di ricorren-
za relativi a tutte le variabili contemporaneamente. La grandissima differenza tra
le scale dei tempi tipici del comportamento ergodico rispetto a tutte le variabili e
quella dei tempi di rilassamento implica che l’ipotesi ergodica (o mixing) non deve
essere utilizzata a livello di tutte le variabili se si vuole giustificare la convergenza
all’equilibrio dei sistemi grandi su scale di tempi fisicamente rilevanti. Inoltre, an-
che se e un luogo comune giustificare l’introduzione delle densita come conseguenza
dell’“ignoranza” riguardo al preciso stato microscopico del sistema, e chiaro che
l’evoluzione del sistema e comunque completamente determinata e non dipende da
cio che un’osservatore puo conoscere. Per questo motivo le densita che entrano
nel formalismo non possono essere giustificate dall’ignoranza ma devono avere una
definizione intrinseca, il piu possibile indipendente dal grado di conoscenza che si
puo avere dello stato microscopico, e fondata sulle operazioni di laboratorio che
sono, in realta, alla base della descrizione statistica.
2.3 Modelli per l’irreversibilita
In base alle idee di Boltzmann gli stati microscopici evolvono in modo tale da au-
mentare il volume del relativo macrostato e quindi massimizzare il valore dell’en-
tropia di Boltzmann. Tuttavia cio costituisce solamente una spiegazione qualitati-
va del comportamento macroscopico. Per fornire una descrizione della convergenza
all’equilibrio che sia anche quantitativa si cerca di derivare delle equazioni che pre-
scrivono un’ evoluzione irreversibile . In alcuni casi, effettivamente, si riescono
a derivare in modo rigoroso delle equazioni macroscopiche irreversibili partendo
dalla dinamica microscopica reversibile. L’ingrediente fondamentale che entra in
queste deduzioni e il rapporto estremamente grande, idealmente infinito, tra scala
macroscopica e scala microscopica (limite idrodinamico). Inoltre le equazioni
irreversibili si ottengono solo nel limite N → +∞ (limite termodinamico).
Tuttavia questo limite non e utilizzato in modo generale ma, al contrario, viene
introdotto secondo procedure “ad hoc” relative ai particolari modelli in esame.
Infine osserviamo che il tentativo di spiegare la convergenza all’equilibrio tramite
la deduzione di equazioni irreversibili presuppone tacitamente (ed in modo ingiu-
26
stificato) che l’ingrediente essenziale sia una qualche forma di irreversibilita per
i sistemi grandi.
2.3.1 Equazione di Boltzmann per gas diluiti
L’ equazione di Boltzmann e un’equazione integro-differenziale deterministica
ed asimmetrica rispetto alla direzione del tempo che prescrive l’evoluzione tempo-
rale della densita f(p,q) nello spazio delle fasi di singola particella Ω. La densita
f(p,q) descrive la distribuzione statistica empirica delle particelle del gas e
non deve essere confusa con le distribuzioni definite sullo spazio delle fasi dell’in-
tero sistema che non hanno, invece, carattere empirico. L’equazione di Boltzmann
e un’equazione macroscopica derivabile dalla dinamica microscopica valida per gas
diluiti in cui l’energia di interazione tra i costituenti microscopici e trascurabile.
La derivazione dell’equazione di Boltzmann richiede un limite idrodinamico tra
scala microscopica e scala macroscopica ed un limite sulla densita delle particelle
detto limite di Boltzmann-Grad . Sia V il volume (d-dimensionale) in cui e
contenuto il gas costituito da N particelle di raggio ε. Il limite di Boltzmann-Grad
consiste nel tenere costante il volume e nel mandare N → ∞ e ε → 0 in modo
tale che Nεd−1 → λ con λ valore costante. In questo limite il libero cammino
medio percorso dalle particelle tra due successive collisioni resta finito mentre la
pressione e l’energia diventano quelle di una sistema non interagente (gas ideale).
Cio segue osservando che nel limite di Boltzmann-Grad la densita delle particelle e
stimata da Nεd/V → ε(λ/V ) ossia risulta ordine ε. Lanford8 ha derivato in modo
rigoroso l’equazione (irreversibile) di Boltzmann dalla dinamica Hamiltoniana (re-
versibile) per un gas di sfere rigide (o con interazioni a range finito piu generale)
nel regime di Boltzmann-Grad. Tuttavia la derivazione ottenuta da Lanford vale
solo in un breve intervallo di tempo. Nella dimostrazione entra in modo essenziale
il fatto che la convergenza all’equilibrio non e uniforme nel tempo. Matematica-
mente questo significa che la topologia che serve a controllare la convergenza delle
distribuzioni cambia passando da un’istante t1 ad un’istante t2 > t1. Se al tempo
t2 si decidesse di invertire le velocita delle particelle e la direzione del tempo, il
fatto che la statistica sia ottenuta, per N → +∞, attraverso diverse nozioni di
convergenza, evita il paradosso della reversibilita (Loschmidt).
Questo meccanismo, tuttavia, ha un’altra conseguenza. Se anche il risultato
di Lanford fosse dimostrato per ogni tempo (cosa al momento lontana dall’essere
8C.f.r. [Lan75] e [Sph91].
27
realizzata) il fatto che la convergenza all’equilibrio avviene in modo non uniforme
nel tempo implica che limite t → +∞ in generale non puo commutare con il limite
N → +∞ (nel senso di Boltzmann-Grad). L’analisi di Lanford richiede per primo
il limite N → +∞ e sembra percio contrastare con le idee della Teoria ergodica,
che dichiara il limite t → ±∞ ad N fisso.
2.3.2 Le equazioni idrodinamiche
L’evoluzione temporale delle densita macroscopiche e governata dalle leggi idro-
dinamiche irreversibili. Generalmente queste leggi si esprimono come equazioni
differenziali non lineari alle derivate parziali della forma
∂
∂tMj(r, t) = Fj(M(r, t),∇M(r, t), . . .) j = 1, 2, . . . (2.6)
avendo indicato con M(r, t) ≡ Mj(r, t) la collezione di tutte le densita macro-
scopiche relative al sistema. Le quantita M e F sono specifiche del fenomeno
considerato, generalmente, la loro dipendenza dalla struttura microscopica del
sistema e piccola. L’“universalita” della (2.6) nasce dal fatto che le leggi idro-
dinamiche sembrano essere diretta conseguenza dell’esistenza di una differenza
di scala spaziale e temporale tra i fenomeni macroscopici e quelli microscopici
(limite idrodinamico). I modelli microscopici possono essere anche piuttosto
rozzi e tuttavia fornire una descrizione quantitativamente corretta del comporta-
mento macroscopico. L’utilizzo di potenti strumenti di simulazione numerica ha
effettivamente mostrato che modelli microscopicamente assai diversi producono
un’evoluzione macroscopica simile.
Le attuali conoscenze matematiche non sono ancora sufficienti per riuscire a
derivare le leggi dell’idrodinamica per sistemi governati da dinamiche Hamilto-
niane realistiche senza ipotesi di natura statistica sugli stati. L’unica eccezione
conosciuta a questa situazione e il gas di Lorentz .
2.3.3 Il gas di Lorentz
Il gas di Lorentz costituisce un esempio in cui si puo derivare un’equazione
di diffusione macroscopica irreversibile partendo dalla dinamica Hamiltoniana re-
versibile dei costituenti microscopici senza necessita di ipotesi aggiuntive sulla
natura del sistema. Il modello consiste di un gas di particelle non interagenti
(sfere rigide in tre dimensioni, oppure dischi rigidi in due) che si muovono in un
28
reticolo periodico e fisso costituito da corpi scatteranti duri e convessi. Se la con-
figurazione degli stati e tale che le particelle possono percorrere solamente delle
distanze uniformemente limitate tra due successivi urti allora si puo dimostrare
rigorosamente che su scale temporali e spaziali macroscopiche le particelle compi-
ono un moto diffusivo di tipo Browniano. Cio e stato dimostrato da Bunimovich
e Sinai9 per il caso bidimensionale ed in seguito questo risultato e stato esteso da
Chernov10 per il caso di una generica dimensione d.
Sia x(t; θ0,x0) la posizione al tempo t di una particella localizzata nell’istante
iniziale t = 0 in x0 e con velocita iniziale unitaria diretta nella direzione θ0 (dato
che il modulo della velocita non cambia durante l’evoluzione e comodo riferirsi al
caso di velocita con modulo 1, inoltre θ0 indica l’insieme di tutte le coordinate ne-
cessarie per specificare la direzione di volo della particella). Se esiste un’incertezza
nella posizione iniziale della particella x0 descritta dalla distribuzione di proba-
bilita p(x)dx, cio indurra una distribuzione di probabilita sulle traiettorie x(t; · ).Definiamo la posizione macroscopica yε al tempo macroscopico t tramite la
relazione
yε(t; · ) ≡ ε x(t/ε2; · ). (2.7)
Se ε → 0 la tipica traiettoria appare, su scala macroscopica, simile ad un moto
Browniano, ossia in termini rigorosi
w-limε→0
yε(t; · ) = WD(t) (2.8)
dove con WD(t) si e indicato il moto Browniano (d-dimensionale) originato dal
tensore di diffusione positivo D ottenuto dalla formula di Green-Kubo. La conver-
genza debole che compare nella (2.8) (il limite deve convergere per ogni scelta delle
condizioni iniziali θ0,x0) significa che rispetto alle scale macroscopiche il compor-
tamento della traiettoria di ogni particella, ovvero la correlazione tra le posizioni
in regioni spaziali diverse a tempi diversi, non e distinguibile da un cammino
Browniano11.
Sia x ∈ X un punto di fase dello stato microscopico che appartiene alla regione dello spazio
delle fasi in cui tutte le particelle hanno velocita unitaria. Il punto x definisce una densita
spaziale (regolare) di particelle n0(r) su scala macroscopica e questa densita definisce una con-
figurazione M ed il relativo macrostato X (M) ⊂ X . Indichiamo con εdN (ω/εd, t/ε2) il numero
di particelle contenuto nella regione macroscopica ω di volume |ω| (con volume |ω|/εd in unita
9C.f.r. [BS91].10C.f.r. [Che94].11L’origine dei comportamenti irreversibili dei sistemi classici e sempre riconducibile ad un
limite debole fatto rispetto a qualche parametro descrittivo del sistema. C.f.r. [GM99].
29
microscopiche) al tempo microscopico t/ε2. Osserviamo che il rapporto tra scala macroscopica
e scala microscopica e ε per le lunghezze e ε2 per i tempi e questo e corretto in presenza di
fenomeni di diffusione con gradienti ordine ε. Dal lavoro di Lebowitz e Spohn12 segue che se
ε → 0 la variabile casuale εdN (ω/εd, t/ε2) tende ad un valore deterministico dato da
limε→0
εdN (ω/εd, t/ε2) =∫
ω
n(r, t) (2.9)
dove la densita di particelle n(r, t) verifica l’equazione
∂
∂tn(r, t) =
∂
∂r·[D(n) · ∂
∂rn(r, t)
]
con densita iniziale fissata da n(r, 0) = n0(r) e con il tensore D ottenuto da Bunimovich e Sinai
tramite la formula di Kubo. La convergenza della (2.9) avviene con probabilita 1 ossia avviene
qualsiasi sia il punto di fase x ∈ X (M) all’istante iniziale.
2.4 Necessita dei sistemi infiniti in Termodina-
mica
I teoremi ergodici presuppongono solo contenuti dinamici e pertanto sono validi
per qualsiasi tipo di sistema indipendentemente dal numero di gradi di liberta.
Tuttavia, come gia intuito da Boltzmann, i comportamenti macroscopici devono
essere legati al fatto che il sistema in esame e formato da un gran numero di co-
stituenti microscopici (ad esempio solo se cio e vero e possibile la suddivisione dello
spazio delle fasi di singola particella in cellette). Generalmente si considerano i
sistemi termodinamici cone sistemi formati da N costituenti microscopici contenuti
in un volume finito V . Si sviluppa la teoria di questi sistemi e si definiscono le
varie nozioni come osservabili, stati, evoluzione temporale, etc. Solo alla fine, come
atto conclusivo, viene introdotta la nozione di sistema infinito nel senso di limite
termodinamico dei sistemi finiti, ovvero considerando il limite di sistemi finiti
sempre piu grandi N → +∞, V → +∞, N/V = const. ed adeguando in qualche
senso conveniente le diverse nozioni fisiche introdotte sui sistemi finiti. Esponiamo
alcune delle motivazioni che rendono necessario, a posteriori, il ricorso alla nozione
di limite termodinamico.
Equivalenza degli ensemble e transizioni di fasi
Per sistemi finiti (V, N < +∞) ed isolati, con energia costante data da H(x) = E,
l’assunzione delle uguali probabilita a priori prescrive come densita di probabilita
12C.f.r. [LS82a] e [LS82b].
30
sullo spazio delle fasi X la distribuzione microcanonica
ρmc(x) =
C se E 6 H(x) 6 E + ∆E
0 altrimenti
essendo C una costante di normalizzazione e ∆E ¿ E.
Se si considera il sistema come non isolato ma lo si pensa come una piccola
parte finita (V, N < +∞) (ma ancora sufficientemente grande da poter essere
considerata macroscopica) di una sistema piu esteso, detto bagno termico, con
il quale e in equilibrio senza che vi sia scambio di materia (N = const.) allora
l’ensemble statistico e descritto dalla distribuzione canonica
ρc(x) = Ce−βH(x)
essendo C una costante di normalizzazione e β un parametro, detto temperatura
inversa , che caratterizza lo stato del bagno termico.
Infine se si vuole considerare la situazione in cui il sistema in esame e una
piccola parte finita (V,N < +∞) di un sistema piu esteso con il quale e in equi-
librio pur potendo scambiare materia allora l’ensemble statistico e descritto dalla
distribuzione grancanonica
ρgc(x,N) =C
N !eβ(Ω+µN−H(x,N))
essendo C una costante di normalizzazione, β la temperatura inversa del bagno
termico e µ e Ω due parametri che determinano la quantita media di materia (N)
contenuta nel sistema detti rispettivamente potenziale chimico e pressione .
Da un punto di vista fisico le tre distribuzioni statistiche devono essere equiv-
alenti altrimenti sarebbe naturale dubitare della loro utilita. In genere le sostanze
macroscopiche (si pensi ai fluidi in genere) godono della proprieta estensiva os-
sia ciascuna loro parte gode ancora delle stesse proprieta macroscopiche dell’intera
sostanza. Se consideriamo una parte di sistema come isolato da tutto il resto essa
deve essere in equilibrio con l’intero sistema. Questo implica che l’intera sostanza
deve essere caratterizzata da un suo proprio parametro β. Inoltre comunque si
guarda una piccola parte dell’intero sistema e naturale aspettarsi che la quantita
di materia in essa presente abbia delle fluttuazioni. Tuttavia, se e vero che le
proprieta macroscopiche dei sottosistemi devono coincidere con quelle dell’intero
sistema, queste fluttuazioni non devono determinare comportamenti termodina-
mici particolari. Il problema dell’equivalenza delle tre distribuzioni, necessario a
31
garantire la coerenza della Meccanica Statistica all’equilibrio, e risolto solo nel
limite termodinamico13.
I sistemi macroscopici hanno la caratteristica di poter esistere in diverse fasi
o stati di aggregazione e sperimentalmente il passaggio tra due diverse fasi si
manifesta con l’apparizione di singolarita nelle funzioni termodinamiche come la
pressione nel caso dei sistemi liquido-vapore oppure la magnetizzazione per i fer-
romagneti. Nasce il problema di derivare teoricamente queste singolarita partendo
dalle funzioni di distribuzioni che sono funzioni analitiche dei propri argomenti.
Anche in questo caso la soluzione del problema risiede nell’assumere che i sistemi
macroscopici approssimano l’ideale limite termodinamico. Infatti avvicinandosi al
limite N → +∞, V → +∞, N/V = const. le funzioni di distribuzione possono
sviluppare delle singolarita dato che il limite di successioni di funzioni analitiche
puo non essere una funzione analitica14.
Sia la questione riguardante l’equivalenza degli ensemble che quella relativa al-
la comparsa delle singolarita nelle funzioni termodinamiche, prese singolarmente,
hanno il carattere di problematiche squisitamente “tecniche”. Ad esempio il con-
tenuto della dimostrazione dell’equivalenza degli ensemble per il caso di un gas
di particelle libere e sostanzialmente un’applicazione della formula di Stirling per
l’approssimazione di N !. Analogamente non e restrittivo limitarsi a sistemi finiti
ma “grandi” per riconoscere la presenza di una transizione di fase. Le discontinuita
ottenute nel limite teorico di sistemi infiniti si manifestano come pendenze “molto
ripide” nei grafici delle funzioni termodinamiche dei sistemi finiti. In questo senso
si puo sempre convenire di definire una discontinuita ogni volta che la derivata
della funzione termodinamica supera un certo valore di soglia e da questo punto
di vista il limite termodinamico non aggiunge nulla di nuovo a questa discussione
pur di considerare il sistema sufficientemente grande.
Principio zero della termodinamica
Nella nozione di equilibrio termodinamico entra in modo cruciale la nozione
di sistema infinito. Ogni tentativo di derivare il concetto di equilibrio partendo
13Una discussione semplice sugli ensemble statistici e sulla loro equivalenza nel limite termo-
dinamico e affrontata in [Hua97] Capitoli 6 e 7. Il trattamento rigoroso del problema e invece
discusso nel testo [Rue69].14Un preciso scenario in cui si ha comparsa di transizioni di fase e stato proposto da Yang
e Lee. Una soddisfacente discussione di questo problema e data in [Hua97] Paragrafi 9.3 e 9.4.
Una trattazione matematicamente rigorosa e invece data in [Rue69] Capitolo 3 (per il limite
termodinamico) e Capitolo 5 (per le transizioni di fase).
32
solamente da considerazioni di tipo meccanico incontra serie difficolta nel definire
i concetti di equilibrio termico e contatto termico ed in questo contesto e
lecito chiedersi se e come il contenuto della Termodinamica aggiunga qualcosa di
nuovo a quello della Meccanica.
In effetti fino a quando il sistema in considerazione e finito ed isolato una com-
pleta descrizione meccanica puo essere fornita in termini dell’ energia interna
E (ad esempio l’energia meccanica posseduta dalle particelle del gas contenuto
in una scatola o l’energia di oscillazione di un pendolo) e di altri parametri di
tipo geometrico V (ad esempio il volume della scatola o la lunghezza del filo del
pendolo) e gli stati del sistema possono essere rappresentati come punti del piano
(E, V ). Se il sistema e isolato, tutte le trasformazioni ammesse sono quelle indotte
da cambiamenti dei parametri geometrici che implicano una nozione di lavoro e
non c’e necessita di introdurre una nozione di scambio di calore . Quindi la
nozione di trasformazione adiabatica δQ = 0 ha un preciso senso Meccanico
e non e un fatto Termodinamico.
L’analogia diviene ancora piu stringente se si considerano ad esempio sistemi
meccanici unidimensionali come ad esempio un pendolo. Gli stati di questo sistema
vengono specificati dalla conoscenza dell’energia meccanica E e dalla lunghezza
del filo L. Una possibile trasformazione che questo sistema puo subire si ottiene
variando la lunghezza L in modo molto lento rispetto al periodo di oscillazione
T = T (E) del pendolo. Sistemi di questo tipo ammettono delle quantita dette in-
varianti adiabatici 15 I(E) che hanno la proprieta di essere funzioni del sistema
che non variano quando il parametro L cambia lentamente. Inoltre si dimostra che
∂I/∂E = T (E)/2π e pertanto per trasformazioni in cui L varia lentamente
dI =T (E)
2πdE
Introducendo la nuova variabile w = ∂S/∂I con S azione del sistema si verifica
anche che dI = −(∂L/∂w)dL e quindi in definitiva
dE = − 2π
T (E)
(∂L
∂w
)
I,L
dL = W (E)dL.
Questo sistema puo subire trasformazioni anche in modi diversi, ad esempio co-
municando un colpo alla massa che oscilla oppure accorciando bruscamente il filo.
In questo caso la precedente equazione puo essere corretta nel seguente modo
dE −W (E)dL = δQ
15Per la teoria degli invarianti adiabatici c.f.r [LL99b] Paragrafi 49 e 50.
33
intendendo con δQ la variazione di energia interna ottenuta in modo non a-
diabatico. In questo caso δQ si interpreta come quantita di calore scambia-
to dal sistema con l’esterno e la precedente equazione e il I Principio del-
la Termodinamica che in questo senso ha un contenuto puramente meccani-
co. Evidentemente l’equazione per le trasformazioni adiabatiche e data da δQ =
dE −W (E)dL = 0 che definisce un’ equazione di Pfaff . Una soluzione dell’e-
quazione di Pfaff e una curva γ(t) ≡ (E(t), L(t)) nel piano (E,L) che verifica per
ogni valore del parametro t la condizione(
dE
dt−W (γ(t))
dL
dt
)dt = 0.
Quindi le curve soluzione dell’equazione adiabatica sono tutte e solo le curve che
hanno in ogni punto del piano (E, L) un vettore tangente v ≡ (dE/dt, dL/dt)
ortogonale al campo vettoriale (1,W ) ed in questo senso l’equazione adiabatica
prescrive in ogni punto del piano (E,L) un sottospazio unidimensionale ortogo-
nale a (1,W (E)). Se si assume il principio di irraggiungibilita ovvero se si
assume che per ogni punto del piano (E,L) esistono punti infinitamente vicini che
non possono essere raggiunti dal sistema tramite trasformazioni adiabatiche allo-
ra un’importante risultato, noto come Teorema di Caratheodory16, afferma
che l’equazione di Pfaff ammette un fattore integrante ovvero esiste una funzione
regolare f : (E, L) → R tale che l’espressione
dS ≡ δQ
f(E, L)=
1
f(E, L)dE − W (E)
f(E, L)dL
risulta un differenziale esatto. Quindi il campo vettoriale (1/f,−W/f) e il gra-
diente di una curva definita su (E, L) dalla condizione S(E, L) = const. e le curve
adiabatiche, soluzioni dell’equazione δQ = 0, sono anche soluzioni dell’equazione
dS = 0 e quindi giacciono sulle curve ad S costante. Intendendo la funzione S
come l’ entropia del pendolo possiamo affermare che le trasformazioni adiabatiche
sono quelle isoentropiche. Quindi il principio di irraggiungibilita applicato ad
un sistema unidimensionale come il pendolo di lunghezza variabile riproduce il
II Principio della Termodinamica17 che in questo senso ha un contenuto
puramente meccanico.
16Il tentativo di dare una formulazione analitica del II Principio della Termodinamica fu com-
piuto dal matematico Caratheodory. Una istruttiva esposizione della formulazione assiomatica
della Termodinamica e data in [Afa96].17In realta il II Principio della Termodinamica fa un’affermazione piu forte, ossia che l’entropia
di un sistema isolato non puo diminuire e si mantiene costante lungo le trasformazioni adiabatiche
reversibili. Nel nostro modello meccanico abbiamo inteso come trasformazioni adiabatiche le sole
34
Sembra evidente da questo esempio che sia il I Principio della Termodinamica,
sia il II aggiungono, in generale, poco di nuovo ai contenuti della meccanica. Serie
difficolta invece si incontrano nel momento in cui si cerca di derivare il Principio
zero da considerazioni puramente meccaniche. Se cerchiamo di formulare una
definizione di equilibrio “termico” tra sistemi messi a contatto l’ipotesi di sistema
finito costituisce un sostanziale limite. Per verificare cio consideriamo la solita sca-
tola di gas isolata che all’equilibrio e descritta dall’energia E e da altri parametri
quali il volume che indicheremo con V . La descrizione statistica di un tale sistema
e di tipo microcanonica ovvero il sistema si trova in uno stato, che indichiamo con
ωE,V , definito dalla misura microcanonica µE,V ≡ Cδ(H(p, q, V )− E) sull’ipersu-
perficie isoenergetica XE nello spazio delle fasi del sistema (C e una costante di nor-
malizzazione). Formulare una nozione di equilibrio che riproduca il Principio zero
significa richiedere che comunque prese due scatole 1 e 2, rispettivamente negli stati
ω(1)E1,V1
e ω(2)E2,V2
ed entrambe alla stessa temperatura Θ = Θ1(E1, V1) = Θ2(E2, V2)
(la temperatura identifica il parametro che caratterizza l’equilibrio che stiamo de-
scrivendo) quando esse vengono messe in contatto (nel senso che viene eliminato
l’isolamento reciproco come ad esempio la parete che divide i due contenitori) al-
lora il sistema totale 1 + 2 continua ad essere descritto da uno stato ωE,V che ha
la stessa forma degli stati ω(1)E1,V1
e ω(2)E2,V2
con E = E1 + E2 e V = V1 + V2. In ter-
mini meccanici questo equivale a chiedere che se le hamiltoniane H1 e H2 valgono
rispettivamente E1 ed E2 negli stati ω(1)E1,V1
e ω(2)E2,V2
allora l’hamiltoniana totale H
deve valere E nello stato ωE,V e che i due fatti devono essere equivalenti. Tuttavia
questo non puo essere vero, infatti se da una parte
H1 = E1, H2 = E2 ⇒ H = H1 + H2 = E1 + E2 = E
viceversa
H = H1 + H2 = E1 + E2 = E ; H1 = E1, H2 = E2
o in altri termini
δ(H1(p1, q1) + H1(p2, q2)− E1 − E2) 6= δ(H1(p1, q1)− E1) δ(H2(p2, q2)− E2).
Cio succede perche dopo la rimozione dell’isolamento l’hamiltoniana H1 general-
mente non varra piu E1 sul bordo tra il sistema 1 e 2; a causa dell’interazione
l’energia totale si puo ripartire in molti modi nei sottosistemi. Questo problema si
trasformazioni che avvengono con una variazione lenta del parametro L e queste trasformazioni
sono automaticamente reversibili.
35
puo superare solo nel limite termodinamico in cui si ha equivalenza degli ensemble
e quindi gli stati dei sistemi 1, 2 e 1 + 2 sono descritti da misure (a meno di nor-
malizzazioni) di peso e−β1H1 , e−β2H2 e e−β(H1+H2) rispettivamente. Se la condizione
di equilibrio viene identificata dal parametro β = β1 = β2 (che infatti abbiamo
chiamato temperatura inversa) la definizione di equilibrio fa senso e riproduce il
Principio zero tramite l’uguaglianza
e−β(H1+H2) = e−βH1 e−βH2 .
Questa deduzione fa uso essenziale dell’equivalenza degli ensemble. In questo con-
testo appare evidente come questa procedura non sia solo un fatto di tecnica
matematica ma possiede un profondo significato fisico. Supponiamo che le due
scatole nell’esempio discusso siano un termometro ed un bicchiere d’acqua di cui
si vuole misurare la temperatura. Se accettiamo l’idea che termometro e bicchiere
d’acqua siano talmente grandi da poter essere considerati infiniti, allora nel con-
tatto termico il termometro subira fluttuazioni piccolissime dal valore della sua
energia media (la misura canonica del termometro e fortemente piccata attorno
al valore della sua energia media, ossia circa tutte le configurazioni assunte dal
termometro hanno stessa energia; ecco il significato dell’approssimazione di Stir-
ling) il sistema infinito non viene perturbato e lo stato di equilibrio puo essere
controllato tramite la misura delle osservabili macroscopiche che in questo con-
testo sono ben definite. Viceversa se un termometro troppo piccolo viene messo
in contatto con un sistema delle sue stesse dimensioni allora le fluttuazioni di en-
ergia non sono piu controllabili e gli scambi energetici tra i due sistemi non sono
piu trascurabili. In questo caso perde senso la nozione stessa di equilibrio (non
esistono variabili macroscopiche sensate che permettano di controllare l’equilibrio)
e pertanto le indicazioni fluttuanti dello strumento non hanno piu alcun valore.
Come emerge da questa discussione per avere un Principio zero occorre consid-
erare sistemi “grandi” ed in questo senso il limite di volume infinito e da consid-
erarsi come il fatto nuovo, e pertanto veramente importante, che la Termodinam-
ica aggiunge alla meccanica. E bene notare che l’idea di limite termodinamico e
molto meno astratta di quello che possa apparire. Dall’osservazione della realta
emerge che il limite termodinamico “in senso fisico” si raggiunge abbastanza facil-
mente ed e per questo che ha senso studiare nella teoria il limite termodinamico
“matematico”.
36
2.5 Conclusioni e prospettive
Come emerge dal quadro generale presentato nei precedenti paragrafi ogni tenta-
tivo di fondare la Meccanica Statistica e la termodinamica partendo da consider-
azioni puramente meccaniche comporta sempre l’esame di sistemi molto grandi,
idealmente infiniti. Il limite N → +∞ entra in modo decisivo praticamente in
tutte le questioni fondamentali.
Questioni di termostatica
• Solamente nel limite N → +∞ possono essere introdotti in modo con-
sistente concetti quali quelli di contatto ed equilibrio termico. Soltanto
sulla base del Principio zero, necessita di sistemi infiniti per po-
ter essere enunciato, il I ed il II Principio della Termodinamica
rappresentano fatti nuovi rispetto alla Meccanica.
• Il limite N → +∞ e decisivo per la formulazione della Meccanica Sta-
tistica all’equilibrio (ad esempio solo in questo limite vale l’equivalenza
degli ensemble) e solamente in questo limite le previsioni della Meccani-
ca Statistica danno origine a fenomeni come transizioni di fase e rotture
spontanee di simmetria.
Questioni di irreversibilita ed approccio all’equilibrio
• Solamente nel limite di un numero di costituenti estremamente grande
l’“impostazione alla Boltzmann” riesce a dare ragione dell’irreversibilita
macroscopica a partire dalla reversibilita microscopica risolvendo i para-
dossi di ricorrenza e di reversibilita. Inoltre questa ipotesi, almeno da
un punto di vista qualitativo, risulta capace di fornire una spiegazione
dell’approccio all’equilibrio che sembra largamente indipendente dal-
la natura della dinamica microscopica. Pertanto e ragionevole supporre
che le cause che inducono il comportamento macroscopico devono essere
ricercata nel numero eccezionalmente grande di costituenti microscopi-
ci che realizzano i macrosistemi e, allo stesso tempo, che la nozione di
statistica sui sottosistemi abbia un ruolo centrale.
• Anche da un punto di vista tecnico il limite N → +∞, assieme a varie
considerazioni sul rapporto “dimensioni macroscopiche/dimensioni mi-
croscopiche”, risulta l’ingrediente necessario per la deduzione (rigorosa)
37
delle equazioni irreversibili dell’evoluzione macroscopica (equazioni i-
drodinamiche, equazioni di diffusione, gas di Lorentz, equazione di Bol-
tzmann, etc.) a partire da sistemi con dinamica Hamiltoniana re-
versibile.
Da questo breve quadro riassuntivo emerge intanto che:
i fondamenti della Meccanica Statistica si occupano dei sistemi
grandi, al limite N → +∞.
Tuttavia, sebbene nel formalismo della Meccanica Statistica il limite N → +∞e trattato in modo univoco e sistematico, nei suoi fondamenti entra in modo
molto meno chiaro; infatti:
• il limite N → +∞ viene generalmente combinato con la nozione di va-
riabile macroscopica che presenta un certo grado di ambiguita e che
sembra limitare i risultati al solo confronto con la Termodinamica;
• le equazioni del moto vengono scritte relativamente a sistemi finiti e si cerca
di controllare gli asintoti temporali contemporaneamente al limite N → +∞,
secondo procedure “ad hoc”, dipendenti dal sistema in esame.
Entrambe queste metodologie di ricerca risultano percio insoddisfacenti e comun-
que insufficienti per formulare, prima ancora che risolvere, il problema nella ge-
neralita in cui e fisicamente rilevante.
Lo scopo di questo lavoro di tesi e quello di mostrare che e possibile adottare un
punto di vista alternativo che ha il vantaggio della semplicita logica e che da origine
a criteri semplici ed univoci per il raggiungimento dell’equilibrio. Partendo da
considerazioni molto generali che mettono in luce il ruolo fondamentale del limite
N → +∞ in tutte le questioni rilevanti della Meccanica Statistica proponiamo
due ipotesi di lavoro.
1) Il limite N → +∞ deve essere formulato in generale e deve essere fatto prima
di ogni altra considerazione. In questo senso affermiamo che:
la Meccanica Statistica puo essere fondata direttamente per
sistemi infiniti, N = +∞.
2) Fondare la Meccanica Statistica significa ottenere gli stati termici dei
sistemi infiniti come limite a tempi grandi, su tutte le osservabili, di
38
classi di stati che devono solo essere “sufficientemente omogenei” in modo da
consentire la definizione di una nozione di statistica sui sottosistemi.
Naturalmente fissare in partenza la condizione N = +∞ non e la stessa cosa che
considerare i vari limiti, sugli stati e sulle interazioni, che entrano nelle deduzioni
delle equazioni macroscopiche irreversibili (equazioni idrodinamica, di Boltzmann,
etc.). Cio non rappresenta un limite, piuttosto consente di separare in un contesto
opportuno il problema della descrizione macroscopica (irreversibile) della dina-
mica dal problema, molto piu generale, dell’ approccio all’equilibrio. Sebbene
l’irreversibilita implichi l’equilibrio, non e detto che un’esplicita descrizione irre-
versibile sia necessaria per ottenerla.
Queste ipotesi di lavoro sono alla base dello schema di indagine seguito in
questo lavoro. L’ipotesi N = +∞ si puo associare al fatto che il sistema in
considerazione occupa una regione infinita di spazio (i costituenti restano fissi per
N → +∞). I sistemi infiniti di cui ci occuperemo sono collezioni di sottosistemi
(microscopici) identici, interagenti, localizzati in diverse regioni dello spazio come
ad esempio siti di un reticolo cristallino infinito o una collezione infinita di (piccole)
scatole identiche contenenti del gas e disposte nello spazio. Un possibile metodo di
studio di questi sistemi potrebbe essere quello di descrivere l’intero sistema infinito
come un prodotto dei sottosistemi finiti, da analizzare con i metodi della teoria
ergodica. Tuttavia, benche per un sistema finito il problema si puo studiare in
termini di una misura assolutamente continua rispetto alla misura di Lebesgue con
il risultato di convergenza a misure dipendenti unicamente dall’energia (per sistemi
mixing), per sistemi infiniti la condizione di assoluta continuita rispetto al prodotto
infinito di misure di Lebesgue e inutile ed inapplicabile. Infatti, poiche due misure
prodotto infinito sono relativamente assolutamente continue se e solo se coincidono,
assumere come stati iniziali misure prodotto assolutamente continue rispetto alla
misura prodotto di Lebesgue equivale a fissare come stati iniziali proprio quelli a
cui si vorrebbe convergere. Questa osservazione dice che l’assunzione N = +∞e incompatibile con ogni pretesa di fissare una misura (e quindi una
statistica) a priori . La misura o le misure “interessanti” sul sistema infinito
devono essere definite “a posteriori” in termini della loro interpretazione fisica.
A questo scopo osserviamo che se il sistema infinito e costituito da sottosistemi
spazialmente distribuiti allora possiamo sempre pensare di effettuare misure di
osservabili microscopiche sui sottosistemi e di fare una media sui valori ottenuti
(media sulle traslazioni spaziali). Le configurazioni interessanti del sistema
sono allora quelle in cui l’operazione di media descritta risulta ben definita. Sono
39
queste configurazioni interessanti che definiscono la statistica (e quindi, nel caso
classico, la misura) che deve descrivere i sistemi estesi. Come si vede una tale
impostazione non fa nessun tipo di assunzione “a priori” tranne la restrizione a
classi di stati che ammettano una statistica sulle traslazioni. Infine se si riesce a
tradurre la dinamica dei sistemi infiniti in termini di una dinamica topologica allora
e possibile che una dinamica perfettamente reversibile abbia dei punti di equilibrio
a cui il sistema tende asintoticamente nel futuro e/o nel passato (equilibrio senza
irreversibilita). Cio e possibile in quanto una descrizione topologica della dinamica
non coinvolge nessuna misura invariante e puo non essere soggetta alla ricorrenza
di Poincare. Queste idee verranno sviluppate ampiamente ed in un contesto idoneo
nei Capitoli 4-7. Nel Capitolo 3 vedremo il nesso di queste considerazioni con la
teoria ergodica e la dinamica topologica.
40
Capitolo 3
Teoria ergodica e dinamica
topologica
3.1 Teoria ergodica
La Teoria ergodica storicamente nasce dal tentativo di conciliare la descrizione
Hamiltoniana dei sistemi finiti (descrizione microscopica) con i tipici comporta-
menti macroscopici dei sistemi grandi (ma finiti) tra cui l’approccio all’equilibrio.
In questo senso essa ha avuto una notevole importanza nello sviluppo delle idee
della Meccanica Statistica.
I sistemi Hamiltoniani autonomi descrivono tutti i sistemi isolati ad un
numero finito di gradi di liberta della meccanica classica. Le proprieta principali
di cui godono si riassumono nella seguente definizione (che rappresenta un sunto
degli aspetti salienti discussi nel Paragrafo A.1):
3.1.1 Definizione (sistema dinamico Hamiltoniano). Un sistema dina-
mico Hamiltoniano (autonomo) e la collezione XE, µE,T, Ψ con XE vari-
eta differenziabile (generalmente compatta), µE una misura normalizzata definita
su XE a partire dalla misura di Lebesgue dpdq dello spazio delle fasi in cui XE e
immersa, Ψtt∈T una rappresentazione del gruppo additivo T = R,Z nei diffeo-
morfismi di XE che preservano la misura µE. Se T = R,Z diremo rispettivamente
che il sistema e continuo o discreto. La misura microcanonica e definita da
δ(H(p, q)− E)dp dq.
Lo studio “in astratto” dell’evoluzione temporale di questi sistemi mostra che
esistono comportamenti generali non dipendenti dalla particolare struttura geo-
metrica ma unicamente implicati dalla presenza di una misura invariante. In par-
41
ticolare la presenza della misura invariante comporta che i sistemi Hamiltoniani
autonomi sono ricorrenti nel senso che sotto l’effetto dell’evoluzione temporale
le orbite (per quasi ogni dato iniziale rispetto alla misura invariante) ritornano
infinite volte arbitrariamente vicino ad ogni punto raggiunto. Questo comporta-
mento nega la possibilita che le orbite possano convergere puntualmente e costi-
tuisce (ed ha costituito) l’ostacolo maggiore per un’interpretazione Hamiltoniana
dell’approccio all’equilibrio dei sistemi macroscopici. L’impostazione attuale (ad
esempio quella del libro di Mackey [Mac92]), che permette di conciliare il rag-
giungimento dell’equilibrio con la ricorrenza, parte dall’affermazione che lo stato
del sistema (per motivi di ignoranza!) deve essere descritto non da una precisa
configurazione (un punto dello spazio delle fasi) ma da una distribuzione (fun-
zione L1 positiva e normalizzata) che descrive la probabilita che il sistema si trovi
in una particolare configurazione. Queste distribuzioni evolvono nel tempo in base
alla relazione ρ(xt) = ρt(x) e si studiano le condizioni sulla dinamica affinche ci sia
convergenza, a tempi grandi, ad una distribuzione stazionaria ρ∞ che descrive l’e-
quilibrio. Si dimostra che se il sistema e mixing allora le distribuzioni convergono
alla distibuzione microcanonica .
Tuttavia la Teoria ergodica risolve solo in modo parziale il problema della
convergenza all’equilibrio in quanto non spiega, e non tenta di spiegare, la comparsa
delle distribuzioni che quindi devono essere assunte “a priori”. Inoltre e una teoria
valida solamente per sistemi finiti che perde di significato nel limite per sistemi
infiniti (come verra discusso nel Paragrafo 3.2.2).
Per la rilevanza che queste nozioni hanno nel contesto della Meccanica Statistica
ed in particolare in quello della convergenza all’equilibrio nel seguito si espongono
i risultati piu significativi della Teoria ergodica mentre si rimanda al Paragrafo A.2
per le dimostrazioni delle varie affermazioni. In ogni caso i testi [Jan63], [Hal56] e
[AA67] costituiscono degli ottimi ed esaurienti riferimenti.
3.1.1 I sistemi dinamici classici
Per trattare in modo preciso i problemi ergodici e necessario definire l’oggetto di
interesse della teoria; tale definizione deve contenere anche i sistemi Hamiltoniani
autonomi. Tuttavia non tutte le proprieta dei sistemi Hamiltoniani risultano ugual-
mente. Partendo dalla Definizione 3.1.1 ed eliminandone il contenuto geometrico
si definiscono delle strutture molto generali, dette sistemi dinamici classici ,
che rappresentano l’oggetto di interesse della “moderna” Teoria ergodica
42
3.1.2 Definizione (sistema dinamico classico). Si chiama sistema dina-
mico classico la struttura definita da Γ ≡ X , M , µ,T, Ψ con X un insieme
non vuoto, M una σ-algebra di sottoinsiemi di X , µ una misura di probabilita sulla
σ-algebra M , T ∈ Z,R e Ψ una rappresentazione del gruppo T sull’insieme
delle trasformazioni invertibili e misurabili di X in se che conservano la misura µ.
Indicheremo con Autµ(X ) l’insieme di tali trasformazioni e diremo che la mappa
T 3 tΨ−→ Ψt ∈ Autµ(X )
e una dinamica misurabile (invertibile) su X . Se T = Z diremo che il
sistema dinamico e discreto, invece se T = R diremo che il sistema dinamico e
continuo.
Gli elementi introdotti nella precedente definizione hanno una loro gerarchia di
significato che discuteremo brevemente.
Apparato statistico
Gli elementi intrinseci sono l’ insieme X che si interpreta come la collezione di tutti
i possibili stati che il sistema puo assumere, e che quindi continueremo a chiamare
X spazio delle fasi , e la σ-algebra M che si interpreta come la collezione delle
situazioni suscettibili di una misurazione fisica . E evidente che questi due
aspetti dipendono esclusivamente dalle caratteristiche fisiche del sistema in esame.
La scelta della misura µ e invece un fatto arbitrario e dipende dal tipo di statistica
che l’osservatore vuole utilizzare. Affermare che un sistema puo essere descritto
dagli elementi X , M e µ equivale ad affermare che il sistema e suscettibile di una
descrizione probabilistica (possibilita di definire X ,M ) e che su di esso e stata
fissata una particolare regola per le probabilita (scelta della misura µ).
Tempo e dinamica
Il termine “sistema dinamico” identifica un sistema fisico capace di subire delle
trasformazioni nel tempo e la parola “dinamica” indica la collezione Ψtt∈T delle
trasformazioni che esso puo subire, essendo T una parametrizzazione del tempo
(continua o discreta). L’insieme T ha la struttura di gruppo additivo (l’operazione
di composizione e “+”) abeliano di cui la dinamica Ψtt∈T costituisce una rap-
presentazione in termini delle trasformazioni invertibili che mandano X in se,
ovvero:
i) Ψ0 = Id con Id trasformazione identica X ;
43
ii) Ψt1 Ψt2 = Ψt1+t2 per ogni t1, t2 ∈ T;
iii) se t ∈ T e se −t e il suo inverso allora Ψ−t = Ψ−1t .
La iii) si puo derivare dalle proprieta i) e ii), inoltre la validita della iii) im-
plica necessariamente l’invertibilita delle trasformazioni Ψt. Nella definizione di
sistema dinamico classico si include anche la possibilita di considerare T = Z.
Sebbene il “tempo fisico” sembri non avere nessun aspetto discreto, questa idealiz-
zazione si puo interpretare come un limite sperimentale sulla capacita di effettuare
osservazioni.
Le differenze tra i sistemi con dinamica continua e quelli con dinamica discreta
derivano solamente dalle diverse proprieta topologiche degli insiemi R e Z.
Su R e definita in modo naturale la topologia euclidea (la topologia metrica
indotta dal valore assoluto) rispetto alla quale R risulta un gruppo additivo ed
abeliano localmente compatto e completo. Inoltre su R e definita un’unica misura
di Haar1 regolare che coincide con la misura di Lebesgue e che indicheremo con il
simbolo dt.
La topologia naturale definita sull’insieme Z e la topologia discreta (la
topologia ottenuta considerando aperti tutti i sottoinsiemi di Z) rispetto alla quale
Z risulta un gruppo additivo ed abeliano localmente compatto. Anche su Z e
definita un’unica misura regolare di Haar che coincide con la misura discreta (la
misura che conta i punti) e che continueremo ad indicare con dt.
La maggior parte dei risultati che seguono non dipendono dal fatto che la
dinamica adottata sia continua o discreta e per tale motivo cercheremo di utilizzare
un’unica notazione capace di sintetizzare entrambe le situazioni. A tale scopo
osserviamo che nel caso di dinamica discreta se T e un sottoinsieme di T = Z e se
dt e la misura che conta i punti allora∫
T
f(t) dt =∑t∈T
f(t)
per ogni funzione f : T→ C.
Evoluzione dinamica e probabilita
La possibilita di descrivere il comportamento di un sistema in termini di una proba-
bilita deve essere indipendente dal fatto che il sistema e soggetto ad un’evoluzione
1Per maggiori dettagli sui gruppi topologici e sulle misure di Haar si rimanda al Paragrafo
B.6.1.
44
temporale. Cio comporta che la struttura puramente probabilistica X ,M , µ e
quella puramente dinamica X ,T, Ψ devono essere compatibili tra loro. Dire che
per ogni t ∈ T la trasformazione invertibile Ψt : X → X e misurabile signifi-
ca che per ogni M ∈ M anche l’insieme Ψt−1(M) appartiene a M . Poiche le
trasformazioni Ψt sono invertibili per ogni t ∈ T segue che la dinamica Ψtt∈T e
misurabile se verifica la seguente proprieta
Ψt(M) ∈ M ∀ M ∈ M , ∀ t ∈ T.
Dire che la trasformazione Ψt : X → X conserva la misura µ significa che la
preimmagine2 secondo Ψt di ogni insieme misurabile di M ha la stessa misura
dell’insieme misurabile di partenza. Dato che la preimmagine di una funzione
invertibile coincide con l’immagine della funzione inversa segue che l’immagine
secondo Ψ−t di ogni insieme misurabile M ha la stessa misura di M . Poiche cio
deve valere per ogni t ∈ T segue che la dinamica misurabile Ψtt∈T conserva la
misura se
µ(Ψt(M)) = µ(M) ∀ M ∈ M , ∀ t ∈ T.
Indichiamo con il simbolo M(X ) l’insieme delle funzioni misurabili , ovvero
l’insieme delle funzioni f : X → C tali che la preimmagine −1f(A) di ogni bore-
liano A ⊆ C e ancora un elemento di M . Ogni automorfismo Ψt opera una
trasformazione dell’insieme M(X ) in se infatti ad ogni funzione misurabile f si
puo associare una nuova funzione Ut(f) definita in modo puntuale dalla relazione
Ut(f)(x) ≡ f(Ψt(x)) ∀ x ∈ X . (3.1)
Per verificare che Ut(f) e misurabile osserviamo che se A ⊆ C e un sottoinsieme
boreliano allora −1Ut(f)(A) ≡ x | x ∈ X , f(Ψt(x)) ∈ A da cui, osservando
che x = Ψt(Ψ−t(x)), segue l’uguaglianza −1Ut(f)(A) = Ψ−t(−1f(A)). Dato che
l’insieme −1f(A) e misurabile (f per ipotesi e misurabile) e che Ψ−t(−1f(A)) e
misurabile (la dinamica Ψ e misurabile) segue che Ut(f) ∈ M(X ). Quindi ad ogni
automorfismo Ψt e associata una trasformazione Ut : M(X ) → M(X ) definita dalla
2Sia f : X1 → X2 una funzione tra due insiemi X1 e X2. Se A ⊆ X2 e un generico sottoinsieme
chiameremo preimmagine di A secondo f il sottoinsieme di X1 definito da
−1f(A) ≡ x | x ∈ X1, f(x) ∈ A.
La definizione di preimmagine ha senso anche per funzioni non invertibili e nel caso in cui f sia
invertibile allora −1f(A) = f−1(A) per ogni A ⊆ X2.
45
(3.1). L’insieme M(X ) possiede una struttura di algebra3 che e preservata dalle
trasformazioni Ut come si verifica con un calcolo esplicito.
Nel seguito indicheremo con L1[X , µ] ⊂ M(X ) l’insieme delle funzioni inte-
grabili sullo spazio X rispetto alla misura µ, ovvero di tutte le funzioni f ∈ M(X )
tali che
‖f‖L1 ≡
∫
X|f(x)| dµ(x) < +∞. (3.2)
Indicheremo, invece, con L2[X , µ] ⊂ M(X ) l’insieme delle funzioni a quadrato-
sommabili su X rispetto alla misura µ, ovvero di tutte le funzioni f ∈ M(X ) tali
che
‖f‖L2 ≡
∫
X|f(x)|2 dµ(x) < +∞. (3.3)
Sia L1[X , µ] che L2[X , µ] sono spazi vettoriali normati e completi (spazi di Banach)
con norme definite rispettivamente dalla (3.2) e (3.3). In particolare L2[X , µ] e
anche uno spazio di Hilbert con il prodotto scalare definito da
(f ; g)L2 ≡
∫
Xf(x)g(x) dµ(x). (3.4)
Quando la misura µ e finita, ossia µ(X ) < +∞ (in particolare per un sistema
dinamico classico µ(X ) = 1), la funzione costante 1(x) = 1 appartiene a L2[X , µ]
e quindi per ogni f ∈ L2[X , µ] si ottiene che (1; f)L2 =
∫X f(x) dµ(x) < +∞.
Questa condizione implica che f e integrabile e cio prova le seguenti inclusioni
L2[X , µ] ⊂ L1[X , µ] ⊂ M(X ).
Dato un sistema dinamico classico Γ ≡ X , M , µ,T, Ψ si dimostrano i seguenti
fatti:
SDC.1) per ogni t ∈ T la mappa Ut : f → Ut(f) definita dalla (3.1) e un’isometria
invertibile di L1[X , µ] in se ed in particolare
∫
Xf(Ψt(x)) dµ(x) =
∫
XUt(f)(x) dµ(x) =
∫
Xf(x) dµ(x) ∀ f ∈ L1[X , µ]
(Proposizione A.2.1 e Corollario A.2.2);
SDC.2) per ogni t ∈ T la mappa Ut : f → Ut(f) definita dalla (3.1) e un operatore
unitario sullo spazio di Hilbert L2[X , µ] e la collezione degli operatori Ut
al variare di t ∈ T fornisce una rappresentazione unitaria del gruppo T
(Teorema A.3.1). Nel caso di dinamica continua, se si assume che la dinamica
3C.f.r. [Rud74] Teoremi 1.8 e 1.9.
46
sia sufficientemente regolare per cui le funzioni F (x, t) ≡ f(Ψt(x)) siano mi-
surabili nello spazio di misura prodotto X ×T, segue che la rappresentazione
unitaria U(T) e anche fortemente continua (Paragrafo A.3.1).
Il contenuto del punto SDC.2), noto come Teorema di Koopman , e partico-
larmente interessante in quanto consente di riesprimere i contenuti della Teo-
ria ergodica, generalmente formulati in termini di spazi di misura, in una veste
puramente geometrica in cui le proprieta della dinamica si traducono in oppor-
tune proprieta spettrali di operatori unitari su spazi di Hilbert. Infatti il Teo-
rema di Koopman permette di associare ad ogni sistema dinamico classico Γ ≡X ,M , µ,T, Ψ una nuova struttura matematica, che indicheremo simbolicamente
con ∆Γ ≡ L2[X , µ],T, U(T), costituito dallo spazio di Hilbert L2[X , µ] e dalla
rappresentazione unitaria U(T) del gruppo T indotta dagli operatori Ut che nel ca-
so continuo, sotto ipotesi molto ragionevoli, e anche fortemente continua. Poiche la
misura µ e di probabilita, e quindi finita, lo spazio L2[X , µ] contiene anche le fun-
zioni costanti che sono funzioni invarianti sotto l’azione della dinamica Ut. Questo
significa che esiste sempre in L2[X , µ] un sottospazio non banale costituito dalle
funzioni invarianti sotto l’evoluzione temporale. Indicheremo con P il proiettore
su questo sottospazio.
Tuttavia la descrizione “Koopman” dei sistemi dinamici classici non e equiva-
lente alla descrizione fatta in termini della misura invariante sullo spazio delle fasi
ma, in un certo senso, risulta parziale. Come conseguenza di un noto risultato
dovuto a Kolmogorov4 segue che sistemi dinamici classici non isomorfi possono
essere dello stesso tipo spettrale e quindi avere una stessa descrizione in termi-
ni Hilbertiani. Ad esempio i sistemi di Bernouilli (Paragrafo 3.2.1) pur essendo
generalmente non isomorfi (possono avere entropie distinte) hanno tutti identiche
caratteristiche spettrali.
Indipendentemente dal contesto dei sistemi dinamici classici si possono studi-
are “in astratto” dei sistemi definiti da uno spazio di Hilbert H su cui agisce una
rappresentazione unitaria U(T) del gruppo T (che nel caso T = R e fortemente
continua) e da un proiettore non banale P tale che [P ; Ut] = 0 per ogni t ∈ T.
Strutture di questo tipo sono chiamate sistemi dinamici Hilbertiani (Para-
grafo A.3.1) e, come vedremo nel Capitolo 7, hanno un’applicazione rilevante nel
contesto dei sistemi dinamici topologici.
4C.f.r. [AA67] Paragrafo 12, Teorema 12.26 e relative conseguenze.
47
3.1.2 Il Teorema di ricorrenza
Uno degli aspetti piu caratteristici dell’evoluzione dinamica dei sistemi dinamici
classici e la proprieta di ricorrenza delle traiettorie (Teorema di Poincare).
Questa proprieta si estende ai sistemi Hamiltoniani autonomi, che sono particolari
sistemi dinamici classici, e rappresenta il maggiore ostacolo per una formulazione
dinamica della convergenza all’equilibrio. Dato l’importante ruolo logico che la
ricorrenza ha nel contesto di questo lavoro riportiamo di seguito la dimostrazione
del Teorema di Poincare per la quale e necessario premettere la seguente:
3.1.3 Definizione. Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico misurabile ed
indichiamo con M un sottoinsieme misurabile di X . Diremo che il punto x ∈ Mesce definitivamente nel futuro da M se esiste un tempo t0 = t0(M, x) > 0
con t0 < +∞ tale che Ψt(x) /∈M per ogni t > t0. Chiameremo t0 tempo futuro
di uscita di x da M. Indicheremo con il simbolo M(+) il sottoinsieme di M
costituito dai punti che escono definitivamente nel futuro e con T(+) = T(+)(M) il
limite superiore dei tempi futuri di uscita dei singoli punti di M(+). Evidentemente
T(+) < +∞ dato che i tempi futuri di uscita sono finiti. Analogamente diremo che
il punto x ∈ M esce definitivamente nel passato da M se esiste un tempo
t0 = t0(M, x) < 0 con t0 > −∞ tale che Ψt(x) /∈M per ogni t < t0. Chiameremo
t0 tempo passato di uscita di x da M. Indicheremo con il simbolo M(−) il
sottoinsieme di M costituito dai punti che escono definitivamente nel passato e
con T(−) = T(−)(M) il limite inferiore dei tempi passati di uscita dei singoli punti
di M(−). Evidentemente T(−) > −∞ dato che i tempi passati di uscita sono finiti.
La definizione degli insiemi M(+) e M
(−) e necessaria se si vuole distinguere il
comportamento delle diverse traiettorie che partendo da M evolvono nel futuro o
nel passato. Se x ∈M(+) allora la traiettoria positiva ϕ
(+)x (t) ≡ Ψt(x), per ogni
t ∈ [0, +∞), giacera definitivamente fuori da M mentre se x ∈ M \M(+) allora
ϕ(+)x (t) o sara definitivamente contenuta nell’insieme M, oppure uscira e rientrera
in M infinite volte nel futuro. Considerazioni analoghe valgono per il sottoinsieme
M(−) e per la traiettoria negativa ϕ
(−)x (t) ≡ Ψt(x).
3.1.1 Lemma. Sia Γ ≡ X , M , µ,T, Ψ un sistema dinamico misurabile. Per
ogni sottoinsieme M ∈ M i sottoinsiemi M(±) di tutti i punti che escono defini-
tivamente nel futuro o nel passato da M hanno misura nulla5.
5Consideriamo uno spazio con misura X , M , µ. In generale un sottoinsieme di un insieme
misurabile non e necessariamente un sottoinsieme misurabile e questo vale anche per i sottoinsiemi
48
zDim.
Dato il sottoinsieme misurabile M proviamo che i sottoinsiemi M(+) e M
(−) sono trascurabili
e pertanto di misura nulla. L’insieme Ψt−1(X \M) e costituito da tutti i punti x ∈ X tali che
Ψt(x) ∈ X \M e quindi l’insieme M∩ Ψt−1(X \M) e costituito da tutti i punti di M che al
tempo t si troveranno fuori da M. Questa considerazione permette di scrivere che
M(+) ⊆ F ≡M∩Ψt1
−1(X \M) ∩ . . . ∩Ψtn
−1(X \M) ∩ . . .
essendo T(+) < t1 < . . . < tn < . . . una successione crescente, numerabile ed illimitata (tn →+∞) di tempi maggiori del tempo futuro di uscita T(+) che contraddistingue l’insieme M
(+).
Analogamente possiamo scrivere che
M(−) ⊆ F ≡M∩Ψt1
−1(X \M) ∩ . . . ∩Ψtn
−1(X \M) ∩ . . .
dove questa volta < . . . < tn < . . . < t1 < T(−) una successione decrescente, numerabile ed
illimitata (tn → −∞) di tempi minori del tempo passato di uscita T(−) che contraddistingue
l’insiemeM(−). PoicheMmisurabile implica anche X\Mmisurabile e dato che le trasformazioni
Ψtn sono misurabili segue che l’insieme F e intersezione numerabile di sottoinsiemi misurabili
e quindi F ∈ M (in entrambi i casi). Poiche F ⊂ M per ogni x ∈ F segue che Ψtn(x) /∈ Fper nessun tempo tn della successione che definisce F . Quindi per ogni tempo tn accade che
Ψtn
−1(F)∩F = ∅. Fissiamo tn = nt0 per ogni n ∈ N (t0 > 0 nel caso in cui si consideri l’insieme
M(+) altrimenti t0 < 0 per l’insieme M
(−)). Con questa scelta, se tn > tm
Ψtn
−1(F) ∩Ψtm
−1(F) = Ψtm
−1(Ψtn−tm
−1(F) ∩ F) = Ψtm
−1(∅) = ∅
dato che tn − tm = (n − m)t0 e un tempo che appartiene alla successione. Poiche gli insiemi
Ψtn
−1(F) sono reciprocamente disgiunti se tn 6= tm e dato che la dinamica Ψ conserva la misura
segue che∑
n∈Nµ(F) =
∑
n∈Nµ(Ψtn
−1(F)) = µ
( ⋃
n∈NΨtn
−1(F)
)6 µ(X ) = 1
che implica µ(F) = 0. Questo prova che i sottoinsiemi M(±) sono sempre trascurabili. ¨
Dal lemma precedente segue che anche il sottoinsieme M(+) ∪M
(−) ha misura
nulla, inoltre l’insieme M \ (M(+) ∪ M
(−)) e caratterizzato dal fatto che ogni
traiettoria (positiva o negativa) che parte da un suo punto o restera per ogni tempo
inM oppure rivisitera infinite volte l’insiemeM. In teoria potrebbero esistere delle
traiettorie che partendo da M visitano punti esterni e poi tornano definitivamente
in M. Tuttavia queste traiettorie pur passando per X \ M a qualche istante
di misura nulla. Per questa ragione si conviene di chiamare trascurabili i sottoinsiemi di insiemi
di misura nulla. Uno spazio di misura si dice completo se ogni sottoinsieme trascurabile e anche
misurabile e quindi di misura nulla. E un fatto generale che ogni spazio con misura X , M , µammette un unico completamento X , M , µ ad uno spazio di misura completo (c.f.r. [Tes97]
Teorema 3.2.11) e pertanto, sottintendendo questa operazione “intrinseca”, converremo sempre
nel seguito di considerare sottoinsiemi di misura nulla anche tutti i sottoinsiemi trascurabili.
49
restano definitivamente fuori da questo insieme e quindi individuano in X \ Mun sottoinsieme di dati iniziali di misura nulla. Cio e sufficiente a provare che
l’insieme dei punti di M, le cui orbite escono solo per un intervallo di tempo
finito da M, costituisce un sottoinsieme di misura nulla. Questa considerazione
completa l’enunciato del Lemma 3.1.1 e permette di affermare che:
3.1.2 Teorema (di ricorrenza o di Poincare). Sia Γ ≡ X ,M , µ,T, Ψ un
sistema dinamico misurabile e sia M un sottoinsieme misurabile. A meno di un
sottoinsieme di dati iniziali eccezionali, di misura nulla, tutte le traiettorie
(sia passate che future) che partono da M, se ne escono, ritornano in M infinite
volte.
Questo risultato e particolarmente significativo quando viene riferito a spazi Xdotati di una topologia e muniti della σ-algebra di Borel. Una tipica situazione di
questo tipo e rappresentata dai sistemi hamiltoniani autonomi per i quali X = R`
essendo ` il numero dei gradi di liberta del sistema. In questi casi sono misurabili
tutti gli intorni sferici, arbitrariamente piccoli, e rispetto alla misura di Lebesgue
hanno misura non nulla. Comunque fissato un intorno sferico B ⊂ R`, piccolo
a piacere, quasi tutte le traiettorie che partono da B o restano sempre in B o
rivisiteranno B infinite volte. La possibilita di scegliere l’intorno B arbitrariamente
piccolo permette di affermare che nel caso dei sistemi hamiltoniani autonomi ogni
stato del sistema, salvo un trascurabile insieme di stati eccezionali, verra riprodotto
in modo arbitrariamente preciso infinite volte. Questo tipico comportamento dei
sistemi Hamiltoniani (e non solo) e definito ricorrenza .
Come emerge dalla dimostrazione del Lemma 3.1.1 la causa del comportamento
ricorrente delle traiettorie e l’esistenza di una misura finita non banale ed invariante
rispetto alla dinamica definita su X . Per sistemi di questo tipo non possono
esistere punti di attrazione ossia punti per cui Ψt(x) → x0 per ogni x ∈ X se
t → ±∞ (evidentemente questa nozione di convergenza necessita di una topologia
su X ) a meno che µ non coincida con la misura di Dirac δx0 con supporto su x0
(questo punto sara chiarito nel Paragrafo 3.3.3). Tuttavia in questo caso tutte le
traiettorie del sistema, tranne la traiettoria costante x0, sarebbero “eccezionali”.
La descrizione di un sistema dinamico di questo tipo e priva di significato se fatta
in termini della misura δx0 mentre puo divenire interessante se fatta in termini di
una topologia su X . Emerge la possibilita che gli spazi topologici, e non quelli
misurabili, con una qualche opportuna nozione di dinamica potrebbero definire
modelli senza ricorrenza e con punti attrattori che si interpreterebbero come stati
50
di equilibrio dinamico. Strutture matematiche di questo tipo, esistono e vengono
chiamate sistemi dinamici topologici .
3.1.3 Le medie temporali
Consideriamo un sistema dinamico misurabile Γ ≡ X ,M , µ,T, Ψ ed una gene-
rica funzione f : X → C. Fissato un intervallo temporale [t0, t0 + t1] ⊂ T ed un
punto x ∈ X consideriamo le espressioni
f1(t0, x) ≡ 1
t1
∫ t0+t1
t0
f(Ψt(x)) dt, (3.5)
f1(t0, x) ≡ 1
t1
t0+t1∑t=t0
f(Ψt(x)), (3.6)
valide rispettivamente nel caso di dinamica continua e di dinamica discreta.
Osserviamo che nel caso di una dinamica continua la (3.5) ha senso solo se
la funzione Fx(t) ≡ f(Ψt(x)) = Ut(f)(x) e misurabile rispetto alla σ-algebra di
Lebesgue di R. Per questa ragione si conviene di considerare funzioni f misurabili
sia rispetto alla variabile x che alla variabile dinamica t. Entrambe queste richieste
sono automaticamente soddisfatte se si considerano funzioni f per cui F (t, x) ≡Ut(f)(x), definite sullo spazio prodotto R×X , e misurabile rispetto alla σ-algebra
prodotto6.
Consideriamo una successione tnn∈N crescente ed illimitata che indicheremo
sinteticamente con tn → +∞. Si chiama media temporale della funzione f
l’espressione
f(t0, x) ≡ limtn→+∞
fn(t0, x) = limtn→+∞
1
tn
∫ t0+tn
t0
f(Ψt(x)) dt
nel caso continuo, oppure nel caso discreto
f(t0, x) ≡ limtn→+∞
fn(t0, x) = limtn→+∞
1
tn
t0+tn∑t=t0
f(Ψt(x)).
Segue che il problema dalla costruzione delle medie temporali si riduce ad un pro-
blema di convergenza alla Cesaro della successione numerica f(Ψtn(x))tn>t0 .
6Per maggiori dettagli sugli spazi di misura prodotto c.f.r. [Rud74] Capitolo 7 o [Hal50]
Capitolo VII oppure [Tes97] Capitolo 9. In particolare se X ×Y e uno spazio di misura prodotto
e se f = f(x, y) e una funzione misurabile rispetto alla σ-algebra prodotto MX × MY , allora
le proiezioni fy(x) ≡ f(x, y) e fx(y) ≡ f(x, y) sono funzioni misurabili rispettivamente sulle
σ-algebre MX e MY .
51
Questo problema ha due distinte soluzioni ognuna delle quali implica una diversa
nozione di convergenza.
MT.1) (Convergenza puntuale) Sia Γ ≡ X , M , µ,T, Ψ un sistema dinamico
classico ed f ∈ M (X ) una funzione misurabile, allora il limite
f(x) = limτ→+∞
1
2τ
∫ τ
τ
f(Ψt(x)) dt
esiste per quasi ogni7 punto x ∈ X e definisce una funzione f misurabile e
costante sulle traiettorie, ossia f(Ψt′(x)) = f(x) per ogni t′ ∈ T. Inoltre se
f ∈ L1[X , µ] allora anche f ∈ L1[X , µ].
MT.2) (Convergenza in norma) Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico
classico ed f ∈ L2[X , µ], allora il limite
f(x) = limτ→+∞
1
2τ
∫ τ
τ
f(Ψt(x)) dt
esiste nel senso della norma ‖ ‖L2 e converge alla funzione P (f) avendo indi-
cato con P il proiettore sul sottospazio di L2[X , µ] costituito dalle funzioni
invarianti rispetto alla dinamica.
Il punto MT.1) riassume il contenuto del Teorema di Birkhoff-Khinchin8
commentato nel Paragrafo A.2.2.
Il punto MT.2) costituisce il contenuto del Teorema ergodico di von Neu-
mann la cui applicazione nel contesto dei sistemi dinamici classici e discussa nel
Paragrafo A.3.2 (mentre la dimostrazione nella sua veste piu generale e discussa
nel Paragrafo B.6.3). Utilizzando il linguaggio geometrico della teoria degli spazi
di Hilbert il punto MT.2) si puo rienunciare affermando che la media temporale
degli operatori unitari Ut converge fortemente su L2[X , µ] al proiettore P , ossia
s-limτ→+∞
1
2τ
∫ +τ
−τ
Ut dt = P
7Dato uno spazio di misura X , M , µ diremo che un’affermazione P e vera quasi ovunque
o equivalentemente su quasi ogni punto (abbreviato q.o.), se l’insieme degli F ⊂ X costituito
dai punti x tali che “P (x) = e falso” ha misura nulla, ovvero µ(F) = 0.8Probabilmente questo risultato ottenuto da Birkhoff nel 1931 puo essere considerato come
l’“atto di nascita” della moderna Teoria ergodica. Il risultato principale del Teorema di Birkhoff e
quello di provare che le medie temporali delle funzioni di fase esistono (nel senso della convergenza
puntuale) e che quindi sono quantita che possono essere studiate e sulle quali si possono fare
ipotesi. Questo punto delicato era stato precedentemente ignorato nei lavori di Boltzmann ed
Ehrenfest che avevano assunto come ovvia l’esistenza di tali quantita.
52
Sia il punto MT.1) (Teorema di Birkhoff) che il punto MT.2) (Teorema ergodico
di von Neumann) affermano l’esistenza delle medie temporali di funzioni misurabili
sullo spazio delle fasi X , ma i due enunciati utilizzano una nozione di esistenza
diversa. Il Teorema di Birkhoff assicura che le medie temporali esistono nel senso
della convergenza puntuale mentre il Teorema di von Neumann prova l’esistenza
delle medie temporali nel senso della convergenza in norma ‖ ‖L2 .
Sia in “senso Birkhoff” che in “senso von Neumann” il risultato di una media
temporale e una funzione che assume valori che si mantengono costanti lungo
quasi tutte le traiettorie. In altre parole le medie temporali sono costanti del
moto. Viceversa e anche vero che tutte le funzioni su X che sono costanti del
moto hanno media temporale (sia nel senso della convergenza puntuale che in
quello della convergenza in norma) che coincide con la funzione stessa. Da queste
considerazioni segue che:
3.1.3 Corollario. Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico classico. A
meno di un’uguaglianza quasi ovunque (t-dipendente) tutte e sole le costanti del
moto del sistema sono le medie temporali.
3.1.4 Ergodicita
La dimostrazione dell’uguaglianza delle medie temporali con le medie sullo spazio
delle fasi delle funzioni di fase necessita di un’ipotesi aggiuntiva sulla dinamica del
sistema.
3.1.4 Definizione (Sistema dinamico ergodico). Diremo che il sistema di-
namico classico Γ ≡ X ,M , µ,T, Ψ e ergodico se gli unici sottoinsieme misura-
bili M ⊆ M ed invarianti, ovvero tali che Ψt−1(M) = M per ogni t ∈ T, sono
banali rispetto alla misura µ, ovvero µ(M) = 0 oppure µ(X \M) = 0.
La condizione di ergodicita coincide con quella di indecomponibilita metrica
ed i sistemi ergodici vengono chiamati anche sistemi metricamente transitivi .
Se un sistema non e ergodico allora esiste un insieme misurabile M ed invariante
con µ(M) > 0 e µ(X \M) > 0. Cio implica che anche l’insieme N ≡ X \M e
misurabile, invariante e non banale e tutto X e ottenuto come unione disgiunta
dei due sottoinsiemi M e N . In questa situazione l’azione della dinamica Ψ su
X si riduce all’azione indipendente sui due sottoinsiemi M e N e per tale ra-
gione questi sistemi vengono detti decomponibili . La condizione di ergodicita
nega la possibilita che la dinamica possa preservare sottoinsiemi non banali i quali
53
si interpreterebbero come sottosistemi indipendenti ed, al contrario, impone alla
dinamica Ψ di “rimescolare” sufficientemente bene tutti i punti di X .
L’ergodicita ha delle importanti conseguenze sulla dinamica (Paragrafo A.2.3).
SDE) Sia Γ ≡ X , M , µ,T, Ψ un sistema dinamico classico. Le seguenti affer-
mazioni sono equivalenti:
i) il sistema e ergodico;
ii) se f e una funzione misurabile tale che f(Ψt(x)) = f(x) per ogni x ∈ Xe per ogni t ∈ T allora f e costante quasi ovunque rispetto alla misura
µ;
iii) per ogni f ∈ M(X ) la media temporale f e costante quasi ovunque su
X rispetto alla misura µ ed inoltre se f ∈ L1[X , µ] allora 〈f〉 = f quasi
ovunque su X rispetto alla misura µ;
iv) per ogni coppia di sottoinsiemi misurabili M,N ∈ M vale che
limτ→+∞
1
2τ
∫ +τ
−τ
µ(Ψt−1(M) ∩N ) dt = µ(M)µ(N ).
La proprieta di indecomponibilita metrica risolve il problema ergodico di Boltz-
mann sull’uguaglianza delle medie temporali e delle medie spaziali delle funzioni
di fase. Tuttavia verificare che i sistemi fisicamente interessanti sono metricamente
transitivi e estremamente complicato e allo stato attuale della ricerca poco e an-
cora noto a riguardo. Oltre al risultato conseguito da Sinai riguardo al gas di sfere
rigide, di cui gia si e detto, e doveroso ricordare anche il lavoro di Oxtoby e Ulam
nel quale viene stabilita l’indecomponibilita metrica di una classe molto generale di
sistemi dinamici su varieta9 che tuttavia sono molto diversi da quelli tipicamente
ottenuti da modelli meccanici.
Dal precedente punto iv), ponendo N = X , segue che per un sistema ergodico
vale la seguente proprieta
limτ→+∞
1
2τ
∫ +τ
−τ
χM(Ψt(x)) dt = µ(M) ∀ M ∈ M . (3.7)
Il primo membro di questa equazione (la media temporale di χM) si interpreta
come il tempo medio di soggiorno del punto x (nel senso della sua traiettoria)
nell’insieme M. La prima osservazione che discende dalla (3.7) e che se µ(M) > 0
allora quasi tutti i punti di X devono ricorrere indefinitamente in M e questo e
9C.f.r. [OU41].
54
una notevole aggiunta al Teorema di ricorrenza. Dalla (3.7) segue immediatamente
che in un sistema dinamico ergodico la misura degli insiemi misurabili M ∈ M e
fissata dal tempo medio di soggiorno di quasi tutte le traiettorie. Quindi se sullo
spazio di misura X ,M esistessero due misure ergodiche, ossia due misure che
verificano l’indecomponibilita metrica rispetto alla stessa dinamica Ψ, e se queste
misure avessero anche gli stessi insiemi di misura nulla (misure assolutamente
continue) allora in virtu della (3.7) esse dovrebbero coincidere.
3.1.4 Proposizione. Se Γ ≡ X , M , µ,T, Ψ e un sistema dinamico ergodico
allora non esistono altre misure invarianti assolutamente continue rispetto a µ.
Infine osserviamo che il punto ii) afferma che in un sistema dinamico ergodico
Γ ≡ X ,M , µ,T, Ψ tutte le funzioni misurabili che sono invarianti rispetto alla
dinamica sono costanti (quasi ovunque). In termini Hilbertiani cio si traduce
affermando che se f ∈ L2[X , µ] e se Ut(f) = f per ogni t ∈ T allora f e costante,
ossia il sottospazio delle funzioni invarianti deve essere unidimensionale e deve
essere generato dalla funzione costante 1(x) = 1. Indichiamo con P1 il proiettore
sul sottospazio Span(1) ⊂ L2[X , µ] ed osserviamo che
P1(f) = (1; f)L21 =
∫
Xf(x) dµ(x) = 〈f〉.
Allora come conseguenza del Teorema ergodico di von Neumann segue che per ogni
f ∈ L 2[X , µ]
f = limτ→+∞
1
2τ
∫ +τ
−τ
Ut(f) dt =
∫
Xf(x) dµ(x) = 〈f〉
con la convergenza intesa rispetto alla norma ‖ ‖L2 . Quindi per sistemi dinamici
ergodici le medie temporali delle funzioni f ∈ L2[X , µ] si costruiscono semplice-
mente proiettandole sul sottospazio delle funzioni costanti. E opportuno con-
frontare il punto iii) di SDE) con il risultato appena ottenuto. Entrambi affermano
l’uguaglianza delle medie temporali e delle medie spaziali ma mentre nel primo ca-
so l’uguaglianza e nel senso della nozione di convergenza puntuale quasi ovunque
nel secondo caso invece l’uguaglianza e intesa nel senso della convergenza in norma
‖ ‖L2 .
3.1.5 Mixing
Esiste una nozione dinamica piu forte della nozione di indecomponibilita metrica
e che pertanto implica un comportamento ancora “piu irregolare” in un senso che
55
verra chiarito nel seguito. Questa nuova proprieta e nota con il nome di mixing
forte o mixing di Hopf o piu brevemente mixing .
3.1.5 Definizione (Sistema dinamico mixing). Diremo che il sistema dinam-
ico classico Γ ≡ X ,M , µ,T, Ψ e mixing se per ogni coppia di sottoinsiemi
misurabili M,N ⊆ M accade che
limτ→±∞
µ(M∩Ψτ−1(N )) = µ(M)µ(N ) (3.8)
intendendo con τ → ±∞ una qualsiasi successione di tempi illimitata nel futuro o
rispettivamente nel passato.
Osserviamo che come conseguenza dell’invertibilita della dinamica e dell’inva-
rianza della misura la condizione di mixing per τ → +∞ implica quella per τ →−∞ e viceversa, infatti
µ(M∩Ψt−1(N )) = µ(Ψt
−1(Ψt(M) ∩N )) = µ(Ψt(M) ∩N ) = µ(N ∩Ψ−t−1(M))
e pertanto
limτ→∓∞
µ(N ∩Ψt−1(M)) = lim
τ→±∞µ(M∩Ψt
−1(N )) = µ(M)µ(N ).
Per verificare che la proprieta di mixing e piu forte della richiesta di ergodicita
supponiamo che M sia un sottoinsieme misurabile ed invariante ed osserviamo
che se e verificata la (3.8) allora
µ(M) = limτ→±∞
µ(M∩Ψτ−1(M)) = µ(M)µ(M)
da cui o µ(M) = 0 oppure µ(M) = 1 ⇒ µ(X \ M) = 0. Quindi, in base alla
definizione 3.1.4, cio verifica che
mixing ⇒ ergodicita.
La proprieta di mixing si caratterizza bene in termini delle funzioni L2[X , µ] e
delle proprieta spettrali degli operatori Ut che implementano la dinamica.
SDM.1) Il sistema dinamico misurabile Γ ≡ X ,M , µ,T, Ψ e mixing se e solo se per
ogni coppia di funzioni f, g ∈ L2[X , µ] accade che
limτ→±∞
(f ; Uτg)L2 = (f ; 1)
L2 (1; g)L2 (3.9)
(indipendentemente dalla scelta della successione τnn∈N), ovvero se e sole
se la successione degli operatori Uτ converge in senso debole al proiettore P1
sul sottospazio unidimensionale delle funzioni costanti
w-limτ→±∞
Uτ = P1
(Proposizione A.3.5).
56
SDM.2) Condizione sufficiente affinche il sistema dinamico Γ ≡ X ,M , µ,T, Ψ sia
mixing e che per ogni t ∈ T gli operatori unitari Ut abbiano spettro di
Lebesgue se ristretti al sottospazio di L2[X , µ] ortogonale alle funzioni costan-
ti. Se la dinamica e discreta (T = Z) e sufficiente che tale condizione sia
verificata da U1 ≡ U (Teorema A.3.6).
Sia ρ ∈ L2[X , µ] una funzione positiva tale che∫X ρ(x) dµ(x) = 1, ossia una
densita . Se il sistema e mixing in base alla (3.9) si verifica che per ogni f ∈L2[X , µ]
limτ→±∞
∫
Xf(x)ρτ (x) dµ(x) = lim
τ→±∞
∫
Xf(x)ρ(Ψτ (x)) dµ(x) =
∫
Xf(x) dµ(x).
Utilizzando il fatto che L2[X , µ] e denso in L1[X , µ] (tutte le funzioni caratteristiche
e quindi tutte le funzioni semplici sono in L2[X , µ]) la precedente relazione si
generalizza ad una densita ρ ∈ L1[X , µ] ed afferma che
limτ→±∞
∫
Xf(x)ρτ (x) dµ(x) =
∫
Xf(x) dµ(x) ∀ f ∈ L1[X , µ],
ossia che ρtw−→ 1 se t → ±∞. Questo fatto riproduce il risultato “alla Mackey”
(C.f.r. [Mac92]), ossia che nell’ipotesi di dinamica mixing le distribuzioni, che
descrivono gli stati di non equilibrio, evolvono nel tempo convergendo (in un senso
debole) alla densita stazionaria 1, ossia alla distribuzione microcanonica .
3.2 Limiti della Teoria ergodica
La statistica di un sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e assegnata dal-
la misura invariante µ. Fissata la misura invariante µ la Teoria ergodica permette
di fare affermazioni riguardo all’evoluzione del sistema; tuttavia le affermazioni
non hanno carattere assoluto ma sono dipendenti dalla misura µ. Quindi nella
teoria dei sistemi dinamici classici e insito un elemento di arbitrarieta che dipende
dal fatto che una misura invariante deve essere assegnata “a priori”. Tuttavia
questa critica non sarebbe rilevante se i sistemi dinamici ammettessero in generale
un’unica misura invariante e quindi diventa rilevante indagare questo aspetto. Un
esempio esplicito (di valenza sufficientemente generale) mostra che i sistemi di-
namici possono avere infinite misure invarianti non continue le une rispetto alle
altre e quindi esiste effettivamente un problema di “scelta” dell’interpretazione
probabilistica. Generalmente questo ostacolo si aggira affermando che esiste una
misura invariante “naturale”, che nel caso dei sistemi Hamiltoniani e la misura di
57
Liouville, e che ad ogni tempo la statistica del sistema deve essere descritta da
una misura che e assolutamente continua rispetto alla “misura naturale”. Que-
sta soluzione, che pure potrebbe essere ragionevole per i sistemi finiti, non si puo
applicare ai sistemi infiniti, in cui da origine ad affermazioni paradossali.
Pertanto emerge che la teoria dei sistemi dinamici classici non appare idonea
alla descrizione dei sistemi infiniti in quanto e subordinata ad una scelta arbitraria
e non naturale di una statistica piuttosto che di un’altra. Per superare queste
difficolta si cerchera di scindere la descrizione dinamica dalla descrizione statisti-
ca, che sara introdotta “a posteriori” (in termini di sottosistemi). La dinamica
topologica , discussa nel Paragrafo 3.3, consente di studiare l’evoluzione tempo-
rale dei sistemi indipendentemente dalla definizione di una misura e costituisce la
premessa generale alla trattazione dei sistemi infiniti del Capitolo 6.
3.2.1 Non unicita della misura invariante
Nel Paragrafo 3.1.4 (Proposizione 3.1.4) abbiamo mostrato che se un sistema di-
namico classico Γ ≡ X ,M , µ,T, Ψ e ergodico allora (a meno di una normaliz-
zazione) non esistono altre misure invarianti uniformemente continue rispetto alla
misura µ. Tuttavia l’unicita garantita dall’ergodicita e solo relativa e non esclude
l’esistenza di altre misure invarianti non uniformemente continue rispetto a µ. Il
problema dell’unicita (o meno) della misura invariante e importante per le que-
stioni che riguardano la Meccanica Statistica in quanto rappresenta il problema
dell’unicita (o meno) dell’interpretazione probabilistica della teoria. In questa ot-
tica e rilevante chiedersi se in generale i sistemi dinamici classici hanno molteplici
misure invarianti. La risposta e generalmente affermativa. Nel seguito discuteremo
i sistemi di Bernouilli che sono esempi di sistemi dinamici classici che ammet-
tono infinite (non numerabili) misure invarianti. Inoltre, dato che queste misure
risultano tutte ergodiche (in particolare mixing), esse sono anche non uniforme-
mente continue le une rispetto alle altre. Sebbene i sistemi di Bernouilli possano
apparire esempi eccessivamente astratti e particolari in realta descrivono sistemi
dinamici abbastanza generali come ad esempio il sistema definito dalla trasfor-
mazione del panettiere sul quadrato unitario diR2. Inoltre la maggior parte dei
sistemi dinamici Hamiltoniani di cui sono note le proprieta ergodiche contengono
sottosistemi di tipo Bernouilli.
Alla luce del modello discusso in questo paragrafo, che evidenzia come in
generale le misure invarianti dei sistemi dinamici classici non sono uniche, ac-
58
quista rilievo la nozione di sistema unicamente ergodico che sara discussa nel
Paragrafo 3.3.4.
Sistema di Bernouilli
Il sistema di Bernouilli e la generalizzazione di uno schema elaborato da J.
Bernouilli per studiare la dinamica del comune gioco del lancio di una moneta.
Si tratta di un sistema dinamico classico discreto i cui elementi costituenti sono
discussi di seguito.
Lo spazio X . Indichiamo con Zn = 0, 1, . . . , n − 1 l’insieme dei primi n interi
positivi o nulli e consideriamo l’insieme
X ≡ Zn × . . .× Zn︸ ︷︷ ︸Z−volte
≡ ZZn
costruito come prodotto cartesiano di un’infinita numerabile di copie di Zn.
Gli elementi di X sono le serie bilatere infinite di elementi di Zn, ossia
il generico x ∈ X e un’espressione del tipo
x ≡ . . . , a−j, . . . , a−1, a0, a1, . . . , aj, . . ., ai ∈ Zn ∀ i ∈ Z.
La σ-algebra M . Indichiamo con il simbolo Mzi il sottoinsieme di X definito da
Mzi ≡ x ∈ X | ai = z, i ∈ Z, z ∈ Zn.
Quindi Mzi e l’insieme di tutte le successioni x ∈ X il cui i-esimo vale z.
Indichiamo con S ≡ Mzi i∈Z,z∈Zn la collezione di tutti i sottoinsiemi di
tipo Mzi e con M la σ-algebra generata da S (la piu piccola σ-algebra che
contiene tutta la collezione S ). La coppia X ; M cosı definita e uno spazio
misurabile. Osserviamo che per ogni i ∈ Z vale la relazione
n−1⋃z=0
Mzi = X
ed inoltre Mz1i ∩Mz2
i = ∅ se z1 6= z2. Quindi per ogni i ∈ Z l’insieme X e
unione disgiuta degli n sottoinsiemi M0i , . . . ,Mn−1
i .
La misura µ. Dotiamo gli elementi di Zn di masse positive o nulle che si som-
mano ad 1, ossia associamo all’elemento 0 di Zn il peso (valore positivo o
nullo) m0, all’elemento 1 il peso m1 e cosı via fino all’elemento n − 1 a cui
associamo peso mn−1 ricordando che alla fine deve valere la condizione di
59
normalizzazione∑n−1
z=0 mz = 1. Dotiamo di misura i sottoinsiemi Mzi che
generano la σ-algebra nel seguente modo
µ(Mzi ) = mz ∀ i ∈ Z.
Per definire la misura di tutti gli elementi di M introduciamo la misura
prodotto. Definiamo la misura di una intersezione (numerabile) di elementi
Mzi , con indici i distinti, come il prodotto delle singole misure degli Mz
i ,
ossia
µ(Mz1
i1∩ . . . ∩Mzk
ik
)= µ
(Mz1i1
). . . µ
(Mzkik
)= mz1 . . .mzk
.
Se invece per una coppia di indici j, h ∈ 1, . . . , k accade che ij = ih ma
zj 6= zh allora la precedente intersezione e vuota e la misura e nulla. Poiche
X =n−1⋃z=0
Mzi con Mz1
i ∩Mz2i = ∅ se z1 6= z2,
otteniamo per la σ-additivita che
µ(X ) = µ
(n−1⋃z=0
Mzi
)=
n−1∑z=0
µ(Mzi ) =
n−1∑z=0
mz = 1
ossia l’insieme X ha misura normalizzata.
La dinamica Ψ. Consideriamo un generico elemento x di X
x = . . . , a−j, . . . , a−1, a0, a1, . . . , aj, . . .
e definiamo la traslazione (shift) Ψ nel seguente modo
Ψ(x) = . . . , a′−j, . . . , a′−1, a
′0, a
′1, . . . , a
′j, . . . con a′j = aj−1 ∀ j ∈ Z.
La trasformazione Ψ e una biezione con inversa definita da
Ψ−1(x) = . . . , a′′−j, . . . , a′′−1, a
′′0, a
′′1, . . . , a
′′j , . . . con a′′j = aj+1 ∀ j ∈ Z,
infatti si verifica immediatamente che (Ψ Ψ−1)(x) = (Ψ−1 Ψ)(x) = x per
ogni x ∈ X . La trasformazione Ψ conserva la misura, infatti sui sottoinsiemi
Mzi che generano la σ-algebra essa agisce nel seguente modo
Ψ(Mzi ) = Ψ(x) ∈ X | ai = z = x ∈ X | ai+1 = z = Mz
i+1
e cio comporta che
µ(Ψ(Mzi )) = µ(Mz
i+1) = mz = µ(Mzi )
60
Inoltre, dato che la misura di tutti gli insiemi della σ-algebra e data da
opportuni prodotti delle misure dei sottoinsiemi Mzi , segue che Ψ e un
automorfismo che preserva la misura. Se introduciamo la notazione
Ψk ≡ Ψ . . . Ψ︸ ︷︷ ︸k−volte
, Ψ−k ≡ Ψ−1 . . . Ψ−1︸ ︷︷ ︸k−volte
, Ψ0 ≡ Id
segue che la collezione Ψkk∈Z e un gruppo discreto di automorfismi che
conservano la misura.
La collezione X ,M , µ,Z, Ψ e detta sistema di Bernouilli e verra indicata
con la notazione B(m0, . . . , mn−1). Il caso B(12, 1
2) corrisponde al gioco del lancio
della moneta. Gli elementi di X ≡ ZZ2 sono le successioni infinite bilatere di
valori 0 ≡ “faccia” e 1 ≡ “croce”. I sottoinsiemi M0i (o rispettivamente M1
i )
descrivono successioni di lanci in cui al tentativo i-esimo si ottiene il risultato
“faccia” (rispettivamente “croce”) e pertanto e naturale interpretare
µ(Mzi ) = Prob(Mz
i ) =1
2z = 0, 1
avendo inteso con Prob(Mzi ) la probabilita che si verifichi una delle successioni di
Mzi .
Vogliamo mostrare che tutti i sistemi di Bernouilli binari10 B(m0,m1) sono
mixing (e quindi ergodici) e questo segue se si verifica che la dinamica Ψ determina
delle mappe unitarie su L2[X , µ] con spettro di Lebesgue sul sottospazio ortogonale
alle funzioni costanti. Dato che m0 + m1 = 1 possiamo parametrizzare il sistema
con una sola variabile p ≡ m0 con 0 6 p 6 1 e m1 = 1− p per cui verra utilizzata
la notazione B(m0,m1) ≡ B(p, 1 − p). Lo spazio X e ottenuto come prodotto (Z
volte) dell’insieme Z2 = 0, 1 e su Z2 la misura µ si riduce alla misura discreta
µ(0) = p e µ(1) = 1− p. Lo spazio L2[Z2, µ] ha dimensione 2 ed e generato dalla
funzione costante 1(z) = 1 per ogni z = 0, 1 e dalla funzione (p 6= 0, 1)
y(z) =
−√
1− p√p
se z = 0
√p√
1− pse z = 1.
(3.10)
Le funzioni 1 e y costituiscono una base ortonormale per L(2)[Z2, µ]. La costruzione
si puo generalizzare anche quando p = 0, 1 ponendo y(0) = 1− p e y(1) = p.
10Il risultato e piu generale in quanto si dimostra che tutti i sistemi di Bernouilli
B(m0, . . . , mn−1) sono mixing.
61
Lo spazio L2[X , µ] si ottiene come prodotto degli spazi L2[Z2, µ] ed e generato
dalla base costituita dalla funzione costante 1(x) = 1 (per ogni successione bila-
tera x ∈ X ) e dai prodotti finiti y(n1) . . . y(nk) con ogni singola funzione y(nj) che
agisce sul nj-esimo sottospazio Z2 come prescritto dalla (3.10). In particolare le
funzioni y(n1) . . . y(nk) generano il sottospazio 1⊥ ⊂ L2[X , µ] costituito da tutte le
funzioni ortogonali alla funzione costante 1. Indichiamo con U l’operatore unitario
definito su L2[X , µ] dalla dinamica Ψ ed osserviamo come agisce sulle funzioni
y(n1) . . . y(nk). Sia x = . . . , a−j, . . . , a−1, a0, a1, . . . , aj, . . . un generico punto di
X , allora
[U(y(n1) . . . y(nk))](x) = (y(n1) . . . y(nk))(Ψ(x)) = y(a′n1) . . . y(a′nk
)
= y(an1−1) . . . y(ank−1) = (y(n1−1) . . . y(nk−1))(x).
L’orbita di ogni elemento y(n1) . . . y(nk) della base e definita da
U q(y(n1) . . . y(nk)) | q ∈ Z = (y(n1−q) . . . y(nk−q)) | q ∈ Z.
Cio mostra che esista un’infinita numerabile di orbite (l’insieme delle funzioni
prodotto y(n1) . . . y(nk) e numerabile) ed ogni orbita e in corrispondenza biunivoca
con Z; se y(n1) . . . y(nk) corrisponde a 0 allora y(n1−q) . . . y(nk−q) corrisponde a q ∈ Z.
Riassumendo in 1⊥ ⊂ L2[X , µ] e generato da una base ortonormale fi,q con i ∈ Ne q ∈ Z tale che
Ufi,q = fi,q+1 ∀ i ∈ N ∀ q ∈ Z. (3.11)
L’indice i ∈ N individua la particolare orbita mentre l’indice q ∈ Z identifica il
“tempo di percorrenza” dell’orbita. La relazione (3.11) implica che l’operatore U
ha spettro di Lebesgue sul sottospazio 1⊥ (Proposizione A.3.7) e cio e sufficiente
per affermare che il sistema di Bernouilli B(p, 1 − p) (indipendentemente da p) e
mixing (Proposizione A.3.6).
Indichiamo con µp,1−p la misura relativa al sistema di Bernouilli B(p, 1−p). Per
ogni valore 0 6 p 6 1 la misura µp,1−p e invariante ed inoltre abbiamo verificato che
tutte queste misure sono mixing e quindi ergodiche. Cio implica (Proposizione 3.1.4
che tutte le misure µp,1−p sono reciprocamente disgiunte. Quindi abbiamo verificato
che il sistema, costituito dalle successioni bilatere con dinamica indotta dallo shift,
ha infinite (non numerabili) misure invarianti non assolutamente continue le une
rispetto alle altre ed ergodiche.
62
Trasformazione del panettiere
Indichiamo con X ≡ T 2 il toro bidimensionale . Questo spazio si puo rappre-
sentare come l’insieme delle coppie (x, y) appartenenti al quadrato [0, 1)× [0, 1) del
piano cartesiano bidimensionale xy munito di una topologia per cui ogni intorno di
(0, 0) include i punti arbitrariamente vicini ai bordi esterni. Inoltre X e anche rap-
presentabile come la classe di equivalenza dei punti di R2 con l’equivalenza definita
da (x, y) ∼ (z, w) se e solo se x − z ∈ Z e y − w ∈ Z (relazione di equivalenza
modulo 1 ). Sul toro X definiamo la trasformazione
Θ (x, y) =
(2x,
y
2
)se 0 6 x <
1
2
(2x− 1,
y
2+
1
2
)se
1
26 x < 1.
(3.12)
La trasformazione Ψ e invertibile come si verifica esplicitamente tramite l’espres-
sione
Θ−1 (x, y) =
(x
2, 2y
)se 0 6 y <
1
2
(x
2+
1
2, 2y − 1
)se
1
26 y < 1
(3.13)
e quindi definisce un automorfismo di X che e chiamato trasformazione del
panettiere . Il nome deriva dal fatto che Θ agisce sul quadrato X prima tramite
un’affinita che duplica le lunghezze nella direzione x e dimezza quelle nella direzione
y, quindi divide il rettangolo ottenuto in due parti uguali che vengono incollate
per riottenere il quadrato di lato 1. Si verifica che Θ conserva l’area dei rettangoli
contenuti in X (basta verificare che preserva separatamente le aree dei rettangoli
che si trovano in 0 6 x <1
2e
1
26 x < 1) e cio implica che Θ conserva la misura
di Lebesgue dx dy. Quindi la collezione X , dx dy,Z, Θ definisce un sistema
dinamico classico discreto.
Isomorfismo tra B(p, 1− p) e la trasformazione del panetterie
Consideriamo la coppia ZZ2 , Ψ costituita dall’insieme delle successioni bilatere di
0 e 1 su cui agisce lo shift Ψ e la coppia T 2, Θ costituita dal toro bidimensionale
T 2 su cui agisce la trasformazione del panettiere Θ. Vogliamo mostrare che esiste
63
un isomorfismo φ che rende commutativo il seguente diagramma:
ZZ2Ψ−→ ZZ2
φ ↓↑φ−1 φ ↓↑φ−1
T 2 Θ−→ T 2
(3.14)
Sia a ≡ . . . , a−j, . . . , a−1, a0, a1, . . . , aj, . . . ∈ ZZ2 e definiamo φ(a) = (x, y)
tramite la relazione
x ≡+∞∑j=0
a−j
2j+1, y ≡
+∞∑j=1
aj
2j. (3.15)
I numeri x e y sono costruiti tramite la mappa φ mediante le rappresentazioni
binarie indotte rispettivamente dalla parte sinistra e dalla parte destra della suc-
cessione bilatera a. Inoltre, evidentemente x, y ∈ [0, 1]. Gli unici elementi di T 2
che sono ottenuti piu volte tramite la mappa φ sono quelli per cui x o/e y sono
frazioni diadiche11. Indichiamo con D ⊂ T 2 l’insieme di questi numeri e con
S ⊂ ZZ2 il sottoinsieme delle successioni bilatere che sono definitivamente costanti
a destra o a sinistra (o da entrambe le parti). La (3.15) definisce l’isomorfismo
ZZ2 \ Sφ−→ T 2 \ D.
Consideriamo il punto (x, y) ∈ T 2 \ D ottenuto tramite la mappa (3.15) ed
osserviamo che
φ−1(x, y) = . . . , a−j, . . . , a−1, a0, a1, . . . , aj, . . .,
Ψ φ−1(x, y) = . . . , a′−j, . . . , a′−1, a
′0, a
′1, . . . , a
′j, . . . con a′j = aj−1
φ Ψ φ−1(x, y) =
(+∞∑j=0
a′−j
2j+1,
+∞∑j=1
a′j2j
)=
(+∞∑j=1
a−j
2j,
+∞∑j=0
aj
2j+1
).
Confrontando l’ultima relazione con la (3.15) si deduce che
11Diremo che il numero x ∈ [0, 1) e una frazione diadica (rispetto alla sviluppo binario) se
x =q
2ncon q, n ∈ N tale che 1 6 q 6 2n − 1.
Solo i numeri di questo tipo ammettono due rappresentazione binarie individuate da due distinte
successioni ann∈N e bnn∈N di 0, 1N. Entrambe le rappresentazioni binarie di una frazione
diadica sono definitivamente costanti e distinte nel senso che esiste un k ∈ N tale per cui am = 0
e bm = 1 per ogni m > k. Ogni numero che non e diadico si rappresenta in modo unico in base
binaria. (C.f.r. [Tes97] Proposizione 0.3.3.)
64
φ Ψ φ−1(x, y) =
(2x,
y
2
)se a0 = 0
(2x− 1,
y
2+
1
2
)se a0 = 1
(3.16)
ed osservando che a0 implica 0 6 x < 1/2 e a0 = 1 implica 1/2 6 x < 1 segue che
φ Ψ φ−1 = Θ su T 2 \ D.
Tutto cio prova che il seguente diagramma e commutativo:
ZZ2 \ S Ψ−→ ZZ2 \ Sφ ↓↑φ−1 φ ↓↑φ−1
T 2 \ D Θ−→ T 2 \ DConsideriamo il sistema di Bernouilli B(p, 1 − p) ed indichiamo con µp,1−p la
relativa misura definita da µp,1−p(M0i ) = p e µp,1−p(M1
i ) = 1− p.
Osserviamo che le misure µ1,0 e µ0,1, corrispondenti ai valori p = 1 e p = 0,
sono degeneri; la misura µ1,0 e concentrata sulla serie bilatera costituita da soli 0
mentre µ0,1 e concentrata sulla serie bilatera costituita da soli 1. Entrambe queste
serie costanti sono contenute in S ed individuano tramite la mappa φ il medesimo
punto (0, 0) ∈ D. Quindi i due sistemi di Bernouilli B(1, 0) e B(0, 1) sono entrambi
equivalenti al sistema dinamico definito dalla trasformazione del panettiere Θ sul
toro T 2 rispetto alla misura invariante definita dalla delta di Dirac δ0 concentrata
in (0,0) (il punto (0,0) e stazionario rispetto alla trasformazione del panettiere).
Supponiamo ora p 6= 1, 0 e mostriamo che l’insieme S e di misura nulla rispetto
a µp,1−p. Consideriamo gli insiemi Mzi ≡ a ∈ ZZ2 | ai = z con i ∈ Z e z ∈
0, 1 che generano la σ-algebra misurabile di ZZ2 . Verifichiamo che l’intersezione⋂+∞i=k M0
i con k ∈ N (l’insieme delle successioni bilatere che sono costantemente 0
a destra dal k-esimo termine in poi) ha misura nulla rispetto a µp,1−p. Comunque
scelto un K ∈ N deve valere che
µp,1−p
(+∞⋂
i=k
M0i
)6 µp,1−p
(k+K⋂
i=k
M0i
)= pK+1
e l’arbitrarieta nella scelta di K, assieme al fatto che p < 1, implica la tesi. Con
la stessa tecnica si dimostra che anche gli insiemi del tipo⋂+∞
i=k M1i ,
⋂+∞i=k M0
−i e⋂+∞i=k M1
−i sono tutti di misura µp,1−p nulla. Definiamo i quattro insiemi S0,1± ≡⋃+∞
k=0
(⋂+∞i=k M0,1
±i
)ed osserviamo che per la subadditivita della misura µp,1−p
µp,1−p(S0,1± ) = µp,1−p
[+∞⋃
k=0
(+∞⋂
i=k
M0,1±i
)]6
+∞∑
k=0
µp,1−p
(+∞⋂
i=k
M0,1±i
)= 0.
65
Dato che S = S0−∪S0
+∪S1−∪S1
+ segue immediatamente che µp,1−p(S) = 0. Questa
relazione e importante poiche consente di definire senza ambiguita una misura
µp,1−p su T 2 definita sulla σ-algebra generata da φ(Mzi ) tramite la prescrizione
µp,1−p(φ(Mzi )) = µp,1−p(Mz
i ).
Rispetto a queste misure segue che µp,1−p(D) = µp,1−p(S) = 0 e quindi, relativa-
mente a tutte le considerazioni in cui intervengono le misure, il grafico commuta-
tivo (3.14) si puo ritenere verificato. Poiche µp,1−p e invariante rispetto allo shift
segue che µp,1−p e invariante rispetto alla trasformazione del panettiere. Inoltre
ogni sistema di Bernouilli B(p, 1 − p) e mixing e questa proprieta e preservata
dall’isomorfismo φ.
3.2.1 Proposizione. Il sistema dinamico T 2, µp,1−p,Z, Θ definito dalla trasfor-
mazione del panettiere Θ sul toro T 2 e mixing rispetto ad ogni misura invariante
µp,1−p.
Quindi la trasformazione Θ sullo spazio T 2 ammette un’infinita non numerabile
di distinte misure ergodiche non assolutamente continue l’una rispetto all’altra.
Esplicitamente
φ(Mzi ) ≡
(+∞∑j=0
a−j
2j+1,
+∞∑j=1
aj
2j
) ∣∣∣∣∣ ai = z
⊂ T 2.
Per capire che tipo di insieme e φ(Mzi ) consideriamo inizialmente il caso i > 0.
Osserviamo che i coefficienti a−j con j = 0, 1, . . . sono arbitrari e cio implica che
i punti di φ(Mzi ) hanno coordinata x che puo assumere tutti i valori in [0, 1).
Riscriviamo l’espressione di y come segue
y ≡ a1
2+
a2
22. . . +
ai−1
2i−1+
z
2i+
[+∞∑j=1
ai+j
2i+j
].
I coefficienti a1, . . . , ai−1 determinano 2i−1 distinte successioni mente l’espressione
tra parentesi quadre, per l’arbitrarieta nella scelta dei coefficienti, individua tutti i
numeri tra [0, 2−i). Quindi per i > 0 l’insieme φ(Mzi ) e costituito da 2i−1 rettangoli
disgiunti lunghi 1 nella direzione x e spessi 2−i nella direzione y. Viceversa se i 6 0
allora i punti di φ(Mzi ) hanno coordinata y che puo assumere tutti i valori in [0, 1)
mentre per la coordinata x vale che
x ≡ a0
2+
a−1
22. . . +
a−|i|+1
2|i|+
z
2|i|+1+
[+∞∑j=1
a−|i|−j
2|i|+1+j
].
66
In questo caso l’insieme φ(Mzi ) e costituito da 2|i| rettangoli disgiunti (il numero
delle distinte sequenze a0, . . . , a−|i|+1) lunghi 1 nella direzione y e spessi 2−(|i|+1)
nella direzione x. Rispetto alla misura di Lebesgue su T 2, indipendentemente dal
valore di z, si ottiene che
|φ(Mzi )| =
2i−1(1× 2−1) =1
2se i > 0,
2|i|(2−(|i|+1) × 1) =1
2se i 6 0.
Quindi |φ(Mzi )| = µ 1
2, 12(Mz
i ) da cui segue che dx dy ≡ µ 12, 12
À µ 12, 12, ovvero il
sistema di Bernouilli B(12, 1
2) e isomorfo al sistema dinamico definito dalla trasfor-
mazione del panettiere sul toro T 2 rispetto alla misura di Lebesgue dx dy.
3.2.2 Misure prodotto su sistemi infiniti
Generalmente dato un sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ si assume
che gli stati siano descritti da misure assolutamente continue rispetto alla misura
µ tramite delle densita ρ ∈ L[X , µ] che, quando il sistema e mixing, tendono alla
densita uniforme 1(x) = 1 sotto l’effetto della dinamica. E naturale chiedersi se e
possibile e ragionevole riadattare questo schema ai sistemi infiniti. Esaminiamo il
caso, relativamente semplice, di un sistema dinamico prodotto∏
n∈Z Γ(n) costituito
da infinite copie identiche del sistema dinamico Γ ≡ X ,M , µ,T, Ψ. Un sistema
dinamico di questo tipo, anche se in modo molto idealizzato, descrive un sistema
dinamico infinito, ad esempio una collezione infinita di (piccole) scatole contenenti
del gas (Figura 7.2).
Il sistema prodotto ha, in modo naturale, una misura invariante sotto l’evoluzio-
ne temporale: la misura prodotto σ ≡ ∏n∈Z µ(n) sullo spazio X ≡ ∏
n∈ZX (n)
(rispetto alla σ-algebra prodotto). Se lo stato di ogni sottosistema e descritto da
una densita ρ, e se i sistemi sono scorrelati, allora tutto il sistema si trova in uno
stato determinato dalla misura prodotto12 σρ ≡∏
n∈Z ρµ(n).
Se la misura prodotto σρ definisse una misura assolutamente continua rispetto
alla misura σ, allora la descrizione tipica dei sistemi finiti si estenderebbe senza
12Stiamo implicitamente assumendo stati invarianti sotto traslazioni spaziali del sistema. Que-
sta assunzione e giustificata e rilevante quando si vogliono considerare perturbazioni dall’equi-
librio in senso globale. Perturbazioni soltanto locali di stati di equilibrio termico sono molto
piu facili da studiare e riconvergono in generale all’equilibrio. Tuttavia tale convergenza non ha
niente a che vedere con il problema, assai piu generale, del raggiungimento dell’equilibrio
67
modifiche anche ai sistemi infiniti e la misura prodotto σ si potrebbe giustificare
come la misura invariante “piu naturale”.
Tuttavia il seguente risultato prova che una tale descrizione e priva di signifi-
cato.
3.2.2 Proposizione. La misura prodotto σρ e assolutamente continua rispetto alla
misura prodotto σ se e solo se ρ = 1 quasi ovunque sul singolo spazio X rispetto
alla misura µ.
zDim.
L’implicazione (⇐) e evidente. Per dimostrare l’implicazione (⇒) supponiamo che esista una
funzione g ∈ L1[X , σ] tale che σρ = g σ. Consideriamo una funzione h ∈ L1[Xj , µj ] che dipende
solo dalle variabili dello spazio Xj e consideriamo l’uguaglianza∫
Xh(xj) dσρ(xn) =
∫
Xj
h(xj)ρ(xj) dµ(j)(xj)∏
n 6=j
(∫
Xn
ρ(xn) dµ(j)(xn))
=∫
Xj
h(xj)ρ(xj) dµ(j)(xj).
D’altra parte∫
Xh(xj) dσρ(xn) =
∫
Xh(xj) g(xn) dσ(xn)
l’arbitrarieta nella scelta di h ∈ L1[Xj , µj ] implica che
ρ(xj) =∫
Xg(xn)
∏
n6=j
dσn(xn). (3.17)
Mostriamo che la funzione g e costante quasi ovunque rispetto alla misura prodotto. Per
fare cio ricorreremo alle proprieta di mixing della misura rispetto alle traslazioni. Sullo spazio
prodotto e definito in modo naturale un’operatore di traslazione τ∗k con k ∈ N tale che τ∗k :
Xn → Xk+n e che mappa ogni punto di Xn nel rispettivo punto di Xk+n (τ∗k definisce solamente
un cambio di “etichetta”). La traslazione puo essere implementata sulle funzioni. Sia h =
h(xn1 , . . . , xnj ) una funzione integrabile rispetto allo spazio prodotto Xn1 × . . .×Xnj . Allora la
funzione τk(h) definita puntualmente da
τk(h)(xn1 , . . . , xnj ) = h(xnk+1 , . . . , xnk+j)
e integrabile rispetto allo spazio prodotto Xnk+1 × . . . × Xnk+j. Se h e p sono due funzioni
integrabili definite su un numero finito di sottospazi allora evidentemente
limk→±∞
∫
Xp τk(h) dσ(xn) =
(∫p
∏m
dµ(m)
)(∫h
∏n
dµ(n)
)
dato che per un k sufficientemente grande lo spazio dove e definita p ed il traslato dello spazio
dove e definita h sono disgiunti. Poiche le funzioni integrabili definite su un numero finito di
spazi sono dense nelle funzioni L1[X , σ] allora la precedente relazione si estende per continuita
68
a tutto L1[X , σ] e la precedente relazione afferma che la misura prodotto σ e mixing rispetto
alle traslazioni (Paragrafo A.3.4). La misura σρ e per costruzione invariante rispetto alle
traslazioni e quindi, affinche sia verificata l’uguaglianza σρ = g σ e necessario che g sia invariante
per traslazioni , τk(g) = g per ogni k ∈ N. Dato che il sistema e mixing g e invariante se e solo
se g = const. quasi ovunque rispetto a σ. Inoltre, dato che σρ e normalizzata, segue ancora che
g = 1. Questo fatto insieme alla (3.17) provano che ρ = 1 quasi ovunque rispetto alla misura
µ. ¨
Questo risultato prova che la dinamica dei sistemi infiniti e molto diversa da
quella dei sistemi finiti. Se si assume che gli stati di non equilibrio (invarianti per
traslazioni) siano descritti da misure assolutamente continue rispetto alla misura
prodotto si afferma che i soli stati possibili sono quelli di equilibrio (ossia proprio
gli stati descritti dalla misura prodotto a cui si vorrebbe convergere) e questa
affermazione e palesemente smentita dall’evidenza. La Teoria ergodica non puo
essere utilizzata per la descrizione globale del sistema infinito (implica affermazioni
false) ma ha ancora un ruolo rilevante nel problema della convergenza all’equilibrio
quando le sue affermazioni riguardano i singoli sottosistemi microscopici (Capitolo
7).
3.3 Dinamica topologica
La dinamica topologica si puo definire come lo studio dei gruppi di trasformazioni
continue definiti su uno spazio topologico (generalmente compatto e di Hausdorff).
I sistemi dinamici topologici sono oggetti sostanzialmente diversi dai sistemi di-
namici misurabili in quanto definiti a partire da strutture matematiche distinte. La
corrente dominante nello studio di questi argomenti cerca di mettere in evidenza
le analogie esistenti tra dinamica topologica e dinamica classica partendo dal pun-
to di vista che ogni spazio topologico e anche una spazio misurabile rispetto alla
σ-algebra di Borel. Il punto di interesse di questo lavoro e invece quello opposto.
Si ritiene che i sistemi dinamici topologici sono interessanti in quanto esibiscono
(generalmente) comportamenti distinti da quelli tipici dei sistemi dinamici classici.
In particolare i sistemi topologici non sono vincolati ad obbedire alla ricorrenza in
quanto non sono definiti a partire da una misura invariante e possono presentare
punti attrattori che costituiscono gli asintoti temporali della dinamica. In questo
caso la convergenza all’equilibrio avrebbe una spiegazione semplice in termini di
convergenza puntuale delle orbite e non sarebbe necessario ricorrere alle densita.
Il testo di riferimento per gli argomenti trattati e [Bro76] (Capitolo II) mentre
69
per una trattazione generale della teoria dei sistemi dinamici topologici si rimanda
a [BS70].
3.3.1 Sistemi dinamici topologici
Di seguito verra data la nozione di sistema dinamico topologico su uno spazio
compatto di Hausdorff X . Inoltre si mostrera come la nozione di dinamica puo
essere estesa all’insieme delle funzioni continue e delle misure (di Baire) su X .
Dinamica topologica
3.3.1 Definizione (sistema dinamico topologico). Si chiama sistema di-
namico topologico la terna Σ ≡ X ,T, Φ costituita dallo spazio topologico Xcompatto e di Hausdorff, T ∈ Z,R e Φ una dinamica topologica invertibile
su X . Se T = Z diremo che il sistema dinamico e discreto, invece se T = R
diremo che il sistema dinamico e continuo.
Sia Om(X ) l’insieme di tutti gli omeomorfismi di X in se e C(X ) l’insieme delle
funzioni continue su X a valori complessi. Una dinamica topologica inver-
tibile sullo spazio X e una rappresentazione Φ fortemente continua del gruppo T
sull’insieme degli omeomorfismi di X , ossia e una mappa
T 3 tΦ−→ Φt ∈ Om(X )
tale che:
i) Φ0 = Id essendo Id la trasformazione che lascia invariati i punti di X ;
ii) Φt1 Φt2 = Φt1+t2 per ogni t1, t2 ∈ T;
iii) Φ−t = Φt−1 per ogni t ∈ T;
iv) se la successione tnn∈N ⊂ T converge a t allora
limtn→t
‖f(Φtn(x))− f(Φt(x))‖∞ = 0 ∀f ∈ C(X ).
Il simbolo ‖ ‖∞ indica la norma del “sup” sulle funzioni continue definita per ogni
f ∈ C(X ) da
‖f‖∞ ≡ supx∈X
|f(x)|. (3.18)
Osserviamo ancora che la proprieta iii) e ridondante in quanto si deriva dalle
proprieta i) e ii) e nel caso in cui T = Z anche la iv) e sovrabbondante in quanto
Z non ammette successioni convergenti eccetto che quelle costanti.
70
Diremo che x0 ∈ X e un punto stazionario della dinamica se accade che
Φt(x0) = x0 per ogni t ∈ T. Diremo che x0 e un attrattore , o punto di equili-
brio, rispetto al sottoinsieme A ⊆ X se x0 e un punto stazionario e se Φt(x) → x0
quando t → +∞ (oppure t → −∞) per ogni x ∈ A. Nel caso in cui A ≡ X diremo
che x0 e un’ attrattore globale .
Dinamica C∗ sulle funzioni continue
La dinamica topologica Φ induce una dinamica sull’insieme C(X ), infatti ad og-
ni omeomorfismo Φt e associata una trasformazione Ut : C(X ) → C(X ) definita
puntualmente come
Ut(f)(x) = f(Φt(x)) ∀ x ∈ X .
Evidentemente se f ∈ C(X ) anche Ut(f) = f Φt ∈ C(X ) in quanto composizione
di funzioni continue. Si verifica immediatamente che per ogni t ∈ T valgono le
seguenti proprieta:
1) Ut(af1 + bf2) = aUt(f1) + bUt(f2) per ogni f1, f2 ∈ C(X ) e a, b ∈ C;
2) Ut(f1f2) = Ut(f1) Ut(f2) per ogni f1, f2 ∈ C(X );
3) Ut(f) = Ut(f) per ogni f ∈ C(X );
4) se f > 0 allora Ut(f) > 0;
5) ‖Ut(f)‖∞ = ‖f‖∞ per ogni f ∈ C(X );
6) Ut(1) = 1.
L’insieme C(X ) gode di importanti proprieta algebriche: e chiuso rispetto alle
combinazioni lineari ed al prodotto dei suoi elementi; e chiuso rispetto alla co-
niugazione complessa; e completo rispetto alla norma ‖ ‖∞; la funzione costante
1(x) = 1 e l’unita rispetto alla moltiplicazione di funzioni. Tutte queste proprieta
si riassumono dicendo che C(X ) e una C∗-algebra13 con unita. Dalle proprieta
1)-6) deriva che le trasformazioni Ut preservano la struttura di C∗-algebra con
unita di C(X ) e la norma dei suoi elementi. Trasformazioni di questo tipo sono
dette ∗-automorfismi o piu semplicemente automorfismi ed indicheremo con
il simbolo Aut(C(X )) l’insieme di tutti gli automorfismi della C∗-algebra C(X ).
13La struttura di C∗-algebra e discussa in dettaglio nel Paragrafo B.1.1.
71
Rispetto alla composizione di trasformazioni Aut(C(X )) ha una struttura di grup-
po con elemento neutro Id rappresentato dalla trasformazione identica Id(f) = f
per ogni f ∈ C(X ). Dalle proprieta i)-iv) verificate dalla dinamica Φ e dalla
definizione delle trasformazioni Ut segue immediatamente che:
i’) U0 = Id essendo Id la trasformazione identica sulle funzioni di C(X );
ii’) Ut1 Ut2 = Ut1+t2 per ogni t1, t2 ∈ T;
iii’) U−t = Ut−1 per ogni t ∈ T;
iv’) se la successione tnn∈N ⊂ T converge a t allora
limtn→t
‖Utn(f)− Ut(f)‖∞ = 0 ∀f ∈ C(X ).
Da queste proprieta segue che la dinamica topologica Φ su X definisce una rappre-
sentazione fortemente continua U(T) del gruppo T nell’insieme degli automorfismi
di C(X ) secondo la mappa
T 3 tU−→ Ut ∈ Aut(C(X ))
che chiameremo dinamica C∗. In realta si dimostra anche il viceversa (Paragrafo
B.1.10), ossia che ogni dinamica C∗ definisce una dinamica topologica sull’insieme
degli stati (funzionali lineari positivi e normalizzati sulla C∗-algebra)
Dinamica aggiunta sulle misure di Baire
Poiche C(X ) e uno spazio di Banach (spazio lineare normato e completo) e
possibile definire il suo duale, ovvero l’insieme dei funzionali lineari e limitati
µ : C(X ) → C che risulta ancora uno spazio di Banach14 rispetto alla norma
‖µ‖ ≡ supf∈C(X )
|µ(f)|‖f‖∞ . (3.19)
Si dimostra che il duale dell’algebra C(X ) coincide con l’insieme di tutte le misure
finite di Baire (o equivalentemente di Borel regolare) su X (Paragrafo B.4.1).
Indicheremo questo insieme con il simbolo M(X ). Se µ ∈ M(X ) ed f ∈ C(X ) il
rapporto di dualita tra µ ed f e espresso da
µ(f) ≡∫
Xf(x) dµ(x).
14C.f.r. [RS72] Teorema III.2.
72
La norma su M(X ) definita dalla (3.19) coincide con la variazione totale del-
la misura, ossia ‖µ‖ = |µ|(X ) e per misure positive si riduce semplicemente a
‖µ‖ = µ(X ). Indicheremo con M+(X ) il sottoinsieme delle misure positive, con
M1(X ) il sottoinsieme delle misure normalizzate (con variazione totale 1) e con
M+;1(X ) ≡ M1(X ) ∩M+(X ) il sottoinsieme delle misure di probabilita (positive
e normalizzate).
La dinamica U(T), definita su C(X ) a partire dalla dinamica topologica Φ, in-
duce, a sua volta, una dinamica sullo spazioM(X ) che associa ad ogni omeomorfis-
mo Φt e quindi ad ogni automorfismo Ut una trasformazione U∗t : M(X ) →M(X )
definita puntualmente da
U∗t (µ)(f) =
∫
Xf(x) d(U∗
t (µ))(x) ≡∫
XUt(f)(x) dµ(x) = µ(Tt(f)) ∀ f ∈ C(X ).
Per ogni t ∈ T le trasformazioni U∗t verificano le seguenti proprieta:
1*) U∗t (aµ1 + bµ2) = aU∗
t (µ1) + bU∗t (µ2) per ogni µ1, µ2 ∈M(X ) e a, b ∈ C;
2*) se µ ∈M+(X ) allora U∗t (µ) ∈M+(X );
3*) ‖U∗t (µ)‖ = ‖µ‖ per ogni µ ∈M(X ).
Dalle proprieta 1*)-3*) segue che le trasformazioni U∗t preservano la struttura di
spazio di Banach diM(X ) e la norma dei suoi elementi e quindi sono degli automor-
fismi. Indicheremo con il simbolo Aut(M(X )) l’insieme di tutti gli automorfismi
di M(X ). Rispetto alla composizione di trasformazioni Aut(M(X )) e un gruppo
con elemento neutro Id rappresentato dalla trasformazione identica Id(µ) = µ per
ogni µ ∈ M(X ). Dalle proprieta i’)-iv’) verificate dalla dinamica U(T) e dalla
definizione delle trasformazioni U∗t segue immediatamente che:
i”) U∗0 = Id essendo Id la trasformazione identica sulle misure di M(X );
ii”) U∗t1 U∗
t2= U∗
t1+t2per ogni t1, t2 ∈ T;
iii’) U∗−t = U∗
t−1 per ogni t ∈ T;
iv’) se la successione tnn∈N ⊂ T converge a t allora
limtn→t
∣∣U∗tn(µ)(f)− U∗
t (µ)(f)| = 0 ∀f ∈ C(X ), ∀ µ ∈ M(X ).
Da queste proprieta segue che la dinamica topologica Φ su X definisce una rappre-
sentazione debolmente continua U∗T del gruppo T nell’insieme degli automorfismi
di M(X ) secondo la mappa
T 3 tU∗−→ U∗
t ∈ Aut(M(X ))
73
che chiameremo dinamica aggiunta .
3.3.2 Dinamica topologica e dinamica misurabile
Cio che rende interessante (per gli scopi di questo lavoro) i sistemi dinamici topo-
logici e la constatazione che non essendo definiti in termini di una misura invariante
in generale non presentano il fenomeno della ricorrenza e pertanto si presentano
come i candidati ideali per la costruzione di modelli che riproducano l’approc-
cio all’equilibrio. Tuttavia questa affermazione deve confrontarsi con un risultato
generale che sembra contraddirla:
3.3.1 Teorema. Sia Σ ≡ X ,T, Φ un sistema dinamico topologico. Allora su Xesiste almeno una misura di probabilita di Baire µ invariante sotto l’azione delle
dinamica Φ e quindi Σ ≡ X ,B, µ,T, Φ, con B σ-algebra di Baire su X , e un
sistema dinamico misurabile.
zDim.
Sia M+;1(X ) l’insieme di tutte le misure di probabilita di Baire su X . L’insieme M+;1(X ) e non
vuoto (ad esempio contiene le misure di Dirac), convesso e debolmente compatto15. Inoltre e
preservato dalla dinamica aggiunta U∗t (M+,1(X )) = M+,1(X ) per ogni t ∈ T. Per il Teorema
del punto fisso di Markov-Kakutani16 esiste un punto fisso µ ∈M+;1(X ) tale che U∗t (µ) = µ
per ogni t ∈ T. Osserviamo che per ogni f ∈ C(X )∫
Xf(Φt(x)) dµ(x) =
∫
XTt(f)(x) dµ(x) =
∫
Xf(x) dT ∗t (µ)(x) =
∫
Xf(x) dµ(x)
e quindi la misura µ definisce un funzionale invariante sulle funzioni C(X ). L’invarianza della
misura µ segue dal Teorema di Riesz-Markov (in particolare dall’unicita della rappresentazione).
Esplicitamente si parte dalla considerazione che le misure di Baire sono regolari e pertanto per
ogni sottoinsieme di Baire B
µ(B) = infµ(O) | B ⊆ O con O aperto di Baire = supµ(C) | C ⊆ B con C chiuso di Baire.
Per ogni C ⊆ B ⊆ O il Lemma di Urysohn17 assicura l’esistenza di una funzione continua
e positiva fC,O che vale 1 su C, 0 su X \ O e 0 6 fC,O(x) 6 1 per ogni x ∈ O \ C per cui
µ(C) 6∫X fC,O(x) dµ(x) 6 µ(O) da cui segue che
µ(B) = infO⊇B
[supC⊆B
∫
XfC,O(x) dµ(x)
].
15La compattezza debole di M+;1(X ) e conseguenza di un risultato generale noto come
Teorema di Banach-Alaoglu che e discusso nel Paragrafo B.1.6.16Il Teorema di Markov-Kakutani afferma che se F e una famiglia di mappe affini, con-
tinue e commutanti di un insieme K in se con K sottoinsieme compatto e convesso di uno spazio
localmente compatto allora esiste un x ∈ K che e un punto fisso comune a tutte le mappe di
F , ossia Tx = x per ogni T ∈ F . Per la dimostrazione si rimanda a [RS72] Teorema V.20.17C.f.r. [RS72] Teorema IV.7.
74
Osservando che fC,O(Φt(x)) = fΦ−1t (C),Φ−1
t (O)(x) l’integrazione rispetto alla misura µ comporta
che ∫
XfC,O(x) dµ(x) =
∫
XfC,O(Φt(x)) dµ(x) =
∫
XfΦ−1
t (C),Φ−1t (O)(x) dµ(x).
Inoltre Φ−1t (C) ⊆ Φ−1
t (B) ⊆ Φ−1t (O) se C ⊆ B ⊆ O e poiche Φ−1
t e continua manda chiusi in
chiusi ed aperti in aperti. Tutto cio implica che µ(B) = µ(Φ−1t (B)) per ogni sottoinsieme di Baire
B e quindi la misura µ e invariante rispetto alla dinamica Φ. ¨
Alla luce di questo risultato ogni sistema dinamico topologico e sempre anche
un sistema dinamico classico e pertanto quasi tutti i punti di X , rispetto alla
misura invariante µ, devono essere ricorrenti. Tuttavia bisogna tenere conto che
la misura invariante µ non e definita a priori ma e costruita (via Teorema di
Markov-Kakutani) in modo dipendente dalla dinamica Φ (che invece e data a
priori). In questo senso l’esistenza della misura invariante non aggiunge nulla al
comportamento della dinamica ne puo imporre la ricorrenza. Ad esempio (cio sara
chiarito nei prossimi paragrafi) un sistema dinamico che ha un attrattore globale
ammette ancora una misura invariante la quale, tuttavia, deve avere supporto
solamente sul punto attrattore. Rispetto a questa misura ogni punto distinto
dall’attrattore e un punto “eccezionale” sul quale il Teorema di Poincare non puo
fare nessuna predizione. In questa situazione la ricorrenza imposta dalla misura µ
implica solamente che il punto attrattore deve essere ricorrente e cio e banalmente
vero in quanto esso e in particolare stazionario.
3.3.3 Sistemi minimali
Nel tentativo di ricondurre lo studio dei sistemi dinamici topologici a quello dei
sistemi dinamici classici viene introdotta la nozione di minimalita . In realta
questa nozione non definisce un comportamento generale della dinamica topologica
ma piuttosto ne seleziona una classe particolare. I sistemi dinamici topologici
rilevanti ai fini di questo lavoro, sono proprio quei sistemi che sono “fortemente non
minimali” ed in questo senso lo studio della minimalita definisce indirettamente un
criterio per la descrizione delle dinamiche topologiche che riteniamo “interessanti”.
Dato un sistema dinamico topologico Σ ≡ X ,T, Φ si chiama orbita del
punto x ∈ X l’insieme
OΦ(x) ≡ y | y = Φt(x) ∀ t ∈ T =⋃t∈T
Φt(x) (3.20)
e si indica con il simbolo OΦ(x) la chiusura di tale insieme. L’orbita di ogni punto
75
e un sottoinsieme invariante di X infatti per ogni x ∈ X e per ogni t ∈ T
Φt(OΦ(x)) ≡ y | y = Φt(Φt′(x)) = Φt+t′(x) ∀ t′ ∈ T = OΦ(x). (3.21)
La continuita delle trasformazioni Φt impone che se xαα∈I e un net convergente a
x0 allora il net yα ≡ Φt(xα)i∈I deve convergere al punto y0 ≡ Φt(x0). Cio implica
che Φt(OΦ(x)) ⊆ Φt(OΦ(x)) = OΦ(x) dove l’ultima uguaglianza e giustificata
dalla (3.21). L’invertibilita della dinamica permette di scrivere anche che OΦ(x) ⊆Φ−t(OΦ(x)) e dato che le due inclusioni devono essere verificate per ogni tempo
segue immediatamente che
Φt(OΦ(x)) = OΦ(x) ∀ t ∈ T ∀ x ∈ X . (3.22)
La condizione (3.22) prepara la seguente definizione:
3.3.2 Definizione (Sistema dinamico minimale). Diremo che il sistema di-
namico Σ ≡ X ,T, Φ e minimale se la condizione Φt(C) = C per ogni t ∈ T,
con C sottoinsieme chiuso di X , implica che C = X oppure C = ∅.
Come conseguenza della (3.22) segue che in un sistema minimale OΦ(x) = Xper ogni x ∈ X ossia ogni orbita e densa in tutto lo spazio. Viceversa se Σ non e
minimale allora deve esistere un sottoinsieme chiuso e non vuoto C ⊂ X tale che
Φt(C) = C per ogni t ∈ T. Se x ∈ C allora anche OΦ(x) ⊆ C ed inoltre OΦ(x) ⊆ Cdato che C e chiuso e quindi OΦ(x) 6= X . Cio prova che
3.3.2 Proposizione. Il sistema dinamico Σ ≡ X ,T, Φ e minimale se e solo
se l’orbita di ogni punto e ovunque densa, ossia se e solo se OΦ(x) = X per ogni
x ∈ X .
Quindi la nozione di minimalita classifica quei sistemi il cui comportamento
puo essere determinato conoscendo semplicemente l’evoluzione temporale (passato,
presente e futuro) di un singolo punto.
Un risultato generale mostra che ogni sistema dinamico topologico, anche non
minimale, possiede sempre un sottosistema minimale.
3.3.3 Teorema. Sia Σ ≡ X ,T, Φ un sistema dinamico classico. Esiste un
sottoinsieme X0 ⊆ X chiuso e non vuoto, detto sottoinsieme minimale della
dinamica Φ, tale che Φt(X0) = X0 per ogni t ∈ T e rispetto al quale il sottosistema
dinamico Σ0 ≡ X0,T, Φ e minimale.
76
zDim.
Indichiamo con C la classe di tutti i sottoinsiemi C ⊆ X chiusi e non vuoti tali che Φt(C) = Cper ogni t ∈ T. La classe C e parzialmente ordinata rispetto alla relazione d’ordine indotta
dall’inclusione. Sia C0 una sottoclasse totalmente ordinata di C il cui estremo inferiore e l’insieme
K0 definito come
K0 ≡⋂
C∈C0
C.
L’insieme K0 e chiuso in quanto intersezione di chiusi ed inoltre per ogni t ∈ T
Φt(K0) = Φt
( ⋂
C∈C0
C)
=⋂
C∈C0
Φt(C) =⋂
C∈C0
C = K0.
Poiche lo spazio X e compatto vale la proprieta dell’intersezione finita18 e dato che la classe
C0 ha intersezioni finite non vuote (e una classe totalmente ordinata) segue che K0 6= ∅. Cio
prova che K0 ∈ C . Il Lemma di Zorn19 assicura che esiste una sottoclasse massimale C0 che
contiene la classe C0 e che e totalmente ordinata. Indichiamo con X0 l’intersezione di tutti gli
elementi di C0. Evidentemente X0 ∈ C e pertanto Φt(X0) = X0 per ogni t ∈ T. Inoltre se C′ ⊆ X0
e un sottoinsieme chiuso tale che Φt(C′) = C′ per ogni t ∈ T allora C′ ∈ C . Per costruzione C′ e
propriamente contenuto in tutti gli insiemi di C0 e per la massimalita di C0 segue che C′ ∈ C0.
Cio prova che C′ = X0 e pertanto il sottosistema dinamico Σ0 ≡ X0,T, Φ e minimale. ¨
Osserviamo che la generalita del teorema appena dimostrato e solo apparente,
infatti la presenza del sottosistema minimale e significativa solo se il sottoinsieme
invariante X0 non e banale. Ad esempio nel caso di un sistema dinamico con
un attrattore globale x0 il contenuto del precedente teorema si riduce alla banale
affermazione che il sottoinsieme X0 ≡ x0 e invariante e quindi x0 coincide con
l’orbita di x0.
La minimalita esprime una sorta di ergodicita della dinamica20 in quanto af-
18Uno spazio X gode della proprieta dell’intersezione finita se comunque scelta una
collezione Cj di sottoinsiemi chiusi e non vuoti di X tale che nessuna intersezione finita di
suoi elementi sia vuota allora anche l’intersezione totale⋂
j Cj non e vuota. Si dimostra che la
proprieta dell’intersezione finita e equivalenza alla compattezza di X . C.f.r. [HY61] Teorema
1-22.19IL Lemma di Zorn , detto anche Principio di massimalita , afferma che se A e un
insieme parzialmente ordinato e se D e un sottoinsieme di A totalmente ordinato allora esiste un
sottoinsieme D di A che contiene D , che e totalmente ordinato e che e il piu grande sottoinsieme
di A (rispetto all’inclusione) a godere di questa proprieta. Si dimostra che il Lemma di Zorn e
equivalente all’ assioma della scelta e al Teorema di Zermelo o del buon ordinamento.
C.f.r [HY61] Teorema 1-26, 1-27.20 Se Σ ≡ X ,T,Φ e un sistema dinamico topologico minimale allora per il Teorema 3.3.4
esiste una misura invariante di Baire µ con supporto su tutto X e Σ ≡ X ,B, µ,T, Φ e un sis-
tema dinamico sia classico che topologico. Si dimostra che la misura µ e metricamente transitiva
rispetto alla dinamica Φ e quindi il sistema dinamico classico Σ e ergodico. In questo senso e piu
forte di quella di ergodicita in quanto la implica.
77
ferma che ogni punto del sistema, sotto l’effetto dell’evoluzione temporale, visitera
arbitrariamente da vicino (in senso topologico) ogni altro punto del sistema. La
proprieta di ergodicita dei sistemi classici e una nozione che dipende dall’esisten-
za di una misura invariante e pertanto e ragionevole che anche la minimalita sia
in relazione con il fatto che la dinamica topologica ammette sempre almeno una
misura invariante. Quello che si dimostra e che i sistemi minimali hanno una
misura invariante con supporto21 su tutto lo spazio.
3.3.4 Teorema. Se il sistema dinamico classico Σ ≡ X ,T, Φ e minimale allora
ogni misura positiva di Baire µ invariante ha come supporto X .
zDim.
Sia Σ ≡ X ,T, Φ un sistema dinamico minimale e sia A ⊆ X un sottoinsieme di Baire aperto
e non vuoto. Consideriamo l’insieme A ≡ ⋃t∈T Φt(A). Poiche la dinamica e invertibile gli
omeomorfismi Φt mandano insiemi aperti in insiemi aperti e pertanto A e aperto. Inoltre A e
anche invariante, infatti per ogni t′ ∈ T
Φt′(A) = Φt′
(⋃
t∈TΦt(A)
)=
⋃
t∈TΦt′+t(A) = A
ed e non vuoto in quanto A ⊇ A 6= ∅. L’insieme K ≡ X \ A e chiuso ed inoltre per ogni t ∈ T
Φt(K) = Φt(X \ A) = Φt(X ) \ Φt(A) = X \ A = K.
Dato che per ipotesi Σ e minimale e poiche K 6= X (in quanto A e non vuoto) segue necessaria-
mente che K = ∅ e quindi A = X . Cio prova che la collezione di insiemi Φt(A) | t ∈ T e una
copertura aperta di X da cui, per la compattezza di X , e possibile estrarre una sottocopertura
finita. Quindi deve esistere una collezione finita t1, . . . , tN ⊂ T tale che X =⋃N
j=1 Φtj (A). Per
la subadditivita e l’invarianza della misura µ segue che
µ(X ) = µ
N⋃
j=1
Φtj (A)
6
N⋃
j=1
µ(Φtj (A)) = N µ(A)
Se S e il supporto della misura µ consideriamo l’aperto A ≡ X \ S. Dato che µ(X \ S) =
µ(X ) − µ(S) = 0 la precedente disuguaglianza implicherebbe che µ(X ) = 0. Cio comporta che
A = ∅ ovvero che S = X . ¨
3.3.4 Sistemi unicamente ergodici
Per ogni funzione continua f ∈ C(X ) e per ogni τ > 0 introduciamo la notazione
fτ (x) ≡ 1
2τ
∫ +τ
−τ
f(Φt(x)) dt.
21Il supporto di una misura di Baire su X e il piu piccolo sottoinsieme chiuso di Borel S ⊆ Xtale che µ(S) = µ(X ). Per ulteriori dettagli si rimanda al Paragrafo B.4.1.
78
Indichiamo con τ → +∞ una generica successione crescente ed illimitata di tempi e
con limτ→+∞ fτ (x) ≡ f(x) la media temporale della funzione f (se esiste) calcolata
lungo l’orbita di x.
Nel caso dei sistemi dinamici topologici le relazioni tra medie temporali e medie
in fase delle funzioni continue sono molto varie. Ad esempio se il sistema dinamico
Σ ≡ X ,T, Φ e minimale allora sicuramente esiste una misura di Baire rispetto
alla quale esso si comporta come un sistema ergodico (C.f.r.Nota 20). Tuttavia
niente impone che tale misura ergodica sia unica. Supponiamo che µ1 e µ2 siano
due distinte misure di Baire, normalizzate ed ergodiche, (cio e possibile a patto
che le misure non siano assolutamente continue e nel Paragrafo 3.2.1 abbiamo
esibito un esempio rilevante in cui cio accade) sul sistema dinamico Σ. In questo
caso l’ergodicita impone che vi saranno punti di X (quasi tutti rispetto a µ1)
tali per cui fτ (x) → µ1(f) (media di fase rispetto alla misura µ1) e vi saranno
altri punti di X (quasi tutti rispetto a µ2) tali per cui fτ (x) → µ2(f) (media di
fase rispetto alla misura µ2). D’altra parte se per un fissato x ∈ X accade che
fτ (x) → Lx(f) per ogni f ∈ C allora risulta definito il funzionale lineare positivo
Lx(f) ≡ limτ→+∞ fτ (x) e per il Teorema di Riesz-Markov esiste un’unica misura
di Baire positiva µx su X tale che Lx(f) = µx(f). Questa misura deve essere
invariante rispetto alla dinamica in quanto limτ→+∞ fτ (x) = limτ→+∞ fτ (Φt(x))
per ogni t ∈ T e tuttavia non deve essere necessariamente ergodica. Se per tutte
le funzioni continue limτ→+∞ fτ (x) converge ad una costante, indipendentemente
da x ∈ X allora anche la misura µx e indipendente da x. Per fare ordine in questa
ampia casistica di situazioni e utile dare le seguenti definizioni.
3.3.3 Definizione (sistema unicamente ergodico, punto generico). Il si-
stema dinamico topologico Σ ≡ X ,T, Φ e unicamente ergodico se esiste
un’unica misura normalizzata di Baire µ su X invariante rispetto alla dinamica
Φ. Un punto x ∈ X e detto generico rispetto a µ se accade che fτ (x) → µ(f) per
ogni f ∈ C(X ).
Ogni funzione continua su un sistema unicamente ergodico ha media temporale
ed il valore della media e costante su tutte (e non quasi tutte!) le orbita del sistema,
infatti:
3.3.5 Teorema. Sia Σ ≡ X ,T, Φ un sistema dinamico topologico. Le seguenti
condizioni sono equivalenti:
i) Σ e unicamente ergodico con misura di probabilita invariante µ;
79
ii) fT (x) converge a µ(f) uniformemente in X per ogni f ∈ C(X );
iii) ogni punto x ∈ X e generico per µ.
zDim.
i) ⇒ ii). Se la i) e vera allora l’insieme di tutte le misure di Baire che si annullano sul sottospazio
X1 ≡ g | g ≡ f − Ut(f), ∀ f ∈ C(X ),∀ t ∈ T
deve coincidere con la varieta unidimensionale di M(X ) generata da µ indicata da Span(µ). Nel
rapporto di dualita tra C(X ) e M(X ) il sottospazio Span(µ) e l’annichilatore di X1 ⊂ C(X )
mentre la varieta
Xµ ≡ g | g ≡ f − µ(f), ∀ f ∈ C(X )
e l’annichilatore di Span(µ). Cio implica che Xµ e la chiusura della varieta X1 rispetto alla
topologia di C(X ) e quindi per ogni f ∈ C(X ), comunque fissato un ε > 0, esiste una funzione
g ∈ C(X ) ed un t′ ∈ T tale che ‖(f − µ(f))− (g − Ut′(g))‖∞ < ε. Pertanto∥∥∥∥[(
12τ
∫ +τ
−τ
f(Φt(x)) dt
)− µ(f)
]− 1
2τ
∫ +τ
−τ
(g − Ut′(g))(Φt(x)) dt
∥∥∥∥∞
6 12τ
∫ +τ
−τ
∥∥Ut[(f − µ(f))− (g − Ut′(g))]∥∥∞dt
=∥∥(f − µ(f))− (g − Ut′(g))
∥∥∞ < ε.
Osservando che∣∣∣∣
12τ
∫ +τ
−τ
(g − Ut′(g))(Φt(x)) dt
∣∣∣∣ =∣∣∣∣
12τ
∫ +τ
−τ
g(Φt(x)) dt− 12τ
∫ +τ
−τ
g(Φt′+t(x)) dt
∣∣∣∣
=
∣∣∣∣∣12τ
∫ +τ
−τ
g(Φt(x)) dt− 12τ
∫ t′+τ
t′−τ
g(Φt(x)) dt
∣∣∣∣∣ 6 |t′|τ‖Ut(g)‖∞ =
|t′|τ‖g‖∞
segue immediatamente che
limτ→+∞
∥∥∥∥12τ
∫ +τ
−τ
(g − Ut′(g))(Φt(x)) dt
∥∥∥∥∞
6 limτ→+∞
|t′|τ‖g‖∞ = 0
e per l’arbitrarieta di ε si ottiene che limτ→+∞ ‖fτ (x)− µ(f)‖∞ = 0.
ii)⇒ iii). Segue banalmente osservando che la convergenza uniforme implica quella puntuale.
iii) ⇒ i). Sia valida la iii) e supponiamo che ν sia una misura invariante di Baire su X . Per
ogni τ > 0, per l’invarianza di ν segue che∫
Xfτ (x) dν(x) =
12τ
∫ +τ
−τ
(∫
Xf(Φt(x)) dν(x)
)dt =
∫
Xf(x) dν(x) = ν(f)
ossia tutte le medie temporali parziali sono ν-sommabili. Inoltre fτ (x) → µ(f) puntualmente
per ogni x ∈ X . Tutte le medie temporali parziali fτ sono uniformemente limitate dalla funzione
80
costante ‖f‖∞ che e ν-sommabile. Poiche sono verificate tutte le condizioni di applicabilita del
Teorema di convergenza dominata di Lebesgue segue che
limτ→+∞
∫
X|fτ (x)− µ(f)| dν(x) = 0
il che implica, per l’invarianza della misura ν,
µ(f) = limτ→+∞
∫
Xfτ (x) dν(x) = ν(f) ∀ f ∈ C(X )
da cui µ = ν. ¨
Consideriamo un sistema dinamico Σ ≡ X ,T, Φ che ha un unico attrattore
globale x0 a cui tende ogni orbita sia nel passato che nel futuro. Sia f una generica
funzione continua ed osserviamo che∣∣∣∣f(x0)− 1
2τ
∫ +τ
−τ
f(Φt(x)) dt
∣∣∣∣ 6 1
2τ
∫ +τ
−τ
|f(x0)− f(Φt(x))| dt.
Comunque fissato un ε > 0 deve esistere un T > 0 tale che per ogni |t| > T si deve
avere che |f(x0)− f(Φt(x))| < ε e quindi
∣∣∣∣f(x0)− 1
2τ
∫ +τ
−τ
f(Φt(x)) dt
∣∣∣∣ 6 1
2τ
∫ +T
−T
|f(x0)− f(Φt(x))| dt +|τ − T |
τε.
Quindi limτ→+∞ |f(x0)− fτ (x)| = 0 e pertanto tutti i punti di X sono generici per
la dinamica e tutte le funzioni continue hanno media temporale f(x0). In base al
Teorema 3.3.5 possiamo affermare che
3.3.6 Corollario. I sistemi dinamici topologici Σ ≡ X ,T, Φ che hanno un
unico attrattore globale x0 a cui tendono le orbite sia nel passato che nel futuro
sono unicamente ergodici con unica misura di probabilita invariante data dalla
misura di Dirac δx0 concentrata nel punto x0.
3.3.5 Sottosistemi con un attrattore globale
Diremo che il sistema dinamico topologico Σ ≡ X ,T, Φ ha un sottosistema
con un attrattore globale se esiste un sottoinsieme A ⊂ X ed un punto x0 ∈ Ache attrae nel futuro e nel passato tutti i punti di A. Sia A che X \ A sono
sottoinsiemi invarianti. Se µ e una misura invariante osserviamo che
µ(X ) = µ(X \ A) + µ(A) = µ(X \ A) + µ(Φt(A))
e questa relazione deve valere per ogni t. Dato che per ipotesi l’insieme Φt(A) e
definitivamente contenuto in ogni intorno aperto del punto x0, per la regolarita
81
della misura di Baire segue che µ(Φt(A)) = limt→±∞ µ(Φt(A)) = µ(x0). Cio
comporta che µ(X ) = µ(X \A)+µ(x0) e quindi hai fini dell’evoluzione dinamica
del sottoinsieme A puo esistere un’unica misura invariante non banale, ovvero la
delta di Dirac δx0 . In questo senso la dinamica ristretta suA e quasi-unicamente
ergodica .
82
Capitolo 4
Il formalismo algebrico per i
sistemi estesi
L’utilita della “formulazione algebrica della meccanica quantistica” risiede nel fat-
to che questa teoria adotta come “struttura primaria e fondamentale” l’algebra
delle osservabili. Una tale astrazione permette di separare e di rendere indipen-
denti i concetti di “osservabile” e di “stato”. L’identificazione delle osservabili
come elementi di una C∗-algebra astratta non fa riferimento a nessun insieme di
stati. Questa indipendenza permette di esprimere tutte le relazioni tra le osserv-
abili, ossia tutte le leggi fisiche , unicamente in termini della struttura algebrica
sottostante. I sistemi fisici, pertanto, sono caratterizzati solo dalle proprieta alge-
briche delle loro osservabili senza necessita di dover specificare anche gli eventuali
stati. Il linguaggio algebrico si adatta perfettamente allo studio dei sistemi in-
finiti che sono l’oggetto di interesse di questo lavoro; la struttura algebrica che
implementa tale descrizione e detta quasi-locale . Nel seguito verranno discusse
le modalita di costruzione e le proprieta fondamentali delle C∗-algebre quasi-locali.
Gli strumenti matematici standard, tipici della formulazione algebrica della Mec-
canica Quantistica, sono ritenuti noti e comunque sistematicamente riassunti in
Appendice B. Tuttavia si ritiene opportuno premettere alla discussione sulle al-
gebre quasi-locali un breve confronto tra l’impostazione standard e l’impostazione
algebrica. Solo in termini di un tale confronto si puo apprezzare a pieno i vantaggi
che il linguaggio algebrico comporta nel passaggio a sistemi ad infiniti gradi di
liberta.
83
4.1 Formalismo ed interpretazione
La formulazione di ogni teoria fisica, e quindi anche della Meccanica Quantistica,
prevede la definizione di un apparato formale e di un apparato interpreta-
tivo.
L’ apparato formale costituisce l’insieme delle strutture matematiche che
servono a sviluppare la teoria. Nella formulazione standard della Meccanica Quan-
tistica l’apparato formale e costituito dalle regole che permettono di identificare
le variabili dinamiche con certi operatori lineari su uno spazio di Hilbert H,
gli stati con i raggi di H, l’ evoluzione temporale con un gruppo di operatori
unitari definiti da un’Hamiltoniana H (operatore autoaggiunto) dalla relazione
Ut ≡ eiHt, etc.
L’ apparato interpretativo fornisce le regole che servono a tradurre il formal-
ismo in previsioni sperimentalmente verificabili. Nel caso della Meccanica Quanti-
stica esse consistono nell’associare gli apparati di misura con gli operatori autoag-
giunti, il loro spettro con i possibili esiti della misura, i coefficienti di espansione
di uno stato rispetto ad una data base con le relative probabilita di ottenere un
determinato risultato sperimentale, etc.
La caratteristica della formulazione ordinaria della Meccanica Quan-
tistica e che la dichiarazione delle variabili dinamiche, ossia delle osservabili , e
subordinata all’identificazione di uno spazio di stati. Cio non e naturale in quanto
le leggi della fisica sono relazioni tra osservabili fisiche che non dipendono dal fatto
che il sistema si trovi un un particolare stato o meno. Stati distinti sono il risultato
di distinte condizioni iniziali ma tutti devono essere compatibili con la medesima
legge fisica.
Questa incoerenza e superata nella formulazione algebrica della Mecca-
nica Quantistica all’interno della quale un’opportuna revisione dei concetti di
stato ed osservabile permette di definire tutte le relazioni tra variabili dinamiche
(leggi fisiche) in modo indipendente dalla dichiarazione degli stati.
Osservabili e stati secondo la formulazione standard
Nella formulazione standard le osservabili si identificano con gli operatori autoag-
giunti su uno spazio di Hilbert. Senza perdita di generalita ci si puo limitare agli
operatori limitati in quanto per il Teorema di rappresentazione spettrale
per operatori illimitati 1 ogni operatore autoaggiunto ed illimitato e sempre
1C.f.r. [RS72] Teorema VIII.5.
84
identificabile con una funzione (illimitata) di un operatore autoaggiunto limitato.
Per esse si assume una struttura di algebra affinche per ogni coppia di osservabili
A e B abbiano senso le espressioni A + B e AB. Non e necessario assumere che
tutti gli operatori autoaggiunti e limitati siano osservabili. E sufficiente che a par-
tire dall’insieme di tutti gli operatori interpretabili come osservabili si costruisca
l’insieme contenente tutti i loro polinomi e tutti i relativi limiti in norma rispetto
alla norma operatoriale definita da
‖A‖ ≡ supϕ∈H
‖Aϕ‖‖ϕ‖ .
L’insieme risultante e detto algebra delle osservabili e gode di alcune importan-
ti proprieta: 1) e un’algebra chiusa in norma; 2) e chiusa rispetto all’aggiunzione,
ossia l’operazione involutiva A → A† e interna all’algebra; 3) per ogni elemento
dell’algebra ‖A†A‖ = ‖A‖2.
Il secondo passo nella formulazione algebrica della Meccanica Quantistica e la
descrizione degli stati. Nella formulazione ordinaria gli stati sono i raggi ψ(stati puri) dello spazio di Hilbert H oppure piu in generale le matrici densita2
ρ (miscele statistiche). Essi agiscono sulle osservabili in modo da determinare i
valori di aspettazione (valori numerici) in modo conforme alla struttura alge-
brica. In altre parole gli stati si identificano con i funzionali lineari sull’algebra
delle osservabili secondo le relazioni
A → (ψ; Aψ), A → TrH(ρA).
Questi funzionali sono continui rispetto alla norma operatoriale ‖ ‖, infatti
|(ψ; Aψ)| 6 ‖ψ‖2‖A‖ = ‖A‖ |TrH(ρA)| 6 ‖ρA‖ 6 ‖ρ‖ ‖A‖ = ‖A‖
sono positivi, ossia per ogni osservabile A
(ψ; A†Aψ) = ‖Aψ‖2 > 0 TrH(ρA†A) = TrH(A†ρA) > 0
e sono normalizzati, ossia se 1 e l’operatore identita allora
(ψ;1ψ) = ‖ψ‖2 = 1 TrH(ρ1) = TrH(ρ) = 1.
Stati ed osservabili si determinano vicendevolmente se sono noti tutti i valori di
aspettazione.
2Una matrice densita ρ e un operatore positivo di classe traccia tale che TrH(ρ) = 1. Un
operatore positivo e caratterizzato dal fatto che (ϕ; Aϕ) > 0 per ogni ϕ ∈ H e quindi, se e definita,
TrH(A) > 0. Questo implica che A†ρA e ancora un operatore positivo e quindi TrH(A†ρA) > 0.
85
Riformulazione algebrica
Astraendo le considerazioni precedenti la Meccanica Quantistica puo essere formu-
lata, o meglio riformulata, in una veste puramente algebrica dichiarando i seguenti
fatti (per le definizioni precise si rimanda all’Appendice B):
osservabili: elementi autoaggiunti di un insieme con struttura di C∗-algebra;
stati: funzionali lineari, continui, positivi e normalizzati sulla C∗-algebra delle
osservabili;
dinamica: gruppo ad un parametro fortemente continuo di ∗-automorfismi (au-
tomorfismi che preservano la struttura C∗) della C∗-algebra delle osservabili.
Via rappresentazione G.N.S. la C∗-algebra si realizza come algebra operatoriale su
un’opportuno spazio di Hilbert, lo stato in cui si trova il sistema si rappresenta
come un vettore ciclico di tale spazio e la dinamica viene implementata unitari-
amente come al solito. Cosı, in generale (se la rappresentazione e irriducibile),
si riottiene la formulazione standard della Meccanica Quantistica. Nel caso di
C∗-algebre commutative, invece, si riottiene esattamente la struttura generale dei
sistemi classici. Quindi questo formalismo ha il vantaggio di incorporare in un
unico linguaggio sia le teorie classiche che quelle quantistiche e le prime si differen-
ziano dalle seconde per il solo fatto di essere descritte in termini di un’algebra delle
osservabili commutativa.
Lo studio delle C∗-algebre consiste di due parti: l’una concerne la struttura
algebrica intrinseca, l’altra ne descrive le possibili rappresentazioni (teoria delle
rappresentazioni). Il maggior risultato in questo senso afferma che ogni C∗-
algebra ammette sempre una rappresentazione fedele in termini di una C∗-algebra
operatoriale su un qualche spazio di Hilbert (Basic Structural Theorem). In
questo senso la definizione assiomatica di C∗-algebra caratterizza tutte le
algebre autoaggiunte ed uniformemente chiuse di operatori su uno spazio di Hilbert
senza dover far riferimento, “a priori”, ad un tale spazio.
4.2 L’approccio algebrico allo studio dei sistemi
estesi
I massimi vantaggi dell’utilizzo della formulazione algebrica della Meccanica Quan-
tistica si hanno quando si vuole trattare i sistemi estesi ovvero quelli che in
86
meccanica statistica vengono chiamati i sistemi macroscopici . Con questa
nomenclatura si denominano i sistemi fisici costituito da un numero estremamente
elevato, “idealmente infinito”, e all’occorrenza variabile di particelle (N → +∞)
distribuiti su regioni di spazio “idealmente infinite” (V → +∞). Nella teoria di
questi sistemi intervengono un numero infinito di gradi di liberta e un’approc-
cio Hilbertiano (standard), che richiede l’identificazione “a priori” di uno spazio di
Hilbert, imporrebbe di considerare uno spazio⊗
j Hj costruito come prodotto ten-
soriale3 degli infiniti spazi di Hilbert Hj che descrivono i vettori di stato associati
ai singoli“sottosistemi costituenti” (ad esempio le singole particelle nel caso di un
gas). Un tale spazio ha diverse “patologie”: non e in generale separabile (anche
se i singoli Hj hanno dimensione finita come nel caso di un sistema di spin), e di
difficile controllo e contiene vettori per la maggior parte privi di significato fisico4.
Il formalismo algebrico, prescindendo da un’identificazione“a priori” degli stati
del sistema, permette di aggirare queste difficolta in un modo estremamente e-
legante. Infatti in questo formalismo e possibile esprimere con chiarezza l’idea
fondamentale per cui i sistemi estesi sono costituiti da un’infinita di sottosiste-
mi finiti e questa idea si concretizza in termini di relazioni tra osservabili. Dato
che ogni osservazione deve essere effettuata in una regione spazialmente e tempo-
ralmente limitata, l’algebra A dovra essere l’unione di algebre AΛ relative a regioni
(spazio-temporali) limitate Λ con la conseguente relazione di inclusione
Λ1 ⊆ Λ2 ⇒ AΛ1 ⊆ AΛ2 .
Nel caso non relativistico le algebre AΛ vengono solitamente associate alle osser-
vazioni a “tempo fisso” e pertanto le osservabili di algebre localizzate su regioni
disgiunte commutano reciprocamente. Una tale richiesta sottintende l’idea che
misure fatte in un medesimo istante su regioni distinte sono indipendenti tra loro.
Per teorie relativistiche il principio di limitatezza della velocita dei segnali im-
pone che le osservabili di algebre associate a regioni dello spazio-tempo separate
da distanze di tipo spazio commutino reciprocamente. Cio equivale ad assumere la
causalita della teoria fisica dato che tutto cio che accade in una data regione dello
spazio-tempo, operazioni di misura incluse, non ammette rapporti di causa-effetto
con cio che accade in zone separate da distanze di tipo spazio5.
3C.f.r. Capitolo 5, Nota 14Questo genere di questioni e trattato estesamente nel Capito 1 di [Thi80].5Il maggiore risultato che questo tipo di approccio ha prodotto e la formalizzazione del-
la localita nella teoria quantistica dei campi all’interno della formulazione algebrica della
87
4.2.1 Algebre quasi-locali di sistemi spazialmente estesi
Proprieta algebriche
Gli oggetti di interesse della meccanica statistica sono i sistemi macroscop-
ici , ossia i sistemi costituiti da un numero molto grande, idealmente infinito,
di sottosistemi costituenti. Se i sistemi macroscopici sono costituiti da infiniti
sottosistemi (di dimensioni piccole ma finite) e se si fa l’ipotesi fisicamente sig-
nificativa di assenza di collasso (in nessun punto dello spazio la densita dei
costituenti deve divergere) allora i sistemi macroscopici devono occupare regioni
illimitate di spazio. Il nostro interesse sara rivolto a sistemi, spazialmente infiniti,
diffusi nell’intero spazio euclideo tridimensionale R3 oppure a sistemi infiniti
con “struttura cristallina” i cui sottosistemi costituenti sono localizzati sui punti
di un reticolo discreto Z3. Una piccola generalizzazione, che non comporta alcuna
difficolta aggiuntiva, si ottiene considerando sistemi spazialmente distribuiti sugli
spazi ν-dimensionali Rν oppure Zν per un qualche ν ∈ N. La maggior parte dei
risultati che seguono e indipendente dalle differenze che caratterizzano gli spazi Rν
e Zν e quindi (fino a quando non diviene necessario specificarli) indicheremo con
il simbolo Kν indifferentemente o l’uno o l’altro. Affermare che il sistema infinito,
“delocalizzato” su tutto Kν , e composto da sottosistemi spazialmente localizzati ci
consente di dare una descrizione fisica dell’intero sistema a partire dalle sue parti
costituenti. Sia Λ una parte finita , ossia un sottoinsieme limitato6 di Kν (nel ca-
so discreto equivale a richiedere che Λ si un sottoinsieme finito di Zν). Conoscere il
sottosistema localizzato in Λ significa, dal punto di vista del formalismo, definire la
C∗-algebra AΛ delle sue osservabili e cio non comporta alcuna difficolta concettuale
in quanto si tratta di un sistema finito (con un numero finito di gradi di liberta).
Indichiamo con P(Kν) l’ insieme potenza di Kν , ossia l’insieme di tutti i suoi
sottoinsiemi, e con Pb(Kν) la collezioni di tutti i suoi sottoinsiemi limitati. Ad
meccanica quantistica. La maggior parte del lavoro in questo settore e stato fatto ad opera di
Haag ([Haa59], [HS62], [HK64]) e di Segal ([Seg47], [Seg59]) a cavallo tra gli anni ’40 e gli anni
’60. Una recente ed organica sistemazione di tutto il formalismo della teoria quantistica di campo
e presentata nel testo di Haag [Haa93].6Sia Λ un sottoinsieme di uno spazio metrico X ed indichiamo con d( ; ) la distanza definita
su X . Chiameremo diametro di Λ il numero
diam(Λ) ≡ supx,y∈Λ
d(x; y)
Diremo che il sottoinsieme Λ ⊂ X e finito se ha diametro finito, ossia se diam(Λ) < +∞. Questa
definizione si estende in modo ovvio agli spazi euclidei Zν e Rν .
88
ogni parte finita Λ ∈ Pb(Kν) dell’intero sistema associamo la relativa C∗-algebra
locale AΛ ed indichiamo con AΛΛ∈Pb(Kν) la collezione di tutte la algebre locali
associate a tutte le parti finite di Kν . E immediato verificare che Pb(Kν) e un
sistema diretto rispetto alla relazione d’ordine indotta dall’inclusione tra insiemi,
ossia
Λ1 ¹ Λ2 ⇔ Λ1 ⊆ Λ2, Λ1, Λ2 ∈ Pb(Kν).
Inoltre Pb(Kν) gode anche di una relazione di ortogonalita indotta dalla proprieta
di disgiunzione tra insiemi, ossia
Λ1⊥Λ2 ⇔ Λ1 ∩ Λ2 = ∅, Λ1, Λ2 ∈ Pb(Kν).
Possiamo riassumere questi due fatti affermando che:
QL.1) la collezione AΛΛ∈Pb(Kν) e un net di C∗-algebre indicizzato dagli elementi
dall’insieme Pb(Kν) che e un sistema diretto rispetto all’inclusione e che
gode di una relazione di ortogonalita indotta dalla disgiunzione.
Questa affermazione e il punto di partenza per la costruzione della struttura
quasi-locale dell’algebra delle osservabili. I dettagli tecnici per la costruzione
astratta di algebre quasi-locali a partire da generici net di C∗-algebre sono discussi
nel Paragrafo B.3. Di seguito, prescindento dalla formulazione astratta, saremo
interessati solamente alla situazione particolare in cui il net delle C∗-algebre e
quello generato dai sottoinsiemi limitati di Kν .
Da un punto di vista fisico e ragionevole supporre che l’“osservazione identica”
venga effettuata con le stesse modalita in ogni punto del sistema e cio si formal-
izza assumendo che tutte le algebre locali AΛ abbiano un’identita comune 1. E
altresı ragionevole che tutte le osservazioni che possono essere fatte in Λ1 sono
anche osservazioni che riguardano la regione Λ2 non appena Λ1 ⊆ Λ2. Queste
considerazioni garantiscono la validita delle due seguenti proprieta:
QL.2) tutte le algebre locali AΛ, per ogni Λ ∈ Pb(Kν), hanno l’identita comune 1;
QL.3) se Λ1 ⊆ Λ2 allora AΛ1 ⊆ AΛ2 .
Le proprieta QL.3), QL.2) e QL.3) consente di costruire l’ algebra delle osser-
vabili locali
A ≡⋃
Λ∈Pb(Kν)
AΛ
che ha la struttura di una ∗-algebra normata generalmente non completa (Para-
grafo B.3). Sebbene l’algebra A possegga tutto il contenuto fisico che riguarda
89
l’intero sistema infinito, il fatto che non sia completa la rende un oggetto matem-
aticamente poco “maneggevole”. Tale pecca, tuttavia, viene eliminata tramite
l’innocua procedura di chiusura in norma, quindi:
QL.4) la C∗-algebra quasi-locale A e ottenuta come chiusura in norma dell’insieme
costituito dall’unione di tutte le algebre locali, ossia
A ≡⋃
Λ∈Pb(Kν)
AΛ
‖ ‖.
Un’assunzione generale sulla struttura dei sistemi grandi e l’indipendenza dei loro
sottosistemi costituenti. Cio si formalizza attraverso la richiesta che misure fatte
su parti disgiunte del sistema non siano reciprocamente influenzabili e a sua volta
l’indipendenza delle misure si esprime algebricamente con la commutativita delle
rispettive osservabili7; quindi:
QL.5) se AΛ1 ∩ AΛ1 = ∅ allora [AΛ1 ; AΛ2 ] = 0.
Dalle precedenti considerazioni segue che e possibile associare ai sistemi fisici,
infinitamente estesi e costituiti da sottosistemi localizzati su regioni finite, una
descrizione in termini di un’algebra quasi-locale A generata dal net delle C∗-algebre
locali AΛΛ∈Pb(Kν).
Le simmetrie spaziali
In molti casi fisicamente interessanti (ed i soli che considereremo) i sistemi macro-
scopici godono di proprieta di simmetria spaziale compatibili con la strut-
tura quasi-locale. Consideriamo un gruppo G di trasformazioni di Kν in se tali
da mandare i sottoinsiemi limitati di Kν in sottoinsiemi ancora limitati, ossia
g : Pb(Kν) → Pb(K
ν) per ogni g ∈ G. L’insieme delle isometrie (rotazioni,
traslazioni e riflessioni) di Kν costituisce un esempio di tale gruppo. La simmetria
descritta da G e compatibile con la struttura del sistema macroscopico se accade
che le leggi fisiche valide nel sottosistema finito localizzato in Λ sono le stesse di
quelle valide in tutti i sottosistemi localizzati nelle parti trasformate g(Λ) per og-
ni g ∈ G. Se tale richiesta e soddisfatta allora le leggi fisiche sono indipendenti
dal gruppo di trasformazioni G che quindi descrive una simmetria della fisica del
7Questa assunzione e corretta limitatamente al caso di sistemi bosonici (che sono gli unici a
cui saremo interessati nel seguito). Per sistemi piu generali, come ad esempio i sistemi fermionici,
si rimanda al Paragrafo B.3.
90
sistema. Dato che le leggi fisiche si formalizzano come relazioni algebriche tra le
osservabili allora l’invarianza delle leggi fisiche a livello locale si deve tradurre nel-
l’indipendenza delle struttura algebrica (locale) dalle trasformazione di simmetria.
Questa richiesta e formalizzata da:
QL.6) il gruppo di trasformazioni G, che manda sottoinsiemi limitati di Kν in sot-
toinsiemi ancora limitati, e una simmetria del sistema se esiste una rappre-
sentazione G 3 g → τg ∈ Aut(A) del gruppo G negli ∗-automorfismo di A
tale che
τg(AΛ) = Ag(Λ) ∀ Λ ∈ Pb(Kν), ∀ g ∈ G.
Se τg e un ∗-automorfismo di A allora τg agisce (per restrizione) come un ∗-iso-
morfismo tra le algebre locali AΛ e Ag(Λ) e quindi mappa le osservabili della prima
nelle osservabili della seconda preservando le relazioni algebriche; cio garantisce la
covarianza delle leggi fisiche.
Sistemi invarianti per traslazioni spaziali
Tra tutti i sistemi infiniti dotati di simmetria quelli a cui saremo maggiormente
interessati sono i sistemi invarianti per traslazioni spaziali , ossia i sistemi
infiniti che ammettono come simmetria spaziale le traslazioni. Gli spazi Zν e Rν
sono dotati in modo intrinseco di una struttura di gruppo additivo e abeliano
che individua il gruppo delle traslazioni spaziali . Ogni x ∈ Kν induce una
trasformazione gx : Kν → Kν definita da gx(y) = x + y per ogni y ∈ Kν . Questa
trasformazione e evidentemente isometrica, ‖gx(y)− gx(z)‖ = ‖x+y− (x+ z)‖ =
‖y−z‖, e quindi manda sottoinsiemi limitati di Kν in sottoinsieme ancora limitati.
In particolare se Λ e un sottoinsieme limitato di Kν e se x e un generico elemento
di Kν , indicheremo l’azione di x su Λ tramite la piu esplicativa notazione x + Λ,
anziche gx(Λ). L’insieme x + Λ, definito da
x + Λ ≡ x′ | x′ ∈ Kν , x′ = x + y, ∀ y ∈ Λ,
e detto traslato x di Λ.
Nel seguito indicheremo con il simbolo A,Kν la struttura di algebra quasi-
locale associata ad un sistema infinito dotato di simmetria per traslazioni. In
questo caso la proprieta QL.6) afferma che deve esistere una rappresentazione
Kν 3 x → τx ∈ Aut(A) del gruppo additivo e abeliano Kν negli ∗-automorfismi
dell’algebra quasi-locale A tale che
τx(AΛ) = A(x+Λ) ∀ Λ ∈ Pb(Kν), ∀x ∈ Kν .
91
I sistemi A,Zν e A,Rν sono chiamati rispettivamente reticolo infinito e
sistema continuo.
4.2.2 Stati invarianti per traslazioni
Un sistema infinito con simmetria per traslazioni spaziali e descritto dall’ alge-
bra quasi-locale A,Kν su cui il gruppo Kν agisce come gruppo delle traslazioni
implementato dagli ∗-automorfismi τx. Tra tutti gli stati ω ∈ EA che agiscono sul-
la C∗-algebra A risultano di particolare interesse gli stati stati Kν-invarianti
definiti da
ω(A) = ω(τx(A)) ∀ x ∈ Kν , ∀ A ∈ A.
L’insieme di tutti gli stati Kν-invarianti su A e indicato con il simbolo EKν
A . Gli as-
petti generali degli stati invarianti su C∗-algebre dotate di simmetrie generiche sono
trattati nel Paragrafo B.5.1. Per il momento e sufficiente ricordare che l’insieme
EKν
A e un sottoinsieme convesso e ∗-debolmente compatto (in quanto ∗-debolmente
chiuso) contenuto nel duale A∗ e quindi in virtu del Teorema di Krein-Millman
(Paragrafo B.1.7) esso risulta generato dalla chiusura ∗-debole di tutte le combi-
nazioni convesse dei suoi stati estremali. Ricordiamo che gli stati estremali di EKν
A
sono gli stati che non si decompongono come combinazioni convesse e non banali di
elementi di EKν
A . Essi vengono chiamati stati Kν-ergodici o piu semplicemente
stati ergodici ed il loro insieme si indica con E(EKν
A ) ≡ PKν
A . Per il Teorema di
Krein-Millman questo insieme e certamente non vuoto se esiste almeno uno stato
invariante (infatti genera per inviluppo convesso tutto l’insieme EKν
A ).
Si definisce l’ azione aggiunta τ ∗ del gruppo delle traslazioni Kν sul duale
A∗ nel modo seguente (Paragrafo B.5.1)
(τ ∗x(φ))(A) ≡ φ(τx(A)) ∀ x ∈ Kν , ∀ A ∈ A, ∀ φ ∈ A∗.
La precedente relazione associa ad ogni punto x ∈ Kν un operatore τ ∗x lineare
ed isometrico (e quindi invertibile) che mappa A∗ in se. Si verifica facilmente, a
partire dalla precedente definizione (e dall’abelianita di Kν), che l’insieme degli
operatori τ ∗x definisce una rappresentazione del gruppo Kν su A∗. Inoltre le mappe
τ ∗x mandano funzionali positivi in funzionali positivi e dato che sono isometriche
mandano stati (funzionali positivi e normalizzati) in stati, ossia τ ∗x : EA → EA per
ogni x ∈ Kν . I funzionali invarianti sono caratterizzati dalla proprieta τ ∗x(φ) = φ
per ogni x ∈ Kν e cio implica immediatamente che gli insiemi EKν
A e PKν
A sono
preservati puntualmente dalle traslazioni.
92
Se ω ∈ EKν
A allora (in base alla Proposizione B.1.7) esiste una rappresentazione
del gruppo Kν in termini di operatori unitari Uω(x) per ogni x ∈ Kν che agiscono
sullo spazio di Hilbert Hω sede della rappresentazione G.N.S. Hω, πω, ψω asso-
ciata allo stato ω. Questa rappresentazione e univocamente determinata dalle due
condizioni
Uω(x)πω(A)Uω(x)† = πω(τx(A))
∀ x ∈ Kν , ∀ A ∈ A
Uω(x)ψω = ψω.
Nel seguito verra utilizzata la notazione sintetica Hω, πω, Uω(Kν), ψω per riferirci
alla struttura costituita dalla rappresentazione G.N.S. e dall’azione unitaria sullo
spazio di rappresentazione del gruppo Kν . Indicheremo con Pω il proiettore ortog-
onale su Hω la cui immagine e costituita dai vettori di Hω invarianti sotto l’azione
di tutti gli operatori Uω(x). Cio implica che [Pω : Uω(x)] = 0 per ogni x ∈ Kν .
Nel caso particolare in cui il gruppo di simmetria e dato dalle traslazioni con-
tinue Rν se xnn∈N e una successione convergente a x e se risulta verificata la
proprieta
limxn→x
‖τxn(A)− τx(A)‖ = 0 ∀ A ∈ A,
allora si dimostra (Proposizione B.1.8) che il gruppo unitario Uω(Rν) che imple-
menta le traslazioni e anche fortemente continuo.
Evidentemente una tale proprieta non e rilevante nel caso delle traslazioni
discrete in quanto Zν ammette come successioni convergenti le sole successioni
costanti.
4.3 Abelianita e clustering nei sistemi estesi
Il gruppo di simmetria Kν induce sulla’algebra quasi-locale delle osservabili A
delle importanti proprieta. Mostreremo che i sistemi A,Kν sono “approssi-
mativamente abeliani” e gli stati Kν-invarianti definiti su A sono “approssimati-
vamente fattorizzabili”. Le proprieta che discuteremo possono essere introdotte
per generiche C∗-algebre (non necessariamente quasi-locale) sulle quali agisce un
qualche gruppo di simmetria G (non necessariamente le traslazioni). Si rimanda
ai Paragrafi B.5.3 e B.5.4 per una presentazione piu generale di questi argomenti.
93
4.3.1 Abelianita asintotica uniforme
Consideriamo un sistema esteso A,Kν con A algebra quasi locale e Kν gruppo
delle traslazioni. Siano Λ1, Λ2 ∈ Pb(Kν) due sottoinsiemi finiti diKν e supponiamo
che che Λ1 ∩ Λ2 6= ∅. Verifichiamo che esiste sempre un numero r = r(Λ1, Λ2) > 0
tale che Λ1 ∩ (x + Λ2) = ∅ per ogni x ∈ Kν con ‖x‖ > r. Indichiamo con
dj = supy∈Λj‖y‖ con j = 1, 2 e osserviamo che dj < +∞ dato che per ipotesi
gli insiemi Λ1 e Λ2 sono limitati. Sia B ≡ z | z ∈ Kν , ‖z‖ 6 d1 la palla chiusa
centrata nell’origine e di raggio d1. Evidentemente Λ1 ⊂ B. Poniamo r = d1 + d2
e consideriamo un generico x ∈ Kν tale da verificare ‖x‖ = r + ε con ε > 0. Ogni
punto dell’insieme (x + Λ2) e della forma x + y al variare di y ∈ Λ2. Vale la
seguente disuguaglianza
‖x + y‖ = ‖x− (−y)‖ >∣∣‖x‖ − ‖y‖
∣∣ =∣∣d1 + d2 + ε− ‖y‖
∣∣ > d + ε
dato che d2 > ‖y‖. Cio prova che non appena ‖x‖ > r ogni punto dell’insieme
(x + Λ2) dista dall’origine piu di d1 e quindi B ∩ (x + Λ2) = ∅. Se si tiene conto
del fatto che Λ1 e contenuto in B segue che
Λ1 ∩ (x + Λ2) = ∅ se ‖x‖ > r (4.1)
dove la costante r e legata agli insiemi Λ1 e Λ2 da
r = r(Λ1, Λ2) ≡ supy∈Λ1
‖y‖+ supy∈Λ2
‖y‖. (4.2)
Questo fatto geometrico, che dipende unicamente dalle caratteristiche dello
spazio Kν , ha una conseguenza immediata sulla struttura dell’algebra quasi-locale
A. Indichiamo con il simbolo A ≡ ⋃Λ AΛ, con Λ ∈ Pb(K
ν), l’algebra delle osser-
vabili locali. Siano A,B ∈ A due osservabili locali appartenenti rispettivamente
alle algebre locali AΛ1 e AΛ2 associate a sottoinsiemi limitati Λ1 e Λ2. In base
alle (4.1) e (4.2) per ogni x ∈ Kν con ‖x‖ > r gli insiemi Λ1 e (x + Λ2) sono
disgiunti e quindi le rispettive algebre locali AΛ1 e A(x+Λ2) = τx(AΛ2) commutano
reciprocamente. Quindi per ogni A,B ∈ A esiste sempre una costante r dipendente
dalle osservabili, tale che [A, τx(B)] = 0 se ‖x‖ > r. Consideriamo un’osservabile
quasi-locale A ∈ A. Per costruzione A e ottenuta come limite in norma di una
successione Ann∈N di osservabili locali An ∈ A per ogni n ∈ N. Osserviamo che
per ogni C ∈ A
‖[A; C]− [An; C]‖ 6 ‖(A− An)C‖+ ‖C(A− An)‖ 6 2‖A− An‖ ‖C‖
94
da cui segue che [A; C] e il limite in norma di [An; C]. Se B e un elemento del-
l’algebra locale A, x un generico punto di Kν e τx lo ∗-automorfismo associato la
precedente disuguaglianza diviene
‖[A; τx(B)]− [An; τx(B)]‖ 6 2‖A− An‖ ‖B‖ (4.3)
dove si e tenuto conto che gli ∗-automorfismi preservano le norme. Comunque
fissato ε > 0 esistere un n′ = n′(ε, B) ∈ N tale che ‖A − An′‖ < ε (2‖B‖)−1.
Quindi per la (4.3), indipendentemente da x ∈ Kν
‖[A; τx(B)]− [An′ ; τx(B)]‖ < ε.
Sia xnn∈N una successione in Kν che verifica la seguente richieste: per ogni r > 0
esiste un n′ = n′(r) ∈ N tale che ‖xn‖ > r per ogni n > n′. Indicheremo queste
successioni con il simbolo x → ∞. In base alle (4.1) e (4.2), fissate le osservabili
locali An′ e B esiste un r′ > 0 ed un m′ = m′(r′) ∈ N tali che ‖xm′‖ > r′ e
[An′ ; τxn(B)] = 0 per ogni n > m′. Dalla precedente disuguaglianza segue che
‖[A; τxn(B)]‖ < ε per ogni n > m′ e per l’arbitrarieta di ε si ottiene che
limx→∞
‖[A; τx(B)]‖ = 0 ∀ A ∈ A, ∀ B ∈ A. (4.4)
Siano A,C ∈ A e sia Cnn∈N ⊂ A la successione di osservabili locali che converge
a C. Se x e un generico punto di Kν e τx lo ∗-automorfismo associato allora
‖[A; τx(C)]− [A; τx(Cn)]‖ 6 ‖Aτx(C − Cn)‖+ ‖τx(C − Cn)A‖ 6 2‖A‖ ‖C − Cn‖.
Dalla seguente catena di disuguaglianze
∣∣‖[A; τx(C)]‖ − ‖[A; τx(Cn)]‖∣∣ 6 ‖[A; τx(C)]− [A; τx(Cn)]‖
6 ‖[A; τx(C)]‖+ ‖[A; τx(Cn)]‖
discende che
limx→∞
‖[A; τx(C)]− [A; τx(Cn)]‖ = limx→∞
‖[A; τx(C)]‖
dato che per la (4.4) limx→∞ ‖[A; τx(Cn)]‖ = 0 per ogni Cn e quindi
limx→∞
‖[A; τx(C)]‖ 6 2‖A‖ ‖C − Cn‖ ∀ n ∈ N.
Dato che la quantita ‖C − Cn‖ puo essere resa piccola a piacere resta provato il
seguente risultato:
95
4.3.1 Proposizione. Sia A,Kν la struttura quasi locale associata ad un sistema
esteso con simmetria per traslazioni. Il sistema e asintoticamente abeliano in
norma, ossia
limx→∞
‖[A; τx(B)]‖ = 0 ∀ A,B ∈ A
dove il x→∞ indica una generica successione di punti di Kν tale che ‖x‖ → +∞.
La proprieta di abelianita asintotica in norma , detta anche abelianita
asintotica uniforme , e una forma approssimata di abelianita indotta sulla C∗-
algebra dalla presenza del gruppo di simmetria Kν . Sotto l’effetto delle traslazioni
ogni osservabile tende a divenire indipendente da ogni altra osservabile del sistema.
L’abelianita asintotica uniforme e di grande importanza ed implica imme-
diatamente una proprieta piu debole, detta abelianita Kν-asintotica . In ge-
nerale (Paragrafo B.5.3) una C∗-algebra A (non necessariamente quasi-locale) e
Kν-abeliana se, rispetto ad una qualche classe di stati ω ∈ EA, accade che
infB′∈ch(τ
Kν (B))
∣∣ω([A; B′])∣∣ = 0 ∀ A,B ∈ A (4.5)
avendo indicato con ch(τKν (B)) l’inviluppo convesso (ossia l’insieme delle combi-
nazioni convesse finite) generato dall’insieme τKν (B) ≡ τx(B) | ∀ x ∈ Kν che
contiene tutte le traslazioni di B. Qualsiasi sia lo stato ω ∈ EA la disuguaglianza
|ω(A)| 6 ‖A‖ valida per ogni A ∈ A implica che
infB′∈ch[τ
Kν (B)]
∣∣ω([A; B′])∣∣ 6 inf
B′∈ch[τKν (B)]
‖[A; B′]‖
e dall’inclusione τKν (B) ⊂ ch[τ
Kν (B)] segue ancora
infB′∈ch[τ
Kν (B)]‖[A; B′]‖ 6 inf
B′∈τKν (B)
‖[A; B′]‖ = infx∈Kν
‖[A; τx(B)]‖.
Come diretto corollario della Proposizione 4.3.1 segue che:
4.3.2 Proposizione. Sia A,Kν la struttura quasi locale associata ad un sistema
esteso con simmetria per traslazioni. Il sistema e Kν-asintoticamente abeliano
per tutti gli stati ω ∈ EA.
La proprieta di abelianita Kν-asintotica, che come abbiamo verificato e im-
plicata dell’abelianita asintotica uniforme, e la proprieta che garantisce l’unicita
della decomposizione ergodica degli stati Kν-invarianti (decomposizione degli
stati invarianti in termini degli stati ergodici). Cio avra conseguenze rilevanti nel
seguito di questo lavoro.
In base alla nomenclatura standard (Paragrafo B.5.3) se ω ∈ EKν
A e uno stato
Kν-invariante sull’algebra quasi-locale A diremo che la coppia A, ω e Kν-abe-
liana .
96
4.3.2 Proprieta di cluster degli stati sui sistemi estesi
Per ulteriori sviluppi e utile studiare sotto quali condizioni i sistemi A,Kνammettono stati ω che verificano la seguente proprieta:
limx→∞
∣∣ω(A τx(B))− ω(A)ω(τx(B))∣∣ = 0 ∀ A,B ∈ A (4.6)
per qualche successione di punti di Kν tale che ‖x‖ → +∞. La proprieta (4.6)
e detta di condizione di clustering e chiameremo gli stati che la verificano
stati cluster . Gli stati che verificano questa proprieta si comportano come stati
“approssimativamente fattorizzati” sotto l’effetto delle traslazioni spaziali e cio
significa, da un punto di vista fisico, che ammettono correlazioni a corto raggio. La
proprieta di abelianita asintotica uniforme, propria dei sistemi A,Kν, ha un ruolo
importante anche riguardo alle proprieta di cluster. In particolare mostreremo
come tutti gli stati gli stati fattoriali sull’algebra quasi-locale A su cui agisce il
gruppo di simmetria Kν verificano la (4.6). La definizione e le proprieta degli
stati fattoriali sono discusse nel Paragrafo B.2.1. Ricordiamo brevemente che uno
stato ω ∈ EA si dice fattoriale se, relativamente alla rappresentazione G.N.S.
Hω, πω, ψω che esso induce, vale la seguente relazione
Zω(A) = πω(A)′ ∩ πω(A)′′ = C1ω
dove πω(A)′ indica il commutante della C∗-algebra πω(A) (ossia l’insieme di tutti
gli operatori limitati L (Hω) che commutano con ogni elemento di πω(A)) e con
πω(A)′′ il bicommutante di πω(A) (ossia l’insieme di tutti gli operatori limitati
L (Hω) che commutano con ogni elemento di πω(A)′). La quantita Zω(A) e detta
centro dell’algebra di von Neumann generata πω(A)′′ e quando accade che il cen-
tro e costituito solamente dai multipli di 1ω allora πω(A)′′ e detto fattore .
Consideriamo la C∗-algebra B generata su Hω dall’insieme di operatori πω(A) ∪ πω(A)′
(chiusura in norma dell’insieme di tutti i polinomi finiti). Un operatore che commuta con tutti
gli elementi di πω(A)∪πω(A)′ deve commutare singolarmente con tutti gli operatori in πω(A) ed
in πω(A)′, ossia deve appartenere a πω(A)′ ∩ πω(A)′′. Se ω e fattoriale allora B′ = C1ω dato
che se un operatore commuta con ogni elemento di B allora commuta anche con tutti gli elementi
di πω(A) ∪ πω(A)′. Come conseguenza del Lemma di Schur (Paragrafo B.1.9) la C∗-algebra
B e irriducibile su Hω ossia non vi sono sottospazio di Hω invariante sotto l’azione di tutti gli
operatori contenuti in B esclusi i sottospazi banali 0 e Hω. Il vettore ϕA ≡ πω(A)ψω−ω(A)ψω
e ortogonale al vettore ψω infatti, per come e costruita la rappresentazione G.N.S., segue che
(ψω; ϕA) = (ψω; πω(A)ψω)− ω(A) (ψω;ψω) = ω(A)− ω(A)‖ψω‖ = 0.
97
Indichiamo con Πω ∈ L (Hω) e il proiettore ortogonale sul sottospazio generato da ψω definito
da Πω ≡ (ψω; ·) ψω. Evidentemente Πω e autoaggiunto ed inoltre ΠωϕA = 0 e Πωψω = ψω.
Come conseguenza del Teorema di transitivita di Kadison8 segue che esiste un operatore
hermitiano Πω ∈ B tale che ΠωϕA = 0 e Πωψω = ψω. Definiamo i due operatori C1, C2 ∈ B nel
seguente modo
C1 ≡ Πω(πω(A)− ω(A)1ω), C2 ≡ (1ω − Πω)(πω(A)− ω(A)1ω)
ed evidentemente C1ψω = ΠωϕA = 0 e C2ψω = (1ω − Πω)ϕA = φA. Poiche Πω e autoaggiunto
C2† = (πω(A)† − ω(A) 1ω)(1ω − Πω)
da cui segue che C2†ψω = (πω(A)†−ω(A) 1ω)(ψω−Πωψω) = 0. Infine osserviamo che C1 +C2 =
πω(A)− ω(A)1ω da cui πω(A) = ω(A)1ω + C1 + C2. Considerando che
ω(A τx(B))− ω(A)ω(τx(B))
= (ψω; πω(A)πω(τx(B))ψω)− ω(A)(ψω; πω(τx(B))ψω)
= (ψω; (ω(A)1ω + C1 + C2)πω(τx(B))ψω)− ω(A)(ψω;πω(τx(B))ψω)
= (ψω; C1πω(τx(B))ψω) + (ψω;C2πω(τx(B))ψω)
= (ψω; C1πω(τx(B))ψω) + (C2†ψω; πω(τx(B))ψω) = (ψω;C1πω(τx(B))ψω)
ed osservando che (ψω;πω(τx(B))C1ψω) = 0 vale la seguente uguaglianza
ω(A τx(B))− ω(A)ω(τx(B)) = (ψω; [C1;πω(τx(B))]ψω). (4.7)
Poiche C1 ∈ B e dato che B e generato come chiusura in norma di polinomi finiti di elementi di
πω(A) ∪ πω(A)′ segue che per ogni ε > 0 deve esistere una famiglia finita A1, . . . , An ∈ A ed
una famiglia finita D1, . . . , Dn ∈ πω(A)′ tali che∥∥∥∥∥∥C1 −
n∑
j=1
πω(Aj)Dj
∥∥∥∥∥∥<
ε
2‖B‖ .
8Il Teorema di transitivita di Kadison afferma che se A ⊂ L (H) una C∗-algebra ir-
riducibile di operatori limitati sullo spazio di Hilbert H, se ψ1, . . . , ψn e ϕ1, . . . , ϕn sono due
famigli finite di vettori di H e se Π ∈ L (H) e un operatore tale per cui Πψj = φj per ogni
j = 1, . . . , n allora esiste un T ∈ A con le stesse proprieta e con ‖T‖ = ‖T‖. Inoltre se T e
autoaggiunto anche T puo essere scelto autoaggiunto e se T e unitario anche T puo essere scelto
unitario. C.f.r.[Kad67] per la dimostrazione ed ulteriori sviluppi.
98
Inserendo questa stima nella (4.7) e considerando che ‖ψω‖ = 1 si ottiene che
|ω(A τx(B))− ω(A)ω(τx(B))| 6 ‖[C1;πω(τx(B))]‖
=
∥∥∥∥∥∥
C1 −
n∑
j=1
πω(Aj)Dj +n∑
j=1
πω(Aj)Dj
;πω(τx(B))
∥∥∥∥∥∥
6
∥∥∥∥∥∥
C1 −
n∑
j=1
πω(Aj)Dj
; πω(τx(B))
∥∥∥∥∥∥+
∥∥∥∥∥∥
n∑
j=1
πω(Aj)Dj ; πω(τx(B))
∥∥∥∥∥∥
6 2
∥∥∥∥∥∥C1 −
n∑
j=1
πω(Aj)Dj
∥∥∥∥∥∥‖πω(τx(B))‖+
n∑
j=1
‖[πω(Aj)Dj ; πω(τx(B))]‖
6 2ε
2‖B‖‖τx(B)‖+n∑
j=1
‖[πω(Aj); πω(τx(B))] Dj + πω(Aj) [Dj ;πω(τx(B))]‖ .
Poiche che [Dj ;πω(τx(B))] = 0 per ogni j = 1, . . . , n in quanto Dj ∈ πω(A)′ e dato che τx
preserva le norme segue ancora
|ω(A τx(B))− ω(A)ω(τx(B))| 6 ε +n∑
j=1
‖[πω(Aj); πω(τx(B))]Dj‖
6 ε +n∑
j=1
‖πω([Aj ; τx(B)])‖ ‖Dj‖ 6 ε +n∑
j=1
‖[Aj ; τx(B)]‖ ‖Dj‖.
La proprieta di abelianita asintotica uniforme impone che limx→∞ ‖[Aj ; τx(B)]‖ = 0 per ogni
Aj ∈ A con j = 1, . . . , n e quindi la precedente disuguaglianza implica che gli stati fattoriali su
A verificano effettivamente la proprieta (4.6).
4.3.3 Proposizione. Sia A,Kν la struttura quasi locale associata ad un sistema
esteso con simmetria per traslazioni. Ogni stato fattoriale ω ∈ EfA verifica la
condizione di cluster.
Nel dedurre questo risultato non e stato necessario supporre che lo stato ω fosse
anche Kν-invariante. Quando questa ulteriore condizione e soddisfatta allora la
(4.6) diviene
limx→∞
∣∣ω(A τx(B))− ω(A)ω(B)∣∣ = 0 ∀ A,B ∈ A. (4.8)
Per stati Kν-invarianti e fattoriali si puo dimostrare una proprieta di clustering
ancora piu forte. Siano x(1)n n∈N e x(2)
n n∈N due successioni di punti di Kν che
99
verificano le seguenti condizioni: per ogni r > 0 esiste un n′ = n′(r) ∈ N tale che
‖x(1)n − x
(2)n ‖ ≡ ‖x(12)
n ‖ > 0 per ogni n > n′. Indicheremo queste successioni con
il simbolo x(12) →∞. Se queste condizioni sono soddisfatte l’abelianita asintotica
uniforme implica che per ogni A,B ∈ A
0 = limx(12)→∞
‖[A; τ(x(1)−x(2))(B)‖ = limx(12)→∞
‖[A; (τ−1x(2) τx(1))(B)‖
Applicando questo risultato allo stato Kν-invariante e fattoriale ω si ottiene dal-
l’equazione (4.8)
limx(12)→∞
∣∣ω(A(τ−1x(2) τx(1))(B))− ω(A)ω(B)
∣∣ = 0 ∀ A,B ∈ A.
Utilizzando l’invarianza di ω la precedente equazione si riscrive
limx(12)→∞
∣∣ω(τx(2)(A) τx(1)(B))− ω(A)ω(B)∣∣ = 0 ∀ A,B ∈ A. (4.9)
La (4.9) viene chiamata condizione di mixing forte e gli stati che la verificano
sono chiamati stati mixing .
I risultati ottenuti possono essere riassunti nel seguente modo: sia A un’algebra
quasi-locale su cui Kν individua il gruppo di simmetria delle traslazioni e sia ω ∈EA uno stato su A allora
ω e fattoriale ⇒ ω e cluster
ω e fattoriale ed invariante ⇒ ω e mixing.
Per concludere osserviamo che se uno stato invariante ω ∈ EKν
A verifica la
condizione di clustering (4.8) allora verifica anche la condizione piu debole
infB′∈ch(τ
Kν (B))
∣∣ω(AB′)− ω(A)ω(B)∣∣ = 0 ∀ A,B ∈ A. (4.10)
Questa condizione di mixing piu debole e importante nella teoria della decompo-
sizione ergodica in quanto assicura che nella rappresentazione G.N.S. indotta dallo
stato ω il sottospazio di Hω invariante rispetto alle traslazioni e unidimensionale
(Paragrafo B.5.4, Proprieta SE.2)).
100
Capitolo 5
I sistemi quantistici di spin
I sistemi quantistici di spin rappresentano modelli teorici relativamente sem-
plici su cui implementare la formulazione algebrica della Meccanica Quantistica e
testarne i risultati generali. Ad esempio sono modelli utili per studiare problemi
tipo le transizioni di fase e le rotture spontanee di simmetria che coinvolgono ne-
cessariamente sistemi infiniti. Sebbene si tratti di modelli discreti, e sicuramente
non adatti a descrivere i piu generali aspetti della realta, offrono un ampio campo
di ricerca e di applicazione. Il vantaggio maggiore che forniscono nasce dal fatto
che la teoria che si sviluppa e generalmente priva di tutte le“sofisticazioni” tec-
niche tipiche del continuo. Inoltre i sistemi di spin, sotto ipotesi molto generali,
ammettono una dinamica sull’intero reticolo infinito e questo, all’atto pratico, li
rende gli unici sistemi infiniti su cui e possibile studiare questioni di approccio
all’equilibrio. Tuttavia la semplicita di questi modelli e solo “relativa”. General-
mente non e quasi mai possibile fare calcoli espliciti tranne pochi passaggi iniziali
e anche le simulazioni al computer si limitano ad un numero esiguo di siti (sebbene
gli aspetti interessanti nascano quando si considera il reticolo infinito). I sistemi
di spin costituiscono il modello base su cui si sviluppa il contenuto di questo la-
voro e pertanto forniamo di seguito una sintesi degli aspetti piu significativi della
teoria di questi modelli. I lavori di riferimento sono l’enciclopedico testo di Simon
[Sim93] ed il testo di Ruelle [Rue69].
5.1 Aspetti cinematici
Un sistema quantistico di spin (quantum spin system) e una collezione
di “particelle” vincolate ad occupare in modo permanente i siti di un reticolo (da
cui anche l’espressione quantum lattice system) e che interagiscono a distanza
101
per accoppiamento dei rispettivi spin vicendevolmente e/o con un campo esterno.
Cio comporta un’evoluzione temporale per cui le orientazioni degli spin cambiano
nel tempo in accordo alle leggi fisiche che definiscono il sistema. In generale come
reticolo di base per il sistema si utilizza Zν . Questa scelta e tutt’altro che riduttiva
in quanto e possibile dimostrare che ogni sottoinsieme L ⊂ Rν tale che: i) se
x,y ∈ L allora x + y ∈ L e −x ∈ L; ii) L e discreto; iii) L non e contenuto in
nessun sottospazio proprio di Rν , e isomorfo a Zν , ossia esiste una ν-upla di vettori
x1, . . . ,xν ∈ Rν tale che L = y =∑ν
j=1 njxj | (n1, . . . , nν) ∈ Zν.La struttura matematica di un sistema quantistico di spin si formalizza in
tre passi: il primo consiste nel definire la struttura di ogni singolo sito; il secon-
do consiste nel definire la struttura delle collezioni finite di siti; il terzo consiste
nell’estensione dalla struttura all’intero reticolo.
SQS.1) La particella che si trova nel sito x ∈ Zν e un sottosistema quantistico
descritto da uno spazio di Hilbert Hx. Generalmente si assume che Hx
abbia dimensione finita ed in particolare se la particella in x ha spin s/2 allora
risulta che dim(Hx) = 2s+1. Assumeremo che lo spin s sia indipendente dal
particolare sito x e cio equivale a considerare il sistema costituito da particelle
identiche. Ovviamente la situazione puo essere generalizzabile al caso di un
sistema con particelle con spin diversi (sito dipendenti) oppure a particelle
con uno spettro di orientazioni continuo e non discreto (dim(Hx) = +∞).
SQS.2) Sia Λ ∈ Pb(Zν) un sottoinsieme finito di Zν e sia Hxx∈Λ la collezione
degli spazi di Hilbert relativi alle particelle contenute in Λ. Indichiamo con
il simbolo HΛ
⊗x∈ΛHx il prodotto tensoriale della collezione di spazi
di Hilbert1 Hxx∈Λ. A questo spazio resta associata la C∗-algebra locale
AΛ = L (HΛ) costituita dagli operatori limitati sullo spazio di Hilbert HΛ.
1Sia H1, . . . ,Hn una collezione finita di spazi di Hilbert rispettivamente di dimensioni
d1, . . . , dn. Sia e(h)j con j = 1, . . . , dh una base dello spazio Hh con h = 1, . . . , n. Con-
sideriamo il simbolo formale e(j1, . . . , jn) ≡ e(1)j1
⊗ . . . ⊗ e(n)jn
che definisce d = d1 . . . dn
oggetti distinti. Si chiama prodotto tensoriale degli spazi di Hilbert H1, . . . ,Hn, e si
indica con H1 ⊗ . . . ⊗ Hn, lo spazio vettoriale costituito da tutti gli oggetti della forma∑aj1...jne(j1, . . . , jn) con aj1...jn ∈ C. Lo spazio prodotto ha evidentemente dimensione
d = d1 . . . dn. Scelti i vettori ψ(1) =∑
b(1)j1
e(1)j1
, . . . , ψ(n) =∑
b(n)jn
e(n)jn
resta definito l’elemen-
to ψ(1) ⊗ . . . ⊗ ψ(n) ≡ ∑b(1)j1
. . . b(n)jn
e(j1, . . . , jn) che prende il nome di vettore fattorizzato.
L’espressione (ψ(1)⊗. . .⊗ψ(n); ϕ(1)⊗. . .⊗ϕ(n)) =∏
h(ψ(h); ϕ(h)) =∑
b(1)j1
c(1)j1
. . . b(n)jn
c(n)jn
definisce
il prodotto scalare su coppie di vettori fattorizzati e questa operazione si estende a due generici
vettori dello spazio prodotto ψ =∑
aj1...jne(j1, . . . , jn), ϕ =∑
bj1...jne(j1, . . . , jn) tramite la
relazione (ψ;ϕ) =∑
aj1...jnbj1...jn . Il prodotto scalare induce una norma che nel caso dei vettori
102
Osserviamo che per costruzione L (HΛ) = L (⊗
x∈ΛHx) =⊗
x∈Λ L (Hx)
ossia vale la relazione AΛ =⊗
x∈Λ Ax in base alla quale AΛ e il prodotto
tensoriale delle C∗-algebre2 di singolo sito Ax. Per motivi tecnici si
definisce H∅ = C e A∅ i multipli dell’identita.
SQS.3) Osserviamo che se Λ1∩Λ2 = ∅ alloraHΛ1∪Λ2 = HΛ1⊗HΛ2 e quindi a livello di
operatori AΛ1∪Λ2 = L (HΛ1∪Λ2) = L (HΛ1)⊗L (HΛ2) = AΛ1⊗AΛ2 . In base a
questa relazione segue che la C∗-algebra di operatori AΛ associata alla regione
finita Λ e immergibile in modo naturale nella C∗-algebra operatoriale AΛ′
associata ad una regione finita piu grande Λ ⊂ Λ′ tramite lo ∗-isomorfismo
: AΛ → AΛ′ definito da (A) = A⊗1Λ′\Λ per ogni A ∈ AΛ ed avendo indicato
con 1Λ′\Λ l’identita relativa alla regione finita Λ′\Λ. Tramite questa relazione
AΛ risulta ∗-isomorfa alla C∗-sottoalgebra (AΛ) ⊂ AΛ′ . Due elementi A ∈AΛ1 e B ∈ AΛ2 si dicono equivalenti se tramite l’isomorfismo coincidono
come elementi della C∗-algebra AΛ1∪Λ2 . Evidentemente cio accade se e solo
se esiste un operatore C ∈ AΛ1∩Λ2 tale che se immerso in AΛ1 tramite
coincide con A ed invece immerso in AΛ2 coincide con B. Indichiamo con
il simbolo A l’insieme delle classi di equivalenza in⋃
Λ∈Pb(Zν) AΛ. L’insieme
A ha in modo naturale una struttura di ∗-algebra; e chiusa per aggiunzione
e se A ∈ AΛ1 e B ∈ AΛ2 allora questi due elementi sono equivalenti a due
elementi A′, B′ ∈ AΛ1∪Λ2 tramite la mappa ed a questo punto sono ben
definite le operazioni A′ + B′ e A′B′. L’insieme A e detto algebra delle
osservabili locali . Su A e definita in modo naturale una norma dato che
la mappa e isometrica ed il completamento in norma dell’insieme
A ≡⋃
Λ∈Pb(Zν)
AΛ
‖ ‖
fattorizzati si esprime da ‖ψ(1) ⊗ . . . ⊗ ψ(n)‖2 =∏
h ‖ψ(h)‖2 =∑(
b(1)j1
)2
. . .(b(n)jn
)2
. L’espres-
sione ‖ψ‖2 =∑
aj1...jnaj1...jn generalizza la norma al generico vettore ψ ≡ ∑aj1...jne(j1, . . . , jn)
dello spazio prodotto. Lo spazio H1 ⊗ . . .⊗Hn e reso completo da questa norma. Per maggiori
dettagli C.f.r. [BR79] Paragrafo 2.7.2.2Sia A1, . . . , An una collezione finita di C∗-algebre operatoriali che operano rispettivamente
sulla collezione finita di spazi di Hilbert H1, . . . ,Hn. La C∗-algebra A1⊗. . .⊗An, detta prodotto
tensoriale delle C∗-algebre A1, . . . , An e generata dagli elementi A1 ⊗ . . .⊗An, con Ah ∈ Ah
per ogni h = 1, . . . , n, che agiscono sui vettori fattorizzati ψ(1) ⊗ . . .⊗ ψ(n) secondo la relazione
(A1⊗ . . .⊗An)(ψ(1)⊗ . . .⊗ψ(n)) = A1ψ(1)⊗ . . .⊗Anψ(n). Per linearita gli operatori A1⊗ . . .⊗An
sono estesi a tutto H1⊗ . . .⊗Hn. La struttura di C∗-algebra del prodotto tensoriale e garantita
dalle relazioni (A1⊗. . .⊗An)† = A†1⊗. . .⊗A†n; (A1⊗. . .⊗An)(B1⊗. . .⊗Bn) = A1B1⊗. . .⊗AnBn;
‖A1 ⊗ . . .⊗An‖ =∏
h ‖Ah‖. Per maggiori dettagli C.f.r. [BR79] Paragrafo 2.7.2.
103
viene detta algebra quasi-locale .
La struttura cosı definita verifica tutte le proprieta QL.1),. . .,QL.5) discusse nel
Paragrafo 4.2.1. Infatti: con l’ordinamento dato dall’inclusione AΛΛ∈Pb(Zν) e un
sistema diretto con la relazione di ortogonalita data dalla disgiunzione di insiemi;
tramite la mappa le identita 1Λ1 e 1Λ2 delle algebre locali AΛ1 e AΛ2 si identi-
ficano come l’unica identita 1Λ1∪Λ2 dell’algebra locale AΛ1∪Λ2 ed in questo senso
tutte le algebre locali hanno identita comune; se Λ1 ⊆ Λ2 allora l’algebra locale
AΛ1 si identifica tramite la mappa con una C∗-sottoalgebra di AΛ2 ed in questo
senso AΛ1 ⊆ AΛ2 ; per costruzione l’algebra quasi-locale A e la chiusura in norma
dell’algebra delle osservabili locali A; se Λ1 ∩ Λ2 = ∅ allora tramite l’isomorfi-
smo le algebre locali AΛ1 e AΛ2 sono rispettivamente isomorfe alla sottoalgebre
AΛ1 ⊗ 1Λ2 ⊂ AΛ1∪Λ2 e 1Λ1 ⊗ AΛ2 ⊂ AΛ1∪Λ2 ed in questo senso evidentemente
[AΛ1 ; AΛ2 ] = 0.
L’insieme Zν agisce in modo naturale come gruppo delle traslazioni sul reticolo.
Scelto un sito y ∈ Zν ed il suo traslato di x + y si puo sempre definire una
mappa unitaria Vy(x) : Hy → Hx+y tra i relativi spazi di Hilbert, infatti basta
mandare (con una scelta che in generale non e unica) una base ortonormale di
Hy in una base ortonormale di Hx+y. Evidentemente in questa costruzione si
sottintende che gli spazi Hx siano tutti isodimensionali. Inoltre si richiede anche
che Vy(0) = 1x, Vy(x1 + x2) = Vx2+y(x1)Vy(x2), Vy(x)† = Vx+y(−x) che sono
proprieta necessarie affinche le mappe unitarie definiscano una struttura di gruppo.
Le mappe unitarie Vy(x) mandano i vettori dello spazio di Hilbert relativo al sito
x nei vettori dello spazio di Hilbert relativo al sito traslato x+y. La stessa azione
si puo generalizzare ad una intera regione finita Λ ∈ Pb(Zν) tramite la mappa
unitaria VΛ(x) ≡ ⊗y∈Λ Vy(x) che manda i vettori dello spazio di Hilbert
⊗y∈ΛHy
nei vettori dello spazio di Hilbert⊗
y∈(x+Λ)Hy. Inoltre VΛ(x)† = Vx+Λ(−x). Fatte
queste premesse sull’intera algebra locale A =⋃
Λ∈Pb(Zν) AΛ risultano definite le
trasformazioni τx : A → A che localmente agiscono come segue
AΛ 3 Aτx−→ τx(A) ≡ VΛ(x)AVx+Λ(−x) ∈ Ax+Λ.
La mappa τx cosı definita risulta essere uno ∗-isomorfismo isometrico e la sua esten-
sione per continuita a tutta l’algebra quasi-locale A definisce una rappresentazione
del gruppo delle traslazioni Zν negli ∗-automorfismi Aut(A) della C∗-algebra A.
Cio dimostra che i sistemi di spin verificano anche la proprieta QL.6) propria delle
algebre quasi-locali su cui e definito un gruppo di simmetria ed in base alla discus-
sione generale affrontata nel Paragrafo 4.3.1 segue che i sistemi di spin verificano
104
anche l’abelianita asintotica uniforme
limx→∞
‖[A; τx(B)]‖ = 0 ∀ A,B ∈ A
con tutte le importanti conseguenze che cio comporta.
I sistemi di spin verificano anche un’altra importante proprieta strutturale che
sara utile in seguito.
SQS.4) L’algebra quasi-locale A di un sistema di spin e separabile, ossia ammette
un sottoinsieme denso numerabile. Cio e conseguenza del fatto che ogni al-
gebra locale AΛ, con Λ ∈ Pb(Zν), e isomorfa (per costruzione) all’insieme
finitamente generato dalle matrici d|Λ| × d|Λ| con d dimensione comune degli
spazi di Hilbert Hx e |Λ| numero di siti (ossia cardinalita) del sottoinsieme
Λ. Dato che l’intero reticolo Zν si puo ricoprire con una famiglia numerabile
di sottoinsiemi finiti Λ segue che l’algebra locale⋃
Λ∈Pb(Zν) AΛ ha un sottoin-
sieme denso e numerabile che per chiusura in norma genera tutta l’algebra
quasi-locale A.
5.2 Aspetti dinamici
I sistemi quantistici di spin, sotto condizioni molto generali, supportano una di-
namica globale definita su tutto il reticolo infinito. Per questa ragione i sistemi
quantistici di spin sono modelli utilissimi nello studio delle questioni che riguardano
l’approccio all’equilibrio.
Interazioni
Si chiama interazione una funzione Φ
Pb(Zν) 3 Λ
Φ−→ Φ(Λ) ∈ AΛ
che associa ad ogni regione finita del reticolo Λ un elemento appartenente alla
C∗-algebra locale AΛ. Inoltre le interazioni devono essere:
IN.1) autoaggiunte, ossia Φ(Λ) = Φ(Λ)† per ogni Λ ∈ Pb(Zν);
IN.2) invarianti rispetto alle traslazioni del reticolo, ossia
τx(Φ(Λ)) = VΛ(x)Φ(Λ)Vx+Λ(−x) = Φ(x + Λ) ∀ Λ ∈ Pb(Zν), ∀ x ∈ Zν .
105
Data un’interazione Φ ad ogni regione finita Λ ∈ Pb(Zν) si puo associare un
Hamiltoniano locale definito da
HΛ(Φ) ≡∑X⊆Λ
Φ(X). (5.1)
La sommatoria che definisce HΛ(Φ) e presa su tutti i sottoinsiemi di Λ e quindi e
finita (un insieme finito ha un numero finito di sottoinsiemi). Inoltre ogni addendo
Φ(X) che interviene nella sommatoria e da intendersi (tramite il solito isomorfismo
) come un elemento della C∗-algebra locale AΛ e pertanto la (5.1) definisce in
modo non ambiguo un elemento autoaggiunto HΛ(Φ) ∈ AΛ, che generalmente si
interpreta come l’ energia di interazione locale degli spin contenuti in Λ.
Diremo che l’interazione Φ ha un range finito se i sottoinsiemi X ∈ Pb(Zν)
tali che 0 ∈ X e Φ(X) 6= 0 sono in numero finito. L’unione di questi sottoinsiemi
si indica con il simbolo ∆Φ. L’insieme ∆Φ e simmetrico rispetto all’origine3, ossia
∆Φ = −∆Φ. Osserviamo che se x,y ∈ X e se x − y /∈ ∆Φ allora Φ(X) = 0,
infatti 0 ∈ (−x + X) e (−x + X) * ∆Φ e cio comporta che Φ(−x + X) = 0.
Dato che Φ(−x + X) = τ−x(Φ(X)) e che τ−x e un’isomorfismo segue che Φ(X) =
0. Questa proprieta giustifica il nome di range di Φ per l’insieme ∆Φ. Siano
Λ1, Λ2 ∈ Pb(Zν), k ∈ Zν e supponiamo che [Λ1− (k + Λ2)]∩∆φ = ∅. Se x ∈ Λ1 e
se y ∈ (k + Λ2) allora x− y /∈ ∆Φ e quindi se x,y ∈ X segue che Φ(X) = 0. Cio
comporta che
HΛ1∪(k+Λ2)(Φ) ≡∑
X⊆Λ1∪(k+Λ2)
Φ(X) =
( ∑X⊆Λ1
Φ(X)
)+
∑
X⊆(k+Λ2)
Φ(X)
,
ossia
HΛ1∪(k+Λ2)(Φ) = HΛ1(Φ) + H(k+Λ2)(Φ) ∀k ∈ Λ1 − Λ2 + Φ. (5.2)
La (5.2) mostra che se Φ e un’interazione a range finito allora le regioni Λ1 e k+Λ2
non interagiscono tra loro se sono sufficientemente lontane.
L’insieme delle interazioni ha la struttura di uno spazio lineare reale (combi-
nazioni lineari a coefficienti reali di interazioni definiscono ancora un’interazione;
i coefficienti reali sono necessari per ottenere elementi autoaggiunti). Indichere-
mo con il simbolo B il sottoinsieme costituito delle interazioni Φ che verificano la
3Osserviamo che ∆Φ ≡ x | ∃X ∈ Pb(Zν), con x,0 ∈ X e Φ(X) 6= 0 e quindi se x ∈ ∆Φ
allora deve esistere un X finito tale che −x,0 ∈ (−x + X). Per la proprieta di invarianza
per traslazioni delle interazioni Φ(−x + X) = τ−x(Φ(X)) e dato che τ−x e un isomorfismo
Φ(−x + X) 6= 0. Cio prova che −x ∈ ∆Φ.
106
seguente proprieta:
|||Φ||| ≡∑X30
‖Φ(X)‖|X| < +∞ (5.3)
con la sommatoria estesa a tutti i sottoinsiemi finiti X ∈ Pb(Zν) che contengono
l’origine 0 ∈ Zν ed avendo indicato con |X| il numero di siti contenuti in X (ossia
la cardinalita di X). Poiche le interazioni sono invarianti rispetto alle traslazioni
sul reticolo segue che la (5.3) resta invariata se al posto della sommatoria su X 3 0
si richiede una sommatoria su X 3 y per un generico y ∈ Zν . La (5.3) definisce
una norma sullo spazio B e rispetto a questa norma B e uno spazio vettoriale reale
completo, ossia uno spazio di Banach reale. Se indichiamo con B0 l’insieme delle
interazioni a range finito segue che B0 ⊂ B ed inoltre si dimostra che B0 e denso
in B rispetto alla norma ||| |||. Dalla minorazione
‖HΛ(Φ)‖ 6∑X⊆Λ
‖Φ(X)‖ =∑X⊆Λ
( ∑y∈ X
|X|−1
)‖Φ(X)‖ 6
∑y∈ Λ
∑X3y
‖Φ(X)‖|X|
segue l’importante relazione
‖HΛ(Φ)‖ 6 |Λ| ‖Φ(X)‖ ∀ Φ ∈ B, ∀ Λ ∈ Pb(Zν). (5.4)
Lo spazio delle interazioni B e estremamente grande e generale. Molti dei risultati
che presenteremo valgono per una classe piu ristretta di interazioni. Diremo che
l’interazione Φ appartiene a B(r) (con r > 0) se e verificata la seguente condizione
||Φ||(r) ≡∑X30
er(|X|−1) ‖Φ(X)‖ < +∞. (5.5)
Valgono le seguenti inclusioni B0 ⊂ B(r) ⊂ B per ogni r > 0. Inoltre se r > r′
segue che B(r′) ⊂ B(r). Da un punto di vista fisico la condizione (5.5) implica che
le interazioni a molti corpi devono essere trascurabili infatti su insiemi X grandi
il contributo di Φ(X) deve deprimere quello di er(|X|−1).
Dinamica locale
Data un’Hamiltoniana locale HΛ si puo implementare su AΛ la consueta dinamica
di tipo Hamiltoniana. Da questo punto di vista sembrerebbe piu logico partire
direttamente da una nozione di Hamiltoniana locale HΛ definendo a posteriori le
interazioni Φ tramite la relazione ricorsiva4 (5.1). Nel contesto dei sistemi quanti-
stici di spin, invece, si preferisce costruire le dinamiche locali partendo dalla nozione
4Ad esempio questa e l’impostazione adottata da Ruelle c.f.r.[Rue69] Paragrafo 2.2.
107
di interazione e definendo a posteriori quella di Hamiltoniana. Cio trova giustifi-
cazione nel fatto che le condizioni sotto cui e possibile estendere la dinamica a tutto
il reticolo si enunciano in modo semplice se riferite alle interazioni Φ piuttosto che
all’Hamiltoniana H(Φ).
Fissata un’interazione Φ ∈ B ad ogni regione finita Λ ∈ Pb(Zν), tramite la
(5.1), resta associato l’operatore Hamiltoniano locale HΛ(Φ) ∈ AΛ. Per ogni t ∈ Re ben definito (in quanto converge in norma) l’operatore unitario di AΛ
eitHΛ(Φ) ≡+∞∑n=0
1
n![itHΛ(Φ)]n. (5.6)
La famiglia eitHΛ(Φ)t∈R definisce una rappresentazione unitaria fortemente con-
tinua del gruppo R definita sullo spazio di Hilbert HΛ =⊗
x∈ΛHx. Ogni ope-
ratore eitHΛ(Φ) permette di definire uno ∗-automorfismo αΛ,Φt : AΛ → AΛ definito
puntualmente da
αΛ,Φt (A) ≡ eitHΛ(Φ)Ae−itHΛ(Φ) ∀ A ∈ AΛ. (5.7)
Gli ∗-automorfismi αΛ,Φt evolvono in modo significativo solamente gli elementi ap-
partenenti alla C∗-algebra locale AΛ mentre agiscono in modo banale sul resto
dell’algebra quasi-locale A. Ad esempio se B ∈ AZν\Λ allora [B; HΛ(Φ)] = 0 (come
previsto dalla struttura quasi-locale) da cui anche [B; eitHΛ(Φ)] = 0 e quindi segue
che αΛ,Φt (B) = eitHΛ(Φ)Be−itHΛ(Φ) = BeitHΛ(Φ)e−itHΛ(Φ) = B. Questo significa che
il sistema dinamico C∗ (Paragrafo B.1.10) Σ(Λ,Φ) ≡ AΛ,R, αΛ,Φ evolve iso-
latamente dall’ambiente esterno Zν \Λ e cio e unicamente conseguenza del fatto
che nella sommatoria che definisce HΛ(Φ) mancano tutte le interazioni che accop-
piano i siti interni a Λ con i siti esterni. Per questo motivo HΛ(Φ) e anche detta
Hamiltoniana con condizioni libere al bordo.
Dinamica globale
L’evoluzione di una generica osservabile locale A ∈ AΛ′ considerata soggetta alla
dinamica dell’intero sistema, e non del solo sottosistema isolato Λ′, deve essere
determinata dall’interazione che accoppia gli spin contenuti in Λ con tutte le parti
del reticolo. Una dinamica globale di questo tipo esiste quando gli automorfismi
locali αΛ,Φt , relativi ad una regione finita Λ ⊃ Λ′, convergono in qualche senso
ragionevole quando la regione Λ diviene infinitamente grande. Il senso in cui esiste
il limite αΛ,Φt
Λ→∞−→ αΦt determina le proprieta della dinamica globale αΦ
t : A → A.
Indicheremo con il simbolo Λ → ∞ una generica successione Λnn∈N ⊂ Pb(Zν)
108
che contiene definitivamente ogni parte finita del reticolo, ossia per ogni X ⊂ Zν
finito, esiste un n′ ∈ N tale che X ⊂ Λn per ogni n > n′. I limiti fatti rispetto
a successioni Λnn∈N di questo tipo vengono detti limiti per inclusione . Il
limite limΛ→∞ αΛ,Φt (A) deve essere inteso nel seguente modo: se A ∈ AΛ′ con Λ′
regione finita del reticolo allora i Λ che entrano nel limite sono tali per cui Λ ⊃ Λ′
e αΛ,Φt (A) ≡ αΛ,Φ
t (A⊗ 1Λ\Λ′).
I risultati generali che si ottengono possono essere riassunti come segue5:
DG.1) Se Φ ∈ B(r) (per qualche r > 0) allora esiste un TΦ > 0 tale per cui
limΛ→∞
‖αΛ,Φt (A)− αΦ
t (A)‖ = 0 ∀ A ∈ A, ∀ t ∈ [−TΦ; TΦ] (5.8)
dove Λ →∞ indica che il limite e fatto per inclusione e A =⋃
Λ AΛ l’algebra
locale delle osservabili. Inoltre il limite (5.8) risulta uniforme in t ∈ [−TΦ; TΦ]
per ogni A ∈ A, ossia per ogni t, s ∈ [−TΦ; TΦ] esiste una costante K (che
dipende da TΦ) tale che ‖αΦt (A)− αΦ
s (A)‖ 6 K|t− s| per ogni A ∈ A.
DG.2) Poiche gli ∗-automorfismi αΛ,Φt conservano le norme, la convergenza del limite
(5.8) sul denso A si estende per continuita a tutta l’algebra quasi-locale A.
Inoltre si ha convergenza per i tempi t, s ∈ [−TΦ; TΦ] e si mostra che si deve
avere convergenza anche al tempo t+ s e da cio segue che il limite (5.8) deve
valere per ogni t ∈ (−∞, +∞). Inoltre il limite risulta uniforme in t per ogni
A ∈ A e per t che varia in sottoinsiemi limitati di R.
DG.3) Il punto precedente si riassume affermando che se Φ ∈ B(r) (per qualche
r > 0) allora
limΛ→∞
‖αΛ,Φt (A)− αΦ
t (A)‖ = 0 ∀ A ∈ A, ∀ t ∈ R (5.9)
dove Λ → ∞ indica che il limite e fatto per inclusione. Inoltre il limite e
uniforme in t per ogni A ∈ A e per t che varia in sottoinsiemi limitati di R.
Queste condizioni sono sufficienti per provare che:
i) per ogni t ∈ R la mappa αΦt : A → A e un ∗-automorfismo;
ii) la collezione delle mappe αΦt t∈R definisce una rappresentazione del
gruppo R, ossia αΦ0 = Id e αΦ
t1 αΦ
t2= αΦ
t1+t2per ogni t1, t2 ∈ R;
iii) per ogni A ∈ A la mappa t → αΦt (A) e continua in norma, ossia la
collezione αΦt t∈R realizza una rappresentazione fortemente continua
del gruppo R negli ∗-automorfismi di A;
5C.f.r. [Sim93] Paragrafo IV.3.
109
iv) fissato A ∈ A si ottiene che τx(αΦt (A)) = αΦ
t (τx(A)) per ogni x ∈ Zν e
per ogni t ∈ R, ovvero [τx; αΦt ] = 0.
Le proprieta i) e ii) seguono dal fatto che sono verificate dalle dinamiche locali
αΛ,Φt e vengono preservate dall’operazione di limite in norma. La proprieta
iii) segue dal fatto che il limite 5.9 e uniforme in t sui sottoinsiemi limitati
di R. La proprieta iv) segue dal fatto che il limite Λ → ∞ e ottenuto per
inclusione.
Quindi, la condizione Φ ∈ B(r) con r > 0, e sufficiente affinche il sistema dinamico
locale Σ(Λ,Φ) ≡ AΛ,R, αΛ,Φ definisca tramite un limite per inclusione Λ → ∞un sistema dinamico C∗ su tutto il reticolo Σ(Λ,Φ) ≡ A,R, αΦ con dinamica
invariante per traslazioni . Sebbene la condizione Φ ∈ B(r) che garantisce
l’esistenza della dinamica sul volume infinito possa sembrare restrittiva, bisogna
tenere presente che la classe delle interazioni B(r) contiene molte interazioni fisica-
mente interessanti come quelle a range finito ed in generale come tutte quelle che
si annullano abbastanza rapidamente su regioni opportunamente grandi.
Generatore infinitesimo della dinamica
Si chiama generatore infinitesimo (Paragrafo B.1.10) della dinamica sul vo-
lume infinito αΛ,Φt l’operatore ∂Φ : AΛ → Aλ definito dalla dinamica locale
∂(Λ)Φ (A) = lim
t→0
αΛ,Φt (A)− A
t.
In generale non e detto che la precedente relazione sia definita su ogni A ∈ AΛ e
quindi per essere piu precisi si dovrebbe definire il generato sul dominio D(Λ)∂ ⊆ A
su cui la precedente espressione e definita in norma. Da un semplice calcolo segue
cheαΛ,Φ
t (A)− A
t=
(eitHΛ(Φ) − 1
t
)Ae−itHΛ(Φ) + A
(e−itHΛ(Φ) + 1
t
).
Esplicitando gli esponenziali si verifica che
(e±itHΛ(Φ) − 1
t
)= ±iHΛ(Φ)
+∞∑n=0
1
n![±itHΛ(Φ)]n = ±iHΛ(Φ)e±itHΛ(Φ)
per cuiαΛ,Φ
t (A)− A
t= iHΛ(Φ)αΛ,Φ
t (A)− iAHΛ(Φ)e−itHΛ(Φ).
110
Da questa espressione segue che il limite t → 0 esiste (in norma) per ogni A ∈ AΛ
ed in particolare utilizzando l’espressione esplicita di HΛ(Φ) si ottiene che
∂(Λ)Φ (A) = i[HΛ(Φ); A] = i
∑X⊆Λ
[Φ(X); A] ∀ A ∈ A. (5.10)
Cio prova in particolare che il dominio della derivazione simmetrica ∂(Λ)Φ
coincide con AΛ e la dinamica locale ha come equazione del moto
d
dt(αΛ,Φ
t (A)) = ∂(Λ)Φ (αΛ,Φ
t (A)) = i∑X⊆Λ
[Φ(X); αΛ,Φt (A)] ∀ A ∈ AΛ.
Supponiamo che A ∈ AΛ′ con Λ′ ⊂ Λ. In questo caso la (5.10) diviene
∂(Λ)Φ (A) = ∂
(Λ)Φ (A⊗ 1Λ\Λ′) = i
∑X⊆Λ
[Φ(X); A⊗ 1Λ\Λ′ ] = i∑X⊆Λ
X∩Λ′ 6=∅
[Φ(X); A].
Questa formula permette di definire il limite per inclusione ∂(Λ)Φ → ∂Φ quando
Λ →∞ sull’algebra locale A secondo la seguente relazione
∂Φ(A) = i∑
X∩Λ 6=∅[Φ(X); A] ∀ A ∈ AΛ. (5.11)
L’operatore ∂Φ generalmente non e limitato su A (la norma di ‖∂Φ(A)‖ cresce con
il volume |Λ| della regione a cui e associata A). Tuttavia esso e chiudibile e se
indichiamo con ∂Φ la sua chiusura e con D∂ ⊂ A il dominio su cui e definito allora
esso si interpreta come il generatore infinitesimo della dinamica sull’intero reticolo.
L’equazione del moto relativa alla dinamica sul volume infinito e
d
dt(αΦ
t (A)) = ∂Φ(αΦt (A)) ∀ A ∈ D∂ ⊂ A. (5.12)
5.3 Modelli di sistemi di spin
Una classe di modelli molto interessanti e costituita dai sistemi di spin 1/2. L’in-
teresse per questi modelli deriva dal fatto che costituiscono delle idealizzazioni
molto semplificate dei sistemi reali. Questa loro “semplicita” li rende adatti allo
scopo di testare la teoria; eliminate tutte le complicazioni tecniche, che sistemi piu
realistici introdurrebbero inevitabilmente, cio che resta e un “macchinario matem-
atico” estremamente scarno ma perfettamente idoneo a controllare idee ed ipotesi
della Meccanica Statistica. I sistemi di spin 1/2 sono ampiamente discussi nei testi
di riferimento [Rue69], [Sim93] e [BR81].
111
I sistemi di spin 1/2 sono reticoli Zν che presentano in ogni sito una “parti-
cella” di spin 1/2 (s = 1 in base alle notazioni del punto SQS.1) della definizione
generale). Per ogni x ∈ Rν lo spazio di HilbertHx e bidimensionale e la C∗-algebra
locale Ax e costituita dalle matrici 2 × 2 a coefficienti complessi una cui base e
costituita dalle matrici di Pauli
σx1 =
(0 1
1 0
), σx
2 =
(0 i
−i 0
), σx
3 =
(1 0
0 −1
)
oltre che dalla matrice identita σx0 = 1x. Ad una regione finita Λ ∈ Pb(Z
ν)
costituita da |Λ| siti e associata la C∗-algebra Aλ =⊗
x∈Λ Ax che e generata dai
limiti in norma di polinomi di elementi del tipo σx1j1⊗ σx2
j2⊗ . . . ⊗ σ
x|Λ|j|Λ| con gli
indici j1, . . . , j|Λ| che assumono i valori 0, 1, 2, 3 ed individuano le diverse matrici
di Pauli o l’identita e x1, . . . ,x|Λ| = Λ. Evidentemente Aλ risulta ∗-isomorfa
all’insieme delle matrici 2|Λ| × 2|Λ|. L’invarianza per traslazioni si implementa
come τx(σyj ) = σx+y
j che corrisponde alla scelta naturale di mandare le matrici di
Pauli (e l’identita) nelle loro omonime traslate. Per linearita questa definizione si
estende a tutti gli elementi della C∗-algebra Ay. La traslazione sulle algebre locali
τx : AΛ → Ax+Λ e implementata dalla generalizzazione della precedente relazione
τx(σy1j1⊗ σ
y2j2⊗ . . .⊗ σ
y|Λ|j|Λ| ) = σ
x+y1j1
⊗ σx+y2j2
⊗ . . .⊗ σx+y|Λ|j|Λ| .
Le interazioni che generalmente si utilizzano nei modelli di spin 1/2 sono le
interazioni ad uno e a due corpi
Φ(1)(x) = τx(Φ(1)(0))
Φ(1)(X) = 0 se |X| > 1,
Φ(2)(x,y) = τx(Φ(1)(0,y− x))
Φ(2)(X) = 0 se |X| > 2.
Con la scelta
Φ(1)(0) ≡ h σ03 , Φ(2)(0,x) =
3∑j=1
Jj(x) (σ0j ⊗ σx
j )
l’Hamiltoniana di interazione sulla regione finita Λ ∈ Pb(Zν) definita dall’inte-
razione Φ = Φ(1) + Φ(2) ad uno ed a due corpi e data da
HΛ(Φ) ≡∑x∈Λ
h σx3 +
∑
x,y∈Λ
3∑j=1
Jj(y− x) (σxj ⊗ σy
j ). (5.13)
Il primo termine di questa Hamiltoniana da il contributo corrispondente all’inte-
razione delle particelle di spin 1/2 con un campo elettromagnetico di intensita h. Il
112
secondo termine fornisce il contributo corrispondente ad un’interazione istantanea
a distanza tra gli spin localizzati nei siti x e y.
Al variare dei valori attribuiti ai coefficienti h, J1, J2, J3 si ottengono diversi
modelli:
modello di Ising: si ottiene quando J1 = J2 = 0 e h 6= 0, J3 6= 0;
modello XY: si ottiene quando J3 = 0, h 6= 0, J1 6= 0 e J2 6= 0;
modello di Heisenberg isotropo: si ottiene quando J1 = J2 = J3 6= 0 e h 6= 0;
modello di Heisenberg anisotropo: si ottiene quando J1 = J2 = J3 6= 0, h 6= 0
e Ji 6= Jj per qualche coppia di indici i, j = 1, 2, 3.
Per tutti questi modelli l’esistenza della dinamica globale e garantita dal fatto
che l’interazione e a range finito. Sebbene si tratta di modelli semplici, in tutti
l’aspetto computazionale e di eccezionale complessita gia per un numero ristretto
di siti (ordine 10-100).
Lo studio di questi sistemi di spin comincia a partire dagli anni ’20 (quin-
di precedendo la nascita della Meccanica Quantistica) con lo scopo di costruire
modelli per il ferromagnetismo6. Lo studio del modello XY comincia a par-
tire dagli anni ’50 e solo negli anni 60 e stata stabilita l’equivalenza tra la catena
unidimensionale XY ed un reticolo fermionico7.
Per modelli unidimensionali di Ising e XY e possibile calcolare esplicitamente
l’evoluzione temporale8.
6C.f.r. [Bru67] e [LM66].7C.f.r. [LM61].8C.f.r. [BR81] Paragrafi 6.2.13 e 6.2.14.
113
Capitolo 6
Medie ergodiche e stati con
statistica
6.1 Statistica sulle traslazioni e stati invarianti
Secondo le idee consuete della Meccanica Statistica le osservazioni macrosco-
piche si possono interpretare come un processo di media sulle osservazioni mi-
croscopiche compiute sui sottosistemi. Perche questa operazione di media abbia
senso statistico e necessario che il sistema sia costituito da infiniti sottosistemi (il
campione delle misure deve essere molto grande, idealmente infinito). Emerge,
percio, in modo naturale la richiesta che il sistema in considerazione si possa
interpretare come un sistema infinito N = +∞. In generale i sistemi infiniti di
cui ci occuperemo sono anche spazialmente estesi1, V → +∞. Nel caso di sistemi
infinitamente estesi il campione delle misure, ovvero i sottosistemi microscopici,
possono essere indicizzati dalle traslazioni spaziali. In questo senso l’operazione di
media sui sottosistemi diventa una statistica sulle traslazioni .
Da questo punto di vista le osservabili macroscopiche (ossia le osservazioni
sull’intero sistema) non entrano nella teoria come concetti fondamentali definiti “a
priori” (che e il punto di vista tipico della Termodinamica) ma vengono introdotte
in modo costruttivo. La possibilita di effettuare una misura macroscopica si fonda
sulla possibilita che la statistica sulle traslazioni di una qualche osservabile mi-
croscopica (che invece e definita dalla natura del sistema) abbia senso. Poiche il
1La richiesta di volume infinito non e generalmente necessaria per discutere i sistemi infiniti.
Tuttavia quando si considerano costituenti microscopici di dimensioni finite e fisse (nel senso che
non vengono mandate a zero in seguito a qualche limite) allora la condizione V → +∞ diviene
anche necessaria se si escludono le situazioni in cui la densita di materia diviene infinita.
114
valore ottenuto in seguito ad un processo di misura dipende dalla configurazione
del sistema nel momento in cui la misura e effettuata, segue che solo la config-
urazione del sistema puo discriminare se una statistica sulle traslazioni fa senso
oppure no. Quindi, l’unico concetto che e necessario definire “a priori” in questo
contesto, e quello di configurazione che ammette statistica . Prendendo se-
riamente questa idea stabiliremo come punto di partenza della nostra analisi la
seguente affermazione:
La Meccanica Statistica ha come ambito di interesse le confi-
gurazioni che ammettono una statistica sulle traslazioni di un
sistema infinito.
Per dare un senso corretto a questa affermazione all’interno di uno schema mec-
canico ricordiamo (Capitolo 3) che le configurazioni di un sistema fisico sono in
corrispondenza biunivoca con gli stati (funzionali lineari, normalizzati e positivi)
sulla C∗-algebra delle osservabili (affermazione valida sia nello schema classico che
in quello quantistico) e quindi gli oggetti che e necessario studiare sono gli stati
che ammettono statistica sulle traslazioni .
6.1.1 Stati con statistica sulle traslazioni
Matematicamente (Paragrafo 4.2) un sistema infinito e spazialmente esteso e de-
scritto dalla struttura A,Kν con A C∗-algebra quasi-locale sullo spazio euclideo
Kν che indica indistintamente Rν (sistema continuo) oppure Zν (reticolo di spin).
Inoltre Kν agisce su A come il gruppo abeliano delle traslazioni tramite la rap-
presentazione Kν 3 x → τx ∈ Aut(A). Nel caso in cui Kν = Rν si assume anche
la continuita in norma delle mappe Rν 3 x → αx(A) ∈ A per ogni A ∈ A. Sia
s ∈ EA uno stato sulla C∗-algebra quasi-locale A. Diremo che s e uno stato con
statistica sulle traslazioni se per ogni A ∈ A esiste finito il seguente limite
limΛ→∞
1
|Λ|∑x∈Λ
s(τx(A)) ≡ ωs(A) (6.1)
limΛ→∞
1
|Λ|∫
Λ
s(τx(A)) dµ(x) ≡ ωs(A). (6.2)
La (6.1) vale per il caso di sistema discreto (Kν = Zν) e |Λ| indica il numero
dei siti contenuti in Λ (misura che conta i punti) mentre la (6.2) vale nel caso di
sistema continuo (Kν = Rν) ed in questo caso |Λ| ≡ µ(Λ) e la misura di Lebesgue
115
di Λ. In questo secondo caso la misura µ che compare nell’integrale e la misura di
Lebesgue invariante per traslazioni (Paragrafo B.6.1, µ e l’unica misura di Haar
regolare a meno di normalizzazioni), inoltre se la rappresentazione τx e fortemente
continua allora la mappa x → s(τx(A)) ∈ C e continua per ogni A ∈ A e quindi
ha senso integrarla. Le equazioni (6.1) e (6.2) non sono definite fino a quando non
si stabilisce il senso in cui Λ →∞.
Definire il senso in cui e necessario prendere il limite Λ →∞ non e immediato
e richiede alcune considerazioni. In primo luogo osserviamo che l’idea di statistica
di una collezione infinita di campioni contiene in se l’idea di “conteggio ordinato”.
Supponiamo di fare una statistica sui lanci di una monetina e di aver collezionato
un numero infinito di esiti “testa” ed un numero infinito di esiti “croce”. Se non
fosse importante l’ordine con cui sono occorsi i diversi esiti potremmo riordinare
il campione a piacimento e fare la solita media (Ntesta − Ncroce)/Ntot. E un fatto
evidente che se testa e croce sono occorsi un numero infinito di volte allora per
un opportuno riordinamento la precedente media puo convergere ad un qualsiasi
numero tra −1 e 1. Quindi in un conteggio statistico l’ordine con cui vengono
contati i campioni e importante e non puo essere arbitrario.
Nel nostro caso l’ordine dei conteggi dei campioni e assicurato se per definire il
limite Λ →∞ si sceglie una successione crescente di sottoinsiemi finiti di Kν .
Inoltre questa successione deve contenere definitivamente ogni parte finita di Kν .
Queste richieste si formalizzano affermando che la successione Λnn∈N ⊂ Pb(Kν)
deve verificare le seguenti condizioni:
S.1) Λn1 ⊆ Λn2 se n1 6 n2;
S.2) per ogni sottoinsieme limitato C ⊂ Kν esiste un n′ ∈ N tale che C ⊆ Λn′ .
Dalla S.1) e dalla S.2) segue che tutti i sottoinsiemi limitati di Kν sono definiti-
vamente contenuti da Λnn∈N, ovvero C ⊂ Λn per ogni n > n′.
Esiste un’ulteriore richiesta di carattere fisico che e necessario fare. La de-
scrizione statistica di un sistema infinito deve essere omogenea nello spazio
nel senso che non puo dipendere da quale zona di Kν si sceglie come punto di
partenza per il calcolo delle medie. Cio equivale a richiedere che i limiti (6.1)
o (6.2) siano invarianti per traslazioni spaziali della successione Λnn∈N che li
definisce. In altre parole se si ha convergenza per la successione Λnn∈N allora si
deve avere convergenza, e allo stesso limite, per ogni altra successione Λ(y)n n∈N,
con y ∈ Kν , avendo definito Λ(y)n ≡ (y + Λn). Osserviamo che questa richiesta e
consistente con le precedenti, infatti se Λnn∈N verifica le S.1) e dalla S.2) allora
116
anche Λ(y)n n∈N le verifica. Una condizione sufficiente (ma probabilmente non
necessaria) a garantire cio e la seguente:
S.3) per ogni y ∈ Kν vale che
limn→+∞
|(y + Λn)4Λn||Λn| = 0 (proprieta di Følner)
avendo indicato con il simbolo 4 l’operazione insiemistica di differenza sim-
metrica . Per verificare la sufficienza di questa condizione consideriamo le due
successioni
an ≡ 1
|Λn|∫
Λn
s(τx(A)) dµ(x), bn ≡ 1
|y + Λn|∫
y+Λn
s(τx(A)) dµ(x)
con Λnn∈N che verifica la S.3) e supponiamo limn→+∞ an = a con a finito. Per
l’invarianza della misura di Lebesgue |y + Λn| = |Λn| e quindi
|an − bn| = 1
|Λn|
∣∣∣∣∫
(y+Λn)4Λn
s(τx(A)) dµ(x)
∣∣∣∣ 6 1
|Λn|∫
(y+Λn)4Λn
|s(τx(A))| dµ(x).
Dato che |s(τx(A))| 6 ‖s‖ ‖τx(A)‖ = ‖s‖ ‖A‖ la precedente disuguaglianza implica
che
limn→+∞
|an − bn| 6 ‖s‖ ‖A‖ limn→+∞
|(y + Λn)4Λn||Λn| = 0,
ovvero la successione an − bnn∈N converge a 0. Dalla seguente disuguaglianza
|bn − bm| 6 |bn − an|+ |an − bm| 6 |bn − an|+ |an − am|+ |am − bm|
segue che la successione bnn∈N e di Cauchy e quindi converge ad un limite b
mentre dalla disuguaglianza |(an − bn) − (a − b)| 6 |an − a| + |bn − b| segue che
a− b = limn→+∞(an − bn) = 0 ossia a = b. Quindi abbiamo verificato che se vale
la S.3) allora
limn→+∞
1
|y + Λn|∫
y+Λn
s(τx(A)) dµ(x) = limn→+∞
1
|Λn|∫
Λn
s(τx(A)) dµ(x) (6.3)
per ogni y ∈ Kν . La dimostrazione per il caso discreto si ottiene da questa
semplicemente interpretando µ come la misura discreta che conta i punti.
A questo punto e necessario controllare che la classe delle successioni Λnn∈N
che soddisfano i requisiti S.1), S.2) e S.3) non sia vuota. Come discusso alla fine
del Paragrafo B.6.2 un esempio molto semplice (e non il solo) che e possibile esibire
su Kν e la successione di cubi crescenti Λn =∏ν
j=1[−n, n] ⊂ Kν con n ∈ N. In
117
questo caso il volume di ogni insieme e dato da |Λn| = (2n)ν (nel caso discreto
(2n + 1)ν). Osserviamo che
|Λn+1 \ Λn||Λn| =
(2(n + 1))ν − (2n)ν
(2n)ν=
(n + 1)ν − nν
nν= o
(1
n
)
da cui limn→+∞ |Λn+1 \ Λn|/|Λn| = 0. Questa proprieta e importante poiche assi-
cura che ogni altra successione Λ′nn∈N, non necessariamente costituita da cubi,
che gode della proprieta Λn ⊆ Λ′n ⊆ Λn+1 verifica le proprieta S.1), S.2) e S.3)
e definisce medie (6.1) o (6.2) che convergono allo stesso limite di quelle definite
dalla successione di cubi Λnn∈N.
6.1.2 Statistica sulle traslazioni e stati invarianti
Sia s ∈ A uno stato con statistica sulle traslazioni e Λnn∈N una successione di
parti finite di Kνche verifica le proprieta S.1), S.2) e S.2). Le equazioni (6.1) o
(6.2) definiscono una mappa ωs : A → C di cui vogliamo studiare le proprieta. Ci
riferiremo al caso continuo ribadendo che tutti i risultati continuano a valere anche
per il caso discreto se si interpreta µ come la misura discreta che conta i punti.
La mappa ωs e lineare, infatti per ogni A,B ∈ A e per ogni a, b ∈ C si verifica
che ωs(aA + bB) = a ωs(A) + b ωs(B) tenendo conto che l’integrale, lo stato s e
l’automorfismo τx agiscono in modo lineare. Inoltre la mappa ωs e normalizzata
in quanto
ωs(1) ≡ limΛ→∞
1
|Λ|∫
Λ
s(τx(1)) dµ(x) = s(1) = 1
ed e positiva dato che per ogni A ∈ A
ωs(A∗A) ≡ lim
Λ→∞1
|Λ|∫
Λ
s(τx(A)∗τx(A)) dµ(x) > 0
in quanto s e un funzionale positivo e quindi s(τx(A)∗τx(A)) > 0 per ogni x ∈ Kν .
Queste proprieta verificano che la mappa ωs : A → C determina un fun-
zionale lineare normalizzato e positivo (quindi continuo), ovvero uno stato, sulla
C∗-algebra A. Comunque scelto un punto y ∈ Kν , per l’invarianza della misura µ
ωs(τy(A)) ≡ limΛ→∞
1
|Λ|∫
x∈Λ
s(τx(τy(A))) dµ(x) = limΛ→∞
1
|Λ|∫
Λ
s(τx+y(A)) dµ(x)
= limΛ→∞
1
|Λ|∫
x∈y+Λ
s(τx(A)) dµ(x) = limΛ(y)→∞
1
|Λ(y)|∫
Λ(y)
s(τx(A)) dµ(x)
118
avendo posto Λ(y)n ≡ y + Λn. Se la successione Λnn∈N verifica la proprieta S.3)
(o piu in generale rende invarianti per traslazioni le medie) allora la successione
Λnn∈N e la successione Λ(y)n n∈N producono lo stesso limite e quindi
ωs(τy(A)) = ωs(A) ∀ A ∈ A, ∀ y ∈ Kν
da cui segue che lo stato ωs e invariante per traslazioni, ωs ∈ EKν
A . Viceversa se
ω ∈ EKν
A e uno stato invariante per traslazioni si verifica facilmente esso coincide
con lo stato ottenuto tramite le (6.1) o (6.2), infatti per ogni A ∈ A
limΛ→∞
1
|Λ|∫
Λ
ω(τx(A)) dµ(x) = limΛ→∞
1
|Λ|∫
Λ
ω(A) dµ(x) = ω(A)
indipendentemente dalla scelta della successione Λnn∈N.
Riassumendo, abbiamo dimostrato che:
6.1.1 Teorema. Sia A una C∗-algebra quasi-locale e τx la rappresentazione del
gruppo delle traslazioni Kν. La mappa definita dalle equazioni (6.1) o (6.2) associa
ad ogni stato s ∈ EA con statistica sulle traslazioni uno stato ωs ∈ EKν
A inva-
riante rispetto alle traslazioni. Inoltre questa mappa agisce identicamente sugli
stati invarianti per traslazione.
Se si conviene di definire statisticamente equivalenti due stati con statistica
sulle traslazioni s1 e s2 che vengono mandati nello stesso stato invariante, ωs1 = ωs2 ,
allora si puo affermare che la mappa indotta dalle equazioni (6.1) o (6.2) definisce
una partizione di EA in classe di equivalenze ognuna delle quali e rappresentata
da uno stato invariante per traslazioni. Quindi, relativamente allo studio delle
questioni legate alle statistiche sulle traslazioni, gli unici stati rilevanti sono gli
stati invarianti EKν
A .
6.1.3 Stati ergodici e stati non correlati
Sia ω ∈ EKν
A uno stato invariante per traslazioni ed indichiamo con la consueta no-
tazione (Paragrafo 4.2.2) Hω, πω, Uω(Kν), ψω la rappresentazione G.N.S da esso
indotta e con Uω(Kν) il gruppo unitario che implementa su Hω gli automorfismi τx
(nel caso continuo se τx e una rappresentazione fortemente o debolmente continua
allora il gruppo Uω(Kν) e fortemente continuo). Osserviamo che per ogni A,B ∈ A
ω
(A
1
|Λ|∫
Λ
τx(B) dµ(x)
)=
(ψω; πω(A)
[1
|Λ|∫
Λ
Uω(x)πω(B)Uω(x)−1 dµ(x)
]ψω
)
=
(πω(A)†ψω;
[1
|Λ|∫
Λ
Uω(x) dµ(x)
]πω(B)ψω
)(6.4)
119
avendo tenuto conto dell’invarianza del vettore ψω rispetto al gruppo Uω(Kν). Il
Teorema ergodico di von Neumann (Paragrafo B.6.3) afferma che
s-limΛ→∞
1
|Λ|∫
Λ
Uω(x) dµ(x) = Pω
essendo Λnn∈N una successione di parti finite di Kν che verificano la condizione
S.3) e Pω il proiettore sullo spazio costituito dai vettori di Hω invarianti rispetto
al gruppo Uω(Kν). Dato che la convergenza forte implica la convergenza debole
segue che quando Λ →∞ dalla (6.4) si ricava che
limΛ→∞
ω
(A
1
|Λ|∫
Λ
τx(B) dµ(x)
)=
(πω(A)†ψω; Pωπω(B)ψω
)
= (ψω; πω(A)Pωπω(B)ψω) . (6.5)
Gli stati ergodici su A,Kν sono gli stati invarianti per traslazione che non
si decompongono come combinazione convessa non banale di altri stati invarianti
(Paragrafo 4.2.2). Dato che la C∗-algebra quasi locale A che descrive il sistema
infinito e asintoticamente abeliana in norma rispetto alle traslazioni segue
che essa e ancheKν-abeliana rispetto ad un generico stato invariante ω (Paragrafo
4.3.1). Sotto queste condizioni un risultato generale (Paragrafo B.5.4) stabilisce
che lo stato ω e ergodico se e solo se il proiettore Pω e unidimensionale ossia
se e solo se il sottospazio Pω(Hω) e generato unicamente dal vettore ciclico ψω.
Se cio accade allora per ogni B ∈ A deve valere che Pωπω(B)ψω = λB ψω con
λB ≡ (ψω; πω(B)ψω) e quindi
(ψω; πω(A)Pωπω(B)ψω) = λB (ψω; πω(A)ψω)
= (ψω; πω(A)ψω) (ψω; πω(B)ψω) = ω(A)ω(B)
Questo risultato, insieme alla (6.5), fornisce la seguente caratterizzazione degli
stati ergodici:
ω ∈ PKν
A ⇔ limΛ→∞
ω
(A
1
|Λ|∫
Λ
τx(B) dµ(x)
)= ω(A)ω(B) ∀ A, B ∈ A
avendo indicato con PKν
A l’insieme degli stati ergodici. Questa caratterizzazione e
utile in quanto consente di fornire un’interpretazione degli stati ergodici in termini
della statistica sulle traslazioni ad essi associati. Supponiamo che lo stato s verifichi
120
per ogni A,B ∈ A la condizione aggiuntiva
limΛ′→∞
limΛ→∞
1
|Λ|∫
Λ
s
[τx
(A
1
|Λ′|∫
Λ′τy(B) dµ(y)
)]dµ(x)
=
(lim
Λ→∞1
|Λ|∫
Λ
s(τx(A)) dµ(x)
) (lim
Λ′→∞1
|Λ′|∫
Λ′s(τy(B)) dµ(y)
). (6.6)
Uno stato s che verifica questa condizione individua tramite la mappa (6.1) o (6.2)
uno stato ergodico. Infatti la (6.6) afferma che:
limΛ′→∞
ωs
(A
1
|Λ′|∫
Λ′τy(B) dµ(y)
)= ωs(A) ωs(B) ∀ A,B ∈ A
e cio caratterizza ωs come uno stato ergodico. Viceversa e immediato constatare
che uno stato ergodico verifica la (6.6).
Per dare un’interpretazione fisica alla (6.6) osserviamo che il primo membro
puo essere riscritto in una forma piu chiara
limΛ′→∞
limΛ→∞
1
|Λ|∫
Λ
s
[τx
(A
1
|Λ′|∫
Λ′τy(B) dµ(y)
)]dµ(x)
= limΛ′→∞
limΛ→∞
1
|Λ|1
|Λ′|∫
Λ
(∫
Λ′s (τx(A) τx+y(B)) dµ(y)
)dµ(x)
= limΛ′→∞
limΛ→∞
1
|Λ|1
|Λ′(x)|
∫
Λ
(∫
Λ′(x)
s (τx(A) τy(B)) dµ(y)
)dµ(x)
avendo indicato con Λ′(x) = x + Λ e avendo utilizzato l’invarianza della misura µ.
Se la successione Λ′nn∈N verifica la condizione S.3) (che garantisce l’invarianza
per traslazioni della media) allora il limite fatto rispetto a Λ′(x)n n∈N per ogni
x ∈ Kν coincide con il limite fatto rispetto a Λ′nn∈N e quindi la condizione (6.6)
risulta equivalente a
limΛ→∞
limΛ′→∞
1
|Λ|1
|Λ′|∫
Λ
∫
Λ′s (τx(A) τy(B)) dµ(x) dµ(y)
=
(lim
Λ→∞1
|Λ|∫
Λ
s(τx(A)) dµ(x)
) (lim
Λ′→∞1
|Λ′|∫
Λ′s(τy(B)) dµ(y)
). (6.7)
Gli stati che verificano la (6.7), o equivalentemente la (6.6), descrivono configu-
razioni del sistema che ammettono una statistica sulle traslazioni priva di corre-
lazioni a lungo raggio e pertanto saranno chiamati stati non correlati o anche
121
stati clustering . Come sunto delle ultime considerazioni possiamo affermare
che:
6.1.2 Teorema. Sia A una C∗-algebra quasi-locale e τx la rappresentazione del
gruppo delle traslazioni Kν. La mappa definita dalle equazioni (6.1) o (6.2) associa
ad ogni stato s ∈ EA che verifica la (6.7) uno stato ergodico ωs ∈ PKν
A .
L’importante conclusione a cui siamo giunti e che gli stati invarianti per trasla-
zione nascono come statistica sulle traslazioni di generici stati ed in particolare gli
stati ergodici nascono come statistica sulle traslazioni di stati non correlati. Per
questo motivo lo studio della statistica sulle traslazioni, che abbiamo introdotto
come criterio costruttivo per dare un’interpretazione al concetto di osservazione
macroscopica, si puo ridurre allo studio degli stati invarianti per traslazione ed alle
rappresentazioni che essi generano.
6.2 Evoluzione dinamica ed invarianza per tra-
slazioni
6.2.1 Dinamica invariante per traslazioni
Consideriamo un C∗-algebra quasi-locale A definita su Kν sulla quale l’azione del
gruppo delle traslazioni e implementata da Kν 3 x → τx ∈ Aut(A). Questa strut-
tura descrive solamente gli aspetti cinematici e geometrici di un sistema infinito.
Se il sistema possiede anche una dinamica questa viene descritta nel linguaggio as-
tratto della C∗-algebra A tramite una rappresentazione T 3 t → αt ∈ Aut(A) del
gruppo ad un parametro T ∈ Z,R (dinamica discreta o continua). La struttura
geometrica del sistema e la dinamica sono compatibili se l’ evoluzione temporale
e omogenea nello spazio, ossia se una stessa osservabile evolve allo stesso mo-
do quando e “spostata” in diversi punti del reticolo (l’evoluto del traslato coincide
con il traslato dell’evoluto). Questa richiesta si esplicita nel seguente modo
αt(τx(A)) = τx(αt(A)) ∀ A ∈ A, ∀ t ∈ T, ∀ x ∈ Kν (6.8)
che equivale a αt τx = τx αt per ogni t ∈ T e per ogni x ∈ Kν . La condizione
(6.8) si sintetizza scrivendo [α; τ ] = 0 e quando una dinamica la verifica diremo
che e invariante per traslazione . Una classe interessante di sistemi discreti
infiniti con dinamica invariante per traslazione e costituita dai sistemi quantistici
122
di spin. Sotto ipotesi abbastanza generali sulle interazioni degli spin su questi
sistemi si possono definire dinamiche che verificano la (6.8) (Paragrafo 5.2).
Se sulla C∗-algebra e definita una dinamica invariante per traslazioni e se lo
stato ω ∈ EKν
A e invariante per traslazioni allora per ogni x ∈ Kν , t ∈ T e A ∈ A
α∗t (ω)(τx(A)) = ω(αt(τx(A))) = ω(τx(αt(A))) = ω(αt(A)) = α∗t (ω)(A).
Questo prova che lo stato α∗t (ω), evoluto al tempo t dello stato ω secondo la
dinamica aggiunta, e ancora uno stato invariante per traslazioni spaziali. In altri
termini in un sistema infinito con dinamica invariante per traslazioni l’evoluzione
indotta sugli stati dalla dinamica aggiunta α∗ e ad ogni istante una biezione del
sottoinsieme degli stati invarianti in se, ovvero α∗t : EKν
A → EKν
A per ogni t ∈ T.
Sia ω ∈ PKν
A uno stato ergodico e supponiamo che
α∗t (ω) = ε ω1 + (1− ε) ω2 con 0 6 ε 6 1
per un qualche t ∈ T e per una qualche coppia ω1, ω2 ∈ EKν
A di stati invarianti
per traslazione. Applicando l’automorfismo α∗−t = α∗t−1 ed utilizzando le proprieta
gruppali segue che
ω = α∗−t α∗t (ω) = ε α∗−t(ω1) + (1− ε) α∗−t(ω2).
Dato che ω e per ipotesi ergodico e α∗−t(ω1), α∗−t(ω2) sono ancora stati invarianti
per traslazioni spaziali segue che ω = α∗t (ω1) = α∗t (ω2), ovvero ε = 0, 1. Cio
implica che α∗t (ω) = ω1 = ω2 ossia che anche lo stato α∗t−1(ω), indipendentemente
dal parametro t ∈ T, e ergodico.
6.2.2 Dinamica topologica sulla chiusura degli stati ergo-
dici
L’insieme PKν
A non e in generale ∗-debolmente chiuso ed il limite per t → ±∞dell’evoluto α∗t (ω) (se esiste), pur essendo ancora uno stato invariante (l’insieme
EKν
A e ∗-debolmente chiuso, Paragrafo B.5.1), puo non essere uno stato ergodi-
co. Indichiamo con PKν
A la chiusura dell’insieme degli stati ergodici rispetto alla
topologia ∗-debole T(w)A∗ ≡ σ (A∗, A) definita su A∗. La coppia PKν
A ,T(w)A∗ ottenuta
restringendo la topologia T(w)A∗ sull’insieme PK
ν
A individua uno spazio topologico di
Hausdorff (il duale A∗ con la topologia ∗-debole e di Hausdorff) compatto (ogni
sottoinsieme chiuso di uno spazio di Hausdorff e compatto). La dinamica aggiun-
ta α∗ : A∗ → A∗ e continua rispetto alla topologia ∗-debole (Paragrafo B.1.10)
123
e quindi commuta con i limiti deboli. Cio significa che le mappe αt preservano
l’insieme PKν
A e la loro restrizione a PKν
A definisce un gruppo di omeomorfismi di
PKν
A . In base alla Definizione 3.3.1 possiamo affermare che:
6.2.1 Teorema. Sia A una C∗-algebra quasi-locale su Kν su cui e definita una
dinamica invariante per traslazioni [α, τ ] = 0. La terna Σ ≡ PKν
A ,T, α∗ definisce
un sistema dinamico topologico.
Consideriamo uno stato con statistica sulle traslazioni s ∈ EA e supponiamo
che su A sia definita una dinamica invariante per traslazioni. Si verifica che per
ogni A ∈ A e per ogni t ∈ Tlim
Λ→∞1
|Λ|∫
Λ
[α∗t (s)](τx(A)) dµ(x) = limΛ→∞
1
|Λ|∫
Λ
s(τx(αt(A))) dµ(x)
da cui, in base alla (6.4) (o alla (6.1) nel caso discreto), segue che l’evoluto tem-
porale di uno stato con statistica sulle traslazioni e ancora uno stato con statistica
sulle traslazioni ed inoltre
ωα∗t (s) = α∗t (ωs).
Se s e uno stato non correlato (nel senso della (6.7)) allora lo stato ωs e ergo-
dico. Poiche per ogni t ∈ T lo stato α∗t (ωs) e ancora ergodico segue che lo stato
α∗t (s) continua ad essere scorrelato. Tuttavia nel limite t → ±∞ lo stato α∗t (ωs)
puo cessare di essere ergodico e cio significa che rispetto agli asintoti temporali
dell’evoluzione anche gli stati scorrelati possono assumere correlazioni.
Alla luce del contenuto del Paragrafo 6.1, il Teorema 6.2.1 implica che:
• l’evoluzione temporale di un sistema infinito (spazialmente esteso) che si
trova inizialmente in uno stato con statistica sulle traslazioni scorrelato si
puo studiare, in termini della statistica sulle traslazioni, come l’evoluzione di
una traiettoria di un sistema dinamico topologico.
Supponiamo che il sistema dinamico cosı ottenuto ammetta un’ attrattore glo-
bale ω∞ (o un attrattore relativo ad un sottoinsieme di PKν
A ). In questo caso, per
effetto dell’evoluzione temporale, il sistema tendera ad assumere stabilmente stati
statisticamente equivalenti a ω∞. Sebbene dal punto di vista macroscopico della
statistica sulle traslazioni il sistema convergera allo stato di equilibrio stazionario
ω∞, dal punto di vista microscopico vi sara ancora una forma di evoluzione “caot-
ica” in quanto lo stato del sistema potra variare nella classe di equivalenza degli
stati con statistica individuati dallo stato invariante ω∞. Questo schema riproduce
la convergenza macroscopica all’equilibrio.
124
6.2.3 Densita degli stati ergodici negli stati invarianti
Nel precedente paragrafo abbiamo verificato che l’evoluzione dinamica degli stati
ergodici puo essere studiata in termini di una dinamica topologica. Al fine di
definire l’evoluzione dinamica su un insieme compatto (condizione sufficiente a
garantire che la dinamica sia definita anche per tempi t → ±∞) abbiamo in-
trodotto la chiusura PKν
A . Diventa rilevante, quindi, comprendere quanto e grande
questa chiusura nell’insieme di tutti gli stati invarianti EKν
A .
Per un fissato a > 0 consideriamo la regione limitata Λa ≡∏ν
j=1[0, a) contenuta
in Zν . Per ogni n ∈ Zν indichiamo con
Λna ≡ na + Λa =ν∏
j=1
[nja, (nj + 1)a)
la regione traslata di na ed osserviamo che la collezione Λna | n ∈ Zν deter-
mina un ricoprimento disgiunto di Kν . Sia ω ∈ EKν
A uno stato invariante per
traslazioni ed indichiamo con ξna ≡ ω|AΛnala restrizione di ω all’algebra locale
AΛna = τna(AΛa). Evidentemente ogni ξna definisce un funzionale lineare, positivo
e normalizzato, ovvero uno stato, sulla relativa algebra locale AΛna . Consideriamo
il funzionale prodotto
ωa ≡⊗n∈Zν
ξna
definito sugli elementi A ∈ ⋃n∈Zν AΛna , con A ∈ AΛn′a per qualche n′ ∈ Zν , dalla
relazione
ωa (A) = ξn′a(A) = ω(A).
Sugli elementi di⋃
n∈Zν AΛna l’applicazione ωa agisce come un funzionale lineare,
positivo e normalizzato e poiche l’insieme⋃
n∈Zν AΛna e denso nell’algebra quasi-
locale segue che ωa definisce uno stato su A, ovvero ωa ∈ EA. Lo stato ωa non e in
generale invariante per generiche traslazioni anche se e invariante sotto la famiglia
di traslazioni τna per ogni n ∈ Zν (stato periodico). Si verifica facilmente che
ωa∗−w−→ ω se a → +∞. (6.9)
Cio segue osservando che per ogni A ∈ AΛ esiste sempre un a′ > 0 tale che Λ ⊂ Λa′
e quindi ωa′(A) = ω(A). Inoltre poiche le osservabili locali sono dense in quelle
quasi-locali segue che la quantita |ωa(A)− ω(A)| puo essere resa piccola a piacere
per ogni A ∈ A se a → +∞ e cio verifica la (6.9).
Lo stato ωa ammette statistica sulle traslazioni. Per ogni A ∈ A scriviamo la
relazione
ωa(A) ≡ limΛ→+∞
1
|Λ|∫
Λ
ωa(τx(A)) dµ(x) (6.10)
125
e valutiamo il limite rispetto alla successione di parti finite Λn =∏ν
j=1[−na, na]
con n ∈ N. La successione Λn verifica la proprieta di Følner, inoltre ogni Λn
contiene un numero intero di regioni Λna. Osserviamo anche che ogni traslazione
τx si puo sempre scomporre come una traslazione del tipo τna, che lascia invariato
ωa, piu una traslazione all’interno di Λa. Tutte queste considerazioni consentono
di scrivere che
ωa(A) ≡ 1
|Λa|∫
Λa
ωa(τx(A)) dµ(x)
≡ ωa
(1
|Λa|∫
Λa
τx(A) dµ(x)
)∀ A ∈ A (6.11)
e questa relazione definisce lo stato invariante ωa ∈ EKν
A . Sia A ∈ AΛ con Λ regione
limitata di Kν . Per un a ∈ N opportunamente grande Λ ⊂ Λa, inoltre per ogni
x ∈ Λa tale che (x + Λ) ⊂ Λna segue che ωa(τx(A)) = ω(τx(A)) = ω(A). Sia
Γ ≡ y ∈ Λa | (x + Λ) ∩ ∂Λa 6= ∅ avendo indicato con ∂Λa il bordo di Λa. In
questo caso la relazione (6.11) si riscrive
ωa(A) =|Λa \ Γ||Λa| ω(A) +
1
|Λa|∫
Γ
ωa(τx(A)) dµ(x)
da cui segue la disuguaglianza
|ωa(A)− ω(A)| 6∣∣∣∣|Λa \ Γ||Λa| − 1
∣∣∣∣ ‖A‖+|Γ||Λa|‖A‖ = 2
|Γ||Λa|‖A‖.
Se A ∈ AΛ allora |Γ| ∝ |Λ| |∂Λa| per cui se a → +∞ allora |Γ|/|Λa| → 0 e quindi
lima→+∞ ωa(A) = ω(A). Poiche questa relazione e verificata su tutte le osservabili
locali e dato che queste sono dense in A segue ancora che
ωa∗−w−→ ω se a → +∞. (6.12)
Infine osserviamo che
ωa
(A
1
|Λ|∫
Λ
τy(B) dµ(y)
)= ωa
[1
|Λa|∫
Λa
τx
(A
1
|Λ|∫
Λ
τy(B) dµ(y)
)dµ(x)
]
=1
|Λa|1
|Λ|∫
Λa
(∫
Λ
ωa(τx(A)τx+y(B)) dµ(y)
)dµ(x).
126
Se A,B ∈ ⋃n∈Zν AΛna , allora, ricordando che ωa e uno stato prodotto, segue che
∣∣∣∣∣ωa
(A
1
|Λ|∑y∈Λ
τy(B)
)− 1
|Λa|1
|Λ|∫
Λa
(∫
Λ
ωa(τx(A))ωa(τx+y(B)) dµ(y)
)dµ(x)
∣∣∣∣∣
6 |ΛA| |ΛB||Λ| |Λa| ‖A‖‖B‖ 6 |Λa|
|Λ| ‖A‖‖B‖
essendo ΛA e ΛB rispettivamente le regioni limitate su cui sono definite le osserv-
abili locali A e B e l’ultima disuguaglianza segue poiche entrambe queste regioni
devono essere contenute in qualche Λna per cui |ΛA|, |ΛB| 6 |Λa|. Quindi
limΛ→∞
ωa
(A
1
|Λ|∫
y∈Λ
τy(B) dµ(y)
)
=1
|Λa|∫
Λa
ωa(τx(A))
(lim
Λ→∞1
|Λ|∫
Λ
ωa(τx+y(B)) dµ(y)
)dµ(x)
=1
|Λa|∫
Λa
ωa(τx(A))
(lim
(x+Λ)→∞1
|x + Λ|∫
(x+Λ)
ωa(τy(B)) dµ(y)
)dµ(x)
e dato che il limite Λ → +∞ e indipendente dalle traslazioni se e verificata la
proprieta di Følner, allora dalle (6.10) e (6.11) segue che
limΛ→∞
ωa
(A
1
|Λ|∫
Λ
τy(B) dµ(y)
)
=
(1
|Λa|∫
Λa
ωa(τx(A)) dµ(x)
)(lim
Λ→∞1
|Λ|∫
Λ
ωa(τy(B)) dµ(y)
)= ωa(A)ωa(B).
Poiche l’insieme⋃
n∈Zν AΛna e denso nell’algebra quasi-locale la precedente re-
lazione si estende per continuita ad ogni A,B ∈ A e da un confronto con la carat-
terizzazione data nel Paragrafo 6.1.3 segue che gli stati ωa sono ergodici, ossia
ωa ∈ PKν
A per ogni a > 0. La relazione (6.12) allora implica che
6.2.2 Teorema. Sia A una C∗-algebra quasi-locale e τx la rappresentazione del
gruppo delle traslazioni Kν. Il sottoinsieme degli stati ergodici e denso nell’insieme
degli stati invarianti, ossia PKν
A = EKν
A .
Da questo risultato segue immediatamente che il sistema dinamico topologico
compatto che descrive l’evoluzione degli stati ergodici in realta e costituito dal-
la terna Σ ≡ EKν
A ,T, α∗ e alla luce del contenuto del Paragrafo 6.1 possiamo
affermare che:
127
• l’evoluzione temporale di un sistema infinito (spazialmente esteso) che si
trova inizialmente in uno stato con statistica sulle traslazioni (generico) si
puo studiare, in termini della statistica sulle traslazioni, come l’evoluzione di
una traiettoria di un sistema dinamico topologico compatto.
6.2.4 Dinamica su PKν
A senza compattezza
Come abbiamo appena visto la richiesta di compattezza del sistema dinamico topo-
logico impone di considerare la chiusura dell’insieme degli stati ergodici ma in
questo modo si finisce per considerare l’evoluzione di tutti gli stati invarianti. In
alternativa, se si vuole considerare solamente l’evoluzione temporale degli stati er-
godici (atteggiamento ragionevole se si considera che gli stati ergodici definiscono
tutti gli stati invarianti), e necessario rinunciare alla compattezza. In questo caso
l’evoluzione degli stati ergodici e descritta dalle traiettorie del sistema dinamico
Σ ≡ PKν
A ,T, α∗ ed inoltre e ancora possibile interpretare l’evoluzione degli stati
invarianti in genere (quelli che si ottengono da stati con statistica correlati).
Ogni algebra quasi locale A e Kν-abeliana rispetto ad ogni stato invariante
(Paragrafo 4.3.1). Questa condizione e sufficiente a garantire l’unicita della de-
composizione ergodica degli stati invarianti (Paragrafi B.5.2 e B.5.3). Ogni
stato invariante EKν
A e univocamente definito da una misura di probabilita di
Baire (misura baricentrica) pseudo-supportata su PKν
A . Esiste, quindi, una cor-
rispondenza biunivoca tra gli stati ω ∈ EKν
A e le misure µω ∈ M+,1
(EK
ν
A
)con
pseudo-supporto su PKν
A secondo la seguente relazione
ω(A) =
∫
PKν
A
ω′(A) dµω(ω′) ∀ A ∈ A.
Poiche ogni stato invariante si interpreta come una misura di probabilita su PKν
A (gli
stati ergodici sono le delta di Dirac concentrate in un punto) allora l’evoluzione
di questi stati e descritta dall’evoluzione delle relative misure (Paragrafo 3.3.1)
secondo la relazione
α∗t (ω)(A) =
∫
PKν
A
ω′(αt(A)) dµω(ω′) =
∫
PKν
A
ω′(A) dµtω(ω′) ∀ A ∈ A.
Quindi si puo affermare che
• l’evoluzione temporale di un sistema infinito (spazialmente esteso) che si
trova inizialmente in uno stato con statistica sulle traslazioni (generico) si
puo studiare, in termini di statistica sulle traslazioni, come l’evoluzione di
una misura di un sistema dinamico topologico non compatto.
128
6.3 Medie ergodiche su uno stato invariante
Per interpretare il contenuto fisico della dinamica introdotta nei precedenti para-
grafi occorre esaminare le proprieta delle funzioni continue definite sul sistema di-
namico topologico Σ ≡ EKν
A ,T, α∗. Come vedremo il nesso tra tali osservabili e la
statistica sulle traslazioni del sistema infinito e dato dalle medie ergodiche . Esse
sono medie spaziali di osservabili locali in un’opportuna rappresentazione e definis-
cono, quindi, operatori che hanno le caratteristiche di osservabili macroscopiche.
La costruzione che esporremo presenta aspetti sottili che verranno analizzati nel
seguito. Rivolgeremo la nostra attenzioni solamente a sistemi discreti definiti sul
reticolo Zν . Questa scelta e motivata dal fatto che una struttura discreta consente
di evitare tutte le complicazioni tecniche che invece sorgono nel passaggio al con-
tinuo ed in particolare evita il problema di dover definire l’integrazione di funzioni
a valori in A.
6.3.1 Le medie ergodiche
Nel seguito converremo sempre di indicare con A un’algebra quasi-locale sul reticolo
Zν e con A ≡ ⋃Λ∈Pb(Zν) AΛ l’algebra delle osservabili locali che genera per chiusura
in norma A.
Fissata una parte finita del reticolo Λ ∈ Pb(Zν) ed un’osservabile A ∈ A
possiamo costruire una nuova osservabile definita da
A(Λ) ≡ 1
|Λ|∑x∈Λ
τx(A). (6.13)
La definizione e ben posta dato che la sommatoria coinvolge un numero finito di
addendi. Sia ω ∈ EKν
A uno stato su A invariante rispetto alle traslazioni τx indotte
da Kν e sia Hω, πω, Uω(Kν), ψω la rappresentazione G.N.S. ad esso associato. Il
rappresentativo dell’osservabile (6.13) rispetto alla rappresentazione G.N.S. e dato
da
πω(A(Λ)) =1
|Λ|∑x∈Λ
πω(τx(A)) =1
|Λ|∑x∈Λ
Uω(x)πω(A)Uω(x)−1.
Consideriamo due osservabili locali A,B ∈ A tali che A ∈ AΣ1 e B ∈ AΣ2 con
Σ1, Σ2 ∈ Pb(Zν). Inoltre poniamo ϕ ≡ πω(B)ψω. Osserviamo che il vettore ϕ ap-
partenente al sottoinsieme di Hω definito da πω(A)ψω. Poiche la rappresentazione
πω e continua (generalmente abbassa la norma) segue che la chiusura nella norma
di Hω del sottoinsieme πω(A)ψω coincide con la chiusura in norma del sottoinsieme
129
πω(A)ψω che (per come e definita la costruzione G.N.S.) e denso in Hω. Cio prova
che anche il sottoinsieme πω(A)ψω e denso in H. Si verifica che
πω(A(Λ))ϕ = πω(A(Λ)B)ψω =1
|Λ|∑x∈Λ
πω(τx(A) B)ψω.
Consideriamo il sottoinsieme di Zν definito da Γ ≡ x | (x + Σ1) ∩ Σ2 6= ∅costituito dai punti di Zν per cui le osservabili τx(A) e B non appartengono ad
algebre locali disgiunte e che quindi non commutano a priori. Quindi per ogni
x ∈ Zν \ Γ sicuramente [τx(A); B] = 0. Il sottoinsieme Γ e finito dato che per
ipotesi sono finiti i sottoinsiemi Σ1 e Σ2. Infatti comunque scelto un punto di Σ1
esistono |Σ2| traslazioni che mandano tale punto in ogni punto di Σ2 e pertanto
Γ 6 |Σ1| |Σ2| < +∞. In base a queste considerazioni la precedente uguaglianza
fornisce
πω(A(Λ))ϕ =1
|Λ|
∑
x∈Λ\Γπω(B τx(A)) +
∑x∈Λ∩Γ
πω(τx(A) B)
ψω
=1
|Λ|
[∑x∈Λ
πω(B τx(A))−∑
x∈Λ∩Γ
πω(B τx(A)) +∑
x∈Λ∩Γ
πω(τx(A) B)
]ψω
= πω(B)1
|Λ|∑x∈Λ
Uω(x)πω(A)ψω +1
|Λ|∑
x∈Λ∩Γ
πω ([τx(A); B]) ψω (6.14)
dove nell’ultima uguaglianza si e tenuto conto che il vettore ciclico ψω e invariante
per cui Uω(x)−1ψω = ψω. Sul denso πω(A)ψω definiamo l’operatore A(ω) in base
alla seguente relazione
A(ω)(πω(B)ψω) ≡ πω(B)Pωπω(A)ψω ∀ B ∈ A (6.15)
con Pω il proiettore sul sottospazio di Hω costituito dai vettori invarianti sotto
il gruppo unitario Uω(Kν). L’operatore A(ω) viene chiamato media ergodica
dell’osservabile A (nella rappresentazione di ω) e questo nome e giustificato dal
fatto che esso si ottiene come limite forte di operatori tipo πω(A(Λ)) quando Λ
tende all’intero reticolo. Per verificare cio osserviamo che dalla (6.14) segue che
130
per ogni ϕ ≡ πω(B)ψω con B ∈ A si ottiene che
‖[πω(A(Λ))− A(ω)]ϕ‖
6∥∥∥∥∥πω(B)
(1
|Λ|∑x∈Λ
Uω(x)− Pω
)πω(A)ψω
∥∥∥∥∥ +
∥∥∥∥∥1
|Λ|∑
x∈Λ∩Γ
πω ([τx(A); B]) ψω
∥∥∥∥∥
6 ‖πω(B)‖∥∥∥∥∥
(1
|Λ|∑x∈Λ
Uω(x)− Pω
)πω(A)ψω
∥∥∥∥∥ +1
|Λ|∑
x∈Λ∩Γ
‖πω ([τx(A); B]) ψω‖ .
Poniamo C ≡ maxx∈Γ‖πω ([τx(A); B]) ψω‖ ed osserviamo che questa costante e
ben definita in quanto per ogni x ∈ Γ l’operatore πω ([τx(A); B]) ψω e limitato ed
inoltre Γ e finito. Inoltre osservando che |Λ∩Γ| 6 |Γ| otteniamo la maggiorazione
‖[πω(A(Λ))− A(ω)]ϕ‖ 6 ‖πω(B)‖∥∥∥∥∥
(1
|Λ|∑x∈Λ
Uω(x)− Pω
)πω(A)ψω
∥∥∥∥∥ + C|Γ||Λ| .
Sia Λnn∈N una generica successione di parti finite di Zν che tende all’intero
reticolo verificando la proprieta di Følner
limn→+∞
|(y + Λn)4Λn||Λn| = 0 ∀ y ∈ Zν
e valutiamo la precedente disuguaglianza nel limite Λ → ∞ rispetto a questa
successione. Come conseguenza del Teorema ergodico di von Neumann (Paragrafo
B.6.3) si ottiene che limΛ→∞ ‖[πω(A(Λ))−A(ω)]ϕ‖ = 0 e quindi sul denso πω(A)ψω ⊂Hω ad ogni A ∈ A e associato un operatore definito da
s-limΛ→∞
πω(A(Λ)) = s-limΛ→∞
πω
(1
|Λ|∑x∈Λ
τx(A)
)= A(ω)
con il limite forte indipendente dalla scelta della particolare successione Λnn∈N
purche sia verificata la proprieta di Følner.
Per ogni Λ finito, tenendo conto che la rappresentazione πω abbassa o preserva
la norma mentre gli automorfismi τx conservano le norme, si ottiene
‖πω(A(Λ))‖ =
∥∥∥∥∥πω
(1
|Λ|∑x∈Λ
τx(A)
)∥∥∥∥∥ 6 1
|Λ|∑x∈Λ
‖πω(τx(A))‖ 6 1
|Λ|∑x∈Λ
‖A‖ = ‖A‖
e cio comporta che per un qualunque ϕ ∈ πω(A)ψω
‖A(ω)ϕ‖ = limΛ→∞
‖πω(A(Λ))ϕ‖ 6 limΛ→∞
‖πω(A(Λn))‖ ‖ϕ‖ 6 ‖A‖ ‖ϕ‖.
131
L’operatore A(ω) e limitato sul denso πω(A)ψω ⊂ Hω e puo essere definito in modo
continuo sull’intero spazio Hω. Inoltre ‖A(ω)‖ 6 ‖A‖.Infine consideriamo un’osservabile A ∈ A ed una successione Ann∈N ⊂ A che
converge in norma a A. Fissato un ε > 0 esiste un n′ = n′(ε) tale che ‖A−An‖ 6 ε
per ogni n > n′. Sia Λ una parte finita del reticolo Zν ed in base alla 6.13 scriviamo
‖A(Λ) − A(Λ)n ‖ =
∥∥∥∥∥1
|Λ|∑x∈Λ
τx(A− An)
∥∥∥∥∥ 6 ‖A− An‖ < ε
e passando alla rappresentazione G.N.S.
‖πω(A(Λ))− πω(A(Λ)n )‖ = ‖πω(A(Λ) − A(Λ)
n )‖ 6 ‖A(Λ) − A(Λ)n ‖ < ε.
Poiche questa maggiorazione non dipende da Λ segue che per ogni ϕ ∈ Hω
‖(πω(A(Λ))− πω(A(Λ)n ))ϕ‖ 6 ‖ϕ‖ ‖πω(A(Λ))− πω(A(Λ)
n ‖ 6 ‖ϕ‖ ‖A(Λ) − A(Λ)n ‖ < ε
non appena n > n′′(ε, ϕ) tale che ‖A− An‖ 6 ε/‖ϕ‖. Da cio segue che
A(ω) ≡ s-limΛ→∞
(πω(A(Λ)) = limn→+∞
[ s-limΛ→∞
(πω(A(Λ)n )] = lim
n→+∞(An(ω)). (6.16)
L’equazione (6.16) definisce la media ergodica associata ad un’osservabile quasi
locale A ∈ A come limite in norma della successione di medie ergodiche relative
alle osservabili locali An ∈ A che approssimano A.
Le medie ergodiche costruite si ottengono come limiti forti di successioni di
operatori appartenenti alla C∗-algebra operatoriale πω(A) ⊂ L (Hω) e pertanto
appartengono alla chiusura forte di πω(A) ossia all’ algebra di von Neumann
generata πω(A)′′ ≡ Mω(A) ⊆ L (Hω) (Paragrafo B.2.1).
6.3.1 Proposizione. Sia A un’algebra quasi-locale definita sul reticolo Zν, τx gli
automorfismi che implementano le traslazioni e ω ∈ EZν
A uno stato invariante per
traslazioni. Esiste una mappa A 3 Am.e.−→ A(ω) ∈ Mω(A), detta media ergodica
in rappresentazione ω, definita dalla relazione seguente
Am.e.−→ A(ω) = s-lim
Λ→∞πω
(1
|Λ|∑x∈Λ
τx(A)
)(6.17)
che associa ad ogni elemento dell’algebra quasi-locale A ∈ A un operatore limitato
su A(ω) ∈ Mω(A) contenuto nella chiusura von Neumann della rappresentazione
G.N.S. indotta dallo stato ω. La mappa cosı definita e continua in quanto ‖A(ω)‖ 6‖A‖ per ogni A ∈ A. Il limite che definisce la media ergodica e indipendente dalla
scelta della particolare successione Λnn∈N ⊂ Pb(Zν) purche sia verificata la
proprieta di Følner.
132
6.3.2 Lo spazio vettoriale delle medie ergodiche
Indichiamo con Vω ≡ A(ω) | ∀ A ∈ A ⊂ Mω(A) l’immagine rispetto alla mappa
(6.17) della sola algebra locale A. Per la (6.16) l’immagine rispetto alla mappa
“media ergodica” si ottiene come chiusura in norma di Vω, ossia Am.e.−→ Vω
‖ ‖ ⊂Mω(A). Per questa ragione studieremo le proprieta di Vω, che sono di piu facile
controllo, dato che quelle di Vω‖ ‖
seguono per una procedura di chiusura in
norma.
L’insieme Vω non e un’algebra dato che in generale A(ω)B(ω) /∈ Vω. Tuttavia
Vω e uno spazio vettoriale, infatti per linearita della mappa (6.16) e per il fatto
che le operazioni lineari sono continue rispetto alla convergenza forte (Paragrafo
B.2.1) segue immediatamente che
aA(ω) + bB(ω) = (aA + bB)(ω) ∀ a, b ∈ C, ∀ A,B ∈ A.
Dato che se A,B ∈ A allora anche aA+ bB ∈ A segue che aA(ω) + bB(ω) ∈ Vω non
appena A(ω), B(ω) ∈ Vω.
Sia 1 ∈ A l’identita dell’algebra quasi-locale A. Gli automorfismi τx mappano
l’unita in se stessa e nella rappresentazione G.N.S. l’unita dell’algebra 1 e mandata
nell’operatore identita dello spazio di Hilbert di rappresentazione 1ω ∈ Hω. Da
cio segue immediatamente che 1(ω) = 1ω e quindi lo spazio vettoriale Vω contiene
l’operatore identita 1ω.
Sia A ∈ A e consideriamo le due medie ergodiche
A(ω) = s-limΛ→∞
πω
(A(Λ)
), A∗
(ω) = s-limΛ→∞
πω
((A∗)(Λ)
)= s-lim
Λ→∞πω
(A(Λ)
)†.
Dato che (ψ; πω
(A(Λ)
)ϕ) = (πω
(A(Λ)
)†ψ; ϕ) per ogni ψ, ϕ ∈ Hω e poiche la
convergenza forte implica la convergenza debole segue che A∗(ω) = A(ω)
†. Cio
prova in particolare che l’insieme Vω e autoaggiunto, ossia contiene l’aggiunto
di ogni suo elemento.
Siano A,B ∈ A due generiche osservabili locali e siano Σ1 e Σ2 due sottoinsiemi
finiti del reticolo tali che A ∈ AΣ1 e B ∈ AΣ2 . Se Λ e una parte finita del reticolo
segue che
[πω(A(Λ)); πω(B)] =
[πω
(1
|Λ|∑x∈Λ
τx(A)
); πω (B)
]
=1
|Λ|∑x∈Λ
[πω (τx(A)) ; πω (B)] = πω
(1
|Λ|∑x∈Λ
[τx(A); B]
).
133
Indichiamo con Γ ≡ x | (x + Σ1)∩Σ2 6= ∅ il sottoinsieme di Zν per cui le osser-
vabili τx(A) e B appartengono alla stessa algebra locale non disgiunte e pertanto
non commutano a priori. Osserviamo che Γ e un insieme finito, infatti per ogni
punto di Σ1 vi sono al massimo |Σ2| traslazioni che lo mandano in un punto di Σ2
e quindi |Γ| 6 |Σ2| |Σ1| < +∞. Da cio segue che
[πω(A(Λ)); πω(B)] = πω
(1
|Λ|∑
x∈Λ∩Γ
[τx(A); B]
)
dato che per ogni x /∈ Λ ∩ Γ il relativo addendo e nullo. Passando alle norme si
ottiene che
∥∥[πω(A(Λ)); πω(B)]∥∥ =
∥∥∥∥∥πω
(1
|Λ|∑
x∈Λ∩Γ
[τx(A); B]
)∥∥∥∥∥
6 1
|Λ|∑
x∈Λ∩Γ
‖πω ([τx(A); B])‖ 6 |Λ ∩ Γ||Λ| max
x∈Λ∩Γ
‖πω ([τx(A); B])‖
.
La maggiorazione e consistente dato che l’operatore πω ([τx(A); B]) e limitato per
ogni x ∈ Zν ed il massimo e valutato su un insieme finito (con cardinalita non
superiore a |Γ|). Se Λnn∈N e una generica successione di parti finite di Zν che
converge all’intero reticolo allora dalla precedente disuguaglianza segue ancora
limΛ→∞
∥∥[πω(A(Λ)); πω(B)]∥∥ 6 lim
Λ→∞|Λ ∩ Γ||Λ| max
x∈Λ∩Γ
‖πω ([τx(A); B])‖
= 0
ossia l’operatore [πω(A(Λ)); πω(B)] converge in norma all’operatore nullo. Dato
che la convergenza in norma implica la convergenza forte e dato che le operazioni
lineari sono continue rispetto alla convergenza forte si ottiene che
s-limΛ→∞
[πω(A(Λ)); πω(B)] = [A(ω); πω(B)] = 0 ∀ B ∈ A.
Sia C ∈ A e un’osservabile quasi-locale e Cnn∈N ⊂ A una successione di osser-
vabili locali che converge in norma C. Osserviamo che
[A(ω); πω(C)] = [A(ω); (πω(C)−πω(Cn)] 6 2‖A(ω)‖ ‖πω(C−Cn)‖ 6 2‖A‖ ‖C−Cn‖e dato che l’ultimo membro puo essere reso piccolo a piacere segue che
[A(ω); πω(C)] = 0 ∀ C ∈ A.
Questo significa che ogni media ergodica A(ω) ∈ Vω appartiene al commutante
πω(A)′, ossia Vω ⊂ πω(A)′ . Inoltre Vω e contenuto in Mω(A) = πω(A)′′ e dato
che πω(A)′ = πω(A)′′′ = Mω(A)′ segue che
Vω ⊂ Mω(A) ∩Mω(A)′ = Zω(A)
134
ossia Vω e contenuto nel centro dell’algebra di von Neumann Mω(A). Come
conseguenza del fatto che il centro di un’algebra di von Neumann e un insieme
abeliano anche gli elementi di Vω commutano reciprocamente (Paragrafo B.2.1).
Il centro Zω(A) e un’algebra di von Neumann commutativa e cio implica che la
chiusura in norma di ogni sottoinsieme di operatori contenuto in Zω(A) e ancora
contenuta in Zω(A). Cio comporta che la chiusura in norma Vω‖ ‖
, che e l’immag-
ine rispetto alla mappa 6.17 dell’intera algebra quasi-locale A, e uno spazio di Ba-
nach contenuto nel centro Zω(A); esso e chiamato spazio vettoriale delle medie
ergodiche (in rappresentazione ω). Poiche l’aggiunzione e un’operazione continua
rispetto alla chiusura in norma segue che anche l’insieme Vω‖ ‖
e autoaggiunto.
6.3.2 Proposizione. Sia A un’algebra quasi-locale definita sul reticolo Zν. L’im-
magine di A rispetto alla mappa “media ergodica” definita dalla (6.17) definisce
uno spazio di Banach Vω‖ ‖
contenuto nel centro Zω(A) dell’algebra di von Neu-
mann generata Mω(A). Cio comporta che tutti gli elementi di Vω‖ ‖
commutano
reciprocamente. Infine Vω‖ ‖
e autoaggiunto e contiene l’identita 1ω.
6.3.3 Costruzione dell’algebra delle medie ergodiche
Nel precedente paragrafo abbiamo visto che la mappa (6.17) manda la C∗-algebra
quasi locale A nello spazio di Banach Vω‖ ‖
contenuto nel centro Zω(A). Quindi
la mappa Am.e.−→ Vω
‖ ‖ ⊆ Zω(A) individua una struttura abbastanza ricca che,
tuttavia, non e un’algebra. Cio risulta una limitazione da un punto di vista pu-
ramente tecnico. Per munire l’insieme delle medie ergodiche di una struttura di
algebra e necessario immergere l’insieme Vω‖ ‖
in un insieme piu grande e cio si
fa tramite una procedura standard (Paragrafo B.1.1).
I) Partendo dall’insieme Vω si costruisce l’insieme Pol(Vω) ⊃ Vω di tutti i
polinomi finiti a coefficienti complessi nelle variabili A(ω), B(ω), C(ω), . . .. Gli
elementi di Pol(Vω) sono ancora operatori limitati contenuti in Zω(A). L’in-
sieme Pol(Vω) cosı ottenuto e una ∗-algebra abeliana con unita , infatti
e chiusa rispetto alle operazioni lineari, al prodotto di due suoi elementi,
all’aggiunzione e contiene 1ω.
II) L’insieme Pol(Vω) sebbene munito di una struttura algebrica non e uno
spazio completo, infatti (per costruzione) non contiene i limiti delle succes-
sioni dei suoi elementi dato che questi sarebbero “polinomi infiniti”. Questo
135
“difetto” viene colmato prendendo la chiusura dell’insieme Pol(Vω) rispet-
to alla norma operatoriale ‖ ‖. L’insieme Pol(Vω) ‖ ‖ cosı ottenuto ha la
struttura di una C∗-algebra commutativa con unita che indicheremo
con Eω(A).
Nel seguito ci riferiremo all’insieme Eω(A) come alla C∗-algebra delle medie
ergodiche nella rappresentazione indotta da ω. Essa coincide con la piu piccola
C∗-algebra di operatori limitati che contiene l’intero spazio vettoriale Vω e poiche
e chiusa in norma segue anche che Vω‖ ‖ ⊂ Eω(A). Pertanto diremo anche che
Eω(A) e l’ algebra generata da Vω‖ ‖
. Poiche Eω(A) e ottenuta tramite com-
pletamento di limiti di successioni in norma operatoriale di elementi di Zω(A) e
dato che il centro, in quanto algebra di von Neumann, e chiuso in norma segue che
Eω(A) ⊆ Zω(A).
6.3.4 Operatori di traslazioni sulle medie ergodiche
Discutiamo l’effetto delle traslazioni sulle medie ergodiche. I limiti forti conser-
vano il prodotto tra operatori, pertanto se Uω(z) e l’operatore unitario su Hω che
implementa la traslazione di una quantita z vale che
Uω(z) A(ω) Uω(z)−1 = s-limΛ→∞
Uω(z) πω(A(Λ)) Uω(z)−1 ∀ z ∈ Zν .
Osserviamo anche che
Uω(z) πω(A(Λ)) Uω(z)−1 = πω
(1
|Λ|∑x∈Λ
τz+x(A)
)= πω(A(z+Λ)).
Le medie ergodiche sono definite da limiti rispetto a successioni Λnn∈N che veri-
ficano la proprieta di Følner e sono indipendenti dalla particolare successione scelta
(come conseguenza del Teorema ergodico di von Neumann). Se Λnn∈N verifica
la proprieta di Følner allora anche (z+Λn)n∈N per ogni z ∈ Zν verifica la stessa
proprieta e pertanto
Uω(z) A(ω) Uω(z)−1 = s-limΛ→∞
Uω(z) πω(A(Λ)) Uω(z)−1 = s-limΛ→∞
πω(A(z+Λ)) = A(ω).
Quindi le medie ergodiche sono invarianti rispetto a tutte le traslazioni del reticolo,
ossia [A(ω); Uω(z)] = 0 per ogni z ∈ Kν e per ogni A(ω) ∈ Vω‖ ‖
. Evidentemente i
prodotti di operatori invarianti sono ancora invarianti, infatti per ogni A(ω), B(ω) ∈Vω
‖ ‖
Uω(z)A(ω)B(ω)Uω(z)−1 = Uω(z)A(ω)Uω(z)−1 Uω(z)B(ω)Uω(z)−1 = A(ω), B(ω).
136
Cio implica che anche tutti i polinomi finiti appartenenti a Pol(Vω), commutano
con gli operatori unitari Uω(z). Infine dato che il prodotto di commutazione e
continuo rispetto alla topologia uniforme segue che anche i limiti in norma delle
successioni di polinomi commutano con ogni Uω(z). Quindi anche tutti gli elementi
della C∗-algebra Eω(A) sono invarianti rispetto alle traslazioni Uω(z). Se indi-
chiamo con Uω(Zν) l’insieme di tutti gli operatori unitari Uω(z) che implementano
su Hω le traslazioni del reticolo e con Uω(Zν)′ il sottoinsieme di L (Hω) costituito
dagli operatori limitati che commutano con tutti gli operatori unitari Uω(z) segue
che Eω(A) ⊂ Uω(Zν)′. Mettendo insieme questo risultato con quello conseguito
nel paragrafo precedente possiamo affermare:
6.3.3 Proposizione. Sia A un’algebra quasi-locale definita sul reticolo Zν e sia
Eω(A) la C∗-algebra abeliana delle medie ergodiche generata in L (Hω) dall’imma-
gine della C∗-algebra quasi-locale rispetto alla mappa “media ergodica” definita dal-
la (6.17). Si verifica che la C∗-algebra Eω(A) e contenuta nel centro invariante
della rappresentazione G.N.S. generata da ω, ossia
Eω(A) ⊆ Zω(A) ∩ Uω(Zν)′. (6.18)
6.3.5 Estensione dello stato alle medie ergodiche
Lo stato invariante ω che definisce la rappresentazione G.N.S. Hω, πω, Uω(Zν), ψωdella C∗-algebra quasi locale A e implementato sull’algebra πω(A) ⊂ L(Hω) dallo
stato vettoriale ρψω
secondo la relazione
ρψω
(πω(A)) ≡ (ψω; πω(A)ψω) = ω(A) ∀ A ∈ A.
Da questa relazione e dall’invarianza di ω sotto traslazioni segue che per ogni parte
finita del reticolo Λ
ρψω
(πω(A(Λ))) =
(ψω; πω
(1
|Λ|∑x∈Λ
τx(A)
)ψω
)=
1
|Λ|∑x∈Λ
(ψω; πω(τx(A))ψω)
=1
|Λ|∑x∈Λ
ω(τx(A)) =1
|Λ|∑x∈Λ
ω(A) = ω(A).
Lo stato vettoriale ρψω
su πω(A) si estende ad uno stato sull’algebra di von Neu-
mann generata Mω(A) per continuita debole , infatti Mω(A) coincide con la
chiusura debole di πω(A) ed un qualunque operatore M ∈ Mω(A) e limite de-
bole di una qualche successione πω(Mn)n∈N ⊂ πω(A). Usando questo fatto si
137
definisce in modo consistente uno stato ρψω
sull’algebra di von Neumann Mω(A)
come estensione debole dello stato ρψω
secondo la prescrizione (Paragrafo B.2.2)
ρψω
(M) ≡ limn→+∞
ρψω
(πω(Mn)) = (ψω; Mψω) ∀ M ∈ Mω(A).
Dato che tutte le successioni fortemente convergenti sono anche debolmente con-
vergenti si puo applicare la precedente relazione alle medie ergodiche A(ω) ∈ Mω
ottenendo che
ρψω
(A(ω)) ≡ limΛ→∞
ρψω
(πω(A(Λ))) = ω(A)
Indichiamo con ω ≡ ρψω|Eω(A)ω la restrizione dello stato vettoriale ρ
ψωalla C∗-al-
gebra delle medie ergodiche Eω(A) ⊆ Mω(A).
6.3.4 Proposizione. L’algebra quasi-locale A ed uno stato ω invariante per trasla-
zioni del reticolo, definiscono tramite la mappa che genera le medie ergodiche
(6.17), una C∗-algebra commutativa Eω(A) ⊆ Mω(A) ed uno stato ω tale che
ω(A(ω)
)= ω(A) ∀ A(ω) ∈ Vω
‖ ‖
e che in generale e definito su tutto Eω(A) come la restrizione dello stato vettoriale
ρψω
su Mω(A).
6.4 Le medie ergodiche come descrizione della
statistica sulle traslazioni
6.4.1 Descrizione statistica delle medie ergodiche
La costruzione sviluppata nei paragrafi precedenti pone alcuni problemi interpre-
tativi derivanti dal fatto che l’algebra delle medie ergodiche Eω(A) e definita a
partire da un particolare stato ω. Ricordiamo che il risultato della costruzione e
una C∗-algebra abeliana con unita Eω(A) che, per l’ isomorfismo di Gel’fand
(Paragrafo B.1.9 ), e identificabile con un’algebra di funzioni continue definite su
un insieme compatto di Hausdorff X i cui punti sono gli stati puri di Eω(A). In
particolare l’isomorfismo di Gel’fand Eω(A) 3 M → fM ∈ C(X ) e definito dalla
relazione fM(%) ≡ %(M) per ogni stato puro % appartenente allo spettro di Eω(A).
Se lo stato invariante ω ∈ EZν
A che definisce la rappresentazione e anche uno
stato estremale di EKν
A , ossia uno stato Kν-ergodico, allora (Paragrafo B.5.4) un
risultato generale afferma che il centro invariante contiene solo i multipli dell’i-
dentita, ossia Zω(A) ∩ Uω(Zν)′ = C1ω e di conseguenza Eω(A) = C1ω per
138
la Proposizione 6.3.3. In questo caso su Eω(A) e definito un unico stato, neces-
sariamente puro, dato che per linearita e normalizzazione %(a1ω) = a%(1ω) = a.
Quest’unico stato deve coincidere con lo stato ω ottenuto come implementazione
su Eω(A) dello stato di partenza ω e cio implica che gli operatori Aω ottenuti come
medie ergodiche degli elementi A ∈ A sono definiti da Aω ≡ ω(A) 1ω. Come e
palese in questa rappresentazione le medie ergodiche contengono come unica infor-
mazione il valore che le osservabili astratte A ∈ A assumono sullo stato considerato
ω. Dal punto di vista dell’isomorfismo di Gel’fand una tale situazione equivale a
voler costruire un’algebra di funzioni usando solo i loro valori nell’unico punto
X ≡ ω.Se invece lo stato invariante ω ∈ EZν
A che definisce la rappresentazione non e
uno stato estremale di EZν
A allora “a priori” la C∗-algebra Eω(A) non e banale e lo
spazio X degli stati puri su Eω(A) non si riduce ad un unico punto. Ad ogni stato
ξ e associata una misura di probabilita di Baire µξ su X tale che
ξ(M) ≡∫
XfM(%) dµξ(%).
Questa relazione vale anche per lo stato ω che sugli operatori Aω agisce come segue
ω(A) = ω(Aω) ≡∫
XfAω
(%) dµω(%).
Le funzioni fAω, che via isomorfismo di Gel’fand si corrispondono agli operatori
Aω, e che quindi generano tutta la C∗-commutativa Eω(A), sono costruite in modo
tale che la loro media rispetto alla particolare misura µω vale ω(A) ed in questo
senso ricostruiscono la statistica dello stato ω.
Un tale approccio tuttavia non e soddisfacente perche in generale non si riesce
a ricostruire la statistica di tutti gli stati invarianti su A. In questo senso l’utilizzo
dell’apparato delle medie ergodiche non e significativo in quanto fornisce solamente
informazioni parziali e la causa di cio sta nel fatto che la costruzione che ab-
biamo presentato e stato-dipendente. Per cercare di ovviare a questa situazione e
necessario servirsi di una costruzione che non fissa un particolare stato invariante
di partenza ma che al contrario coinvolge tutti gli stati, o magari un sottoinsieme
significativo di essi. Quello che mostreremo e che una tale costruzione esiste e
permette di riottenere a posteriori la statistica di tutti gli stati invarianti su A.
6.4.2 Rappresentazione universale sugli stati ergodici
L’idea che vogliamo sviluppare e quella di dedurre una generalizzazione della
costruzione delle medie ergodiche che non sia stato-dipendente. Un’ipotesi ra-
139
gionevole puo essere quella di considerare la costruzione delle medie ergodiche non
nello spazio di rappresentazione G.N.S. relativo ad un particolare stato invariante ω
ma nello spazio di rappresentazione ottenuto come somma diretta di tutti i singoli
spazi di rappresentazione. In questo modo tutti gli stati invarianti entrerebbero
nella costruzione. In realta dato che tutti gli stati invarianti ω ∈ EZν
A si ottengono
come chiusura ∗-debole di combinazioni convesse di stati Zν-ergodici (Paragrafo
B.5.1) puo essere sufficiente limitarsi a questi ultimi.
Indichiamo con PZν
A ≡ E(EZν
A ) l’insieme degli stati ergodici su A e per ogni ωα ∈PZ
ν
A indichiamo la relativa rappresentazione G.N.S. con Hα; πα; Uα(Zν), ψα. Con
le consuete notazioni indichiamo con il simbolo HE, πE ≡⊕
αHα; πα la somma
diretta delle rappresentazioni G.N.S. relative ad i singoli stati ergodici (Paragrafo
B.1.5) convenendo di sottintendere che l’indice α spazia sull’intero insieme PZν
A .
Esplicitamente
HE ≡⊕
α
Hα, πE ≡⊕
α
πα
e la chiameremo rappresentazione universale degli stati ergodici .
Le traslazioni del gruppo Zν , implementate sull’algebra quasi-locale A dagli
∗-automorfismi τx, devono avere una rappresentazione anche sullo spazio HE. Sui
singoli spazi Hα ad ogni traslazione τx e associato un unico operatore unitario
Uα(x) tale che Uα(x)ψα = ψα e πα(τx(A)) = Uα(x)πα(A)Uα(x)−1. Per definizione
la rappresentazione πE dell’osservabile τx(A) e
πE(τx(A)) ≡⊕
α
πα(τx(A)) =⊕
α
Uα(x)πα(A)Uα(x)−1.
Definiamo su HE l’operatore UE(x) nel seguente modo
UE(x) ≡⊕
α
Uα(x).
L’operatore UE(x) e invertibile ed il suo inverso e dato dall’operatore che su ogni
sottospazio Hα agisce come Uα(x)−1
UE(x)−1 ≡⊕
α
Uα(x)−1.
Con questa notazione possiamo scrivere che
πE(τx(A)) = UE(x)πE(A)UE(x)−1
ed il fatto che la collezione UE(x) al variare di x ∈ Kν sia una rappresentazione
del gruppo delle traslazioni Kν segue direttamente dal fatto che le collezioni Uα(x)
140
sono rappresentazioni sui singoli sottospazi Hα. Si verifica anche che questa
rappresentazione e unitaria, infatti dato che ogni Uα(x) e unitario segue che
UE(x)−1 ≡⊕
α
Uα(x)−1 =⊕
α
Uα(x)† = UE(x)†.
Indichiamo con Ω(α) ≡ Ω(α)α′ ∈ HE il vettore definito per componenti da Ω(α)
α′ =
0 se α 6= α′ e Ω(α)α = ψα. Quindi il vettore Ω(α) corrisponde nella somma diretta
al vettore ciclico ψα relativo allo spazio Hα. L’azione degli operatori UE(x) su
questi vettori e definita da
UE(x)Ω(α) = Ω(α) ∀ α ∈ PZν
A , ∀ x ∈ Zn.
Tramite i vettori Ω(α) ∈ HE possiamo definire gli stati vettoriali ΦΩ(α) nel modo
usuale come
ΦΩ(α)(πE(A)) ≡ (Ω(α); πE(A)Ω(α)) ∀ A ∈ A.
Esplicitando il prodotto scalare su HE ed utilizzando la definizione dei vettori Ω(α)
si verifica
ΦΩ(α)(πE(A)) =∑
α′(Ω(α)
α′ ; πα′(A)Ω(α)α′)Hα′
= (ψα; πα(A)ψα)Hα= ωα(A)
dove si e tenuto conto che ωα(A) = (ψα; πα(A)ψα)Hαe esattamente la relazione
che definisce la costruzione G.N.S Hα, πα, ψα associata allo stato ωα. Quindi,
ogni stato ergodico ωα ∈ PKν
A e implementato sulla C∗-algebra πE(A) dallo stato
vettoriale associato a Ω(α) secondo la relazione
ωα(A) = ΦΩ(α)(πE(A)) = (Ω(α); πE(A)Ω(α)) ∀ A ∈ A. (6.19)
6.4.3 La C∗-algebra delle medie ergodiche
Sia ωα ∈ PKν
A uno stato ergodico. Ad ogni A ∈ A possiamo associare tramite
l’operazione di media ergodica (6.17) l’operatore Aα ∈ Mα(A). Cio consente di
associare ad A un operatore A(∞) sullo spazio di Hilbert HE della rappresentazione
ergodica definito come
A(∞) ≡⊕
α
Aα.
L’operatore A(∞) cosı definito e detto media ergodica dell’osservabile A. Questi
operatori si ottengono come limite forte di successioni di operatori di πE(A), infatti
(Paragrafo B.2.1) la convergenza forte delle singole successioni
s-limΛ→∞
πα(A(Λ)) = Aα
141
implica la convergenza forte su HE della successione
s-limΛ→∞
(⊕α
πα(A(Λ))
)=
⊕α
Aα = A(∞)
e come e evidente la successione che definisce A(∞) e contenuta in πE(A). Quest’ul-
tima considerazione implica che A(∞) ∈ ME(A) per ogni A ∈ A. Sui singoli
sottospazi Hα la collezione degli operatori Aα, al variare di A in A, costituisce
uno spazio vettoriale che contiene l’identita 1α. Queste proprieta si estendono
automaticamente anche alle somme dirette, infatti la linearita segue da
aA(∞) + bB(∞) = a
(⊕α
Aα
)+ b
(⊕α
Bα
)
=⊕
α
(aAα + bBα
)=
⊕α
(aA + bB)α = (aA + bB)(∞)
e l’esistenza dell’identita da
1(∞) =⊕
α
1α =⊕
α
1α = 1E.
Indichiamo con V(∞) ⊂ ME(A) lo spazio vettoriale di tutte le medie ergodiche
su HE. Abbiamo dimostrato anche che su ogni sottospazio le medie ergodiche
appartengono a πα(A)′ ossia commutano con tutti gli operatori della relativa rap-
presentazione. Questo fatto si estende alla rappresentazione universale degli stati
ergodici osservando che ogni media ergodica A(∞) commuta con il piu generale
operatore fattorizzato appartenente a⊕
α πα(A), ossia
V(∞) ⊂(⊕
α
πα(A)
)′
.
Poiche vale anche l’inclusione (Paragrafo B.2.1, relazione (B.19))
V(∞) ⊂ ME(A) ⊂(⊕
α
πα(A)
)′′
segue immediatamente che
V(∞) ⊂(⊕
α
πα(A)
)′′
∩(⊕
α
πα(A)
)′
≡ ZE
(⊕α
πα(A)
).
Il fatto che V(∞) sia contenuto in un centro implica immediatamente che i suoi
elementi commutano reciprocamente.
142
Con l’usuale tecnica (Paragrafo 6.3.3) da V(∞) si puo generare una C∗-algebra
per chiusura in norma dell’insieme dei polinomi finiti di elementi di V(∞). Indi-
chiamo con E(∞)(A) la C∗-algebra cosı ottenuta che chiameremo C∗-algebra delle
medie ergodiche . Dato che i polinomi generati da V(∞) sono contenuti nel centro
e dato che il centro e chiuso rispetto alla topologia forte segue
E(∞)(A) ⊂ ZE
(⊕α
πα(A)
)
da cui si evince che la C∗-algebra E(∞)(A) e abeliana. Infine, poiche si dimostra
(Paragrafo B.2.1, relazione (B.20)) che il centro di una somma diretta e la somma
diretta dei centri otteniamo
E(∞)(A) ⊂⊕
α
Zα(A). (6.20)
Discutiamo le conseguenze che l’invarianza per traslazioni induce sulla C∗-
algebra E(∞)(A). Le medie ergodiche Aα relative alla rappresentazione indotta da
ωα commutano con tutti gli operatori unitari Uα(x) che implementano su Hα gli
automorfismi τx. Passando agli operatori ottenuti come somma diretta segue che
V(∞) ⊂(⊕
α
Uα(Zν)
)′
.
Questa proprieta si estende a tutti i polinomi finiti costruiti con gli elementi di
V(∞) e per continuita in norma a tutta la C∗-algebra E(∞)(A). Inoltre essa e co-
stituita da operatori fattorizzati e quindi deve essere contenuta nel sottoinsieme
di (⊕
α Uα(Zν))′ costituito dagli elementi fattorizzati ossia
E(∞)(A) ⊂⊕
α
Uα(Zν)′. (6.21)
Dalle (6.20) e (6.21) segue che
E(∞)(A) ⊂(⊕
α
Zα(A)
)∩
(⊕α
Uα(Zν)′)
=⊕
α
Zα(A) ∩ Uα(Zν)′. (6.22)
6.4.4 Lo spettro dell’algebra delle medie ergodiche
In questo paragrafo e studiato lo spettro dell’algebra delle medie ergodiche E(∞)(A)
e si definisce una biezione tra questo insieme e l’insieme EZν
A degli stati invarianti
su A. Il nesso fondamentale e costituito dal fatto che l’insieme degli stati ergodici
PZν
A coincide come spazio topologico con un sottoinsieme denso di EE(∞) .
143
6.4.1 Lemma. Ad ogni stato ergodico ωα ∈ PZν
A corrisponde uno stato moltiplica-
tivo, ovvero uno stato puro, ωα ∈ PE(∞) e la mappa ωα → ωα e iniettiva.
zDim.
Ogni stato ωα ∈ PZν
A viene implementato su πE(A) dallo stato vettoriale
ΦΩ(α)(πE(A)) ≡ (Ω(α); πE(A)Ω(α)) ∀ πE(A) ∈ πE(A)
e questi stati si estendono per continuita debole a tutta la chiusura von Neumann
ME(A) secondo la prescrizione ΦΩ(α)(M) ≡ (Ω(α); MΩ(α)) per ogni M ∈ ME(A).
La restrizione di ΦΩ(α) alla C∗-algebra delle medie ergodiche E(∞)(A) ⊂ ME(A)
produce degli stati, che indicheremo con ωα, definiti da
ωα(B) = (Ω(α); BΩ(α)) ∀ B ∈ E(∞)(A)
e che in particolare sulle medie ergodiche A(∞) agiscono come segue
ωα(A(∞)) = (Ω(α); A(∞)Ω(α)) = (ψα; Aαψα)Hα= ωα(A)
ovvero riproducendo il valore che lo stato ergodico ωα assume sull’osservabile
A ∈ A associato alla media ergodica A(∞). Resta da verificare che gli stati ωα
appartengono allo spettro di E(∞)(A). Gli stati ωα, che definiscono la rappresen-
tazione universale in cui e ambientata E(∞)(A) sono gli stati Kν-ergodici su A.
Cio comporta che nella singola rappresentazione relativa allo stato ωα vale che
Zα(A) ∩ Uα(Zν)′ = C1α (Paragrafo B.5.4) e quindi per la (6.22) segue che
E(∞)(A) ⊂⊕
α
C1α. (6.23)
Il piu generale elemento dell’algebra delle medie ergodiche e della forma M =⊕α mα1α ossia e univocamente determinato dalla collezione di numeri complessi
mα indicizzata dagli stati ergodici α ∼ ωα ∈ PKν
A . Particolarmente significativa
e l’espressione delle medie ergodiche A(∞), infatti la loro espressione generale e del
tipo A(∞) =⊕
α aα1α ed applicando lo stato ωα′ segue che
ωα′(A(∞)) = (Ω(α′); A(∞)Ω(α′)) = aα′(Ω
(α′);1α′Ω(α′)) = aα′
e ricordando che ωα′(A(∞)) = ωα′(A) segue
A(∞) =⊕
α
ωα(A)1α.
Le medie ergodiche A(∞) sono operatori “diagonali” specificati dalla collezione dei
loro autovalori che coincidono con i valori che tutti gli stati ergodici ωα assumono
144
sull’osservabile A ∈ A da cui la media ergodica A(∞) e ottenuta tramite la mappa
(6.17). Gli stati puri su un’algebra abeliana coincidono con i funzionali moltiplica-
tivi (Paragrafo B.1.8). Questo criterio ci consente di verificare che gli stati ωα sono
nello spettro di E(∞)(A), infatti per ogni M, N ∈ E(∞)(A) segue che
M =⊕
α
mα1α, N =⊕
α
nα1α, MN =⊕
α
(mαnα)1α
ed ogni stato ωα′ agisce come segue
ωα′(MN) = mα′nα′ = ωα′(M) ωα′(N) ∀ M, N ∈ EE(A).
Dato che gli stati ωα sono moltiplicativi allora ωα ∈ PE(∞) . Per finire verifichiamo
che la mappa ωα → ωα e iniettiva. Cio e immediato dato che se ωα 6= ωβ esiste
un A ∈ A tale che ωα(A) 6= ωβ(A) e cio implica che ωα(A(∞)) 6= ωβ(A(∞)) ossia
ωα 6= ωβ. ¨
Quindi PZν
A À X ⊆ PE(∞) avendo indicato con X la collezione degli stati ωα
al variare di α nell’insieme degli stati ergodici su A. Verifichiamo che X e un
sottoinsieme denso in PE(∞) ovvero che la chiusura ∗-debole coincide con PE(∞)
allora necessariamente ω ∈ X . Questo e il contenuto dei Lemmi 6.4.2 e 6.4.3.
6.4.2 Lemma. Rispetto alla topologia ∗-debole dei funzionali lineari continui su
E(∞)(A) l’insieme X e uno spazio compatto di Hausdorff e la C∗-algebra E(∞)(A)
e isomorfa alla C∗-algebra C(X ) delle funzioni continue su X .
zDim.
E un fatto generale che lo spettro di una C∗-algebra abeliana e un sottoinsieme
∗-debolmente chiuso e compatto del duale (Paragrafo B.1.9) e quindi contiene la
chiusura di ogni suo sottoinsieme. Cio implica che X ⊆ PE(∞) e quindi X e uno
spazio topologico di Hausdorff compatto. Osserviamo che ogni M ∈ E(∞)(A) puo
essere interpretata come una funzione fM su X tramite la relazione fM(ω) ≡ ω(M).
Con un calcolo diretto si verifica che la mappa M → fM cosı definita conserva le
relazioni algebriche, ossia: aM + bN → afM + bfN , MN → fMfN , M † → fM ,
1E → 1. La linearita deriva dal fatto che gli stati sono funzionali lineari ma per
dimostrare che e conservato anche il prodotto entra in modo decisivo il fatto che
gli elementi di X sono funzionali moltiplicativi. L’insieme di queste funzioni su
X definisce un’algebra commutativa, autoaggiunta, con identita e normata rispet-
to alla consueta norma “del sup”. La chiusura rispetto a tale norma definisce
una C∗-algebra di funzioni su X a valori complessi. La mappa M → fM e una
145
rappresentazione di E(∞)(A) sulla C∗-algebra di queste funzioni che in generale
e continua in quanto abbassa la norma (Paragrafo B.1.5), ossia ‖fM‖∞ 6 ‖M‖per ogni M ∈ E(∞)(A). In realta la mappa M → fM conserva la norma, infatti
(Paragrafo B.1.5 relazione (B.4))
‖fM‖∞ = supω∈X
|fM(ω)| = supω∈X
|ω(M)| ¦= supωα∈X
|ωα(M)| = supα‖M‖Hα
= ‖M‖
e cio verifica che si tratta di un ∗-isomorfismo di C∗-algebre. L’uguaglianza¦=
e giustificata dal fatto che per ogni M ∈ E(∞)(A), comunque fissato un ε > 0
esiste un ωα ∈ X tale che |ω(M)| = ε + |ωα(M)|. Le funzioni fM sono conti-
nue su X . Sia ωα e un net che converge ∗-debolmente a ω ed osserviamo che
|fM(ωα)−fM(ω0)| = |ωα(M)−ω0(M)|. Poiche il secondo membro va a 0 se α →∞per ogni M segue che le funzioni fM sono continue in ω. La collezioni delle funzioni
fM costituisce una C∗-algebra di funzioni continue sul compatto di Hausdorff X ,
autoaggiunta e che contiene le funzioni costanti. Inoltre quest’algebra separa i pun-
ti di X dato che per ogni coppia ω1 6= ω2 ∈ X deve esistere un M ∈ E(∞)(A) tale
che ω1(M) 6= ω2(M) (altrimenti ω1 = ω2) e quindi fM(ω1) 6= fM(ω2). La collezione
delle funzioni fM verifica tutte le condizioni del Teorema di Stone-Weierstrass2 e
pertanto coincide con la C∗-algebra C(X ) di tutte le funzioni continue a valori
complessi definite sul compatto di Hausdorff X . In altri termini resta prova-
ta l’esistenza di un isomorfismo isometrico detto isomorfismo di Gel’fand
E(∞)(A) À C(X ). ¨
Cio che abbiamo provato fino ad ora e ancora molto generale. L’ingrediente
fondamentale che entra in questa discussione e che l’insieme degli stati X ⊆ PE(∞)
e compatto e contiene stati (puri) a sufficienza da verificare la condizione ‖M‖ =
supωα∈X |ωα(M)| per ogni M ∈ E(∞)(A). Tali condizioni, su un’algebra di ope-
ratori diagonali, sono soddisfatte considerando la chiusura dell’insieme di tutti gli
stati che associano ad ogni operatore l’autovalore corrispondente al relativo sot-
tospazio. Il contenuto del precedente lemma consiste solamente in una “traduzione
di linguaggio” che non aggiunge nulla di nuovo a cio che sappiamo della C∗-algebra
E(∞)(A). Tuttavia in questo “nuovo linguaggio” possiamo dimostrare agevolmente
che l’insieme X esaurisce lo spettro di E(∞)(A).
6.4.3 Lemma. Esiste un isomorfismo tra gli stati su E(∞)(A) e le misure di pro-
babilita di Baire su X . Tutti gli stati puri di E(∞)(A) corrispondono alle misure di
Dirac su X e quindi X esaurisce lo spettro di E(∞)(A).
2C.f.r. [RS72] Teorema IV.10.
146
zDim.
L’isomorfismo di Gel’fand tra le C∗-algebre E(∞)(A) e C(X ) identifica anche i
rispettivi insiemi duali E(∞)(A)∗ e C(X )∗, infatti con una semplice verifica si prova
che la mappa E(∞)(A)∗ 3 φ → Φφ ∈ C(X )∗ definita da φ(M) = Φφ(fM) al variare
di M ∈ E(∞)(A) e un isomorfismo isometrico. Ogni stato ω ∈ EE(∞) e un fun-
zionale lineare positivo e normalizzato Φω sulla C∗-algebra C(X )∗ e viceversa, per
il Teorema di Riesz-Markov (Paragrafo B.4.1), ogni funzionale lineare continuo Φω
su C(X ) e rappresentato in modo unico tramite una misura complessa di Baire su
X secondo la relazione
Φφ(fM) =
∫
XfM(ωα) dµφ(ωα).
Esiste, quindi, una corrispondenza uno a uno tra i funzionali lineari φ ∈ E(∞)(A)∗,
i funzionali lineari Φφ ∈ C(X )∗ e le misure complesse di Baire µφ ∈M(X ) secondo
la relazione φ À Φφ À µφ definita da
φ(M) = Φφ(fM) =
∫
XfM(ωα) dµφ(ωα) ∀ M ∈ EE(∞) .
Poiche la C∗-algebra E(∞)(A) e abeliana i suoi stati puri sono funzionali lineari
moltiplicativi (caratteri). Quindi se ω appartiene allo spettro di E(∞)(A) allora
per ogni M, N ∈ E(∞)(A) deve valere che ω(MN) = ω(M)ω(N) ed in base alla
precedente identificazione cio comporta l’esistenza di una misura di probabilita di
Baire µω ∈M1,+(X ) tale che
∫
X(fMfN)(ωα) dµω(ωα) =
(∫
XfM(ωα) dµω(ωα)
)(∫
XfN(ωα) dµω(ωα)
)
per ogni coppia di funzioni fM , fN ∈ C(X ). Tutte e sole le misure che verifi-
cano questa proprieta sono le misure di Dirac ossia le misure a supporto in un
punto (Paragrafo B.4.1, Teorema B.4.3). Indichiamo con δω0 la misura di Dirac
concentrata nel punto ω0 ∈ X ed osserviamo che per ogni M ∈ E(∞)(A)∫
XfM(ωα) dδω0(ωα) = fM(ω0) = ω0(M).
Quindi le misure di Dirac in M+,1(X ) identificano tutti e soli gli stati X ⊂ EE(∞)
e cio prova che X esaurisce l’insieme degli stati moltiplicativi su E(∞)(A), ossia
X = PE(∞) . ¨
Come mostrato in Figura 6.1 gli stati ergodici PZν
A non esauriscono lo spettro
dell’algebra delle medie ergodiche ma ne individuano un sottoinsieme X denso
147
rispetto alla topologia ∗-debole T(∞) ≡ σ(E(∞)(A)
∗,E(∞)(A)
)dei funzionali lineari
su E(∞)(A). L’insieme degli stati ergodici PZν
A non e, in generale, un sottoinsieme
chiuso del duale A∗ rispetto alla topologia ∗-debole T(w)A∗ ≡ σ (A∗,A) tuttavia la
chiusura ∗-debole PZν
A coincide con l’insieme degli stati invarianti EZν
A (Teorema
6.2.2). I punti limite di PZν
A in genere non sono piu stati ergodici e pertanto,
generalmente, non descrivono piu stati con statistica sulle traslazioni scorrelati
(Teorema 6.1.2). Nel Lemma 6.4.1 abbiamo verificato che gli insiemi PZν
A e Xcoincidono punto per punto ma in realta il loro legame e piu forte in quanto
coincidono come spazi topologici. Indichiamo con la coppia PZν
A ,T(w)A∗ lo spazio
topologico ottenuto restringendo la topologia ∗-debole di A∗ all’insieme degli stati
ergodici ed analogamente indichiamo con X ,T(∞) lo spazio topologico ottenuto
restringendo la topologia ∗-debole di E(∞)(A)∗
sul sottoinsieme denso dello spettro
X .
6.4.4 Lemma. Gli spazi topologici PZν
A ,T(w)A∗ e X ,T(∞) sono omeomorfi.
zDim.
In base al Lemma 6.4.1 gli insiemi PZν
A e X coincidono punto per punto. Per veri-
ficare che i due insiemi coincidono anche come spazi topologici dobbiamo mostrare
che le topologie ∗-deboli definite sui due insiemi sono equivalenti. Sia
U[A1,...,AN ;ε](ω0) ≡ ωα ∈ PZν
A | |ω0(Aj)− ωα(Aj)| < ε, ∀ j = 1, . . . , N
un intorno aperto del punto ω0 rispetto alla topologia indotta su PKν
A da T(w)A∗ .
Questo intorno coincide punto per punto con l’insieme
U[A
(∞)1 ,...,A
(∞)N ;ε]
(ω0) ≡ ωα ∈ X | |ω0(A(∞)j )− ωα(A
(∞)j )| < ε, ∀ j = 1, . . . , N
dato che |ω0(A(∞)j ) − ωα(A
(∞)j )| < ε ⇔ |ω0(Aj) − ωα(Aj)| < ε per ogni scelta
degli stati e degli operatori. L’insieme U[A
(∞)1 ,...A
(∞)N ;ε]
e un intorno aperto del pun-
to ω0 nella topologia indotta su X da T(∞). Quindi tutti gli intorni aperti (e di
conseguenza tutti gli aperti) di PZν
A ,T(w)A∗ individuano intorni aperti (e quindi
aperti) in X ,T(∞) e pertanto tutte le successioni (net) convergenti in X sono
anche successioni (net) convergenti in PZν
A . La topologia T(∞) non puo essere con-
frontata direttamente con la topologia T(w)A∗ dato che intorni indicizzati da elementi
M ∈ E(∞)(A) che non sono medie ergodiche di elementi di A non sono direttamente
riconducibili ad intorni di T(w)A∗ . In questo senso la topologia T(∞) e piu forte (piu
ricca di aperti) della topologia T(w)A∗ . Tuttavia l’equivalenza degli spazi topologici
PZν
A , T(w)A∗ e X ,T(∞) e verificata se si dimostra che ogni intorno aperto di X
148
contiene un intorno di PZν
A . Verificato cio, infatti, segue che anche ogni succes-
sione (net) convergente in PZν
A individua una successione (net) convergente in Xe pertanto gli spazi PZν
A , T(w)A∗ e X ,T(∞) hanno stesse successioni (net) conver-
genti, quindi stessi chiusi e quindi stessa topologia. Sia M un generico elemento
di E(∞)(A) e consideriamo l’intorno
U[M ;ε](ω0) ≡ ωα ∈ X | |ω0(M)− ωα(M)| < ε.
Sia P ≡ P (A(∞)1 , . . . A
(∞)N ) un elemento di V(∞) (polinomio nelle medie ergodiche
A(∞)1 , . . . A
(∞)N ) e tale che ‖M − P‖ 6 η. Per opportune scelte di P il parametro
η puo essere reso piccolo a piacere. Poniamo ancora
κ ≡ supωα∈U[M ;ε](ω0)
|ω0(M − P )− ωα(M − P )| 6 ‖ω0 − ωα‖ η
da cui segue che per un’opportuna scelta di P anche κ puo essere reso piccolo a
piacere (ed in particolare minore di ε). Osserviamo che
|ω0(M)−ωα(M)| = |ω0(M−P )−ωα(M−P )+ω0(P )−ωα(P )| 6 κ+|ω0(P )−ωα(P )|
da cui segue che se |ω0(P ) − ωα(P )| < ε − κ allora ωα ∈ U[M ;ε](ω0). Quindi
per ogni intorno U[M ;ε](ω0) esiste un polinomio finito nelle medie ergodiche P ed
una costante ε′ 6 ε tale che U[P ;ε′](ω0) ⊆ U[M ;ε](ω0). Poiche gli stati ωα sono
moltiplicativi si ottiene che
|ω0(P )− ωα(P )| = |(ω0 − ωα)(P )| = |P ((ω0 − ωα)(A(∞)1 ), . . . , (ω0 − ωα)(A
(∞)N ))|
6 P ′(|(ω0 − ωα)(A(∞)1 )|, . . . , |(ω0 − ωα)(A
(∞)N )|)
avendo indicato con P ′ il polinomio ottenuto da P sostituendo ai coefficienti il
valore assoluto dei coefficienti. Nell’ultimo membro compare un polinomio a coef-
ficienti positivi le cui variabili assumono solo valori positivi. Prendendo variabili
sufficientemente piccole allora il polinomio P ′ puo assumere valori piccoli a piacere.
Quindi deve esistere un parametro δ tale che se |(ω0 − ωα)(A(∞)j )| < δ per ogni
j = 1, . . . , N allora P ′ < ε′. Cio prova che
U[A
(∞)1 ,...,A
(∞)N ;δ]
(ω0) ⊆ U[P ;ε′](ω0) = U[M ;ε](ω0)
e U[A
(∞)1 ,...,A
(∞)N ;δ]
(ω0) corrisponde all’intorno aperto U[A1,...,AN ;δ](ω0) di PZν
A . Il risul-
tato si estende al caso piu generale osservando che
U[M1,...,MN ;ε](ω0) =N⋂
j=1
U[Mj ;ε]
149
e che in U[M1,...,MN ;ε](ω0) e contenuta l’intersezione finita (che e ancora aperta) di
tutti gli intorni di X contenuti rispettivamente negli insiemi U[Mj ;ε]. ¨
stati invarianti
stati sull’algebra delle medie
ergodiche
X
X
spettro
dell’algebrastati ergodici
chiusura dell’insieme degli stati ergodici
omeomorfismo
γ
γ
Figura 6.1: Relazione tra gli insiemi PZν
A e EE(∞) .
La coincidenza degli spazi topologici PZν
A ,T(w)A∗ e X ,T(∞) permette di costru-
ire una biezione γ tra lo spettro dell’algebra delle medie ergodiche PE(∞) e l’insieme
degli stati invarianti EZν
A .
6.4.5 Lemma. Esiste una mappa γ che realizza una corrispondenza biunivoca
tra gli insiemi PE(∞) e EZν
A . Inoltre se ω ∈ PE(∞) e ω = γ(ω) ∈ EZν
A allora
ω(A) = ω(A(∞)) per ogni A ∈ A e per ogni relativa media ergodica A(∞) ∈ V(∞).
zDim.
Il Lemma 6.4.1 definisce la mappa γ tra gli insiemi PZν
A e X ed il Lemma 6.4.4
identifica gli spazi topologici PZν
A , T(w)A∗ e X ,T(∞). L’algebra quasi locale A, per
via della struttura discreta (sistema di spin), e separabile. Sotto queste condizioni
si dimostra che la topologia T(w)A∗ e metrizzabile e PZ
ν
A e un sottoinsieme boreliano
di EZν
A di tipo Gδ. Lo spazio topologico PZν
A ,T(w)A∗ e metrizzabile e quindi ha un
unico completamento che si ottiene aggiungendo i limiti delle successioni di Cauchy.
L’identificazione delle topologie implica che anche X ,T(∞) e metrizzabile e quindi
ha un unico completamento. La mappa γ identifica le successioni di Cauchy dei
150
due spazi e quindi i loro limiti (che sono unici). Cio verifica l’esistenza della mappa
γ : PZν
A À X e per il Teorema 6.2.2 ed il Lemma 6.4.3 segue che γ : EZν
A À PE(∞) .
Infine la relazione ω(A) = ω(A(∞)) e verificata sui densi PZν
A e X per ogni A ∈ A
e per ogni relativa media ergodica A(∞) ∈ V(∞) e quindi si estende alle relative
chiusure. ¨
Sia ω ∈ PE(∞) un elemento dello spettro dell’algebra delle medie ergodiche
E(∞)(A). La mappa γ definisce un unico stato invariante ω ≡ γ(ω) ∈ EZν
A . Lo
stato ω cosı ottenuto definisce a sua volta un unico stato ω sull’algebra di von
Neumann ME(A) (relativa alla rappresentazione universale degli stati ergodici) e
quindi per restrizione definisce un unico stato su E(∞)(A) ⊂ ME(A). A questo
punto e naturale chiedersi se ω(M) e ω(M) coincidono per ogni M ∈ ME(A).
Evidentemente per costruzione
ω(A(∞)) = ω(A) = ω(A(∞)) ∀ A(∞) ∈ V∞
tuttavia questa uguaglianza non si estende a generici elementi di E(∞)(A). Sia
ω ∈ PE(∞) ottenuto come limite della successione ωαα∈I ⊂ X e sia M ∈ E(∞)(A)
approssimato (in senso von Neumann) dalla successione πE(Mn)n∈N ⊂ πE(A).
Osserviamo che
ω(M) = limn
ω(πE(Mn)) = limn
ω(Mn) = limn
(lim
αωα(Mn)
)
avendo tenuto conto che ω = γ(ω) ∈ EZν
A e ottenuto come limite della successione
ωα = γ(ωα)α∈I ⊂ PZν
A . Viceversa osserviamo che
ω(M) = limα
ωα(M) = limα
ωα(M) = limα
(lim
nωα(πE(Mn))
)= lim
α
(lim
nωα(Mn)
).
In generale e possibile esibire esempi in cui i due limiti non commutano e questo
implica che ω 6= ω sull’algebra E(∞)(A). Questo fatto ha come immediata con-
seguenza che:
6.4.6 Corollario. La topologia T(∞) ristretta a PE(∞) e la topologia T(w)A∗ ristretta
a EZν
A = γ(PE(∞)) non coincidono.
Come sunto di questo paragrafo possiamo affermate che ogni stato invariante
ammette un’unica immagine come punto dello spettro dell’algebra delle medie
ergodiche tramite la biezione γ : EZν
A À PE(∞) . Questa mappa identifica solamente
i punti e non preserva le topologie. Questo implica che in generale gli elementi dello
spettro dell’algebra delle medie ergodiche non possono interpretarsi come gli stati
fisici che invece sono definiti tramite un’estensione all’algebra di von Neumann
generata e quindi tramite una restrizione all’algebra delle medie ergodiche.
151
6.5 Medie ergodiche e dinamica topologica
Partendo da un’algebra quasi-locale A definita sul reticolo Zν , tramite la mappa
(6.17) che definisce le media ergodica, abbiamo costruito la C∗-algebra delle medie
ergodiche E(∞)(A). Tuttavia le algebre A e E(∞)(A) non sono isomorfe e quindi
non e evidente “a priori” il modo di esportare la dinamica da A a E(∞)(A). Un
modo possibile e quello di definire l’evoluto temporale della media ergodica A(∞)
come la media ergodica dell’operatore evoluto αt(A)
αt(A(∞)) = (αt(A))(∞). (6.24)
Questa definizione e ben posta se l’evoluzione temporale commuta con le traslazioni
spaziali dato che in questo caso αt
(A(Λ)
)= (αt(A))(Λ) per ogni parte finita Λ del
reticolo. La (6.24), poi, deve essere estesa a tutti i polinomi nelle medie ergodiche
e per chiusura in norma a tutta l’algebra E(∞)(A).
Tuttavia diventa abbastanza piu semplice introdurre una dinamica su E(∞)(A)
utilizzando l’identificazione puntuale γ : EZν
A À PE(∞) , che e conseguenza del
Lemma 6.4.5. Indichiamo con α la dinamica definita su A e con α∗ la dinamica
aggiunta definita sul duale A∗. Le mappe α∗t : A∗ → A∗ sono continue rispetto alla
topologia ∗-debole (Paragrafo B.1.10) e nel Paragrafo 6.2.1 e stato verificato che
α∗ preserva l’insieme EZν
A . La dinamica α∗ su EZν
A definisce in modo naturale una
dinamica α∗ su PE(∞) secondo l’identificazione
α∗t (ω) = α∗t (ω) con ω = γ(ω)
Le mappe α∗t sono continue su X (infatti le mappe α∗t sono continue su PZν
A e le
topologie sui due spazi coincidono) e quindi si estendono per continuita su tutto
lo spettro PE(∞) . Per definire la dinamica sugli elementi dell’algebra delle medie
ergodiche ricordiamo che ogni M ∈ E(∞)(A) e identificato da una funzione continua
fM ∈ C (PE(∞)). Indichiamo con αt(fM) l’evoluto al tempo t della funzione fM
definito dalla relazione
αt(fM)(ω) = fM(α∗t (ω)) ∀ ω ∈ PE(∞) . (6.25)
La definizione e ben posta in quanto la mappa αt manda elementi di C (PE(∞))
in elementi C (PE(∞)) dato che αt(fM) ≡ fM α∗t e una composizione di funzioni
continue. Dato che αt(fM) ∈ C(PE(∞)) esso identifica un solo elemento di E(∞)(A)
che indicheremo con αt(M) e che corrisponde all’evoluto al tempo t di M .
152
Quindi ad ogni sistema infinito descritto da una C∗-algebra quasi-locale A sul
reticolo Zν con dinamica invariante per traslazioni [α; τ ] = 0 e associata una de-
scrizione, la rappresentazione universale degli stati ergodici, rispetto alla quale
le osservabili del sistema si interpretano come alcune funzioni continue a valori
complessi su uno spazio compatto di Hausdorff densamente generato dagli stati
ergodici. La dinamica α definita sull’algebra astratta A si inserisce in questa
interpretazione attraverso la dinamica aggiunta α∗ che, ristretta al sottoinsieme
degli stati invarianti e tramite la mappa γ, definisce una rappresentazione continua
(rispetto alla topologia ∗-debole T(∞)) del gruppo T nel gruppo degli omeomor-
fismi di PE(∞) . In questa descrizione l’evoluzione delle medie ergodiche e definita
dalla relazione (6.25). Il sistema dinamico topologico compatto Σ ≡ PE(∞) ,T, α∗cosı ottenuto riproduce l’evoluzione degli stati invarianti del sistema e quindi, in
termini della statistica sulle traslazioni, riproduce l’evoluzione degli stati con sta-
tistica del sistema. Ad ogni sistema infinito e discreto, con una dinamica invariante
per traslazioni, e associata, tramite la mappa che definisce le medie ergodiche, una
descrizione dinamica classica .
6.6 Conservazione dell’energia media
Consideriamo un sistema di spin sul reticolo Zν ed indichiamo con A la relativa
algebra quasi-locale. Con le notazioni introdotte nel Paragrafo 5.2 consideriamo
un’interazione Φ a range finito ∆Φ e definiamo l’Hamiltoniano nell’origine H0(Φ) ∈A∆Φ
H0(Φ) ≡∑
∆Φ⊇X30
Φ(X).
Costruiamo gli Hamiltoniani locali
H(Λ) ≡∑x∈Λ
τx(H0(Φ)) =∑x∈Λ
∑
(x+∆Φ)⊇X3x
Φ(X) (6.26)
e definiamo la media ergodica (nella rappresentazione universale degli stati ergo-
dici)
πE(A) 3 πE
(1
|Λ|H(Λ)
)s−→ E(∞) ∈ E(∞)(A).
La media ergodica E(∞) si interpreta come l’ energia media sul reticolo.
L’evoluzione temporale di E(∞) e definita da α∗t (ω)(E(∞)) = ω(αt(E(∞))) su ogni ω
appartenente allo spettro di E(∞)(A), tuttavia per continuita e sufficiente valutare
153
l’evoluzione solamente sugli stati ergodici. Quindi per ogni ωβ ∈ X
ωβ(αt(E(∞))) = α∗t (ωβ)(E(∞)) = α∗t (ωβ)
(lim
Λ→∞πE
(1
|Λ|H(Λ)
))
= limΛ→∞
α∗t (ωβ)
(πE
(1
|Λ|H(Λ)
))= lim
Λ→∞1
|Λ|ωβ(αt(H(Λ)))
essendo ωβ l’estensione di ωβ sull’algebra di von Neumann generata. Da questa
relazione segue che
ωβ(αt(E(∞)))− ωβ(E(∞)))
t= lim
Λ→∞1
|Λ| ωβ
(αt(H
(Λ))−H(Λ)
t
).
Passando al limite per t → 0 si ottiene che (Paragrafo 5.2)
d
dtωβ(αt(E
(∞))) = limΛ→∞
1
|Λ| ωβ
(∂Φ(H(Λ))
)
con
∂Φ(H(Λ)) = i∑
X∩Λ′ 6=∅[Φ(X); H(Λ)]
essendo Λ′ ⊇ Λ la regione finita su cui e definito H(Λ) in base alla (6.26). Osser-
viamo che quando Λ →∞ allora dalla (6.26), a meno dei termini di bordo, segue
che
H(Λ) '∑X⊂Λ
Φ(X) + o (|∆Φ| |∂Λ|)
da cui
∂Φ(H(Λ)) ' i∑
X,Y⊂Λ
[Φ(X); Φ(Y )].
La maggior parte di questi addendi e nullo e si verifica che ‖∂Φ(H(Λ))‖/|Λ| → 0
quando Λ →∞. Cio comporta che
d
dtωβ(αt(E
(∞))) = 0
ossia E(∞) e una costante del moto rispetto alla dinamica definita sulle medie
ergodiche. Questo fatto implica che il sistema dinamico che descrive l’evoluzione
del sistema non e definito su PE(∞) ma sul sottoinsieme chiuso (e quindi compatto)
di PE(∞) definito da tutti gli elementi che assumono stesso valore su E(∞).
Questa osservazione apre due importanti questioni:
• esistono altre costanti del moto oltre E(∞) sull’algebra delle medie ergodiche?
• in assenza di altre costanti del moto e possibile dimostrare l’unicita dei limiti
per t → ±∞ dell’evoluzione dinamica?
154
6.7 Conclusioni
Il contenuto di questo capitolo si puo sintetizzare nei seguenti punti:
• I sistemi infiniti costituiti da sottosistemi (microscopici) identici e localizzati
in punti diversi dello spazio sono descritti in termini di una C∗-algebra quasi-
locale su cui e definita l’azione del gruppo delle traslazioni. Questo linguaggio
permette di definire in modo preciso la nozione di stati con statistica che
identifica un particolare sottoinsieme (in generale non tutti) degli stati del
sistema su cui e definita l’operazione di statistica sulle traslazioni delle
osservabili locali (microscopiche) del sistema.
• In termini della statistica sulle traslazioni ogni stato con statistica definisce
uno stato invariante per traslazione. In altri termini si puo dire che l’o-
perazione di statistica sulle traslazioni definisce una relazione di equivalenza
sugli stati con statistica il cui quoziente e l’insieme degli stati invarianti per
traslazioni. In particolare gli stati che non hanno correlazione a lun-
ga distanza (stati clustering) definiscono (e quindi sono statisticamente
equivalenti) gli stati ergodici del sistema. Quindi ai fini di una descrizione
statistica del sistema tutti e soli gli stati rilevanti sono gli stati invarianti per
traslazione.
• Se sul sistema e definita una dinamica invariante per traslazione allora la
chiusura dell’insieme degli stati ergodici (compatto di Hausdorff) e preser-
vato dalla dinamica, l’evoluzione temporale degli stati ergodici e descritta
dalle traiettorie di un sistema dinamico topologico. Tuttavia la chiusura
dell’insieme degli stati ergodici coincide con l’insieme di tutti gli stati in-
varianti e quindi l’evoluzione di questi stati si puo descrivere in due modi:
1) se si utilizza un sistema dinamico compatto allora ogni stato invariante
evolve come una traiettoria; 2) se si rinuncia alla compattezza allora gli stati
invarianti evolvono come misure pseudo-supportate sull’insieme degli stati
ergodici. Ne segue che, dal punto di vista di una descrizione in termini di
statistica sulle traslazioni, l’evoluzione temporale di un sistema infinito e
spazialmente esteso e sempre descrivibile in termini di un sistema dinamico
topologico.
• Nella rappresentazione G.N.S. relativa ad ogni stato invariante si possono co-
struire le medie ergodiche che sono le chiusure, nella topologia operatoriale
155
forte, di limiti per volumi infiniti di osservabili ottenute come medie locali (su
volumi finiti) di osservabili microscopiche. Il valore che lo stato invariante
assume su una media ergodica coincide con il valore che lo stesso assume
sull’osservabile microscopico che genera la media ergodica e rappresenta il
valor medio che si ottiene dalla statistica sulle traslazioni dell’osservabile
microscopica fatta sugli stati statisticamente equivalenti allo stato invari-
ante considerato. In questi termini le medie ergodiche e gli stati invarianti
per traslazioni riducono all’osso lo studio della statistica sulle traslazioni del
sistema in esame.
• La collezione delle medie ergodiche ottenute a partire da un solo stato in-
variante riproduce solamente il contenuto statistico relativo allo stato di
partenza. In questo senso una costruzione “stato-dipendente” non puo essere
soddisfacente se si vuole descrivere la statistica sulle traslazioni di tutti gli
stati con statistica del sistema. Per questa ragione si ambientano le medie
ergodiche nella rappresentazione ottenuta come somma diretta di tutte le
rappresentazioni G.N.S. relative agli stati ergodici del sistema (rappresen-
tazione universale delle medie ergodiche). In questo spazio di rap-
presentazione la collezione di tutte le medie ergodiche (che costituisce uno
spazio vettoriale) puo essere immersa in modo standard nella C∗-algebra
generata detta algebra delle medie ergodiche . La C∗-algebra delle me-
die ergodiche contiene tutta l’informazione fisica riguardante la statistica
sulle traslazioni del sistema di partenza e quindi esse si possono interpretare
come le osservabili macroscopiche del sistema nella misura in cui la
statistica sulle traslazioni corrisponde ad un’osservazione macroscopica. Se
quest’interpretazione e corretta derivano immediatamente altre due consider-
azioni: 1) le osservabili macroscopiche non sono “poche” come generalmente
si sostiene in termodinamica; 2) ogni sistema fisico in termini della descrizione
macroscopica fornita dalle medie ergodiche ammette una descrizione classica.
• L’algebra delle medie ergodiche e abeliana ed e costituita da operatori che
su ogni sottospazio di rappresentazione sono multipli dell’identita. Via iso-
morfismo di Gel’fand quest’algebra e rappresentabile in termini di una C∗-
algebra di funzioni continue definite sull’insieme dei suoi stati puri (spettro)
ed e quindi descrivibile in termini classici. Lo spettro di quest’algebra co-
incide con il completamento dell’insieme degli stati ergodici nella topologia
∗-debole (il completamento e unico poiche la topologia e metrizzabile). Iden-
156
tificando le successioni di Cauchy di stati ergodici si costruisce una biezione
tra lo spettro dell’algebra delle medie ergodiche e gli stati invarianti sulle os-
servabili del sistema. In questo modo ad ogni punto dello spettro dell’algebra
delle medie ergodiche e associato un unico stato invariante per traslazione,
cioe un’unica statistica sui sottosistemi.
• Se il sistema in esame ha una dinamica che commuta con le traslazioni
(cio ad esempio accade per i sistemi quantistici di spin) allora essa definisce
una dinamica topologica sullo spettro dell’algebra delle medie ergodiche.
L’evoluzione delle medie ergodiche e descritta dal valore che le funzioni
rappresentative assumono sulle traiettorie compiute dai punti dello spettro.
Poiche la dinamica e di tipo topologico puo non esserci ricorrenza. Se accade
che, per una qualche classe di stati di partenza, vi e convergenza ad un’unico
punto allora i valori di tutte la medie ergodiche convergeranno verso i valori
assunti sul particolare stato limite (via la biezione esistente tra spettro e stati
invarianti). Cio significa che le statistiche sulle traslazioni delle variabili mi-
croscopiche convergeranno a dei valori di equilibrio ed il sistema evolvera, per
tempi grandi, solo passando per stati con statistica equivalente. In questo
senso sebbene vi sia ancora evoluzione microscopica l’effetto macroscopico e
stazionario. Questo e l’ equilibrio. In generale l’evoluzione temporale degli
stati ergodici (contenuti in X ) puo convergere a stati invarianti che non sono
piu ergodici (punti di PE(∞)) e che individuano statistiche con correlazioni.
157
Capitolo 7
Modelli di dinamica topologica e
sistemi infiniti
7.1 Un modello di sistema unicamente ergodico
In questo paragrafo viene presentato un semplice modello di sistema dinamico
topologico unicamente ergodico e con un attrattore globale sia nel futuro che nel
passato. Questo modello dimostra che la “convergenza topologica” e abbastan-
za semplice da realizzare e verra utilizzato nel seguito per costruire un modello
statistico per la convergenza all’equilibrio.
Indichiamo con ∆ ≡ H,T, U(T) un sistema dinamico Hilbertiano mixing
(Definizione A.3.3), ossia un sistema caratterizzato dall’esistenza di un sottospazio
unidimensionale, individuato dal proiettore P1, invariante sotto l’azione del grup-
po unitario (fortemente continuo nel caso di dinamica continua) U(T) e tale che
Uτw−→ P1 quando τ → ±∞. Indicando con ψ1 il vettore normalizzato che genera
P1(H) la condizione di mixing si esplicita nel seguente modo:
limτ→±∞
(ψ; Uτϕ) = (ψ; P1ϕ) = (ψ; ψ1)(ψ1; ϕ) ∀ ψ, ϕ ∈ H.
Ricordiamo che condizione sufficiente affinche il sistema dinamico sia mixing e che
il gruppo unitario U(T) abbia spettro di Lebesgue sul sottospazio P1(H)⊥ (Para-
grafo A.3.4). Sistemi di questo tipo nascono generalmente come “descrizione geo-
metrica” di sistemi dinamici classici mixing Γ ≡ X , M , µ,T, Ψ (Paragrafo 3.1.5)
identificando H con L2[X , µ], gli operatori Ut con le trasformazioni Ut(f(x)) =
f(Ψt(x)) ed il sottospazio P1(H) con il sottospazio di L2[X , µ] generato dalle
funzioni costanti (quasi ovunque).
158
Costruzione del sistema dinamico topologico
La topologia naturale definita sullo spazio di Hilbert H e la topologia metrica
(uniforme) indotta dalla norma ma su H e possibile introdurre anche la topologia
debole1 definita come la piu debole topologia che rende continui gli elementi del
duale H∗. La topologia debole verifica la proprieta di Hausdorff e se lo spazio di
Hilbert H e separabile (cosa che supporremo sempre vera ed in particolare e vera
quandoH coincide con uno spazio L2) allora e metrizzabile e quindi numerabile. In
quest’ultimo caso tutte le proprieta topologiche possono essere discusse in termini
di successioni convergenti. Sia ψnn∈N una successioni di vettori inH che converge
debolmente a ψ0, allora
ψnw−→ ψ0 ⇔ lim
n→+∞|(ϕ; ψα)− (ϕ; ψ0)| = 0 ∀ ϕ ∈ H.
Indichiamo con B1 la palla unitaria contenuta in H ossia l’insieme definito da
B1 ≡ ϕ | ϕ ∈ H, ‖ϕ‖ 6 1.
Come conseguenza del Teorema di Banach-Alaoglu2 la palla unitaria B1 ⊂ He compatta rispetto alla topologia debole di H. Se si considera il sottoinsieme
B1 munito della topologia debole relativa (la topologia ottenuta considerando
aperti gli insiemi B1 ∩ U con U insieme debolmente aperto di H) allora B1 risulta
uno spazio compatto di Hausdorff.
Consideriamo il gruppo UT. Per ogni t ∈ T l’operatore Ut e unitario, ossia
isometrico ed invertibile. L’isometria comporta che ‖Utϕ‖ = ‖ϕ‖ per ogni ϕ ∈ He quindi Ut(B1) ⊆ B1. L’invertibilita di Ut comporta che Ut(B1) = B1. Quindi
la dinamica UT preserva la palla unitaria B1 ∈ H. Se si indica con Vt ≡ Ut|B1la
restrizione di Ut su B1 allora la famiglia VT costituisce una rappresentazione del
gruppo T nelle trasformazioni invertibili di B1 in se. Gli operatori Ut sono continui
rispetto alla topologia uniforme, infatti
‖Utϕ− Utϕ0‖ = ‖U(ϕ− ϕ0)‖ = ‖ϕ− ϕ0‖
da cui segue che se ϕ → ϕ0 allora Ut(ϕ) → Ut(ϕ0).
Si verifica che gli operatori Ut sono continui anche rispetto alla topologia debole,
infatti
|(ψ; Utϕ)− (ψ; Utϕ0)| =∣∣(Ut
†ψ; ϕ)− (Ut†ψ; ϕ0)
∣∣1Una discussione generale sulla topologia debole e sulle sue proprieta e data nel Paragrafo
B.1.6.2Il Teorema di Banach-Alaoglu e discusso nel Paragrafo B.1.6.
159
e quindi se ϕw−→ ϕ0 allora Ut(ϕ)
w−→ Ut(ϕ0). Dato che gli operatori Ut sono
debolmente continui su tutto H, le loro restrizioni Vt ≡ Ut|B1sono debolmente
continue sulla palla unitaria B1. Quindi per ogni t ∈ T la trasformazione Vt :
B1 → B1 e continua, invertibile e con inversa continua ossia un omeomorfismo
di B1. La famiglia V (T) e un’azione del gruppo T nell’insieme Om(B1) degli
omeomorfismi dello spazio compatto di Hausdorff B1 in se.
Dalle precedenti considerazioni segue che la terna Σ ≡ B1,T, V (T) e un
sistema dinamico topologico. Per ogni ψ ∈ B1 vale che
w-limτ→±∞
Vτψ = w-limτ→±∞
Uτψ = P1ψ = (ψ1; ψ) ψ1 ≡ ψ
ossia la traiettoria ψ(t) ≡ Vtψ di ogni punto ψ ∈ B1 tende nel remoto passato e nel
remoto futuro al punto limite ψ = (ψ1; ψ) ψ1. Indichiamo con F il sottoinsieme di
B1 definito da
F ≡ B1 ∩ P1(H) = ϕ | ϕ = η ψ1, η ∈ D1 (7.1)
essendo D1 il disco unitario di C, ovvero D1 ≡ η ∈ C | |η| = 1. L’insieme Fe costituito da tutti e soli i punti di B1 invariante sotto la dinamica V (T) (e un
sottoinsieme di P1(H)) e per questo motivo diremo che F e l’ insieme dei punti
fissi del sistema dinamico Σ. Poiche esistono dei punti fissi segue che il sistema
dinamico non e minimale. Inoltre ogni traiettoria ψ(t) ≡ Vtψ tende nel remoto
passato e nel remoto futuro ad un punto limite ψ = η ψ1 appartenente ad F .
Osserviamo che comunque scelto un sottoinsieme chiuso (di Borel) F ′ ⊆ F si
puo costruire una misura di probabilita di Baire (o di Borel regolare) δF ′ invariante
e con supporto su F ′. Poiche per ogni scelta di F ′ ⊆ F si ottiene una misura
invariante distinta segue che il sistema dinamico topologico Σ ≡ B1,T, V (T)non e unicamente ergodico (Definizione 3.3.3).
Costante del moto ed ipersuperfici invarianti
Il sistema dinamico Σ ≡ B1,T, V (T) possiede una costante del moto, ossia
una funzione ωψ1 : B1 → C che si mantiene costante lungo le traiettorie. Conside-
riamo il generico punto ψ ∈ B1 e la relativa traiettoria ψ(t) ≡ Vtψ ed osserviamo
che
ωψ1(ψ(t)) ≡ (ψ1; ψ(t)) = (Vtψ1; Vtψ) = (Utψ1; Utψ) = (ψ1; Ut†Utψ) = (ψ1; ψ) = η.
Cio prova che le traiettorie ψ(t) = Vtψ hanno proiezione lungo ψ1 costante.
Ogni vettore di ϕ ∈ H si decompone in modo unico come ϕ = αψ1 + ϕ⊥ con
α ∈ C e ϕ⊥ ∈ ψ1⊥ e quindi ωψ1(ϕ) = (ψ1; αψ1 +ϕ⊥) = α(ψ1; ψ1)+(ψ1; ϕ⊥) = α.
160
pertanto l’insieme Π(α) costituito da tutti i vettori di H su cui ωψ1 assume il valore
α e definito da
Π(α) ≡ ϕ | ϕ ∈ H, ϕ = αψ1 + ϕ⊥, ϕ⊥ ∈ ψ1⊥ ≡ αψ1 + ψ1⊥ ≡ αψ1 + Π(0).
L’insieme Π(0) ≡ ψ1⊥ e l’iperpiano (con questo termine intendiamo un sot-
tospazio di H di codimensione 1) ortogonale alla direzione individuata dal vettore
ψ1 ed il sottoinsieme Π(α) e un iperpiano parallelo a Π(0) e traslato di α lungo la
direzione di ψ1. Evidentemente l’iperpiano Π(α) interseca la palla unitaria B1 se e
solo se |α| 6 1 (Teorema di Pitagora). Indichiamo con B(η)1 ≡ B1 ∩ Π(η) al variare
di η ∈ D1 i dischi ottenuti tagliando la sfera B1 con gli iperpiani Π(η). Se ψ ∈ B(η)1
la legge di conservazione impone che tutta la traiettoria ψ(t) = Vtψ deve essere
contenuta in B(η)1 . Inoltre per ogni ψ ∈ B(η)
1 vale che
w-limτ→±∞
Vτψ = (ψ1; ψ) ψ1 = ηψ1
ossia ogni punto di B(η)1 converge nel remoto passato o nel remoto futuro all’unico
punto fisso ηψ1 di B(η)1 ottenuto dall’intersezione di F con l’iperpiano Π(η).
B1
F
B(η)1
Figura 7.1: Palla unitaria in H e relativa sezione.
La funzione ωψ1 e debolmente continua3 su H e la controimmagine di ogni chiuso
di C definisce un sottoinsieme debolmente chiuso di H. Poiche l’insieme costituito
dal solo punto α ⊂ C e un chiuso allora −1ωψ1(α) e debolmente chiuso in H.
3La funzione ωψ1 ≡ (ψ1; ) e debolmente continua, infatti dalla relazione
|ωψ1(ϕ)− ωψ1(ϕ0)| = |(ψ1; ϕ)− (ψ1; ϕ0)|
segue che se ϕw−→ ϕ0 allora ωψ1(ϕ) → ωψ1(ϕ0).
161
Per definizione −1ωψ1(α) = Π(α) e quindi per ogni α ∈ C l’iperpiano Π(α) e un
sottoinsieme debolmente chiuso di H. La palla unitaria B1 e un sottoinsieme de-
bolmente compatto dello spazio H che rispetto alla topologia debole e uno spazio
di Hausdorff; cio implica che B1 e anche debolmente chiuso4. Quindi per ogni
η ∈ D1 il disco B(η)1 = B1 ∩Π(η) e debolmente chiuso in quanto intersezione di due
sottoinsiemi debolmente chiusi. Dato che ogni sottoinsieme chiuso di un insieme
compatto e compatto5 si conclude che i dischi B(η)1 sono sottoinsiemi debolmente
compatti di H. La dinamica U(T) lascia invariati gli insiemi B1 e Π(η) e quindi
preserva anche la loro intersezione B(η)1 . Per ogni t ∈ T l’operatore Ut definisce
una mappa biunivoca di ogni disco B(η)1 in se. Se indichiamo con V
(η)t ≡ Ut|B(η)
1la
restrizione di Ut su B(η)1 segue che ogni V
(η)t definisce una trasformazione continua
ed invertibile con inversa continua di B(η)1 in se, ovvero V
(η)t ∈ Om(B(η)
1 ). Per ogni
η ∈ D1 la terna Σ(η) ≡ B(η)1 ,T, V (η)(T) ha la struttura di un sistema dinamico
topologico con un unico punto fisso ηψ1 che e anche un’ attrattore globale della
dinamica . Per il Corollario 3.3.6 segue che ogni sistema dinamico Σ(η) e uni-
camente ergodico con unica misura invariante (a meno di normalizzazione) data
dalla misura di Dirac δη concentrata sul punto ηψ1.
7.2 Il modello come sistema infinito con osser-
vabili di singolo sito
Indichiamo con Γ ≡ X ,M , µ,T, Ψ un sistema dinamico classico, ad esempio
una scatola contenente del gas, che supponiamo mixing. Se il sistema e di tipo
Hamiltoniano allora lo spazio X e compatto di Hausdorff, la misura µ e boreliana
(ad esempio la misura di Liouville) e la dinamica Ψ oltre ad essere misurabile
e anche continua. Consideriamo un sistema infinito costituito da una collezione
numerabile di questi sistemi Γ(n)n∈Z. Ad esempio si puo pensare ad un reticolo
discreto in cui ad ogni sito e associato un sistema Γ. Un sistema di questo genere
e un reticolo (unidimensionale) classico che si costruisce come un sistema
quantistico di spin con l’unica differenza che la C∗-algebra locale associata ad ogni
sito non e costituita da matrici finite (matrici (2s + 1) × (2s + 1) per sistemi di
spin s/2) ma coincide con la C∗-algebra C(X ) delle funzioni continue su X .
4C.f.r. [HY61] Corollario 2-2.5C.f.r. [HY61] Teorema 1-25.
162
X(0)
X(−1)
X(−2)
X(1)
X(2)
Figura 7.2: Sistema prodotto infinito.
Su questo sistema si definiscono le traslazioni in modo naturale. Sia f (0) ∈C(0)(X ) una funzione continua sul sistema associato al sito 0 e per ogni k ∈ Z
definiamo la mappa invertibile τk tale che τk(f(0)) = f (k) ∈ C(k)(X ) essendo f (k)
l’“omonima” della funzione f (0) ma riferita al sito traslato in k. Consideriamo un
punto xn appartenente allo spazio prodotto∏
n∈ZX (n) e definito da xn ∈ X (n).
Ogni punto xn definisce uno stato ωxn sulla C∗-algebra quasi-locale del sistema
secondo la definizione
ωxn(f(n1) ⊗ . . .⊗ g(nN )) ≡ f (n1)(xn1) . . . g(nN )(xnN
)
per ogni osservabile locale f (n1) ⊗ . . . ⊗ g(nN ) ∈ C(n1)(X ) ⊗ . . . ⊗ C(nk)(X ) con
N < +∞. L’estensione a tutta l’algebra quasi-locale si ottiene per continuita.
Osserviamo che le C∗-algebre locali C(n1)(X ) ⊗ . . . ⊗ C(nk)(X ) sono commutative
e questa proprieta si estende anche all’algebra quasi-locale (il sistema che consi-
deriamo e classico). Inoltre gli stati ωxn sono moltiplicativi e quindi sono stati
puri del sistema. Consideriamo una funzione continua f ≡ f (0) ∈ C(0)(X ) e
definiamo l’espressione
Lxn(f) ≡ limN→+∞
1
2N + 1
+N∑
k=−N
ωxn(τk(f(0))) = lim
N→+∞1
2N + 1
+N∑
k=−N
f(xk).
Se Lxn(f) esiste finito per ogni f ∈ C(X )(0) diremo che ωxn e uno stato con
statistica ed il punto xn ∈∏
n∈ZX (n) individua una configurazione con
statistica . Osserviamo che questa definizione di stato con statistica e piu de-
bole di quella data nel Paragrafo 6.1 in quanto non si richiede che la statistica sia
definita per tutte le osservabili del sistema ma solo per le osservabili di singolo sito
(funzioni ad un punto). In particolare se Lxn e invariante per traslazioni e
quindi definisce un funzionale lineare positivo e normalizzato (lo stesso) su ogni
C∗-algebra di singolo sito C(n)(X ). Quindi, secondo questa definizione, ogni con-
figurazione con statistica xn ∈∏
n∈ZX (n) definisce uno stato Lxn sulle funzioni
163
continue di X . Per il Teorema di Riesz-Markov segue ancora che
Lxn(f) =
∫
Xf(x′) dµxn(x
′) ∀ f ∈ C(X )
con µxn misura di probabilita di Baire (o equivalentemente regolare di Borel) su
X . Quindi, ricapitolando, ogni configurazione con statistica sulle funzioni
ad un punto del sistema infinito∏
n∈Z Γ(n) definisce una misura di probabilita
di Baire sul singolo sottosistema dinamico Γ ≡ X ,M , µ,T, Ψ. Diremo che la
configurazione con statistica xn ∈∏
n∈ZX (n) e regolare se la misura µxn e
assolutamente continua rispetto alla misura ergodica (di Liouville) µ che definisce
il sistema mixing Γ, ossia se esiste una funzione ρ ∈ L1[X , µ] tale che
∫
Xf(x′) dµxn(x
′) =
∫
Xf(x′) ρ(x′) dµ(x′) ∀ f ∈ C(X ).
In particolare, dato che µxn e una misura di probabilita, segue che ρ(x) > 0 e∫X ρ(x′) dµ(x) = 1, ossia ρ e una densita per il sistema Γ ≡ X ,M , µ,T, Ψ.
Sotto l’effetto dell’evoluzione temporale su ogni sottosistema il punto xn evolve
nel tempo t nel punto Ψt(xn). Cio significa che anche la configurazione xn ∈∏n∈ZX (n) evolvera nel tempo in una nuova configurazione xn(t) ∈ ∏
n∈ZX (n)
definita da xn(t) ≡ Ψt(xn). La configurazione xn con statistica sulle funzioni
ad un punto evolve in una configurazione xn(t) che ha ancora statistica, infatti
Lxn(t)(f) = limN→+∞
1
2N + 1
+N∑
k=−N
f(Ψt(xk))
= limN→+∞
1
2N + 1
+N∑
k=−N
Ut(f)(xk) = Lxn(Ut(f)) ∀ f ∈ C(X )
e dato che Ut(f) = f Ψt e una funzione continua (in un modello hamiltoniano la
dinamica e continua, oltre che misurabile) segue che Lxn(t) definisce un funzionale
positivo e normalizzato su C(X ). Se la configurazione di partenza xn e anche
regolare allora per il Teorema di Riesz-Markov segue che per ogni f ∈ C(X )
∫
Xf(x′) dµxn(t)(x
′) =
∫
Xf(Ψt(x
′)) ρ(x′) dµ(x′) =
∫
Xf(x′) ρ(Ψ−t(x
′)) dµ(x′)
dove nell’ultimo passaggio si utilizzata l’invarianza della misura µ rispetto alla
dinamica. Cio prova che la misura µxn(t) e assolutamente continua rispetto alla
misura ergodica di partenza µ e quindi xn(t) e ancora uno stato regolare. Inoltre
164
ρt(x) ≡ ρ(Ψ−t(x)) e ancora una densita (funzione positiva ed integrata ad 1) che
rappresenta l’evoluta temporale al tempo t della densita iniziale ρ.
A meno di un ε > 0 piccolo a piacere la densita ρ puo essere sostituita
con una densita ρ′ ∈ L2[X , µ] tale che∫X |ρ(x′) − ρ(x′)| dµ(x′) < ε. Quin-
di, a meno di questa innocua approssimazione, in termini di una statistica sulle
traslazioni l’evoluzione dinamica del sistema infinito si puo descrivere in termini
dall’evoluzione temporale di una densita L2[X , µ] sotto l’effetto di una dinamica
mixing. Osserviamo ancora che
1 =
∫
Xρ(x′) dµ(x′) = (1; ρ)
L2
in quanto ρ e una densita e per la disuguaglianza di Schwartz
1 = |(1; ρ)L2 |2 6 ‖ρ‖2
L2
da cui segue che ‖ρ‖L2 = M > 1 se si esclude il caso in cui ρ = 1. Cio significa che
la densita ρ e contenuta nel disco dello spazio di Hilbert L2[X , µ] ottenuto tagliando
la palla BM di raggio M > 1 con l’iperpiano Π(1) ortogonale al sottospazio delle fun-
zioni costanti ed individuato dall’equazione (1; f)L2 = 1 al variare di f ∈ L2[X , µ].
Per quanto discusso nel precedente paragrafo il disco B(1)M ≡ BM ∩ Π(1) e un in-
sieme compatto di Hausdorff rispetto alla topologia debole e la dinamica mixing
definisce un sistema dinamico unicamente ergodico ΣM ≡ B(1)M ,T, V (1)(T) con
un unico punto attrattore che coincide con la funzione costante 1(x) = 1. Quin-
di sotto l’effetto dell’evoluzione dinamica la densita ρ convergera debolmente alla
densita uniforme 1 ed ogni sottosistema sara descritto in termini di una statistica
microcanonica.
Fino ad ora abbiamo dimostrato che ogni stato puro xn ∈∏
n∈ZX (n) con
statistica regolare sulle funzioni ad un punto definisce una densita ρ ∈ L2[X , µ] (a
meno di un ε) caratterizzata dalle relazioni ‖ρ‖L2 = M > 1 e (1; ρ)
L2 = 1. Questa
densita e un punto di un sistema dinamico ΣM ≡ B(1)M ,T, V (1)(T) che, in ipotesi
di mixing, ha un unico attrattore globale nel passato e nel futuro. Tuttavia il
sistema dinamico ΣM e M -dipendente, ossia dipende dalla norma L2 della densita
ρ. In generale, per un’opportuna scelta della configurazione con statistica regolare
il valore di M puo essere arbitrariamente grande e quindi la collezione di tutte le
densita che descrivono le configurazioni con statistica regolare e⋃
M>1 B(1)M che non
e compatto (anche se risulta debolmente chiuso in quanto coincide con l’iperpiano
Π(1)) e non e contenuto in nessun compatto (debole) di L2[X , µ]. Quindi il modello
Hilbertiano di sistema dinamico topologico descritto nel Paragrafo 7.1 e inadeguato
165
per descrivere l’evoluzione dinamica di tutte le densita definite dalle configurazioni
con statistica regolare. Tuttavia e ancora possibile immergere la collezione delle
densita in un sistema dinamico topologico. Indichiamo conM+,1(X ) l’insieme delle
misure di probabilita di Baire su X . L’insiemeM+,1(X ) coincide con l’insieme degli
stati sulla C∗-algebra C(X ) (Teorema di Riesz-Markov, Paragrafo B.4.1) e quindi
e ∗-debolmente compatto e di Hausdorff (conseguenza del Teorema di Banach-
Alaoglu, Paragrafo B.1.6). Le densita ottenute a partire dalle configurazioni con
statistica regolare definiscono il sottoinsieme L1 ⊂ M+,1(X ) costituito da tutte le
misure ρ µ assolutamente continue alla misura µ per ogni ρ ∈ L1[X , µ] positiva e
tale che∫X ρ(x) dµ(x) = 1 (non e piu necessario limitarsi a densita L2). L’insieme
L1 e invariante rispetto all’evoluzione dinamica (le densita evolvono nelle densita
in quanto le configurazioni regolari evolvono in configurazioni regolari) ed inoltre
se la dinamica e mixing si verifica che (Paragrafo 3.1.5) per ogni f ∈ C(X )
limτ→±∞
ρτ µ(f) = limτ→±∞
∫
Xf(x)ρ(Ψ−τ (x)) dµ(x) =
∫
Xf(x) dµ(x) = µ(f)
ossia ρτ µ∗−w−→ µ. Quindi le configurazioni con statistica regolare definiscono un
sottoinsieme invariante L1 che e immerso nel sistema dinamico topologico ΣM ≡M+,1(X ),T, V (T). Inoltre tutti i punti di L1 vengono attratti nel passato o nel
futuro dal punto stazionario µ. Il sistema ΣM non e unicamente ergodico in quanto
anche l’insieme M+,1(X ) \L1 (costituito dalle misure ottenute dalle configurazioni
con statistica non regolare) e invariante e quindi, in generale, e possibile costruire
diverse misure invarianti. Tuttavia la restrizione della dinamica su L1 definisce un
sottosistema che e quasi-unicamente ergodico (Paragrafo 3.3.5).
7.3 Un sistema infinito con convergenza all’equi-
librio
La comparsa delle densita sui singoli sottosistemi microscopici dipende dalla defini-
zione molto debole di configurazione con statistica sulle funzioni ad un punto. In
pratica si considerano tutti gli stati che hanno statistica sulle traslazioni non rispet-
to a tutte le osservabili microscopiche ma solo rispetto alle particolari osservabili
definite su ogni singolo sito. Resta aperto il problema di capire cosa succede se si
considerano anche le osservabili relative a piu siti e le configurazioni con statistica
su tutte tali osservabili.
166
Con le stesse notazioni del paragrafo precedente consideriamo il prodotto in-
finito dei sistemi dinamici Γ ≡ X ,M , µ,T, Ψ. Indichiamo con il simbolo
AL ≡ C(−L)(X )⊗ . . .⊗ C(0)(X )⊗ . . .⊗ C(L)(X )
la C∗-algebra locale associata all’insieme limitato dei 2L+1 siti [−L, L]. L’algebra
locale del sistema e data da A ≡ ⋃L∈NAL e tramite una chiusura in norma si
ottiene l’algebra quasi-locale A ≡ ⋃L∈NAL. La C∗-algebra A cosı definita e com-
mutativa (e commutativa ogni algebra locale) e quindi per il Teorema di Gel’fand
(Paragrafo B.1.9) e isomorfa alla C∗-algebra C(PA) delle funzioni continue definite
sul suo spettro PA. Gli stati moltiplicativi, ossia gli elementi dello spettro, sono
associati alle configurazioni xn ∈∏
n∈ZX (n) tramite le relazioni
ωxn(f(n1) ⊗ . . .⊗ g(nN )) ≡ f (n1)(xn1) . . . g(nN )(xnN
)
e viceversa ogni successione di punti definisce un funzionale moltiplicativo su A.
Cio mostra che PA coincide con il prodotto∏
n∈ZX (n) e quindi A = C(∏
n∈ZX (n)).
Diremo che xn e una configurazione con statistica sulle traslazioni ri-
spetto a tutte le osservabili se
Lxn(A) ≡ limN→+∞
1
2N + 1
+N∑
k=−N
ωxn(τk(A)) ∀ A ∈ A
esiste finito. In questo caso Lxn definisce un funzionale lineare positivo e nor-
malizzato sulla C∗-algebra A = C(∏
n∈ZX (n)) e per il Teorema di Riesz-Markov
individua una misura di probabilita di Baire µxn sullo spazio prodotto∏
n∈ZX (n).
Diremo che xn e una configurazione con statistica regolare se la restrizione
della misura µxn alla C∗-algebra locale AL e data da
dµxn∣∣AL≡ ρ(x−L, x−L+1, . . . , xL−1, xL) dµ(x−L)dµ(x−L+1) . . . dµ(xL−1)dµ(xL)
con ρ ∈ L2[∏+L
n=−LX (n),∏+L
n=−L µ]. Sia xn(t) l’evoluto della configurazione xned osserviamo che sulle osservabili locali vale che
ωxn(t)(f(n1) ⊗ . . .⊗ g(nN )) = f (n1)(xn1(t)) . . . g(nN )(xnN
(t))
= (U(n1)t f (n1))(xn1) . . . (U
(nN )t g(nN ))(xnN
) = ωxn[Ut(f(n1) ⊗ . . .⊗ g(nN ))]
avendo introdotto l’operatore Ut ≡⊗
n∈Z U(n)t . La precedente relazione si gene-
ralizza scrivendo che ωxn(t)(A) = ωxn(Ut(A)) per ogni osservabile quasi-locale
167
A ∈ A. L’evoluzione temporale commuta con le traslazioni e quindi
Lxn(t)(A) = limN→+∞
1
2N + 1
+N∑
k=−N
ωxn(t)(τk(A))
= limN→+∞
1
2N + 1
+N∑
k=−N
ωxn[Ut(τk(A))]
= limN→+∞
1
2N + 1
+N∑
k=−N
ωxn[τk(Ut(A))] = Lxn(Ut(A)) ∀ A ∈ A
il che mostra che le configurazioni con statistica rispetto a tutte le osservabili
evolvono in configurazioni che hanno ancora statistica rispetto a tutte le osservabili.
Sia µxn(t) la misura associata al funzionale Lxn(t)(A). Se la configurazione xne anche regolare allora la relazione Lxn(t)(A) = Lxn(Ut(A)), ristretta alle algebre
locali, implica che
dµxn(t)∣∣AL
= ρ(Ψ−t(x−L), . . . , Ψ−t(xL)) dµ(x−L) . . . dµ(xL) (7.2)
e quindi xn(t) e ancora uno stato regolare e
ρ(Ψ−t(x−L), . . . , Ψ−t(xL)) ≡ (Utρ)(x−L, . . . , xL) = ρt(x−L, . . . , xL)
rappresenta l’evoluta al tempo t della densita ρ ∈ L2[∏+L
n=−LX (n),∏+L
n=−L µ]. Se
indichiamo con H(n) la spazio di Hilbert L2[X (n), µ] associato al sito n-esimo allora
L2
[+L∏
n=−L
X (n),
+L∏n=−L
µ
]= H(−L) ⊗H(−L+1) ⊗ . . .⊗H(L−1) ⊗H(L) ≡ HL.
L’evoluzione temporale su HL e indotta dagli operatori fattorizzati
Ut ≡ U(−L)t ⊗ U
(−L+1)t ⊗ . . .⊗ U
(L−1)t ⊗ U
(L)t
e nell’ipotesi che ogni sistema dinamico Γ(n) associato al singolo singolo sito sia
mixing segue che ogni spazio componente H(n) ha un sottospazio unidimensionale
invariante (le funzioni costanti) sotto l’azione degli operatori unitari U(L)t . Indi-
cando questo sottospazio con h(n) vale la decomposizione in sottospazi ortogonali
H(n) = h(n) ⊕ V (n). Quindi
HL = (h(−L) ⊕ V (−L))⊗ . . .⊗ (h(L) ⊕ V (L)). (7.3)
168
Questo prodotto puo essere riordinato nel modo seguente
HL = H2L+1,0 ⊕H2L,1 ⊕ . . .⊕H0,2L+1 (7.4)
dove ogni H2L+1−k,k e un prodotto tensoriale di 2L + 1 sottospazi definiti da
H2L+1,0 ≡ h(−L) ⊗ . . .⊗ h(L)
H2L,1 ≡ [V(−L) ⊗ h(−L+1) ⊗ . . .⊗ h(L)]⊕ . . .⊕ [. . .]︸ ︷︷ ︸tutte le disposizioni di 2L spazi h e 1 spazio V
H2L−1,2 ≡ [V(−L) ⊗ V (−L+1) ⊗ h(−L+2) ⊗ . . .⊗ h(L)]⊕ . . .⊕ [. . .]︸ ︷︷ ︸tutte le disposizioni di 2L−1 spazi h e 2 spazio V
......
H0,2L+1 ≡ V (−L) ⊗ . . .⊗ V (L).
Gli spazi H2L+1−k,k sono tutti mutuamente ortogonali6 e sono tutti invarianti
rispetto agli operatori Ut ≡ U(−L)t ⊗ . . . ⊗ U
(L)t (sono singolarmente invarianti
i sottospazi h e V). Questo implica che tutti i prodotti scalari (ψ; Utϕ) con vet-
tori appartenenti a sottospazi H2L+1−k,k con k distinti sono automaticamente nulli.
Consideriamo due vettori fattorizzati ψ ≡ ψ(−L)⊗. . .⊗ψ(L) e ϕ ≡ ϕ(−L)⊗. . .⊗ϕ(L)
appartenenti allo stesso sottospazioH2L+1−k,k, con k > 1, e nell’ipotesi di dinamica
mixing dei singoli sistemi dinamici osserviamo che
limτ→±∞
(ψ; Uτϕ) = limτ→±∞
L∏n=−L
(ψ(n); U (n)τ ϕ(n)) =
L∏n=−L
(ψ(n); e(n)0 )(e
(n)0 ; ϕ(n)) = 0
avendo indicato con e(n)0 il vettore normalizzato che genera il sottospazio invariante
h(n) ed il risultato segue considerando che almeno k delle componenti di ψ e ϕ de-
vono appartenere a sottospazi di tipo V . Il risultato si estende a tutto il sottospazio
H2L+1−k,k dato che i vettori fattorizzati ne costituiscono un sottoinsieme denso. Ne
segue che limτ→±∞(ψ; Uτϕ) = 0 non appena ϕ e ortogonale al sottospazio unidi-
mensionale H2L+1,0. Invece se ψ ∈ H2L+1,0 allora ψ ≡ a(e(−L) ⊗ . . . ⊗ e(L)) e
6Il prodotto scalare tra due vettori fattorizzati relativi a due spazi con valori distinti di
k e nullo. Infatti questi vettori presentano nella loro decomposizione un numero distinto di
componenti di tipi h e quindi rispetto a qualche componente deve comparire il prodotto scalare
tra un vettore di tipo h ed un vettore di tipo V che e nullo. Il risultato si estende a tutto lo
spazio dato che i vettori fattorizzati sono un insieme denso.
169
ϕ ≡ b(e(−L) ⊗ . . .⊗ e(L)) con a, b ∈ C e quindi
limτ→±∞
(ψ; Uτϕ) = ab = (ψ; ϕ).
Cio verifica che Uτw−→ P avendo indicato con P il proiettore unidimensionale sul
sottospazio H2L+1,0. Inoltre P ≡ P (−L) ⊗ . . .⊗ P (L) essendo P (n) il proiettore sul
singolo sottospazio h(n).
In termini di ρ ∈ L2[∏+L
n=−LX (n),∏+L
n=−L µ] cio implica che
limτ→±∞
∫∏+L
n=−L X (n)
f(x′−L, . . . , x′L)(Uτρ)(x′−L, . . . , x′L)+L∏
n=−L
dµ(x′n)
=
(∫∏+L
n=−L X (n)
f(x′−L, . . . , x′L)+L∏
n=−L
dµ(x′n)
)(7.5)
per ogni f ∈ L2[∏+L
n=−LX (n),∏+L
n=−L µ] avendo assunto per la densita ρ che
∫∏+L
n=−L X (n)
ρ(x′−L, . . . , x′L)+L∏
n=−L
dµ(x′n) = 1.
La relazione (7.5) si estende anche alle densita ρ ∈ L1[∏+L
n=−LX (n),∏+L
n=−L µ] che
sono approssimate arbitrariamente bene da densita L2 ed inoltre con la notazione
(7.2) la precedente relazione diviene
limτ→±∞
∫∏+L
n=−L X (n)
f(x′−L, . . . , x′L) dµxn(τ)∣∣AL
=
(∫∏+L
n=−L X (n)
f(x′−L, . . . , x′L)+L∏
n=−L
dµ(x′n)
)∀ f ∈ C
(+L∏
n=−L
X (n)
).
Cio implica che la misura µxn(τ)∣∣AL
converge nel senso della topologia ∗-debole
definita sullo spazio delle misure M(∏+L
n=−LX (n)) alla misura prodotto∏+L
n=−L µ.
Poiche cio accade per ogni restrizione alle algebre locali AL segue che
µxn(τ)∗−w−→
∏n∈Z
µ se τ → ±∞.
Quindi, riassumendo, ad ogni configurazione xn con statistica regolare sulle
traslazioni e associata un’unica misura µxn ∈ M+,1(∏
n∈ZX (n)) tale che ristret-
ta ad ogni algebra locale di funzioni continue AL risulta assolutamente continua
170
alla misura prodotto∏+L
n=−L µ tramite una densita ρ ∈ L1[∏+L
n=−LX (n),∏+L
n=−L µ].
Indichiamo con L1 ⊂M+,1(∏
n∈ZX (n)) l’insieme di queste misure regolari ed osser-
viamo che L1 e un sottoinsieme denso inM+,1(∏
n∈ZX (n)) che e, invece, un insieme
∗-debolmente compatto. Sotto l’effetto dell’evoluzione temporale, con l’ipotesi di
dinamica mixing dei sottosistemi, ogni punto di L1 converge nella topologia ∗-debole alla misura prodotto
∏n∈Z µ che e l’unico punto stazionario di L1 e la sta-
tistica del sistema infinito converge alla statistica di equilibrio definita dal prodotto
delle misure microcanoniche.
∏n
µ
misure prodotto
M+,1(∏
nX(n))
L1
misure non regolari
Figura 7.3: Convergenza delle misure regolari.
Le “misure non regolari”, appartenenti a M+,1(∏
n∈ZX (n)) \ L1, nascono da
configurazioni di partenza “con statistica irregolare” che in generale non conver-
gono a stati di equilibrio. Tuttavia la dinamica sui singoli sottosistemi X puo
ammettere molte misure invarianti e disgiunte (ad esempio se ogni sottosistema
e di Bernouilli; Paragrafo 3.2.1). Quando i sottosistemi ammettono molteplici
misure invarianti disgiunte e mixing allora ognuna di queste definisce una propria
classe di configurazioni con statistica regolari. L’intero spazio M+,1(∏
n∈ZX (n))
si ripartisce in diversi sottospazi invarianti L1, uno per ogni misura mixing, ed
ognuno di questi sottospazi ha un unico attrattore che e il prodotto della relativa
misura mixing.
171
7.4 Conclusioni
Sebbene il modello discusso nei Paragrafi 7.2 e 7.3 sia estremamente semplice esso
evidenzia alcuni aspetti interessanti che meritano un commento.
• Le densita sui sottosistemi non compaiono come espressione dell’ignoranza
dell’osservatore riguardo alla configurazione microscopica del sistema (at-
teggiamento generalmente tipico in lavori come [Mac92]). Si assume di
conoscere dettagliatamente lo stato microscopico del sistema (il sistema puo
essere preparato in laboratorio in modo da averne una conoscenza arbitra-
riamente dettagliata) e appaiono come risultato di una descrizione statistica
fatta sulle traslazioni. Questa procedura ha un significato intrinseco, for-
malizza le procedure di osservazione in laboratorio e non richiede alcuna
assunzione di statistiche “a priori”.
• La nozione di mixing riguarda i singoli sottosistemi microscopici e non l’in-
tero sistema. Questo fatto e rilevante dato che le proprieta ergodiche si
controllano bene sui sistemi piccoli e perdono di significato sui sistemi gran-
di, al limite infiniti. In questo senso il mixing risulta ancora un’ipotesi im-
portante per il raggiungimento dell’equilibrio, che viene utilizzata in modo
non ambiguo ad un livello microscopico ben definito dalla struttura del si-
stema e che non richiede compromessi particolari come la nozione di sistema
arbitrariamente grande ma finito.
• La comparsa delle densita in questo modello non e un fatto generale ma
dipende dall’assunzione di configurazioni iniziali con statistica regolare. Tut-
tavia esistono casi in cui gli stessi risultati si possono ottenere anche partendo
da configurazioni non regolari. Infatti i sottosistemi microscopici potrebbero
avere piu misure ergodiche (non assolutamente continue) rispetto alle quali
la dinamica e mixing che definiscono differenti nozioni di regolarita
• In questo modello la convergenza all’equilibrio e descritta in termini di un
sistema dinamico topologico con un unico punto attrattore. I punti di
questo spazio sono gli stati invarianti per traslazione (la densita ρ descrive
la collezione di misure in piu variabili per tutti i sottosistemi microscopici e
quindi definisce uno stato invariante per traslazione) e la topologia e debole
e non uniforme. In particolare la convergenza all’equilibrio non richiede
alcuna irreversibilita della dinamica. Questo modello, quindi, realizza il
comportamento generale ipotizzato nel Capitolo 6.
172
• La convergenza al prodotto delle distribuzioni microcanoniche e ragionevole
in quanto il modello considerato descrive una collezione di sottosistemi non
interagenti. Resta aperto il problema di studiare cosa comporta un’inte-
razione tra i sottosistemi, che dovrebbe essere all’origine della distribuzione
canonica.
Nella seguente tabella si confronta il modello discusso in questo paragrafo con
l’interpretazione “alla Boltzmann” della convergenza all’equilibrio.
Boltzmann Questa tesi
microstato
(punto di fase di un sistema finito)
configurazione xndi un sistema infinito
macrostato definito dai
numeri di occupazione
di celle relative
ad osservabili macroscopiche
stato, come funzionale
su tutte le osservabili,
definito dalla statistica
sui sottosistemi
uguali probabilita “a priori”
(misura microcanonica sul sistema)
mipotesi di ergodicita
della dinamica
misura µ sui sottosistemi
⇓definizione di configurazione
con statistica regolare
⇓misura di probabilita
regolari sulle
osservabili locali
gli stati di non equilibrio
sono poco probabili (?)
(insieme di punti
di misura microcanonica piccola).
L’equilibrio e raggiunto
in modo irreversibile (?).
ipotesi di mixing sui sottosistemi
⇓µxn(t)
∣∣AL−→ ∏+L
n=−L µ
per ogni L se t → ±∞⇓
convergenza all’equilibrio
senza irreversibilita .
173
Appendice A
Teoria ergodica
In questa appendice vengono esposti in modo formale le idee ed i teoremi della
Teoria Ergodica. Il primo paragrafo e dedicato ad un sunto dello schema Hamilto-
niano di cui, la Teoria ergodica prima, e la Teoria dei sistemi dinamici topologici
poi, sono una generalizzazione. Nel seguito si fara spesso ricorso a risultati e con-
cetti della teoria della misura per i quali si rimanda agli ottimi testi specialistici
[Rud74], [Hal50], [Tes97]. Per cio che riguarda la teoria ergodica i testi di rifer-
imento sono [Jan63], [Hal56] e [AA67] mentre per la Teoria dei sistemi dinamici
topologici si rimanda a [Bro76] e [BS70].
A.1 Lo schema Hamiltoniano
Tutta l’analisi classica riguardante il problema dei fondamenti della Meccanica
Statistica utilizza gli strumenti ed i concetti del formalismo Hamiltoniano che
richiamiamo brevemente di seguito. Un’ampia esposizione di questi argomenti e
fornita nei testi [LL99b] o [Arn99]. Per gli argomenti riguardanti la teoria delle
equazioni differenziali si rimanda invece al Capitolo 8 di [HS74].
Secondo lo schema Hamiltoniana (classico) la cinematica di un sistema mec-
canico ad ` di gradi di liberta e determinata quando si fissano le coordinate
generalizzate q ≡ (q1, . . . , q`) ed i momenti coniugati p ≡ (p1, . . . , p`) che
costituiscono le variabili dinamiche. E comodo pensare alla 2`-upla ordinata
definita degli impulsi coniugati e dalle coordinate generalizzate x ≡ (p,q) =
(p1, . . . , p`, q1, . . . , q`) come ad un punto rappresentativo in uno spazio euclideo
2`-dimensionale X chiamato spazio delle fasi . Ogni punto di X descrive lo sta-
to istantaneo del sistema meccanico; quando il tempo scorre lo stato istantaneo
evolve, in un modo determinata dalle leggi che governano la fisica del sistema, in
174
nuovi stati e l’intera storia del sistema e descritta da una curva, detta traietto-
ria , percorsa in X . La legge dinamica, che prescrive l’evoluzione temporale degli
stati istantanei del sistema, viene assegnata tramite una funzione H = H(p,q, t),
chiamata funzione di Halmiton o Hamiltoniana del sistema. L’evoluzione
temporale degli stati istantanei e legata alla funzione H dall’assunzione che la
traiettoria x(t) = (p(t),q(t)) percorsa dal punto rappresentativo del sistema in Xe soluzione del sistema delle 2` equazioni del moto (equazioni differenziali del
primo ordine):
p ≡ dp
dt= −∂H
∂q
q ≡ dq
dt=
∂H
∂p
(A.1)
Il sistema canonico di Hamilton (A.1) puo essere riscritto in una forma piu com-
pattadx
dt= I ∇H(x, t) = F (x, t). (A.2)
avendo introdotto le notazioni
I ≡(
0 −1`
1` 0
), ∇H(x, t) ≡
(∂H
∂p,∂H
∂q
);
I e la matrice simplettica 2`× 2` con 1` matrice identita `× `.
Sotto opportune condizioni di regolarita su F (e quindi su H) il Teorema di
Cauchy afferma che fissato un dato iniziale (x0, t0) esiste in X un’unica soluzione
della (A.2) definita in un intorno temporale [t0 − δ, t0 + δ] e tale che x(t0) = x0.
Questo risultato garantisce la possibilita di fare previsioni sul sistema solo per
tempi molto vicini (nel passato e nel futuro) all’istante iniziale t0 mentre la mag-
gior parte delle questioni interessanti sul comportamento di un sistema meccanico
riguardano l’evoluzione a tempi grandi. Tuttavia e generalmente possibile prol-
ungare (nel passato e nel futuro) il dominio di definizione delle soluzioni fino ad
ottenere un intervallo temporale di esistenza massimale. Quando l’intervallo mas-
simale coincide con R parleremo di soluzione globale . Per ottenere soluzioni
globali e necessario che il campo vettoriale F sia definito per ogni t ∈ R. Un
caso importante in cui cio accade si ha quando F non dipende esplicitamente dal
tempo, ossia ∂F/∂t = 0. In questa circostanza il sistema di equazioni differenziali
(A.2) viene detto autonomo1. Dalla (A.2) discende che un sistema Hamiltoniano
produce un sistema di equazioni differenziali autonome se l’Hamiltoniana H non
1E un fatto evidente che le leggi fondamentali della natura non dipendono dal tempo (almeno
175
ha esplicita dipendenza dal tempo ∂H/∂t = 0. Se valutiamo la funzione H lungo
la curva soluzione x(t) allora l’unica variabile da cui H dipendere e il parametro
tempora t, H(t) ≡ H(x(t)). Derivando rispetto al tempo questa espressione si
ottiene che
d
dtH(t) =
2∑j=1
∂H
∂xj
dxj
dt+
∂H
∂t=
∂H
∂p· p +
∂H
∂q· q +
∂H
∂t=
∂H
∂t
avendo tenuto conto che la curva x(t) = (p(t),q(t)) soddisfa le equazioni (A.1).
Da questa relazione segue che per i sistemi Hamiltoniani autonomi il valore della
funzione di Hamilton si mantiene costante lungo le curve; questa quantita prende
il nome di integrale primo dell’energia . Consideriamo il dato iniziale (x0, t0)
ed indichiamo con E il valore che l’hamiltoniana H assume sullo stato istantaneo
x0. Se il sistema e autonomo il generico stato evoluto x(t) deve verificare la con-
dizione H(x(t)) = E. Se indichiamo con XE il sottoinsieme dello spazio delle fasi
X definito da XE ≡ x | x ∈ X , H(x) = E otteniamo che la curva soluzione x(t)
e interamente contenuta in XE. L’insieme XE e detto ipersuperficie isoener-
getica e costituisce una varieta di dimensione 2`− 1 immersa in X . Da un punto
di vista topologico l’insieme XE e chiuso in quanto coincide con la preimmagine
del sottoinsieme chiuso di E ⊂ R rispetto alla funzione continua H : X → R.
Inoltre si puo generalmente assumere che l’insieme XE sia un sottoinsieme limitato
di X (in generale cio significa ammettere che il sistema e confinato in una regione
finita dello spazio fisico come ad esempio una scatola di volume V ) e cio impli-
ca la compatezza del sottoinsieme XE in X . In queste condizioni ad ogni scelta
del dato iniziale (x0, t0) corrisponde una superficie compatta XE che contiene la
curva soluzione delle equazioni di Hamilton ed un risultato generale di analisi2
afferma che questa soluzione esiste globalmente. Questo risultato garantisce che
per tutti i sistemi fisici isolati (autonomi) e spazialmente limitata (che sono una
classe assolutamente rilevante di sistemi fisici) esiste la possibilita di fare previ-
su scale temporali piccole rispetto all’eta dell’universo) e pertanto le equazioni differenziali che
descrivono i fenomeni fisici non dovrebbero dipendere in modo esplicito dal parametro t. In questo
senso gli unici sistemi meccanici degni di nota dovrebbero essere i sistemi autonomi. Tuttavia e
anche vero che spesso il sistema fisico I che si vuole osservare e parte di un sistema piu grande
I + II. Benche la legge di evoluzione del sistema totale I + II non varia nel tempo puo accadere
che la parte II esercita sulla parte I una azione tale da rendere le equazioni di evoluzione di I
temporalmente dipendenti. In questo senso diviene fisicamente significativo anche il concetto di
sistema non autonomo ed i sistemi autonomi si identificano in modo naturale con i sistemi fisici
isolati.2C.f.r. [HS74] Capitolo 8, Paragrafo 5.
176
sioni per tempi arbitrariamente lontani nel futuro e nel passato non appena sia
nota la legge dinamica ed uno stato istantaneo x0 ad un tempo dato t0; questa
affermazione costituisce il contenuto del Principio di determinismo classico.
Il Teorema di Cauchy e l’assunzione di soluzioni globali impongono che l’intera
traiettoria x(t) percorsa dal punto rappresentativo del sistema e univocamente
determinata dalla conoscenza del dato iniziale (x0, t0). Poiche ogni punto dello
spazio delle fasi puo essere scelto come dato iniziale segue che per ogni punto di Xpassa almeno una traiettoria; l’unicita della soluzione implica che tale traiettoria
deve essere unica. Cio comporta che due traiettorie o coincidono in ogni punto o
sono disgiunte e quindi lo spazio X si rappresenta come unione disgiuta di un fascio
di traiettorie. Se ad un dato istante t0 il punto rappresentativo del sistema e x0 e
se ad un istante diverso (precedente o successivo) t lo stato del sistema e divenuto
x allora diremo che il punto x0 nell’intervallo di tempo [t0, t] e evoluto nel punto x.
Nello stesso intervallo di tempo ogni altro punto di X evolve in una nuova posizione
e quindi, sotto l’azione della dinamica tutto lo spazio delle fasi X viene trasformato
in se stesso. Questa trasformazione deve essere biunivoca in quanto se due punti
distinti x0 e x′0 fossero mandati contemporaneamente in x vi sarebbero due orbite
distinte con una intersezione. Poiche nel caso di sistemi autonomi la fisica non
dipende dal tempo non vi e nessun fatto oggettivo che imponga una particolare
scelta dell’istante iniziale t0 e pertanto porremo sempre t0 = 0. Sotto l’azione della
dinamica possiamo associare ad ogni tempo t una mappa biunivoca Ψt : X → Xche associa al generico punto x ∈ X al tempo t = 0 la sua evoluzione temporale
x(t) al tempo t. In altre parole la mappa Ψt agisce sul punto x mandandolo in un
nuovo punto ottenuto percorrendo per un tempo t la curva soluzione passante per
x al tempo t = 0. La collezione delle mappe Ψt al variare di t ∈ R gode, rispetto
alla composizione di applicazioni, delle seguenti proprieta:
i) Ψ0 = Id;
ii) Ψt1 Ψt2 = Ψt2 Ψt1 = Ψt1+t2 ∀ t1, t2 ∈ R;
ii) Ψt−1 = Ψ−t ∀ t ∈ R.
Quindi la collezione Ψtt∈R costituisce una rappresentazione del gruppo ad-
ditivo abeliano R negli isomorfismi di X . Se la funzione F (x) che definisce il
sistema autonomo e di classe C1(X ) (condizione che riterremo sempre verificata)
allora sono di classe C1(X ) le mappe Ψt : X → X per ogni t ∈ R che quindi sono
177
diffeomorfismi 3 di X . La collezione Ψtt∈R definisce una rappresentazione di
R in Dif(X ) (detta azione del gruppo R su X ) che prende il nome di flus-
so hamiltoniano. Il flusso Hamiltoniano Ψtt∈R e regolare anche rispetto alla
dipendenza dal parametro temporale ed in particolare per ogni x ∈ X la funzione
fx(t) ≡ Ψt(x) : R → X e di classe C1(R). Poiche l’evoluzione temporale conserva
le ipersuperfici isoenergetiche XE allora il flusso hamiltoniano Ψtt∈R puo essere
considerato come una rappresentazione di R in Dif(XE).
Lo spazio delle fasi X , in quanto sottoinsieme dello spazio euclideo R2`, e dotato
in modo naturale della misura di Lebesgue dx = dp dq che in contesto Hamilto-
niano e chiemata misura di Liouville . Il Teorema di Liouville afferma
che la misura di Liouville e invariante sotto l’azione del flusso Hamiltoniano, os-
sia se M e un sottoinsieme misurabile di X e se |M| indica la sua misura allora
|Ψt(M)| = |M| per ogni t ∈ R. Nel caso di sistemi Hamiltoniani il flusso Hamilto-
niano preserva le ipersuperfici isoenergetiche XE e se ad un dato tempo il sistema
si trova in uno stato di energia E allora l’evoluto del punto rappresentativo del sis-
tema sara in XE a tutti i tempi. Quindi la descrizione di un sistema Hamiltoniano
autonomo ad energia iniziale E si riduce alla descrizione del flusso Hamiltoniano
Ψtt∈R ristretto all’ipersuperficie XE. In questi termini, tuttavia, non e rilevante
che il flusso hamiltoniano preservi la misura di Lebesgue su X dato che tutti i
sottoinsiemi di XE hanno misura nulla. Nonostante cio e ancora possibile definire
una misura invariante, non banale, su XE ottenuta come proiezione della misura di
Liouville sull’ipersuperficie. Se Lo spazio delle fasi X ha dimensione 2` la superficie
XE e una varieta differenziabile di dimensione 2`− 1. Sia u1, . . . , u2`−1 un sistema
di coordinate locali ortonormali in un intorno del punto x ∈ XE. Si dimostra che
la misura
dµmc ≡ Cdu1 . . . du2`−1
‖∇H‖ (A.3)
e invariante sotto il flusso hamiltoniano e permette di misurare la restrizione su
XE di tutte le funzioni misurabili secondo Lebesgue4. In particolare se M e un
insieme misurabile dello spazio delle fasi X e se ME e la sua intersezione con
3Si chiama omeomorfismo di X una trasformazione Ψ : X → X continua, invertibile e con
inversa continua. Indicheremo con il simbolo Om(X ) l’insieme di tutti gli omeomorfismi di X .
Si chiama diffeomorfismodi X e un trasformazione Ψ : X → X differenziabili, invertibile con
inversa differenziabile. Indicheremo con il simbolo Dif(X ) l’insieme di tutti i diffeomorfismi di X .
Sia Om(X ) che Dif(X ) sono gruppi rispetto al prodotto dato dalla composizione di applicazioni.4C.f.r. [PS95] Esempio 1.18. (Formula di coarea).
178
l’ipersuperficie XE allora
|ME|E ≡ µmc(ME) = C
∫
Mδ(H(p,q)− E) dp dq (A.4)
avendo indicato con δ la funzione delta di Dirac. La costante C che compare
nella (A.3) o equivalentemente (A.4) ha il compito di rendere normalizzata la
misura, µmc(XE) = 1, e la misura µmc prende il nome di misura microcanonica .
A.2 La Teoria ergodica
In questo paragrafo vengono discussi, e nella maggior parte dei casi dimostrati, i
risultati standard della Teoria ergodica. In particolare sara esposto il Teorema di
Birkhoff assieme agli importanti concetti di ergodicita e mixing.
A.2.1 I sistemi dinamici classici
La Teoria ergodica si occupa dei sistemi dinamici classici (per la definizione
si rimanda al Paragrafo 3.1.1). Indichiamo con il simbolo M(X ) l’insieme delle
funzioni misurabili ed associamo ad ogni automorfismo Ψt la trasformazione
dell’insieme M(X ) in se definita in modo puntuale dalla relazione
Ut(f)(x) ≡ f(Ψt(x)) ∀ x ∈ X . (A.5)
L’insieme M(X ) possiede una struttura di algebra5 che e preservata dalle trasfor-
mazioni Ut. Indichiamo con L1[X , µ] ⊂ M(X ) l’insieme delle funzioni integra-
bili sullo spazio X rispetto alla misura µ, ovvero di tutte le funzioni f ∈ M(X )
tali che
‖f‖L1 ≡
∫
X|f(x)| dµ(x) < +∞. (A.6)
L’insieme L1[X , µ] e uno spazio vettoriale normato e completo rispetto alla norma
definita dalla (A.6). Inoltre dato che |f | = |f | segue anche che L1[X , µ] e chiuso
rispetto all’operazione di coniugazione complessa anche se in generale non e chiuso
rispetto al prodotto di funzioni. Vale il seguente importante risultato:
A.2.1 Proposizione. Sia Γ ≡ X , M , µ,T, Ψ un sistema dinamico misurabile.
Per ogni t ∈ T la mappa Ut : f → Ut(f) che associa ad ogni funzione f su X la
funzione Ut(f)(x) = f(Ψt(x)) e un’isometria invertibile di L1[X , µ] in se.
5C.f.r. [Rud74] Teoremi 1.8 e 1.9.
179
zDim.
La mappa Ut e evidentemente lineare e come conseguenza del fatto che la dinamica e invertibile
segue anche che Ut e invertibile infatti per ogni funzione f su X si ha puntualmente che
U−t(Ut(f))(x)U−tf(Ψt(x)) = f(Ψ−t Ψt(x)) = f(x)
e quindi U−t(Ut(f)) = f . L’arbitrarieta nella scelta della funzione f implica che U−t Ut = 1 e
ripetendo la stessa dimostrazione al tempo t′ = −t si ricava anche che Ut U−t = 1. Quindi per
ogni t ∈ T la mappa Ut e invertibile con inversa Ut−1 = U−t.
Proviamo che Ut e un’isometria di L1[X , µ] in se. Sia χA la funzione caratteristica dell’insieme
misurabile A ∈ M . Dato che la misura µ e di probabilita segue che tutti i sottoinsiemi misurabili
hanno misura finita e quindi tutte le funzioni caratteristiche appartengono a L1[X , µ] in quanto
‖χA‖L1 = µ(A) < +∞. La funzione Ut(χA) e la funzione caratteristica dell’insieme Ψt−1(A)
che e ancora misurabile in quanto la dinamica Ψ e supposta misurabile. Questo implica che
Ut(χA) ∈ L1[X , µ] ed inoltre dato che la misura µ e invariante rispetto alla dinamica si ha
anche che ‖Ut(χA)‖L1 = µ(Ψt
−1(A)) = µ(A) = ‖χA‖L1 . Sia f ≡ ∑Nn=1 an χAn
con an > 0
una funzione semplice non negativa, ossia una combinazione lineare a coefficienti non negativi di
funzioni caratteristiche. Osserviamo che
‖f‖L1 =
∥∥∥∥∥N∑
n=1
an χAn
∥∥∥∥∥L1
=∫
X
N∑n=1
an χAn(x) dµ(x)
=N∑
n=1
an
∫
XχAn(x) dµ(x) =
N∑n=1
an µ(An).
Per la linearita di Ut segue che Ut(f) =∑N
n=1 an Ut(χAn) =∑N
n=1 an χΨt−1(An) e calcolando la
norma di questa espressione si ricava che
‖Ut(f)‖L1 =
N∑n=1
an µ(Ψt−1(An)) =
N∑n=1
an µ(An) = ‖f‖L1 .
Cio prova che la mappa Ut e isometrica anche sulle funzioni semplici.
Sia f una funzione su X non negative. Ogni funzione non negativa e ottenibile come limite
puntuale di un’opportuna successione crescente fnn∈N di funzioni semplici non negative6 e se
f e una funzione L 1[X , µ] allora come conseguenza del Teorema di convergenza monotona7
segue che fn → f in norma ‖ ‖L1 . Osserviamo che anche Ut(fn)n∈N e una successione crescente
di funzioni semplici non negative, infatti per ogni x ∈ X e per ogni n ∈ N si ha che Ut(fn+1)(x) =
fn+1(Ψt(x)) > fn(Ψt(x)) = Ut(fn)(x). Inoltre Ut(fn)n∈N converge puntualmente alla funzione
Ut(f) dato che fn(Ψt(x)) → f(Ψt(x)) per ogni x ∈ X . Sempre per il Teorema di convergenza
6C.f.r. [Hal50] Paragrafo 20, Teorema B. Una successione fnn∈N di funzioni non negative
e detta crescente se accade che fn+1(x) > fn(x) per ogni n ∈ N e per ogni x ∈ X .7C.f.r. [Hal50] Paragrafo 27, Teorema B. Questo risultato e anche noto con il nome di
Teorema di Beppo Levi .
180
monotona segue che la funzione Ut(f) e misurabile ed inoltre∫
XUt(f)(x) dµ(x) = lim
n→+∞
∫
XUt(fn)(x) dµ(x) = lim
n→+∞‖Ut(fn)‖
L1
= limn→+∞
‖fn‖L1 = ‖f‖L1 .
Cio prova che la funzione Ut(f) ∈ L1[X , µ] e poiche essa e anche positiva risulta verificato anche
che ‖Ut(f)‖L1 = ‖f‖
L1 e quindi Ut e un’isometria sulle funzioni non negative.
Se f e una generica funzione L 1[X , µ] allora che anche |f | ∈ L 1[X , µ]. Inoltre Ut(|f |)(x) =
|f(Ψt(x))| = |Ut(f)(x)| = |Ut(f)|(x) e quindi Ut(|f |) = |Ut(f)|. Dato che |f | e una funzione non
negativa segue che Ut(|f |) ∈ L1[X , µ] e che ‖Ut(|f |)‖L1 = ‖|f |‖L1 = ‖f‖
L1 . Cio implica ancora
che ‖Ut(f)‖L1 = ‖|Ut(f)|‖
L1 = ‖Ut(|f |)‖L1 = ‖f‖L1 ossia che anche Ut(f) ∈ L1[X , µ] e che Ut e
un’isometria su tutti gli elementi di L1[X , µ]. ¨
Ogni generica funzione f : X → C si puo sempre scrivere come combinazione
lineare di quattro funzioni positive (ogni funzione si scompone in parte reale e parte
immaginaria che a loro volta si scompongono in parte positiva e negativa) e f ∈L1[X , µ] se e solo se ognuna di queste funzioni appartiene a L1[X , µ]. Utilizzando
la linearita della trasformazione Ut e dell’integrale segue immediatamente che
A.2.2 Corollario. Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico misurabile. Per
ogni f ∈ L1[X , µ] e per ogni t ∈ T vale che∫
Xf(Ψt(x)) dµ(x) =
∫
XUt(f)(x) dµ(x) =
∫
Xf(x) dµ(x).
A.2.2 Il Teorema di Birkhoff; convergenza puntuale
Consideriamo un sistema dinamico misurabile Γ ≡ X ,M , µ,T, Ψ e sia f : X →C una generica funzione sullo spazio delle fasi X . Si chiama media temporale
della funzione f l’espressione
f(t0, x) ≡ limtn→+∞
fn(t0, x) = limtn→+∞
1
tn
∫ t0+tn
t0
f(Ψt(x)) dt (A.7)
nel caso continuo, oppure nel caso discreto
f(t0, x) ≡ limtn→+∞
fn(t0, x) = limtn→+∞
1
tn
t0+tn∑t=t0
f(Ψt(x)), (A.8)
avendo indicato con tn → +∞ il limite fatto rispetto ad una successione tnn∈N
crescente ed illimitata. Il problema dalla costruzione delle medie temporali e
un problema di convergenza alla Cesaro della successione a valori complessi
f(Ψtn(x))tn>t0 . Il Teorema di Birkhoff prova che sotto ragionevoli condizioni su
f le medie temporali sono definite per quasi ogni punto x ∈ X .
181
A.2.3 Teorema (di Birkhoff-Khinchin). Sia Γ ≡ X ,M , µ,T, Ψ un sistema
dinamico classico e sia f ∈ M (X ) una funzione misurabile. Se la dinamica e
continua supponiamo anche che F ≡ U(f) sia una funzione misurabile sullo spazio
prodotto R×X (condizione necessaria per integrare rispetto al tempo). Valgono i
seguenti fatti:
i) il limite della successione di Cesaro
f(t0, x) ≡ limτ→+∞
fτ (t0, x) = limτ→+∞
1
τ
∫ t0+τ
t0
f(Ψt(x)) dt
(con τ → +∞ si intende indipendenza dalla scelta della successione di tempi
tnn∈N crescente ed illimitata) esiste puntualmente per quasi ogni punto
x ∈ X rispetto alla misura µ;
ii) la funzione f(t0, ) e misurabile ed invariante rispetto alla dinamica, ossia
f(t0, Ψt(x)) = f(t0, x) ∀ x ∈ X , ∀ t ∈ T;
iii) la funzione f(t0, ) non dipende da t0 nel senso che per ogni t0 ∈ T vale che
f(t0, ) = f(0, ) ≡ f ;
iv) se f ∈ L1[X , µ] allora anche f ∈ L1[X , µ] e∫
Xf(x) dµ(x) =
∫
Xf(x) dµ(x) ≡ 〈f〉.
La dimostrazione del Teorema di Birkhoff e lunga, laboriosa ed estremamente
tecnica e pertanto la sua esposizione esula dagli scopi di questo lavoro8. L’enun-
ciato del Teorema di Birkhoff continua a valere anche se si definisce la media
temporale per tempi che tendono infinitamente nel passato ottenendo che
limτ→+∞
1
τ
∫ t0
t0−τ
f(Ψt(x)) dt = limτ→+∞
1
τ
∫ t0+τ
t0
f(Ψt(x)) dt = f(x).
Osservando che per τ > 0 vale l’ovvia relazione
1
2τ
∫ t0+τ
t0−τ
f(Ψt(x)) dt =1
2
[1
τ
∫ t0
t0−τ
f(Ψt(x)) dt +1
τ
∫ t0+τ
t0
f(Ψt(x)) dt
]
segue che le medie temporali delle funzioni di fase f possono essere stimate anche
come
f(x) = limτ→+∞
1
2τ
∫ t0+τ
t0−τ
f(Ψt(x)) dt (A.9)
8Per la dimostrazione nel caso continuo c.f.r. [Khi49] Capitolo II, Paragrafo 5. Per la
dimostrazione discreto c.f.r [Hal56] pp. 18-21.
182
ed il risultato e indipendente da t0. L’indipendenza di (A.9) da t0 implica (per un
cambio della variabile d’integrazione) che la quantita f e invariante rispetto alla
dinamica. Il valore che f assume sul punto x e uguale al valore che f assume su
un generico punto della traiettoria Ψt(x) definita da x. In altre parole le medie
temporali sono costanti del moto.
A.2.3 Dinamica ergodica
In base alla definizione data nel Paragrafo 3.1.4 un sistema dinamico classico e
ergodico se verifica la proprieta di indecomponibilita metrica (Ψt−1(M) = M
implica µ(M) = 0 oppure µ(X \M) = 0). I sistemi ergodici hanno un’importante
caratterizzazione in termini delle funzioni misurabili ed invarianti su X .
A.2.4 Teorema. Il sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e ergodico se
e solo se le uniche funzioni misurabili f ∈ M(X ) tali che f(Ψt(x)) = f(x) per ogni
x ∈ X e per ogni t ∈ T sono quelle costanti quasi ovunque rispetto alla misura µ.
zDim.
(⇒) Sia f una funzione misurabile reale e consideriamo per ogni a ∈ R la coppia di insiemi
F+a ≡ x ∈ X | f(x) > a e F−a ≡ x ∈ X | f(x) < a. Poiche la funzione f e misurabile
gli insiemi F+a e F−a sono entrambi misurabili9. Inoltre se per ogni t ∈ T e per ogni x ∈ X
accade che f(x) = f(Ψt(x)) allora x ∈ F±a se e solo se Ψt−1(x) ∈ F±a e pertanto gli insiemi
F+a e F−a sono invarianti. Se il sistema e ergodico allora questi insiemi devono essere banali e
questo implica o che f(x) > a quasi ovunque oppure che f(x) < a quasi ovunque e poiche cio
deve essere vero per ogni a ∈ R ne consegue che f deve essere costante quasi ovunque rispetto
alla misura µ. Se f e una funzione misurabile complessa allora essa si esprime in modo unico
come f = <(f) + i=(f) con <(f) e =(f) rispettivamente parte reale e parte immaginari di f .
Le funzioni <(f) e =(f) sono reali ed invarianti rispetto alla dinamica se f e invariante. Se il
sistema e ergodico, allora ogni funzione misurabile complessa f ha parte reale ed immaginaria
costanti quasi ovunque e quindi e essa stessa una funzione costante quasi ovunque.
(⇐) Supponiamo che M sia un sottoinsieme invariante e misurabile di X . Cio implica che la
funzione caratteristica χM e invariante sotto Ψt e quindi per ipotesi deve essere costante quasi
ovunque. Dato che una funzione caratteristica puo assumere solo i valori 0 o 1 segue che o
µ(M) = 0 oppure µ(X \M) = 0 e pertanto il sistema dinamico e ergodico. ¨
Il precedente risultato combinato con il Teorema di Birkhoff implica che un
sistema dinamico classico e ergodico se e solo se tutte le medie temporali sono
costanti quasi ovunque su X . Inoltre se f ∈ L1[X , µ] e se la sua media temporale
e costante quasi ovunque allora dal punto iv) del Teorema di Birkhoff segue che
〈f〉 ≡∫
Xf(x)dµ(x) =
∫
Xfdµ(x) = f
9C.f.r. [Hal50] Paragrafo 18, Teorema A.
183
ovvero l’uguaglianza, quasi ovunque, della media temporale con la media sullo
spazio delle fasi. Viceversa se per ogni f ∈ L1[X , µ] si ha uguaglianza quasi
ovunque della media temporale e della media spaziale, dato che tutte le fun-
zioni caratteristiche sono L1[X , µ] (la misura µ e finita), segue che 〈χ〉 = χ quasi
ovunque. Se M e un insieme invariante allora anche la funzione caratteristica
χM e invariante e quindi χM = χM = 〈χM〉 = µ(M) quasi ovunque. Eviden-
temente questa relazione puo essere verificata solamente se µ(M) = 0 oppure se
µ(X \M) = 0.
Se il sistema dinamico Γ ≡ X ,M , µ,T, Ψ e ergodico allora per ogni coppia
di funzioni f, g ∈ L1[X , µ] vale che
limτ→+∞
1
2τ
∫ +τ
−τ
f(Ψt(x))g(x) dt = f(x)g(x) = 〈f〉g(x).
Se M e N sono due sottoinsiemi misurabili e χM, χN le rispettive funzioni carat-
teristiche la precedente relazione implica
limτ→+∞
1
2τ
∫ +τ
−τ
χΨt−1(M)(x)χN (x) dt = µ(M)χN (x)
nel senso della convergenza puntualmente su X . Osservando che
0 6 χΨt−1(M)(x)χN (x) = χΨt
−1(M)∩N (x) 6 1
segue anche che per ogni valore di τ
0 6 1
2τ
∫ +τ
−τ
χΨt−1(M)(x)χN (x) dt 6 1.
Poiche la misura µ e finita sia 1 che µ(M)χN (x) sono funzioni L1[X , µ] e quindi
sono soddisfatte tutte le condizioni di applicabilita del Teorema di convergenza
dominata di Lebesgue10 secondo il quale
∫
X
(lim
τ→+∞1
2τ
∫ +τ
−τ
χΨt−1(M)(x)χN (x) dt
)dµ(x) =
∫
Xµ(M)χN (x) dµ(x)
da cui scambiano l’ordine di integrazione segue che
limτ→+∞
1
2τ
∫ +τ
−τ
µ(Ψt−1(M) ∩N ) dt = µ(M)µ(N ) (A.10)
L’equazione (A.10) si interpreta dicendo che in un sistema ergodico la probabilita
che un punto appartenente a N sotto l’evoluzione temporale giunga in M tende,
10C.f.r. [Hal50] Paragrafo 26, Teorema D.
184
nel senso della convergenza alla Cesaro, al prodotto delle misure degli insiemi M e
N , ossia al prodotto delle probabilita che il punto cada in M o N . In altre parola
un insieme N spostato dall’azione della dinamica tende a divenire stocasticamente
indipendente da ogni altro sottoinsieme M. La (A.10) non solo e soddisfatta da
tutti i sistemi ergodici ma caratterizza anche la proprieta di indecomponibilita
metrica, infatti assumendo che M sia un insieme invariante e ponendo N = Mnella (A.10) si ottiene che
µ(M)2 = limτ→+∞
1
2τ
∫ +τ
−τ
µ(Ψt−1(M) ∩M) dt
= limτ→+∞
1
2τ
∫ +τ
−τ
µ(M) dt = µ(M)
da cui segue che µ(M) = 1 oppure µ(M) = 0. La sintesi di tutte queste
considerazioni e il contenuto del seguente enunciato.
A.2.5 Corollario. Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico classico. Le
seguenti affermazioni sono equivalenti:
i) il sistema e ergodico;
ii) per ogni f ∈ M(X ) la media temporale f e costante quasi ovunque su Xrispetto alla misura µ ed inoltre se f ∈ L1[X , µ] allora 〈f〉 = f quasi ovunque
su X rispetto alla misura µ;
iii) per ogni coppia di sottoinsiemi misurabili M,N ∈ M vale che
limτ→+∞
1
2τ
∫ +τ
−τ
µ(Ψt−1(M) ∩N ) dt = µ(M)µ(N ). (A.11)
A.2.4 Dinamica mixing e debolmente mixing
In base alla definizione data nel Paragrafo 3.1.5 un sistema dinamico classico e
mixing se per ogni coppia di sottoinsieme misurabili M,N ⊆ M accade che
limτ→±∞
µ(Ψτ−1(M) ∩N ) = µ(M)µ(N ). (A.12)
L’invertibilita della dinamica e l’invarianza della misura implicano che se vi e
mixing per τ → +∞ allora vi e anche per τ → −∞ e viceversa. La differenza
tra dinamica mixing e dinamica ergodica risulta evidente dal confronto tra la
(A.12) e la (A.11). In un sistema mixing la successione numerica µ(Ψτ−1(M)∩N )
185
converge al valore µ(M)µ(N ) quando τ → ±∞; invece in un sistema ergodico la
stessa successione converge allo stesso limite ma nel senso della convergenza alla
Cesaro. Tra questi due criteri di convergenza ne esiste un terzo in cui si richiede la
convergenza forte alla Cesaro (convergenza alla Cesaro dei moduli). Questa
nozione di convergenza definisce una classe di sistemi dinamici dalle proprieta
intermedie tra quelle dei sistemi ergodici e quelle dei sistemi mixing.
A.2.1 Definizione (Sistema dinamico debolmente mixing). Diremo che il
sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e debolmente mixing se per
ogni coppia di sottoinsieme misurabili M,N ⊆ M accade che
limτ→+∞
1
2τ
∫ +τ
−τ
|µ(Ψτ−1(M) ∩N )− µ(M)µ(N )| dt = 0.
E immediato stabilire le relazioni tra le proprieta di mixing, mixing debole ed
ergodicita.
A.2.6 Proposizione. Sia Γ ≡ X ,M , µ,T, Ψ un sistema dinamico classico.
Valgono le seguenti implicazioni sulle proprieta del sistema:
mixing ⇒ mixing debole ⇒ ergodicita.
zDim.
La dimostrazione segue immediatamente dalle seguenti disuguaglianze
supt∈[−τ,+τ ]
|µ(Ψτ−1(M) ∩N )− µ(M)µ(N )| > 1
2τ
∫ +τ
−τ
|µ(Ψτ−1(M) ∩N )− µ(M)µ(N )| dt
>∣∣∣∣
12τ
∫ +τ
−τ
µ(Ψτ−1(M) ∩N )− µ(M)µ(N ) dt
∣∣∣∣
valide per ogni coppia di sottoinsiemi M,N ∈ M (X ). ¨
A.3 La Teoria di Koopman
La Teoria Ergodica puo essere messa in una veste puramente geometrica in cui le
proprieta della dinamica si controllano in termini opportune proprieta spettrali di
operatori unitari su spazi di Hilbert. Il vantaggio di questa riformulazione (dovuta
a Koopman) consiste nel fatto che il linguaggio geometrico rende piu semplici e piu
facilmente utilizzabili i contenuti dei teoremi ergodici. Tuttavia e necessario tenere
presente che le due formulazioni non sono equivalenti. Poiche esiste un’invari-
ante dinamico (entropia di Kolmogorov) che non e un’invariante spettrale11
11C.f.r. [AA67] Paragrafo 12.
186
e possibile costruire dei sistemi dinamici non isomorfi tra loro che definiscono la
stessa struttura geometrica. In questo senso la formulazione alla Koopman risulta
“parziale” rispetto alla descrizione dinamica.
A.3.1 I sistemi dinamici Hilbertiani
Se X , M , µ e uno spazio di misura si indica con L2[X , µ] l’insieme delle funzioni
misurabili f ∈ M(X ) tali che
‖f‖2
L2≡
∫
X|f(x)|2 dµ(x) < +∞.
Lo spazio L2[X , µ] e uno spazio di Hilbert con norma ‖ ‖L2 definita dal prodotto
scalare
(f ; g) ≡∫
Xf(x)g(x) dµ(x).
La Proposizione A.2.1 afferma che la dinamica Ψ induce una isometria lineare
sullo spazio L1[X , µ] definita puntualmente dalla relazione Ut(f)(x) ≡ f(Ψt(x))
per ogni x ∈ X . Questo risultato puo essere esteso allo spazio L2[X , µ].
A.3.1 Teorema (di Koopman). Sia Γ ≡ X , M , µ,T, Ψ un sistema dinamico
classico. Per ogni t ∈ T la mappa Ut : f → Ut(f) definita da Ut(f)(x) = f(Ψt(x)) e
un operatore unitario sullo spazio di Hilbert L2[X , µ] e la collezione degli operatori
Ut al variare di t ∈ T definisce una rappresentazione unitaria del gruppo T.
zDim.
Dalla Proposizione A.2.1 segue che la mappa Ut e un’isometria lineare ed invertibile di L1[X , µ].
Si puo mostrare anche che essa mappa lo spazio di funzioni L2[X , µ] in se. Dalla seguente
uguaglianza
‖f‖2L2
=∫
X|f(x)|2 dµ(x) =
∫
Xf(x)f(x) dµ(x) = ‖ff‖
L1
discende che la funzione f appartiene a L2[X , µ] se e solo se la funzione ff appartiene a L1[X , µ].
Ma se ff ∈ L1[X , µ] allora anche Ut(ff) ∈ L1[X , µ] e ricordando come agisce Ut sul prodotto
di funzioni si ricava anche che Ut(ff) = Ut(f)Ut(f) = Ut(f)Ut(f) il che implica che Ut(f) ∈L2[X , µ]. Cio verifica che Ut : L2[X , µ] → L2[X , µ]. Poiche Ut e un’isometria di L1[X , µ] segue
anche che
‖Ut(f)‖2L2
= ‖Ut(f)Ut(f)‖L1 = ‖Ut(ff)‖
L1 = ‖ff‖L1 = ‖f‖2
L2
ossia Ut e un’isometria anche su L2[X , µ]. Infine Ut e invertibile su L2[X , µ] in quanto Ut−1 = U−t
per ogni t su la piu generale funzione f : X → C. Quindi Ut e un operatore lineare isometrico
ed invertibile sull’insieme di funzioni L2[X , µ] che e uno spazio di Hilbert. Dato che tutti e soli
gli operatori lineari isometrici ed invertibili su uno spazio di Hilbert sono gli operatori unitari,
segue che per ogni t ∈ T l’operatore Ut e unitario su L2[X , µ]. Accertato che Ut−1 = U−t per
ogni t ∈ T per verificare che la collezione degli operatori unitari Ut al variare di t ∈ T costituisce
187
una rappresentazione del gruppo T e sufficiente verificare la legge di composizione. Cio segue
osservando che per ogni t1, t2 ∈ T vale che
Ut1Ut2(f)(x) = Ut1(f)(Ψt2(x)) = f(Ψt1 Ψt2(x)) = f(Ψt1+t2(x)) = Ut1+t2(f)(x)
e l’arbitrarieta nella scelta di f e x implica che Ut1Ut2 = Ut1+t2 . ¨
Nel caso di dinamica continua T = R per rendere sensate le espressioni che
prevedono integrali rispetto al parametro temporale t (come nel caso del Teorema
di Birkhoff) e necessario supporre che la dinamica goda di buone proprieta rispetto
all’integrazione in dt. Sia f : X → C e una funzione a valori complessi definita sullo
spazio delle fasi X . Affinche questa funzione sia compatibile con la struttura di
spazio di misura e naturale richiedere che essa sia misurabile rispetto a X ,M .Se invece consideriamo a x fisso la funzione f(Ψt(x)) come dipendente solo del
parametro t la richiesta piu naturale e che f(Ψt(x)) sia misurabile rispetto allo
spazio di misura T, B essendo B la σ-algebra di Borel su T = R. Se si assume
che la funzione F : X × T → C, definita dalla relazione F (x, t) = f(Ψt(x)),
sia misurabile rispetto alla struttura di spazio di misura prodotto X × T, M ×B allora entrambe le precedenti richieste risultano automaticamente verificate12.
Ogni funzione g su X puo essere estesa in modo naturale ad una funzione su X ×Tsecondo la identificazione g(x, t) ≡ g(x). Se g e misurabile rispetto allo spazio di
misura X ,M allora g e banalmente misurabile rispetto allo spazio di misura
prodotto X × T,M × B (per ogni sottoinsieme misurabile A ⊆ C si ottiene
che −1g(A) =−1 g(A) × T che e un misurabile di M ×B). Dato che le funzioni
misurabili fanno un’algebra chiusa anche rispetto alla coniugazione complessa13
segue che anche F (x, t) = f(x)g(Ψt(x)) e misurabile rispetto a X ×T,M ×B.Se f e g sono due funzioni non negative allora anche la funzione Fg,f (x, t) e non
negativa e per il Teorema di Fubini 14 si ha che le due funzioni
h(t) ≡∫
XF (x, t) dµ(x), k(x) ≡
∫
XF (x, t) dt
sono rispettivamente misurabili sugli spazi con misura T,B, dt e X ,M , µ.Consideriamo in modo particolare la prima delle due funzioni, ossia
h(t) ≡∫
XF (x, t) dµ(x) =
∫
Xg(x)f(Ψt(x)) dµ(x).
Se g e una generica funzione complessa e misurabile su X ,M allora sia la sua
parte reale che la sua parte immaginaria sono funzioni misurabili ed ognuno di
12C.f.r. [Hal50] Paragrafo 34, Teorema B.13C.f.r. [Rud74] Teoremi 1.8 e 1.9.14C.f.r. [Hal50] Paragrafo 34, Teorema B.
188
questi due termini si puo ulteriormente scomporre comme somma di parte positiva
e parte negativa che sono ancora funzioni misurabili. Quindi ogni g misurabile su
X ,M si scrive in modo unico come combinazione lineare di funzioni misura-
bili e positive e cio vale banalmente per la sua estensione g sullo spazio di misura
prodotto. Questo, in virtu della linearita dell’integrale, implica ancora che per una
generica g e per una f non negativa la funzione h(t) si decompone come combi-
nazione lineare di funzioni misurabili sullo spazio T,B e pertanto e ancora una
funzione misurabile. Per l’invarianza della misura rispetto alla dinamica possiamo
porre ancora
h(t) ≡∫
XF (x, t) dµ(x) =
∫
Xg(Ψ−t(x))f(x) dµ(x)
ed utilizzando nuovamente la linearita dell’integrale ed il fatto che una generica f
misurabile puo essere decomposta come combinazione lineare di funzioni misurabili
non negative segue che la funzione h(t) e misurabile sullo spazio T,B per ogni
scelte delle funzioni misurabili f, g. Quindi sotto la sola ipotesi che la dinamica Ψ
sia tale per cui comunque scelta una funzione f misurabile su X ,M la funzione
F (x, t) = f(Ψt(x)) e misurabile rispetto a X × T,M × B si ottiene che la
funzione h(t) e misurabile su T, B per ogni scelta delle funzioni f, g. Nel caso
particolare di funzioni in L2[X , µ] la precedente relazione dice che
h(t) =
∫
XF (x, t) dµ(x) =
∫
Xg(x)Ut(f)(x) dµ(x) = (g; Ut(f))
ovvero che il prodotto scalare (g; Ut(f)) al variare di t definisce una funzione mis-
urabile. Dato che l’insieme L2[X , µ] e uno spazio di Hilbert separabile sono ver-
ificate le condizioni di un teorema15 dovuto a von Neumann che assicura che il
gruppo unitario ad un parametro Ut che implementa la dinamica e fortemente
continuo. Nel seguito assumeremo questa condizione sempre verificata.
Il Teorema di Koopman permette di associare ad ogni sistema dinamico classico
Γ ≡ X ,M , µ,T, Ψ una nuovo struttura matematica, che indicheremo simboli-
camente con ∆Γ ≡ L2[X , µ],T, UT, costituito dallo spazio di Hilbert L2[X , µ]
e dalla rappresentazione unitaria U(T) del gruppo T che nel caso di dinamica
continua, sotto ipotesi molto ragionevoli, e fortemente continua nel parametro
t ∈ T. La maggior parte dei risultati riguardanti i sistemi dinamici classici
(ma non tutti) possono essere tradotti nel linguaggio astratto di questi sistemi
“dinamico-gemetrici”.
15C.f.r. [RS72] Teorema VIII.9
189
A.3.1 Definizione (sistema dinamico Hilbertiano). Un sistema dinamico
Hilbertiano e una terna ∆ ≡ H,T, U(T) con H uno spazio di Hilbert, T ∈R,Z e U(T) una rappresentazione unitaria di T su H (che nel caso continuo
T = R deve essere fortemente continua nel parametro t). InoltreH deve ammettere
un sottospazio non banale costituito da vettori invarianti sotto l’azione di U(T),
ovvero deve esistere un proiettore ortogonale non banale P tale che [Ut; P ] = 0 per
ogni t ∈ T.
Poiche per un sistema dinamico classico la misura µ e finita (e di probabilita)
allora L2[X , µ] contiene anche le funzioni costanti che sono invarianti sotto l’azione
degli operatori Ut. In questo senso L2[X , µ] ha un proiettore P non e banale.
A.3.2 Il Teorema di von Neumann; convergenza in norma
Il problema dell’esistenza delle medie temporali si pone in modo molto chiaro
nel linguaggio geometrico dei sistemi dinamici Hilbertiani ed in questo contesto
ammette una soluzione estremamente elegante.
A.3.2 Teorema (ergodico di von Neumann). Sia Γ ≡ X ,M , µ,T, Ψ un
sistema dinamico classico e per ogni t ∈ T indichiamo con Ut l’operatore unitario
sullo spazio L2[X , µ] definito da Ut(f)(x) = f(Ψt(x)). Indichiamo con P il proi-
ettore sulle funzioni di L2[X , µ] invarianti sotto l’azione della dinamica Ut. Per
ogni f ∈ L2[X , µ] la successione delle funzioni fτ definite da
fτ ≡ 1
2τ
∫ +τ
−τ
Ut(f) dt =
(1
2τ
∫ +τ
−τ
Ut dt
)(f)
converge in norma ‖ ‖L2 alla funzione P (f) quando τ → +∞. Tale limite definisce
la media temporale della funzione f ∈ L2[X , µ] per cui f = P (f) dove l’uguaglianza
e da intendersi nel senso della relazione di equivalenza quasi ovunque16. La media
temporale f e invariante sotto l’azione della dinamica in quanto, per definizione,
[Ut; P ] = 0.
16Siano f, g ∈ L2[X , µ]. Diremo che f = g se accade che
‖f − g‖2L2
=∫
X|f(x)− g(x)|2 dµ(x)
e cio accade quando l’insieme dei punti di X per cui f(x) 6= g(x) e un sottoinsieme di misura
nulla rispetto alla misura µ. Quindi L2[X , µ] piu che un insieme di funzioni e da considerarsi una
classe di equivalenza di funzioni rispetto alla relazione di equivalenza indotta dalla uguaglianza
delle funzioni quasi ovunque su X rispetto alla misura µ.
190
Questo risultato e unicamente di carattere geometrico e quindi, in astratto,
afferma che se ∆ ≡ H,T, UT e un sistema dinamico Hilbertiano e se P e il
proiettore sul sottospazio dei vettori invarianti sotto l’azione del gruppo U(T)
allora
s-limτ→+∞
1
2τ
∫ +τ
−τ
Ut dt = P
e la media temporale di ogni vettore ψ ∈ H e definita da
ψ ≡ limτ→+∞
(1
2τ
∫ +τ
−τ
Ut dt
)ψ = Pψ
con la convergenza intesa rispetto alla norma di H.
Il Teorema ergodico di von Neumann vale anche per gruppi piu generali di R
o Z e per la dimostrazione si rimanda al Paragrafo B.6.3.
A.3.3 Dinamica Hilbertiana ergodica
Ricordiamo che un sistema dinamico classico e ergodico se gli unici sottoinsiemi Mmisurabili ed invarianti sono banali rispetto alla misura µ nel senso che o µ(M) = 0
oppure µ(X \M) = 0. Il Teorema A.2.4 afferma che la condizione di ergodicita
e equivalente al fatto che tutte e sole le funzioni misurabili tali che Ut(f) = f
per ogni t ∈ T sono le funzioni costanti quasi ovunque su X rispetto alla misura
µ. Dato che tutte la funzioni di L2[X , µ] sono in particolare funzioni misurabili
segue che l’ergodicita del sistema equivale al fatto che le sole funzioni di L2[X , µ]
invarianti sotto il gruppo U(T) sono le costanti (nel senso dell’equivalenza quasi
ovunque che definisce gli elementi di questo spazio) e cio implica che il sottospazio
su cui proietta P e unidimensionale ed e generato dalla funzione costante 1(x)=1.
Nel seguito indicheremo con Span(1) il sottospazio unidimensionale di L2[X , µ]
generato dalle costanti e con P1 il proiettore su questo sottospazio. Come diretta
conseguenza del Teorema A.2.4 discende la seguente caratterizzazione:
A.3.3 Teorema. Il sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e ergodico se
e solo se il sottospazio di L2[X , µ] costituito dalle funzioni invarianti rispetto al
gruppo U(T) e unidimensionale ed e costituito dalle sole funzioni costanti Span(1).
Cio equivale ad affermare che il sistema e ergodico se e solo se tutti gli operatore Ut
per ogni t ∈ T ammettono Span(1) come autospazio comune relativo all’autovalore
simultaneo 1. Se la dinamica e discreta allora Um = Um per ogni m ∈ Z avendo
posto U ≡ U1. In questo caso si puo affermare che il sistema e ergodico se e solo
se il numero 1 e autovalore semplice17 di U .
17Diremo che un autovalore e semplice se il relativo autospazio ha dimensione 1.
191
Il prossimo teorema fornisce una precisa caratterizzazione dell’ergodicita in
termini delle proprieta spettrali degli operatori Ut.
A.3.4 Teorema (degli autovalori). Sia Γ ≡ X , M , µ,T, Ψ un sistema di-
namico classico. Se il sistema e ergodico e se f ∈ L2[X , µ] e un’autofunzione
comune a tutti gli operatori Ut allora |f | e costante quasi ovunque su X rispetto
alla misura µ e f(x) = Aeih(x) con A ∈ R ed h : X → R. Inoltre in caso di
dinamica discreta, indicando U ≡ U1, segue che:
i) il valore assoluto di ogni autofunzione di U e costante quasi ovunque su Xrispetto alla misura µ;
ii) ogni autovalore di U e semplice;
iii) l’insieme degli autovalori di U costituiscono un sottogruppo del cerchio.
zDim.
Dato che ogni operatore Ut e unitario allora ogni autovalore di Ut e della forma eiat con at ∈ R.
Se f ∈ L2[X , µ] e un’autofunzione di tutti gli operatori Ut allora segue che f(Ψt(x)) = Ut(f)(x) =
eiatf(x) da cui |f(Ψt(x))| = |f(x)| ovvero la funzione |f | e invariante. Ma se il sistema e ergodico
allora |f | deve essere costante quasi ovunque su X e quindi |f | ∈ Span(1). Cio impone che quasi
ovunque su X rispetto alla misura µ deve valere che f(x) = Aeih(x) con A ∈ R ed h funzione a
valori reali.
Se la dinamica e discreta allora per ogni m ∈ Z si verifica che Um = (U1)m ≡ Um.
i) Se f ∈ L2[X , µ] e un autofunzione di U con autovalore eia allora essa e anche autofunzione
di Um con autovalore eima, infatti
Um(f) = Um(f) = eiaUm−1(f) = ei2aUm−2(f) = . . . = eimaf.
Se f e autofunzione simultanea di tutti gli operatori Um allora |f | ∈ Span(1).
ii) Siano f, g ∈ L2[X , µ] autofunzioni di U relative allo stesso autovalore eia. Per il punto i)
|g| e costante quasi ovunque su X e quindi g = Beik(x) quasi ovunque. Cio significa che e ben
definita la funzione f/g. Osserviamo che f(Ψm(x))/g(Ψm(x)) = eimaf(x)/eimag(x) = f(x)/g(x)
e quindi la funzione f/g e invariante. Se il sistema e ergodico allora f/g e una funzione costante
quasi ovunque e quindi f e g sono multiple l’una dell’altra.
iii) Se f, g ∈ L2[X , µ] sono autofunzioni di U relative rispettivamente agli autovalori eia e eib
allora la funzione fg ∈ L2[X , µ] in quanto |fg| = |f | |g| ∈ Span(1) e
U(fg) = U(f)U(g) = eiaeibfg = ei(a+b)fg.
Inoltre anche la funzione 1/f ∈ L2[X , µ] dato che |1/f | = 1/|f | ∈ Span(1) e quindi segue che
U(1/f) = 1/(eiaf) = e−ia(1/f). ¨
Prendendo spunto dalla caratterizzazione data nel Teorema A.3.3 si puo esten-
dere il concetto di ergodicita anche ai sistemi dinamici Hilbertiani astratti.
192
A.3.2 Definizione (sistema dinamico Hilbertiano ergodico). Il sistema di-
namico Hilbertiano ∆ ≡ H,T, U(T) e detto ergodico se il sottospazio dei vettori
invarianti sotto il gruppo U(T) e unidimensionale ed in questo caso indicheremo
il proiettore su questo sottospazio con P1.
In questo caso il Teorema ergodico di von Neumann implica che
ψ ≡ limτ→+∞
(1
2τ
∫ +τ
−τ
Ut dt
)ψ = (ψ1; ψ) ψ1
avendo indicato con ψ1 il vettore normalizzato di H che genera il sottospazio
unidimensionale dei vettori invarianti, con P1 il proiettore su questo sottospazio
e con ψ la media temporale del generico vettore ψ ∈ H. La convergenza e da
intendersi rispetto alla norma di H.
A.3.4 Dinamica Hilbertiana mixing
Ricordiamo che un sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e mixing se
per ogni coppia di sottoinsiemi misurabili M,N ∈ M la misura dell’insieme
M∩Ψτ−1(N ) nel limite τ → ±∞ converge al prodotto delle misure µ(M)µ(N ).
Nel “linguaggio Koopman” la condizione di mixing deve essere traducibile in una
qualche caratteristica peculiare del gruppo unitario U(T).
A.3.5 Proposizione. Il sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e mixing
se e solo se per ogni coppia di funzioni f, g ∈ L2[X , µ] accade che
limτ→±∞
(f ; Uτg)L2 = (f ; 1)
L2 (1; g)L2 , (A.13)
ovvero se e sole se la successione degli operatori Uτ converge in senso debole al
proiettore P1 sul sottospazio unidimensionale delle funzioni costanti
w-limτ→±∞
Uτ = P1.
zDim.
(⇒) Per definizione di mixing se M e N sono due insiemi misurabili e se χM e χN sono le
rispettive funzioni caratteristiche si ottiene che
limτ→±∞
∫
XχM(x)χN (Ψτ (x)) dµ =
∫
XχM(x) dµ
∫
XχM(x) dµ
e dato che χM, χN ∈ L2[X , µ] la precedente relazione si puo riscrivere introducendo i prodotti
scalari come limτ→±∞(χM; Uτ (χN ))L2 = (χM; 1)(1; χN )
L2 . Per la linearita del prodotto scalare
193
se fm ≡ ∑mj=1 aj χMj e una funzione semplice segue immediatamente che
limτ→±∞
(fm;Uτ (χN ))L2 =
m∑
j=1
aj limτ→±∞
(χMj;Uτ (χN ))
L2
=m∑
j=1
aj(χMj; 1)
L2 (1; χN )L2 = (fm; 1)
L2 (1; χN )L2 .
Sia f ∈ L2[X , µ] una generica funzione e fm una funzione semplice, allora dalle seguenti disug-
uaglianze
∣∣ limτ→±∞
|(fm; Uτ (χN ))L2 − (fm; 1)
L2 (1; χN )L2 | − lim
τ→±∞|(f ; Uτ (χN ))
L2
− (f ; 1)L2 (1; χN )
L2 |∣∣
6 limτ→±∞
|(fm; Uτ (χN ))L2 − (fm; 1)
L2 (1; χN )L2 − (f ;Uτ (χN ))
L2 + (f ; 1)L2 (1; χN )
L2 |
6 limτ→±∞
|(fm − f ;Uτ (χN ))L2 |+ |(f − fm; 1)
L2 (1; χN )L2 |
6 ‖fm − f‖L2 lim
τ→±∞‖Uτ (χN )‖
L2 + ‖fm − f‖L2 ‖χN ‖L2 ‖1‖2L2
= 2 µ(N ) ‖fm − f‖L2
e dal fatto che |(fm; Uτ (χN ))L2 − (fm; 1)
L2 (1; χN )L2 | → 0 se τ → ±∞ segue che
limτ→±∞
|(f ;Uτ (χN ))L2 − (f ; 1)
L2 (1; χN )L2 | 6 2 µ(N ) ‖fm − f‖
L2 .
Dato che ogni f ∈ L2[X , µ] e approssimata in norma da una successione di funzioni semplici18
fmm∈N l’ultimo membro della precedente disuguaglianza puo essere reso piccolo a piacere e
quindi otteniamo che limτ→±∞(f ; Uτ (χB))L2 = (f ; 1)
L2 (1; χN )L2 qualunque siano la funzione f
e l’insieme N . Ancora per la linearita del prodotto scalare se gm ≡ ∑mj=1 bj χNj e una funzione
semplice segue immediatamente che
limτ→±∞
(f ; Uτ (gm))L2 =
m∑
j=1
bj limτ→±∞
(f ; Uτ (χNj ))L2
=m∑
j=1
bj(f ; 1)L2 (1; χNj )L2 = (f ; 1)
L2 (1; gm)L2 .
Sia g ∈ L2[X , µ] una generica funzione e gm una funzione semplice, allora dalle seguenti disug-
18C.f.r. [Rud74] Teorema 3.13.
194
uaglianze∣∣ lim
τ→±∞|(f ; Uτ (gm))
L2 − (f ; 1)L2 (1; gm)
L2 | − limτ→±∞
|(f ; Uτ (g))L2 − (f ; 1)
L2 (1; g)L2 |
∣∣
6 limτ→±∞
|(f ; Uτ (gm))L2 − (f ; 1)
L2 (1; gm)L2 − (f ; Uτ (g))
L2 + (f ; 1)L2 (1; g)
L2 |
6 limτ→±∞
|(f ; Uτ (gm − g))L2 |+ |(f ; 1)
L2 (1; (g − gm))L2 |
6 ‖f‖L2 lim
τ→±∞‖Uτ (gm − g)‖
L2 + ‖f‖L2 ‖(g − gm)‖
L2 ‖1‖2L2
= 2 ‖f‖L2 ‖gm − g‖
L2
e dal fatto che |(f ; Uτ (gm))L2 − (f ; 1)
L2 (1; gm)L2 | → 0 se τ → ±∞ segue che
limτ→±∞
|(f ; Uτ (g))L2 − (f ; 1)
L2 (1; g)L2 | 6 2 ‖f‖
L2 ‖gm − g‖L2 .
Poiche la norma ‖gm − g‖L2 puo essere resa piccola a piacere segue che
limτ→±∞
(f ; Uτ (g))L2 = (f ; 1)
L2 (1; g)L2 ∀ f, g ∈ L2[X , µ].
(⇐) Se per ogni f, g ∈ L2[X , µ] vale la (A.13) allora osservando che per ogni coppia di insiemi
misurabili M,N ∈ M le rispettive funzioni caratteristiche χM e χN sono elementi di L2[X , µ]
segue che
limτ→±∞
∫
XχM(x)χN (Ψτ (x)) dµ(x) =
∫
XχM(x) dµ(x)
∫
XχN (x) dµ(x)
ossia limτ→±∞ µ(M∩Ψτ−1(N )) = µ(M)µ(N ) che e la definizione di mixing.
Per concludere la dimostrazione osserviamo che il sistema essendo mixing e anche ergodico
e quindi il sottospazio delle funzioni invarianti sotto UT e costituito unicamente dalle costanti.
Indicando con P1 il proiettore su questo sottospazio segue che P1(g) = (1; g)1. ¨
La condizione di mixing si riflette sulle proprieta spettrali degli operatori unitari
Ut che descrivono la dinamica sullo spazio di Hilbert H ≡ L 2[X , µ]. Ricordiamo
che in caso di dinamica continua T = R il gruppo UT e fortemente continuo rispetto
al parametro temporale ed il Teorema di Stone19 permette di scrivere Ut = eitH
con H operatore autoaggiunto (generalmente illimitati) sullo spazio di Hilbert H.
In questo caso, ricordando che per un operatore autoaggiunto e illimitato H il suo
spettro σ(H) e un sottoinsieme illimitato di R, il Teorema di decomposizione
spettrale20 (per operatori autoaggiunti illimitati) permette di scrivere
Ut =
∫ +∞
−∞eitx dEx, H =
∫ +∞
−∞x dEx,
19C.f.r. [RS72] Teorema VIII.8.20C.f.r. [RS72] Teorema VIII.6.
195
avendo indicato con EBB∈B(R) una misura a valori di proiezione definita
sui sottoinsiemi boreliani dell’asse reale e con supporto sullo spettro σ(H). Per
ogni ψ ∈ H l’applicazione µψ(B) ≡ (ψ; EBψ) definisce una misura positiva sui
boreliani B(R). Si indica con Hac il sottospazio di H costituito da tutti i vettori
ψ tali per cui la misura µψ e assolutamente continua rispetto alla misura
di Lebesgue21. Se H|Hace la restrizione di H sul sottospazio Hac indicheremo
con σac(H) lo spettro assolutamente continuo (o spettro di Lebesgue)
di H, ossia lo spettro di H|Hacsu Hac. Evidentemente se ψ e un autovettore
(normalizzato) di H, relativo all’autovalore reale h, la misura µψ non puo essere
assolutamente continua rispetto alla misura di Lebesgue. In questo caso, infatti,
dal Teorema di decomposizione spettrale segue che
g(h) = (ψ; g(H)ψ) =
∫ +∞
−∞g(x) (ψ; dExψ) =
∫ +∞
−∞g(x) dµψ(x)
per ogni funzione g boreliana e limitata. L’arbitrarieta di g implica che la misura
µψ deve coincidere con la misura di Dirac δh concentrata sul punto h che non e
assolutamente continua rispetto alla misura di Lebesgue. Indicheremo con Hpp
l’insieme dei vettori ψ ∈ H per cui la misura µψ e concentrata su un insieme
discreto di punti e quindi Hpp coincide con il sottospazio generato degli autovettori
di H. Se H|Hppe la restrizione di H sul sottospazio Hpp indicheremo con σpp(H) lo
spettro puntuale di H ossia lo spettro di H|Hppsu Hpp. Evidentemente σpp(H)
coincide con l’insieme degli autovalori di H.
Infine se la dinamica e discreta T = Z non si puo utilizzare il Teorema di
Stone. Tuttavia per il Teorema di decomposizione spettrale (per gli operatori
normali e limitati), ricordando che gli operatori unitari (che sono normali e limitati)
hanno spettro contenuto ne cerchio unitario di C segue che
U1 ≡ U =
∫ 2π
0
eiθ dEθ, Um ≡ Um =
∫ 2π
0
eimθ dEθ
avendo indicato in questo caso con EBB∈B([0,2π]) una misura a valori di
21Sia dx la misura di Lebesgue su R. Diremo che la misura boreliana µ : B(R) → C e
assolutamente continua rispetto alla misura di Lebesgue se esiste una funzione f : R → C,
localmente integrabile rispetto alla misura di Lebesgue (∫ b
a|f(x)|dx per ogni intervallo finito
(a, b) ⊂ R) tale che ∫ +∞
−∞g(x) dµ(x) =
∫ +∞
−∞g(x)f(x) dx
per ogni funzione boreliana ed integrabile g ∈ L1[R, µ]. In questo caso si puo scrivere che
dµ(x) = f(x) dx.
196
proiezione limitata (p.v.m.l.) definita sui sottoinsiemi boreliani dell’intervallo
[0, 2π].
Fatte queste premesse possiamo stabilire un’importante caratterizzazione spet-
trale dei sistemi con dinamica mixing.
A.3.6 Teorema. Condizione sufficiente per garantire che il sistema dinamico clas-
sico Γ ≡ X , M , µ,T, Ψ sia mixing e che per ogni t ∈ T gli operatori unitari Ut
abbiano spettro di Lebesgue se ristretti al sottospazio di L2[X , µ] ortogonale alle
funzioni costanti, ossia se Hac = 1⊥ = f | ∫X f(x) dµ(x) = 0 per ogni Ut.
Se la dinamica e discreta, T = Z, e sufficiente che U1 ≡ U abbiano spettro di
Lebesgue se ristretto al sottospazio 1⊥.
zDim.
Dato che tutti gli operatori Ut hanno come punto fisso le costanti segue che il sottospazio generato
da 1 e un autospazio simultaneo di tutti gli operatori Ut e quindi lo spettro assolutamente
continuo di ogni Ut e certamente contenuto in 1⊥. Supponiamo che per τ → ±∞ si abbia che
(f ;Uτ (g))L2 → 0 per ogni f, g ∈ 1⊥. Dato che le costanti sono autovettori di Uτ con autovalore
1 si ha anche che (f ; Uτ (λ1))L2 = λ(f ; 1)
L2 = (f ; λ1)L2 per ogni f ∈ L2[X , µ] e per ogni τ e
quindi in definitiva
limτ→±∞
(f ; (Uτ − P1)(g))L2 = 0 ∀ f, g ∈ L2[X , µ]
essendo P1 il proiettore sulle funzioni costanti. Quindi, sia nel caso di dinamica continua che
in quello di dinamica discreta, basta provare che (f ;Uτ (g))L2 → 0 per ogni f, g ∈ 1⊥ quando
τ → ±∞ per verificare che Uτw−→ P1 ossia per verificare che il sistema e mixing.
Sia f ∈ 1⊥ ed indichiamo con µf la misura spettrale relativa all’operatore autoaggiunto
H sul vettore f che implementa la rappresentazione Uτ = exp iHτ nel caso di dinamica continua
oppure sia µf la misura spettrale relativa all’operatore unitario U ≡ U1 nel caso di dinamica
discreta. In entrambe le circostanze facendo ricorso alla decomposizione spettrale si ottiene che
(f ; Uτf)L2 =
∫ +∞
−∞eiλτ dµf (λ) τ ∈ R
(f ; Umf)L2 =
∫ 2π
0
eimθ dµf (θ) m ∈ Z.
Dato che per ipotesi µf e assolutamente continua rispetto alla misura di Lebesgue dλ sull’asse
reale deve esistere una funzione Ff , tale che∫ a
b|Ff (λ)| dλ < +∞ su ogni intervallo finito (a, b),
per cui
(f ;Uτf)L2 =
∫ +∞
−∞eiλτFf (λ) dλ = Ff (τ)
avendo indicato con Ff la trasformata di Fourier della funzione Ff . Osserviamo che questa
espressione e corretta anche per il caso discreto se si considera che [0, 2π] ⊂ R e che la funzione
Ff puo essere assunta con supporto in [0, 2π]. Senza perdere di generalita possiamo supporre f
normalizzata e quindi
1 = ‖f‖2L2
= (f ; f)L2 =
∫ +∞
−∞Ff (λ) dλ
197
che implica che Ff ∈ L1[R, dλ]. Quindi Ff e la trasformata di Fourier di una funzione funzione
L1[R, dλ] e come conseguenza del22 Lemma di Riemann-Lebesgue segue che Ff e una funzione
continua che si annulla all’infinito. Cio implica che
limτ→±∞
(f ; Uτ (f))L2 = lim
τ→±∞Ff (τ) = 0 ∀ f ∈ 1⊥.
Se f, g ∈ 1⊥ anche f + jg ∈ 1⊥ con j ∈ I ≡ +1,−1, +i,−i. Utilizzando la formula di
polarizzazione segue allora che
limτ→±∞
(f ;Uτ (g))L2 = lim
τ→±∞
∑
j∈I
14j
((f + jg); Uτ (f + jg))L2 = 0 ∀ f, g ∈ 1⊥
e cio prova che Uτw−→ P1 se τ → ±∞ (m → ±∞ nel caso discreto) ovvero che il sistema e
mixing. ¨
I risultati ottenuti possono essere utilizzati per esportare il concetto di dinamica
mixing anche al livello puramente geometrico dei sistemi dinamici Hilbertiani.
A.3.3 Definizione (sistema dinamico Hilbertiano mixing). Il sistema di-
namico Hilbertiano ergodico ∆ ≡ H,T, U(T) e detto mixing se accade che
Uτw−→ P1 quando τ → ±∞.
Evidentemente condizione sufficiente al mixing e che il gruppo unitario forte-
mente continuo U(T) sia generato da un operato autoaggiunto H con spettro di
Lebesgue sul sottospazio P1(H)⊥. Nel caso di dinamica discreta e invece suffi-
ciente controllare che U ≡ U1 abbia spettro di Lebesgue sulla varieta P1(H)⊥.
La proprieta di mixing ed il concetto di spettro di Lebesgue sono intima-
mente collegate e per questo motivo puo essere comodo avere una caratterizzazione
operative di questa nozione spettrale. A tale scopo enunciamo il seguente risultato:
A.3.7 Proposizione. Sia H uno spazio di Hilbert separabile, U un operatore uni-
tario e H0 un sottospazio invariante rispetto ad U e generato dalla base ortonor-
male di vettori ϕi,ji∈I,j∈Z con I un sottoinsieme di Z (finito o infinito). L’opera-
tore U ha spettro di Lebesgue su H0 (di molteplicita I se e soltanto se Uϕi,j = ϕi,j+1
per ogni i ∈ I e j ∈ Z.
Per ragioni di completezza forniamo anche una caratterizzazione del mixing
debole in termini delle proprieta spettrali della rappresentazione unitari U(T).
A.3.8 Teorema. Il sistema dinamico classico Γ ≡ X ,M , µ,T, Ψ e debolmente
mixing se e solo ogni operatore unitari Ut, al variare di t ∈ T, ha un unico
autovalore corrispondente al numero 1 e se questo autovalore e anche semplice.
22C.f.r. [RS75] Teorema IX.7.
198
La dimostrazione23 di questo enunciato e lunga e laboriosa ed esula dagli scopi
di questa esposizione.
23C.f.r. [Hal50] pp. 39-41.
199
Appendice B
La formulazione algebrica della
Meccanica Quantistica
B.1 Il formalismo di base
Nei prossimi paragrafi verra presentato un quadro riassuntivo delle definizioni e
dei risultati tipici del formalismo algebrico della Meccanica Quantistica. La mag-
gior parte dei risultati saranno solamente enunciati. Il riferimento principale e il
Capitolo 2 del testo [BR79]. Altri utili riferimenti sono i testi [Sak71], [Tak79],
[Dix81], [Dix77] e [KR83].
B.1.1 C∗-algebra
Una C∗-algebra A e un insieme dotato delle seguenti strutture:
I) A e un’ algebra , ossia e uno spazio vettoriale sul corpo C dotato di un
prodotto interno associativo e distributivo
A(BC) = (AB)C
A(B + C) = AB + AC ∀ A,B, C ∈ A, ∀ a, b ∈ C;
ab(AB) = (aA)(bB)
II) esiste un’ involuzione (in questo caso si parla di ∗-algebra), ossia una
200
mappa ∗ : A → A, ∗(A) ≡ A∗, tale che
A∗∗ ≡ (A∗)∗ = A
(AB)∗ = B∗A∗ ∀ A,B ∈ A, ∀ a, b ∈ C;
(aA + bB) = aA∗ + bB∗
III) esiste una norma ‖ ‖ tale che
‖A‖ > 0 e ‖A‖ = 0 ⇔ A = 0
‖aA‖ = |a| ‖A‖∀ A,B ∈ A, ∀ a, b ∈ C;
‖A + B‖ 6 ‖A‖+ ‖B‖ (disuguaglianza triangolare)
‖AB‖ 6 ‖A‖‖B‖ (disuguaglianza del prodotto)
IV) A e uno spazio di Banach , ossia e completo rispetto alla topologia uni-
forme indotta dalla norma ed inoltre
‖A∗A‖ = ‖A‖2 ∀ A ∈ A (condizione C∗).
Dalla condizione C∗ e dalla disuguaglianza sul prodotto segue immediatamente
anche che:
‖A∗‖ = ‖A‖ ∀ A ∈ A.
Se AB = BA per ogni A,B ∈ A diremo che l’algebra e commutativa o
anche abeliana . Un’ identita e un elemento 1 ∈ A tale che A = 1A = A1
per ogni A ∈ A. Evidentemente se esiste un’identita questa e unica dato che
1′ = 1′1 = 1. Inoltre dalla relazione A∗ = A∗1∗ = 1∗A∗ segue anche che 1∗
e un’identita e pertanto 1 = 1∗. Dalla condizione C∗ segue che ‖1‖ = ‖1‖2 e
dalla disuguaglianza del prodotto segue che ‖A‖ 6 ‖1‖ ‖A‖ per ogni A ∈ A. Le
due relazioni sono compatibili solo se ‖1‖ = 1. Nel seguito assumeremo sempre
(salvo avviso contrario) che la C∗-algebra ha l’identita. Questa non e una grossa
restrizione dato che ogni C∗-algebra A priva di identita puo sempre essere immersa
in una C∗-algebra piu grande A ≡ C1+ A che ha l’identita1.
La classe delle C∗-algebre non e vuota come mostrato nei seguenti esempi:
1C.f.r. [BR79] Proposizione 2.1.5.
201
• Sia H uno spazio di Hilbert. L’insieme L (H) costituito dagli operatori
lineari e limitati su H e una C∗-algebra rispetto alla norma operatoriale e
all’involuzione data dall’operazione di aggiunzione. In particolare L (H) e
un’algebra con identita generalmente non commutativa.
• Sia X uno spazio di Hausdorff localmente compatto. L’insieme C0(X ) co-
stituito dalle funzioni continue che si annullano all’infinito e una C∗-algebra
rispetto alla norma del “sup” ‖ ‖∞ e all’involuzione data dalla coniugazione
complessa. In particolare C0(X ) e commutativa ma non possiede identita
in quanto la funzione che vale costantemente 1 non si annulla all’infinito.
Tuttavia se X e compatto allora l’insieme C(X ) costituito dalle funzioni
continue e una C∗-algebra abeliana con identita.
Questi due esempi esauriscono l’intera casistica delle possibili C∗-algebre come
segue dai due seguenti risultati generali che verranno discussi nel Paragrafo B.1.9:
B.1.1 Teorema (Basic Structural Theorem). Ogni C∗-algebra A e isomorfa
ad una algebra B ⊆ L (H) autoaggiunta e chiusa in norma costituita di operatori
limitati su uno spazio di Hilbert H.
B.1.2 Teorema (di Gel’fand). Ogni C∗-algebra commutativa A e isomorfa alla
C∗-algebra C0(X ) delle funzioni continue e nulle all’infinito su uno spazio local-
mente compatto X . In particolare se la C∗-algebra possiede l’identita allora lo A e
isomorfa a C(X ) con X spazio compatto.
Il primo risultato e noto anche con il nome di costruzione G.N.S mentre il
secondo e noto come isomorfismo di Gel’fand . In particolare la costruzione
G.N.S. e il risultato che giustifica la formulazione algebrica della Meccanica Quan-
tistica come estrapolazione della formulazione standard.
Sia B un sottoinsieme della C∗-algebra A. La chiusura in norma dell’insieme
costituito da tutti i polinomi negli elementi di B e dei loro aggiunti e una C∗-
algebra che viene detta C∗-algebra generata da B e si indica con A(B). In
questo caso A(B) e la piu piccola C∗-algebra contenente gli elementi di B. La
costruzione e significativa anche quando B e costituito da un solo elemento.
B.1.2 Classificazione degli elementi di una C∗-algebra
Sia A una C∗-algebra con identita 1. Un elemento A ∈ A si dice normale se
AA∗ = A∗A, si dice autoaggiunto se A = A∗ e si dice unitario se AA∗ =
202
A∗A = 1. Sia gli elementi autoaggiunti che quelli unitari sono in particolare
normali. L’insieme degli elementi unitari e un gruppo rispetto al prodotto interno
di A. Un elemento A ∈ A si dice invertibile se esiste un altro elemento A−1 ∈ A,
detto inverso, tale che A−1A = AA−11. L’inverso di un elemento se esiste e unico
ed e a sua volta invertibile. Inoltre se A e invertibile allora anche A∗ e invertibile e
(A∗)−1 = (A−1)∗. Anche l’insieme degli elementi invertibili e un gruppo rispetto al
prodotto interno di A. L’identita e un esempio di elemento autoaggiunto 1 = 1∗ ed
unitario 11∗ = 1∗1 = 1. Inoltre 1 e invertibile e coincide con il suo inverso. Una
C∗-algebra contiene sempre elementi autoaggiunti (oltre all’identita), ad esempio,
tutti quelli della forma A + A∗ per ogni A ∈ A. Per ogni A ∈ A si chiama
esponenziale di A l’elemento definito da
eA ≡+∞∑n=0
An
n!
con A0 = 1. La definizione e ben posta in quanto la serie e assolutamente con-
vergente rispetto alla norma di A in quanto ‖eA‖ 6∑+∞
n=0(‖A‖n/n!) = e‖A‖. Si
chiama commutatore degli elementi A e B l’espressione [A; B] ≡ AB − BA. Se
[A; B] = 0 allora si dimostra che eA+B = eAeB. Da cio segue immediatamente
che(eA
)−1= e−A e cio mostra che l’esponenziale e una mappa della C∗-algebra
nel gruppo degli elementi invertibili. Una C∗-algebra contiene sempre elementi
unitari (oltre all’identita), ad esempio, tutti quelli della forma eiA con A = A∗.
Si chiamano proiettori ortogonali gli elementi P ∈ A tali che P = P ∗ = P 2.
Sicuramente sono proiettori (banali) gli elementi 1 e 0 e puo accadere che una
C∗-algebra non abbia altri proiettori ortogonali oltre questi due.
Ogni A ∈ A si esprime in modo unico come somma di due elementi autoaggiunti
A = AR + iAI (B.1)
avendo definito la parte reale (AR) e la parte immaginaria (AI) come
AR ≡ A + A∗
2, AI ≡ A− A∗
2i.
Dalle relazioni
AA∗ = A2R + A2
I − i[AR; AI ], A∗A = A2R + A2
I + i[AR; AI ]
segue immediatamente che A e normale se e solo se [AR; AI ] = 0.
203
B.1.3 Risolvente, spettro e raggio spettrale
Sia A una C∗-algebra con identita e sia A un generico elemento. Si chiama risol-
vente di A, e si indica con il simbolo ρA(A), il sottoinsieme dei λ ∈ C per cui l’ele-
mento A−λ1 e invertibile in A. Il complemento del risolvente σA(A) ≡ C \ ρA(A)
si chiama spettro di A. Se B ⊂ A e una C∗-sottoalgebra di A e se A ∈ B si
puo definire il risolvente e lo spettro di A relativamente a B. Indichiamo con
σA(A) e σB(A) gli spettri di A relativi rispettivamente a A e B. Si dimostra che
σA(A) = σB(A) e quindi ρA(A) = ρB(A) e pertanto l’uso dei pedici A e B risulta
sovrabbondante2. Per ogni A ∈ A il numero positivo rA definito da
rA ≡ supλ∈σ(A)
|λ|
si chiama raggio spettrale di A. Per ogni A,B ∈ A e per ogni λ ∈ C si dimostrano
i seguenti risultati3:
S.1) ρ(A) e un sottoinsieme aperto di C;
S.2) σ(A) e limitato poiche e contenuto nel disco di raggio ‖A‖ di C, inoltre e
chiuso in quanto complementare di un insieme aperto e quindi e un compatto
di C;
S.3) vale che
rA = limn→+∞
‖An‖ 1n
da cui evidentemente rA 6 ‖A‖, inoltre il limite esiste finito e quindi σ(A) 6=∅;
S.4) σ(λ1− A) = λ− σ(A);
S.5) σ (A∗) = σ(A);
S.6) se A e invertibile allora σ (A−1) = σ(A)−1;
S.7) σ(AB) ∪ 0 = σ(BA) ∪ 0 da cui evidentemente rAB = rBA;
S.8) se P e un generico polinomio in una variabile e se P(A) ∈ A e l’elemento
ottenuto come polinomio di A segue che σ (P(A)) = P (σ(A));
S.9) se A e normale rA = ‖A‖;2C.f.r. [BR79] Proposizione 2.2.7.3C.f.r. [BR79] Proposizioni 2.2.2 e 2.2.3, Teorema 2.2.5.
204
S.10) se A e unitario rA = 1 e σ(A) ⊆ D1 essendo D1 il disco di raggio 1 in C;
S.11) se A e autoaggiunto il suo spettro e reale e rA ⊆ [−‖A‖, ‖A‖].
Per definizione lo spettro di un elemento A ∈ A e determinato solamente dalla
struttura algebrica di A e non dalla struttura topologica. Il raggio spettrale fissa
la norma degli elementi autoaggiunti secondo la relazione rA = ‖A‖ e, per la
condizione C∗, fissa anche la norma di ogni generico elemento secondo la relazione
√rA∗A = ‖A∗A‖ 1
2 = ‖A‖.
Cio prova che su una C∗-algebra A esiste un’unica norma che verifica la condizione
C∗ e rispetto alla quale A e completo.
Secondo l’apparato interpretativo della Meccanica Quantistica gli elementi au-
toaggiunti della C∗-algebra si interpretano come le osservabili, ovvero come le
variabili dinamiche, del sistema fisico ed il loro spettro costituisce l’insieme dei
possibili risultati di una misura. Questa interpretazione e supportata dal fatto
che gli autoaggiunti hanno spettro reale. Lo spettro dei proiettori consiste di
due soli punti 0, 1. Essi rappresentano apparati di misura che forniscono una
risposta binaria “si/no” e pertanto hanno un ruolo importante nell’interpretazione
probabilistica della Meccanica Quantistica. In genere le C∗-algebre possono non
contenere proiettori oltre a quelli banali e per questa ragione, per gli scopi del-
la Meccanica Quantistica, diventa importante studiare delle classi particolari di
C∗-algebre (le algebre di von Neumann) non soggette a questa limitazione.
B.1.4 Elementi positivi
Un elemento autoaggiunto A di una C∗-algebra si dice positivo e si scrive A > 0
se il suo spettro e contenuto nella semiretta positiva, ovvero se σ(A) ⊆ [0, ‖A‖].L’insieme degli elementi positivi di A si indica con il simbolo A+. Le seguenti
affermazioni sono equivalenti4:
P.1) A ∈ A e positivo;
P.2) se A contiene l’identita allora
∥∥∥∥1−A
‖A‖
∥∥∥∥ 6 1;
4C.f.r. [BR79] Lemma 2.2.9 e Teorema2.2.12.
205
P.3) esiste un B ∈ A tale A = B∗B.
Inoltre se A e positivo allora esiste un unico elemento positivo B tale che A = B2
e B e contenuto nella C∗-sottoalgebra abeliana A(A) generata da A (l’abelianita
deriva da A = A∗). A questo elemento si da il nome di radice quadrata di A e
si indica con il simbolo B ≡ √A. Se A e un generico elemento di A allora per il
punto P.3) A∗A definisce un elemento positivo su A il quale a sua volta definisce
un’unica radice quadrata√
A∗A. Quindi ad ogni A ∈ A e unicamente associato
un elemento positivo definito da |A| ≡ √A∗A e chiamato modulo di A. Seguono
due importanti risultati che stabiliscono la possibilita di effettuare scomposizioni
notevoli degli elementi di una C∗-algebra.
B.1.3 Teorema (di decomposizione polare). Sia A una C∗-algebra e A un
suo elemento invertibile. A si decompone in mode unico come A = U |A| con
U = A|A|−1 operatore unitario.
Infatti se A e invertibile anche A∗A e invertibile con inversa positiva in quanto
(A∗A)−1 = A−1(A−1)∗. Da cio segue che |A| e invertibile con inversa |A|−1 ≡√(A∗A)−1 e quindi A = A|A|−1|A| = U |A|. L’elemento U = A|A|−1 e invertibile
poiche prodotto di elementi invertibili ed inoltre si verifica che e unitario poiche
U∗U = |A|−1A∗A|A|−1 = |A|−1|A|2|A|−1 = 1.
B.1.4 Teorema (di decomposizione ortogonale5). L’insieme A+ degli ele-
menti positivi della C∗-algebra A e un cono convesso6 chiuso in norma e con la
proprieta A+ ∩ (−A+) = 0. Se A e un elemento autoaggiunto di A+ si pos-
sono definire i due elementi A± ≡ (|A| ± A)/2. Segue che A± ∈ A+, A+A− = 0,
A = A+ − A− e inoltre A± sono gli unici elementi di A che verificano queste
proprieta.
Questo teorema permette di definire una relazione d’ordine parziale tra gli
elementi autoaggiunti di A. Se A e B sono due elementi autoaggiunti scriveremo
A > B se e solo se A−B > 0, ossia se e solo se A−B ∈ A+. L’ordinamento cosı
definito gode delle seguenti proprieta7:
O.1) A > 0 e 0 > A se e solo se A = 0;
O.2) se A > B e B > C allora A > C;
5C.f.r. [BR79] Proposizione 2.2.116La definizione di cono convesso e data nel Paragrafo B.1.7.7C.f.r. [BR79] Proposizione 2.2.13.
206
O.3) se A > B > 0 allora ‖A‖ > ‖B‖;
O.4) se A > 0 allora A‖A‖ > A2;
O.5) se A > B > 0 allora se C∗AC > C∗BC > 0 per ogni C ∈ A.
B.1.5 Rappresentazioni
Si chiama rappresentazione della C∗-algebra A su uno spazio di Hilbert H uno
∗-morfismo π : A → π(A) ⊆ L (H) che mappa la C∗-algebra A nel sottoinsieme
π(A) della C∗-algebra L (H) degli operatori limitati su H preservando la struttura
di C∗-algebra. In altre parole per ogni A,B ∈ A e per ogni a, b ∈ C deve valere
che:
R.1) π(aA + bB) = a π(A) + b π(B);
R.2) π(AB) = π(A) π(B);
R.3) π (A∗) = π(A)†.
Ogni rappresentazione mappa elementi positivi in elementi positivi, infatti se A ∈A+ allora π(A) = π(B∗B) = π(B)† π(B) > 0. Inoltre le rappresentazioni sono
automaticamente mappe continue in quanto abbassano la norma8, ‖π(A)‖ 6 ‖A‖per ogni A ∈ A. Ci riferiremo alle rappresentazioni utilizzando il simbolo H, π.La rappresentazione H, π e detta fedele se π e uno ∗-isomorfismo tra A e π(A) ⊆L (H), ossia se Ker(π) = 0. In particolare si dimostra che la rappresentazione
H, π e fedele se e solo se π e un’isometria9, ossia se e solo se ‖π(A)‖ = ‖A‖ per
ogni A ∈ A.
La rappresentazione H, π della C∗-algebra A si dice ciclica se esiste un
vettore ψ ∈ H tale che l’insieme π(A)ψ ≡ ϕ | ϕ = π(A)ψ, A ∈ A e denso
in H, ossia tale che π(A)ψ = H. In questo caso il vettore ψ si dice ciclico e
la rappresentazione ciclica si indica con H, π, ψ. La rappresentazione H, π si
dice non degenere se π(A)ϕ = 0 per ogni A ∈ A implica che ϕ = 0, ovvero se
π(A)H = H. In particolare
H, π, ψ rappresentazione ciclica ⇒ rappresentazione non degenere.
Sia Hα, παα una collezione di rappresentazioni della C∗-algebra A indicizzata
da α ∈ I con I insieme di indici qualsiasi (finito, numerabile, piu che numerabile).
8C.f.r. [BR79] Proposizione 2.3.1.9C.f.r. [BR79] Proposizione 2.3.3.
207
Indichiamo con H ≡ ⊕α∈I Hα la somma diretta dei singoli spazi di rappresen-
tazione. La collezione di tutti i sottoinsiemi finiti F ⊂ I definisce un sistema
diretto10 rispetto all’ordinamento dato dall’inclusione. Lo spazio H e l’insieme
delle famiglie di vettori ϕ ≡ ϕα con ϕα ∈ Hα tali che
‖ϕ‖ ≡ limF→∞
(∑α∈F
‖ϕα‖2Hα
)< +∞. (B.2)
La (B.2) definisce la norma su H mentre il prodotto scalare e definito da
(ϕ; φ) = (ϕα; φα) ≡∑
α
(ϕα; φα)Hα≡ lim
F→∞
(∑α∈F
(ϕα; φα)Hα
). (B.3)
Ogni spazio Hα si identifica con il sottospazio di H costituito dai vettori della
forma ϕ ≡ ϕα′ con ϕα′ = 0 se α′ 6= α e pertanto ha senso la notazione Hα ⊂ H.
Rispetto al prodotto scalare (B.3) i sottospazi Hα sono reciprocamente ortogonali
e quindi sono definiti i rispettivi proiettori ortogonali Pα.
Sullo spazio somma H si definisce la rappresentazione somma π come
somma diretta delle singole rappresentazioni πα, ossia π ≡ ⊕α∈I πα. Esplici-
tamente π(A) identifica su ogni sottospazio Hα l’operatore πα(A) nel senso che
π(A)ϕ = π(A)ϕα = πα(A)ϕα per ogni ϕ ≡ ϕα ∈ H e ogni A ∈ A. Nel se-
guito faremo uso della notazione compatta π(A) ≡ ⊕α∈I πα(A). Infine osserviamo
che per ogni A ∈ A
‖π(A)‖2 = supϕα∈H
‖πα(A)ϕα‖2
‖ϕα‖2= sup
ϕα∈H
(∑α ‖πα(A)ϕα‖2Hα∑
α ‖ϕα‖2Hα
)
da cui segue che
‖π(A)‖ = supα∈I
‖πα(A)‖Hα . (B.4)
La coppia H, π con H ≡ ⊕α∈I Hα e π ≡ ⊕
α∈I πα definisce una rappresen-
tazione detta somma diretta delle rappresentazioni Hα, παα. Il legame tra le
rappresentazioni non degeneri e le rappresentazioni cicliche sta nel fatto che ogni
rappresentazione non degenere della C∗-algebra A e somma diretta di una famiglia
di rappresentazioni cicliche11.
Due rappresentazioni H1, π1,H2, π2 di una stessa C∗-algebra A si dicono
unitariamente equivalenti se esiste un operatore unitario V : H1 → H2 tale
per cui π1(A) = V π2(A)V † per ogni A ∈ A. L’equivalenza tra le mappe π1 e π2 si
indica con π1 ' π2.
10La definizione di sistema diretto e data nel Paragrafo B.1.6 alla Nota 13.11C.f.r. [BR79] Proposizione 2.3.6.
208
B.1.6 Topologia debole e ∗-debole
Duale di uno spazio di Banach
Siano X e Y due spazi vettoriali normati (non necessariamente completi) ed
indichiamo con L (X ,Y) l’insieme delle trasformazioni lineari A : X → Y limitate
‖A‖ ≡ supx∈X
‖Ax‖Y‖x‖X
< +∞. (B.5)
L’insieme L (X ,Y) e uno spazio vettoriale (con le operazioni di somma e prodotto
per uno scalare definite in modo puntuale) sul quale la (B.5) definisce una norma.
Se Y e uno spazio completo rispetto alla sua norma allora anche lo spazio L (X ,Y)
risulta completo rispetto alla norma (B.5), ossia L (X ,Y) risulta uno spazio di
Banach12. La completezza di L (X ,Y ) e indipendente dalla completezza di X e
dipende solamente da quella di Y .
Quando Y = C l’insieme L (X ,C) prende il nome di duale topologico di Xe viene indicato X ∗ ed i suoi elementi sono detti funzionali lineari limitati .
Poiche C e uno spazio completo segue che il duale X ∗ e completo rispetto alla
norma
‖φ‖ ≡ supx∈X
|φ(x)|‖x‖X
che e detta norma del “sup” o norma uniforme . Dato che ogni spazio
normato puo sempre essere completato ed in modo unico non si perde di generalita
se si considera X uno spazio di Banach; inoltre converremo di indicare la norma
su X semplicemente con ‖ ‖.
Topologia uniforme su uno spazio di Banach
Si chiama topologia uniforme la topologia metrica indotta su X dalla norma
‖ ‖. La metrica e definita da d(x, x′) ≡ ‖x−x′‖ e la topologia e generata utilizzando
come base la collezione delle palle aperte
Uε(x) ≡ y | y ∈ X , ‖x− y‖ < ε ∀ x ∈ X , ∀ ε > 0.
Per ogni x ∈ X la collezione Uε(x) al variare di ε > 0 si chiama base di intorni
per il punto x. Come tutte le topologie metriche la topologia uniforme verifica
la proprieta di Hausdorff (per ogni coppia di punti distinti x 6= y esiste un
aperto che contiene x ed un aperto che contiene y la cui intersezione e vuota) ed
il primo assioma di numerabilita (ogni punto ammette una base di intorni
12C.f.r. [RS72] Teorema III.2.
209
numerabile) infatti la famiglia Uq(x) con q ∈ Q+ genera per unioni qualsiasi palla
aperta Uε(x). Sia xαα∈I un net indicizzato dal sistema diretto13 I. Il net
xαα∈I converge al punto x ∈ X se per ogni intorno U(x) di x esiste un β ∈ Itale che xα ∈ U (x) se β ≺ α. La proprieta di Hausdorff assicura che ogni net puo
convergere al massimo ad un unico limite (due limiti distinti di uno stesso net
non potrebbero essere separati da intorni disgiunti). Se A ⊆ X allora x e un punto
della chiusura di A se e solo se esiste un net xαα∈I ⊆ A convergente a x. Ogni
insieme chiuso coincide con la propria chiusura ed ogni insieme che gode di questa
proprieta e chiuso. Inoltre la conoscenza di tutti i chiusi equivale alla conoscenza
di tutti gli aperti (per complementazione) e pertanto la topologia e descrivibile
anche in termini di net convergenti. Per topologie che verificano il primo assioma
di numerabilita (le topologie metriche in generale e quella uniforme in particolare),
la chiusura di ogni insieme puo essere costruita usando solo net numerabili ossia
successioni ordinarie. Se xnn∈N e una successione di X che converge a x rispetto
alla topologia uniforme, allora per ogni intorno Uq(x) deve esistere un n′(q) ∈ Ntale che xn ∈ Uq(x), ossia ‖x− xn‖ < q, se n > n′ e quindi
xn‖ ‖−→ x ⇔ lim
n→+∞‖x− xn‖ = 0.
Relativamente alla topologia uniforme su X ed alla topologia naturale (quella
metrica indotta dal modulo) su C gli elementi di X ∗ sono continui. Condizione
necessaria e sufficiente affinche il funzionale φ sia continuo e che per ogni punto
x0 ∈ X e per ogni successione xnn∈N ⊂ X convergente a x0 la successione
φ(xn)n∈N ⊂ C e convergente a φ(x0). Cio si verifica immediatamente osservando
che per la limitatezza degli elementi di X ∗
|φ(x)− φ(x0)| = |φ(x− x0)| 6 ‖φ‖ ‖x− x0‖.13Un sistema diretto e un insieme di indici munito di una relazione d’ordine ≺ che verifica
le seguenti proprieta:
SD.1) I e parzialmente ordinato;
SD.2) se α, β ∈ I allora esiste un γ ∈ I tale che α ≺ γ e β ≺ γ.
Una net (detto anche successione generalizzata) sullo spazio topologico X e una mappa
da un sistema diretto I in X che indicheremo con xαα∈I . Se come sistema diretto si sceglie
l’insieme N dotato dell’ordinamento usuale allora i net si riducono alle ordinarie successione
su X . In questo senso i net generalizzano il concetto di successione.
210
Topologia debole su uno spazio di Banach
La topologia uniforme su X e generalmente molto ricca. Spesso e necessario consi-
derare topologie meno ricche, ossia che contengono meno aperti, rispetto alle quali
sono convergenti successioni (o net) che in generale non convergono uniformemente.
Si chiama topologia debole su X la piu piccola topologia che rende continui tutti
gli elementi di X ∗. Il funzionale φ ∈ X ∗ e continuo se e solo se per ogni x0 ∈ X e
per ogni ε > 0 l’insieme dei punti x ∈ X per cui |φ(x) − φ(x0)| < ε e un intorno
aperto di x0. Quindi la topologia generata su X utilizzando come base la collezione
di insiemi
U[f ;ε](x) ≡ y | y ∈ X , |φ(y)− φ(x)| < ε ∀ x ∈ X , ∀ ε > 0
e tale da rendere continuo il funzionale φ. Se si vogliono rendere continui tutti
gli elementi X ∗ allora e necessario costruire una base per ogni funzionale lineare.
Dato che la famiglia degli aperti deve essere stabile rispetto alle intersezioni finite
segue che gli intorni necessari a generare la topologia debole sono definiti da
U[φ1,...,φn;ε](x) ≡ y | y ∈ X , |φj(x)− φj(x0)| < ε ∀ j = 1, . . . , n
per ogni x ∈ X , per ogni ε > 0, e per ogni collezione finita φ1, . . . , φn ⊂ X ∗ di
funzionali. In generale la topologia debole non verifica il primo assioma di nume-
rabilita e cio comporta che la topologia non puo essere determinata unicamente
dalle successioni convergenti ma e necessario considerare anche limiti dei net con-
vergenti. Se il net xαα∈I converge al punto x secondo la topologia debole allora
per ogni intorno debole U[φ1,...,φn;ε](x) esiste un β(ε) ∈ I tale che xα ∈ U[φ1,...,φn;ε](x),
ossia |φj(x)− φj(xα)| < ε per ogni j = 1, . . . , n, se β ≺ α e quindi
xαw−→ x ⇔ lim
α→∞|φ(x)− φ(xα)| = 0 ∀ φ ∈ X ∗.
Si verificano i seguenti fatti:
W.1) la topologia debole e piu debole della topologia uniforme;
W.2) ogni successione debolmente convergente e limitata in norma;
W.3) la topologia debole e di Hausdorff;
W.4) un funzionale lineare φ su X e uniformemente continuo se e solo se e
debolmente continuo.
211
La verifica del punto W.1) segue dalla disuguaglianza |φ(y)−φ(x)| 6 ‖φ‖ ‖y−x‖ da cui segue che se ‖y − x‖ 6 ε/‖φ‖ allora x ∈ U[φ;ε](x) per cui l’intorno
uniforme Uε/‖φ‖(x) e tutto contenuto nell’intorno debole U[φ;ε](x). Cio e sufficiente
a dimostrare che tutti gli aperti deboli sono anche aperti uniformi, ma non il
viceversa. Ovviamente se xnn∈N e una successione uniformemente convergente
a x allora essa e anche debolmente come segue immediatamente da
limn→+∞
|φ(xn)− φ(x)| 6 ‖φ‖ limn→+∞
‖xn − x‖ = 0 ∀ φ ∈ X ∗.
Se A ⊂ X la chiusura uniforme A ‖ ‖si ottiene aggiungendo ad A tutti i limiti
delle successioni (ed e sufficiente considerare unicamente le successioni dato che
la topologia uniforme verifica il primo assioma di numerabilita) uniformemente
convergenti contenute in A. Analogamente la chiusura debole A w si ottiene ag-
giungendo ad A tutti i limiti dei net (non e sufficiente considerare solamente le
successioni dato che la topologia debole non soddisfa il primo assioma di nume-
rabilita) debolmente convergenti contenute in A . Dato che la convergenza uni-
forme implica quella debole segue che A ‖ ‖ ⊆ A w. In generale la topologia debole
definisce chiusure piu grandi di quelle ottenute secondo la topologia uniforme. Se
un insieme e debolmente chiuso allora esso contiene tutti i limiti deboli dei net
convergenti ed in particolare anche tutti i limiti uniformi. Cio implica che tutti gli
insiemi debolmente chiusi sono anche uniformemente chiusi.
La verifica del punto W.2) segue dal Teorema di Banach-Steinhaus14 o
principio di uniforme limitatezza . Se xnn∈N ⊂ X e una successione de-
bolmente convergente allora per ogni φ ∈ X ∗ la successione φ(xn)n∈N ⊂ C e
convergente e quindi limitata da una costante Cφ > 0 (sarebbe falso in caso di
net). Ogni punto xn puo essere pensato come un elemento di L (X ∗,C) tramite
la relazione xn(φ) ≡ φ(xn) e quindi scelto φ ∈ X ∗ vale che |xn(φ)| 6 Cφ per ogni
xn. Per il Teorema di Banach-Steinhaus esiste una costante C tale che ‖xn‖ 6 C
per ogni elemento della successione xnn∈N e quindi ogni successione debolmente
convergente e anche limitata in norma. Osserviamo che la proprieta W.2) vale
unicamente se riferita a successioni ed in generale e falsa se riferita a net.
14Il Teorema di Banach-Steinhaus afferma che se X e uno spazio di Banach, F ⊆ L (X ,Y)
con Y spazio lineare normato e Cx > 0 costante fissata, dipendente da x, tale che ‖Ax‖Y 6 Cx,
per ogni A ∈ F e per ogni x ∈ X allora esiste una costante C > 0 tale che ‖A‖ 6 C per ogni
A ∈ F. Per la dimostrazione si rimanda a [RS72] Teorema III.9.
212
Il punto W.3) segue da una versione del Teorema di Hahn-Banach15 valida
per gli spazi normati. Questo teorema assicura che per ogni x ∈ X non nullo esiste
un φ(x) ∈ X ∗ tale che φ(x)(x) = ‖x‖ e ‖φ(x)‖ = 1, ottenuto come estensione del
funzionale φ′(x) definito sul sottospazio unidimensionale Span(x) da φ′(x)(λx) ≡λ‖x‖ per ogni λ ∈ C. Siano x 6= y e consideriamo il funzionale φ[a] ≡ φ(x) + a φ(y)
con a ∈ C. Esiste almeno un valore di a per cui g[a](x) 6= g[a](y) e pertanto
il duale X ∗ e separante per X , ossia per ogni coppia di punti distinti x 6= y
esiste sempre un elemento di X ∗ che li distingue. Se x 6= y e se φ e tale per
cui |φ(x) − φ(y)| = η allora i due intorni deboli U[φ;ε](x) e U[φ;ε](y) con ε < η/2
hanno intersezione nulla. Cio prova che la topologia debole e di Hausdorff e cio e
importante poiche garantisce l’unicita dei limiti deboli.
Lo spazio X e separabile se esiste un suo sottoinsieme denso (uniformemente)
e numerabile, ossia se esiste un sottoinsieme D ≡ x1, . . . , xn, . . . tale che D ‖ ‖=
X . In questo caso anche X ∗ e separabile con sottoinsieme denso dato dai funzionali
D∗ ≡ φ1, . . . , φn, . . . definiti da φj(xk) = δjk. In questa circostanza la topologia
debole e metrizzabile in quanto coincide con la topologia definita dalla seguente
metrica:
dw(x, y) ≡+∞∑n=1
|φn(x)− φn(x)|2n
.
Quindi se X e separabile anche la topologia debole verifica il primo assioma di
numerabilita e quindi e descrivibile unicamente in termini di successioni.
Biduale di uno spazio di Banach e topologia ∗-debole
Poiche il duale X ∗ di uno spazio di Banach e esso stesso uno spazio di Banach esso
ammettera a sua volta uno spazio duale, detto biduale , che si indica con X ∗∗.
Si dimostra16 che lo spazio X si identifica con un sottoinsieme del biduale X ∗∗,
infatti se per ogni x ∈ X indichiamo con x il funzionale lineare su X ∗ definito da
x(φ) ≡ φ(x) per ogni φ ∈ X ∗, segue che la mappa J : x → x e un isomorfismo
isometrico tra X ed un sottospazio (possibilmente proprio) di X ∗∗. Qualora la
mappa J e anche suriettiva allora X = X ∗∗ e diremo che X e riflessivo. Dato che
X ∗ e uno spazio di Banach l’insieme X ∗∗ puo indurre la topologia debole su X ∗.
15Il Teorema di Hahn-Banach per spazi normati afferma che se X e uno spazio normato,
Z un suo sottospazio e φ ∈ Z∗ allora esiste un φ ∈ X ∗ che estende φ su tutto X e tale che
‖φ‖X∗ = ‖φ‖Z∗ . Per la dimostrazione si rimanda a [RS72] Teorema III.6. e seguente Corollario
1.16C.f.r. [RS72] Teorema III.4.
213
Tuttavia risulta piu utile considerare la topologia indotta da X , quale sottoinsieme
di X ∗∗, su X ∗. Chiameremo topologia ∗-debole la piu piccola topologia su X ∗ che
rende continui tutti i funzionali x(φ) ≡ φ(x) appartenenti a J(X ) ⊆ X ∗∗. La base
di intorni di questa topologia e costituita da insiemi del tipo
U[x1,...,xn;ε](φ) ≡ ξ | ξ ∈ X ∗, |ξ(xj)− φ0(xj)| < ε ∀ j = 1, . . . , n
che sono indicizzati dalle successioni finite x1, . . . , xn di punti di X e dal parametro
ε > 0. La topologia ∗-debole soddisfa la proprieta di Hausdorff ed in generale
non verifica il primo assioma di numerabilita. La topologia ∗-debole su X ∗ e in
generale piu debole della topologia debole su X ∗, infatti la topologia ∗-debole e
indotta dalla richiesta che siano continui solamente i funzionali appartenenti a
J(X ) ⊆ X ∗∗ mentre la topologia debole richiede la continuita di tutti i funzionali
appartenenti a X ∗∗.
Lo spazio X e separabile e se D ≡ x1, . . . , xn, . . . e il sottoinsieme denso segue
che la topologia ∗-debole su X ∗ e metrizzabile in quanto coincide con la topologia
definita dalla seguente metrica:
dw∗(φ, ξ) ≡+∞∑n=1
|φ(xn)− ξ(xn)|2n
.
Quindi se X e separabile anche la topologia ∗-debole verifica il primo assioma di
numerabilita e quindi e descrivibile unicamente in termini di successioni.
Coppie duali e topologie deboli
Tutte le considerazioni ed i teoremi che riguardano i rapporti tra la topologia
debole e gli spazi lineari possono essere formulati in un ambito piu generale. Sia
X uno spazio vettoriale e sia F un insieme di funzionali lineari su X che sia un
sottospazio vettoriale dell’insieme di tutti i funzionali lineari su X e che separa i
punti di X (ossia per x 6= y in X esiste un φ ∈ F tale che φ(x) 6= φ(y)). La coppia
〈X ;Y〉 prende il nome di coppia duale . Se X ha dimensione finita la richiesta
che F separi i punti di X implica che F coincida con l’insieme di tutti i funzionali
lineari su X . Se x ∈ X possiamo definire il funzionale lineare x su Y tramite la
relazione x(φ) = φ(x) per ogni φ ∈ Y . Poiche F e separante per X implica che la
mappa J : x → x e iniettiva e quindi X puo essere pensato come un insieme di
funzionali lineari su F ; pertanto anche 〈F ;X〉 e una coppia duale.
Data la coppia duale 〈X ;F〉 si chiama topologia F-debole su X , e si indica
con σ(X ,F), la piu debole topologia su X che rende continui tutti i funzionali di
214
F . Dato che F separa i punti di X la topologia σ(X ,F) soddisfa la proprieta di
Hausdorff. In termini di questa impostazione piu generale risulta che la topologia
debole su X (spazio di Banach) e la topologia σ(X ,X ∗) mentre la topologia ∗-de-
bole su X ∗ e la topologia σ(X ∗,X ). Si dimostra17 che data la coppia duale σ(X ,Y)
il funzionale lineare f su X appartiene a Y se e solo se esso e σ(X ,Y)-continuo.
Questo risultato e la generalizzazione della proprieta W.4) enunciata a proposito
della topologia debole.
Concludiamo questo paragrafo con un risultato di grande importanza con-
seguenza del Teorema di Tychonoff.
B.1.5 Teorema (di Banach-Alaoglu18). Sia X ∗ il duale di uno spazio di Banach
X e sia B∗1 la palla unitaria contenuta in X ∗, ovvero l’insieme dei funzionali li-
neari tali che ‖φ‖ 6 1. Allora B∗1 e un sottoinsieme compatto rispetto alla topologia
∗-debole.
B.1.7 Insiemi convessi
Sia X uno spazio vettoriale e sia C un suo sottoinsieme. Diremo che C e convesso
se per ogni x, y ∈ C e per ogni 0 6 ε 6 1 anche la combinazione convessa
ε x + (1 − ε)y appartiene a C. Diremo che C e un cono se per ogni x ∈ C anche
λ x ∈ C per ogni λ > 0. Un cono C tale che C∩(−C) = 0 e detto cono proprio.
Un insieme convesso che e anche un cono viene chiamato cono convesso. Se Ce un insieme convesso allora diremo che x ∈ C e un punto estremale se e solo
se la relazione x = ε y + (1 − ε)z con y, z ∈ C e 0 < ε < 1 implica x = y = z. In
altri termini i punti estremali di C sono quei punti che non sono interni a nessun
segmento contenuto in C. Indicheremo l’insieme dei punti estremi di C con E(C).
Consideriamo uno spazio vettoriale X dotato di una topologia localmente
convessa (ogni punto di X ammette una base di intorni convessi) e sia A un
arbitrario sottoinsieme di X . Chiameremo inviluppo convesso chiuso di A e
lo indicheremo con cch(A) il piu piccolo insieme chiuso e convesso contenente Aossia
cch(A) ≡+∞⋃n=1
ε1 x1 + . . . + εn xn | xi ∈ A , εi > 0,
n∑i=1
εi = 1
.
17C.f.r. [RS72] Teorema IV.20.18C.f.r. [RS72] Teorema IV.21.
215
B.1.6 Teorema (Krein-Millman19). Sia X uno spazio vettoriale localmente con-
vesso e sia C un suo sottoinsieme compatto e convesso. L’insieme C coincide
con l’inviluppo convesso chiuso dei suoi punti estremi, ossia C = cch(E(C)). In
particolare segue che E(C) 6= ∅ non appena C 6= ∅.
Se 〈X ;Y〉 e una coppia duale si verifica facilmente che la topologia σ(X ,Y)
su X e localmente convessa dato che e definita assegnando ad ogni punto una
base di intorni convessi. Pertanto le precedenti definizioni ed i precedenti risultati,
compreso il Teorema di Krein-Millman, continuano a valere anche nel caso delle
coppie duali e degli spazi di Banach con i loro duali.
B.1.8 Stati su una C∗-algebra
Proprieta algebriche
Una C∗-algebra A e in particolare uno spazio di Banach e quindi valgono tutte
le considerazioni fatte nei Paragrafi B.1.6 e B.1.7. Indicheremo con A∗ il duale
(topologico) di A, ovvero l’insieme dei funzionali lineari φ : A → C continui
rispetto alla consueta “norma del sup”
‖φ‖ ≡ supA∈A
|φ(A)|‖A‖ .
Ribadiamo che l’insieme A∗ con la norma cosı definita e uno spazio di Banach. Un
funzionale lineare e positivo, e scriveremo φ > 0, se manda elementi positivi di
A in numeri positivi, ossia se φ(A∗A) > 0 per ogni A ∈ A. Indicheremo con A∗+ il
sottoinsieme dei funzionali lineari positivi. Un funzionale lineare e normalizzato
se ‖φ‖ = 1. L’insieme dei funzionali normalizzati si indica con A∗1. Si chiama
stato su A, e lo indicheremo con ω, un funzionale lineare positivo e normalizzato.
L’insieme degli stati su A coincide con A∗+ ∩ A∗
1 e si indica con EA. I funzionali
lineari positivi godono delle seguenti proprieta20:
FP.1) φ e un funzionale positivo se e solo se φ e continuo e ‖φ‖ = φ(1);
FP.2) se φ e un funzionale positivo allora per ogni A,B ∈ A
i) φ(A∗B) = φ(B∗A);
ii) |φ(A∗B)|2 6 φ(A∗A)φ(B∗B).
19C.f.r. [Sim93] Teorema I.5.7.20C.f.r. [BR79] Lemma 2.3.10 e Proposizione 2.3.11.
216
Evidentemente la FP.1) e valida solo se la C∗-algebra possiede l’identita 1, cosa
che noi supporremo sempre verificata. Inoltre questa proprieta assicura che ogni
funzionale lineare e positivo φ : A → C e anche limitato (in quanto continuo) e
quindi e un elemento di A∗; pertanto vale l’inclusione A∗+ ⊂ A∗. In particolare gli
stati su A si caratterizzano come i funzionali lineari positivi ω tali che ω(1) = 1.
Se φ1 e φ2 sono due funzionali positivi allora anche φ1 +φ2 e un funzionale positivo
e per la la FP.1) si ha
‖φ1 + φ2‖ = (φ1 + φ2)(1) = φ1(1) + φ2(1) = ‖φ1‖+ ‖φ2‖.
La disuguaglianza ii) in FP.2) si chiama disuguaglianza di Cauchy-Schwarz .
L’importanza della nozione di stato e ben illustrata se si considera una rap-
presentazione H, π della C∗-algebra A. Sia ψ 6= 0 un vettore diH e consideriamo
l’applicazione ωψ : A → C definita da
ωψ(A) ≡ (ψ; π(A)ψ) ∀ A ∈ A.
Evidentemente ωψ e lineare su A ed inoltre e positivo in quanto
ωψ(A∗A) = (ψ; π(A∗A)ψ) = (ψ; π(A)†π(A)ψ) = ‖π(A)ψ‖2 > 0.
Inoltre ωψ(1) = ‖π(1)ψ‖2 = ‖ψ‖2 e se ‖ψ‖ = 1 allora ωψ e uno stato su A. Stati
di questo tipo sono detti stati vettore della rappresentazione H, π. Sebbene
gli stati vettori possono apparire casi particolari di stati in realta essi descrivono
la situazione piu generale in quanto si verifica che ogni stato su una C∗-algebra e
uno stato vettore rispetto ad una qualche rappresentazione (Paragrafo B.1.9).
Proprieta topologiche
Se φ e un funzionale positivo allora anche λφ e ancora un funzionale positivo per
ogni λ > 0 e pertanto A∗+ e un cono contenuto in A∗. Inoltre se φ1 e φ2 sono
due funzionali positivi allora anche ε φ1 + (1 − ε)φ2 e un funzionale positivo per
ogni 0 6 ε 6 1 e quindi A∗+ e un sottoinsieme convesso di A∗. Quindi l’insieme
dei funzionali positivi risulta un cono convesso di A∗. La nozione di positivita
introduce un ordinamento sull’insieme dei funzionali positivi. Se φ1, φ2 ∈ A∗+
scriveremo che φ1 > φ2 se φ1 − φ2 > 0 ossia se φ1 − φ2 ∈ A∗+.
Se ω1 e ω2 sono due stati su A allora ω = ε ω1 + (1− ε)ω2 per ogni 0 6 ε 6 1 e
ancora uno stato su A e cio prova che anche EA e un sottoinsieme convesso di A∗.
Se ω = ε ω1 + (1 − ε)ω2 con 0 < ε < 1 e una combinazione convessa non banale
217
degli stati ω1 e ω2 allora ω− ε ω1 = (1− ε)ω2 > 0 e ω− (1− ε)ω2 = ε ω1 > 0, ossia
ω > ξ ω1 e ω > (1 − ξ)ω2. Quindi se uno stato ω e combinazione convessa non
banale di due stati distinti ω1 e ω2 allora esistono due multipli di questi stati che
sono maggiorati da ω. Diremo che uno stato e puro se non puo essere scritto come
combinazione convessa non banale di stati distinti, ossia uno stato e puro se e un
punto estremale di EA. Questa definizione si enuncia in termini di ordinamento
dicendo che uno stato ω e puro se i soli funzionali lineari positivi maggiorati da ω
sono della forma ε ω con 0 6 ε 6 1. Il sottoinsieme degli stati puri si indica con
PA ≡ E(EA). Gli stati che non sono puri si dicono stati misti .
Consideriamo il duale A∗ dotato della topologia ∗-debole ed indichiamo con B∗1
la palla unitaria di A∗, ossia l’insieme di tutti i funzionali lineari su A di norma
minore o uguale ad 1. Per il Teorema di Banach-Alaoglu (Teorema B.1.5) l’in-
sieme B∗1 e ∗-debolmente compatto in A∗. Se 1 ∈ A allora 1 puo essere pensato
come l’elemento di A∗∗ definito da 1(φ) ≡ φ(1). Ovviamente (per definizione)
questa applicazione 1 : A∗ → C e continua rispetto alla topologia ∗-debole. La
controimmagine rispetto a questa applicazione del sottoinsieme chiuso 1 ∈ C
definisce un iperpiano in A∗ costituito da tutti i funzionali φ(1) = 1. Questo
iperpiano e ∗-debolmente chiuso in quanto controimmagine continua di un chiuso.
L’insieme degli stati EA si ottiene come intersezione di questo iperpiano con B∗1.
Poiche ogni compatto di uno spazio di Hausdorff e chiuso21 e dato che ogni chiuso
contenuto in un compatto e a sua volta compatto22 segue che l’insieme EA e ∗-debolmente compatto23. Riassumendo l’insieme degli stati e un sottoinsieme di A∗
convesso e ∗-debolmente compatto. Poiche sono verificate le condizioni del Teo-
rema di Krein-Millman (Teorema B.1.6) segue che EA e generato come inviluppo
convesso ∗-chiuso dell’insieme dei suoi punti estremi E(EA) ≡ PA, ossia, in altri
termini, l’insieme di tutti gli stati su A si ottiene a partire dagli stati puri tramite
combinazioni convesse e chiusura ∗-debole.
Infine ricordiamo che se A e una C∗-algebra e se B e una C∗-sottoalgebra
contenuta in A allora ogni stato ω definito su B e sempre estendibile ad uno stato
ω definito su tutto A. Se ω e puro allora anche ω puo essere scelto puro24.
21C.f.r. [HY61] Corollario 2-2.22C.f.r. [HY61] Teorema 1-25.23Evidentemente questa affermazione non e piu vera se A non possiede l’identita 1.24C.f.r. [BR79] Proposizione 2.3.24.
218
Stati su C∗-algebre abeliane
Sia A una C∗-algebra abeliana. Si chiama carattere su A ogni mappa lineare non
nulla ω : A → C tale che ω(AB) = ω(A)ω(B) per ogni A,B ∈ A. Lo spettro di
A e l’insieme di tutti i caratteri di A e si indica con σ(A). Se ω e un carattere
allora per ogni elemento A ∈ A si dimostra25 che ω(A) ∈ σ(A) avendo indicato con
σ(A) lo spettro dell’elemento A (Paragrafo B.1.3). Quindi dalla disuguaglianza del
raggio spettrale segue che |ω(A)| 6 ‖A‖ e dal fatto che A∗A e un elemento positivo
segue che ω(A∗A) > 0. Tutto cio prova che i caratteri sono elementi di A∗ positivi.
In realta vale un risultato ancora piu forte26
ω e un carattere su A ⇔ ω e uno stato puro su A.
Quindi lo spettro σ(A) e un sottoinsieme di A∗ e coincide con l’insieme PA.
B.1.9 Stati e rappresentazioni
Rappresentazione G.N.S.
Sia A una C∗-algebra. A partire da un generico stato ω ∈ EA si puo costruire
sempre una rappresentazione ciclica di A, indicata con Hω, πω, ψω, tale che il
vettore ciclico ψω e normalizzato (‖ψω‖ = 1) e
ω(A) = (ψω; πω(A)ψω) ∀ A ∈ A. (B.6)
Essa e detta rappresentazione G.N.S (Teorema di Gel’fand-Naimark-Segal) o
rappresentazione ciclica indotta da ω e risulta unica a meno di equivalenze
unitarie27. La (B.6) giustifica l’affermazione fatta nel paragrafo precedente per cui
ogni stato su una C∗-algebra e sempre uno stato vettoriale. La costruzione G.N.S.
mostra che l’insieme delle rappresentazioni di una C∗-algebra non e vuoto dato che
esiste almeno la rappresentazione G.N.S. Tuttavia questa affermazione e vera se
esiste almeno uno stato. In effetti come conseguenza del Teorema di Hahn-Banach
si dimostra il Basic Existence Lemma28 che assicura che per ogni elemento
A ∈ A esiste uno stato puro ω ∈ PA tale che ω(A∗A) = ‖A‖2. Inoltre rispetto alla
rappresentazione G.N.S. indotta da questo stato segue che
‖A‖2 = ω(A∗A) = (ψω; πω(A∗A)ψω) = (ψω; πω(A)†πω(A)ψω) = ‖πω(A)‖2.
25C.f.r. [BR79] Lemma 2.3.26.26C.f.r. [BR79] Proposizione 2.3.27.27C.f.r. [BR79] Teorema 2.3.16.28C.f.r. [BR79] Lemma 2.3.23.
219
Uno ∗-automorfismo τ : A → A e un’isomorfismo di A in se che preserva la
struttura di C∗-algebra. In particolare ogni ∗-automorfismo preserva la norma,
ossia ‖τ(A)‖ = ‖A‖ per ogni A ∈ A. Diremo che lo stato ω e invariante rispetto
allo ∗-automorfismo τ se accade che ω(τ(A)) = ω(A) per ogni A ∈ A. Vale il
seguente risultato:
B.1.7 Proposizione. Se ω e uno stato sulla C∗-algebra A invariante rispetto allo
∗-automorfismo τ allora rispetto alla rappresentazione G.N.S. Hω, πω, ψω esiste
un unico operatore unitario Uω, costruito a partire da ω, tale che
i) Uωπω(A)Uω−1 = πω(τ(A)) per ogni A ∈ A;
ii) Uωψω = ψω.
L’operatore Uω e definito sul denso πω(A)ψω dalla relazione
Uωπω(A)ψω = πω(τ(A))ψω.
L’importanza della rappresentazione G.N.S. e che esso non e un semplice risul-
tato di esistenza ma e una “ricetta operativa” che permette di costruire effettiva-
mente la rappresentazione partendo dal solo stato ω.
Rappresentazioni irriducibili e stati puri
Sia H uno spazio di Hilbert, L (H) l’insieme dei suoi operatori limitati e R un
sottoinsieme di L (H). Diremo che R e irriducibile (topologicamente) se i
soli sottospazi di H invarianti sotto l’azione di R sono quelli banali 0 e H stesso.
Diremo che la collezione di operatori R e autoaggiunta se R e chiuso rispetto
all’aggiunzione, ossia se contiene l’aggiunto di ogni suo elemento. Indicheremo
con il simbolo R ′ il commutante di R, ossia l’insieme di tutti gli operatori di
L (H) che commutano con ogni elemento di R. Se R e un insieme autoaggiunto di
operatori limitati su H allora l’irriducibilita e caratterizzata dall’equivalenza delle
seguenti affermazioni29 (Lemma di Schur):
IR.1) R e irriducibile;
IR.2) il commutante R ′ contiene solo i multipli dell’identita, ossia R ′ ≡ C1;
IR.3) ogni vettore non nullo ψ ∈ H e ciclico per R in H, oppure R = 0 e H = C.
29C.f.r. [BR79] Proposizione 2.3.8.
220
Una rappresentazione H, π di una C∗-algebra A si dice irriducibile se
l’insieme π(A) e irriducibile su H. Gli stati puri e le rappresentazioni (G.N.S.)
irriducibili di una C∗-algebra sono strettamente legati, infatti si dimostra che30
ω e uno stato puro su A ⇔ Hω, πω, ψω e irriducibile su Hω.
Il Basic Structural Theorem31 per le C∗-algebre afferma che ogni C∗-
algebra A e isomorfa ad un’algebra chiuso in norma ed autoaggiunta di operatori
limitati su uno spazio di Hilbert H. Lo spazio di base di questa rappresentazione
si ottiene come somma diretta di tutti gli spazi di rappresentazione G.N.S. (uno
per ogni stato) ossia H ≡ ⊕ω∈EA
Hω mentre la rappresentazione e indotta da
π ≡ ⊕ω∈EA
πω. La coppia H, π cosı definita si chiama rappresentazione
universale di A. La rappresentazione universale esiste per ogni C∗-algebra dato
che per il “Basic Existence Lemma” EA 6= ∅. Inoltre la rappresentazione universale
e fedele in quanto π e un isomorfismo (infatti per ogni A ∈ A esiste sempre uno
stato ω ed una rappresentazione G.N.S. per cui ‖A‖ = ‖πω(A)‖). L’importanza di
questo risultato dovuto a Gel’fand e Naimark consiste nel fatto che dimostra che
gli assiomi che definiscono una C∗-algebra astratta caratterizzano tutte le algebre
autoaggiunte ed uniformemente chiuse di operatori limitati su spazi di Hilbert sen-
za la necessita di fare alcun riferimento esplicito al particolare spazio di Hilbert su
cui tale algebra operatoriale agisce.
L’isomorfismo di Gel’fand per le C∗-algebre abeliane
Sia A una C∗-algebra abeliana e σ(A) ⊂ A∗ il suo spettro, ossia l’insieme dei suoi
stati puri. Si verifica32 che rispetto alla topologia ∗-debole definita su A∗ l’insieme
σ(A) risulta ∗-compatto di Hausdorff. La ∗-compatezza deriva dal fatto che σ(A) e
∗-chiuso e contenuto nell’insieme ∗-compatto EA. La proprieta di Hausdorff viene
ereditata dalla topologia ∗-debole. Indichiamo con X lo spettro σ(A) munito
della topologia ∗-debole. Ogni A ∈ A definisce una funzione a valori complessi
su X secondo la relazione fA(ω) = ω(A) per ogni ω ∈ X . La mappa A → fA
definisce un isomorfismo (isomorfismo di Gel’fand) tra A ed un’algebra di
funzioni continue su X chiusa in norma, chiusa per coniugazione complessa, che
contiene le costanti e che separa i punti di X . Il Teorema di Stone-Weierstrass33
30C.f.r. [BR79] Teorema 2.3.19.31C.f.r. [BR79] Teorema 2.1.10.32C.f.r. [BR79] Teorema 2.1.11A.33C.f.r. [RS72] Teorema IV.10.
221
allora assicura che l’isomorfismo mappa A nell’insieme C(X ) di tutte le funzioni
continue a valori complessi su X . In definitiva questo importante risultato dovuto
a Gel’fand prova che gli assiomi che definiscono una C∗-algebra abeliana (con
identita) astratta caratterizzano tutte le C∗-algebre abeliane concrete costituite
dalle funzioni continue su spazi di Hausdorff compatti senza la necessita di fare
alcun riferimento esplicito al particolare spazio topologico X .
Se la C∗-algebra non possiede l’identita il risultato enunciato deve essere mo-
dificato in quanto lo spettro σ(A) = X risulta solo localmente ∗-compatto e l’iso-
morfismo A → fA mappa elementi di A nell’algebra C0(X ) delle funzioni continue
che si annullano all’infinito.
Un caso interessante si ha quando la C∗-algebra A e generata da un solo ele-
mento A (oltre che da A∗) e dall’identita 1. In questo caso si dimostra34 che A
e isomorfa alla C∗-algebra delle funzioni continue definite sullo spettro dell’ope-
ratore A (compatto di Hausdorff), ossia C(σ(A)). In particolare se A e normale
la C∗-algebra A e abeliana e si verifica che l’isomorfismo e unico, manda 1 nella
funzione costante 1(x) = 1 e manda A nella funzione f(x) = x. Cio permette
di identificare le funzioni f(A) ∈ A tramite l’isomorfismo inverso partendo da
funzioni f ∈ C(σ(A)).
B.1.10 Dinamica sui sistemi C∗
Le teorie fisiche consistono essenzialmente di due elementi, una struttura cine-
matica che descrive istantaneamente gli stati e le osservabili del sistema ed una
legge dinamica che descrive l’evoluzione degli stati e delle osservabili. Tutto il for-
malismo presentato nei precedenti paragrafi riguarda essenzialmente la descrizione
cinematica dei sistemi fisici. In questo paragrafo introdurremo la descrizione della
dinamica all’interno del formalismo algebrico della Meccanica Quantistica. Nella
meccanica classica l’evoluzione temporale e descritta da un gruppo di diffeomor-
fismi sullo spazio delle fasi mentre nella formulazione ordinaria della Meccanica
Quantistica essa e descritta da un gruppo unitario di operatori sullo spazio di
Hilbert. Nella formulazione algebrica invece l’evoluzione temporale e descritta da
un gruppo di automorfismi sulla C∗-algebra delle osservabili. Nella formulazione
consueta delle teorie delle particelle interagenti il flusso dinamico viene introdot-
to in modo implicito. La descrizione naturale del moto viene fornita in termini di
cambiamenti infinitesimi del sistema ed il moto infinitesimo e direttamente descrit-
34C.f.r. [BR79] Teorema 2.1.11B.
222
to da qualche formalismo Hamiltoniano che cerca di incorporare in modo esplicito
le interazioni tra le particelle. Nella meccanica classica le evoluzioni infinitesime
sono descritte da una funzione Hamiltoniana sul campo vettoriale, nella meccanica
quantistica da un operatore autoaggiunto detto Hamiltoniano e nei sistemi ad
infiniti gradi di liberta da una qualche forma di derivazione associata all’algebra
delle osservabili.
Dinamica su una C∗-algebra
Una dinamica su una C∗-algebra A e una rappresentazione α fortemente continua
di T ∈ R,Z sull’insieme Aut(A) degli automorfismi di A, ossia e una mappa
T 3 tα−→ αt ∈ Aut(A)
tale che:
i) α0 = Id essendo Id la trasformazione che lascia invariati gli elementi di A;
ii) αt1 αt2 = αt1+t2 per ogni t1, t2 ∈ T;
iii) α−t = αt−1 per ogni t ∈ T;
iv) se la successione tnn∈N ⊂ T converge a t allora
limtn→t
‖αtn(A)− αt(A)‖ = 0 ∀ A ∈ A. (B.7)
La proprieta iii) e ridondante in quanto si deriva dalle proprieta i) e ii). La iv)
e sovrabbondante nel caso T = Z, infatti la topologia naturale (discreta) definita
su Z e “troppo ricca” di aperti ed ammette come successioni convergenti le sole
successioni costanti tn = t per ogni n ∈ N. La terna Σ ≡ A;T; α formata
da una C∗-algebra A, dal gruppo T ∈ R,Z e da una dinamica α definisce un
sistema dinamico C∗. Quando T = R diremo che il sistema ha una dinamica
continua invece se T = Z parleremo di dinamica discreta . Per ogni A ∈ A
l’osservabile αt(A) descrive l’ evoluto di A al tempo t secondo la dinamica α e
l’insieme Oα(A) ≡ αt(A) | ∀ t ∈ T si chiama orbita di A.
Dinamica aggiunta
All’evoluzione temporale delle osservabili indotta da una dinamica α si puo asso-
ciare un’evoluzione temporale sull’insieme dei funzionali lineari A∗. Sia φ ∈ A∗
223
ed αt l’automorfismo che evolve le osservabili al tempo t. Al funzionale φ resta
associato un nuovo funzionale α∗t (φ) definito puntualmente dalla relazione
α∗t−1(φ)(A) ≡ φ(αt(A)) ∀ A ∈ A. (B.8)
Dalla linearita dell’automorfismo αt segue che il funzionale α∗t (φ) e lineare, inoltre
‖α∗t (φ)‖ = supA∈A
|α∗t (φ)(A)|‖A‖ = sup
A∈A
|φ(αt(A))|‖A‖ = sup
A∈αt(A)
|φ(A)|‖A‖ = ‖φ‖.
Quindi ad ogni t ∈ T e associata una mappa isometrica α∗t : A∗ → A∗ che per la
(B.8) e anche lineare. Quindi per ogni t ∈ T la mappa α∗t e un’isometria lineare
e quindi invertibile, ovvero un automorfismo del duale A∗. La collezione degli α∗tal variare di t ∈ T definisce una rappresentazione α∗ del gruppo T nell’insieme
Aut(A) indotta dalla mappa
T 3 tα∗−→ α∗t ∈ Aut(A∗). (B.9)
E immediato verificare che questa mappa preserva l’identita e la composizione del
gruppo, ossia che i) α∗0 = Id; ii) α∗t2+t1= α∗t2 α∗t1 per ogni t1, t2 ∈ T. Da queste
due proprieta e dall’invertibilita delle mappe segue anche che iii) α∗−t = α∗t−1 per
ogni t ∈ T. Osserviamo ancora che per ogni t′, t ∈ T, per ogni A ∈ A e per ogni
φ ∈ A∗ vale che
|α∗t′(φ)(A)− α∗t (φ)(A)| = |φ(αt′(A))− φ(αt(A))|
6 ‖φ‖ ‖αt′(A)− αt(A)‖
da cui segue immediatamente che se la successione tnn∈N ⊂ T converge a t allora
limtn→t |α∗tn(φ)(A) − α∗t (φ)(A)| = 0. La mappa α∗ definita dalla (B.9) definisce
una rappresentazione “fortemente continua”, rispetto alla topologia ∗-debole, di
T sul gruppo Aut(A∗) degli automorfismi di A. Questa mappa prende il nome di
dinamica aggiunta del sistema dinamico Σ ≡ A;T; α. Il funzionale α∗t1(φ) e l’
evoluto di φ al tempo t rispetto alla dinamica α e l’insieme O∗α(φ) ≡ α∗t (φ) | ∀ t ∈
T e l’ orbita di φ. Un funzionale φ ∈ A∗ e detto invariante o stazionario
rispetto alla dinamica α se accade che α∗t (φ) = φ per ogni t ∈ T o equivalente se
l’orbita di φ coincide con il solo punto φ.
Poiche la dinamica aggiunta e isometrica essa preserva il sottoinsieme degli
stati, α∗t : EA → EA per ogni t ∈ T. I concetti di evoluto, orbita e stato in-
variante o stazionario si deducono banalmente da quelli generali definiti per
224
i funzionali. Sia ω ∈ PA uno stato puro e supponiamo che per un qualche t ∈ Tvalga che
α∗t (ω) = ε ω1 + (1− ε) ω2 con 0 6 ε 6 1
per una qualche coppia ω1, ω2 ∈ EA. Applicando l’automorfismo α∗−t ed utilizzando
le proprieta gruppali segue che
ω = α∗−t α∗t (ω) = ε α∗−t(ω1) + (1− ε) α∗−t(ω2).
Poiche ω e puro ω = α∗−t(ω1) = α∗−t(ω2) da cui riapplicando la trasformazione α∗tsegue che α∗t (ω) = ω1 = ω2. Cio prova che anche lo stato α∗t (ω), indipendentemente
da t ∈ T, e puro. Quindi la dinamica aggiunta non solo preserva il sottoinsieme
degli stati ma preserva anche il sottoinsieme degli stati puri, ossia α∗t : PA → PA
per ogni t ∈ T.
In seguito faremo uso del fatto che per ogni t ∈ T le trasformazioni α∗t :
A∗ → A∗ sono continue nella topologia ∗-debole di A∗. Cio segue immediatamente
osservando che
|α∗t (φ′)(A)− α∗t (φ)(A)| = |φ′(αt(A))− φ(αt(A))|.
Se φββ∈I e un net convergente al punto φ rispetto alla topologia ∗-debole di
A∗ allora |φβ(αt(A)) − φ(αt(A))| → 0 per ogni A ∈ A quando β → ∞. Dalla
precedente uguaglianza segue che |α∗t (φβ)(A) − α∗t (φ)(A)| → 0 per ogni A ∈ A
se β → ∞ e quindi il net α∗t (φβ)β∈I converge ∗-debolmente a α∗t (φ). Cio e
sufficiente per verificare che le trasformazioni α∗t sono ∗-debolmente continue su
A∗.
Rappresentazione G.N.S. relativa a stati stazionari
Sia ω ∈ EA uno stato stazionario rispetto alla dinamica α, ossia α∗t (ω)(A) =
ω(αt(A)) = ω(A) per ogni A ∈ A e per ogni t ∈ T. Per quanto affermato nella
Proposizione B.1.7, nella rappresentazione G.N.S. Hω; πω; ψω relativa allo stato
stazionario ω, l’azione di ogni automorfismo αt viene implementata da un operatore
unitario Uω(t) su Hω tale che Uω(t)πω(A)Uω(t)−1 = πω(αt(A)) per ogni A ∈ A e
che lascia invariato il vettore ciclico ψω. Per costruzione sul denso πω(A)ψω vale
che
Uω(t1 + t2)πω(A)ψω = πω(αt1+t2(A))ψω = πω(αt1(A))πω(αt2(A))ψω
= Uω(t1)πω(αt2(A))ψω = Uω(t1)Uω(t2)πω(A)ψω
225
da cui Uω(t1 + t2) = Uω(t1)Uω(t2) per ogni t1, t2 ∈ T per estensione continua su
tutto Hω. Cio significa che la collezione Uω(T) di tutti gli operatori unitari Uω(t)
al variare di t ∈ T definisce una rappresentazione unitaria del gruppo T su
Hω che implementa la dinamica nella rappresentazione G.N.S.
B.1.8 Proposizione. Se la dinamica C∗ e continua, T = R, e se e verificata
la proprieta B.7 allora la rappresentazione unitaria Uω(T) e anche fortemente
continua su Hω.
zDim.
La prova di questa affermazione segue dalla relazione (che si verifica con un calcolo esplicito)
‖[Uω(t′)− Uω(t)]πω(A)ψω‖2
= 2ω(A∗A)− (Uω(t)πω(A)ψω; Uω(t′)πω(A)ψω)
− (Uω(t′)πω(A)ψω; Uω(t)πω(A)ψω)
= 2ω(A∗A)− (πω(αt(A))ψω;πω(αt′(A))ψω)
− (πω(αt′(A))ψω;πω(αt(A))ψω)
dove nell’ultima relazione si e utilizzato il fatto che ψω e invariante rispetto agli operatori Uω(t).
Riordinando i prodotti scalari tramite un’operazione di aggiunzione si ottiene che
‖[Uω(t′)− Uω(t)]πω(A)ψω‖2 = 2ω(A∗A)− ω(αt(A∗)αt′(A))− ω(αt′(A∗)αt(A))
= ω([αt(A)− αt′(A)]∗[αt(A)− αt′(A)])
dove l’ultima uguaglianza segue per la stazionarieta di ω. Da questa relazione, utilizzando la
proprieta C∗ della norma, segue ancora
‖[Uω(t′)− Uω(t)]πω(A)ψω‖2 6 ‖ω‖ ‖[αt(A)− αt′(A)]∗[αt(A)− αt′(A)]‖
= ‖αt(A)− αt′(A)‖2.
Da questa disuguaglianza segue che ‖[Uω(tn)−Uω(t)]πω(A)ψω‖ → 0 per ogni successione tnn∈Nconvergente al punto t e per ogni A ∈ A. Cio verifica che la rappresentazione unitaria Uω(T)
e fortemente continua sul denso πω(A)ψω di Hω. Per verificare che si ha convergenza forte
su tutto Hω osserviamo che per ogni vettore ϕ e per ogni ε > 0 esiste un A ∈ A tale che
‖[Uω(t′)− Uω(t)](ϕ− πω(A)ψω)‖ < ε e quindi∣∣∣‖[Uω(t′)− Uω(t)]ϕ‖ − ‖[Uω(t′)− Uω(t)]πω(A)ψω‖
∣∣∣
6 ‖[Uω(t′)− Uω(t)](ϕ− πω(A)ψω)‖ < ε
226
da cui segue che limtn→t ‖[Uω(tn)−Uω(t)]ϕ‖ < ε per ogni ϕ ∈ Hω. L’arbitrarieta nella scelta di
ε impone infine che Uω(tn) converge fortemente a Uω(t) su tutto Hω. ¨
Riassumendo un sistema dinamico C∗ ed uno stato stazionario ω generano una
rappresentazione G.N.S. in cui la dinamica viene implementata da un gruppo di
operatori unitari Uω(T) sullo spazio di rappresentazione Hω. Se la dinamica e
continua T = R allora il gruppo unitario Uω(T) e anche fortemente continuo su
Hω.
Generatore infinitesimo della dinamica continua
In questo paragrafo analizzeremo le proprieta della dinamica su una C∗-algebra in
termini di trasformazioni infinitesime. Il concetto di trasformazione infinitesima
richiede di controllare la dinamica per tempi “infinitesimi” t → 0 e quindi ha senso
solo nel caso di dinamica continua T = R dato che per dinamiche discrete (T = Z)
l’assenza di una significativa nozione di convergenza rende prive di significato tutte
le affermazioni che implicano una nozione di limite.
Sia A;R; α un sistema dinamico C∗ continuo. Alla dinamica α si puo asso-
ciare un un operatore ∂α : A → A, chiamato generatore infinitesimo, che rap-
presenta la “derivata forte” della dinamica. Consideriamo il sottoinsieme D∂ ⊆ A
costituito da tutti gli operatori A tali per cui
limt→0
1
|t| ‖αt(A)− A‖ < +∞.
Se la C∗-algebra possiede un’identita 1 allora 1 ∈ D∂, inoltre dalle seguenti
relazioni
‖αt(A∗)− A∗‖ = ‖αt(A)− A‖
‖αt(aA + bB)− (aA + bB)‖ 6 a‖αt(A)− A‖+ b‖αt(B)−B‖
‖αt(AB)− AB‖ 6 ‖A‖ ‖αt(B)−B‖+ ‖αt(A)− A‖ ‖B‖
segue che il dominio D∂ e chiuso rispetto all’aggiunzione, alle combinazioni lineari
ed al prodotto dei suoi elementi e quindi D∂ e una ∗-sottoalgebra di A che contiene
l’identita. La seguente relazione
∂α(A) ≡ limt→0
αt(A)− A
tse A ∈ D∂ (B.10)
227
risulta ben posta e definisce un operatore ∂α : D∂ ⊆ A → A che gode, come e facile
verificare, delle seguenti proprieta:
∂α(A∗) = ∂α(A)∗
∀ A,B ∈ D∂
∂α(AB) = ∂α(A)B + A∂α(B).
(B.11)
Ogni operatore che gode delle proprieta (B.11) viene chiamato derivazione sim-
metrica . Osserviamo che dalla seconda delle (B.11) (valida per ogni generica
derivazione simmetrica) segue che ∂α(1) = 0 infatti
∂α(1) = ∂α(12) = ∂α(1)1+ 1∂α(1) = 2∂α(1).
L’insieme D∂ e invariante rispetto all’azione degli automorfismi infatti se A ∈ D∂
e se t′ ∈ R allora
‖αt(αt′(A))− αt′(A)‖ = ‖αt′(αt(A)− A)‖ = ‖αt(A)− A‖
da cui segue immediatamente che αt′(A) ∈ D∂. Quindi l’equazione (B.10) si puo
generalizzare scrivendo l’equazione
∂α(αt(A)) =d
dtαt(A) se A ∈ D∂ (B.12)
che si interpreta come l’ equazione del moto che determina l’evoluto αt(A)
dell’osservabile A al generico tempo t.
Si dimostra che il generatore infinitesimo ∂α e un operatore chiuso e densa-
mente definito35.
Rappresentazioni del generatore infinitesimo
Se il generatore infinitesimo ∂α e limitato, e quindi definito ovunque (D∂ = A),
allora si dimostra36 che per ogni rappresentazione π di A esiste un operatore
35Ricordiamo che l’operatore ∂α : D∂ ⊂ A → A e chiudibile se per ogni successione
Ann∈N ⊂ D∂ tale che An → 0 e ∂α(An) → B in norma, segue che B = 0. Invece ∂α e
chiuso se per ogni successione Ann∈N ⊂ D∂ tale che An → A e ∂α(An) → B in norma, segue
che A ∈ D∂ e B = ∂α(A). Inoltre e densamente definito se il dominio D∂ e un sottoinsieme
denso di A. Le proprieta del generatore infinitesimo sono una conseguenza di un risultato piu
generale noto come Teorema di Lumer-Phillips (C.f.r. [BR79] Teorema 3.1.16.) e valido per
generatori di gruppi (o semigruppi) ad un parametro di automorfismi (o contrazioni, ossia oper-
atori che non aumentano la norma) continui rispetto alla σ(A;A∗)-topologia (topologia debole)
su A. Tutti i risultati del Teorema di Lumer-Phillips valgono nei casi di nostro interesse in cui
il gruppo di automorfismi e, per ipotesi, continuo rispetto alla topologia forte di A e quindi, di
conseguenza, anche rispetto alla topologia debole.36C.f.r. [BR79] Corollario 3.2.48.
228
autoaggiunto H = H† ∈ π(A)′′, detto Hmiltoniano, tale che 2‖H‖ 6 ‖∂α‖e
π(∂α(A)) = i[H; π(A)] ∀ A ∈ A.
Una rappresentazione di questo tipo e ancora possibile quando il generatore
infinitesimo non e definito ovunque (ossia non e limitato) ma esiste uno stato
stazionario ω ∈ EA. In questo caso nella rappresentazione G.N.S. indotta da
ω la dinamica α viene implementata da un gruppo unitario fortemente continuo
Uω(T) sullo spazio di rappresentazione Hω. Queste sono le condizioni di validita
del Teorema di Stone37 che assicura l’esistenza di un operatore Hamiltoniano
Hω, autoaggiunto ed in generale non limitato, tale che Uω(t) = eiHωt per ogni
t ∈ R. Come prima cosa osserviamo che per la continuita di πω che implica la
disuguaglianza∥∥∥∥πω
(αt(A)− A
t
)− πω(∂α(A))
∥∥∥∥ 6∥∥∥∥(
αt(A)− A
t
)− ∂α(A)
∥∥∥∥
segue che per ogni A ∈ D∂, uniformemente nella norma di Hω,
πω(∂α(A)) = limt→0
πω
(αt(A)− A
t
)= lim
t→0
eiHωtπω(A)e−iHωt − πω(A)
t.
Se moltiplichiamo l’ultimo membro per il vettore ciclico ψω e ricordiamo che per
l’invarianza Uω(t)ψω = eiHωtψω = ψω per ogni t ∈ R si ottiene che
πω(∂α(A))ψω = limt→0
(eiHωt − 1ω
t
)πω(A)ψω
il che assicura38 che tutti i vettori del tipo πω(A)ψω con A ∈ D∂ appartengono al
dominio di Hω e che πω(∂α(A))ψω = iHω πω(A)ψω.
Sia ϕ = πω(B)ψω un generico elemento del sottospazio πω(D∂)ψω ed osserviamo
che dopo alcuni semplici calcoli
πω(∂α(A))ϕ = limt→0
eiHωtπω(A)e−iHωt − πω(A)
tϕ
= limt→0
(eiHωt − 1ω
t
)πω(A)e−iHωtϕ− iπω(A)Hω ϕ.
Dato che per definizione
πω(A)e−iHωtϕ = πω(A)e−iHωtπω(B)eiHωtψω = π(Aα−t(B))
37C.f.r. [RS72] Teorema VIII.8.38C.f.r. [RS72] Teorema VIII.1.
229
segue che πω(A)e−iHωtϕ ∈ πω(D∂)ψω per ogni t ∈ R e quindi
πω(∂α(A))ϕ = iHωπω(A) limt→0
e−iHωtϕ− iπω(A)Hω ϕ.
L’ultima relazione consente di affermare che nel caso di un sistema dinamico C∗
con uno stato ω stazionario rispetto alla dinamica α nella rappresentazione G.N.S.
associata esiste un operatore Hω autoaggiunto ed in generale non limitato tale che
πω(∂α(A))ϕ = i[Hω; πω(A)]ϕ ∀ ϕ ∈ πω(D∂)ψω. (B.13)
L’equazione del moto di Heisenberg
Sia ω ∈ EA un generico stato sul sistema dinamico A;R; α ed osserviamo che
dalla disuguaglianza∣∣∣∣ω
(αt(A)− A
t
)− ω(∂α(A))
∣∣∣∣ 6∥∥∥∥(
αt(A)− A
t
)− ∂α(A)
∥∥∥∥
segue che
ω(∂α(A)) = limt→0
ω
(αt(A)− A
t
)= lim
t→0
ω(αt(A))− ω(A)
t
dove la convergenza e da intendersi rispetto al valore assoluto. Generalizzando
questa equazione si ottiene che
ω(∂α(αt(A))) =d
dtω(αt(A)) se A ∈ D∂ (B.14)
che si interpreta come l’ equazione del moto che determina l’evoluto ω(αt(A))
del valore assunto dallo stato sull’osservabile A al generico tempo t. Quindi l’e-
quazione differenziale (B.14) determina l’evoluto α∗t (ω) dello stato ω rispetto alla
dinamica aggiunta sulla ∗-sottoalgebra D∂ ed estendendo il risultato per continuita
(essendo D∂ denso) determina l’azione di α∗t (ω) su tutto A. Nella rappresentazione
G.N.S indotta da ω la (B.14) diviene
(ψω; πω(∂α(αt(A)))ψω) =d
dt(ψω; πω(αt(A))ψω)
e se lo stato ω e stazionario, utilizzando la relazione (B.13), si ottiene che
(ψω; i[Hω; πω(αt(A))]ψω) =d
dt(ψω; πω(αt(A))ψω).
Se si pone At ≡ πω(αt(A)) ∈ πω(A) la precedente equazione si legge come il valore
di aspettazione sul vettore ciclico ψω dell’ equazione del moto di Heisenberg
d
dtAt = i[Hω; At]
230
propria della formulazione ordinaria della Meccanica Quantistica.
L’equazione differenziale (B.14) consente una caratterizzazione degli stati sta-
zionari tramite il generatore infinitesimo della dinamica, infatti segue che
ω ∈ EA e stazionario ⇔ ω(∂α(A)) = 0 ∀ A ∈ D∂.
B.2 Sviluppo del formalismo
B.2.1 Algebre di von Neumann (W ∗-algebre)
Ogni C∗-algebra si puo rappresentare come un’algebra di operatori limitati su uno
spazio di Hilbert H. In generale vi sono diversi metodi inequivalenti di rappresen-
tazione ma in ogni fissata rappresentazione l’algebra ottenuta deve essere chiusa
nella topologia uniforme degli operatori. Una analisi dettagliata della struttura
ottenuta tramite rappresentazione richiede lo studio dell’azione dell’algebra sui
vettori e sui sottospazi dello spazio di rappresentazione H. In questa analisi di-
viene interessante poter considerare anche operatori che approssimano gli elementi
rappresentativi della C∗-algebra su sottospazi di dimensione finita. Queste con-
siderazioni motivano la necessita di completare l’algebra operatoriale ottenuta via
rappresentazione in qualche topologia che sia globalmente piu debole di quella
uniforme ma che sia equivalente sui sottospazi finiti. Esiste una grande varieta di
queste topologie che tuttavia producono lo stesso “ampiamento” della C∗-algebra
operatoriale. L’algebra allargata cosı ottenuta e detta algebra di von Neumann
o W ∗-algebra .
Topologie su L (H)
Sia H uno spazio di Hilbert e L (H) l’insieme degli operatori lineari e limitati.
L’insieme L (H) e un’algebra di Banach rispetto alla topologia uniforme indot-
ta dalla norma operatoriale ‖ ‖. La topologia uniforme e localmente convessa in
quanto e generata dagli intorni sferici che sono sottoinsiemi convessi. Su L (H)
si possono definire topologie localmente convesse piu deboli di quella uniforme.
Introdurremo le diverse nozioni topologiche definendo le proprieta di convergenza
e non esibendo la famiglia degli aperti39. Entrambe le procedure sono equivalenti
39In maniera astratta le diverse topologie su L (H) vengono introdotte definendo delle famiglie
di seminorme con le quali si costruiscono le basi di intorni. Questo approccio generale e
presentato in [BR79] Paragrafo 2.4.1.
231
in quanto la conoscenza di tutte le successioni convergenti permette di costruire
le chiusure degli insiemi e quindi di definire gli insiemi chiusi come quegli insie-
mi che coincidono con la propria chiusura. La conoscenza di tutti i chiusi per
complementazione determina la conoscenza di tutti gli aperti.
Topologia forte: La successione di operatori Ann∈N ⊂ L (H) converge nella
topologia forte all’operatore A ∈ L (H) se
Ans−→ A ⇔ lim
n→+∞‖(An − A)ψ‖ = 0 ∀ ψ ∈ H.
Topologia σ-forte: La successione di operatori Ann∈N ⊂ L (H) converge nella
topologia σ-forte all’operatore A ∈ L (H) se
Anσ−s−→ A ⇔ lim
n→+∞
(+∞∑j=1
‖(An − A)ψj‖)
= 0 ∀ ψjj∈N ⊂ H,
avendo indicato con ψjj∈N una generica successione di H a norma `2, ossia∑+∞j=1 ‖ψj‖2 < +∞.
Topologia debole: La successione di operatori Ann∈N ⊂ L (H) converge nella
topologia debole all’operatore A ∈ L (H) se
Anw−→ A ⇔ lim
n→+∞|(ϕ; (An − A)ψ)| = 0 ∀ ϕ, ψ ∈ H.
Topologia σ-debole: La successione di operatori Ann∈N ⊂ L (H) converge
nella topologia σ-debole all’operatore A ∈ L (H) se
Anσ−w−→ A ⇔ lim
n→+∞
(+∞∑j=1
|(ϕj; (An − A)ψj)|)
= 0
per ogni coppia di successioni ϕjj∈N, ψjj∈N ⊂ H a norma `2.
Nella definizione della convergenza debole e σ-debole, utilizzando la formula di
polarizzazione40 si puo sostituire il prodotto scalare misto (ϕ; (An−A)ψ) con il
valore di aspettazione (ψ; (An − A)ψ).
40Si chiama formula di polarizzazione l’identita
(ϕ; Aψ) =3∑
n=0
14i
(ϕ + inψ; A(ϕ + inψ)).
Essa si prova tramite un conto diretto.
232
La relazione completa delle inclusioni tra le diverse nozioni topologiche e espres-
sa dal seguente schema:
topologia uniforme ⇒ topologia σ − forte ⇒ topologia σ − debole
⇓ ⇓topologia forte ⇒ topologia debole
e nel caso dim(H) = +∞ le implicazioni ⇒ risultano verificate strettamente nel
senso che e sempre possibile trovare successioni convergenti secondo la topologia
piu debole e non secondo quella piu forte.
Infine osserviamo che tutte le topologie introdotte rendono continue le ope-
razioni lineari di somma e di prodotto per uno scalare compatibilmente con la
struttura di spazio vettoriale di L (H).
Commutanti ed algebre di von Neumann
Sia M ⊆ L (H) una collezione di operatori limitati sullo spazio di Hilbert H. Il
commutante di M, che si indica con M′, e il sottoinsieme di L (H) costituito
da tutti gli operatori che commutano con ogni elemento di M. Evidentemente
M′ e chiuso rispetto alle combinazioni lineari ed al prodotto di operatori e 1 ∈M′. Inoltre l’insieme M′ e anche uniformemente chiuso in quanto l’operazione di
commutazione tra operatori e continua in norma. Tutto cio prova che M′ e una
sottoalgebra di Banach con unita contenuta L (H). Se la collezione di partenza M
e autoaggiunta allora anche M′ e autoaggiunto e quindi risulta una C∗-sottoalgebra
di L (H). In modo ricorsivo si possono costruire i commutanti di ordine superiore
M ⊆ M′′ = M(iv) = M(vi) . . .
M′ = M′′′ = M(v) = M(vii) . . . .
Il commutante di ordine 2 M′′ e detto bicomutante . Si chiama algebra di
von Neumann o anche W ∗-algebra sullo spazio di HilbertH una ∗-sottoalgebra
di M ⊆ L (H) tale che M′′ = M. In generale, conformemente alla teoria in
uso, supporremo sempre di dichiarare algebre di osservabili M che contengono
l’identita 1. Cio non rappresenta una perdita di generalita infatti l’assenza di 1
introduce solamente complicazioni tecniche dovute all’immersione in algebre piu
grandi contenenti l’identita. Un sottoinsieme M ⊆ L (H) si dice non degenere
se MH = H. Evidentemente se 1 ∈ M allora la famiglia M e certamente non
degenere su H.
233
I risultati strutturali nella teoria delle algebre di von Neumann sono i seguenti:
B.2.1 Teorema (del bicommutante41). Sia M una ∗-sottoalgebra non de-
genere di operatori limitati sullo spazio di Hilbert H. Le seguenti condizioni sono
equivalenti:
i) M = M′′;
ii) M e chiuso rispetto alla topologia σ-forte;
iii) M e chiuso rispetto alla topologia forte;
iv) M e chiuso rispetto alla topologia σ-debole;
v) M e chiuso rispetto alla topologia debole.
B.2.2 Teorema (di densita di von Neumann42). Sia M una ast-sottoalgebra
non degenere di operatori limitati sullo spazio di Hilbert H. L’insieme M e denso
in M′′ in qualunque delle topologie forte, σ-forte, debole, σ-debole. In particolare
M′′ si ottiene come chiusura di M in una delle suddette (equivalenti) topologie.
Tecnicamente diremo che M′′ e la chiusura von Neumann di M.
In base a questi risultati possiamo definire algebra di von Neumann o W ∗-
algebra su H ogni ∗-sottoalgebra di L (H) che contiene l’identita e che e chiusa
rispetto ad una delle (equivalenti topologie) forte, σ-forte, debole o σ-debole. Segue
subito che ogni W ∗-algebra e anche una C∗-algebra in quanto la chiusura rispetto
ai limiti forti assicura anche la chiusura rispetto ai limiti in norma operatoriale.
Sia A un elemento autoaggiunto di un’algebra di von Neumann M sullo spazio
di Hilbert H. Se un qualunque operatore commuta con A allora questo operatore
commuta anche con tutti i proiettori spettrali di A. In questo senso M = M′′
contiene i proiettori spettrali di tutti i suoi elementi. Dato che ogni operatore
autoaggiunto A puo essere approssimato in norma con combinazioni lineari dei
suoi proiettori e poiche ogni generico elemento si decompone sempre come somma
di due operatori autoaggiunti (decomposizione B.1) segue che l’intera algebra M
e generata per chiusura in norma operatoriale del sottoinsieme dei proiettori orto-
gonali di tutti gli elementi di M. Questo fatto mostra in che senso le C∗-algebre
sono diverse dalle W ∗-algebre. Mentre le prime, in generale, possono non contenere
41C.f.r. [BR79] Teorema 2.4.11.42C.f.r. [BR79] Corollario 2.4.15.
234
proiettori ortogonali oltre quelli banali 0 e 1 le seconde ne contengono cosı tanti
da esserne addirittura generate.
Se M e un’algebra di von Neumann si chiama centro di M e si indica con
Z(M) il sottoinsieme
Z(M) ≡ M′′ ∩M′ = M ∩M′.
Osservando che Z(M)′′ = M′′ ∩ M′′′′ = M ∩ M′ = Z(M) segue che il centro e
un’algebra di von Neumann che per costruzione e anche commutativa. L’algebra
di von Neumann M e detta fattore se il suo centro e banale, ossia se contiene
solamente i multipli dell’identita, Z(M) = C1.Se H e uno spazio di Hilbert l’intera collezione L (H), costituita da tutti gli
operatori limitati, e un’algebra di von Neumann in quanto e chiusa, ad esempio,
sotto limiti forti. Inoltre L (H) e anche un fattore in quanto L (H)′ = C1.Inoltre tutte e sole le algebre di von Neumann irriducibili sono del tipo M = L (H),
infatti, come conseguenza del Lemma di Schur (Paragrafo B.1.9) segue che
irriducibilita di M ⇔ M′ = 1C ⇔ M = M′′ = L (H).
Rappresentazione G.N.S., chiusura von Neumann e stati fattoriali
Sia A una C∗-algebra astratta, ω ∈ EA uno stato e Hω, πω, ψω la relativa rappre-
sentazione G.N.S. La rappresentazione “concreta” πω(A) e una C∗-sottoalgebra
di L (Hω) non degenere in quanto contiene l’identita 1ω (su Hω). L’insieme
Mω(A) ≡ πω(A)′′, che corrisponde alla chiusura von Neumann (forte, debole, σ-
forte, σ-debole) di πω(A), si chiama algebra di von Neumann generata . Essa
si interpreta come l’“algebra delle osservabili del sistema nello stato ω” (ovvia-
mente si sottintende che le osservabili sono gli operatori autoaggiunti contenuti
nell’algebra). In Mω(A), per costruzione, sono contenuti tutti i proiettori spettrali
delle osservabili del sistema (relativamente allo stato ω) i quali si interpretano
come gli apparati di misura a risposta bonaria “si/no”.
Con il simbolo Zω(A) si indica il centro dell’algebra di von Neumann Mω(A)
generata nella rappresentazione G.N.S. della C∗-algebra A relativamente allo stato
ω, ossia
Zω(A) ≡ πω(A)′′ ∩ πω(A)′′′ = πω(A)′′ ∩ πω(A)′.
Diremo che lo stato ω ∈ EA e fattoriale o primario se l’algebra di von Neumann
generata Mω(A) e un centro, ossia se πω(A)′′ ∩ πω(A)′ = C1ω. Indicheremo con
il simbolo EfA l’insieme di tutti gli stati fattoriali su A. Se ω e uno stato fattoriale
cio significa che le sole quantita osservabili descritte da elementi di πω(A)′ sono i
235
multipli dell’identita. In questo senso la fattorialita “fissa le osservabili classiche”
della teoria come le sole osservabili banali.
Chiusura von Neumann di una somma diretta di rappresentazioni
Sia Hα, παα una collezione di rappresentazioni della C∗-algebra A indicizzata da
α ∈ I ed indichiamo con H, π la somma diretta delle rappresentazioni
essendo H ≡ ⊕α∈I Hα e π ≡ ⊕
α∈I πα. La collezione π(A) ⊆ L (H) e una C∗-
sottoalgebra concreta di operatori limitati sullo spazio di Hilbert H non degenere
in quanto contiene l’identita. La chiusura von Neumann (forte, debole, σ-forte,
σ-debole) di πω(A) definisce in L (H) l’algebra di von Neumann generata M(A) =
π(A)′′.
Consideriamo la famiglia di operatori limitati B ≡ ⊕α∈I πα(A) ⊂ L (H) co-
stituito da tutti gli operatori fattorizzati del tipo A ≡ ⊕α∈I πα(A(α)), essendo
A(α)α∈I una collezione di elementi di A non necessariamente distinti. L’in-
sieme B e chiuso rispetto alle operazioni algebriche ed all’aggiunzione e contiene
l’identita. Inoltre dalla disuguaglianza valida per ogni α ∈ I
‖πα(A(α))‖Hα 6 supα∈I
‖πα(A(α))‖Hα
= ‖A‖
segue che se la successione Ann∈N ⊂ B converge all’operatore A allora su ogni
sottospazio α-esimo la successione delle componenti πα(A(α)n )n∈N deve convergere
rispetto alla relativa norma operatoriale ‖ ‖Hα . Poiche i sottospazi πα(A) sono
chiusi nelle rispettive norme operatoriali segue che A ∈ B e quindi B e chiuso in
norma. Da cio segue che B e una C∗-sottoalgebra di L (H). Gli elementi della
rappresentazione π(A) sono operatori del tipo π(A) ≡ ⊕α∈I πα(A) ossia sono i
particolari elementi di B per cui A(α) = A per ogni α e quindi
π(A) ⊂⊕α∈I
πα(A) ≡ B. (B.15)
Per come definita la norma (B.2) segue che per ogni ϕ = ϕα ∈ H
‖ϕα‖2Hα
6 ‖ϕ‖2 ≡∑
α
‖ϕα‖2Hα
6 limF→∞
|F|(
supωα∈S
‖ϕα‖2Hα)
(B.16)
essendo |F| la cardinalita del sottoinsieme finito di indici F ⊂ I. Da questa
disuguaglianza segue che la successione ϕnn∈N ⊂ H converge in norma a ϕ ∈ Hse e solo se tutte le successioni delle componenti (ϕα)nn∈N ⊂ Hα convergono in
norma nei relativi sottospazi a ϕα ∈ Hα. Questa osservazione e utile per descrivere
236
la chiusura forte dell’insieme B. Sia Ann∈N una successione di elementi di B che
converge fortemente a B ∈ L (HE). Controlliamo che la condizione ‖(An−B)ϕ‖ →0 per ogni ϕ ∈ H implica che l’operatore B e fattorizzato sui sottospazi, ossia
che non mescola vettori appartenenti a sottospazi differenti. A questo proposito
osserviamo che
‖(An − B)ϕ‖2 =∑
α
‖Pα(An − B)ϕ‖2Hα
> ‖Pγ(An − B)ϕ‖2Hγ
= ‖Pγ(An − B)ϕ‖2
essendo Pγ il generico proiettore sul sottospazio Hα. Se ‖(An− B)ϕ‖ → 0 per ogni
ϕ ∈ H allora anche ‖Pγ(An − B)ϕ‖ → 0 per ogni ϕ ∈ H ed in particolare si avra
convergenza anche per tutti i vettori appartenenti ad un generico sottospazio Hβ,
ossia
‖Pγ(An − B)Pβϕ‖ = ‖(PγAnPβ − PγBPβ)ϕ‖ → 0 ∀ ϕ ∈ H.
Osservando che per costruzione PγAnPβ = Pγπβ(A(β)n ) = 0 se γ 6= β segue che
PγBPβ = 0 se γ 6= β e quindi l’operatore B, ottenuto come limite forte della
successione di operatori fattorizzati An e ancora un operatore fattorizzato della
forma B ≡ ⊕α∈I B(α) con B(α) ≡ PαBPα. A questo punto la condizione di
convergenza si esprime come
‖(An − B)ϕ‖2 =∑
α
‖(πα(A(α)n )−B(α))ϕα‖2
Hα→ 0 ∀ ϕ ∈ H
da cui ‖(πα(A(α)n )− B(α))ϕα‖Hα
→ 0 per ogni ϕα ∈ Hα in virtu della (B.16). Cio
implica la convergenza forte delle successioni componenti e pertanto le proiezioni
B(α) dell’operatore B sono limiti forti di successioni di operatori appartenenti a
πα(A). Con le solite notazioni cio si esprime scrivendo B(α) ∈ Mα(A) = πα(A)′′.
Dato che B e un limite forte di operatori appartenenti a B ossia B ∈ M(B) = B′′
segue che M(B) ⊆ ⊕α∈I Mα(A).
Si puo provare anche l’inclusione opposta. Su ogni sottospazio Hα si consi-
deri un operatore B(α) ∈ Mα(A) ottenuto come limite forte della successione di
operatori πα(A(α)n )n∈N ⊂ πα(A). Definiamo gli operatori fattorizzati
An ≡⊕α∈I
πα(A(α)n ) ∈ B, B ≡
⊕α∈I
B(α) ∈⊕α∈I
Mα(A).
La convergenza forte delle successioni ‖(πα(A(α)n )−B(α))ϕα‖Hα
→ 0 per ogni ϕα ∈Hα implica per la relazione (B.16) la convergenza forte di ‖(An − B)ϕ‖ → 0 per
237
ogni ϕ ∈ H e quindi implica che B ∈ M(B), ossia M(B) ⊇ ⊕α∈I Mα(A). La
doppia inclusione dimostra l’uguaglianza
M(B) =⊕α∈I
Mα(A) (B.17)
che, usando una notazione piu esplicita, si riscrive anche come(⊕
α∈Iπα(A)
)′′
=⊕α∈I
πα(A)′′. (B.18)
Poiche π(A) ⊆ B ⊆ L (H) segue anche che π(A)′′ ⊆ B′′ ⊆ L (H) e quindi
π(A)′′ ⊆⊕α∈I
πα(A)′′
o piu sinteticamente
M(A) ⊆⊕α∈I
Mα(A). (B.19)
Il risultato (B.19) afferma che la chiusura von Neumann della C∗-algebra operato-
riale π(A) ottenuta nella somma diretta di rappresentazioni H, π e contenuta nel-
la somma diretta delle chiusure von Neumann delle singole C∗-algebre operatoriali
πα(A) ottenute nelle singole rappresentazioni Hα, παα.
Sia Z(B) il centro dell’algebra di von Neumann generata da B, ossia
Z(B) = B′′ ∩B′ =
(⊕α∈I
πα(A)
)′′
∩(⊕
α∈Iπα(A)
)′
che utilizzando la (B.18) si riscrive anche
Z(B) =
(⊕α∈I
πα(A)′′)∩
(⊕α∈I
πα(A)
)′
.
Poiche tutti gli operatori⊕
α∈I πα(A)′′ sono fattorizzati segue che gli unici o-
peratori di(⊕
α∈I πα(A))′
che daranno contributo al centro sono quelli di tipo
fattorizzato, ossia gli operatori appartenenti a⊕
α∈I πα(A)′, per cui
Z(B) =
(⊕α∈I
πα(A)′′)∩
(⊕α∈I
πα(A)′)
=⊕α∈I
πα(A)′′ ∩ πα(A)′
ossia
Z
(⊕α∈I
πα(A)
)=
⊕α∈I
Zα(A). (B.20)
Quindi il centro relativo alla C∗-sottoalgebra B coincide con la somma diretta dei
centri relativi alle C∗-algebre operatoriali πα(A) ottenute nelle singole rappresen-
tazioni Hα, παα.
238
Caratterizzazione astratta delle algebre di von Neumann
Sia M un’algebra di von Neumann su uno spazio di HilbertH. Si chiama preduale
di M, e si indica con M∗, l’insieme dei funzionali lineari φ : M → C continui
rispetto alla topologia σ-debole definita su M. Si dimostra43 che M∗ e uno spazio di
Banach rispetto alla norma del “sup” definita su M∗ ed inoltre il termine preduale
e giustificato dal fatto che rispetto alla relazione di dualita
M×M∗ 3 (A, φ) −→ φ(A) ∈ C
M e il duale di M∗.Un esempio tipico ed importante si ottiene considerando l’algebra di von Neumann L (H)
costituita da tutti gli operatori limitati sullo spazio di Hilbert H. Il preduale di L (H)∗ di L (H)
e canonicamente identificato con l’insieme T (H) degli operatori di classe traccia su H, ossia
degli operatori T ∈ L (H) tali che TrH(|T |) ≡ ‖T‖1 < +∞ con |T | valore assoluto dell’operatore
T . Si dimostra44 che l’insieme T (H) e un ideale di L (H), ossia se T ∈ T (H) allora anche AT e
TA in T (H) per ogni A ∈ L (H). Inoltre T (H) risulta anche uno spazio di Banach autoaggiunto
(ma non un’algebra) rispetto alla norma ‖ ‖1. Poiche T (H) e uno spazio di Banach e definito il
suo duale T (H)∗ il quale risulta isometricamente isomorfo45 a L (H) secondo la mappa
L (H) 3 A → φA ∈ T (H)∗
definita da φA(T ) ≡ TrH(AT ) per ogni T ∈ T (H). Invertendo il rapporto di dualita ogni
operatore T ∈ T (H) definisce un funzionale lineare φT su L (H) secondo la relazione φT (A) ≡TrH(TA) per ogni A ∈ L (H). Inoltre questi elementi risultano continui rispetto alla topologia
σ-debole su L (H) per cui resta definita l’identificazione L (H)∗ ¿ T (H).
Ogni W ∗-algebra concreta di operatori su uno spazio di Hilbert e sempre il
duale di uno spazio di Banach e questa proprieta e il punto di partenza per una
“caratterizzazione astratta” delle algebre di von Neumann. Per “caratterizzazione
astratta” si intende la possibilita di reinterpretare le algebre di von Neumann
come particolari C∗-algebre astratte senza la necessita di dover adottare il punto
di vista “concreto” che le vede emergere come chiusura von Neumann di C∗-algebre
operatoriali πω(A) sullo spazio di rappresentazione Hω ottenuto a partire da un
qualche stato ω. Questa possibilita si fonda sul seguente risultato:
B.2.3 Teorema (di Sakai46). Una C∗-algebra A e ∗-isomorfa ad una W ∗-algebra
concreta di operatori su un opportuno spazio di Hilbert se e solo se A e il duale di
uno spazio di Banach.
43C.f.r. [BR79] Proposizione 2.4.18.44C.f.r. [RS72] Teorema VI.19 e VI.20.45C.f.r. [RS72] Teorema VI.26.46C.f.r. [Sak71] Teorema 1.16.7.
239
Quindi una W ∗-algebra astratta47 e per definizione una C∗-algebra che e
duale di uno spazio di Banach. In generale spazi di Banach distinti (e non isomorfi)
possono avere come duale il medesimo spazio di Banach. Tuttavia se lo spazio di
Banach in considerazione e in particolare una C∗-algebra allora il suo preduale
e effettivamente unico. In altre parole il preduale M∗ di una W ∗-algebra M e
univocamente fissato dalla struttura C∗ posseduta da M. Questo risultato e noto
come Teorema di unicita del preduale48.
Tuttavia e doveroso osservare che ai fini dell’interpretazione fisica del forma-
lismo assumere inizialmente per le osservabili del sistema una struttura di W ∗-
algebra astratta (anziche semplicemente di C∗-algebra astratta) significa in un
certo senso assumere una struttura “eccessivamente ricca”. Ad un primo livello
di formalismo ha senso limitarsi a considerare unicamente le W ∗-algebre concrete
ottenute via rappresentazione G.N.S. come Mω(A) = πω(A)′′. In termini operato-
riali questo atteggiamento significa: 1) dichiarare come algebra delle osservabili del
sistema, nel particolare stato ω, una certa algebra Mω di operatori limitati su uno
spazio di Hilbert Hω, autoaggiunta e chiusa fortemente; 2) dichiarare un vettore
ψω ∈ Hω, ciclico per Mω, tale per cui (ψω; Mψω) esprime il valore di aspettazione
dell’osservabile M ∈ Mω nello stato ω in cui si trova il sistema.
Un caso interessante, che mette in luce le complicazioni che vengono introdotte
da una formulazione astratta delle W ∗-algebre, e quello commutativo. Un’algebra
di von Neumann commutativa M dichiarata in astratto (ossia senza riferimento
ad un particolare spazio di Hilbert su cui si realizza come algebra operatoriale), in
quanto in particolare e anche una C∗-algebra, e ∗-isomorfa (isomorfismo di Gel’-
fand) ad una certa algebra C(X ) di funzioni continue su uno spazio di Hausdorff
compatto X (assumiamo 1 ∈ M). Lo spazio X e l’insieme degli stati puri su M (lo
spettro di M) dotato della topologia ∗-debole indotta sull duale M∗. Riguardando
le algebre di von Neumann astratte come delle opportune algebre C(X ) si pone
immediatamente il problema dell’eccessiva ricchezza di proprieta dello spazio Xche e in un certo senso uno spazio“misterioso” e di difficile controllo. La grande ric-
chezza di proprieta e la difficolta nella caratterizzazione di X sono sostanzialmente
conseguenze del fatto che l’isomorfismo di Gel’fand che associa a M l’algebra C(X )
47In alcuni autori la terminologia W ∗-algebra e riservata alla struttura astratta definita da
una C∗-algebra duale di uno spazio di Banach mentre si utilizza la terminologia algebra di von
Neumann per indicarne le realizzazioni concrete come algebre operatoriali. In questo lavoro
non si tiene conto di una tale distinzione e si utilizzano le due dizioni in maniera equivalente ed
interscambiabile.48C.f.r. [Sak71] Teorema 1.13.3.
240
utilizza sostanzialmente solamente la struttura C∗ di M mentre l’essere chiusa in
senso forte (o equivalentemente l’essere il duale di qualche spazio di Banach) impli-
ca unicamente le proprieta aggiuntive per X . Viceversa con l’approccio “concreto”
si puo assumere che M = Mω(A) = πω(A)′′ con A una C∗-algebra astratta e com-
mutativa. Tramite l’isomorfismo di Gel’fand si ottiene che A e realizzata come
algebra di funzioni continue C(X ) con X = σ(πω(A)) caratterizzato come spet-
tro della C∗-algebra concreta πω(A) e quindi tutt’altro che misterioso. A questo
punto l’algebra di von Neumann M, in quanto chiusura forte della C∗-algebra, e
rappresentata da L∞(X ).
Per una descrizione ampia e tecnicamente esauriente delle W ∗-algebre astratte
e della loro classificazione sistematica si rimanda al testo di Sakai [Sak71] o al testo
di Takesaki [Tak79].
B.2.2 Stati su una W ∗-algebra
Da una prospettiva “astratta” la nozione di stato su una W ∗-algebra M e la stessa
di quella introdotta per le C∗-algebre (di cui le algebre di von Neumann costitui-
scono casi particolari). Gli stati su M sono i funzionali lineari positivi e normaliz-
zati, ossia il sottoinsieme EM contenuto nel duale M∗ di M. La caratterizzazione
“in astratto” degli stati di un’algebra di von Neumann, ossia lo studio algebrico
e topologico dell’insieme EM quando M e una C∗-algebra duale di uno spazio di
Banach, porta ad un quadro estremamente ricco difficilmente controllabile. Una
tale problematica e affrontata in modo esauriente in [Sak71] o in [Tak79]. Nel
proseguo di questo studio adotteremo, invece, il punto di vista “concreto”.
Estensione dello stato di rappresentazione ω
Sia A una C∗-algebra, ω ∈ EA uno stato su A, πω(A) la C∗-algebra concreta
di operatori sullo spazio di Hilbert Hω ottenuta via rappresentazione G.N.S. e
Mω(A) = πω(A)′′ l’algebra di von Neumann generata da A su Hω. In questo
approccio il primo stato che viene naturale considerare su Mω(A) e l’estensione
ω ottenuta per continuita debole a partire dallo stato ω. Questo stato deve agire
su πω(A) alla stessa maniera di ω, ossia ω(πω(A)) = ω(A) per ogni A ∈ A. Per
costruzione l’insieme πω(A) e debolmente denso in Mω(A) e quindi ogni operatore
M ∈ Mω(A) e limite debole di una qualche successione di operatori πω(An)n∈N ⊂πω(A). La successione numerica ω(πω(An)) = ω(An)n∈N e convergente in quanto
241
di Cauchy, infatti se m,n → +∞ allora
|ω(πω(An))− ω(πω(Am))| = |ω(An − Am)| = |(ψω; πω(An − Am)ψω)| → 0
poiche la successione πω(An)n∈N converge debolmente. Per completezza e ne-
cessario verificare anche che il limite e indipendente dalla particolare successione di
operatori scelta per approssimare debolmente l’operatore M . Siano πω(An)n∈N
e πω(Bn)n∈N due successioni di operatori di πω(A) convergenti debolmente a
M ∈ Mω(A). Se m,n → +∞
|ω(πω(An))− ω(πω(Bm))| = |(ψω; πω(An −Bm)ψω)|
= |(ψω; [πω(An)−M + M − (Bm)]ψω)|
6 |(ψω; (πω(An)−M)ψω)|+ |(ψω; (M − (Bm))ψω)| → 0
il che dimostra che le due successioni hanno lo stesso limite. Quindi cio prova che
ω(M) = limn→+∞ ω(πω(An)) per una qualche successione πω(An)n∈N converge
debolmente a M , ovvero
ω(M) ≡ (ψω; Mψω) ∀ M ∈ Mω(A). (B.21)
Stati vettoriali e stati normali
In analogia a come e stato costruito lo stato ω si individuano in modo naturale
due classi di stati sull’algebra di von Neumann Mω(A).
Stati vettoriali: Sono gli stati che, come ω, si esprimono in forma vettoriale,
%(M) ≡ (ψ; Mψ) per ogni M ∈ Mω(A) essendo ψ ∈ Hω un vettore normal-
izzato ‖ψ‖ = 1. Questi stati si ottengono per estensione debolmente continua
di stati che sulla C∗-algebra πω(A) agiscono nella forma (ψ; πω(A)ψ) ≡ %(A)
per ogni A ∈ A. Per la ciclicita di ψω si puo sempre fare l’approssimazione
ψ = πω(B)ψω per un’opportuno B ∈ A e quindi gli stati vettoriali su Mω(A)
si identificano con le estensioni debolmente continue di stati che sulla C∗-
algebra πω(A) agiscono nella forma %(πω(A)) = (πω(B)ψω; πω(A)πω(B)ψω) =
ω(B∗AB).
Stati normali: Sono tutti gli stati su Mω(A) che sono σ-debolmente continui,
ossia % e uno stato normale su Mω(A) se e solo se % e uno stato e se
242
limn→+∞ %(Mn) = %(M) per ogni successione Mnn∈N ⊂ Mω(A) che con-
verge nella topologia σ-debole al suo limite M . L’insieme degli stati normali
e individuato da EMω∩Mω(A)∗. Inoltre dato che la continuita debole implica
la continuita σ-debole segue che anche gli stati vettoriali sono in particolare
stati normali. Si dimostra49 che tutti e soli gli stati normali su Mω(A) sono
gli stati della forma
%ρ ≡ TrHω(ρM) ∀ M ∈ Mω(A)
essendo ρ una matrice densita suHω, ossia un operatore limitato, positivo,
classe traccia con TrHω(ρ) = 1.
Anche gli stati vettoriali si possono esprimere in termini di una matrice densita.
Sia %ψ lo stato vettoriale associato al vettore ψ ∈ Hω e Pψ il proiettore ortogonale
unidimensionale sul sottospazio generato da ψ, allora
%ψ(M) = (ψ; Mψ) = (Pψψ; MPψψ) = (ψ; PψMPψψ) = TrHω(PψMPψ)
= TrHω(Pψ2M) = TrHω(PψM) = TrHω(Pψ
2M) = %Pψ
(M)
ossia lo stato vettoriale %ψ coincide con lo stato definito dalla matrice densita
ρ ≡ Pψ.
Gli stati vettoriali della forma %ψ(πω(A)) = (ψ; πω(A)ψ) ≡ %(A) definiscono
degli stati sulla C∗-algebra di partenza A che vengono detti stati vettoriali nel-
la rappresentazione di ω. L’insieme di questi stati e un sottoinsieme chiuso
di EA rispetto alla norma dei funzionali. Anche gli stati normali della forma
%ρ(πω(A)) = TrHω(ρπω(A)) ≡ %(A) definiscono degli stati sulla C∗-algebra A. l’in-
sieme di tutti questi stati (che contiene ovviamente anche gli stati vettoriali) costi-
tuisce il folium degli stati nella rappresentazione di ω. Ogni stato ω ∈ Eω,
e quindi ogni rappresentazione G.N.N. Hω, πω, ψω, individua il proprio folium di
stati. Ogni folium relativo ad una data rappresentazione e un sottoinsieme chiuso
di EA rispetto alla norma dei funzionali.
49C.f.r. [BR79] Teorema 2.4.21.
243
Densita degli stati normali
In generale gli stati normali non esauriscono l’insieme di tutti i possibili stati50 EM
sulla W ∗-algebra operatoriale M. Tuttavia se H, π e una rappresentazione fedele
di una C∗-algebra A allora il Teorema di Fell 51 afferma che il folium di stati
relativo alla data rappresentazione (tutti gli stati normali nella rappresentazione
data) e un sottoinsieme denso in EA rispetto alla topologia ∗-debole. In altri
termini ogni stato % ∈ EA e approssimabile da uno stato normale %ρ (definito da
%ρ(A) = TrH(ρπ(A))) nel senso che per ogni ε > 0 esiste una matrice densita ρ su
H tale che
|%(A)− TrH(ρπ(A))| < ε ∀ A ∈ A.
Questo risultato si riutilizza in modo fruttuoso se applicato ad un’algebra o-
peratoriale di von Neumann M su uno spazio di HilbertH, intesa come C∗-algebra.
In questo caso la rappresentazione identica Id : M → M e certamente fedele e gli
stati del suo folium sono tutti gli stati normali su M ovvero tutti gli stati della
forma %ρ(M) = TrH(ρM) per ogni M ∈ M. In questo caso la “versione von
Neumann” del Teorema di Fell afferma che l’insieme di tutti gli stati normali
su M e ∗-debolmente denso nell’insieme di tutti gli stati EM su M. In altri
termini ogni stato su un’algebra di von Neumann operatoriale si puo approssimare
arbitrariamente bene (∗-debolmente) con uno stato normale, ossia con uno stato
σ-debolmente continuo.
Stati normali e formulazione ordinaria della Meccanica Quantistica
Gli stati vettoriali e piu in generale gli stati normali definiscono in una data rap-
presentazione l’azione di uno su una C∗-algebra di partenza. Tuttavia e opportuno
notare che lo stato di partenza non definisce univocamente ne il vettore, se lo stato
e vettoriale, ne tanto meno la matrice densita, se lo stato e normale. Ad esempio
condizione sufficiente affinche (ψ; Mψ) = (ψ′; Mψ′) per ogni M appartenente al-
l’algebra di von Neumann M e che ψ′ = Uψ per un qualunque operatore unitario
U appartenente al commutante M′. Evidentemente e incluso anche il caso in cui
i due vettori differiscono per una fase U = eia1 con a ∈ R. Analogamente con-
50Un caso particolare in cui tutti gli stati sono anche stati normali e quello dell’algebra (di von
Neumann) delle matrici n × n a valori complessi Mn(C). In questo caso ogni stato si esprime
tramite una matrice densita n× n.51C.f.r. [Fel60].
244
dizione sufficiente affinche TrH(ρM) = TrH(ρ′M) e che ρ′ = UρU † per un generico
operatore unitario appartenente a M′.
Questa ambiguita nella prescrizione del “vettore rappresentativo” o della “ma-
trice densita rappresentativa” di uno stato normale rende prioritaria la dichiarazio-
ne dello stato ω che agisce sull’algebra M lasciando arbitraria la scelta del vettore
ψ ∈ H o della matrice densita ρ ∈ L (H).
Nella formulazione standard della Meccanica Quantistica questa ambiguita non
esiste dato che in questa formulazione l’algebra delle osservabili coincide con l’in-
tera algebra di von Neumann M ≡ L (H) per un’opportuno spazio di Hilbert H.
In questo caso M′ = C1 e quindi gli unici operatori unitari di M′ sono le fasi.
Pertanto le matrici densita rappresentative degli stati normali risultano univoca-
mente definite mentre i vettori rappresentativi risultano definiti a menno di una
fase. In particolare si ritrova che gli stati (vettoriali) sono definiti dai raggi di
H. In altre parole la formulazione standard della Meccanica Quantistica assume
l’irriducibilita dell’algebra M delle osservabili. Algebricamente cio significa che
l’algebra di von Neumann M appare come l’algebra di von Neumann generata a
partire da una rappresentazione G.N.S. irriducibile della C∗-algebra astratta delle
osservabili il che equivale a dire che il sistema si trova uno stato puro. Questo tut-
tavia non e il caso piu generale dato che a priori il sistema si puo trovare anche in
uno stato misto che, via rappresentazione G.N.S. e chiusura von Neumann, genera
un’algebra di von Neumann con commutante non banale.
Quindi nel caso generale di un’algebra di osservabili riducibile perde di signifi-
cato caratterizzare gli stati normali o vettoriali tramite un’unica matrice densita
o un unico vettore rappresentativo.
B.2.3 Dinamica sui sistemi W ∗
Una dinamica su una W ∗-algebra M e una rappresentazione α σ-debolmente
continua di T ∈ R,Z sull’insieme Aut(M) degli automorfismi di M, ossia e una
mappa
T 3 tα−→ αt ∈ Aut(M)
tale che:
i) α0 = Id essendo Id la trasformazione che lascia invariati gli elementi di A;
ii) αt1 αt2 = αt1+t2 per ogni t1, t2 ∈ T;
iii) α−t = α−1t per ogni t ∈ T;
245
iv) se la successione tnn∈N ⊂ T converge a t allora αtn(M) → αt(M) per ogni
M ∈ M rispetto alla topologia σ-debole.
La proprieta iii) e ridondante in quanto si deriva dalle proprieta i) e ii). La iv) e
sovrabbondante nel caso T = Z in quanto le uniche successioni convergenti sono
quelle costanti tn = t per ogni n ∈ N. La terna Σ ≡ M,T, α formata da una
W ∗-algebra M, dal gruppo T ∈ R,Z e da una dinamica α definisce un sistema
dinamico W ∗. Quando T = R diremo che il sistema ha una dinamica continua
invece se T = Z parleremo di dinamica discreta .
La descrizione di un sistema dinamico C∗, Σ ≡ A,T, α, in un certo stato ω ∈EA invariante rispetto alla dinamica si estende in modo naturale alla descrizione
del sistema dinamico W ∗ generato via rappresentazione G.N.S. Hω, πω, ψω re-
lativa allo stato ω. Sulla W ∗-algebra generata Mω(A) = πω(A)′′ lo stato ω si
estende allo stato vettoriale ω(M) = (ψω; Mψω) per ogni M ∈ Mω(A). Il grup-
po fortemente continuo di automorfismi αt e implementato su πω(A) secondo la
prescrizione πω(αt(A)) = Uω(t)πω(A)Uω(t)−1 dal gruppo unitario Uω(t). Questo
gruppo individua un gruppo ad un parametro di automorfismi di Mω(A) secondo
la naturale prescrizione αt(M) = Uω(t)MUω(t)−1 per ogni M ∈ Mω(A). Questo
e l’unico gruppo di automorfismi di Mω(A) che e σ-debolmente continuo e che si
riduce alla dinamica C∗ su πω(A), ossia tale che αt(πω(A)) = πω(αt(A)). Rispetto
a questa dinamica lo stato ω risulta stazionario.
Quindi un sistema dinamico C∗ individuato da Σ ≡ A;T; α ed uno stato
ω ∈ EA invariante rispetto alla dinamica definiscono in rappresentazione G.N.S.
un sistema dinamico W ∗ individuato da Σ ≡ Mω(A),T, α nello stato invariante
ω.
B.3 Struttura quasi-locale
La formalizzazione coerente di una teoria matematica valida per i sistemi estesi
necessita l’introduzione di una nuova struttura chiamata algebra quasi-locale .
Il punto di partenza e una collezione di C∗-algebre Aαα∈I i cui elementi devono
verificare alcune relazioni strutturali ed al fine di introdurre queste strutture e
necessario specificare le proprieta dell’insieme di indici I.
Le proprieta richieste all’insieme I sono le seguenti:
ordinamento parziale: su I deve essere definito un ordinamento parziale
“¹” tra alcune coppie di elementi α, β ∈ I tale che:
246
i) α ¹ α per ogni α ∈ I (proprieta riflessiva);
ii) se α ¹ β e β ¹ γ allora α ¹ γ (proprieta transitiva);
iii) se α ¹ β e β ¹ α allora α = γ (proprieta simmetrica).
Se la relazione d’ordine ¹ e definita per ogni coppia di elementi di I diremo
che I e un insieme totalmente ordinato e che 6 e un ordinamento;
sistema diretto: l’insieme I e un sistema diretto rispetto all’ordinamento
parziale ¹ se comunque scelta una coppia di elementi α, β ∈ I esiste almeno
un γ ∈ I tale per cui α ¹ γ e β ¹ γ;
relazione di ortogonalita: il sistema diretto I e dotato di una relazione di
ortogonalita se e definita una relazione “⊥” tra alcune coppie di elementi
che verifichi le seguenti proprieta :
i) se α ∈ I allora esiste almeno un β ∈ I tale che α⊥β;
ii) se α ¹ β e β⊥γ allora α⊥γ;
iii) se α⊥β e α⊥γ allora esiste un δ ∈ I tale che α⊥δ e β, γ ¹ δ.
Se σ e un automorfismo della C∗-algebra che verifica σ2 = Id, ossia σ(σ(A)) = A
per ogni A ∈ A (proprieta involutiva), allora ogni elemento di A ∈ A ammette
un’unica decomposizione in una parte pari ed una dispari rispetto σ. Questa
decomposizione e definita da
A = A+ + A− con A± =A± σ(A)
2.
Si verifica immediatamente che: σ(A±) = ±A±; gli elementi pari di A costituiscono
una C∗-sottoalgebra Ap ⊆ A; gli elementi dispari di A costituiscono uno spazio di
Banach Ad ⊆ A.
Un’ algebra quasi-locale A e una C∗-algebra con unita costruita a partire
da una famiglia Aαα∈I di C∗-algebre, dette algebre locali , che verificano le
seguenti proprieta:
QL.1) la collezione Aαα∈I e un net di C∗-algebre indicizzate da un sistema diretto
I su cui e definita anche una relazione di ortogonalita;
QL.2) tutte le algebre locali Aα hanno l’unita comune 1;
QL.3) se α ¹ β allora Aα ⊆ Aβ;
247
QL.4) la C∗-algebra A e ottenuta come chiusura in norma dell’insieme costituito
dall’unione di tutte le algebre locali, ossia
A ≡⋃α∈I
Aα
‖ ‖;
QL.5) esiste un automorfismo σ tale che σ2 = Id, σ(Aα) = Aα e per cui non appena
α⊥β, [Aαp; Aβ
p] = 0, [Aαp; Aβ
d] = 0, Aαd; Aβ
d = 0 dove si e indicato
con Aαp ⊆ Aα e Aα
d ⊆ Aα rispettivamente l’insieme degli elementi pari e
dispari di Aα rispetto a σ.
La proprieta QL.3) insieme al fatto che I e un sistema diretto assicura che l’insieme
A ≡⋃α∈I
Aα,
e un’algebra (generalmente detta algebra delle osservabili locali ). Infatti per
ogni A,B ∈ A esistono due indici α, β ∈ I tali che A ∈ Aα e B ∈ Aβ ⊂ A e dato
che I e un sistema diretto deve esistere un indice γ ∈ I, tale che α ¹ γ e β ¹ γ,
per cui dalla QL.3) A,B ∈ Aγ. Quindi dato che A,B sono elementi di una stessa
C∗-algebra ha senso costruire gli elementi A + B e AB che appartengono ancora
a Aγ e che quindi sono contenuti in A. L’arbitrarieta nella scelta di A,B assicura
che A e un’algebra. Inoltre 1 ∈ A e la proprieta QL.2) assicura che 1 agisca come
unita anche su A. Infine l’algebra con unita A risulta munita in modo naturale
di una norma ‖ ‖. Comunque scelto A ∈ Aα ⊂ A si definisce ‖A‖ ≡ ‖A‖Aα .
La proprieta di inclusione delle algebre locali rende questa definizione di norma
consistente, infatti per ogni A ∈ A esiste un α ∈ I tale che A ∈ Aα e quindi
‖A‖ = ‖A‖Aα > 0 e ‖A‖ = 0 se e solo se ‖A‖Aα = 0 ossia se e solo se A = 0, inoltre
‖λ A‖ = ‖λ A‖Aα = |λ| ‖A‖Aα = |λ| ‖A‖ per ogni λ ∈ C ed infine, comunque
scelti due elementi A,B ∈ A, poiche I e un sistema diretto esiste un indice γ tale
per cui A,B ∈ Aγ e quindi ‖A+ B‖ = ‖A+ B‖Aγ 6 ‖A‖Aγ + ‖B‖Aγ = ‖A‖+ ‖B‖e ancora ‖AB‖ = ‖AB‖Aγ 6 ‖A‖Aγ‖B‖Aγ = ‖A‖‖B‖. Quindi le proprieta QL.1),
QL.2) e QL.3) consentono di definire in modo coerente l’algebra delle osservabili
locali A che e una ∗-algebra normata con unita. L’algebra A, tuttavia, non e in
generale completa e pertanto si rende necessaria la proprieta QL.4) che assicura
che l’algebra quasi-locale A abbia effettivamente la struttura di una C∗-algebra con
unita. La condizione di chiusura in norma richiesta dalla QL.4) si concretizza come
un’operazione “innocua” ed “intrinseca” sulla struttura fisicamente significativa
che costituita dall’algebra di tutte le osservabili locali A. Ogni considerazione che
248
fa uso delle proprieta algebriche di A e della continuita in norma si estende in modo
automatico a tutta l’algebra A. La proprieta QL.5) garantisce la localita (e quindi
la causalita nel caso relativistico) della teoria. Osserviamo che il simbolo ; indica l’ anticommutatore definito da A; B = AB +BA. Un caso importante
si ha quando σ = Id e quindi Aαp = Aα e Aα
d = 0. Nelle applicazioni alla
Meccanica Quantistica σ = Id corrisponde al caso di sistemi fisici che verificano
la statistica di Bose mentre per i sistemi fisici che verificano la statistica di
Fermi si ha che σ 6= Id. Limitatamente ai sistemi che verificano la statistica di
Bose la proprieta QL.5) assume la forma piu compatta:
QL.5′) se α⊥β allora [Aα; Aβ] = 0.
Nei casi di maggiore interesse l’insieme di indici I gode anche di un’ulteriore pro-
prieta. Si assume che per ogni coppia di elementi α, β ∈ I esiste almeno un limite
superiore α ∨ β ∈ I che gode delle seguenti proprieta: α 6 α ∨ β e β 6 α ∨ β;
se α 6 γ e β 6 γ allora α ∨ β 6 γ.
La struttura astratta dell’algebra quasi-locale presentata in questo paragrafo
puo essere specializzata a casi fisicamente concreti. In particolare questa struttura
si presta bene allo scopo di descrivere sistemi globalmente diffusi su regioni illim-
itate di spazio ma che posseggono una struttura locale ben definita. I prototipi
di tali sistemi sono le teorie quantistiche di campo ed i sistemi macroscopici tipici
della meccanica statistica.
B.4 Decomposizione degli stati
In questa sezione tratteremo la teoria generale della decomposizione degli stati
ω ∈ EA su una C∗-algebra A. Il riferimento per un’ampliamento degli argomenti
che qui verranno esposti brevemente sono i Capitoli 4.1. e 4.2. di [BR79].
B.4.1 Rappresentazione integrale di insiemi convessi
In questo paragrafo accenneremo brevemente alla teoria della misura su spazi com-
patti e localmente compatti e al Teorema di Riesz-Markov con le sue conseguenze.
Per maggiori dettagli si rimanda al Capitolo X di [Hal50] e al Paragrafo IV.4. di
[RS72].
249
Misure di Baire e di Borel
Indicheremo con V uno spazio vettoriale munito di una topologia di Hausdorff local-
mente convessa e con X ⊂ V un sottoinsieme convesso e compatto. Sul compatto
X si definiscono in modo naturale gli insiemi boreliani come gli elementi della
σ-algebra di Borel B generata dagli insiemi chiusi, oppure dagli insiemi aperti,
oppure dagli insiemi compatti (ogni aperto e il complementare di un chiuso e se Xe compatto ogni suo sottoinsieme e compatto se e solo se e chiuso). Una misura
regolare e positiva di Borel e una funzione di insieme µ : B → [0; +∞), nu-
merabilmente additiva, finita sui compatti (e quindi finita se X e compatto) e che
verifica la condizione di regolarita
µ(B) = supµ(C) | C ⊂ B, C compatto = infµ(A) | B ⊂ A, A aperto.
La σ-algebra di Borel B su X contiene tutte le intersezioni numerabili di sottoin-
siemi aperti e tutte le unioni numerabili di sottoinsiemi chiusi. Queste famiglie
vengono indicate rispettivamente con Gδ e Fσ. Gli insiemi di Baire sul compatto
X sono definiti come gli elementi della σ-algebra B0 generata dagli elementi chiusi
(equivalentemente compatti) di Gδ o equivalentemente dagli elementi aperti di Fσ.
La famiglia B0 si chiama σ-algebra di Baire e risulta la piu piccola σ-algebra
che rende misurabile tutte le funzioni continue f : X → C. Indicheremo con C(X )
l’insieme delle funzioni continue su X . Una misura finita µ0 sulla σ-algebra B0 e
detta misura di Baire . Le misure di Baire godono delle seguenti proprieta:
MB.1) ogni misura di Baire e automaticamente regolare, infatti
µ0(B) = supµ0(C) | C ⊂ B, C compatto di Baire
= infµ0(A) | B ⊂ A, A aperto di Baire;
MB.2) in generale una misura di Baire puo essere estesa in diversi modi su tutta
la σ-algebra di Borel ma esiste un’unica estensione ad una misura di Borel
regolare. Dato che la restrizione di una misura di Borel su B0 definisce una
misura di Baire segue che vi e una corrispondenza uno ad uno tra le misure
di Baire e le misure regolari di Borel.
In virtu della MB.2) le misure di Baire e le misure regolari di Borel si identi-
ficano vicendevolmente e pertanto nel seguito (salvo precisa specificazione) non
distingueremo piu tra le due nozioni.
250
Una misura di Baire complessa su X e una qualunque combinazione li-
neare finita a coefficienti complessi di misure di Baire positive su X . Indicheremo
l’insieme di tutte le misure di Baire complesse con M(X ). In particolare tra le
misure complesse sono comprese anche le misura di Baire con segno, ossia
le combinazioni lineari finite a coefficienti reali di misure di Baire positive su X .
Indicheremo con M+(X ) ⊂ M(X ) il sottoinsieme delle misure positive di Baire,
con M1(X ) ⊂M(X ) il sottoinsieme delle misure di Baire normalizzate, ossia delle
misure µ a variazione totale 1,
‖µ‖ ≡∣∣∣∣∫
Xdµ(x)
∣∣∣∣ = |µ|(X ) = 1. (B.22)
L’insieme M(X ) e uno spazio di Banach rispetto alla norma definita dalla (B.22).
Con il simbolo M+,1(X ) ⊂ M(X ) si indica il sottoinsieme delle misure di proba-
bilita (positive e normalizzate) di Baire.
B.4.1 Teorema (di Riesz-Markov). Sia X uno spazio compatto di Hausdorff e
C(X ) l’algebra delle funzioni continue su X . Per ogni funzionale lineare φ ∈ C(X )∗
esiste un’unica misura di Baire µφ ∈M(X ) che verifica la relazione
φ(f) =
∫
Xf(x) dµφ(x) ∀ f ∈ C(X ). (B.23)
Il contenuto del Teorema di Riesz-Markov la completa identificazione dei due
spazi di Banach M(X ) ¿ C(X )∗. In base alla (B.23) le misure positive corrispon-
dono ai funzionali lineari positivi. Inoltre dalla relazione
|φ(f)| =∣∣∣∣∫
Xf(x) dµφ(x)
∣∣∣∣ 6∫
X|f(x)| |dµφ|(x) 6 ‖f‖∞ |µφ|(X )
segue che
‖φ‖ = supf∈C(X )
|φ(f)|‖f‖∞ 6 |µφ|(X ) = ‖µφ‖
ed in particolare per f(x) = 1(x) = 1 si ottiene che |φ(1)| = ‖φ‖ = ‖µφ‖.Segue che la corrispondenza tra M(X ) e C(X )∗ e isometrica ed inoltre i funzionali
normalizzati sono associati alle misure a variazione totale 1.
Se µ ∈ M+(X ) chiameremo supporto di µ il piu piccolo sottoinsieme chiuso
Sµ ⊆ X tale che µ(Sµ) = µ(X ) ed un tale sottoinsieme esiste grazie alla regolarita
della misura di Baire (o della sua unica estensione regolare di Borel).
Sia Cαα la collezione di tutti i sottoinsiemi chiusi di X (tutti misurabili secondo Borel)
tali che µ(Cα) = µ(X ) ed indichiamo con Sµ il chiuso definito da Sµ ≡⋂
α Cα. Consideriamo gli
251
aperti Aα ≡ X \ Cα ed osserviamo che µ(Aα) = 0. Sia C un chiuso di X tale che C ∩ Sµ = ∅ ed
osserviamo che
C ⊆ X \ Sµ = X \(⋂
α
Cα
)=
⋃α
(X \ Cα) =⋃α
Aα.
Quindi gli aperti Aα sono una copertura aperta di C che in quanto sottoinsieme chiuso di uno
spazio compatto e esso stesso compatto. Cio implica che deve esistere una collezione finita
Aα1 , . . . ,Aαn tale che C ⊆ ⋃nj=1Aαj e per la subadditivita della misura
µ(C) 6 µ
n⋃
j=1
Aαj
6
n∑
j=1
µ(Aαj ) = 0
dato che gli Aα hanno tutti misura nulla. Sia A un aperto di X tale che Sµ ⊆ A allora µ(A) =
µ(X )−µ(X \A) = µ(X ) dato che X \A e un chiuso che non interseca Sµ. Per la regolarita della
misura segue che
µ(Sµ) = infµ(A) | Sµ ⊂ A, A aperto di Borel = µ(X )
e cio mostra che Sµ e il piu piccolo chiuso che ha misura µ(X ), ossia il supporto di µ.
Chiameremo pseudosupporto di µ un insieme A ⊆ X tale per cui µ(B) = 0
non appena B ∩ A = ∅.Una misura di Dirac, o misura puntuale con supporto x0 ∈ X , e la
funzione positiva e normalizzata di insieme δx0 definita sugli insiemi di Baire B ∈B0 da
δx0(B) =
1 se x0 ∈ B
0 se x0 /∈ B.
Le misure di Dirac sono tutte contenute in M+,1(X ). Una misura µ e moltiplica-
tiva se verifica∫
Xf(x)g(x) dµ(x) =
(∫
Xf(x) dµ(x)
)(∫
Xg(x) dµ(x)
)∀ f, g,∈ C(X )
(B.24)
o piu sinteticamente µ(fg) = µ(f)µ(g) indicando µ(f) ≡ ∫X f(x) dµ(x) per sem-
plicita di notazione. Una misura moltiplicativa e necessariamente normalizzata e
positiva. Applicando la (B.24) alla funzione costante 1(x) = 1 segue che µ(X ) =
µ(X )2 da cui µ(X ) = 1. Inoltre ogni f > 0 si puo sempre scrivere come f = gg con
g(x) ≡√
f(x) eih(x) con h funzione reale e quindi µ(f) = µ(g)µ(g) = |µ(g)|2 > 0.
Le misure di Dirac sono moltiplicative, infatti per ogni scelta di f, g ∈ C(X ) si
ha che∫
Xf(x)g(x) dδx0(x) = f(x0)g(x0) =
(∫
Xf(x) dδx0(x)
)(∫
Xg(x) dδx0(x)
).
252
Consideriamo la relazione di dispersione definita da
Dµ(f) ≡∫
X
[f(x)−
∫
Xf(x′) dµ(x′)
]2
dµ(x′) ≡ µ[(f − µ(f))2]. (B.25)
Le misure µ per cui Dµ(f) = 0 per ogni f ∈ C(X ) sono dette misure senza
dispersione .
B.4.2 Lemma. Condizione necessaria e sufficiente affinche la misura µ sia molti-
plicativa e che sia senza dispersione sulle funzioni reali.
zDim.
Se µ e moltiplicativa (e quindi normalizzata) allora per ogni f ∈ C(X )
µ[(f − µ(f))2] = µ(f2)− 2µ(f)2 + µ(f)2µ(X ) = µ(f2)− µ(f)2 = 0.
La disuguaglianza di Schwartz si scrive
|µ(fg)|2 6 µ(ff) µ(gg) ∀ f, g,∈ C(X ). (B.26)
Siano f, g due funzioni continue a valori reali, allora utilizzando la (B.26)
|µ(fg)− µ(f)µ(g)|2 = |µ[(f − µ(f))(g − µ(g))]|2
6 µ[(f − µ(f))2]µ[(g − µ(g))2] = Dµ(f) Dµ(g).
Quindi se la misura µ non e dispersiva sulle funzioni continue reali segue che µ e moltiplicativa su
queste funzioni. Per la linearita dell’integrale e poiche ogni funzione continua complessa si scrive
come combinazione di due funzioni reali segue allora che µ e moltiplicativa su tutte le funzioni
continue. ¨
Dal precedente Lemma segue che:
B.4.3 Teorema. Tutte e sole le misure moltiplicative sullo spazio compatto di
Hausdorff X sono le misure di Dirac.
zDim.
Abbiamo precedentemente mostrato che le misure di Dirac sono moltiplicative, quindi resta da
verificare che sono anche le uniche. Consideriamo una misura µ ∈ M+,1(X ) con supporto Sµ
che non si riduce ad un solo punto (ossia µ non e una misura di Dirac) e mostriamo che questa
misura e necessariamente dispersiva e quindi non moltiplicativa.
Se il supporto Sµ contiene piu di un punto allora esiste sempre una funzione continua a valori
reali che non e costante su Sµ. Cio segue da due fatti che dipendono dal fatto che X sia uno
spazio compatto di Hausdorff: a) comunque scelta una coppia di punti distinti esistono due chiusi
disgiunti ognuno dei quali contiene uno dei punti52; b) comunque scelti due chiusi disgiunti esiste
52C.f.r. [RS72] Teorema IV.6.
253
una funzione continua e positiva che vale 1 su un chiuso, 0 sull’altro ed un valore intermedio su
tutti gli altri punti dello spazio (Lemma di Urysohn53). Se f non e costante su Sµ allora la
funzione f definita da
f(x) ≡ f(x)−∫
Xf(x′) dµ(x′) = f(x)− µ(f)
non e identicamente nulla su Sµ. Consideriamo gli aperti A+f ≡ x | f(x) > 0 e A−f ≡
x | f(x) < 0. Entrambe le intersezioni A±f ∩ Sµ sono sottoinsiemi misurabili54, non possono
essere entrambe vuote altrimenti f sarebbe costante su Sµ e appena una delle due e non vuota
deve avere misura non nulla altrimenti il complementare dell’insieme (X \ Sµ) ∪ A±f sarebbe un
chiuso contenuto in Sµ che rispetto a µ ha la stessa misura di X contraddicendo il fatto che Sµ
e il supporto di µ. Cio comporta che∫
X[f(x)]2 dµ(x) =
∫
A+f ∩Sµ
[f(x)]2 dµ(x) +∫
A−f ∩Sµ
[f(x)]2 dµ(x) > 0
in quanto f2 > 0 sugli insiemi di misura non nulla A±f ∩ Sµ. Osservando che
∫
X[f(x)]2 dµ(x) = µ(f2) = µ[(f − µ(f))2] = Dµ(f) > 0
segue che la misura µ ha dispersione se il suo supporto contiene piu di un punto. ¨
Se µ ∈M+(X ) anche tutte le misure aµ per ogni a > 0 sono ancora misure di
Baire positive, inoltre se µ1, µ2 ∈M+(X ) tutte le misure εµ1+(1−ε)µ2 per ogni 0 6ε 6 1 sono ancora misure di Baire positive. Quindi M+(X ) e un cono convesso
sul quale e possibile definire in modo naturale una relazione d’ordine. Se µ, ν ∈M+(X ) scriveremo che µ > ν se accade che µ(f) > ν(f) (ovvero
∫X f(x) dµ(x) >∫
X f(x) dν(x)) per ogni funzione f ∈ C(X ) positiva (f > 0). Sia µ, ν ∈ M+(X )
una generica coppia di misure positive e definiamo le due nuove misure positive
µ ∨ ν ≡ (µ− ν)+ + ν, µ ∧ ν ≡ ν − (µ− ν)−
avendo indicato con (µ − ν)± rispettivamente la parte positiva o negativa della
misura con segno µ − ν. Rispetto alla relazione d’ordine precedentemente in-
trodotta si verifica che µ ∨ ν > µ, ν > µ ∧ ν. Ogni coppia di misure positive in
M+(X ) possiede sempre almeno un maggiorante ed un minorante. Geometrica-
mente cio si esprime dicendo che rispetto alla relazione d’ordine introdotta il cono
M+(X ) e un reticolo55.
53C.f.r. [RS72] Teorema IV.7.54C.f.r. [Hal50] Paragrafo 19, Teorema A.55Un insieme X su cui e introdotta una relazione d’ordine parziale ¹ si dice reticolo se
comunque scelta una coppia di elementi x, y ∈ X esistono sempre due elementi z, w ∈ X tali che
z ¹ x, y ¹ w.
254
Il baricentro di una misura
Sia µ ∈M+,1(X ) una misura di probabilita di Baire su X . Chiameremo baricen-
tro di µ un punto x ∈ X tale che, in senso debole,
x =
∫
Xy dµ(y)
ossia tale che
f (x) =
∫
Xf(y) dµ(y) ∀ f ∈ C(X ). (B.27)
Indicheremo il baricentro di µ con b(µ) e con Mx(X ) il sottoinsieme di M+,1(X ) i
cui elementi hanno baricentro x, ossia Mx(X ) ≡ µ | µ ∈M+,1(X ), b(µ) = x.L’esistenza del baricentro di una generica misura M+,1(X ) non e una cosa evi-
dente a priori, tuttavia un risultato generale garantisce cio e fornisce un’utile pro-
cedura di approssimazione. Osserviamo che su M(X ) ¿ C(X )∗ si puo introdurre
la consueta topologia ∗-debole σ (M(X ),C(X )) rispetto alla quale la palla unitaria
di M(X ) e compatta (Teorema di Banach-Alaoglu). Anche l’insieme M+,1(X ) e
∗-debolmente compatto in quanto C(X ) contiene l’identita ed inoltre M+,1(X ) e
anche un insieme convesso i cui punti estremali sono le misure di Dirac (uniche
misure moltiplicative). Il Teorema di Krein-Millman assicura che tutte le misure
µ ∈ M+,1(X ) si possono ottenere come limiti ∗-deboli di net µαα∈I ⊂ M+,1(X )
di misure a supporto finito, ossia come limiti ∗-deboli di net di combinazioni con-
vesse di misure di Dirac (approssimazione di Riemann degli integrali).
Si dimostra56 che per ogni µ ∈ M+,1(X ) esiste un unico punto b(µ) ∈ X che e
baricentro della misura µ. Inoltre la misura µ si realizza come limite di un net
∗-debolmente convergente µαα∈I ⊂M+,1(X ) di misure a supporto finito tale che
b(µα) = b(µ).
Misure massime e decomposizione baricentrica
Il problema della decomposizione baricentrica dei punti di X consiste nello stabilire
sotto quali condizioni si puo associare ad un punto x ∈ X una misura µ ∈Mx(X )
supportata sull’insieme E(X ) dei punti estremi di X .
Iniziamo con l’introdurre una relazione d’ordine sull’insieme M+(X ). Sia S(X )
il sottoinsieme di CR(X ) costituito dalle funzioni reali convesse , ossia dalle
funzioni
f [εx1 + (1− ε)x2] 6 εf(x1) + (1− ε)f(x2) ∀ x1, x2 ∈ X , ∀ 0 6 ε 6 1.
56C.f.r. [BR79] Proposizione 4.1.1.
255
e sia A(X ) il sottoinsieme di CR(X ) costituito dalle funzioni reali affini , ossia
dalle funzioni
f [εx1 + (1− ε)x2] = εf(x1) + (1− ε)f(x2) ∀ x1, x2 ∈ X , ∀ 0 6 ε 6 1.
L’insieme S(X ) e un cono convesso e A(X ) = S(X ) ∩ (−S(X )). Su M+(X ) si puo
introdurre la seguente relazione d’ordine
ν ≺ µ ⇔ ν(f) 6 µ(f) ∀ f ∈ S(X ).
Sebbene sia immediato verificare che ≺ e riflessiva (µ ≺ µ) e transitava (ν ≺ µ,
µ ≺ τ implica ν ≺ τ) non e altrettanto evidente che ≺ sia anche antisimmetrica
ossia che ν ≺ µ e µ ≺ ν implica ν = µ. Un risultato generale stabilisce che ≺ e
un ordinamento parziale su M+(X ) e rispetto a questo ordinamento diremo che la
misura µ e massima se µ ≺ ν implica ν = µ. Inoltre si dimostra57 che:
MM.1) se ν ≺ µ allora ν(f) = µ(f) per ogni f ∈ A(X ) ed in particolare, dato che
1 ∈ A(X ), si ha che ‖ν‖ = ‖µ‖;
MM.2) se ν ≺ µ ed inoltre ν ∈ M+,1(X ) le misure ν e µ hanno stesso baricentro,
ossia b(ν) = b(µ);
MM.3) la condizione µ ∈Mx(X ) e equivalente alla condizione δx ≺ µ;
MM.4) ogni punto x ∈ X e il baricentro di una misura µ ∈ M+,1(X ) massima
rispetto all’ordinamento ≺.
Le complicazioni maggiori quando si vogliono costruire misure con supporto E(X )
derivano dal fatto che questo insieme in generale puo essere non misurabile. Re-
lativamente a cio si dimostrano58 i seguenti risultati:
MM.5) ogni misura µ ∈ M+,1(X ), massima rispetto alla relazione d’ordine ≺, am-
mette come pseudosupporto l’insieme E(X ) dei punti estremali di X e per-
tanto µ(B) = 1 per ogni insieme di Baire B che contiene E(X );
MM.6) se l’insieme X e metrizzabile gli insiemi di Baire e quelli di Borel coincidono,
E(X ) e un sottoinsieme di tipo Gδ e le seguenti condizioni sono equivalenti:
i) la misura µ ∈M+,1(X ) e massima;
ii) µ(E(X )) = 1, ovvero ν ha supporto E(X ).
57C.f.r. [BR79] Proposizione 4.1.3.58C.f.r. [BR79] Proposizione 4.1.11.
256
Riassumendo dalle precedenti affermazioni segue che ogni punto x ∈ X e il bari-
centro di una misura di probabilita massima rispetto alla relazione d’ordine ≺ e
tutte le misure massime sono pseudosupportate su E(X ). Inoltre nel caso parti-
colare in cui l’insieme X e metrizzabile le misure massime hanno come supporto
proprio l’insieme E(X ).
Unicita della decomposizione baricentrica
Fino ad ora abbiamo discusso le condizioni che garantiscono l’esistenza della de-
composizione baricentrica dei punti x ∈ X . Il passo successivo e quello di stabilire
delle condizioni che garantiscono anche l’unicita di una tale decomposizione. Al
fine di formulare la condizione di unicita e conveniente assumere che X sia la base
di un cono convesso con apice nell’origene59. Cio si puo ottenere in modo
standard rimpiazzando lo spazio vettoriale localmente convesso V con la spazio
R×V , identificando X con il sottoinsieme 1×X ed indicando con C(K) il cono
generato da 1 × X
C(X ) ≡ (a, y) | (a, y) ∈ R× V , a > 0, a−1y ∈ X ∪ (0, 0).
Mentre esistono diversi modi per realizzare X come base di un cono (e tutte queste
procedure risultano equivalenti dato che ogni punto del cono deve essere specificato
in modo unico da ax con a > 0 e x ∈ X ) tutte le proprieta affini di C(X ) sono
indipendenti dalla particolare realizzazione e derivano unicamente dalle proprieta
affini di X .
Su ogni cono C e sempre definito in modo naturale un ordinamento dato da
y1 6 y2 se e solo se y2 − y1 ∈ C e diremo che il cono C e un reticolo se esso e un
reticolo rispetto a questo ordinamento. Se il sottoinsieme X e la base di un cono
C(X ) che e un reticolo rispetto all’ordinamento naturale del cono allora diremo
che X e un simplex 60.
L’insieme M+(X ) e un cono convesso che risulta un reticolo rispetto all’ordina-
mento 6. Inoltre M+,1(X ) e una base per M+(X ), infatti se µ ∈M+(X ) la misura
µ′ ≡ ‖µ‖−1µ e a norma 1. Quindi l’insieme M+,1(X ) costituisce un esempio di
simplex.
59Sia C un cono convesso con apice nell’origine. Una base X di C e un sottoinsieme convesso
X ⊂ C tale che 0 /∈ X ed ogni y ∈ C con y 6= 0 si scrive in modo unico come y = ax con a > 0 e
x ∈ X .60La definizione data generalizza quella valida per spazi a dimensione finita. Il simplex m-
dimensionale e l’insieme (a1, . . . , am+1) | aj > 0,∑
j aj = 1 ed esso costituisce la base del cono
(m + 1)-dimensionale (a1, . . . , am+1) | aj > 0.
257
L’unicita della decomposizione baricentrica e legata alla nozione di simplex in
base al seguente risultato61:
MM.7) le seguenti condizioni sono equivalenti:
i) l’insieme compatto e convesso X e un simplex;
ii) ogni x ∈ X e il baricentro di un’unica misura di probabilita massima,
ossia per ogni x ∈ X esiste un’unica misura massima µx tale che δx ≺ µx.
B.4.2 Misure ortogonali
Nel precedente paragrafo abbiamo esaminato gli aspetti fondamentali della teoria
“astratta” della decomposizione baricentrica . In questo paragrafo discutere-
mo le conseguenze che questa teoria ha se applicata allo studio dell’insieme degli
stati EA su una C∗-algebra A. Ricordiamo che il duale A∗, munito della topolo-
gia ∗-debole σ(A∗; A) e uno spazio vettoriale di Hausdorff localmente convesso e
se A possiede l’identita (cosa che supporremo verificata) allora EA e un sottoin-
sieme di A∗ convesso e ∗-debolmente compatto. Come conseguenza delle proprieta
MM.1),. . .,MM.7) discusse nel precedente paragrafo segue che ogni stato ω ∈ EA e
il baricentro di almeno una misura di probabilita µ ∈M+,1(EA) massima rispetto
alla relazione d’ordine ≺ che e pseudosupportata sull’insieme dei punti estremali
E(EA) ≡ PA. In altre parole per ogni ω ∈ EA vale in senso debole la seguente
decomposizione
ω =
∫
EA
ω′ dµ(ω′)
ossia
f(ω) =
∫
EA
f(ω′) dµ(ω′) ∀ f ∈ C(EA). (B.28)
In realta si dimostra62 che l’uguaglianza in senso debole definita dalla (B.28) e
garantita non appena e verificata sulle sole funzioni continue e affini su EA e come
conseguenza del Teorema di Hahn-Banach si dimostra che tutte e sole le funzioni
affini su EA sono della forma A(ω) = ω(A) per ogni A ∈ A. Per tale motivo
possiamo rimpiazzare la definizione (B.28) con l’equivalente relazione
ω(A) =
∫
EA
ω′(A) dµ(ω′) ∀ A ∈ A. (B.29)
In generale la misura µ ∈ M+,1(EA) che realizza la decomposizione baricentrica e
pseudosupportata su PA, ossia µ(B) = 1 per ogni sottoinsieme di Baire B ⊂ EA
61C.f.r. [BR79] Teorema 4.1.15.62C.f.r. [BR79] Teorema 4.1.1.
258
tale che PA ⊂ B. Inoltre PA coincide con il supporto della misura solo nel caso in
cui lo spazio degli stati EA e metrizzabile e una condizione sufficiente affinche cio
accada e che la C∗-algebra A sia separabile (Paragrafo B.1.6).
L’unicita della rappresentazione (B.29) e assicurata se e solamente se EA e
un simplex. A tale proposito la situazione generale e espressa dalle seguenti
implicazioni63:
EA e un simplex ⇔ A e abeliana ⇔ A+ e un reticolo
dove A+ indica il cono convesso degli elementi positivi di A munito della relazione
d’ordine consueta (Paragrafo B.1.4). In base a cio la decomposizione baricentrica
(B.29) di ogni stato ω e unica se e solo se A e una C∗-abeliana. In questo caso
particolare la C∗-algebra abeliana A risulta ∗-isomorfa (tramite l’isomorfismo di
Gel’fand) all’insieme C(PA) delle funzioni continue a valori complessi definite sullo
spettro (insieme degli stati puri) PA tramite la relazione fA(ω) = ω(A). Poiche
tale spettro e compatto di Hausdorff segue che ogni stato ω su A e un funzionale
lineare positivo e normalizzato su C(PA) e tramite il Teorema di Riesz-Markov e
una misura di probabilita su PA tale che
ω(A) =
∫
PA
fA(ω′) dµ(ω′) ∀ A ∈ A.
Cio prova che nel caso di C∗-algebra abeliana la decomposizione (B.29) oltre ad
essere unica ha come supporto (e non come pseudosupporto) proprio l’insieme
E(EA) = PA prescindendo dal fatto che EA sia metrizzabile o meno.
Diremo che ω1, ω2 ∈ EA sono stati ortogonali e scriveremo ω1⊥ω2 se verifi-
cano le seguenti proprieta equivalenti64:
SO.1) se φ e un funzionale lineare su A tale che φ 6 ω1 e φ 6 ω2 allora φ = 0;
SO.2) se ω = ε ω1 + (1 − ε)ω2 con 0 < ε < 1 e se Hω, πω, ψω e la relativa
rappresentazione G.N.S. allora esiste un proiettore ortogonale non banale
P ∈ πω(A)′ tale che ε = (ψω; Pψω)
ω1(A) =(ψω; Pπω(A)ψω)
(ψω; Pψω), ω2(A) =
(ψω; (1ω − P )πω(A)ψω)
(ψω; (1ω − P )ψω);
SO.3) la rappresentazione G.N.S. associata a ω e somma diretta delle rappresen-
tazioni G.N.S. associate agli stati ω1 e ω2, ossia
Hω = Hω1 ⊕Hω2 , πω = πω1 ⊕ πω2 , ψω = ψω1 ⊕ ψω2 .
63C.f.r. [BR79] Esempio 4.2.6.64C.f.r. [BR79] Lemma 4.1.19.
259
Se µ ∈M+,1(EA) e se per ogni sottoinsieme di Baire S ⊂ EA accade che
(∫
Sω′ dµ(ω′)
)⊥
(∫
EA\Sω′ dµ(ω′)
)
allora diremo che µ e una misura ortogonale su EA. Indicheremo con Oω(EA)
l’insieme delle misure di probabilita su EA ortogonali e con baricentro ω. L’insieme
Oω(EA) e contenuto nell’insieme Mω(EA) di tutte le misure di probabilita con
baricentro ω. Il prossimo passo e quello di caratterizzare la relazione tra questi
due insiemi di misure. Per ogni misura µ ∈Mω(EA) la relazione
(ψω; κµ(f)πω(A)ψω) ≡∫
EA
f(ω′) ω′(A) dµ(ω′) ∀ A ∈ A
con f ∈ L∞[EA, µ] definisce un elemento κµ(f) ∈ πω(A)′. Quindi per ogni µ ∈Mω(EA) e definita una mappa κµ
L∞[EA, µ] 3 fκµ−→ κµ(f) ∈ πω(A)′
che risulta continua se L∞[EA, µ] e munito della topologia σ(L∞, L1) e πω(A)′
della topologia debole degli operatori65. Indichiamo con B ⊆ πω(A)′ l’immagine
della mappa κµ, ossia B ≡ κµ(f) | f ∈ L∞[EA, µ]. Il Teorema di Tomita66
afferma che la misura µ appartiene a Oω(EA) se e solo se la mappa κµ e uno ∗-isomorfismo tra L∞[EA, µ] e B ⊆ πω(A)′, ossia se e solo se B e una sottoalgebra
di von Neumann abeliana contenuta in πω(A)′. Come importante conseguenza di
questo teorema si dimostra67 che ogni misura ortogonale µ ∈ Oω(EA) e un punto
estremale dell’insieme Mω(EA) (che e convesso), ossia
Oω(EA) = E(Mω(EA)).
La piu importante caratterizzazione delle misure ortogonali in termini di algebre
abeliane e di proiettori e frutto del seguente risultato68:
B.4.4 Teorema. Sia A una C∗-algebra con identita e sia ω uno stato su A. Vi e
una corrispondenza uno ad uno tra i tre seguenti insiemi:
• le misure ortogonali di Mω(EA), ossia gli elementi di Oω(EA);
• le sottoalgebre abeliane di von Neumann B contenute in πω(A)′;
65C.f.r. [BR79] Lemma 4.1.21.66C.f.r. [BR79] Proposizione 4.1.22.67C.f.r. [BR79] Corollario 4.1.23.68C.f.r. [BR79] Teorema 4.1.2. e Teorema 4.1.28.
260
• I proiettori ortogonali P su Hω tali che
Pψω = ψω, Pπω(A)P ⊆ Pπω(A)P′.
Se µ, B e P sono in corrispondenza, secondo i precedenti punti, allora valgono le
seguenti relazioni:
i) B = πω(A) ∪ P ′;
ii) PHω = Span(Bψω), ossia il sottospazio su cui proietta P e generato da
Bψω;
iii) sia A1, . . . , An un insieme finito di elementi di A, siano A1, . . . , An le relative
funzioni affini su EA e A1 . . . An il loro prodotto (che e ancora un elemento
di C(EA)), allora
µ(A1 . . . An) = (ψω; Pπω(A1)P . . . Pπω(An)Pψω);
iv) B e ∗-isomorfo all’immagine della mappa κµ : L∞(µ) → πω(A)′ e per ogni
A,B ∈ A vale che κµ(A)πω(B)ψω = πω(B)Pπω(A)ψω;
v) se µ, ν ∈ Oω(EA) e se Bµ, Pµ e Bν , Pν sono, rispettivamente, le algebre
abeliane di von Neumann ed i proiettori associati a µ e ν allora
ν ≺ µ ⇔ Bν ⊆ Bµ ⇔ Pµ 6 Pµ.
Una misura µ ∈ Oω(EA) e massima tra tutte le misure di Oω(EA) se e solo se la
corrispondente algebra abeliana di von Neumann B ⊆ πω(A)′ e massimamente
abeliana .
B.4.3 Decomposizione estremale
I risultati discussi precedentemente possono essere utilizzati per specificare la de-
composizione degli stati della C∗-algebra con unita A in termini degli stati puri.
Una tale decomposizione viene detta decomposizione estremale . La decompo-
sizione estremale di uno stato ω ∈ EA si puo costruire tramite l’aiuto delle misure
ortogonali. Tramite il Teorema B.4.4 si puo associare ad ogni algebre abeliane di
von Neumann B contenute in πω(A)′ una misura ortogonale µB ∈ Oω(EA) e se B
e un’algebra abeliana di von Neumann massimale in πω(A)′ allora µB e massima in
Oω(EA). Il primo risultato che e necessario conseguire e che µB e, in realta, massi-
ma in Mω(EA). Per dimostrare cio e necessaria una precisa caratterizzazione della
261
relazione d’ordine ≺ per le misure. Un risultato generale, noto come Teorema di
Cartier-Fell-Meyer 69 afferma che due misure µ e ν sono comparabili se e solo se
sono comparabili componente per componente. In altri termini se µ, ν ∈ Mω(K )
la condizione ν ≺ µ e equivalente al fatto che per ogni decomposizione convessa
ν =∑n
j=1 ajνj con νj ∈ Mωj(K ) esiste un’analoga decomposizione µ =
∑nj=1 ajµj
con µj ∈ Mωj(K ) e νj ≺ µj per ogni j = 1, . . . , n. Come conseguenza del Teo-
rema di Cartier-Fell-Meyer si dimostra70 che se A e una C∗-algebra con identita,
ω uno stato su A, B un’algebra di von Neumann abeliana contenuta in πω(A)′ e
µB ∈ Oω(EA) la corrispondente misura ortogonale allora B e la massima sottoal-
gebra abeliana contenuta in πω(A)′ ⇔ µB e massima tra le misure di Oω(EA) ⇔µB e massima tra le misure di Mω(EA). Da questo risultato si puo derivare una
caratterizzazione dell’unicita delle misure massime che hanno un fissato stato per
baricentro; si dimostra che71:
B.4.5 Teorema. Sia A una C∗-algebra con identita, ω uno stato su A e P il
proiettore su πω(A)′ψω. Le seguenti condizioni sono equivalenti:
1) Mω(EA) ha una unica misura massima µ;
2) πω(A)′ e abeliano;
3) Pπω(A)P genera un’algebra abeliana.
Quando queste condizioni sono verificate µ e proprio la misura ortogonale che
corrisponde all’algebra abeliana di von Neumann πω(A)′.
In particolare nel caso in cui πω(A)′ = C1ω lo stato ω e puro e la misura
massima µ si riduce alla misura di Dirac δω.
B.4.4 Decomposizione centrale
In questa sezione vogliamo esaminare le possibili decomposizioni di uno stato ω
che sono associate ad una qualche sottoalgebra di von Neumann contenuta nel cen-
tro Zω(A) = πω(A)′′ ∩ πω(A)′ della rappresentazione πω(A). La misura ortogonale
associata all’intera algebra Zω(A) viene detta misura centrale mentre chiamere-
mo misure sub-centrali tutte le misure associate a qualche sottoalgebra di von
69C.f.r. [BR79] Proposizione 4.2.1.70C.f.r. [BR79] Teorema 4.2.2.71C.f.r. [BR79] Teorema 4.2.3.
262
Neumann contenuta in Zω(A). Questa classe di misure risulta di particolare impor-
tanza in fisica poiche gli elementi di πω(A)′′ sono generalmente interpretati come le
osservabili del sistema nello stato ω ed il centro Zω(A) corrisponde all’insieme degli
invarianti del sistema. Quindi in questo schema interpretativo la misura centrale
fornisce la distribuzione di probabilita dei valori di questi invarianti e la relativa
decomposizione e un’espressione di ω in termini di stati sui quali gli invarianti
assumono valori specificati.
Le misure sub-centrali possono essere caratterizzate tramite una condizione
appena piu forte dell’ortogonalita. Se le coppie H1, π1 e H2, π2 costituiscono
due rappresentazioni della C∗-algebra A diremo che esse ammettono una sot-
torappresentazione equivalente se e solo se esistono due sottospazi K1 ⊂ H1
e K2 ⊂ H2, entrambi A-stabili, ossia tali che π1(A)K1 ⊆ K1 e π1(A)K2 ⊆ K2,
ed una mappa unitaria V : K1 → K2 tale per cui π1(A) = V †π2(A)V per ogni
A ∈ A. Quando le due rappresentazioni non hanno sottorappresentazioni equiv-
alenti allora diremo che esse sono disgiunte e scriveremo π1§π2. Diremo che i
due stati ω1 ed ω2 sono disgiunti , e scriveremo ω1§ω2, se originano rappresen-
tazioni G.N.S. Hω1 , πω1 , ψω1 e Hω1 , πω1 , ψω1 disgiunte. Si verifica72 che i due
stati ω1, ω2 ∈ EA sono disgiunti se e solo se nella rappresentazione G.N.S. indotta
dallo stato ω = ε ω1 + (1 − ε) ω2 con 0 < ε < 1 esiste un proiettore non banale
P ∈ Zω(A) = πω(A)′ ∩ πω(A)′′ tale che ε = (ψω; Pψω) e
ω1(A) =(ψω; Pπω(A)ψω)
(ψω; Pψω), ω2(A) =
(ψω; (1ω − P )πω(A)ψω)
(ψω; (1ω − P )ψω),
per ogni A ∈ A. In particolare se gli stati ω1 e ω2 sono disgiunti allora sono anche
ortogonali.
Se ω ∈ E(A) e se µ ∈Mω(EA) allora si dimostra73 che la condizione
(∫
Sω′ dµ(ω′)
)§(∫
EA\Sω′ dµ(ω′)
)
per ogni sottoinsieme di Baire S ⊆ EA e equivalente al fatto che µ e una misura
sub-centrale, ossia µ ∈ Oω(EA) e la sottoalgebra abeliana di von Neumann a lei
associata B ⊆ πω(A) e contenuta nel centro Zω(A) della rappresentazione πω(A).
Osserviamo che come conseguenza del punto v) del Teorema B.4.4 segue che
la misura centrale µZω e la piu piccola misura di Mω(EA) che massimizza tutte le
misure sub-centrali.
72C.f.r. [BR79] Lemma 4.2.8.73C.f.r. [BR79] Proposizione 4.2.9.
263
Ricordiamo che lo stato ω e fattoriale se il centro dell’algebra di von Neumann
generata e banale, ossia se
Zω(A) = πω(A)′′ ∩ πω(A)′ = C1ω.
L’insieme di tutti gli stati fattoriali su A si indica con EfA.
Come sunto di tutta la teoria discussa possiamo enunciare il Teorema di
decomposizione centrale il quale afferma che per ogni stato ω ∈ EA esiste
un’unica misura di probabilita µZω su EA, detta misura centrale, che verifica le
seguenti proprieta:
DC.1) µZω ha come baricentro ω, ossia
ω =
∫
EA
ω′ dµZω(ω′);
DC.2) per ogni insieme di Baire S ⊆ EA si ha che(∫
Sω′ dµZω(ω′)
)§(∫
EA\Sω′ dµZω(ω′)
);
DC.3) µZω e pseudosupportata sull’insieme degli stati fattoriali EfA. Inoltre se la
C∗-algebra A e separabile allora EfA e un boreliano e pertanto costituisce il
supporto di µZω .
B.5 Gruppi di simmetria
B.5.1 Stati invarianti
Proprieta topologiche
Consideriamo una C∗-algebra A con identita ed un gruppo G che ha una rappre-
sentazione τ nell’insieme Aut(A) degli ∗-automorfismi di A. Indicheremo l’azione
di G su A nel seguente modo:
A 3 Ag−→ τg(A) ∈ A ∀ g ∈ G.
Uno funzionale lineare φ ∈ A∗ e detto G-invariante se
φ(A) = φ(τg(A)) ∀ g ∈ G, ∀ A ∈ A.
In particolare saremo interessati agli stati G-invariante su A ed indicheremo
il loro insieme con EAG. L’insieme EA
G e contenuto nel sottoinsieme convesso e
264
∗-debolmente compatto EA. Anche EAG e convesso, infatti se ω1 e ω2 sono stati
G-invarianti e ω = ε ω1 + (1− ε) ω2 con 0 6 ε 6 1 segue che
ω(A) = ε ω1(A) + (1− ε) ω2(A)
= ε ω1(τg(A)) + (1− ε) ω2(τg(A)) = ω(τg(A))
da cui, per l’arbitrarieta di A ∈ A e g ∈ G, segue che ω ∈ EAG per ogni valore di ε ∈
[0, 1]. L’insieme EAG e anche ∗-debolmente chiuso, infatti se ωαα∈I ⊂ EA
G e un
net di stati invarianti ∗-debolmente convergente allo stato ω allora limα→∞ |ωα(A)−ω(A)| = 0 per ogni A ∈ A ed in particolare
limα→∞
|ωα(τg(A))− ω(τg(A))| = 0 ∀ A ∈ A, ∀ g ∈ G.
L’invarianza degli ωα assicura che le successioni numeriche ωα(τg(A))α∈I (una
per ogni valore di g) coincidono con l’unica successione ωα(A)α∈I e quindi tutti
i limiti ω(τg(A)) coincidono con il limite ω(A). Quindi ω(τg(A)) = ω(A) per ogni
A ∈ A e per ogni g ∈ G e cio prova che anche lo stato ω e G-invariante. L’insieme
EAG contiene i limiti ∗-deboli dei suoi net convergenti ed e, quindi, ∗-debolmente
chiuso. Poiche EAG e contenuto nell’insieme ∗-debolmente compatto EA e dato
che ogni chiuso contenuto in un compatto e automaticamente compatto segue che
anche EAG ∗-debolmente compatto. Ricapitolando EA
G e un sottoinsieme del duale
A∗ convesso e ∗-debolmente compatto. Dato che sono verificate le condizioni del
Teorema di Krein-Millman si puo affermare che l’insieme degli stati estremali
di EAG, che indicheremo con E(EA
G) ≡ PAG, non e vuoto e genera per inviluppo
convesso ∗-debolmente chiuso tutto l’insieme EAG. Gli stati G-invarianti estremali
PAG vengono solitamente chiamati stati G-ergodici o piu semplicemente stati
ergodici .
Rappresentazione G.N.S.
Se ω ∈ EAG allora, come conseguenza della Proposizione B.1.7, esiste una rappre-
sentazione del gruppo G in termini di operatori unitari Uω(g) per ogni g ∈ G che
agiscono sullo spazio di HilbertHω sede della rappresentazione G.N.S. Hω, πω, ψωassociata allo stato ω. Questa rappresentazione e univocamente determinata dalle
due condizioni
Uω(g)πω(A)Uω(g)† = πω(τg(A))
∀ g ∈ G, ∀ A ∈ A
Uω(g)ψω = ψω.
265
Nel seguito useremo la notazione sintetica Hω, πω, Uω(G), ψω per riferirci al-
la struttura costituita dalla rappresentazione G.N.S. e dall’azione unitaria sullo
spazio di rappresentazione del gruppo G. Indicheremo con il simbolo HGω l’insieme
dei vettori di Hω che sono invarianti rispetto all’azione del gruppo Uω(G). Sicu-
ramente questo insieme non e vuoto in quanto coincide almeno con il sottospazio
unidimensionale generato dal vettore ψω. Se indichiamo con P un proiettore or-
togonale su HGω o anche su un sottospazio di HG
ω si verifica immediatamente che
[P : Uω(g)] = 0 per ogni g ∈ G.
Azione aggiunta del gruppo di simmetria
E utile definire l’ azione aggiunta τ ∗ del gruppo G sul duale A∗. Essa viene
definita puntualmente nel modo seguente
(τ ∗g (φ))(A) ≡ φ(τg−1(A)) ∀ g ∈ G, ∀ A ∈ A, ∀ φ ∈ A∗. (B.30)
La (B.30) permette di associare ad ogni elemento g ∈ G un’operatore lineare ed
isometrico τ ∗g ∈ Iso(A∗) ed inoltre la convenzione adottata assicura che la mappa
τ ∗ definisca una rappresentazione di G, infatti
(τ ∗(g1·g2)(φ))(A) = φ(τ(g1·g2)−1(A)) = φ(τ(g2−1·g1
−1)(A))
= φ(τg2−1 τg1
−1(A)) = (τ ∗g2(φ))(τg1
−1(A)) = (τ ∗g1 τ ∗g2
(φ))(A)
da cui per l’arbitrarieta di A ∈ A e di φ ∈ A∗ segue che τ ∗(g1·g2) = τ ∗g1τ ∗g2
. Tuttavia,
come emerge dal calcolo precedente, se il gruppo G e abeliano si puo rimpiazzare
la (B.30) con la definizione
(τ ∗g (φ))(A) ≡ φ(τg(A)) ∀ g ∈ G, ∀ A ∈ A, ∀ φ ∈ A∗ (B.31)
che, in questo caso particolare, e sufficiente a garantire che la mappa τ ∗ sia ancora
una rappresentazione del gruppo G.
Evidentemente i funzionali lineari invarianti sono caratterizzati in termini del-
l’azione aggiunta dalla relazione τ ∗g (φ) = φ per ogni g ∈ G.
Tramite la doppia trasposizione si puo definire l’azione di G anche sull’algebra
C(EA) delle funzioni continue su EA tramite la relazione
(τgf)(ω) ≡ f(τ ∗g−1ω) ∀ g ∈ G, ∀ f ∈ C(EA), ∀ ω ∈ EA. (B.32)
266
B.5.2 La decomposizione ergodica
In questo paragrafo discuteremo i criteri generali che permettono di decomporre
uno stato G-invariante ω ∈ EAG in termini dei sue punti estremali PA
G. Questo
tipo di scomposizione e detta decomposizione ergodica . La teoria che dis-
cuteremo di seguito e una naturale estensione dei concetti e dei risultati discussi
nella teoria generale dalla decomposizione degli stati (Paragrafo B.4). Le dif-
ferenze rispetto al caso generale, nascono dalla presenza dell’ulteriore struttura
definita dall’azione di un gruppo di trasformazioni su A rispetto alla quale gli stati
considerati sono invarianti.
La misura di Baire µ su EA invariante sotto l’azione del gruppo G se accade
che µ(B) = µ(τ ∗g−1(B)) per ogni sottoinsieme di Baire SB ⊆ EA e per ogni g ∈ G.
Inoltre la relazione (B.32) si puo estendere per definire l’azione del gruppo G su
tutta l’algebra L∞[EA, µ].
Sia A una C∗-algebra con unita, τ una rappresentazione del gruppo G negli
∗-automorfismi di A e ω ∈ EAG uno stato invariante. Come naturale estensione
delle affermazioni contenute nel Teorema B.4.4 al caso in cui esiste un gruppo di
simmetria si dimostra74 che
DE.1) esiste una corrispondenza uno ad uno tra:
i) le misure µ ∈ Oω(EA) ortogonali e con baricentro ω che verificano la
condizione di invarianza
µ(τg(f1)f2) = µ(f2f2) ∀ f1, f2 ∈ L∞[EA, µ], ∀ g ∈ G;
ii) le sottoalgebre abeliane di von Neumann B ⊆ πω(A) ∪ Uω(G)′;iii) i proiettori ortogonali P su Hω tali che
Pψω = ψω, Uω(G)P = P, Pπω(A)P ⊆ Pπω(A)P′.
Inoltre se B1,B2 ⊆ πω(A)∪Uω(G)′ sono due algebre abeliane di von Neu-
mann, µB1 , µB2 le misure ortogonali loro rispettivamente associate e P1, P2 i
relativi proiettori si ha che
µB1 ≺ µB2 ⇔ B1 ⊆ B2 ⇔ P1 6 P2.
Riguardo al supporto di queste particolari misure ortogonali si dimostra75 che:
74C.f.r. [BR79] Proposizione 4.3.1.75C.f.r. [BR79] Proposizione 4.3.2.
267
DE.2) se µ ∈ Oω(EA) allora le seguenti condizioni sono equivalenti:
i) µ(τg(f1)f2) = µ(f2f2) per ogni f1, f2 ∈ C(EA) e per ogni g ∈ G;
ii) il supporto di µ e contenuto in un sottoinsieme ∗-debolmente chiuso di
EAG, ossia e costituito solo da stati invarianti.
Se µ verifica queste condizioni (equivalenti) e se inoltre e massima allora essa
e pseudosupportata sull’insieme degli stati ergodici PAG. Infine, condizione
sufficiente affinche la misura massima µ ∈ Oω(EA) sia supportata su PAG e
che A sia separabile.
Le circostanze per cui esiste un’unica misura ortogonale e massima di baricentro
ω ∈ EAG sono chiarite dale seguente risultato76:
DE.3) le seguenti condizioni sono equivalenti:
i) Mω(EAG) contiene un’unica misura massima µ;
ii) l’algebra πω(A) ∪ Uω(G)′ e abeliana.
Quando queste condizioni (equivalenti) sono soddisfatte µ e ortogonale ed
in particolare coincide con la misura ortogonale corrispondente all’algebra
abeliana di von Neumann πω(A) ∪ Uω(G)′.
La DE.3) e importante perche fornisce un criterio che garantisce l’unicita del-
la massima misura ortogonale µ ∈ Oω(EAG). Qualora fossero soddisfatte anche le
condizioni affinche il supporto di µ sia costituito dagli stati ergodici PAG (ad esem-
pio se A e separabile) allora l’unicita della massima misura ortogonale corrisponde
all’unicita della decomposizione ergodica. Nel seguito ci occuperemo del solo prob-
lema dell’unicita senza interessarci ulteriormente della questione del supporto di
µ.
B.5.3 Abelianita asintotica ed unicita della decomposizione
I teoremi riguardanti l’unicita della decomposizione ergodica necessitano di un’im-
portante strumento tecnico noto come Teorema della media ergodica di Ala-
oglu-Birkhoff . Presenteremo una versione assolutamente astratta di questo
risultato tale da poter essere applicato alla rappresentazione unitaria del grup-
po g → Uω(g) senza nessuna assunzione di continuita. Inoltre l’utilita di questo
76C.f.r. [BR79] Proposizione 4.3.3.
268
teorema non si limita solamente agli scopi di questo paragrafo (in questo contesto
poteva essere addirittura omesso dato che compare solo come strumento puramente
tecnico) ma tornera utile anche nel seguito ed in particolare nella dimostrazione
del teorema ergodico di von Neumann . Per questo motivo oltre all’enunciato
forniremo anche una traccia della dimostrazione.
B.5.1 Teorema (della media ergodica di Alaoglu-Birkhoff). Sia U una
famiglia di operatori limitati sullo spazio di Hilbert H che verificano le seguenti
proprieta:
1) ‖U‖ 6 1 per ogni U ∈ U ;
2) se U1, U2 ∈ U allora anche il prodotto U1U2 e un elemento di U .
Sia P il proiettore ortogonale di H sul sottospazio costituito da tutti i vettori
invarianti sotto l’azione della intera famiglia U , ossia
PH ≡ ψ | ψ ∈ H, Uψ = ψ ∀ U ∈ U .
Il proiettore P si ottiene come inviluppo convesso fortemente chiuso di elementi di
U , ossia P ∈ s-cch(U ).
zDim.
Se ψ ∈ PH allora per ogni U ∈ U
‖ψ‖2 = (Uψ;ψ) = (ψ; U†ψ) 6 ‖ψ‖ ‖U†ψ‖ 6 ‖U†‖ ‖ψ‖2 6 ‖ψ‖2
da cui seguono le due relazioni (ψ; U†ψ) = ‖ψ‖2 e ‖U†ψ‖ = ‖ψ‖. Quindi
‖U†ψ − ψ‖2 = ‖U†ψ‖2 − (U†ψ; ψ)− (ψ; U†ψ) + ‖ψ‖2 = 0
per cui U†ψ = ψ. Da cio segue che se ϕ ∈ (PH)⊥ allora (Uϕ,ψ) = (ϕ; U†ψ) = (ϕ; ψ) = 0
ossia Uϕ ∈ (PH)⊥. Questo significa che il sottospazio (PH)⊥ e invariante sotto l’azione di ogni
elemento delle famiglia U . Consideriamo il sottoinsieme convesso Cϕ di H definito da
Cϕ ≡ ξ | ξ ∈ H, ξ = Kϕ ∀ K ∈ ch(U ).
dove con il simbolo ch(U ) si intende la collezione delle combinazioni finite e convesse di elementi
di U . Evidentemente se ϕ ∈ (PH)⊥ allora Cϕ ⊆ (PH)⊥. Ogni sottoinsieme chiuso e convesso
di H ammette un unico elemento di norma minima ed indichiamo con ξ l’elemento di norma
minima di Cϕ. Per ogni U ∈ U deve valere ‖ξ‖ 6 ‖Uξ‖ 6 ‖U‖ ‖ξ‖ 6 ‖ξ‖ da cui ‖Uξ‖ = ‖ξ‖ e
per l’unicita dell’elemento di norma minima Uξ = ξ. Ma cio allora implica che ξ ∈ (PH)⊥∩PH,
ossia ξ = 0.
Se η e un generico vettore di H allora esiste un’unica decomposizione η = ψ +ϕ con ψ ∈ PHe ϕ ∈ (PH)⊥. In base al precedente risultato si ottiene che
infK∈ch(U )
‖(K − P )η‖ = infK∈ch(U )
‖Kη − ψ‖ = infK∈ch(U )
‖Kϕ‖ = infξ∈Cϕ
‖ξ‖ = 0.
269
Si puo applicare questo risultato alla famiglia di operatori Un ≡ U ⊕ . . .⊕ U | ∀ U ∈ U agente sullo spazio di Hilbert Hn ≡ H ⊕ . . .⊕H. Se η ≡ (η1, . . . , ηn) ∈ Hn e se indichiamo con
Pn ≡ P ⊕ . . .⊕P il proiettore sul sottospazio invariante (PH)n ≡ PH⊕ . . .⊕PH allora per ogni
ε > 0 deve esistere un Kn ≡ K ⊕ . . .⊕K ∈ ch(Un) tale che
‖(Kn − Pn)η‖2Hn=
n∑
j=1
‖(K − P )ηj‖2 < ε.
Cio implica che ‖(K−P )ηj‖2 < ε per ogni j = 1, . . . , n e l’arbitrarieta di ε prova che P appartiene
alla chiusura forte di ch(U ).
Esplicitamente cio significa che e possibile scegliere una successione (se H e separabile la
topologia forte e a base numerabile) di elementi Knn∈N ⊂ ch(U ) definiti da
Kn =N∑
j=1
a(n)j Uj con
N∑
j=1
a(n)j = 1
tale che Kns−→ P . In definitiva cio prova l’enunciato, ossia che P ∈ s-cch(U ). ¨
Per procedere nello studio della teoria della decomposizione ergodica e ne-
cessario introdurre delle proprieta di “commutazione approssimata” tra coppie di
elementi della C∗-algebra A quando tali elementi sono “traslati” (trasformati) sotto
l’azione degli automorfismi τ che implementano l’azione del gruppo G. Tali pro-
prieta vengono generalmente denominate sotto la comune terminologia di abelian-
ita asintotica . Studieremo tali condizioni nella forma
infA′∈ch(τ
G(A))
|ω([A′; B])| = 0
per ogni coppia di elementi A,B ∈ A e per una data sottoclasse di stati ω intenden-
do con ch(τG(A)) l’inviluppo convesso (insieme delle combinazioni convesse finite)
dell’insieme τG(A) ≡ τg(A) | g ∈ G. La terminologia “abelianita asintotica” si
usa perche nella particolare situazione in cui il gruppo G ha una struttura topolo-
gica la condizione precedente e modificata sostituendo A′ con τg(A) e “muovendo”
g definitivamente fuori da ogni compatto di G. Un“raffinamento” di questa con-
dizione e necessario per caratterizzare l’unicita della decomposizione ergodica, la
subcentralita di questa decomposizione e la struttura ergodica degli stati estremali
PAG. Osserviamo che un tale criterio e particolarmente utile dato che le diverse
condizioni di asintoticita abeliana sono tutte soddisfatte se e soddisfatto un criterio
piu forte e piu facilmente verificabile detto abeliantita asintotica in norma :
infg∈G
‖[τg(A); B]‖ = 0 ∀ A,B ∈ A, ∀ g ∈ G. (B.33)
La teoria che segue si basa sulla seguente proprieta di abelianita asintotica. Sia A
una C∗-algebra con unita, G un gruppo, τ la rappresentazione del gruppo come
270
∗-automorfismi di A e ω uno stato G-invariante su A. Diremo che la coppia A, ωe detta essere G-abeliana se accade che
infA′∈ch(τ
G(A))
|ω′([A′; B])| = 0 (B.34)
per ogni coppia di elementi A,B ∈ A e per ogni stato G-invariante ω′ ∈ EAG
vettoriale rispetto alla rappresentazione G.N.S. Hω, πω, ψω.Dalle seguenti disuguaglianze
infA′∈ch(τ
G(A))
|ω′([A′; B])| 6 ‖ω′‖ infA′∈ch(τ
G(A))
‖[A′; B]‖ 6 infg∈G
‖[τg(A); B]‖
segue che la (B.34) e sicuramente verificata, indipendentemente dallo stato in-
variante ω, se e verificata la condizione (B.33). Inoltre quest’ultima condizione e
certamente verificata se la C∗-algebra A e abeliana dato che in questa evenienza
[τg(A); B] = 0 per ogni A,B ∈ A. Ricapitolando otteniamo le seguenti implicazioni
La C∗-algebra A e abeliana.
⇓La C∗-algebra A e asintoticamente abeliana in norma.
⇓Per ogni ω ∈ EA
G la coppia A, ω e G-abeliana.
Osserviamo che uno stato vettoriale ω′ e definito in rappresentazione G.N.S.
dalla relazione ω′(A) ≡ (ϕ; πω(A)ϕ) per un qualche ϕ ∈ Hω e la G-invarianza
impone che
(ϕ; πω(A)ϕ) = ω′(A) = ω′(τg(A)) = ω′(A)(ϕ; πω(τg(A))ϕ)
= (ϕ; Uω(g)πω(A)Uω(g)†ϕ) = (Uω(g)†ϕ; πω(A)Uω(g)†ϕ)
per ogni g ∈ G ossia ϕ deve essere invariante sotto l’azione del gruppo unitario
Uω(G). In altri termini ϕ ∈ PωHω essendo Pω il proiettore ortogonale su Hω che
proietta sul sottospazio costituito dai vettori invarianti sotto l’azione del gruppo
Uω(G). Quindi dall’uguaglianza
|ω′([A′; B])| = |(Pωϕ; πω([A′; B])Pωϕ)| = |(ϕ; Pω[πω(A′); πω(B)]Pωϕ)|
segue che la (B.34) e equivalente a
infA′∈ch(τ
G(A))
|(ϕ; [Pωπω(A′)Pω; Pωπω(B)Pω]ϕ)| = 0
271
per ogni A,B ∈ A e per ogni ϕ ∈ Hω. Per la formula di polarizzazione cio implica
che anche l’estremo inferiore di tutti i prodotti scalari misti deve essere nullo e
pertanto cio implica che (B.34) e equivalente alla seguente condizione
infA′∈ch(τ
G(A))
[Pωπω(A′)Pω; Pωπω(B)Pω] = 0. (B.35)
Evidentemente questa relazione e soddisfatta se l’insieme Pωπω(A)Pω e abeliano77
e come conseguenza del Teorema della media ergodica di Alaoglu-Birkhoff si di-
mostra anche che l’abelianita di Pωπω(A)Pω e condizione necessaria affinche valga
la (B.34) o equivalentemente la (B.35). Valgono i seguenti risultati78:
DE.4) si considerino le seguenti condizioni:
i) la coppia A; ω e G-abeliana;
ii) l’insieme Pωπω(A)Pω e abeliano;
iii) l’algebra di von Neumann πω(A) ∪ Uω(G)′ e abeliana;
iv) Mω(EAG) contiene un’unica misura massima µ che risulta ortogonale.
Le implicazioni sono i) ⇔ ii) ⇒ iii) ⇔ iv). Inoltre se accade che ψω e
separante79 per πω(A)′′ allora tutte le precedenti condizioni sono equivalenti
ossia vale anche l’implicazione ii) ⇐ iii).
L’implicazione ii) ⇐ iii) in generale e falsa come si puo verificare con un semplice
contro esempio scegliendo G come il gruppo costituito da un solo elemento (che
deve essere necessariamente l’elemento neutro) ed A una C∗-algebra non abeliana.
In questo caso Uω(G) e 1ω su Hω e la condizione iii) diviene equivalente all’a-
belianita di πω(A)′ mentre la condizione ii) diviene equivalente all’abelianita di
πω(A) e cio non puo accadere per tutti gli stati ω (che sono tutti automaticamente
G-invarianti se il gruppo ha un solo elemento).
Le affermazioni dell’enunciato DE.4) coinvolgono un solo stato invariante ω ∈EA
G. Questo risultato ammette una “versione globale”, valida per tutti gli stati
invarianti ω ∈ EAG. Si dimostra che80:
77Il termine abeliano non va inteso in riferimento a qualche struttura algebrica di
Pωπω(A)Pω ma semplicemente nel senso che gli operatori contenuti in Pωπω(A)Pω commutano
vicendevolmente.78C.f.r. [BR79] Proposizione 4.3.7.79Il vettore ψω e separante per πω(A)′′ se per ogni M ∈ πω(A)′′ la condizione Mψω = 0
implica che M = 0. Come fatto generale segue che se ψω e separante per πω(A)′′ allora e ciclico
per πω(A)′, ossia πω(A)′ψω = Hω. C.f.r. [BR79] Proposizione 2.5.3.80C.f.r. [BR79] Proposizione 4.3.11.
272
DE.5) Le seguenti condizioni sono equivalenti:
i) per ogni ω ∈ EAG la coppia A; ω e G-abeliana;
ii) l’insieme EAG e un simplex;
iii) per ogni ω ∈ EAG l’algebra di von Neumann πω(A)∪Uω(G)′ e abeliana;
iv) per ogni ω ∈ EAG l’insieme Pωπω(A)Pω e abeliano.
L’implicazione i) ⇒ ii) risulta di grande importanza dato che la proprieta i) e, in
generale, facilmente verificabile mentre la proprieta di essere un simplex (assieme
a qualche condizione aggiuntiva sulla separabilita) assicura che ogni ω ∈ EAG ha
un’unica decomposizione ergodica. La i) e sicuramente verificata se la C∗-algebra
A e abeliana oppure gode dell’abelianita asintotica in norma.
B.5.4 Stati ergodici e proprieta di mixing
Nel precedente paragrafo abbiamo discusso la realizzazione della decomposizione
degli stati G-invarianti in termini di un’unica misura ortogonale e massima su EAG.
Questa teorie e una diretta generalizzazione della teorie della decomposizione degli
stati di una generica C∗-algebra A. Le proprieta di abelianita di A sono rimpiaz-
zate dalle proprieta di G-abelianita e gli stati EA sono rimpiazzati dagli stati G-
invarianti EAG. Gli stati G-ergodici, ossia gli stati estremali PA
G dell’insieme EAG
corrispondono agli stati puri PA di un’algebra abeliana ed e lecito aspettarsi che
essi godano di proprieta simili. Gli stati puri su una C∗-algebra abeliana generano
delle rappresentazioni irriducibili che devono essere necessariamente unidimension-
ali e cio ha come conseguenza che essi fattorizzano, ossia ω(AB) = ω(A)ω(B) per
ogni A,B ∈ A. Ognuna di queste proprieta ha un analogo per gli stati G-ergodici
in cui, tuttavia, il gruppo G e la sua rappresentazione Uω(G) intervengono in modo
cruciale. Discuteremo delle proprieta di “fattorizzazione approssimata” degli stati
chiamate proprieta di mixing o proprieta di cluster il cui prototipo e dato
da
infB′∈ch(τG (B))
|ω(AB′C)− ω(AC)ω(B)| = 0.
Molti dei risultati che enunceremo sono indipendenti dall’assunzione che la
coppia A; ω sia G-abeliana.
Nello studio degli stati ergodici il primo, importante, risultato che si dimostra81
lega i concetti di irriducibilita e di ergodicita.
81C.f.r. [BR79] Teorema 4.3.17.
273
SE.1) Si considerino le seguenti condizioni:
i) Pω ha rango uno, ossia il sottospazio di Hω su cui Pω proietta e unidi-
mensionale ed e generato dal solo vettore ψω;
ii) lo stato ω e G-ergodico, ossia ω ∈ PAG;
iii) l’insieme di operatori πω(A) ∪ Uω(G) e irriducibile su Hω;
iv) Zω(A) ∩ Uω(G)′ = C1ω;
valgono le implicazioni i) ⇒ ii) ⇔ iii) ⇒ iv). Se inoltre la coppia A; ω e
G-abeliana allora vale anche l’implicazione i) ⇐ ii).
Osserviamo che se A = L (H) con H generico spazio di Hilbert, ω un qualunque
stato vettoriale e G il gruppo costituito da un solo elemento (e pertanto rappre-
sentato dall’automorfismo identita) allora la condizione ii) puo essere vera anche
se la i) e falsa come accade non appena la dimensione di H e maggiore di uno.
Cio prova che la G-abelianita della coppia A, ω e necessaria per l’implicazione
i) ⇒ ii).
L’insieme Zω(A) ∩ Uω(G)′ che compare nel punto iv) e chiamato centro
invariante e la condizione Zω(A) ∩ Uω(G)′ = C1ω e detta di ergodicita
centrale . Gli stati che verificano detta condizione, sono chiamati centralmente
ergodici . Per quanto affermato dalla SE.1) tutti gli stati G-ergodici ω ∈ PAG sono
anche centralmente ergodici ma in generale non e vero il viceversa. Quello che e
possibile dimostrare82 e che se lo stato invariante ω ∈ EAG verifica la condizione
πω(A)′′ ∩ Uω(G)′ = C1ω allora ω ∈ PAG, tuttavia non vale il viceversa nel
senso che la precedente condizione non viene implicata dal fatto che lo stato ω sia
G-ergodico.
Per concludere questa sezione esaminiamo la caratterizzazione dell’ergodicita
in termini delle proprieta di cluster. I criteri che forniremo di seguito non sono
criteri diretti per l’ergodicita bensı criteri che garantiscono l’unidimensionalita del
proiettore Pω. Questa condizione in virtu della SE.1) risulta sufficiente a garantire
anche l’ergodicita. Si dimostra che83:
SE.2) Sia ω ∈ EAG uno stato invariante, allora le seguenti condizioni sono equi-
valenti:
i) Pω ha rango uno, ossia il sottospazio di Hω su cui Pω proietta e unidi-
mensionale ed e generato dal solo vettore ψω;
82C.f.r. [BR79] Teorema 4.3.20.83C.f.r. [BR79] Teorema 4.3.22.
274
ii) per ogni A, B ∈ A vale che
infB′∈ch(τ
G(B))
|ω(AB′)− ω(A)ω(B)| = 0;
iii) per ogni B ∈ A esiste un net Bαα∈I ⊆ ch(τG(B)) tale che
limα→∞
|ω(Aτg(Bα))− ω(A)ω(B)| = 0 ∀ A ∈ A
uniformemente in g ∈ G.
La condizione che compare al punto ii) viene detta proprieta di cluster a due
punti .
Se la coppia A, ω e G-abelianita allora per la SE.1) la condizione ω ∈ PAG e
equivalente all’unidimensionalita del proiettore Pω e questa proprieta per la SE.2)
e equivalente all’esistenza di un net Bαα∈I ⊆ ch(τG(B)) tale che
limα→∞
|ω(ABα)− ω(A)ω(B)| = 0 ∀ A,B ∈ A.
Puo essere interessante avere un criterio per stabilire quali stati ammettono
l’esistenza di un net gαα∈I ⊆ G tale per cui
limα→∞
|ω(Aτgα(B))− ω(A)ω(B)| = 0 ∀ A,B ∈ A.
Una tale proprieta di cluster occorre nella teoria ergodica classica e risulta im-
portante nelle teorie non commutative. Si puo dimostrare84 che se esiste un net
gαα∈I ⊆ G su cui e verificata la condizione di abelianita asintotica uniforme
limα→∞
‖[A; τgα(B)]‖ = 0 ∀ A,B ∈ A
allora per ogni stato fattoriale ω ∈ EfA (non necessariamente invariante) vale che
limα→∞
|ω(Aτgα(B))− ω(A)ω(B)| = 0 ∀ A,B ∈ A.
Tale condizione e detta di strong mixing .
B.6 Proprieta topologiche dei gruppi di simme-
trie
Nei precedenti paragrafi abbiamo discusso l’effetto di un gruppo di simmetria G
che agisce su una C∗-algebra A tramite una rappresentazione τ nel gruppo degli
84C.f.r. [BR79] Esempio 4.3.24.
275
automorfismi Aut(A). I risultati ottenuti sono assolutamente indipendenti dalla
natura del particolare gruppo preso in esame. In questo paragrafo invece saremo
interessati ai particolari gruppi G dotati di una struttura topologica ed in partico-
lare saremo interessati ai gruppi localmente compatti. Le proprieta topologiche di
G permettono di definire una qualche forma di continuita per la rappresentazione
τ e cio comporta delle nuove ed interessanti proprieta.
B.6.1 Misure su gruppi localmente compatti
In questo paragrafo introdurremo i concetti fondamentali della teoria della misura
su gruppi dotati di una topologia. Per i dovuti approfondimenti si rimanda al
Capitolo XI di [Hal50].
Un gruppo topologico G e una insieme dotato simultaneamente delle strut-
ture di gruppo e di spazio topologico di Hausdorff con la compatibilita tra le due
strutture derivante dalla richiesta che la trasformazione definita da
G×G 3 (g1, g2) → g1−1 · g2 ∈ G
deve essere continua. La topologia presente su G consente di definire in modo nat-
urale la σ-algebra di Borel B. Nel seguito supporremo sempre che G sia localmente
compatto di Hausdorff rispetto alla sua struttura topologica.
Dato un gruppo localmente compatto di Hausdorff G si chiama misura di
Haar una misura boreliana e positiva µH : B → R+ tale che µH(A) > 0 per ogni
sottoinsieme di Borel A ⊆ G aperto e non vuoto A 6= ∅ e tale che µH(g ·H) = µ(H)
per ogni g ∈ G e per ogni borelianoH ⊆ G essendo g ·H ≡ g′ | g′ = g ·h ∀ h ∈ H.L’ultima richiesta e detta invarianza a sinistra della misura.
B.6.1 Lemma. Sia µH una misura boreliana, positiva ed invariante a sinistra su
G. La condizione µH(A) > 0 per ogni sottoinsieme di Borel A aperto e non vuoto
e equivalente ad affermare cha la misura µH non e identicamente nulla.
zDim.
Supponiamo che µH(A) = 0 per qualche sottoinsieme di Borel A aperto e non vuoto. Senza
perdere di generalita possiamo anche supporre che A contenga l’elemento neutro di G dato che
per ogni g ∈ G anche l’insieme g ·A e aperto e boreliano e µH(g ·A) = µH(A) = 0. Se A possiede
l’elemento neutro allora h ·Ah∈C e una copertura aperta di C e per la supposta compattezza di
questo insieme deve esistere una sottocopertura finita h1 ·A, . . . , hn ·A tale che C ⊆ ⋃nj=1 hj ·A.
Per la subadditivita e l’invarianza a sinistra della misura µH segue che
µH(C) 6 µH
n⋃
j=1
hj · A 6
n∑
j=1
µH (hj · A) = n µH(A).
276
Quindi se per un aperto di Borel non vuoto si avesse che µH(A) = 0 allora tutti i compatti di
G avrebbero misura nulla. Poiche il gruppo G e supposto localmente compatto di Hausdorff la
σ-algebra di Borel B risulta generata dalla collezione di tutti i compatti di G. Se la misura
µH si annullasse su tutti i compatti allora sarebbe identicamente nulla su tutti i sottoinsiemi di
Borel. ¨
Possiamo riassumere tutto cio dicendo che una misura di Haar µH su un
gruppo localmente compatto di Hausdorff G e una misura boreliana
positiva e non identicamente nulla che e invariante a sinistra .
Le traslazioni a destra e a sinistra hanno le stesse proprieta su G e pertanto
si possono definire allo stesso modo anche le misure di Haar invarianti a destra.
Tuttavia osservando che la mappa g → g−1 scambiano il concetto di destra e di
sinistra e preservano tutte le altre strutture topologiche e di gruppo ogni osser-
vazione che risulta vera per l’invarianza a sinistra e anche vera per l’invarianza a
destra. In particolare si verifica immediatamente che se µH e una misura di Haar
invariante a sinistra allora la nuova misura νH definita da νH(H) = µH(H−1) e una
misura di Haar invariante a destra. Per tale motivo risulta giustificata ed innocua
la convenzione di considerare le misure di Haar invariante a sinistra.
I teoremi fondamentali riguardo all’esistenza e all’unicita delle misure di Haar
affermano che85:
MH.1) in ogni gruppo topologico localmente compatto di Hausdorff G esiste almeno
una misura regolare di Haar µH ;
MH.2) se µH e νH sono due misure di Haar regolari sul gruppo localmente compatto
di Hausdorff G allora esiste sempre una costante positiva e finita c > 0 tale
che µH(H) = cνH(H) per ogni boreliano H ⊆ G.
Il punto MH.2 assicura, a meno di una normalizzazione, l’unicita della misura
regolare di Haar (invariante a sinistra) µH .
Indicheremo con il simbolo L1[G, µH ] l’insieme delle funzioni f : G → C
integrabili, ossia tali che ‖f‖L1 ≡
∫G|f(g)| dµH(g) < +∞.
Due esempi molto importanti di gruppi topologici localmente compatti di Haus-
dorff sono gli spazi euclidei Rn e Zn. Lo spazio Rn e un gruppo abeliano additivo
localmente compatto di Hausdorff rispetto alla topologia indotta dalla norma eu-
clidea ‖x‖2 =∑n
j=1 |xj|2 per ogni x ≡ (x1, . . . , xn) ∈ Rn. Il fatto che come gruppo
Rn sia abeliano rende completamente superflua la distinzione tra misure di Haar
destra e sinistra. L’unica misura di Haar regolare (a meno di normalizzazioni)
85C.f.r. [Hal50] Paragrafo 58 Teorema B e Paragrafo 60 Teorema C.
277
su Rn e la misura di Lebesgue che e invariante per traslazioni. Anche lo spazio
Zn e un gruppo abeliano localmente compatto di Hausdorff rispetto alla topologia
discreta (che e la naturale restrizione della topologia euclidea di Rn su Zn). Anche
in questo caso l’abelianita rende superflua la distinzione tra misure di Haar destra
e sinistra e l’unica misura di Haar regolare (a meno di normalizzazioni) risulta la
misura discreta che conta i punti, ossia la misura µ definita da µ(Λ) = |Λ| essendo
|Λ| la cardinalita del sottoinsieme discreto Λ ∈ Zn.
B.6.2 Gruppi amenable
In questo paragrafo discuteremo le nozioni basilari della teoria della gruppi ame-
nable . Per i dovuti approfondimenti si rimanda ai lavori di Greenleaf [Gre69b]
e [Gre69a]. Queste nozioni vengono applicate nella descrizione dei sistemi asin-
toticamente abeliani rispetto all’azione di un gruppo di simmetria (ad esempio le
traslazioni). Per tali applicazioni si rimanda ai lavori [KR66] e [DKK67]
Medie invarianti su G
Sia G un gruppo localmente compatto di Hausdorff ed indichiamo con il simbolo
Cb(G) l’insieme delle funzioni continue a valori complessi limitate e con C0(G)
l’insieme delle funzioni continue a valori complesse che si annullano all’infini-
to (ossia definitivamente fuori da ogni compatto di G). Vale l’ovvia inclusione
C0(G) ⊆ Cb(G) con l’uguaglianza che vale solamente nel caso in cui il gruppo G
e compatto. Rispetto alla norma del “sup” ‖f‖∞ = supg∈G |f(g)|. Entrambi gli
insiemi C0(G) e C0(G) hanno una struttura di C∗-algebra rispetto alla norma ‖ ‖∞e all’operazione di aggiunzione data dalla complementazione complessa.
Per ogni funzione f : G→ C e per ogni h ∈ G possiamo definire la traslata a
sinistra hf e la traslata a destra fh nel seguente modo:
hf(g) ≡ f(h−1 · g)
∀ g ∈ G.
fh(g) ≡ f(g · h)
Per definizione di gruppo topologico le mappe g → g · h e g → g · hh−1 · g devono
essere continue e quindi se f ∈ Cb(G) (o in Co(G)) anche hf e fh appartengono a
Cb(G) (o rispettivamente a C0(G)).
Una media m sul gruppo G e un funzionale lineare positivo e normalizzato
(ossia uno stato) sulla C∗-algebra Cb(G). In base alla proprieta FP.1) di Para-
grafo B.1.8 segue che la positivita di m e sufficiente a garantirne la continuita.
278
Diremo che m e una media invariante a sinistra se m(hf) = m(f) per ogni
f ∈ Cb(G). Analogamente diremo che m e una media invariante a destra se
m(fh) = m(f) per ogni f ∈ Cb(G). Una media invariante e una media m che e
contemporaneamente invariante sia a destra che a sinistra.
B.6.2 Lemma. Il gruppo G possiede una media invariante a sinistra se e solo se
possiede una media invariante a destra.
zDim.
Per verificare cio osserviamo che per ogni f ∈ Cb(G) anche la funzione f definita da f(g) ≡ f(g−1)
appartiene a Cb(G) in quanto la mappa g → g−1 e continua. Inoltre ‖f‖∞ = ‖f‖∞. Se m e
una media invariante a destra allora si puo definire una nuova media m tramite la relazione
m(f) ≡ m(f) per ogni f ∈ Cb(G). Osserviamo che
fh(g) = f(g · h) = f((g · h)−1) = f(h−1 · g−1) =h f(g−1) = hf(g)
per cui
m(hf) = m(hf) = m(fh) = m(f) = m(f)
e quindi m e una media invariante a sinistra. Analogamente si prova che da una media invariante
a sinistre si puo sempre ottenere una media invariante a destra. ¨
La completa simmetria tra media invariante a destra e media invariante a sin-
istra consente di scegliere convenzionalmente solo una delle due definizioni (in par-
ticolare l’invarianza a sinistra) tenendo conto che tutti i “teoremi destri” valgono
anche come “teoremi sinistri”.
In molte occasioni l’esistenza su G di una media invariante a desta m(d) e di
una media invariante a sinistra m(s) permette di costruire una media invariante
m. L’idea di base e quella di associare ad ogni f ∈ Cb(G) una nuova funzione
Ff : G → C definita da Ff (g) ≡ m(s)(fg) per ogni g ∈ G. A questo punto
si puo definire la nuova media come m(f) ≡ m(d)(Ff ) per ogni f ∈ Cb(G). Si
verifica che questa misura e invariante sia a destra che a sinistra. Ad esempio
m(fh) = m(d)(Ffh) ma Ffh
(g) = m(s)((fh)g) = m(s)(fg·h) = Ff (g · h) = (Ff )h(g) e
quindi m(fh) = m(d)(Ffh) = m(d)((Ff )h) = m(d)(Ff ) = m(f) e cio prova l’invarianza
a destra. Similmente si dimostra che Fhf = Ff il che prova anche l’invarianza
a sinistra di m. Il problema di questa costruzione consiste nel fatto che non e
assicurato che la funzione Ff sia ancora un elemento di Cb(G). Affinche questa
costruzione possa funzionare e necessario restringersi ad opportuni spazi di funzioni
con appropriate caratteristiche di continuita uniforme. Tuttavia questo tipo di
studio esula dai nostri interessi.
279
Gruppo amenable ed m-net
Si chiama gruppo amenable un gruppo localmente compatto di Hausdorff G
su cui e definita una media invariante a sinistra m. Non tutti i gruppi amenable
tuttavia questa classe contiene i gruppi compatti, i gruppi abeliani localmente
compatti (quindi Rn e Zn), i gruppi solvilibili localmente compatti. Inoltre ogni
sottogruppo chiuso di un gruppo amenable e ancora amenable ed il quoziente di
un gruppo amenable rispetto ad un sottogruppo normale chiuso e amenable. Non
sono amenable i gruppi semisemplici di Lie non compatti.
Indichiamo con Σ(G) ≡ χ ∈ L1[G, µ] | χ > 0, ‖χ‖L1 = 1 l’insieme delle
funzioni integrabili rispetto alla misura di Haar µ (unica se si fissa la normaliz-
zazione) positive e a norma 1. Un diremo che il net χ(α)α∈I ⊂ Σ(G) converge in
norma L1 ad un invariante sinistro se accade che
limα→∞
‖hχ(α) − χ(α)‖
L1 = limα→∞
∫
G
|χ(α)(h−1 · g)− χ(α)(g)| dµ(g) = 0 ∀ h ∈ G.
Un net χ(α)α∈I ⊂ Σ(G) che verifica questa proprieta e detto m-net .
Indichiamo con M ⊂ Cb(G)∗ l’insieme delle medie (ossia degli stati) su G ed
osserviamo che esiste una mappa Σ(G) 3 χ → mχ ∈ M definita da
mχ(f) ≡∫
G
χ(g)f(g) dµ(g)
La linearita di mχ segue dalla linearita dell’integrale, inoltre se f > 0 anche χf >0dato che per definizione χ > 0 e cio verifica anche il funzionale mχ e positivo.
Poiche mχ e un funzionale lineare positivo sulla C∗-algebra con unita Cb(G) segue,
in base alla FP.1) di Paragrafo B.1.8, che
‖mχ‖ = mχ(1) =
∫
G
χ(g) dµ(g) = ‖χ‖L1 = 1
e quindi mχ e normalizzato. Cio verifica che mχ ∈ M e con abuso di notazione
scriveremo che Σ(G) ⊂ M . L’insieme Σ(G) come di sottoinsieme di M e ∗-debolmente denso nel sottoinsieme di tutte le “medie integrale” definite da una
misura uniformemente continua rispetto alla (unica) misura di Haar regolare µ.
Inoltre per il Teorema di Riesz-Markov una media invariante a sinistra definisce
una misura regolare di Borel invariante a sinistra che deve essere uniformemente
continua rispetto alla misura regolare di Haar µ. Questo significa che se il gruppo
G ha una media invariante a sinistra m allora esiste un net χ(α)α∈I ⊂ Σ(G) tale
che mχα
∗−w−→ m. Possiamo dimostrare la seguente importante caratterizzazione dei
gruppi amenable.
280
B.6.3 Proposizione. Il gruppo localmente compatto G e amenable se e solamente
se possiede un m-net, ossia un net χ(α)α∈I ⊂ Σ(G) che converge in norma ‖ ‖L1
ad un invariante sinistro.
zDim.
(⇒) Se G e amenable allora possiede una media invariante a sinistra m ed esistere un net
χ(α)α∈I ⊂ Σ(G) che genera medie ∗-debolmente convergenti a m. Osserviamo che per ogni
f ∈ Cb(G) e per ogni h ∈ G
mhχα
(f)−mχα(f) =
∫
Ghχα(g)f(g) dµ(g)−
∫
G
χα(g)f(g) dµ(g)
=∫
G
χα(h−1 · g)f(g) dµ(g)−∫
G
χα(g)f(g) dµ(g)
=∫
G
χα(g)f(h · g) dµ(g)−∫
G
χα(g)f(g) dµ(g) = mχα(h−1f)−mχα
(f).
Poiche per l’invarianza di m si ha che m(h−1f) = m(f) possiamo scrivere
|mhχα(f)−mχα(f)| = |mχα(h−1f)−mχα(f)| = |mχα(h−1f)−m(h−1f) + m(f)−mχα(f)|
6 |mχα(h−1f)−m(h−1f)|+ |m(f)−mχα(f)|.
Dato che mχα
∗−w−→ m segue che per ogni f ∈ Cb(G) le due quantita |mχα(h−1f) − m(h−1f)| → 0
e |m(f)−mχα(f)| → 0 se α →∞ per cui
limα→∞
|mhχα(f)−mχα(f)| = lim
α→∞
∣∣∣∣∫
G
[χα(h−1 · g)− χα(g)]f(g) dµ(g)∣∣∣∣ = 0.
L’arbitrarieta di f (ad esempio si puo scegliere f(g) = [χα(h−1 · g)− χα(g)]) implica che
limα→∞
∣∣∣∣∫
G
|χα(h−1 · g)− χα(g)| dµ(g)∣∣∣∣ = ‖hχ(α) − χ(α)‖
L1 = 0
e cio prova che χ(α)α∈I ⊂ Σ(G) e un m-net.
(⇐) Se G possiede un m-net χ(α)α∈I ⊂ Σ(G) possiamo costruire il funzionale lineare
m(f) ≡ limα→∞
∫
G
χα(g)f(g) dµ(g) ∀ f ∈ Cb(G).
Evidentemente questo funzionale e lineare (per la linearita dell’integrale) e positivo (se f > 0
allora m(f) e limite di quantita non negative). Inoltre
‖m‖ = m(1) = limα→∞
∫
G
χα(g) dµ(g) = limα→∞
‖χα‖L1 = 1.
Resta solamente da verificare che m e una media invariante a sinistra. Per ogni f ∈ Cb(G) vale
281
che
|m(hf − f)| =∣∣∣∣ limα→∞
∫
G
χα(g)[f(h−1 · g)− f(g)] dµ(g)∣∣∣∣
=∣∣∣∣ limα→∞
∫
G
χα(h · g)f(g) dµ(g)− limα→∞
∫
G
χα(g)f(g) dµ(g)∣∣∣∣
6 ‖f‖∞ limα→∞
∫
G
|χα(h · g)− χα(g)| dµ(g) = 0.
e cio prova che la media m e invariante a sinistra. ¨
Costruzione di m-net
La precedente caratterizzazione risulta estremamente importante dato che esistono
criteri generali per costruire un m-net. Si dimostra86 che
PF) il gruppo localmente compatto G e amenable se e solo se comunque fissato un
ε > 0 ed un sottoinsieme compatto C ⊂ G esiste un sottoinsieme boreliano
Λ ⊂ G con 0 < µ(Λ) < +∞ tale che
µ((h · Λ)4Λ)
µ(Λ)< ε ∀ h ∈ C
essendo (h · Λ)4Λ ≡ ((h · Λ) ∪ Λ) \ ((h · Λ) ∩ Λ).
La PF) e detta Proprieta di Følner ed intuitivamente afferma che un gruppo e
amenable se e possibile costruire insieme boreliani sufficientemente grandi da poter
essere spostati relativamente poco dall’azione degli elementi di ogni compatto C.
Mentre e piuttosto complicato verificare che se G e amenable allora vale la PF) e,
invece, abbastanza semplice verificare che la PF) implica l’esistenza di un m-net
e quindi il fatto che G sia amenable. Se vale la PF) per ogni ε > 0 e per ogni
compatto C ⊂ G esiste un boreliano Λα ⊂ G indicizzato da α ≡ α(ε, C). L’insieme
di questi indici, che indicheremo con I, risulta parzialmente ordinato tramite la
relazione α(ε2, C2) 6 α(ε1, C1) se e solo se ε1 6 ε2 e C2 ⊆ C1. Inoltre I e anche
un sistema diretto i quanto per ogni coppia di indici α(ε2, C2) e α(ε1, C1) l’indice
α(ε, C) con ε 6 minε1, ε2 e (C1 ∪ C2) ⊆ C e tale per cui α(εj, Cj) 6 α(ε, C) con
j = 1, 2. Consideriamo il net di funzioni L1[G, µ] definito da
χα ≡ ζΛα
µ(Λα)con ζΛα(g) =
1 se g ∈ Λα
0 se g /∈ Λα.
86C.f.r. [Gre69b] Teorema 3.6.2.
282
Evidentemente le funzioni χα ∈ Σ(G) in quanto positive ed a norma 1. Inoltre il
net converge in norma ad un’invariante sinistro, infatti
‖hχα − χα‖L1 =1
µ(Λα)
∫
G
|ζΛα(h−1 · g)− ζΛα(g)| dµ(g)
=1
µ(Λα)
∫
G
|ζ(h·Λα)(g)− ζΛα(g)| dµ(g) =µ((h · Λα)4Λα)
µ(Λα).
Il singolo punto h e un compatto di G e quindi comunque fissato un ε > 0 esiste
un α(ε, h) tale che per ogni α > α si ha che ‖hχα − χα‖L1 < ε. l’arbitrarieta di
ε implica che limα→∞ ‖hχα − χα‖L1 = 0 per ogni h ∈ G e pertanto la collezione di
funzioni χα definisce un m-net.
I gruppi Rν e Zν
Consideriamo i due spazi euclidei Rν e Zν con ν ∈ N. Questi spazi risultano grup-
pi abeliani rispetto all’operazione interna indotta dalla somma e sono localmente
compatti come spazi topologici. Quindi Rν e Zν sono due gruppi amenable. Es-
ibiremo per questo gruppi un esempio esplicito di m-net utilizzando la Proprieta
di di Følner.
Consideriamo la famigli (numerabile) costituita dai cubi chiusi centrati nell’o-
rigine Λm ≡ ∏νj=1[−m,m] ⊂ Rν con m ∈ N. Se µ e la misura di Lebesgue su
Rν allora µ(Λm) = (2m)ν . Sia k ≡ k1, . . . , kν un generico elemento di Rν ed
osserviamo che il traslato di Λm e dato da (k + Λm) ≡ ∏νj=1[kj − m, kj + m].
Vogliamo dare una stima di (k + Λm)4Λm. Consideriamo prima il caso in cui
ki ≡ 0, . . . , 0, ki, 0, . . . , 0 ed osserviamo che
(ki + Λm)4Λm =
(∏
j 6=i
[−m, +m]
)× ([−m, kj −m] ∪ [m,m + kj])
dove, senza perdere di generalita, si e assunto kj > 0. Dalla precedente relazione
segue immediatamente che µ((ki + Λm)4Λm) = 2νmν−1ki. Si puo pensare di
compiere la generica traslazione k in ν passi successivi, una per ogni direzione di
riferimento. Ogni traslazione aggiunge al computo di µ((k+Λm)4Λm) un termine
che e maggiorato da 2νmν−1|ki| se ki e la quantita (positiva o negativa) di cui si
trasla nella direzione i-esima. Cio comporta che per una generica traslazione deve
valere la disuguaglianza
µ((k + Λm)4Λm) 6 2νmν−1(|k1|+ . . . + |kν |) 6 ν2νmν−1‖k‖
283
da cui segue immediatamente che
limm→+∞
µ((k + Λm)4Λm)
µ(Λm)6 lim
m→+∞ν2νmν−1‖k‖
(2m)ν= lim
m→+∞ν‖k‖m
= 0 ∀ k ∈ Rν .
Cio verifica che la famiglia di cubi Λmm∈N ⊂ Rν verifica la proprieta PF) e
quindi puo essere utilizzata per costruire un m-net su Rν . Con un conto analogo
(complicato sola dalla presenza di qualche coefficiente nelle formule) si dimostra
che la stessa proprieta e verificata anche dalla famiglia di parallelepipedi Λm ≡∏νj=1[−ajm, bjm] con m ∈ N e aj, bj ∈ R+ per ogni j = 1, . . . , ν. Osserviamo
ancora che per ogni a ∈ Rν
a + ((k + Λm)4Λm) = (a + k + Λm)4(a + Λm) = (k + Λ(a)m )4Λ(a)
m
avendo indicato con Λ(a)m ≡ a + Λm il parallelepipedo centrato in a. Dato che la
misura di Lebesgue e invariante per traslazioni si ottiene che
µ((k + Λm)4Λm)
µ(Λm)=
µ((k + Λ(a)m )4Λ
(a)m )
µ(Λ(a)m )
e cio prova che anche la generica famiglia Λ(a)m m∈N ⊂ Rν di parallelepipedi cen-
trati nel punto a ∈ Rν verifica la proprieta PF) e quindi puo essere utilizzata per
costruire un m-net su Rν .
Tutte le considerazioni fatte si estendono in modo identico anche al caso Zν
con l’unica differenza che la misura di Lebesgue viene rimpiazzata dalla misura
discreta che conta i punti degli insiemi.
B.6.3 Il Teorema ergodico di von Neumann
Sia G un gruppo localmente compatto di Hausdorff con misura Haar µ e sia H uno
spazio di Hilbert su cui il gruppo G ha una rappresentazione unitari fortemente
continua G 3 g → U(g) ∈ L (H). Il fatto che il gruppo sia fortemente (sarebbe
sufficiente debolmente continuo) continuo nel parametro g implica che per ogni
coppia di vettori ψ, ϕ ∈ H la funzione (ψ; U(·)ϕ);G → C e continua e quindi
integrabile rispetto alla misura di Haar µ. Quindi per ogni ψ, ϕ ∈ H e per ogni
f ∈ L1[G; µ] e ben definita l’espressione
Lf (ψ; ϕ) ≡∫
G
f(g) (ψ; U(g)ϕ) dµ(g).
Perla linearita dell’integrale e per le proprieta del prodotto scalare si verifica im-
mediatamente che il funzionale Lf (·, ·) e antilineare nella prima variabile e lineare
nella seconda. Infine osserviamo ancora che
284
|Lf (ψ; ϕ)| =∣∣∣∣∫
G
f(g) (ψ; U(g)ϕ) dµ(g)
∣∣∣∣ 6∫
G
|f(g)| |(ψ; U(g)ϕ)| dµ(g)
6 ‖ψ‖ ‖ϕ‖∫
G
|f(g)| ‖U(g)‖ dµ(g) = ‖f‖L∞‖ψ‖ ‖ϕ‖.
Come conseguenza del Lemma di Riesz 87 esiste un unico operatore limitato If
(con norma non superiore a ‖f‖L∞ ) tale che Lf (ψ; ϕ) = (ψ; Ifϕ) da cui segue che
If ≡∫
G
f(g) U(g) dµ(g)
Questa relazione definisce l’ integrale in senso debole della funzione a valori
operatori G 3 g → f(g) U(g) ∈ L (H).
B.6.4 Teorema (ergodico di von Neumann). Sia G un gruppo amenable, la
collezione χαα∈I un m-net, H uno spazio di Hilbert su cui e definita la rappre-
sentazione unitaria fortemente continua G 3 g → U(g) ∈ L (H) e P il proiettore
ortogonale sul sottospazio dei vettori invarianti sotto l’azione degli operatori U(g),
allora
P = s-limα→∞
∫
G
χα(g) U(g) dµ(g).
zDim.
Dobbiamo verificare che per ogni ψ ∈ H
limα→∞
∥∥∥∥(
P −∫
G
χα(g) U(g) dµ(g))
ψ
∥∥∥∥ = 0.
Sicuramente questa relazione e verificata per tutti i vettori invarianti U(g)ψ = Pψ = ψ in quanto
la precedente espressione si riduce a∥∥∥∥(1− 1
∫
G
χα(g) dµ(g))
ψ
∥∥∥∥ = 0 ∀ α.
Resta da verificare la relazione per ogni ψ ∈ Ker(P ). Utilizzando relazione generale Ker(A) =
Im(A†) valida per ogni A ∈ L (H) ed osservando che P = P † in quanto proiettore segue che
Im(P ) =⋂
g∈GKer(U(g)−1) =
⋂
g∈GIm(U(g)†−1)⊥ =
⋂
g∈GIm(U(g)−1)⊥ =
⋃
g∈GIm(U(g)− 1)
⊥
da cui
Ker(P ) = Im(P )⊥ =
⋃
g∈GIm(U(g)− 1)
⊥⊥
=⋃
g∈GIm(U(g)− 1).
87C.f.r. [RS72] Teorema II.4.
285
Questa relazione implica che per ogni ψ ∈ Ker(P ) e per ogni ε > 0 devono esistere g1, . . . , gn ∈ Ge ϕ1, . . . , ϕn ∈ H tali che ∥∥∥∥∥∥
ψ −n∑
j=1
(U(gj)ϕj − ϕj)
∥∥∥∥∥∥< ε.
In base a questa approssimazione il teorema risulta verificato se si dimostra che
limα→∞
∥∥∥∥(
P −∫
G
χα(g) U(g) dµ(g))
(U(g′)ϕ− ϕ)∥∥∥∥ = 0 ∀ g′ ∈ G, ϕ ∈ H.
Osserviamo che∥∥∥∥(
P −∫
G
χα(g) U(g) dµ(g))
(U(g′)ϕ− ϕ)∥∥∥∥ =
∥∥∥∥(∫
G
χα(g) U(g) dµ(g))
(U(g′)ϕ− ϕ)∥∥∥∥
=∥∥∥∥(∫
G
χα(g) (U(g · g′)− U(g)) dµ(g))
ϕ
∥∥∥∥ =∥∥∥∥(∫
G
(χα(g · g′−1)− χα(g)) U(g)dµ(g))
ϕ
∥∥∥∥
6∫
G
|χα(g · g′−1)− χα(g)| ‖U(g)ϕ‖ dµ(g) = ‖ϕ‖∫
G
|χα(g · g′−1)− χα(g)| dµ(g)
e dato che χαα∈I un m-net segue la tesi. ¨
Se G e amenable allora ammette un net di sottoinsiemi boreliani λαα∈I che
realizza la proprieta di Følner PF). Introducendo le funzioni χα ≡ ζΛα/µ(Λα) che
realizzano il m-net l’enunciato del Teorema di von Neumann si riscrive
P = s-limα→∞
1
µ(Λα)
∫
Λα
U(g) dµ(g). (B.36)
La B.36 e particolarmente utile soprattutto nei casi dei gruppi Rν e Zν . In
particolare nel caso discreto la precedente equazione si riscrive
P = s-limα→∞
1
|Λα|∑x∈Λα
U(x) (B.37)
dove ad esempio la collezione Λαα∈I puo essere costituita da parallelepipedi
concentrici che divengono infinitamente grandi.
Nel caso dei gruppi R o rel l’equivalente della famiglia di parallelepipedi con-
centrici ν-dimensionale e fornito dalla collezione di intervalli Λτ ≡ [−τ ; τ ] con
τ > 0. Se si indica con dt la misura di Lebesgue su R l’equivalente della (B.36)
diviene
P = s-limτ→+∞
1
2τ
∫ +τ
−τ
U(t) dt.
Nel caso discreto invece si ottiene che
P = s-limτ→+∞
1
2τ + 1
+τ∑tn=−τ
U(tn).
286
Bibliografia
[AA67] V. I. Arnold and A. Avez. “Problemes Ergodiques de la Mecanique
Classique.” Gauthier-Villars, Parigi, 1967.
[Afa96] T. E. Afanassjeva. “I Fondamenti della Termodinamica.” La Goliardica
Pavese, Pavia, 1996.
[Arn99] V. I. Arnold. “Metodi Matematici Della Meccanica Classica.” Editori
Riuniti, Roma, III edition, 1999.
[Bol96] L. Boltzmann. Ann. Physik, 57: 773, 1896.
[BR79] O. Bratteli and D. W. Robinson. “C∗- and W ∗-Algebras. Symmetry
Groups. Decomposition of States.”, volume 1 of “Operator Algebras and
Quantum Statistical Mechanics.” Springer-Verlag, New York-Heidelberg,
II edition, 1979.
[BR81] O. Bratteli and D. W. Robinson. “Equilibrium States. Models in Quan-
tum Statistical Mechanics.”, volume 2 of “Operator Algebras and Quan-
tum Statistical Mechanics.” Springer-Verlag, New York-Heidelberg, II
edition, 1981.
[Bro76] J. R. Brown. “Ergodic Theory and Topological Dynamics.” Academic
Press, New York, 1976.
[Bru67] S. G. Brush. “History of the Lenz-Ising Model.” Rev. Mod. Phys., 39:
883–893, 1967.
[BS70] N. P. Bhatia and G. Szego. “Stability Theory of Dynamical Systems.”
Springer, Berlino, 1970.
[BS91] L. Bunimovich and Y. Sinai. Commun. Math. Phys., 78: 479, 1991.
287
[Che94] N. Chernov. “Statistical Properties of the Periodic Lorentz Gas:
Multidimensional Case.” J. Stat. Phys., 74: 11–53, 1994.
[Dix77] J. Dixmier. “C∗-algebras.” North Holland, 1977.
[Dix81] J. Dixmier. “Von Neumann Algebras.” North Holland, 1981.
[DKK67] S. Doplicher, R.V. Kadison, and D. Kastler. “Asymptotically Abelian
Systems.” Commun. math. Phys., 6: 101–120, 1967.
[Ein05] A. Einstein. “uber die von der molekular kintische theorie der
warme geforderte bewegung von in ruhenden flussigkeiten suspendierten
teilchen.” Ann. Physik, 17: 549, 1905.
[Fel60] J. M. G. Fell. “The Dual Space of C∗-Algebras.” Trans. Amer. Math.
Soc., 94: 365, 1960.
[Fri92] J. Fritz. “Derivation of Hydrodynamic Equations from Microscopic Prin-
ciples.” “From Phase Transition to Chaos, Topics in Modern Statistical
Physics.” World Scientific, Singapore, 1992.
[Gib02] W. Gibbs. “Elementari Principles of Statistical Mechanics.” Yale
University Press, 1902.
[GM99] F. Gentili and G. Morchio. “Irreversible Weak Limits of Classical
Dynamical Systems.” J. Math. Phys., 40: 4400–4418, 1999.
[Gol01] S. Goldstein. “Boltzmann’s Approach to Statistical Mechanics.” preprint
arXiv:cond-mat/0105242, 2001.
[Gre69a] F. P. Greenleaf. “Amenable Actions of Locally Compact Groups.” J.
Func. Anal., 4: 295–315, 1969.
[Gre69b] F. R. Greenleaf. “Invariant Means on Toplogical Groups and Their
Applications.” D. Van Nostrand Company, New York, 1969.
[Haa59] R. Haag. “Discussion des Axiomes et des Proprietes Asymptotiques
d’une Theorie des Champs Locale avec Particules Composees.” Les
Problemes Mathematiques de la Theorie Quantique des Champs. Centre
National de la Recherche Scientifique, Parigi, 1959.
[Haa93] R. Haag. “Local Quantum Physics.” Springer, New York, 1993.
288
[Hal50] P. R. Halmos. “Measure Theory.” D. Van Nostrand Company, Princeton,
New Jersey, 1950.
[Hal56] P. R. Halmos. “Lectures on Ergodic Theory.” The Mathematical Society
of Japan, Tokyo, 1956.
[HK64] R. Haag and D. Kastler. “An Algebraic Approach to Quantum Field
Theory.” J. Math. Phys., 5: 848, 1964.
[HS62] R. Haag and B. Schroer. “Postulates of Quantum Field Theory.” J.
Math. Phys., 3: 248, 1962.
[HS74] M. W. Hirsch and S. Smale. “Differentia Equation, Dynamical Systems
and Linear Algebra.” Accademic Press, New York, 1974.
[Hua97] K. Huang. “Meccanica Statistica.” Zanichelli, Bologna, 1997.
[HY61] G. J. Hocking and G. S. Young. “Topology.” Dover Publications, New
York, 1961.
[Jan63] R. Jancel. “Les Fondements de la M?canique Statistique Classique et
Quantique.” Gauthier-Villars, Parigi, 1963.
[Kad67] R. V. Kadison. “Lectures on operator algebras.” in “Applications of
mathematics to problems in theoretical physics.” Gordon & Breach, New
York, 1967.
[Khi49] A. I. Khinchin. “Mathematical Fundations of Statistical Mechanics.”
Dover Publications, New York, 1949.
[KR66] D. Kastler and D. W. Robinson. “Invariant States in Statistical
Mechanics.” Commun. math. Phys., 3: 151–180, 1966.
[KR83] R. V. Kadison and J. R. Ringrose. “Fundamentals of the Theory of
Operatpr Algebras.”, volume I-IV. Accademic Press, 1983.
[Lan75] O. Lanford. “Time Evolution of Large Classical Systems.”, volume 38
of Lecture Notes in Physics. Springer, Berlino, 1975.
[Leb93a] J. L. Lebowitz. “Boltzmann’s Entropy and Time’s Arrow.” Physics
Today, 46: 32–38, 1993.
289
[Leb93b] J. L. Lebowitz. “Macroscopi Laws, Microscopic Dynamics, Time’s Arrow
and Boltzmann’s Entropy.” Physica A, 194: 1–27, 1993.
[LG03] J. L. Lebowitz and S. Goldstein. “On the (Boltzmann) Entropy of
Nonequilibrium Systems.” preprint arXiv:cond-mat/0304251, 2003.
[LL99a] L. Landau and E. Lifshitz. “Fisica Statistica.”, volume V of “Corso di
Fisica Teorica.” Editori Riuniti, Roma, II edition, 1999.
[LL99b] L. Landau and E. Lifshitz. “Meccanica.”, volume I of “Corso di Fisica
Teorica.” Editori Riuniti, Roma, IV edition, 1999.
[LM61] E. H. Lieb and T. Schultzand D. C. Mattis. “Two Soluble Models of an
Antiferromagnetic Chain.” Ann. Phys., 16: 407–466, 1961.
[LM66] E. H. Lieb and D. C. Mattis. “Mathematical Physics in One Dimension
(a collection of preprints).” Academic Press, 1966.
[LS82a] J. L. Lebowitz and H. Spohn. J. Stat. Phys., 28: 539, 1982.
[LS82b] J. L. Lebowitz and H. Spohn. J. Stat. Phys., 29: 39, 1982.
[Mac96] E. Mach. “Die Prinzipien der Warmelehre historisch-kritisch
dargestellt.” Lipsia, 1896.
[Mac92] M. C. Mackey. “Time’s Arrow: Thr Origins of Thermodynamic
Behavior.” Springer-Verlag, New York, 1992.
[OU41] I. Oxtoby and S. Ulam. Ann. of Math., 42: 874, 1941.
[OVY93] S. Olla, S. R. S. Varadhan, and H. T. Yau. “Hydrodinamical Limit for
a Hamilton System With Weak Noise.” Commun. Math. Phys., 155:
523–560, 1993.
[Pla13] M. Plancherel. Ann. Physik, 42: 1061, 1913.
[PS95] C.D. Pagani and S. Salsa. “Analisi Matematica.”, volume II. Masson,
Milano, 1995.
[Ros13] A. Rosenthal. Ann. Physik, 42: 796, 1913.
[RS72] M. Reed and B. Simon. “Functional Analysis.”, volume I of “Methods
of Modern Mathematical Phisics.” Academic Press, New York-London,
I edition, 1972.
290
[RS75] M. Reed and B. Simon. “Fourier Analysis. Self-Adjointness.”, volume II
of “Methods of Modern Mathematical Phisics.” Academic Press, New
York-London, I edition, 1975.
[Rud74] W. Rudin. “Analisi Reale e Complessa.” Boringhieri, Torino, 1974.
[Rue69] D. Ruelle. “Statistical Mechanics: Rigorous Results.” Benjamin, New
York, 1969.
[Rue99] D. Ruelle. “Smooth Dynamics and New Theoretical Ideas in Nonequi-
librium Statistical Mechanics.” J. Stat. Phys., 95: 393–468,
1999.
[Sak71] S. Sakai. “C∗-algebras and W ∗-algebras.” Springer, Berlino, 1971.
[Seg47] I. E. Segal. “Postulates for General Quantum Mechanics.” Ann. Math.,
48: 930, 1947.
[Seg59] I. E. Segal. “Caracterisation Mathematique des Observables en Theorie
Quantique des Champs et ses Consequences pour la Structure des Par-
ticules Libres.” Les Problemes Mathematiques de la Theorie Quantique
des Champs. Centre National de la Recherche Scientifique, Parigi, 1959.
[Sim93] B. Simon. “The Statistical Mechanics of Lattice Gases.”, volume I.
Princeton University Press, Princeton, New Jersey, 1993.
[Sin63] Y. Sinai. “On the Foundations of the Ergodic Hypothesis for a Dynam-
ical System of Statistical Mechanics.” Sov. Math. Dokl., 4: 1818–1822,
1963.
[Sin67] Y. Sinai. “Ergodicity of Boltzmann’s Gas Model.” “Statistical Mechanics,
Foundations and Applications.” Benjamin, New York, 1967.
[Sph91] H. Sphon. “Large Scale Dynamics of Interacting Particles.” Springer,
Berlino, 1991.
[Tak79] M. Takesaki. “Theory of Operator Algebras.”, volume I. Springer, New
York, 1979.
[Tes97] A. Tesei. “Istituzioni di Analisi Superiore.” Boringhieri, Torino, 1997.
[tH54] D. ter Haar. “Elements fo Statistical Mechanics.” Rinehart & Co., New
York, 1954.
291
[Thi80] W. Thirring. “Quantum Mechanics of Large Systems.”, volume 4 of
“A Course in Mathematical Physics.” Springer-Verlag, New York-Wien,
1980.
[Uhl68] G. E. Uhlenbeck. “An Outline of Statistical Mechanics.”, volume II of
“Fundamental Problems in Statistical Mechanics.” E. G. D. Cohen, New
York, 1968.
[Wig70] A. S. Wightman. “Statistical Mechanics end Ergodic Theory: an Expos-
itory Lecture.” “Statistical Mechanics at the Turn of the Decade.” E. G.
D. Cohen, New York, 1970.
292