Appunti del corso di Introduzione alla Relatività Generale · Appunti del corso di Introduzione...

Appunti del corso diIntroduzione alla Relatività Generale

Raccolti da

Carlo Mascaretti

Prof. Dietmar KlemmDipartimento di Fisica, Università degli Studi di Milano

Anno Accademico 2012-2013

Indice

1 Introduzione e motivazione 5

2 Parentesi matematica: geometria differenziale 72.1 Varietà differenziabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Lo spazio tangente, campi vettoriali e tensoriali . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2.1 Spazio tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.2.2 Covettori e tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.3 Le p-forme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2.4 Le equazioni di Maxwell in forma covariante . . . . . . . . . . . . . . . . . . . . . . 232.2.5 Richiami di relatività ristretta, campi vettoriali e tensoriali . . . . . . . . . . . . . 27

2.3 Varietà (pseudo-)riemanniane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.3.1 Connessioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.3.2 Geodetiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.3.3 Curvatura e tensore di Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.3.4 Equazione della deviazione geodetica . . . . . . . . . . . . . . . . . . . . . . . . . . 492.3.5 Vettori di Killing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3 Le equazioni di Einstein 573.1 Il tensore energia momento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.1.1 Meccanica dei continui . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573.2 Relazione tra geometria nello spaziotempo e distribuzione di materia . . . . . . . . . . . . 603.3 Gravità linearizzata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623.4 Il limite newtoniano della relatività generale . . . . . . . . . . . . . . . . . . . . . . . . . . 653.5 La soluzione di Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.5.1 Derivazione della soluzione di Schwarzschild . . . . . . . . . . . . . . . . . . . . . . 663.5.2 Geodetiche della geometria di Schwarzschild . . . . . . . . . . . . . . . . . . . . . . 69

3.6 I test classici della relatività generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.6.1 Deviazione della luce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.6.2 Precessione del perielio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.6.3 Dilatazione del tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.6.4 Redshift gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.7 L’estensione di Kruskal del buco nero di Schwarzschild . . . . . . . . . . . . . . . . . . . . 78

4 Cosmologia 854.1 Omogeneità ed isotropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 854.2 Dinamica di un universo omogeneo ed isotropo . . . . . . . . . . . . . . . . . . . . . . . . 90

4.2.1 La legge di Hubble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 904.3 Redshift cosmologico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954.4 Phantom energy, Big Rip, orizzonti cosmologici, coordinate normali di Riemann . . . . . . 98

Testi consigliati 103

Indice analitico 104

La relatività generale è la più grande prestazione del pensieroumano sulla natura; è una notevole combinazione di profondità

filosofica, intuizione fisica ed ingegnosità matematica.La ammiro come un’opera d’arte.

Max Born

Parlerò sinceramente: anche iosarei potuto arrivare alla relatività ristretta,

ma come Einstein abbia tirato fuori quella generalemi rimane totalmente incomprensibile.

Affanculo, sono Feynman e la posso tirarfuori quando voglio, la relatività generale!

Richard Feynman

Circa dal ’97 sappiamodi non sapere nulla.

Dietmar Klemm

-Qualcuno conosce qualche esperimentodi rivelazione di onde gravitazionali?

-Sì, uno dell’INFN.-Dove?

-A Pisa.-Bravi, come si chiama?

-Virgo.-Ah bene. E sapete perchè si chiama così?

-...-Perchè non vedrà mai un cazzo!

Dietmar Klemm

Dedico queste pagine a tutti i miei compagni di corso, in particolar modo a Baso, Beppe, bl4ckst0ne,Brescia, Ghera, Penny e Tommy, senza i quali questi appunti non sarebbero esistiti nella forma presente.

Il curatoreCarlo Mascaretti

Quest’opera è stata rilasciata con licenza Creative Commons Attribuzione - Condividi allo stessomodo 3.0 Italia. Per leggere una copia della licenza visita il sito web o spedisci una lettera a CreativeCommons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.

Le immagini sono state realizzate con Inkscape 0.48.Realizzato con LATEX.

versione aggiornata al 17 settembre 2013 (completa – v3.14159)

http://creativecommons.org/licenses/by-sa/3.0/it/

Capitolo 1

Introduzione e motivazione

Dai tempi di Galileo e di Newton sappiamo che tutti i corpi cadono con la stessa accelerazione, indi-pendentemente dalla loro massa. Questo fatto va sotto il nome di principio di equivalenza debole:la massa inerziale e la massa gravitazionale di qualsiasi oggetto sono uguali. Ma cosa sono la massainerziale e quella gravitazionale? Dalla seconda legge di Newton abbiamo

F = mia (1.0.1)

dove mi è la massa inerziale: tale equazione ci dice che la massa inerziale ha a che fare con la resistenzache sentiamo quando spingiamo un oggetto. La legge di gravitazione invece asserisce

F = −mg∇φ (1.0.2)

dove mg è la massa gravitazionale, che contribuisce alla generazione della forza, e φ è il potenzialegravitazionale. Unendo le equazioni (1.0.1), (1.0.2) otteniamo

a = −mg

mi∇φ = −∇φ

che ci dice che tutti i corpi subiscono la stessa accelerazione. L’esperimento di Eötvös, effettuato con unabilancia di torsione, diede come risultato

∣∣∣∣mg

mi− 1

∣∣∣∣ . 10−14

Risulta dunque immediato chiedersi perchè vale mi = mg, la teoria newtoniana funzionerebbe infattiugualmente bene, se non fosse così; c’è un motivo più profondo?

Riformuliamo il principio di equivalenza debole in una forma leggermente diversa: consideriamo un os-servatore in una scatola chiusa, isolata e sufficientemente piccola, così da non poter vedere il mondoesterno. Supponiamo che questo osservatore faccia degli esperimenti studiando il moto di particelle test,ad esempio per misurare il campo gravitazionale locale: egli otterrebbe dei risultati diversi se la scatolasi trovasse sulla Luna o su Giove, anzichè sulla Terra. La risposta a tali esperimenti sarebbe diversaanche se la scatola accelerasse in modo uniforme, in quanto cambierebbe l’accelerazione delle particelle incaduta libera rispetto alla scatola. Il principio di equivalenza debole implica che non c’è nessun modo diseparare gli effetti di un campo gravitazionale da quelli causati da un’accelerazione costante, osservandodelle particelle in caduta libera1. Il fatto che la scatola sia piccola serve ad approssimare il valore di ∇φcostante in tutta la scatola, ed il fatto che le particelle siano test permette di trascurare le interazionigravitazionali tra di esse.

1è possibile invece distinguere fra accelerazione costante e campo elettromagnetico osservando il comportamento diparticelle con cariche diverse.

6 Capitolo 1. Introduzione e motivazione

Figura 1.1: la scatola troppo grande svela l’origine gravitazionale dell’accelerazione.

La generalizzazione di Einstein del principio di equivalenza afferma invece che per il fisico nella scatola nonc’è nessun modo di disinguere tra accelerazione uniforme e campo gravitazionale, qualsiasi esperimentofaccia (quindi non solo buttando delle particelle). Ciò implica che nella scatola le leggi della fisica siriducono a quelle della relatività ristretta: è impossibile rivelare l’esistenza di un campo gravitazionale,e questo fatto va sotto il nome di principio di equivalenza di Einstein. Risulta impossibile definireunivocamente l’accelerazione come causata dalla gravità: ha più senso definire “non accelerato” come “incaduta libera”, promuovendo1 così ad inerziale un qualunque sistema in caduta libera. Da questo passoconsegue che la gravità non è una forza: forza implica accelerazione e la nostra definizione diaccelerazione nulla è muoversi liberamente in un qualsiasi campo gravitazionale. L’idea chegiace alla base di tale definizione è che la gravità è una manifestazione della curvatura2 dello spaziotempo.

1si può anche dire che localmente possiamo trasformare “via la gravità”, vedremo più tardi cosa ciò significhi in terminidi geometria differenziale.

2in uno spaziotempo curvo le particelle si muovono lungo delle geodetiche, curve che definiremo più tardi; in questo modola coincidenza di massa inerziale e di massa gravitazionale è automaticamente assunta fin dall’inizio, e non è più un caso.

Capitolo 2

Parentesi matematica: geometriadifferenziale

2.1 Varietà differenziabiliIl concetto di varietà generalizza quello di una superficie in R3 (o di un’ipersuperficie in Rn). Una varietàviene però definita senza usare un’immersione in Rn, e generalizza invece l’idea di una rappresentazioneparametrica di una superficie, ovvero di una mappa ϕ omeomorfa1 da un insieme aperto Ω alla superficienel piano R2. Vogliamo generalizzare la rappresentazione parametrica (o carta o sistema di coordinate):l’idea è di avere una superficie coperta dai domini delle carte in un modo tale che nell’intersezione tra duedomini i due insiemi di coordinate siano legati tra loro in maniera continua. Una varietà differenziabilegeneralizza il concetto di superficie differenziabile in R3, cioè di una superficie con un piano tangentedefinito in ogni punto di essa.

Definizione 2.1. Sia X un insieme: si definisce topologia su X una collezione F di sottoinsiemi di Xtali che:

• X e ∅ appartengono ad F ;

• l’unione numerabile di elementi di F appartiene ad F ;

• l’intersezione di un numero finito di elementi di F appartiene ad F .

Gli elementi di F si dicono aperti nella topologia F .

Definizione 2.2. Uno spazio topologico è una coppia (T,X) dove T è una topologia su X.

Definizione 2.3. Una varietà (o manifold) è uno spazio topologico di Hausdorff (cioè tale che per duepunti distinti si possono sempre trovare degli intorni disgiunti) tale che ogni punto della varietà possiedeun intorno omeomorfo ad Rn, ed in tal caso la varietà si dice n-dimensionale.

Definizione 2.4. Una carta di una varietà X è una coppia (U,ϕ) dove U ⊆ X è aperto e viene dettodominio della carta, e ϕ : U → V è un omeomorfismo, con V insieme aperto in Rn.

Le coordinate(x1, x2, . . . , xn

)dell’immagine ϕ(x) ∈ Rn del punto x ∈ U ⊆ X vengono dette coordinate

di x nella carta (U,ϕ).

Definizione 2.5. Un atlante di classe C k su di una varietà X è un insieme (Uα, ϕα) di carte taliche:

• ⋃αUα = X;

1tale per cui esista ϕ−1 e siano continue sia ϕ che ϕ−1.

8 Capitolo 2. Parentesi matematica: geometria differenziale

• le ϕα siano tali che le mappe ϕβ ϕ−1α : ϕα(Uα ∩Uβ)→ ϕβ(Uα ∩Uβ) sono di classe C k (condizione

di compatibilità).

Figura 2.1: rappresentazione di una carta.

In altre parole, se xi e yi sono rispettivamente le coordinate di x nelle carte (Uα, ϕα) e (Uβ , ϕβ), la mappaϕβ ϕ−1

α è data da n funzioni f j ∈ C k(ϕα(Uα ∩ Uβ)) di n variabili tali che

xi 7→ yj = f j(xi)

Figura 2.2: rappresentazione di un atlante.

La condizione di compatibilità, se soddisfatta, caratterizza le varietà differenziabili k volte. Convarietà differenziabile di solito si intende una varietà C k con k sufficientemente grande per un datocontesto (spesso si intende k → +∞).

Ecco due esempi per comprendere meglio quanto appena affrontato:

1. il cono doppio, ovvero l’insieme

(x1, x2, x3) ∈ R3 :(x1)2 −

(x2)2 −

(x3)2

= 0

munito della topologia indotta da quella usuale in R3 è una varietà? No, perchè l’origine non ha unintorno omeomorfo ad R2; tuttavia il semicono

(x1, x2, x3) ∈ R3 :

(x1)2 −

(x2)2 −

(x3)2

= 0, x1 ≥ 0

è una varieta di classe C 0.

2.1. Varietà differenziabili 9

Figura 2.3: il cono doppio ed il semicono.

2. Consideriamo la sfera in R3

S2 :(ξ1, ξ2, ξ3

)∈ R3 :

(ξ1)2

+(ξ2)2

+(ξ3)2

= r2

per fissato r > 0: possiamo costruire una carta usando la proiezione stereografica dal polo nord,identificato dalle coordinate N = (0, 0, r), nel modo illustrato in figura:

Figura 2.4: proiezione stereografica a partire dal polo nord.

Per ogni punto x =(ξ1, ξ2, ξ3

)appartenente alla sfera si traccia la congiungente il polo nord, che

intersecherà il piano(ξ1, ξ2

)in un punto di coordinate

(ξ

1, ξ

2, 0), per cui si ottiene in modo univoco

un punto in R2 caratterizzato dalle coordinate(x1, x2

)dove x1 = ξ

1e x2 = ξ

2. Risulta perciò ben

definita una funzione ϕ1 : U1 ⊆ S2 → V1 ⊆ R2 tale che(ξ1, ξ2, ξ3

)7→(x1, x2

)= ϕ1

(ξ1, ξ2, ξ3

)

Determinare il punto(x1, x2

)individuato dalla retta in R3 passante per il polo nord e per il punto

x =(ξ1, ξ2, ξ3

)generico della sfera S2.


La generica retta in R3 passante per i punti P =(a1, a2, a3

)e Q =

(b1, b2, b3

)è il luogo dei punti(

x1, x2, x3)soddisfacenti

x1 − a1

b1 − a1=x2 − a2

b2 − a2=x3 − a3

b3 − a3

Imponendo P ≡ N , ovvero(a1, a2, a3

)= (0, 0, r), e Q ≡ x, ovvero

(b1, b2, b3

)=(ξ1, ξ2, ξ3

)si ottiene

x1

ξ1=x2

ξ2=x3 − rξ3 − r

Seguendo la costruzione stereografica imponiamo x3 = 0: si giunge così a

x1

ξ1=x2

ξ2= − r

ξ3 − r =⇒ ϕ1 :

x1 =rξ1

r − ξ3

x2 =rξ2

r − ξ3

Si nota perciò che la carta così costruita copre tutta la sfera tranne il polo nord, che viene mappatonell’∞: ciò implica che per coprire tutta la sfera ci vogliono almeno due carte, e possiamo sceglierela seconda, per esempio, prendendo la proiezione stereografica dal polo sud.

Esercizio 2.1. Considerando S2 e ϕ1 definite come sopra, sia ϕ2 la carta ottenuta dalla proiezionestereografica dal polo sud e siano U1 ed U2 gli insiemi

U1 = S2 \ (0, 0, r) U2 = S2 \ (0, 0,−r)Si determini esplicitamente la mappa ϕ2 ϕ−1

1 : ϕ1(U1 ∩ U2)→ ϕ2(U1 ∩ U2).

La proiezione stereografica dal polo sud si ottiene immediatamente da quella ottenuta dal polo nordsostituendo −r ad r, ottenendo così

ϕ1 :

x1 =rξ1

r − ξ3

x2 =rξ2

r − ξ3

ϕ2 :

x1 =rξ1

r + ξ3

x2 =rξ2

r + ξ3

A questo punto si osserva chex1

x2=ξ1

ξ2=x1

x2

e che(x1)2

+(x2)2

=r2

(r − ξ3)2

[(ξ1)2

+(ξ2)2]

︸︷︷︸r2−(ξ3)2

= r2 r + ξ3

r − ξ3

Varrà una relazione simmetrica per le xi:

(x1)2

+(x2)2

= r2 r − ξ3

r + ξ3

Sfruttando il fatto che

x2 = x1x2

x1

r − ξ3

r + ξ3=

r2

(x1)2

+(x2)2

possiamo scrivere

(x1)2[

1 +

(x2

x1

)2]

=r4

(x1)2

+(x2)2 =⇒

x1 =r2x1

(x1)2

+(x2)2

x2 =r2x2

(x1)2

+(x2)2

Possiamo concludere dunque che le xi sono funzioni differenziabili delle xj eccetto in(x1, x2

)= (0, 0), che

però non appartiene a ϕ1(U1 ∩ U2) = R2 \ (0, 0): S2 è dunque una varietà differenziabile.

2.1. Varietà differenziabili 11

Le carte permettono di definire la differenziabilità di una funzione definita su di una varietà. Conside-riamo f : X → R e sia (U,ϕ) una carta in x ∈ U ⊆ X: allora la funzione f ϕ−1 è una mappa

f ϕ−1 : ϕ(U)→ R

Figura 2.5: rappresentazione di una funzione reale definita sulla varietà X.

Nello stesso modo in cui le coordinate di ϕ(x) rappresentano x nella carta locale(U,ϕ), la mappa f ϕ−1

rappresenta f nella carta locale.

Definizione 2.6. La funzione f : X → R è differenziabile in x ∈ X se, in una carta (U,ϕ) in x ∈ Ucon U ⊆ X, la funzione f ϕ−1 è differenziabile in ϕ(x).

A questo punto ci si potrebbe domandare se la differenziabilità di f dipenda dalla carta scelta: la rispostaè no, in quanto se f ϕ−1 è differenziabile in ϕ(x) per una carta (U,ϕ) allora f ϕ−1 è differenziabile inϕ(x) per ogni carta (U , ϕ) in x, perchè

f ϕ−1 =(f ϕ−1

)(ϕ ϕ−1

)

dove f ϕ−1 è differenziabile per ipotesi e ϕ ϕ−1 è differenziabile per la condizione di compatibilità: neconsegue quindi che f ϕ−1 è differenziabile. Lo spazio delle funzioni differenziabili su X viene indicatocon F(X).

A volte è conveniente scrivere alcune espressioni più esplicitamente, come segue: sia ai : Rn → R tale che

ai(u) = ui u ∈ Rn

Allora ai ϕ(x) = xi: definiamo perciò ϕi : X → R come ϕi = ai ϕ. La rappresentazione locale di ϕisarà

ϕi ϕ−1 = ai ϕ ϕ−1 = ai

Possiamo ora chiederci quando due varietà differenziabili sono equivalenti; siano Xn ed Y p due varietàdifferenziabili di dimensione rispettivamente n e p, e sia f : Xn → Y p. La funzione ψf ϕ−1 rappresentaf nelle carte locali (U,ϕ), (W,ψ) di Xn ed Y p: f è differenziabile in x ∈ U se la funzione ψ f ϕ−1

è differenziabile in ϕ(x). In altre parole, f è differenziabile in x se le coordinate yα = fα(xi)di y sono

funzioni differenziabili delle coordinate xi di x.

Definizione 2.7. Una funzione f è detta diffeomorfismo se f è bijettiva ed f, f−1 sono differenziabili.

I diffeomorfismi stanno alle varietà differenziabili come gli omeomorfismi stanno agli spazi topologici, ecome gli isomorfismi stanno agli spazi vettoriali.


Figura 2.6: rappresentazione della situazione descritta.

2.2 Lo spazio tangente, campi vettoriali e tensoriali

2.2.1 Spazio tangenteLo spazio tangente ad una varietà X in un punto x ∈ X, indicato con Tx(X), viene usato per definiredelle proprietà differenziali di oggetti in un intorno di x, indipendentemente dalle coordinate locali. Tx(X)approssima X localmente in x; molte approssimazioni in fisica consistono nel sostituire localmente unavarietà col suo piano tangente in un suo punto (e si parla di linearizzazione locale). Dimostreremo piùavanti che

dimX = n =⇒ Tx(X) ∼= Rn

dove il simbolo ∼= sta per “isomorfo a”.

Figura 2.1: rappresentazione del piano tangente, e di un vettore ad esso appartenente, alla varietà X.

Prima di impostare il discorso, può essere utile aprire una breve parentesi sulle superfici: una superficieS in R3 viene parametrizzata da due coordinate, (u, v), con le quali scrivere, detto ξ =

(ξ1, ξ2, ξ3

)∈ S:

ξ1 = ξ1(u, v) ξ2 = ξ2(u, v) ξ3 = ξ3(u, v)

Si definiscono quindi i vettori t ed s tangenti alla superficie:

t =∂ξ

∂us =

∂ξ

∂v

2.2. Lo spazio tangente, campi vettoriali e tensoriali 13

che generano il piano tangente in un punto, ed il vettore normale alla superficie n:

n = t× s

Figura 2.2: rappresentazione di una superficie in R3.

Esistono tre definizioni equivalenti di vettore tangente in un punto.

Definizione 2.8. Un vettore tangente vx in un punto x ∈ X è un’applicazione lineare dallo spaziodelle funzioni differenziabili f : U → R, dove U è un intorno di x, in R che soddisfi:

i) la linearità, per cui, dati α, β ∈ R ed f, g funzioni, vale:

vx(αf + βg) = αvx(f) + βvx(g)

ii) la regola di Leibniz:vx(fg) = f(x)vx(g) + g(x)vx(f)

Osservazione 2.1. Si noti che le condizioni i) e ii) implicano che, data f = α ∈ R, vx(α) = 0: bastainfatti porre f = g = 1 nella ii), per cui si ottiene che vx(1) = 0, e quindi usare f = 1 e β = 0 nella i), dacui vx(α) = αvx(1) = 0.

Osservazione 2.2. Una mappa lineare che soddisfi la regola di Leibniz viene chiamata derivazione.

Lo spazio Tx(X) dei vettori tangenti in x, dotato di addizione e moltiplicazione per scalare definite da

(αux + βvx)(f) = αux(f) + βvx(f)

è uno spazio vettoriale, chiamato spazio vettoriale tangente.

Osservazione 2.3. La definizione di un vettore tangente come mappa su funzioni non richiede un’im-mersione della varietà in qualche spazio.

Vediamo ora come definire le componenti di un vettore tangente; siano f una funzione differenziabile inun intorno di x0 ∈ X, (U,ϕ) una carta locale tale che x0 ∈ U ed f = f ϕ−1 una funzione f : ϕ(U)→ R.Per il teorema del valore medio (o di Lagrange), si ha che, per un qualche s ∈ (0, 1):

f(x) = f(ϕ(x)) = f(ϕ(x0)) +(xi − xi0

) ∂f

∂xi

∣∣∣∣ϕ(x0)+s[ϕ(x)−ϕ(x0)]


dove è sottointesa la somma sull’indice ripetuto i. Si ha ora che xi = ϕi(x), ricordando la precedentedefinizione di ϕi, così come xi0 = ϕi(x0), per cui

f(x) = f(ϕ(x0)) +(ϕi(x)− ϕi(x0)

) ∂f

∂xi

∣∣∣∣ϕ(x0)+s[ϕ(x)−ϕ(x0)]

(2.2.1)

Definendo le quantità α, gi e βi come

α = f(ϕ(x0)) gi(x) =∂f

∂xi

∣∣∣∣ϕ(x0)+s[ϕ(x)−ϕ(x0)]

βi = ϕi(x0)

la (2.2.1) diventaf = α+ gi

(ϕi − βi

)

Applicando ad f il vettore tangente in x0 si ottiene

vx0(f) =vx0

(α) + vx0(gi)(ϕi(x0)− βi

)+ gi(x0)

[vx0

(ϕi)−vx0

(βi)]

= gi(x0)vx0

(ϕi)

avendo usato le proprietà del vettore tangente: si ottiene perciò

vx0(f) = vi∂f

∂xi

∣∣∣∣ϕ(x0)

(2.2.2)

Cioè per il rappresentativo di vx in coordinate locali possiamo scrivere

vx(f) = vi∂

∂xif(x) = vi∂if(x)

assumendo1 vi come componenti di vx e ∂i come vettori di base dello spazio tangente.

Esercizio 2.2. Si dimostri che i vettori ∂ini=1 formano una base nello spazio tangente.

Per dimostrare che un set di vettori è una base, bisogna mostrare che essi sono indipendenti linearmentee formano un set completo: quest’ultima proprietà è stata appena dimostrata, infatti abbiamo appenascritto il generico vettore tangente nella (2.2.2). Rimane da dimostrarne dunque l’indipendenza: sia

vx(f) = vi∂f

∂xi

∣∣∣∣ϕ(x)

= 0 ∀f

Basta scegliere f = ϕj per ottenere vj = vx(ϕj)

= 0 ∀j.

Definizione 2.9. Un vettore tangente vx è una tripla (x, ϕ, v), dove ϕ è una carta, in modo tale che(x, ϕ, v) e (x, ϕ′, v′) rappresentano lo stesso vettore se v′ si può ottenere da v come

v′ = D(ϕ′ ϕ−1

)∣∣xv (2.2.3)

dove D(ϕ′ ϕ−1

)∣∣xè la Jacobiana, ovvero la matrice J di componenti

Jji(ϕ(x)) =∂x′j

∂xi

∣∣∣∣∣ϕ(x)

Esercizio 2.3. Si verifichi che vx dato dalla (2.2.2) soddisfa la (2.2.3).

vi∂

∂xi= vi

∂x′j

∂xi∂

∂x′j= v′

j ∂

∂x′j=⇒ v′

j=∂x′j

∂xivi

1anche qua si adotta la convenzione di Einstein, per cui è implicita la somma su di un indice ripetuto una volta in bassoed una in alto (“saturato”)


Osservazione 2.4. La definizione 2.9 è la vecchia definizione che conosciamo: un oggetto è un vettorese controvaria, ovvero se si comporta come indicato da essa.

Figura 2.3: rappresentazione della situazione descritta nella definizione 2.9.

La terza definizione di vettore è in termini di classi d’equivalenza di curve differenziabili in X che passanoper x: una curva Γ in X è una mappa da I ⊆ X in X tale che

I 3 t 7→ Γ(t) ∈ X

Sia Γ una curva differenziabile, ovvero una mappa differenziabile da I inX, con Γ(0) = x0, e sia f : X → Rdifferenziabile in x0; la mappa f Γ è una funzione definita su I a valori reali e differenziabile in t = 0.

Figura 2.4: rappresentazione della terza definizione.

Il vettore tangente alla curva Γ in x0 è una mappa f 7→ vΓx0

(f) dallo spazio delle funzioni differenziabiliin x0 ad R, la cui azione è definita da

vΓx0

(f) : =

[d

dt(f Γ)

]

t=0

(2.2.4)

vΓx0

(f) viene chiamata derivata di f lungo Γ in x0. Se due curve Γ1 e Γ2 sono tali che

vΓ1x0

(f) = vΓ2x0

(f) ∀f


si dice che sono tangenti in x0, o che hanno lo stesso vettore tangente in x0. Viceversa, dato un vettoretangente vx0 , è sempre possibile trovare una curva differenziabile che passi per x0 alla quale vx0 è tangente.È quindi possibile identificare un vettore tangente in x0 con una classe d’equivalenza di curve tangenti inx0.

Figura 2.5: rappresentazione di tre curve (Γ1, Γ2 e Γ3) appartenenti alla stessa classe d’equivalenza.

Questa è la terza definizione di vettore tangente. Quali sono le componenti del vettore vx0 tangentealla curva Γ in x0? Per definizione

vΓx0

(f) =

[d

dt

(f ϕ−1 ϕ Γ

)]

t=0

dove le mappe f ϕ−1 = f : ϕ(U(x0)

)→ R e ϕ Γ: I ⊆ R→ U(x0), dove U(x0) ⊂ X è un intorno di x0,

sono tali che

ϕ Γ: I 3 t 7→(Γ1(t),Γ2(t), . . . ,Γn(t)

)f : ϕ(X) 3

xi7→ f

(xi)

Perciò avremo che

vΓx0

(f) =

[d

dtf(

Γi(t))]

t=0

=∂f

∂xi

∣∣∣∣ϕ(x0)

dΓi

dt

∣∣∣∣t=0

∀f

dove ancora una volta ∂i è l’i-esimo vettore di base e la derivata rispetto a t di Γi, valutata in t = 0, èl’i-esima componente.

Esempio 2.1. Consideriamo ancora una volta la sfera S2, di cui richiamiamo la definizione:

S2 :(ξ1, ξ2, ξ3

)∈ R3 :

(ξ1)2

+(ξ2)2

+(ξ3)2

= r2

Utilizziamo come carta locale le usuali coordinate sferiche:

ϕ :

ξ1 = r sinϑ cosφ

ξ2 = r sinϑ sinφ

ξ3 = r cosϑ

con (ϑ, φ) ∈ [0, π]× [0, 2π)

Consideriamo la curva Γ: [0, 2π)→ S2 definita, nella carta locale ϕ, da

(ϕ Γ) (t) :=(π

2, t)

corrispondente all’equatore della sfera; il vettore tangente in t = 0 ha componenti

vi =dΓi

dt

∣∣∣∣t=0

=⇒v1 = 0

v2 = 1=⇒ v = vi∂i = ∂φ


Figura 2.6: rappresentazione dell’azione di ϕ.

Ad una mappa f : Xn → Y p differenziabile in x possiamo associare una mappa lineare, chiamataDf(x) : Tx(X

n)→ Ty(Yp) che manda Tx(Xn) 3 v 7→ w ∈ Ty(Y n) definita da

w(h) := v(h f) ∀h : Y p → R

dove h è differenziabile in y = f(x) ∈ Y p.


Definizione 2.10. La mappa Df(x), indicata anche con fx(x), viene chiamata differenziale di f in x.

2.2.2 Covettori e tensoriDefinizione 2.11. Il duale T ∗x(X) dello spazio tangente Tx(X) è lo spazio delle funzioni lineariwx : Tx(X) → R, tali che vx 7→ wx(vx) ∈ R. T ∗x(X) è di nuovo uno spazio vettoriale, chiamato spaziocotangente; gli elementi di T ∗x sono detti vettori covarianti1 o forme differenziali, mentre glielementi dello spazio tangente Tx sono detti vettori contravarianti2.

Andiamo a costruire una base di T ∗x(X): sia ei base di Tx e chiamiamo vix le componenti del vettorevx nella base ei, per cui

vx = vixei

Risulta naturale definire ϑi come il funzionale tale che ϑi(vx) = vix, per cui, per linearità e per la definizioneappena data della loro azione, varrà che

ϑi(vjxej

)= vjxϑ

i(ej) = vjxδij

1a volte chiamati anche covettori.2la differenza tra i due tipi di entità è il modo in cui si trasformano le loro componenti sotto cambiamento di base.


Si ottiene dunque la relazioneϑi(ej) =

⟨ϑi, ej

⟩= δij (2.2.5)

Chiamiamo dxi la base duale alla base di coordinate ∂i, cioè⟨dxi, ∂j

⟩= δij (2.2.6)

Possiamo dunque scrivere il prodotto scalare tra un vettore dello spazio cotangente wx ed un vettore dellospazio tangente vx come

〈wx, vx〉 =⟨wxiϑ

i, vjxej⟩

= wxivjx

⟨ϑi, ej

⟩= wxiv

ix (2.2.7)

Osservazione 2.5. Le componenti di un vettore covariante hanno l’indice in basso e le componenti diun vettore contravariante l’indice in alto: non bisogna però confondere ϑi con l’i-esima componente diun vettore tangente, in quanto è l’i-esimo vettore della base dello spazio cotangente.

Come prima anticipato, la differenza tra vettori covarianti e contravarianti sta nel modo con cui si tra-sformano le loro componenti sotto cambiamento di base: sia perciò ei → e′i un cambio di base datoda

ei = akie′k (2.2.8)

A questo1 corrisponde un cambiamento di baseϑi→ϑ′iin T ∗x definito da a−1, infatti

vx = viei = v′ke′k

perciò varràv′k = viaki (2.2.9)

Per definizione dei ϑi avremo che

ϑ′k(vx) = v′k = viaki = ϑi(vx)aki ∀vxper cui il cambio di base nello spazio cotangente sarà dato da

ϑ′k = ϑiaki (2.2.10)

Prendendo un vettore wx ∈ T ∗x(X) avremo

wx = wiϑi = w′kϑ

′k = w′kϑiaki

perciò varràwi = akiw

′k (2.2.11)

Esempio 2.2. Sia ei = ∂i la base “naturale” dello spazio tangente: consideriamo il cambiamento dibase indotto dal cambiamento di coordinate

xi7→x′idefinito da

∂i =∂x′j

∂xi∂′j =⇒ aji =

∂x′j

∂xi

dove aji altro non è che la componente generica della matrice Jacobiana. Dalla (2.2.10) segue che

dx′j =∂x′j

∂xidxi

per cui dxi è di fatto il differenziale di xi, come anticipato dalla notazione. Possiamo scrivere ogniwx ∈ T ∗x(X) nella cobase naturale

dxicome

wx = widxi (2.2.12)

che giustifica il nome di “1-forma” e di “forma differenziale” dato agli elementi dello spazio cotangente.1gli elementi aki appartengono ad una matrice a.


Osservazione 2.6. La (2.2.12) non implica necessariamente che wx = df per qualche funzione f ; wxnon è necessariamente un differenziale esatto.

Definizione 2.12. Un tensore del tipo (r, s) è una mappa T multilineare

T : V ∗ × . . .× V ∗︸︷︷︸r volte

×V × . . .× V︸︷︷︸s volte

→ R

dove V è uno spazio vettoriale e V ∗ è il suo duale.

Per noi V = Tx(X), V ∗ = T ∗x(X); i tensori del tipo (r, s) formano uno spazio vettoriale V rs , la cui base èdata da

ej1 ⊗ . . .⊗ ejr︸︷︷︸basi di V

⊗ϑi1 ⊗ . . .⊗ ϑis︸︷︷︸basi di V ∗

(2.2.13)

dove ⊗ denota il prodotto tensoriale. Un tensore può essere sviluppato in componenti come

T = T j1...jri1...is ej1 ⊗ . . .⊗ ejr ⊗ ϑi1 ⊗ . . .⊗ ϑis (2.2.14)

e viene detto r volte contravariante ed s volte covariante.

Definizione 2.13. Dati V , W spazi vettoriali su campo K, il prodotto tensoriale V ⊗W è uno spaziovettoriale formato dalle somme finite formali

v1 ⊗ w1 + v2 ⊗ w2 + . . . vi ∈ V, wi ∈W ∀i

con le regole, detto c ∈ K:

i) (v1 + v2)⊗ w = v1 ⊗ w + v2 ⊗ w;

ii) v ⊗(w1 + w2) = v ⊗ w1 + v ⊗ w2;

iii) (cv)⊗ w = v ⊗ (cw) = c(v ⊗ w).

Esempio 2.3. Siano V = Cn, W = Cm: allora

V 3 v =

a1

a2

...an

W 3 w =

b1b2...bm

Cn+m ⊇ V ×W 3 (v, w)

Si può rappresentare il prodotto tensoriale tra V e W con

V ⊗W =

a1

...an

⊗

b1...bm

=

a1

b1...bm

...

an

b1...bm

=

a1b1...

a1bm...

anb1...

anbm

∼=

a1b1 a1b2 . . . a1bma2b1 a2b2 . . . a2bm...

.... . .

...anb1 anb2 . . . anbm

Verificare come esercizio che tale rappresentazione soddisfa le proprietà i), ii), iii) richieste dalla definizio-ne. Per n = m = 2, v e w possono rappresentare delle particelle di spin 1/2; v ⊗ w descriverebbe quindiil sistema formato dalle due particelle.


Più formalmente, V ×W è l’insieme delle coppie ordinate (v, w) dove v ∈ V e w ∈W ; lo spazio vettorialelibero F su V ×W è lo spazio in cui gli elementi di V ×W costituiscono una base, ovvero

F(V ×W ) =

n∑

i=1

αi(vi, wi), αi ∈ K, n ∈ N,(vi, wi) ∈ V ×W ∀i

Il prodotto tensoriale viene definito, a partire da questo, tramite la relazione di equivalenza per cui, dativ, v1, v2 ∈ V , w, w1, w2 ∈W e c ∈ K qualsiasi:

(v1 + v2, w) ∼(v1, w) +(v2, w)

(v, w1 + w2) ∼(v, w1) +(v, w2)

(cv, w) ∼(v, cw) ∼ c(v, w)

In tal caso V ⊗W := F (V ×W )/∼ . Notiamo invece che V ⊕W = V ×W dotato della struttura vettoriale

(v1, w1) +(v2, w2) :=(v1 + v2, w1 + w2) α(v, w) :=(αv, αw)

La somma diretta può quindi essere vista come il quoziente rispetto alle seguenti relazioni di equivalenza

(v1, w1) +(v2, w2) ∼(v1 + v2, w1 + w2) (cv, cw) ∼ c(v, w)

Per definizione un tensore prende come argomenti r funzioni lineari ed s vettori; posso scrivere l’azionesulla base scelta come

T( ∈V ∗︷︸︸︷u(1), . . . , u(r),

∈V︷︸︸︷v(1), . . . , v(s)

)= T j1...jri1...is ej1 ⊗ . . .⊗ ϑ

is(u(1), . . . , v(s)

)

def= T j1...jri1...is ej1

(u(1)

). . . ejr

(u(r)

)ϑi1(v(1)

). . . ϑis

(v(s)

)

= T j1...jri1...is u(1)j1 . . . u(r)jrvi1(1) . . . v

is(s)

Notiamo che ϑik(v(k)

)= vik(k) come da definizione, mentre ejk

(u(k)

)= u(k)jk ; ciò è legato al fatto che V e

V ∗ sono l’uno il duale dell’altro.

Esempio 2.4. Sia T un tensore e sia K = R; allora se

• T : V → R, ovvero T è di tipo (0, 1), si avrà un vettore covariante, od 1-forma, scrivibile comeT = Tiϑ

i;

• T : V ∗ → R, ovvero T è di tipo (1, 0): si avrà un vettore controvariante, scrivibile come T = T iei;

• T : V × V → R, ovvero T è di tipo (0, 2): potremo scrivere T = Tij ϑi ⊗ ϑj . Esempi di tale tipo di

tensore sono il tensore di Faraday Fij ed il tensore energia-momento Tij .

Come trasforma un tensore sotto cambiamento di base? Abbiamo visto che

ei = akie′k ϑ′k = ϑiaki

perciòϑ′k(a−1

)lk

= ϑi aki(a−1

)lk︸︷︷︸

δli

=⇒ ϑl = ϑ′k(a−1

)lk

Abbiamo scritto inoltre il generico tensore in una base

T = T j1...jri1...is ej1 ⊗ . . .⊗ ejr ⊗ ϑi1 ⊗ . . .⊗ ϑis

possiamo perciò vedere come varia il tensore sotto cambio di base:

T = T j1...jri1...is ak1j1. . . akrjr

(a−1

)i1l1. . .(a−1

)islse′k1 ⊗ . . .⊗ e′kr ⊗ ϑ′l1 ⊗ . . .⊗ ϑ′ls


ma d’altra parte si ha anche

T = T k1...krl1...ls e′k1 ⊗ . . .⊗ e′kr ⊗ ϑ′l1 ⊗ . . .⊗ ϑ′ls

Per cui si ha cheT k1...krl1...ls = T j1...jri1...is a

k1j1. . . akrjr

(a−1

)i1l1. . .(a−1

)isls

(2.2.15)

cioè un tensore “ha bisogno” di una matrice a per ogni indice in alto e della matrice a−1 per ogni indicein basso.

2.2.3 Le p-formeDefinizione 2.14. Una p-forma è un tensore del tipo (0, p) Ti1...ip totalmente antisimmetrico, cioè taleche

Ti1...in−1inin+1...ip = −Ti1...inin−1in+1...ip

Prendiamo come esempio di 2-forma il tensore di Faraday Fij : la proprietà di antisimmetria si traducenel fatto che

Fij = −FjiSviluppiamo tale tensore su di una base:

F = Fijϑi ⊗ ϑj =

1

2Fijϑ

i ⊗ ϑj +1

2Fijϑ

i ⊗ ϑj

ora cambiamo il nome agli indici, scambiando i e j, al secondo addendo1; dopodichè sfruttiamo l’antisim-metria, cioè

F =1

2Fijϑ

i ⊗ ϑj +1

2Fjiϑ

j ⊗ ϑi =1

2Fij(ϑi ⊗ ϑj − ϑj ⊗ ϑi

)

Introduciamo ora la seguente notazione:

ϑi ∧ ϑj := ϑi ⊗ ϑj − ϑj ⊗ ϑi

Definizione 2.15. Siano φ ∈ ΛpV , dove

ΛpV :=

T : V × . . .× V︸︷︷︸

p volte

→ R, T p-forma

e χ ∈ ΛqV : definiamo prodotto esterno tra φ e χ come

φ ∧ χ :=(p+ q)!

p! q!A(φ⊗ χ) (2.2.16)

dove A2 è l’operatore di antisimmetrizzazione, cioè, presa una p-forma T :

(AT )(v1, . . . , vp) :=1

p!

∑

σ∈SpεσT

(vσ(1), . . . , vσ(p)

)(2.2.17)

Esempio 2.5. Sia p = 2, allora

AT(v1, v2) =1

2(+1)T(v1, v2) +

1

2(−1)T(v2, v1)

Osservazione 2.7. φ ∧ χ è un tensore con componenti φi1...ipχj1...jq cioè è una (p+ q)-forma.

1operazione lecita in quanto sono muti.2Sp è il gruppo delle permutazioni di p elementi, ed εσ = 1 se σ è pari, cioè equivale ad un numero pari di scambi, e

εσ = −1 se σ è dispari.


Proprietà: il prodotto esterno è

i) multilineare:

φ ∧(χ+ φ) = φ ∧ χ+ φ ∧ ψ (φ+ χ) ∧ ψ = φ ∧ ψ + χ ∧ ψ f(φ ∧ χ) = fφ ∧ χ = φ ∧ fχ

ii) non commutativo, in generale: φ ∧ χ = (−1)pqχ ∧ φ;

iii) associativo: (φ ∧ χ) ∧ ψ = φ ∧(χ ∧ ψ) =: φ ∧ χ ∧ ψ.

Esempio 2.6. Consideriamo il caso particolare di due 1-forme, χ e φ, allora

φ ∧ χ = 2A(φ⊗ χ) = 21

2(φ⊗ χ− χ⊗ φ) = φ⊗ χ− χ⊗ φ

Osservazione 2.8. Una funzione f : X → R, con X varietà differenziabile, è una 0-forma. L’insiemedelle p-forme per tutte le p, dotato del prodotto esterno, forma un’algebra gradata1, chiamata algebraesterna o algebra di Grassmann. Se inoltre dimV = n allora non esistono p forme non banali per p > n:la verifica di questo fatto è banale in quanto una p forma è un tensore Ti1...ip totalmente antisimmetrico,e, se p > n, almeno uno degli indici deve ripetersi una volta, per cui Ti1...ip = 0. In particolare, esisteun’unica forma non banale per n = p, ed è la forma di volume, altrimenti detta determinante.

Costruiamo una base di ΛpV : dataϑibase in V ∗, dimV ∗ = n ≥ p, una base è data daϑI1 ∧ ϑI2 ∧ . . . ∧ ϑIp

dove Ij = 1, . . . , n indicano dei numeri ordinati, ovvero Ij < Ij+1, per cui

dim(ΛpV ) =

(n

p

)

Esempio 2.7. Considerando n = 4 e p = 2, una base dello spazio Λp sarà data daϑ1 ∧ ϑ2, ϑ1 ∧ ϑ3, ϑ1 ∧ ϑ4, ϑ2 ∧ ϑ3, ϑ2 ∧ ϑ4, ϑ3 ∧ ϑ4

Siano φ, χ ∈ Λ1 e ω = φ ∧ χ dove φ = φiϑi e χ = χjϑ

j : allora

ω = φiϑi ∧ χjϑj = φiχjϑ

i ∧ ϑj =1

2(φiχj − φjχi)ϑi ∧ ϑj =: φ[iχj]ϑ

i ∧ ϑj

In generale si può scrivere un tensore T come

Tij = T(ij) + T[ij] =1

2(Tij + Tji) +

1

2(Tij − Tji)

perciò, presi un tensore simmetrico T ed uno antisimmetrico A si ha che

TijAij = −TijAji = −TjiAji = −TijAij = 0

avendo prima usato le proprietà di simmetria dei tensori e poi scambiato il nome degli indici; tale relazionestabilisce che la contrazione tra un oggetto simmetrico ed uno antisimmetrico è 0. Dal conto impostatoin precedenza si ha inoltre che

ωij = φiχj − φjχi in quanto φ ∧ χ = φ⊗ χ− χ⊗ φ

Se ω è una p-forma generica, si può dimostrare che

ω =1

p!ωi1...ipϑ

i1 ∧ . . . ∧ ϑip

1ovvero un’algebra in cui si possono sommare solo le forme con p uguale.


Definizione 2.16. Sia φ ∈ ΛpV una p-forma, per cui, fissata una base di coordinate:

φ =1

p!φi1...ipdxi1 ∧ . . . ∧ dxip

La derivata esterna d : ΛpV → Λp+1V produce da una p-forma φ una (p+ 1)-forma dφ con le seguentiproprietà:

i) d(φ+ χ) = dφ+ dχ;

ii) d(φ ∧ χ) = dφ ∧ χ+ (−1)pφ ∧ dχ, dove χ è una q-forma;

iii) d(dφ) = d2φ = 0;

iv) df = ∂ifdxi se f è una 0-forma.

Vediamo ora una formula esplicita per calcolare dφ:

dφ = d

(1

p!φi1...ipdxi1 ∧ . . . ∧ dxip

)=

1

p!dφi1...ipdxi1 ∧ . . . ∧ dxip +

1

p!φi1...ipd

(dxi1 ∧ . . . ∧ dxip

)

avendo usato la proprietà ii): ma per le proprietà ii), iii) il secondo addendo è nullo, poichè

d(dxi1 ∧ . . . ∧ dxip

)= d2xi1 ∧ . . . ∧ dxip − dxi1 ∧ d

(dxi2 ∧ . . . ∧ dxip

)= −dxi1 ∧ d

(dxi2 ∧ . . . ∧ dxip

)

e così via. Si ha dunque, usando la proprietà iv), che:

dφ =1

p!dφi1...ipdxi1 ∧ . . . ∧ dxip =

1

p!∂jφi1...ipdxj ∧ dxi1 ∧ . . . ∧ dxip

perciò, ponendo ∂jφi1...ip =: φi1...ip,j si ha

dφ =1

p!φi1...ip,jdx

j ∧ dxi1 ∧ . . . ∧ dxip (2.2.18)

2.2.4 Le equazioni di Maxwell in forma covarianteSi definisce il tensore di Faraday F come la 2-forma data da:

F =

0 E1 E2 E3

−E1 0 −B3 B2

−E2 B3 0 −B1

−E3 −B2 B1 0

che unifica i campi elettrico e magnetico: il nostro obiettivo è scrivere le leggi della fisica in modocovariante, ovvero in modo tale da vedere ad occhio come cambiano sotto trasformazioni di Lorentz.

Andiamo a calcolare dF :

dF = d

(1

2Fijdx

i ∧ dxj)

=1

2Fij,kdxk ∧ dxi ∧ dxj

A questo punto si introduce il tensore di Maxwell ∗F , duale del tensore di Faraday, tale che

∗F ij =1

2εijklFkl (2.2.19)

dove εijkl è il simbolo totalmente antisimmetrico1, tale che ε0123 = −1.1detto anche tensore di Levi-Civita.


Dimostrare che

∗F =

0 B1 B2 B3

−B1 0 −E3 E2

−B2 E3 0 −E1

−B3 −E2 E1 0

A partire da ciò, ricaviamo che le equazioni di Maxwell

divB = 0 rotE = −∂B∂t

possono essere scritte in forma covariante come

∂i∗F ij = 0 (2.2.20)

Il fatto che ∗F abbia tale forma è la traduzione matematica della dualità tra B ed E; cominciamo averificare la (2.2.20) a partire dalla componente temporale:

∂i∗F i0 = −∂αBα = −divB

il che ci dice che, imponendo ∂i∗F i0 = 0, la divergenza di B è nulla. Vediamo ora le componenti spaziali:

∂i∗F iα = ∂0

∗F 0α + ∂β∗F βα

ma vale che ∗F βα = −εβαγEγ infatti, ad esempio:∗F 12 = −ε12γEγ = −ε123E3 = −E3 = −E3

dove l’ultima uguaglianza è data dal fatto che la metrica di Minkowski è l’identità per le componentispaziali. Otteniamo perciò

∂i∗F iα = ∂tB

α − ∂βεβαγEγ = ∂tBα − εβαγ∂βEγ = ∂tB

α + εαβγ∂βEγ = ∂tBα + (rotE)α

Perciò abbiamo dimostrato che

∂i∗F ij = 0 =⇒

divB = 0

rotE = −∂tBDalle equazioni (2.2.19) e (2.2.20) segue che

1

2∂iε

ijklFkl = 0 =⇒ εijkl∂iFkl = 0 =⇒ εijkl∂[iFkl] = 0

infatti1

∂[iFkl] :=1

3!(∂iFkl + ∂lFik + ∂kFli − ∂kFil − ∂lFki − ∂iFlk) =

1

3(∂iFkl + ∂lFik + ∂kFli)

e, usando il trucco di cambiare nome agli indici e poi scambiarli sfruttando l’antisimmetria del tensore diLevi-Civita, si ottiene:

−εijkl∂lFki = −εljki∂iFkl = εijkl∂iFkl

da cui consegue∂[iFkl] = 0 (2.2.21)

La (2.2.21) è una forma alternativa delle equazioni di Maxwell omogenee: riscrivendo dF abbiamo che

dF =1

2Fij,kdxk ∧ dxi ∧ dxj =

1

2∂[iFkl]dx

k ∧ dxi ∧ dxj

avendo sfruttato l’antisimmetria di dxk ∧ dxi ∧ dxj ; secondo la (2.2.21) si ha perciò

dF = 0 (2.2.22)

che contiene le equazioni di Maxwell omogenee: tale relazione prende il nome di identità di Bianchi.1spezzando il tensore ∂iFkl nella somma della sua parte simmetrica ed una antisimmetrica, solo quest’ultima rimane, in

quanto la contrazione tra un tensore simmetrico ed uno totalmente antisimmetrico è nulla.


Osservazione 2.9. La condizione dF = 0 implica che, localmente, F = dA dove A è una 1-forma, cioè

A = Aidxi

dove Ai è il potenziale 4-vettore avente per parte temporale il potenziale scalare ϕ.

F = dA = ∂jAidxj ∧ dxi = ∂[jAi]dx

j ∧ dxi =:1

2Fjidx

j ∧ dxi

per cui si ottieneFji = ∂jAi − ∂iAj (2.2.23)

Esercizio 2.4. Si dimostri che la (2.2.23) è equivalente a

B = rotA E = −∂A∂t− gradϕ

Qual è il legame tra A, ϕ e Ai?

Notiamo che le equazioni di Maxwell rimangono invariate se, fissata una funzione χ regolare, si mandaA 7→ A + gradχ e ϕ 7→ ϕ− ∂tχ, infatti, detto A′ il nuovo 4-vettore potenziale:

F = dA = dA′

Le trasformazioni imposte su A e su ϕ vengono dette trasformazioni di gauge.

Osservazione 2.10. Non è sempre vero che dω = 0 implica che ω = dχ globalmente: basta infatticonsiderare il seguente esempio

ω = − y

x2 + y2dx+

x

x2 + y2dy

Verificato che dω = 0, considerato un cammino Γ =( cosϕ, sinϕ), ϕ ∈ [0, 2π], si ha che∮

Γ

ω = −2π 6= 0

per cui ω non può essere esatta.

Per scrivere le equazioni di Maxwell non omogenee, introduciamo la metrica di Minkowski

η =

−1 0 0 00 1 0 00 0 1 00 0 0 1

con la quale possiamo alzare od abbassare gli indici, nel seguente modo

∗Fij = ηikηjl∗F kl

Andiamo a calcolare d∗F esplicitamente:

d∗F = d(B1dx1 ∧ dt+B2dx3 ∧ dt+B3dx3 ∧ dt− E3dx1 ∧ dx2 + E2dx1 ∧ dx3 − E1dx2 ∧ dx3

)

= −(∂E1

∂x1+∂E2

∂x2+∂E3

∂x3

)dx1 ∧ dx2 ∧ dx3 −

(∂E1

∂t− ∂B2

∂x2+∂B2

∂x3

)dt ∧ dx2 ∧ dx3 + . . .

= −4π(ρdx1 ∧ dx2 ∧ dx3 − j1dx2 ∧ dx3 ∧ dt− . . .

)= 4π∗j

dove ρ è la densità di carica e ∗j è la 3-forma definita da

∗jijk := εijkljl j0 = ρ jα = j


avendo indicato con ρ la densità di carica e con j la densità di corrente. Si ottengono così le equazioni diMaxwell non omogenee

d∗F = 4π∗j (2.2.24)

Scrivendo in questo modo le equazioni di Maxwell è facile vedere che esse sono Lorentz-covarianti. Letrasformazioni di Lorentz sono date da:

x′i = Λijxj Λ =

γ −γvt

−γv (Λµν)

Λµν = δµν + vµvν

(γ − 1

v2

)γ =

1√1− v2

Ad esempio, considerando il boost di Lorentz lungo la direzione x, ovvero la trasformazione per cuiv = v1e1, si ha

Λ =

γ −γv1 0 0−γv1 γ 0 0

0 0 1 00 0 0 1

Si tenga presente che Λij 6= Λ ji ; vediamo dunque come trasforma ∗F .

∗F ′ij = ΛikΛjl∗F kl ∂′i =

(Λ−1

)mi∂m

quindi si avrà

∂′i∗F ′ij =

(Λ−1

)mi∂m

(ΛikΛjl

∗F kl)

=(Λ−1

)miΛik︸︷︷︸

δmk

Λjl∂m∗F kl = Λjl∂k

∗F kl = 0

avendo usato la (2.2.20): ciò significa che nel sistema dellex′ile equazioni Maxwell hanno la stessa

forma.

Esercizio 2.5. Data l’azione scritta tramite la lagrangiana di Maxwell

S =

∫d4x

(−1

4FijF

ij − 4πAiji

)

con Fij = ∂iAj − ∂jAi e F ij = ηikηjlFkl, ricavare le equazioni di Maxwell non omogenee minimizzandoS.

Riscriviamo S nel seguente modo:

S =

∫d4x

(−1

4FijFklη

ikηjl − 4πAiji

)=

∫d4x

[−1

4(∂iAj − ∂jAi)(∂kAl − ∂lAk) ηikηjl − 4πAij

i

]

=

∫d4x

[−1

4

(∂iAj∂kAlη

ikηjl − ∂iAj∂lAkηikηjl − ∂jAi∂kAlηikηjl + ∂jAi∂lAkηikηjl

)− 4πAij

i

]

Scambiando i nomi degli indici in modo opportuno, ovvero scambiando j ed i nel terzo e quarto blocco,essendo ηikηjl 6= 0 ⇐⇒ i = k ∧ j = l, si scrive la variazione dell’azione come

δS =

∫d4x

[−1

2

(∂iδAj∂kAlη

ikηjl − ∂iAj∂kδAlηikηjl − ∂iδAj∂lAkηikηjl + ∂iAj∂lδAkηikηjl

)− 4πδAij

i

]

Scambiando i con k ed l con j si cancellano il secondo ed il quarto blocco: consideriamo ora il termine∂iδAj∂kAlη

ikηjl: vorremmo variare Aj e non le sue derivate, perciò si definisce il 4-vettore ausiliario vicome

∂iδAj∂kAlηikηjl = ∂i

(δAj∂kAlη

ikηjl)

︸︷︷︸vi

−δAj∂i(∂kAlη

ikηjl)


per cui si dimostra che vale il teorema di Gauss anche in 4 dimensioni, ovvero∫

M

d4x ∂ivi =

∮

∂M

d3Si vi

doveM è una varietà, ∂M ne è il bordo e d3Si = dV ni dove ni è normale a ∂M. Tale risultato ci permettedi dire che il primo blocco dà un contributo solo di bordo, dove Aj è fissato, per cui δAj |bordo = 0, il cheimplica vi

∣∣∂M = 0, perciò il termine di bordo è nullo. Rimane solo

δS =

∫d4x

[δAj∂i

(∂kAlη

ikηjl)− δAj∂i

(∂lAkη

ikηjl)− 4πδAjj

j]

=

∫d4x δAj

[∂i(∂kAlη

ikηjl)− ∂i

(∂lAkη

ikηjl)− 4πjj

]

Affinchè tutto quello che è dentro le parentesi sia nullo

ηikηjl∂i(∂kAl − ∂lAk)︸︷︷︸Fkl

= 4πjj =⇒ ∂iFij = 4πjj

che è equivalente alla (2.2.24).

2.2.5 Richiami di relatività ristretta, campi vettoriali e tensorialiEsiste una generalizzazione relativistica della seconda legge di Newton?

dp

dt= F

Sostituiamo p col quadrivettore pi, t con il tempo proprio τ ed F col quadrivettore forza F i: che conse-guenze ha quest’operazione? Parametrizziamo una linea di mondo della particella usando come parametroil tempo proprio, cioè scriviamo xi = xi(τ), per cui la quadrivelocità ui sarà data da

ui =dxi

dτ=

dt

dτ

dx

dτ

= γ

1

dx

dt

= γ

(1v

)

Notiamo che, essendo γ =(1− v2

)−1/2, vale

uiui = ηijuiuj = −

(u0)2

+(u1)2

+(u2)2

+(u3)2

= γ2(−1 + v2

)= −1

L’impulso è dato dalla massa a riposo (ovvero quella misurata nel sistema di riferimento solidale allaparticella) per quadrivelocità

pi = m0ui =⇒ pipi = −m2

0

Se f i è la forza di Lorentz, vale la relazione

f i =dpi

dτ= −qF ij uj

Verifichiamo che valga tale uguaglianza per gli indici spaziali:

dpα

dτ= −qFα0 u0 − qFαβ uβ = qFα0γ − qFαβγvβ

infatti vale che F ij = ηikF jk , per cui Fα0 = ηk0Fαk , e che vβ = vβ , poichè nelle tre dimensioni spaziali

la metrica è l’identità. Si ottiene dunque

1

γ

dpα

dτ= q(Eα + εαβδvβBδ

)= q(E + v ×B)


Con l’indice 0 si ha

dp0

dτ= −qF 0

j uj = −qF 0

α uα = qF0αu

α = qEαvαγ = γqEαvα = γF · v

ma F · v è la potenza, per cuip0 = m0u

0 = γm0 = E

Si definisce m := γm0 massa dinamica; sviluppando γ per |v| << 1

E = m = m0 +1

2m0v

2 +O(v4)

Definizione 2.17. Un campo vettoriale v su di una varietà X associa ad ogni punto x ∈ X un vettoretangente v0 ∈ Tx(X): x0 7→ v0 = v(x0).

Analogamente si definisce un campo tensoriale. In coordinate locali, un vettore vx è definito dan = dimX componenti, quindi un campo vettoriale v è definito nel dominio di una carta da n funzioni vidi n variabili.

Esempio 2.8. Data S2 parametrizzata da coordinate sferiche (ϑ, φ), il generico campo vettoriale su diessa ha la forma

v = vϑ(ϑ, φ) ∂ϑ + vφ(ϑ, φ) ∂φ

Sia χ(X) l’insieme di tutti i campi vettoriali differenziabili su X, cioè, in coordinate locali, le vi sonofunzioni differenziabili delle xj ; possiamo dare a χ(X) la struttura di algebra di Lie nel seguente modo,dati v, w ∈ χ(X) e f , g ∈ F(X):

i) definendo un’operazione additiva su χ(X):

(v + w)(f) := v(f) + w(f)

ii) definendo un’operazione moltiplicativa tra un campo vettoriale ed una funzione:

(gv) (f) = v(f) · g

In questo modo χ(X) assume la struttura di modulo, e non spazio vettoriale1, sull’anello F(X),che non è un campo perchè in generale f ∈ F(X) non è invertibile;

iii) definendo un’operazione moltiplicativa tra campi vettoriali:

[v, w] := vw − wv (2.2.25)

con tale operazione, detta parentesi di Lie, si intende

[v, w] (f) = v(w(f))− w(v(f))

In coordinate locali, per cui f è la rappresentante di f in una data carta, si ottiene:

[v, w] (f) =(vi∂iw

j − wi∂ivj)∂j f

L’operazione di parentesi di Lie è bilineare, soddisfa la regola di Leibniz e l’identità di Jacobi:

[v1,[v2, v3]] +[v2,[v3, v1]] +[v3,[v1, v2]] = 0 (2.2.26)

chiaramente vale che[v, w] = −[w, v] (2.2.27)

Un modulo su cui sia definita un’operazione bilineare soddisfacente la (2.2.26) e la (2.2.27) viene dettoalgebra di Lie.

1la differenza sta nel fatto che un modulo “pesca” gli scalari in un anello, mentre uno spazio vettoriale in un campo.


Esercizio 2.6. Si dimostri che non possiamo prendere vw come prodotto anzichè la parentesi di Liepoichè vw così definito non è un campo vettoriale: non è soddisfatta la regola di Leibniz

(vw)(fg) 6= g · (vw)(f) + f · (vw)(g)

Esempio 2.9. Sia S2 la 2-sfera e

v = sinφ cotϑ∂φ − cosφ∂ϑ w = cosφ cotϑ∂φ + sinφ∂ϑ

Calcoliamo [v, w]:

[v, w](f) = [ sinφ cotϑ∂φ − cosφ∂ϑ cosφ cotϑ∂φ + sinφ∂ϑ](f)

=( sinφ cotϑ∂φ − cosφ∂ϑ)( cosφ cotϑ∂φf + sinφ∂ϑf)−( cosφ cotϑ∂φ + sinφ∂ϑ) ·

·( sinφ cotϑ∂φf − cosφ∂ϑf) = − sin2φ cot2ϑ∂φf + sinφ cosφ cotϑ∂ϑf +cos2φ

sin2ϑ∂φf+

−(

cos2φ cot2ϑ∂φf + cosφ sinφ cotϑ∂ϑf − ∂φf)

= − cot2ϑ∂φf +1

sin2ϑ∂φf = ∂φf

Perciò[v, w] = ∂φ

Esercizio 2.7. Il momento angolare in meccanica quantistica è dato da

L = r×(−i~∇) =⇒

L1 = −i~(x2∂3 − x3∂1

)

L2 = −i~(x3∂1 − x1∂3

)

L3 = −i~(x1∂2 − x2∂1

)

Li sono 3 campi vettoriali in R3; si dimostri che [L1, L2] = i~L3 e cicliche.


2.3 Varietà (pseudo-)riemannianeDefinizione 2.18. Una varietà (pseudo-)riemanniana è una varietà differenziabile X dotata di uncampo tensoriale g del tipo (0, 2), chiamato tensore metrico e tale che

i) g è simmetrico, ovvero gij = gji;

ii) ∀x ∈ X la forma bilineare è non degenere, ovvero

gx(v, w) = 0 ∀v ∈ Tx =⇒ w = 0

Se gx(v, v) > 0 ∀v ∈ Tx allora si parla di una varietà riemanniana propria, altrimenti si parla di unavarietà pseudo-riemanniana.

Esempio 2.10. Sia X lo spazio di Minkowski e g = η; si danno le seguenti definizioni

η(v, v)

> 0 =⇒ v tipo spazio= 0 =⇒ v tipo luce< 0 =⇒ v tipo tempo

Seϑiè un campo di covettori di base, cioè una base dipendente dal punto della varietà, si definisce

ds2 := g = gijϑi ⊗ ϑj =

1

2gijϑ

i ⊗ ϑj +1

2gjiϑ

j ⊗ ϑi = gij1

2

(ϑi ⊗ ϑj + ϑj ⊗ ϑi

):= gijϑ

iϑj

ϑiϑj prende il nome di prodotto simmetrizzato.

Il tensore g fornisce un prodotto scalare in Tx(X), definito da

(v|w) := gx(v, w) v, w ∈ Tx(X) (2.3.1)

Se ei è la base duale aϑiallora

gx(v, w) = gx(viei, w

jej)

= viwjgx(ei, ej) = gijviwj

avendo sfruttato la multilinearità e la definizione di metrica: si ha dunque che

gx(ei, ej) = gij (2.3.2)

In ogni punto x ∈ X i vettori nulli (o di tipo luce) formano un cono in Tx, detto cono luce, dato da

gijvivj = 0 (2.3.3)

g definisce un isomorfismo canonico tra Tx e T ∗x nel seguente modo: preso u ∈ T ∗x , la mappag(u, ·) : Tx → R è tale che

v 7→ g(u, v) ∈ R

e quindi g(u, ·) ∈ T ∗x . L’isomorfismo canonico è la mappa

Tx → T ∗x : u 7→ g(u, ·) =: u∗

In componenti:g(u, v) = giju

ivj =⇒ u∗j = g(u, ·) = gijui

Useremo lo stesso simbolo u sia per il vettore contravariante u che per il vettore covariante, primaindicato u∗, che è l’immagine del primo secondo l’isomorfismo canonico; useremo inoltre ui per indicarele componenti contravarianti di u e ui per quelle covarianti. Si ha dunque che

ui = gijuj ui = gijuj (2.3.4)

2.3. Varietà (pseudo-)riemanniane 31

dove gij è la matrice inversa di gij , cioè tale che

gijgjk = δik (2.3.5)

In modo analogo, dato un tensore T del tipo (p, 0) possiamo definire

Ti1...ip = gi1j1...ipjpTj1...jp

cioè avremo l’isomorfismo canonico tra⊗p

Tx e⊗p

T ∗x . Oppure possiamo alzare anche solo un indice,dato un tensore T del tipo (0, 2), nel seguente modo

T ij = gikTkj

Si dice che gli indici vengono alzati ed abbassati tramite il tensore metrico g.

Scegliendo la base ei in Tx in modo opportuno, la forma quadratica

gx(v, v) = gijvivj

può essere scritta come somma di k quadrati negativi ed n− k quadrati positivi, ovvero

gx(v, v) = −k∑

i=1

(vi)2

+

n∑

i=k+1

(vi)2

grazie alla simmetricità di g e ad opportuni riscalamenti dei vettori di base. k prende il nome di indicedella forma quadratica: (n− k)− k è invece detto segnatura, ed è pari al numero di autovalori positivimeno il numero di autovalori negativi. In una varietà riemanniana propria k = 0; in una tale varietà labase è ortonormale se(ei|ej) = δij . Se k = 1, si dice che X è lorentziana, e g prende il nome di metricalorentziana, caso di fondamentale interesse in fisica (soprattutto con n = 4). Per le varietà lorentzianeindicheremo con indici latini(i, j) tutte le componenti (perciò i, j = 0, 1, . . . , n−1), e con indici greci(α, β)solo le componenti spaziali (perciò α, β = 1, 2, . . . , n− 1): si avrà perciò che ei è una base ortonormalese

(eα|eβ) = δαβ (e0|e0) = −1 (eα|e0) = 0

ovvero(ei|ej) = ηij (2.3.6)

dove η è la metrica di Minkowski. La baseϑiduale alla base ortonormale ei sarà tale che

g = −ϑ0ϑ0 +

n−1∑

α=1

ϑαϑα (2.3.7)

per cui l’equazione di un cono di luce è, per la (2.3.3), data da

−(v0)2

+

n−1∑

α=1

(vα)2

= 0 (2.3.8)

Sia w ∈ Tx; allora

w2 = gijwiwj

< 0 w di tipo tempo (dentro il cono)= 0 w di tipo luce (sul cono)> 0 w di tipo spazio (fuori dal cono)

Esempi di varietà (pseudo-)riemanniane

• Lo spaziotempo di Minkowski dotato della matrice g = η tale che, fissata una base di coordinate

g = ds2 = gijdxidxj = −

(dx0)2

+(dx1)2

+(dx2)2

+(dx3)2

è una varietà pseudo-riemanniana 4-dimensionale.


Figura 2.1: rappresentazione del cono di luce.

• Lo spazio euclideo 3-dimensionale dotato della metrica usuale

ds2 =(dx1)2

+(dx2)2

+(dx3)2 (2.3.9)

è una varietà riemanniana, e

dxiè la cobase ortonormale. Utilizzando le coordinate sferiche:

x1 = r sinϑ cosφ

x2 = r sinϑ sinφ

x3 = r cosϑ

=⇒

dx1 = sinϑ cosφdr + r cosϑ cosφ dϑ− r sinϑ sinφdφ

dx2 = sinϑ sinφdr + r cosϑ cosφ dϑ+ r sinϑ cosφdφ

dx3 = cosϑ dr − r sinϑ dϑ

Sostituendo nella (2.3.9) si ottiene

ds2 = dr2 + r2(dϑ2 + sin2ϑ dφ2

)(2.3.10)

perciò la base (∂r, ∂ϑ, ∂φ) non è ortonormale, in quanto

(∂r|∂r) = grr = 1 (∂ϑ|∂ϑ) = gϑϑ = r2 (∂φ|∂φ) = gφφ = r2 sin2ϑ

e le altre componenti di g sono nulle; vale un discorso simile anche per le coordinate cilindriche.

• Consideriamo la 2-sfera S2 di raggio unitario; essa è una sottovarietà di R3, perciò usiamo la metricaindotta dalla (2.3.10) con r = 1, ovvero

ds2 = dϑ2 + sin2ϑdφ2 (2.3.11)

• Lo spaziotempo di Rindler bidimensionale, dotato della metrica

ds2 = −x2dt2 + dx2 x > 0, t ∈ R (2.3.12)

la metrica così definita è manifestamente lorentziana e non ortonormale.

Esercizio 2.8. Si dimostri che lo spaziotempo di Rindler è semplicemente una parte dello spaziotempodi Minkowski.

Consideriamo il seguente cambio di coordinate:T = x sinh t

X = x cosh t=⇒

dT = sinh tdx+ x cosh tdt

dX = cosh tdx+ x sinh tdt


sostituendo nella (2.3.12) otteniamo dunque

ds2 = −dT 2 + dX2

Per capire quale parte della metrica di Minkowski abbiamo ottenuto notiamo che

X2 − T 2 = x2 > 0 =⇒ X2 > T 2

essendo x > 0 e cosh t > 0 ∀t dovrà essereX > |T |

Figura 2.2: lo spaziotempo di Rindler; la regione |X| > T è nota come Rindler wedge.

Se x è costante si avranno rami destri di iperboli nel piano (X,T ), in particolare, per x = 0, tali iperbolidegenereranno nelle due rette X = ±T . Un osservatore con linea di mondo x = k, 0 < k ∈ R, si muovecon velocità u = x−1∂t poichè x = k implica che, scritta

u = ut∂t + ux∂x

allora sarà ux = 0 ed inoltre1giju

iuj = −1 =⇒ −x2utut = −1

Affermiamo che tale osservatore ha accelerazione propria costante; inoltre essa tende a ∞ con x → 0,e, per questo motivo, x = 0 viene chiamato orizzonte di accelerazione. Andiamo a calcolare quanto ciservirà per ricavare l’accelerazione:

∂

∂t=∂T

∂t

∂

∂T+∂X

∂t

∂

∂X= x cosh t ∂T + x sinh t ∂X

da cuiuT = cosh t =

1

x

∂T

∂tuX = sinh t =

1

x

∂X

∂t

Andiamo a definire il 2-impulso come pi := mui, per cui

pT = E = muT = m cosh t→ +∞ per t→ +∞Il tempo proprio sarà

dτ2 = −ds2 = dT 2 − dX2 = x2dt2 =⇒ dτ = xdt

1dalla metrica di Minkowski sappiamo che il quadrivettore velocità ha modulo −1.


A questo punto possiamo scrivere l’accelerazione come

ai =dui

dτ=

1

x

dui

dt=⇒ a =

1

x

d

dt

(cosh tsinh t

)=

1

x

(sinh tcosh t

)

il cui modulo è dato da

ηijaiaj = −

(aT)2

+(aX)2

=1

x2

(− sinh2 t+ cosh2 t

)=

1

x2=⇒ a =

1

x

che diverge con x→ 0.

2.3.1 Connessioni lineariL’obiettivo è definire la derivata di un vettore, o, più in generale, di un tensore, lungo una curva C.

Figura 2.3: rappresentazione di due vettori tangenti alla varietà X collegati da una curva C.

Un modo ingenuo di definire la derivata di un vettore v sarebbe

dv

dt= lim

∆t→0

v(t+ ∆t)− v(t)

∆t

ma sorge subito un problema: gli spazi tangenti TpX e TqX sono degli spazi vettoriali diversi, e quindinon c’è un modo di paragonare un vettore in p con uno in q! Notiamo incidentalmente che, in questocontesto, se la curva è data da t 7→ xi(t) in coordinate locali, e se definiamo la derivata del vettore vlungo C come il vettore con componenti

vi,j =∂vi

∂xjdxj

dt

ci sarebbe il problema che vi,j non trasforma come un tensore sotto trasformazione di coordinate, inquanto c’è la derivata della Jacobiana, ovvero una derivata seconda.

Serve dunque una definizione di trasporto parallelo, ovvero trasportare parallelamente il vettore vq lungoC fino a p, e poi paragonare il vettore così ottenuto con vp. Tale concetto è equivalente a quello delladerivata, perchè se sappiamo trasportare un vettore parallelamente lungo una curva possiamo definire laderivata di un campo vettoriale nella direzione della curva. Al contrario, dato il concetto di derivata,possiamo definire che un vettore è trasportato parallelamente se la sua derivata lungo una data curva èzero.

Osservazione 2.11. La definizione di trasporto parallelo richiede più della struttura di varietà differen-ziabile.


Definizione 2.19. Una derivata covariante, o connessione fra spazi tangenti TpX e TqX, su unavarietà differenziabile X, è una mappa v 7→ ∇v dai campi vettoriali su X ai campi tensoriali di tipo (1, 1)su X tale che

i) ∇(v + w) = ∇v +∇w;

ii) data f : X → R differenziabile∇(fv) = df ⊗ v + f · ∇v

Il tensore ∇v viene chiamato derivata covariante di v.

Introduciamo ora i coefficienti di connessione Γjki definiti da

∇ei = Γjkiϑk ⊗ ej (2.3.13)

dove ej è un campo di vettori di base eϑkè un campo di covettori di base. Grazie a tali simboli

possiamo scrivere ∇v in componenti come

∇v = ∇(viei

) ii)= dvi ⊗ ei + vi∇ei =

(dvi + vjΓikjϑ

k)⊗ ei

Per scrivere l’ultima uguaglianza sono stati cambiati gli indici e si è usata la (2.3.13): grazie alle equazioni(2.2.8), (2.2.10) possiamo scrivere che

dvi = ∂kvidxk = ek

(vi)ϑk

perciò∇v =

[ek(vi)

+ Γikjvj]ϑk ⊗ ei (2.3.14)

Le componenti del tensore ∇v vengono indicate con ∇kvi oppure con vi;k

∇v = ∇kviϑk ⊗ ei = vi;kϑk ⊗ ei (2.3.15)

con i ∇kvi dati per confronto con la (2.3.14) da

∇kvi = ek(vi)

+ Γikjvj = ∂kv

i + Γikjvj (2.3.16)

avendo fissato una base di coordinate ek = ∂k; nella (2.3.16) possiamo notare la presenza sia del termine∂kv

i, corrispondente alla solita derivazione, che dei coefficienti di connessione Γikj , corrispondenti alladerivata covariante.

Usiamo ora il fatto che∇v è un tensore per trovare la legge di trasformazione dei coefficienti di connessione:cambiamo perciò base, sfruttando le (2.2.8), (2.2.9), (2.2.10):

ei = a ji e′j vi = v′j

(a−1

) ij

ϑk = ϑ′l(a−1

) kl

quindidvi =

(a−1

) il

dv′l + v′ld(a−1

) il

=(a−1

) il

dv′l + v′le′h[(a−1

) il

]ϑ′h

perciò

∇v =(dvi + vjΓikjϑ

k)⊗ a mi e′m

=(a−1

) il

dv′l + v′le′h[(a−1

) il

]ϑ′h + v′l

(a−1

) jl

Γikjϑ′h(a−1

) k

h

⊗ a mi e′m

=

dv′m + v′l[a mi e′h

((a−1

) il

)+(a−1

) jla mi Γikj

(a−1

) k

h

]ϑ′h⊗ e′m

ma questo dev’essere uguale a∇v =

(dv′m + v′lΓ′

mhlϑ′h)⊗ e′m


Otteniamo dunqueΓ′mhl = a mi Γikj

(a−1

) k

h

(a−1

) jl︸︷︷︸

trasformazione tensoriale

+ a mi e′h[(a−1

) il

]

︸︷︷︸parte non tensoriale

(2.3.17)

La parte non tensoriale contiene una derivata seconda, che cancella quella proveniente dal termine ∂kvi;dall’espressione (2.3.17) capiamo che i coefficienti di connessione non sono le componenti di un tensore.Vediamo il caso particolare in cui ∂i e

dxisono basi di coordinate e

x′j = x′j(xi)

=⇒ a ji =∂x′j

∂xi

allora avremo che

Γ′mhl =

∂x′m

∂xiΓikj

∂xk

∂x′h∂xj

∂x′l+∂x′m

∂xi∂

∂x′h

(∂xi

∂x′l

)(2.3.18)

La derivata covariante ∇uv di v nella direzione u è definita da

∇uv :=(∇v) (u) (2.3.19)

ma ∇v = vi;kϑk ⊗ ei, per cui

∇v(u) = vi;k ϑk(u)︸︷︷︸uk

ei = vi;kukei

Otteniamo così∇v(u) = uk

[ek(vi)

+ Γikjvj]ei (2.3.20)

Figura 2.4: rappresentazione di un vettore tangente alla varietà X lungo una curva C.

Esercizio 2.9. Usando le (2.3.13), (2.3.19), si dimostri che

∇eiek = Γjikej (2.3.21)

Osservazione 2.12. Dalla (2.3.19) consegue che, prese f, g : X → R:

∇fu+gwv = f · ∇uv + g · ∇wv (2.3.22)

Definizione 2.20. Si dice che un vettore v è parallelo lungo una curva C : t 7→ C(t) se

∇uv = 0 con ui =dCi

dt

per tutti i punti su C.

Notiamo che, grazie alla (2.3.16)

∇uv = 0 ⇐⇒ uk[ek(vi)

+ Γikjvj]

= 0


che implica, fissata una base di coordinate, che

uk(∂kv

i + Γikjvj)

= 0 (2.3.23)

La (2.3.23) è un sistema di n equazioni differenziali alle derivate parziali del primo ordine in vi; inoltre, sei coefficienti di connessione Γikj sono nulli, cioè se lo spazio è piatto, si ha la solita definizione di derivatadirezionale.

Possiamo estendere la derivata covariante ai tensori di qualsiasi tipo richiedendo, detti t, s tensori del tipo(p, q), f : X → R funzione, che:

1. ∇vf = v(f), che è uguale, fissata una base di coordinate, a vi∂if ;

2. ∇v(t+ s) = ∇vt+∇vs;

3. ∇v(t⊗ s) = ∇vt⊗ s+ t⊗∇vs;

4. ∇v commuti con la contrazione, vedi sotto.

Osservazione 2.13. Se t è un tensore del tipo (p, q), ∇t è un tensore del tipo (p, q + 1) definito da

∇t(v, v1, . . . , vq, w1, . . . , wp) = ∇vt(v1, . . . , vq, w1, . . . , wp)

Usiamo in particolare la proprietà 4. per trovare la derivata covariante di una 1-forma α: la derivatacovariante nella direzione v della contrazione di α⊗ u (quindi di α(u) := αiu

i) è uguale alla contrazionedella derivate covarianti, cioè di ∇vα⊗ u+ α⊗∇vu, ovvero

∇v[α(u)] =(∇vα) (u) + α(∇vu) =⇒ (∇vα) (u) = ∇v[α(u)]− α(∇vu)

Sia ora u = ei, per cui(∇vα)i = ∇v(αi)− α(∇vei)

usando ora le (2.3.21), (2.3.22) riscriviamo ∇vei come

∇vei = ∇vkekei = vk∇ekei = vkΓjkiej

per cui, sfruttando la 1.:

(∇vα)i = v(αi)− α(vkΓjkiej

)= v(αi)− Γjkiv

kαj = vk[ek(αi)− Γjkiαj

]

ma allora∇vα =(∇vα)i ϑ

i = vk[ek(αi)− Γjkiαj

]ϑi

Perciò, in generale∇α =

[ek(αi)− Γjkiαj

]ϑk ⊗ ϑi = ∇kαiϑk ⊗ ϑi (2.3.24)

e, fissata una base di coordinate:

∇kαi = αi;k = ∂kαi − Γjkiαj = αi,k − Γjkiαj

Esercizio 2.10. Usando la (2.3.24) si dimostri che

∇ϑi = −Γikjϑk ⊗ ϑj (2.3.25)

e quindi∇vϑi = −vkΓikjϑ

j (2.3.26)

Usando questo risultato assieme alle proprietà 1., 2., 3. si può trovare la derivata covariante di un tensorequalsiasi: ecco di seguito un esempio.


Esempio 2.11. Sia t il tensore dato da

t = tiklei ⊗ ϑk ⊗ ϑl

è un tensore di tipo (1, 2): calcoliamo ∇vt, che, per la regola di Leibniz, sarà

∇vt =(∇vtikl

)ei ⊗ ϑk ⊗ ϑl + tikl∇vei ⊗ ϑk ⊗ ϑl + tiklei ⊗∇vϑk ⊗ ϑl + tiklei ⊗ ϑk ⊗∇vϑl

ma valgono le seguenti relazioni:

∇vtikl = v(tikl)

∇vei = vjΓmjiem ∇vϑk = −vjΓkjmϑm ∇vϑl = −vjΓljmϑm

per cui

∇vt = vjej(tikl)ei ⊗ ϑk ⊗ ϑl + tiklΓ

mjiv

jem ⊗ ϑk ⊗ ϑl − tiklΓkjmvjei ⊗ ϑm ⊗ ϑl − tiklΓljmvjei ⊗ ϑk ⊗ ϑm

Cambiando gli indici in modo opportuno si ottiene

∇vt = vj[ej(tikl)

+ Γijmtmkl − Γmjkt

iml − Γmjlt

ikm

]ei ⊗ ϑk ⊗ ϑl

quindi le componenti di ∇t sono∇jtikl = ej

(tikl)

+ Γijmtmkl − Γmjkt

iml − Γmjlt

ikm (2.3.27)

Dalla formula appena scritta si nota che per ogni indice c’è un termine Γ, e tale termine sarà precedutodal segno + se l’indice è alto o dal − se l’indice è in basso: questa è una “regola” generale utile per svolgeregli esercizi.

Esercizio 2.11. Si dimostri che la formula per le componenti della derivata covariante di un prodotto èidentica alla usuale formula per la derivata di un prodotto.

Notiamo innanzitutto che∇jtikl =(∇t) i

j kl =(∇ej t

)ikl

Consideriamo il prodotto

s⊗ t =(sikei ⊗ ϑk

)⊗ tlϑl = siktlei ⊗ ϑk ⊗ ϑl

ed usiamo la regola di Leibniz:

∇ej(s⊗ t) =(∇ejs

)⊗ t+ s⊗

(∇ej t

)=⇒

[∇ej(s⊗ t)

]ikl

=(∇ejs

)iktl + sik

(∇ej t

)l

ma questo implica che[∇(s⊗ t)] ij kl =(∇s) i

j k tl + sik(∇t)jloppure

∇j(siktl

)= tl∇jsik + sik∇jtl

che è proprio quanto richiesto dall’esercizio.

Data solo la struttura differenziale della varietà, ci sono molte possibili definizioni di derivata covariante,e nessuna è privilegiata rispetto alle altre. Se invece c’è anche una metrica g, esiste una scelta naturaleper la derivata covariante, in quanto essa fornisce una condizione da imporre sul trasporto parallelo; datidue vettori u e w, richiediamo che il loro prodotto scalare g(u,w) rimanga invariato se trasportiamo u ew parallelamente lungo qualsiasi curva, ovvero

∇vg(u,w) = 0 ∀v (2.3.28)

e questo se ∇vu = ∇vw = 0, cioè se u e w sono trasportati parallelamente lungo v. La (2.3.28) si puòriscrivere usando la proprietà di commutazione tra contrazione e derivata covariante, e ciò nel seguentemodo:

0 = ∇vg(u,w) =(∇vg)(v, w) + g(∇vu,w) + g(u,∇vw) =⇒ ∇g = 0

In componenti, tale relazione si scrive come ∇igjk = 0, ma questo, per la (2.3.27), è vero se e solo se

ei(gjk)− Γmijgmk − Γmikgjm = 0 (2.3.29)

Nel caso ciò avvenga, si dice che la connessione è metrica, oppure che g è covariantemente costante.


Osservazione 2.14. Teorie di gravità in cui ∇g 6= 0, per esempio quella che Weyl1 formulò nel 1918,non sono compatibili con le osservazioni; ad esempio, la frequenza di un orologio dipenderebbe dalla suastoria. Esistono inoltre applicazioni di questi concetti nello studio dei cristalli, dove in generale ∇g 6= 0;in tale contesto, la non metricità corrisponde alla presenza di difetti nei cristalli.

A parte la richiesta della metricità della connessione, abbiamo bisogno di un’altra condizione su ∇, cheviene fornita dalla torsione.

Definizione 2.21. Il tensore della torsione è

T(α, u, v) = α(∇uv −∇vu−[u, v]) (2.3.30)

dove u e v sono vettori ed α è una 1-forma; ne consegue che T è un tensore del tipo (1, 2).

Osservazione 2.15. Il principio di equivalenza implica che esiste un sistema di coordinate tale cheil tensore di torsione è nullo in un certo punto; in quanto tensore, se è 0 in uno specifico sistema dicoordinate, allora è 0 in uno qualsiasi. Ad ogni modo torneremo su questo punto più tardi; si dimostrainoltre che se T 6= 0, particelle con spin diversi cadono diversamente in uno stesso campo gravitazionale.

Se T = 0, allora[u, v] = ∇uv −∇vu

perciò la connessione viene detta simmetrica. Vediamo ora il significato geometrico2 di T : consideriamoa tal proposito due vettori u e v, spiccati inizialmente da uno stesso punto P0, che viene collegato poicon P2 e P1 rispettivamente da due curve C1 e C2, tangenti a v(P0) e u(P0) nell’ordine, di lunghezzarispettiva η ed ε, con ε, η entrambi infinitesimi. Si trasportano parallelamente poi u lungo C1 e v lungoC2 fino ai punti P1 e P2, dopodichè si tracciano da essi altre due curve, tangenti al vettore spiccato dalpunto di partenza e di lunghezza sempre η ed ε: ciò che avviene quando la torsione non è nulla è che nonsi può costruire in questo modo un “parallelogramma” che si chiuda. Formalmente:

∇vu = 0 ∇uv = 0 C1,2 : t 7→ C1,2(t) C1,2(0) = P0 C1(η) = P2 C2(ε) = P1

v(P0)(f) =d

dt(f C1) (t)

∣∣∣∣t=0

u(P0)(f) =d

dt(f C2) (t)

∣∣∣∣t=0

Figura 2.5: la torsione nonnulla impedisce la chiusura del “parallelogramma”.

1egli tentò di unire la gravità e l’elettromagnetismo, e, indicando con A il 4-potenziale elettromagnetico, scrisse

∇igjk = Ajgik −Akgij

Una delle conseguenze delle sue teorie è che l’angolo tra due vettori trasportati non cambia, ma il loro modulo sì.2per maggiori dettagli consultare Gravitation, di Misner, Thorne e Wheeler, Box 9.2.


Scriviamo le componenti di T in una base di coordinate:

T ikl = T(dxi, ∂k, ∂l

)= dxi(∇ek∂l −∇el∂k −[∂k, ∂l])

ma tale espressione è uguale, per la (2.3.21) a

T ikl = dxi(

Γjkl∂j − Γjlk∂j

)= Γikl − Γilk (2.3.31)

perciòT ikl = 0 ⇐⇒ Γikl = Γilk (2.3.32)

Vogliamo ora usare la metricità e la simmetria per determinare le componenti Γikl, e quindi ∇: sfruttandola (2.3.29), fissata una base di coordinate, si ha

∇g = 0 =⇒ gjk,i − Γmijgmk − Γmikgjm = 0

Riscriviamo due volte la stessa equazione con gli indici permutati:

gki,j − Γmjkgmi − Γmjigkm = 0 gij,k − Γmkigmj − Γmkjgim = 0

Ora sommiamo le prime due e sottraiamo la terza, ottenendo così

gjk,i + gki,j − gij,k − Γmijgmk − Γmikgjm − Γmjkgmi − Γmjigkm + Γmkigmj + Γmkjgim = 0

Per simmetria, equazione (2.3.32), molti termini si cancellano e rimane

Γmijgmk =1

2(gjk,i + gki,j − gij,k)

per cui

Γlij =1

2glk(gjk,i + gki,j − gij,k) (2.3.33)

cioè la connessione lineare è completamente determinata dalla metrica e dalle sue derivate. Una con-nessione metrica e simmetrica viene anche chiamata connessione di Levi-Civita e i coefficienti Γlijvengono detti simboli di Christoffel.

Osservazione 2.16. In uno spaziotempo piatto (per cui la matrice metrica è costante) si ha che Γlij = 0usando coordinate cartesiane, per cui la derivata covariante si riduce a quella classica; in uno spaziotempopiatto con coordinate non cartesiane non si ha necessariamente Γlij = 0.

Esempio 2.12. Calcoliamo i coefficienti di connessione per la due sfera S2.

Ricordiamo quanto scritto nella (2.3.11):

ds2 = dϑ2 + sin2ϑ dφ2

Allora si ha chegϑϑ = 1 gφφ = sin2ϑ gϑϑ = 1 gφφ =

1

sin2ϑ

usiamo quindi la (2.3.33):

Γϑϑϑ =1

2gϑk(gϑk,ϑ + gkϑ,ϑ − gϑϑ,k) = 0

Γϑϑφ =1

2gϑk(gφk,ϑ + gkϑ,φ − gϑφ,k) = 0 =⇒ Γϑφϑ = 0

Γϑφφ =1

2gϑk(gφk,φ + gkφ,φ − gφφ,k) = −1

2∂ϑgφφ = − sinϑ cosϑ

In modo analogo si trova che

Γφϑϑ = Γφφφ = 0 Γφϑφ = Γφφϑ = cotϑ


2.3.2 Geodetiche

Dati due punti p, q su di una varietà X, qual è la curva C ⊂ X più corta che colleghi p e q? SupponiamoX varietà riemanniana1 e consideriamo dunque un cammino C : t 7→ C(t) tale che C(t0) = p e C(t1) = q;allora la lunghezza della curva è data da

l =

q∫

p

√gij dxidxj =

t1∫

t0

√gij

dxi

dt

dxj

dtdt (2.3.34)

dove la quantitàdxi

dtsono le componenti del vettore tangente, prima chiamate anche

dCi

dt. La curva più

corta è tale che l è estremale, ovvero δl = 0, perciò useremo il principio variazionale già visto in meccanicaclassica.

Figura 2.6: tre curve su di una varietà X aventi estremi coincidenti.

Andiamo quindi a calcolare δl:

δl =

t1∫

t0

1

2

(gkl

dxk

dt

dxl

dt

)−1/2[δgij

dxi

dt

dxj

dt+ gij

dδxi

dt

dxj

dt+ gij

dxi

dt

dδxj

dt

]dt

Notiamo innanzitutto che i termini in cui compare un termine dδxk con k = i e k = j sono uguali;inoltre, poichè la lunghezza della curva è indipendente dalla parametrizzazione, cioè l è invariante sottoriparametrizzazione t 7→ t(t), possiamo sempre scegliere una parametrizzazione tale che

gijdxi

dt

dxj

dt= 1

il che equivale a prendere la lunghezza della curva come parametro.

δl =

t1∫

t0

[1

2δgij︸︷︷︸

gij,kδxk

dxi

dt

dxk

dt+ gij

dδxi

dt

dxj

dt

]dt

Integrando ora per parti il secondo addendo e tenendo conto che δxi∣∣t0

= δxi∣∣t1

= 0 rimane solo:

δl =

t1∫

t0

[1

2gij,kδx

k dxi

dt

dxj

dt− δxi d

dt

(gij

dxj

dt

)]dt

1si può estendere il discorso anche alle varietà pseudo-riemanniane.


cambiamo ora l’indice i con k nel secondo addendo

δl =

t1∫

t0

[1

2gij,k

dxi

dt

dxj

dt− d

dt

(gkj

dxj

dt

)]δxkdt

Affinchè si abbia δl = 0 per ogni variazione δxk deve valere che

1

2gij,k

dxi

dt

dxj

dt− d

dt

(gkj

dxj

dt

)= 0 (2.3.35)

La (2.3.35) può essere riscritta come

1

2gij,k

dxi

dt

dxj

dt− gkj,i

dxi

dt

dxj

dt− gkj

d2xj

dt2= 0 (2.3.36)

e può essere resa più simmetrica sfruttando la seguente espressione

gkj,idxi

dt

dxj

dt=

1

2gkj,i

dxi

dt

dxj

dt+

1

2gki,j

dxj

dt

dxi

dt

Sostituendo nell’espressione (2.3.36) queste modifiche e cambiando segno otteniamo:

gkjd2xj

dt2+

1

2(gkj,i + gki,j − gij,k)

dxi

dt

dxj

dt= 0

Moltiplicando ora ambo i membri per glk si ottiene

d2xl

dt2+

1

2glk(gkj,i + gki,j − gij,k)

dxi

dt

dxj

dt= 0

ovvero, per la (2.3.33):d2xl

dt2+ Γlij

dxi

dt

dxj

dt= 0 (2.3.37)

che costituisce il sistema di equazioni di Eulero-Lagrange del principio variazionale. Una curva t 7→ xi(t)che soddisfa la (2.3.37), che noi chiameremo d’ora in poi come equazione delle geodetiche, viene chiamatageodetica.

Proposizione 2.3.1. La (2.3.37) è equivalente a

∇uu = 0 (2.3.38)

dove ui =dxi

dt.

Dimostrazione

∇uu = 0 ⇐⇒ ∇uiei(ujej

)= 0

(2.3.22)⇐⇒ ui∇ei(ujej

)= 0 ⇐⇒ ui

(ei(uj)ej + uj ∇eiej︸︷︷︸

Γkijek

)= 0

L’ultima equazione è equivalente aui(ei(uk)

+ Γkijuj)

= 0

ma

uiei(uk)

= u(uk) (2.2.4)

=duk

dt=⇒ duk

dt+ Γkiju

iuj = 0


La (2.3.38) significa che una geodetica è una curva C il cui vettore tangente è trasportato parallelamentelungo C.

Esempio 2.13. Risolviamo la (2.3.37) per la 2-sfera S2, usando(x1, x2

)=(φ, ϑ):

l = 1 =⇒ φ+ Γφijdxi

dt

dxj

dt= 0

ricordiamo1 che Γφij 6= 0 se ij = φϑ ∨ ij = ϑφ perciò

φ+ 2Γφφϑ = 0 =⇒ φ+ 2 cotϑ φ ϑ = 0 l = 1

ϑ+ Γϑφφ φ2 = 0 =⇒ ϑ− sinϑ cosϑ φ2 = 0 l = 2

Moltiplichiamo la prima per sin2ϑ ottenendo così

sin2ϑ φ+ 2 cosϑ sinϑ ϑ φ = 0 =⇒ d

dt

(sin2ϑ φ

)= 0 =⇒ sin2ϑ φ = k

Nel caso particolare in cui k = 0 si ha φ costante, e perciò ϑ = at+ b, ovvero la geodetica è un meridiano;se k 6= 0, sostituiamo l’espressione di φ(ϑ) nella seconda equazione, perciò

ϑ− k2 cosϑ

sin3ϑ= 0 =⇒ ϑϑ− k2 cosϑ

sin3ϑϑ = 0

integro=⇒ 1

2ϑ2 +

k2

2 sin2ϑ=d2

2

dove d è una costante. k viene interpretata fisicamente come l’energia di una particella che si muove sulla2-sfera. Separando le variabili si risolve l’equazione differenziale così ottenuta:

dϑ

dt= ϑ = ±

√d2 − k2

sin2ϑ

perciò

t = ±∫ (

d2 − k2

sin2ϑ

)− 12

dϑ = ±∫

sinϑdϑ√d2 sin2ϑ− k2

x= cosϑ= ∓

∫dx√

d2(1− x2)− k2

2.3.3 Curvatura e tensore di RiemannIl nostro concetto intuitivo di curvatura proviene soprattutto dalle superfici bidimensionali immerse in R3,che corrisponde al concetto di curvatura estrinseca di una varietà immersa in uno spazio a dimensionepiù alta. Il nostro problema è che lo spaziotempo (X, g) non è sempre immergibile in qualche spazioa dimensione maggiore (almeno non in una maniera naturale); abbiamo così bisogno di un concettointrinseco di curvatura, senza riferirci ad uno spazio di immersione. Un tale concetto può essere definitoin termini di trasporto parallelo.

Figura 2.7: Il trasporto parallelo di un vettore v a partire da un punto p lungo una curva chiusa su di unpiano fa sì che il vettore v torni in se stesso.

1vedasi l’esempio 2.12.


Figura 2.8: Il trasporto parallelo lungo tre segmenti ortogonali di geodetiche sulla sfera fa sì che il vettorev torna nel punto di partenza ruotato di 90 a causa della curvatura.

Questa idea ci permette di caratterizzare intrinsecamente la curvatura di qualsiasi varietà se sappiamocome trasportare parallelamente dei vettori lungo delle curve contenute in esse. C’è un metodo alternativoed equivalente: una geodetica è una curva la cui tangente viene trasportata parallelamente lungo se stessa,cioè una curva “più dritta possibile”. Uno spazio è curvo se e solo se le geodetiche sono tali che i vettoriad esse tangenti siano paralleli in certi punti ed in altri non lo siano: un semplice esempio è quello deimeridiani lungo la sfera.

Notazione: d’ora in poi useremo indici latini per le componenti spaziali e greci per le componentispaziotemporali.

Il fatto che un vettore non torni più al suo valore originale, se viene trasportato lungo una curva chiusa- anche infinitesima -, si traduce nella non commutatività delle derivate covarianti.

Definizione 2.22. Il tensore di Riemann R è il tensore di tipo (1, 3) definito da

[∇µ,∇ν ]ωρ = −Rσρµνωσ (2.3.39)

Figura 2.9: v trasportato parallelamente lungo C1 e C2 è diverso da v trasportato parallelamente lungoC3 e C4.

Proposizione 2.3.2. La definizione 2.22 implica che

[∇µ,∇ν ] vρ = Rρσµνvσ (2.3.40)

Dimostrazione Sia f ∈ F(X): si ha che

(∇µ∇ν −∇ν∇µ) f = 0

infatti(∇µ∇ν −∇ν∇µ) f = ∇µ∂νf −∇ν∂µf


poichè f non ha indici, non avrà nemmeno termini di correzione oltre alla normale derivazione; sfruttandoora la (2.3.24) otteniamo

∇µ∂νf −∇ν∂µf = ∂µνf − Γρµν∂ρf −(∂νµf − Γρνµ∂ρf

)=(Γρνµ − Γρµν

)∂ρf = 0

l’ultimo passaggio è giustificato dal fatto che la torsione è nulla. Allora possiamo scrivere

0 =(∇µ∇ν −∇ν∇µ)(vρωρ) = ∇µ(ωρ∇νvρ + vρ∇νωρ)−∇ν(ωρ∇µvρ + vρ∇µωρ)

= ωρ(∇µ∇ν −∇ν∇µ) vρ + vρ

−Rσρµνωσ︷︸︸︷(∇µ∇ν −∇ν∇µ)ωρ

Perciò

0 = ωρ[∇µ,∇ν ] vρ − vρRσρµνωσ =⇒ ωρ([∇µ,∇ν ] vρ −Rσρµνvσ

)= 0 ∀ω =⇒ [∇µ,∇ν ] vρ = Rρσµνv

σ

avendo scambiato opportunamente gli indici.

Calcoliamo un’espressione esplicita per il tensore di Riemann:

([∇µ,∇ν ])ωρ = ∇µ(∂νωρ − Γσνρωσ

)−∇ν

(∂µωρ − Γσµρωσ

)

= ∂µ(∂νωρ − Γσνρωσ

)−((((

((((((

Γλνµ(∂λωρ − Γσλρωσ

)− Γλµρ(∂νωλ − Γσνλωσ) +

− ∂ν(∂µωρ − Γσµρωσ

)+(((

(((((((

Γλνµ(∂λωρ − Γσλρωσ

)+ Γλνρ

(∂µωλ − Γσµλωσ

)

Per simmetria si cancellano i primi due termini della seconda riga coi primi due1 dell’ultima riga; sempreper simmetria, si sommano gli ultimi membri di tali righe e quindi riscriviamo tale espressione come

−Rσρµν ωσ = −(∂µΓσνρ

)ωσ +

(∂νΓσµρ

)ωσ + ΓλµρΓ

σνλωσ− ΓλµρΓ

σµνωσ

perciò si ottiene, scambiando opportunamente gli indici e togliendo la dipendenza da ωσ:

Rσρµν = ∂µΓσνρ − ∂νΓσµρ + ΓλνρΓσµλ − ΓλµρΓ

σνλ (2.3.41)

da cui notiamo che per definire il tensore di Riemann non serve una metrica, ma il solo trasporto parallelo.

Proposizione 2.3.3. Stabilito che Rρµνλ = gρσRσµνλ, il tensore di Riemann ha le seguenti proprietà:

1. Rρµνλ = −Rµρνλ se ∇µgνλ = 0;

2. Rρµνλ = −Rρµλν ;3. Rρµνλ = Rνλρµ;

4. Rµ[ρνλ] = 0 (prima identità di Bianchi);

5. Rσλ[νρ;µ] = 0 (seconda identità di Bianchi)2.

Dimostrazione

1. Moltiplichiamo a sinistra il tensore di Riemann per gλρ:

gλρ[∇µ,∇ν ] vρ = Rρσµνvσgλρ =⇒

∇g=0

−Rρλµν︷︸︸︷[∇µ,∇ν ] vλ = Rλσµνv

σ = −Rσλµνvσ

Ora abbassiamo σ su R ed alziamolo su v, ovvero

Rσλµνvσ = gσρR

ρλµνv

σ = Rρλµνvρ

otteniamo perciò la tesi, in quanto

−Rσλµνvσ = Rσλµνvσ = Rρλµνvρ

1il primo col primo ed il secondo con il secondo.2si vedano le equazioni di Maxwell omogenee, a volte viene chiamata anche identità di Bianchi, F[νρ,µ] = 0.


2. Segue immediatamente dalla definizione 2.22.

3. Vedi Wald.

4. Vedi Wald.

5. È la generalizzazione di [∇µ,∇ν ]ωρ = −Rσρµνωσ al caso di un tensore di tipo (0, 2): si dimostri peresercizio che

[∇µ,∇ν ] tρλ = −Rσρµνtσλ −RσλµνtρσTale relazione implica che

(∇µ∇ν −∇ν∇µ)∇ρωλ = −Rσρµν∇σωλ −Rσλµν∇ρωσ (2.3.42)

D’altra parte

∇µ(∇ν∇ρωλ −∇ρ∇νωλ) = ∇µ(−Rσλµρωσ

)= −ωσ∇µRσλνρ −Rσλνρ∇µωσ (2.3.43)

Ora antisimmetriziamo la (2.3.42) e la (2.3.43) in µ, ν, ρ: i membri sinistri diventano uguali,ricordando che

T[µνρ] =1

3!(Tµνρ + Tρµν + Tνρµ − Tνµρ − Tρνµ − Tµρν)

Come membri destri abbiamo:

Rσ[ρµν]∇σωλ︸︷︷︸=0 per 4.

+Rσλ[µν∇ρ]ωσ = ωσ∇[µRσ|λ|νρ] +Rσλ[νρ∇µ]ωσ

dove con |λ| si indica che non si antisimmetrizza su λ. Gli ultimi due termini di ambo i membri sielidono per antisimmetria, perciò rimane, ∀ω:

ωσ∇[µRσ|λ|νρ] = 0 =⇒ ∇[µR

σ|λ|νρ] = 0

che equivale a Rσλ[νρ;µ] = 0.

La proprietà 5. del tensore di Riemann ha portato Einstein alla forma giusta delle sue equazioni. Ilnumero di componenti indipendenti del tensore di Riemann è1

N2

12

(N2 − 1

)

dove N è il numero di dimensioni.

Definizione 2.23. A partire dal tensore di Riemann si definiscono:

• il tensore di Ricci:Rµν := Rλµλν (2.3.44)

• lo scalare di curvatura:R := Rνν = gνµRµν (2.3.45)

• il tensore di Einstein:

Gµν := Rµν −1

2Rgµν (2.3.46)

1senza dimostrazione.


Dalla seconda identità di Bianchi e grazie all’antisimmetria del tensore di Riemann si ha che

Rσλνρ;µ +Rσλµν;ρ +Rσλρµ;ν = 0

e sia ora σ = ν, perciòRσλσρ;µ +Rσλµσ;ρ +Rσλρµ;σ = 0

Ma Rσλµσ;ρ = −Rσλσµ;ρ per la proprietà 2. del tensore di Riemann; ciò implica che

Rλρ;µ −Rλµ;ρ +Rσλρµ;σ = 0

moltiplicando tutto per gλρ si ottiene

gλρRλρ;µ − gλρRλµ;ρ + gλρRσλρµ;σ = 0

In quanto ∇g = 0 possiamo riscrivere tale relazione come

(R︷︸︸︷

gλρRλρ)

;µ−(gλµRλµ

);ρ

+(gλµRσλρµ

);σ

= 0 =⇒ R;µ −Rρµ;ρ +Rσρρµ;σ = 0

Ma Rσρρµ;σ = −Rρσρµ;σ per la proprietà 1. del tensore di Riemann, per cui

R;µ −Rρµ;ρ −Rσµ;σ = 0

da cui deriva che, per la (2.3.46):Gρµ;ρ = 0 (2.3.47)

ovvero la divergenza covariante del tensore di Einstein è nulla.

Quello che ora ci prefiggiamo come obiettivo è andare a calcolare δvρ dopo il trasporto parallelo lungouna curva chiusa infinitesima C : t 7→ C(t) tale che C(0) = p = C(t1); definito u come il vettore tangente

a C, ovvero tale che uµ =dxµ

dt, dobbiamo risolvere il sistema

∇uv = 0

v(t = 0) = vp


Dalla prima equazione del sistema segue che

uµ(∂µv

ρ + Γρµνvν)

= 0 =⇒ dvρ

dt+ Γρµν

dxµ

dtvν = 0

per cui

dvρ = −Γρµνdxµ

dtvνdt (2.3.48)


Sviluppiamo Γρµν al prim’ordine, indicando con x0 la coordinata di p:

Γρµν(x) = Γρµν(x0) + Γρµν,λ

∣∣∣x0

(xλ − xλ0

)+ ϑ(x− x0)

2

perciò

dvρ = −[Γρµν(x0) + Γρµν,λ

∣∣∣x0

(xλ − xλ0

)+ ϑ(x− x0)

2

]vν(0)dxµ

da cui, integrando a destra e a sinistra:

vρ(t)− vρ(0) = −Γρµν(x0) vν(0)(xµ(t)− xµ0 ) + ϑ(x− x0)2

dove il termine in Γρµν,λ

∣∣∣x0

è finito in ϑ(x− x0)2. Da quest’ultima espressione ricaviamo vρ(t), ed

eliminando i dt e sostituendo l’espressione ricavata per Γρµν(x) nella (2.3.48), si ottiene

dvρ = −[Γρµν(x0) + Γρµν,λ

∣∣∣x0

(xλ − xλ0

)+ ϑ(x− x0)2

][vν(0)− Γνλσ(x0)vσ(0)

(xλ − xλ0

)+ ϑ(x− x0)

2]

dxµ

=

[−Γρµν(x0)vν(0) + Γρµν(x0)Γνλσ(x0) vσ(0)(xλ − xλ0 )− Γρµν,λ

∣∣∣x0

vν(0)(xλ − xλ0 ) + ϑ(x− x0)2

]dxµ

Raccogliendo a destra1 vν(0) e reintroducendo i dt possiamo andare ad integrare in dt ambo i membri:

t1∫

0

dvρ =

t1∫

0

[−Γρµν(x0) + Γρµσ(x0)Γσλν(x0)(xλ − xλ0 )− Γρµν,λ

∣∣∣x0

(xλ − xλ0 ) + ϑ(x− x0)2

]vν(0)

dxµ

dtdt

Notiamo che il termine −Γρµν(x0) è un termine costante che non contribuisce all’integrale, in quanto∮k dxµ = 0

Rimane quindi

vρ(t1)− vρ(0) =

[Γρµσ(x0)Γσλν(x0)− Γρµν,λ

∣∣∣x0

]vν(0)

t1∫

0

(xλ − xλ0

) dxµ

dtdt

=[Γρ[µ|σ|Γ

σλ]ν − Γρ[µ|ν|,λ]

]x0

vν(0)

∮

C

xλdxµ

L’antisimmetrizzazione è giustificata dal fatto che, prendendo una superficie A tale che C = +∂A,possiamo usare il teorema di Stokes2:

∮

C

xλdxµ =

∫

A

dxλ ∧ dxµ

si ottiene perciò

vρ(t1)− vρ(0) = δvρ =[Γρ[µ|σ|Γ

σλ]ν − Γρ[µ|ν|,λ]

]x0

vν(0)

∫

A

dxλ ∧ dxµ

1ciò richiede chiaramente un cambio di indici opportuno.2in generale, il teorema di Stokes afferma che, dati un “circuito” p-dimensionale chiuso C, una “superficie”

(p+ 1)-dimensionale A tale che +∂A = C ed una p-forma ω, vale che∮C

ω =

∫A

dω

Notiamo che tale teorema contiene anche quello di Gauss.


Antisimmetrizzando tale espressione e riutilizzando il teorema di Stokes si ha

δvρ =1

2

[ΓρµσΓ

σµν − ΓρλσΓ

σµν − Γρµν,λ + Γρλν,µ

]x0

vν(0)

∮

C

xλdxµ

Tra le parentesi quadre è presente l’espressione del tensore di Riemann, ovvero

δvρ = Rρνµλ

∣∣∣x0

vν(0)

∮

C

xλdxµ (2.3.49)

2.3.4 Equazione della deviazione geodeticaL’equazione della deviazione geodetica lega la tendenza delle geodetiche ad avvicinarsi l’una all’altra o adallontanarsi una dall’altra alla curvatura della varietà. Questo fornisce un altro modo per caratterizzarela curvatura: consideriamo una famiglia ad un parametro di geodetiche γs(t) in modo tale che, ∀s ∈ R,la curva γs è una geodetica con parametro affine t, ovvero t è tale che ∇uu = 0 con u = ∂t

1.

Figura 2.11: rappresentazione della situazione descritta a breve.

T := ∂t è il vettore tangente alla geodetica, perciò ∇TTµ = 0; X := ∂s rappresenta lo spostamento dauna geodetica ad un’altra infinitesimamente vicina.

Proposizione 2.3.4. Con una riparametrizzazione t 7→ t′ = b(s)t+ c(s) possiamo sempre porre

XµTµ = 0 per t = 0 ed inoltre ∇X(TµTµ) = 0

quindi TµTµ non dipende nè da s nè da t, in quanto

∇TTµTµ = 2Tµ∇TTµ = 0

Dimostrazione La trasformazione diretta èt′ = b(s)t+ c(s)

s′ = s

mentre quella inversa è data da t =

t′ − c(s′)b(s′)

s = s′

Perciò, secondo la definizione, avremo che

T ′ =∂

∂t′=

∂t

∂t′∂

∂t=

1

b(s)T

1per maggiori approfondimenti, svolgere l’esercizio su geodetiche e parametro affine.


e, allo stesso modo

X ′ =∂

∂s′=

∂t

∂s′∂

∂t+∂s

∂s′∂

∂s= T

∂t

∂s′+X

Imponiamo la condizione di ortogonalità tra X ′ e T ′ in t′ = 0

0 = 〈X ′, T ′〉 =

⟨T∂t

∂s′+X,

1

bT

⟩=

1

b

⟨−bc′(s′) + cb′ (s′)b2

T +X,T

⟩=⇒ bc′(s′)− cb′(s′)

b2=〈X,T 〉〈T, T 〉

∣∣∣∣t′=0

ed inoltre0

!=

∂

∂s′〈T ′, T ′〉 =

∂

∂s′

(1

b2〈T, T 〉

)

Il termine tra parentesi tonde è solo funzione di s′ e perciò, avendo derivata rispetto ad s′ nulla, esso saràuna costante k che può essere fissata arbitrariamente ad 1 senza perdita di generalità, effettuando al piùun riscalamento di b.

1

b2〈T, T 〉 = 1 =⇒ b2 = 〈T, T 〉

Notiamo che〈T, T 〉

∣∣∣∣t′=0

= 〈T, T 〉∣∣∣∣t=−c/b

= 〈T, T 〉

e, sostituendo il valore di 〈T, T 〉 nella relazione precedentemente trovata si ha che

c′(s′)b− cb′(s′) = 〈X,T 〉∣∣∣∣t′=0

che è un’equazione differenziale in c(s′) che ha sempre soluzione. Per noi vale che

[X,T ] =[∂s, ∂t] = 0 =⇒ Xµ∇µT ν = Tµ∇µXν

essendo nulla la torsione; inoltre

∇T(XµTµ) =(∇TXµ)Tµ +Xµ∇TTµ =(T ν∇νXµ)Tµ

poichè ∇TTµ = 0 in quanto vettore tangente ad una geodetica. Ma allora, sostituendo il risultato appenaottenuto nell’ultima relazione:

∇T(XµTµ) =(T ν∇νXµ)Tµ =(Xν∇νTµ)Tµ =1

2Xν∇ν(TµTµ) =

1

2∇X(TµTµ) = 0

grazie all’apposita riparametrizzazione; da ciò consegue che XµTµ è costante lungo ogni geodetica, esiccome tale quantità è 0 per t = 0 allora è 0 per qualsiasi t.

La quantitàvµ := T ν∇νXµ

viene interpretata come la velocità relativa di una geodetica infinitesimamente vicina; si definisce anchel’accelerazione relativa, come

aµ := T ν∇νvµ

Cerchiamo ora una relazione tra aµ ed il tensore di Riemann:

aµ = T ν∇ν(Tλ∇λXµ

)= T ν∇ν

(Xλ∇λTµ

)= T ν

(∇νXλ

)∇λTµ + T νXλ∇ν∇λTµ

ma essendo [X,T ] = 0 e sfruttando la (2.3.40) vale che

T ν(∇νXλ

)∇λTµ = Xν

(∇νTλ

)∇λTµ ∇ν∇λTµ = ∇λ∇νTµ +RµσνλT

σ

perciò, sostituendo nell’espressione di aµ precedente e scambiando nel secondo addendo µ con λ, otteniamo

aµ = Xν∇ν(Tλ∇λTµ

)+RµσλνT

λXνTσ


Notiamo ora che il primo termine è nullo, perchè T è vettore tangente lungo una geodetica: perciò

aµ = RµσλνTλXνTσ (2.3.50)

Tale equazione prende il nome di equazione della deviazione geodetica, da cui consegue direttamenteche il tensore di Riemann non è 0 se e solo se le geodetiche accelerano l’una rispetto all’altra; geodeticheinizialmente parallele, nel senso che vµ = 0, rimangono parallele se e solo se il tensore di Riemann è nullo.

Esempio 2.14. Ricaviamo l’espressione delle forze fittizie a partire da un sistema rotante.

Ci serviremo della metrica di Minkowski

ds2 = −dt2 + dx2 + dy2 + dz2

e delle coordinate di Born, utili per descrivere un sistema a partire da un osservatore rotante, date da

x = r cos(ϑ+ ωt)

y = r sin(ϑ+ ωt)

z = z

t = t

=⇒

dx = cos(ϑ+ ωt) dr − r sin(ϑ+ ωt)(dϑ+ ωdt)

dy = sin(ϑ+ ωt) dr + r cos(ϑ+ ωt)(dϑ+ ωdt)

dz = dz

dt = dt

perciò la metrica, nelle coordinate (t, ϑ, r, z), diventa

ds2 = −(1− ω2r2

)dt2 + dr2 + r2dϑ2 + dz2 + 2r2ωdϑdt

Osserviamo immediatamente che per r > ω−1 il vettore tangente ∂t diventa un vettore di tipo spazio, acausa della rotazione rigida; la matrice inversa della metrica sarà

(gµν) =

−1 ω 0 0ω r−2 − ω2 0 00 0 1 00 0 0 1

avendo ordinato i “posti” come (t, ϑ, r, z). A questo punto possiamo andare a calcolare i simboli diChristoffel: riscriviamo per comodità la (2.3.33)

Γµνρ =1

2gµλ(gρλ,ν + gλν,ρ − gνρ,λ)

perciò

Γrtt = −ω2r Γrϑϑ = −r Γrtϑ = Γrϑt = −ωr Γϑrt = Γϑtr =ω

rΓϑrϑ = Γϑϑr =

1

r

e gli altri coefficienti sono nulli. Un metodo alternativo di calcolare i simboli di Christoffel è usare la(2.3.18), ovvero

Γ′ = J−1ΓJ2 + JdJ

dove J è la matrice Jacobiana del cambio di coordinate, per partire dai simboli di Christoffel Γ dellecoordinate cartesiane. Possiamo ora calcolare l’equazione delle geodetiche, secondo la (2.3.37), ovvero

d2xµ

dτ2+ Γµνρ

dxν

dτ

dxρ

dτ= 0

perciò, indicando con xµ =dxµ

dτ, avremo

t = 0 r − ω2rt2 − rϑ2 − 2ωrϑt = 0 ϑ+2ω

rrt+

2

rrϑ = 0 z = 0


Un metodo più veloce e valido in generale è sfruttare i principi variazionali:

δ

∫(±gµν xµxν)

12 dτ = 0 e δ

∫gµν x

µxνdτ = 0

tali due condizioni portano alle equazioni delle geodetiche. La nostra Lagrangiana è dunque

L = gµν xµxν =

(ω2r2 − 1

)t2 + r2 + r2ϑ2 + z2 + 2r2ωϑt

ed applicando le equazioni di Eulero-Lagrange

d

dτ

∂L

∂xµ− ∂L

∂xµ= 0

otteniamo il sistema di equazioni differenziali

(r2ω2 − 1

)t+ 2ω2rtr + r2ωϑ+ 2rωϑr = 0

r − ω2rt2 − rϑ2 − 2ωrϑt = 0

2rrϑ+ r2ϑ+ 2ωrtr + ωr2t = 0

z = 0

Notiamo che, sottraendo alla prima equazione del sistema la seconda moltiplicata per ω, si ottiene dinuovo t = 0, che, sostituita nella seconda equazione del sistema, porta a

ϑ+2ω

rrt+

2

rrϑ = 0

Da t = 0 ricaviamo t = aτ + b, dove a e b sono costanti: vale perciò

d

dτ=

dt

dτ

d

dt= a

d

dt

che ci permette di riscrivere tutte le derivate rispetto a τ come derivate rispetto a t, ovvero

r − ω2rt2 − rϑ2 − 2ωrϑt = 0 =⇒ d2r

dt2− ω2r − r

(dϑ

dt

)2

− 2ωrdϑ

dt= 0

dove in ω2r riconosciamo la forza centrifuga; allo stesso modo

ϑ+2ω

rrt+

2

rrϑ = 0 =⇒ d2ϑ

dt2+

2ω

r

dr

dt+

2

r

dr

dt

dϑ

dt= 0

Introduciamo ora le coordinate polari (r, ϑ) nel piano rotante, date da

r =

(x′

y′

)=

(r cosϑr sinϑ

)

avendo indicato con (x′, y′) le coordinate cartesiane nel piano rotante. Definiti i vettori di baseer = cosϑ ex′ + sinϑ ey′

eϑ = − sinϑ ex′ + cosϑ ey′

vale che

r = x′ex′ + y′ey′ = r cosϑ ex′ + r sinϑ ey′ =⇒ r =(r cosϑ− r sinϑϑ

)ex′ +

(r sinϑ+ r cosϑϑ

)ey′

Andiamo ad imporre dunque

d2r

dt2=

[d2r

dt2− r(

dϑ

dt

)2]er +

(2

dr

dt

dϑ

dt+ r

d2ϑ

dt2

)eϑ =

F

m=

1

m

(F rer + Fϑeϑ

)


che implica

F r = m

(ω2r + 2ωr

dϑ

dt

)

Fϑ = −2mωdr

dt

avendo usato le equazioni prima ottenute:

d2r

dt2− ω2r − r

(dϑ

dt

)2

− 2ωrdϑ

dt= 0

d2ϑ

dt2+

2ω

r

dr

dt+

2

r

dr

dt

dϑ

dt= 0

Abbiamo già notato la presenza della forza centrifuga; ci sarà in più la forza di Coriolis

Fc = −2mω × v = −2mωez ×(vrer + vϑeϑ + vzez

)= −2mω

(vreϑ − vϑer

)

perciò

Fϑc = −2mωvr = −2mωdr

dt

F rc = 2mωvϑ = 2mωrdϑ

dt

2.3.5 Vettori di KillingConsideriamo un diffeomorfismo xµ 7→ x′µ = xµ+ξµ(x) dove ξµ è infinitesimale1; come cambia la metricasotto tale cambio di coordinate? Ci interessa la quantità

δgµν := g′µν(x)− gµν(x)

Sappiamo cheg′µν(x′)dx′µdx′ν = gµν(x)dxµdxν

in quanto la distanza (al quadrato) tra due punti non può variare a seconda delle coordinate; ma allora

g′µν(x′)dx′µdx′ν = g′µν(x′)(

dxµ + ξµ,λdxλ)(

dxν + ξν,λdxλ)

= g′µν(x′)dxµdxν + g′µν(x′)dxµξµ,λdxλ + g′µν(x′)ξµ,λdxλdxν +O(ξ2)

cambiando ora gli indici in modo da avere dappertutto il prodotto dxµdxν otteniamo

gµν(x) = g′µν(x′) + g′µλ(x′)ξλ,ν + g′λν(x′)ξλ,µ

Sviluppiamo in serie g′µν(x′) intorno ad x, ricordando che ξλ = x′λ − xλ:

g′µν(x′) = g′µν(x)+∂g′µν∂x′λ

∣∣∣∣x

ξλ+O(ξ2) =⇒ gµν(x) = g′µν(x)+g′µν,λ(x)ξλ+g′µλ(x)ξλ,ν +g′λν(x)ξλ,µ+O(ξ2)

Osserviamo da quest’ultima equazione che:

gµν,λ(x) = g′µν,λ(x) +O(ξ) g′µν(x) = gµν(x) +O(ξ)

perciò otteniamo

gµν(x) = g′µν(x) + gµν,λ(x)ξλ + gµλ(x)ξλ,ν + gλν(x)ξλ,µ +O(ξ2)

che implica

δgµν = −gµν,λ(x)ξλ − gµλ(x)ξλ,ν − gλν(x)ξλ,µ

= −gµν,λ(x)ξλ − ∂ν[gµλ(x)ξλ

]+ gµλ,ν(x)ξλ − ∂µ

[gλν(x)ξλ

]+ gλν,µ(x)ξλ

1nel senso che si può pensare come perturbazione di x: in pratica trascureremo ogni termine di ordine ξ2.


Scriviamo le derivate della metrica in funzione dei simboli di Christoffel:

δgµν = −(

Γηλµgην + Γηλνgηµ

)ξλ − ξµ,ν +

(Γηνµgηλ + Γηνλgηµ

)ξλ − ξν,µ +

(Γηµλgην + Γηµνgηλ

)ξλ

= −Γνλµξλ − Γµλνξ

λ − ξµ,ν + Γλνµξλ + Γµνλξ

λ − ξν,µ + Γνµλξλ + Γλµνξ

λ

= −(∂µξν − Γλµνξ

λ)−(∂νξµ − Γλνµξ

λ)

ovveroδgµν = −∇µξν −∇νξµ = −(Lξg)µν (2.3.51)

avendo indicato con Lξ la derivata di Lie1 di ξ. In particolare vale δgµν = 0 quando i vettori ξ soddisfano

∇µξν +∇νξµ = 0 (2.3.52)

I vettori ξ che soddisfano tale relazione vengono detti vettori di Killing: se si effettua un movimentolungo di essi la metrica non cambia.

Proposizione 2.3.5. Su di una varietà (semi-)riemanniana N -dimensionale ci sono al massimoN(N + 1)/2 vettori di Killing. Se ce ne sono proprio N(N + 1)/2 allora lo spazio è a curvatura costante- vale anche il viceversa - cioè

Rµνρσ = λ(gµρgνσ− gµσgνρ)

Esercizio 2.12. Si dimostri che λ =R

N(N − 1).

Esempio 2.15. Calcoliamo i vettori di Killing per la 2-sfera.

La metrica sulla 2-sfera è data dads2 = dϑ2 + sin2ϑdϕ2

troviamo i vettori v di Killing tramite l’equazione (2.3.52):

∂µvν − Γαµνvα + ∂νvµ − Γανµvα = 0

che possiamo riscrivere attraverso la simmetria negli ultimi due indici dei simboli di Christoffel come

∂µvν + ∂νvµ − 2Γαµνvα = 0

Gli unici Γαµν nonnulli sono, ricordando l’esempio 2.12:

Γϑϕϕ = − sinϑ cosϑ Γϕϑϕ = Γϕϕϑ = cotϑ

perciò le equazioni di Killing diventano

∂ϑvϑ − Γαϑϑvα = 0

∂ϕvϕ − Γαϕϕvα = 0

∂ϕvϑ + ∂ϑvϕ − 2Γαϕϑvα = 0

=⇒

∂ϑvϑ = 0

∂ϕvϕ + sinϑ cosϑ vϑ = 0

∂ϕvϑ + ∂ϑvϕ − 2 cosϑ vϕ = 0

La cui soluzione più generale è data da

v =[(A sinϕ−B cosϕ) cotϑ+ C] ∂ϕ +[−A cosϕ−B sinϕ] ∂ϑ

Notiamo che lo spazio delle soluzioni ha dimensione 3, ovvero abbiamo il massimo numero di vettori diKilling, ed infatti la 2-sfera ha curvatura è costante. Scegliendo A = B = 0, C = 1 otteniamo v(1) = ∂ϕ,

1in generale, dato un tensore g di tipo (0, 2) anche Lξg è un tensore di tipo (0, 2), con:

(Lξg)µν = ξα∇αgµν + gαµ∇νξα + gαν∇µξα

tuttavia g è covariantemente costante. . .


soluzione che potevamo aspettarci a priori in quanto la metrica g non dipende da ϕ; inoltre sostituendoi valori A = 1, B = C = 0 e B = −1, A = C = 0 si ottengono

v(2) = sinϕ cotϑ∂ϕ − cosϕ∂ϑ v(3) = cosϕ cotϑ∂ϕ + sinϕ∂ϑ

Tale scelta dei v(i) ci permette di notare che[v(i), v(j)

]= εijkv(k)

ovvero vale la relazione di commutazione tipica del gruppo delle rotazioni.

Proposizione 2.3.6. Se ξ è un vettore di Killing e γ una geodetica con vettore tangente u, allora laquantità uµξµ è costante lungo γ.

Dimostrazione

∇u(uµξµ) =(∇uuµ︸︷︷︸

=0 geod.

)ξµ + uµ∇uξµ =

simm.︷︸︸︷uµuν ∇νξµ︸︷︷︸

antisimm.

= 0

Ad ogni vettore di Killing possiamo associare una costante del moto: questo è utile per esempio nellostudio del moto di un corpo nella metrica di Schwarzschild.

Esempio 2.16. Usiamo i vettori di Killing per ottenere le geodetiche sulla 2-sfera.

Detto λ il parametro affine, la tangente alle traiettorie xµ è data da

uµ =dxµ

dt

Facendo riferimento ai v(i) definiti nell’esempio 2.15, troviamo le costanti secondo la proposizione appenavista:

⟨u, v(1)

⟩= 〈u, ∂ϕ〉 = gµνu

µ(∂ϕ)ν

= gϕϕuϕ = sin2ϑ

dϕ

dλ=: a

⟨u, v(2)

⟩=

dϕ

dλsinϕ cotϑ sin2ϑ− dϑ

dλcosϕ =: b

⟨u, v(3)

⟩=

dϕ

dλcosϕ cotϑ sin2ϑ+

dϑ

dλsinϕ =: c

Ma valgono le seguenti relazioni:

a cotϑ = b sinϕ+ c cosϕ a cosϑ =(b sinϕ+ c cosϕ) sinϑ

Sostituendo nella relazione a sinistra b = c = 0 si ottiene

cotϑ = 0 =⇒ ϑ =π

2

che è la geodetica particolare comunemente nota come equatore. Osservando invece la relazione a destrasi nota che, essendo

x = sinϑ cosϕ

y = sinϑ sinϕ

z = cosϑ

essa diventaaz = by + cx

cioè essa afferma che le geodetiche si ottengono come intersezioni tra piani di questo tipo e la 2-sfera.

Capitolo 3

Le equazioni di Einstein

3.1 Il tensore energia momentoIn relatività ristretta, le distribuzioni continue di materia sono descritte da un tensore simmetrico Tµν ,chiamato tensore energia momento, le cui componenti hanno il seguente significato fisico:

• T 00 è la densità di energia;

• T 0i = T i0 è la densità di quantità di moto;

• −T ij è il tensore degli sforzi.

3.1.1 Meccanica dei continuiApriamo una breve parentesi sulla meccanica dei continui a proposito degli sforzi; lo sforzo è dato da,presi i vettori forza ed area infinitesimi:

dF = S dA dFi = Sij dAj

S è un tensore, detto tensore degli sforzi; non necessariamente dF ‖ dA, dove dA = ndA avendodefinito n il versore normale ad A.


La conservazione del tensore energia momento in un sistema isolato è scrivibile come:

∂µTµν = 0 (3.1.1)

mentre in un sistema non isolato, detta kν la densità di forza:

∂µTµν = kν (3.1.2)

58 Capitolo 3. Le equazioni di Einstein

Esempio 3.1. Per definizione un fluido perfetto è una distribuzione continua di materia con tensoreenergia momento della forma

Tµν = ρ uµuν + P(ηµν + uµuν) (3.1.3)

dove η è la metrica, ρ la densità di energia, P la pressione e uµ è un vettore di tipo tempo tale cheηµν u

µuν = −1, e che rappresenta la 4-velocità del fluido. Nel sistema di quiete

(uν) = (1, 0, 0, 0) =⇒ Tµν =

ρ 0 0 00 P 0 00 0 P 00 0 0 P

dove ρ è la densità di energia e P è la pressione misurate nel sistema di quiete. Un fluido viene dettoperfetto perchè non ci sono termini di conducibilità termica e termini di sforzi che corrispondono allaviscosità. Le equazioni del moto per un fluido perfetto senza forze esterne sono date dalla (3.1.1), per cui:

∂µ[ρ uµuν + P(ηµν + uµuν)] = 0

che implica

(∂µρ)uµuν + ρ(∂µuµ)uν + ρ uµ∂µu

ν +(∂µP )(ηµν + uµuν) + P(∂µuµ)uν + P uµ∂µu

ν = 0

Sapendo cheuνu

ν = −1 =⇒ (∂µuν)uν + uν∂µuν = 0 =⇒ (∂µu

ν)uν = 0

e che ηµν + uµuν è una sorta di proiettore lungo la direzione perpendicolare a u, infatti

uν(ηµν + uµuν) = uµ − uµ = 0

moltiplichiamo l’equazione della conservazione di Tµν per uν ottenendo così

uµ∂µρ+ ρ ∂µuµ + P ∂µu

µ = 0 (3.1.4)

che viene detta equazione di continuità relativistica.

Abbiamo visto che la quantità ηµν + uµuν è un proiettore, ma anche δβν + uβuν è un proiettore sulsottospazio perpendicolare ad u, perciò, derivando e moltiplicando la (3.1.3) per tale proiettore:

ρuµ(δβν + uβuν

)∂µu

ν +(∂µP )(δβν + uβuν

)(ηµν + uµuν) + Puµ

(δβν + uβuν

)∂µu

ν = 0

ma (δβν + uβuν

)(ηµν + uµuν) = ηβµ +

uµuβ +

uβuµ − uβuµ uν∂µu

ν = 0

perciò(P + ρ)uµ ∂µu

β +(ηβµ + uβuµ

)∂µP = 0 (3.1.5)

che è l’equazione di Navier-Stokes relativistica. Vediamone il limite non relativistico, per cui

P << ρ = ϑ(mc2

)−−−−→c→∞

∞ e, detto (uµ) = (1,v) con |v| << c, |v| dPdτ

<< |∇P |, perciò dalla (3.1.4)

abbiamo1

∂tρ+ vi∂iρ+ ρ ∂ivi + P ∂iv

i = 0

ma P ∂ivi è trascurabile poichè P << ρ, perciò otteniamo

∂ρ

∂t+∇·(ρv) = 0 (3.1.6)

che è una legge di conservazione dell’energia.

1τ = ct.

3.1. Il tensore energia momento 59

Dalla (3.1.5) segue che

(P + ρ)(∂tv

i + vj∂jvi)

+ ∂iP + vi(∂tP + vj∂jP

)= 0

ma, ancora, P << ρ, ∂tP << ∂iP e vivj∂jP << ∂iP essendo |v| << 1 perciò

ρ

[∂v

∂t+(v · ∇)v

]= −∇P (3.1.7)

che è l’equazione di Eulero.

Proposizione 3.1.1. La (3.1.7) può essere ottenuta anche dal secondo principio di Newton.

Dimostrazione Consideriamo un volume V ; su questo agisce una forza totale data, sfruttando il teoremadi Gauss, da

−∮

∂V

P d2f = −∫

V

∇P dV

da cui segue che ∇P altro non è che una densità di forza, per cui imponiamo1

−∇P = ρdv

dt= ρ

[∂v

∂t+∂v

∂xi∂xi

∂t

]= ρ

[∂v

∂t+(v · ∇)v

]

che è proprio quanto volevamo dimostrare.

Nel sistema di quiete S abbiamo visto che(Tµν) = diag(ρ, P, P, P ); usiamo ora le trasformazioni di Lorentzper passare a descrivere (Tµν) in un sistema di riferimento S′ che si muova rispetto ad S

x′µ = Λµν xν

Avremo quindiT ′µν =

(ΛT T Λ

)µν

= (ΛT ) αµ Tαβ Λβν = Λαµ Tαβ Λβν

dove, definito γ := (1− v2)−1/2:

(Λµν) =

γ −γvt

−γv(Λij)

Λij = δij + vivj

(γ − 1

v2

)uµ =

dxµ

dτ=

dxµ

dt

dt

dτ= γ

dxµ

dt

l’ultima relazione implica che ui = γvi e u0 = γ. Scrivendo esplicitamente l’espressione di T ′µν abbiamoche

T ′00 = Λα0 Tαβ Λβ0 = Λ00 T00 Λ0

0 + 2Λ00 T0i Λi0 + Λi0 Tij Λj0 = γ2ρ+ γ2vi vj P δij = γ2ρ+ γ2 v2 P

Maγ2 =

1

1− v2=⇒ v2 = 1− γ−2 =⇒ v2γ2 = γ2 − 1

perciòT ′00 = γ2ρ+

(γ2 − 1

)P

ma, d’altra parteρu0 u0 + P(η00 + u0 u0) = γ2ρ+ (γ2 − 1)P = T ′00

In modo analogo si trovano T ′0i, T ′ij : in uno spaziotempo curvo dobbiamo eseguire le seguenti sostituzioni

ηµν → gµν ∂µ → ∇µperciò il tensore energia-momento del fluido perfetto diventa

Tµν = ρ uµuν + P(gµν + uµuν)

che soddisfa ∇νT νµ = 0.

1secondo la meccanica classica, F = ma =⇒F

V=m

V

dv

dt= ρ

dv

dt.


3.2 Relazione tra geometria nello spaziotempo e distribuzione dimateria

Qual è l’equazione che descrive il legame tra geometria dello spaziotempo e distribuzione di materia? Unindizio importante viene dal paragone tra le forze di marea descritte dalla gravità newtoniana e dallarelatività generale.

Proposizione 3.2.1. L’accelerazione relativa di due particelle vicine è data, secondo la teoria newtonia-na, da

a = −(y · ∇)∇φ (3.2.1)

dove y è il vettore di separazione delle particelle, e φ è il potenziale gravitazionale newtoniano.

Dimostrazione Se x è la posizione della particella 1, quella della particella 2 è data da x + y; ma alloravalgono

d2xi

dt2= −∂iφ(x)

d2(xi + yi

)

dt2= −∂iφ(x + y)

Supponendo le due particelle vicine, sviluppiamo la seconda equazione, che diventa perciò

d2xi

dt2+

d2yi

dt2= −∂iφ(x + y) ≈ −∂iφ(x)− yj ∂j∂iφ(x)

e sostituendovi la prima equazione del sistema otteniamo

d2yi

dt2= −yj∂j∂iφ(x)

che è proprio la tesi.

Nella relatività generale tale accelerazione è data dalla equazione della deviazione geodetica (2.3.50):

aµ = Rµσλν vσvλyν

dove yν è il vettore di deviazione. Il confronto tra i due risultati suggerisce euristicamente la corrispon-denza

Rµσλµ vσvλ ←→ −∂µ∂µφ

D’altro canto l’equazione di Poisson con costante gravitazionale universale unitaria (G = 1) afferma che

∇2φ = 4πρ

dove ρ è la densità di massa/energia della materia; dato un tensore energia-momento Tµν , un osservatorecon quadrivelocità v misura la densità di energia

ρ = Tσλ vσvλ

ma ora osserviamo che ∂µ∂µφ = ∇2φ, perciò

−4πTσλ vσvλ = −∇2φ = −∂µ∂µφ←→ Rµσλµ = −Rσλ

che suggerisceRσλ = 4πTσλ (3.2.2)

equazione che fu postulata inizialmente da Einstein, che però si accorse subito di un problema serio, inquanto, come detto sopra, il tensore Tµν deve soddisfare la conservazione dell’energia ∇µTµν = 0. D’altraparte, sappiamo che

∇µGµν = ∇µ(Rµν − 1

2Rgµν

)= 0 =⇒ ∇µRµν −

1

2gµν ∇µR = 0

3.2. Relazione tra geometria nello spaziotempo e distribuzione di materia 61

avendo sfruttato il fatto che gµν è covariantemente costante; osservando tale equazione notiamo che∇µRµν = 4π∇µTµν = 0 per la (3.2.2) e per la conservazione dell’energia, ma allora

∇µR = 0 =⇒ T = Tµµ = k

cioè la curvatura scalare dovrebbe essere costante nell’universo, così come la quantità T . Tali restrizionisulla distribuzione della materia non sono fisiche, e, a maggior ragione, oggi sappiamo che l’universo siespande, e quindi la curvatura e la ρ sono cambiate. Einstein abbandonò la (3.2.2), e, spinto dal fattoche il tensore G fosse a divergenza nulla, considerò invece l’equazione

Gµν = 8πTµν (3.2.3)

Con la (3.2.3) non c’è più conflitto tra l’identità di Bianchi e la conservazione dell’energia, infatti

∇µGµν = 0 =⇒ 8π∇µTµν = 0

anzi, la conservazione dell’energia è conseguenza dell’identità di Bianchi.

Apriamo ora una piccola parentesi di elettrodinamica: le equazioni di Maxwell sono

∂µFµν = 4πjν

e le identità di Bianchi implicano che Fµν = ∂µAν − ∂νAµ; ma dall’equazioni di Maxwell

0 = ∂ν∂µFµν = 4π ∂νj

ν =⇒ ∂νjν = 0

che è la conservazione della carica; notiamo che ∂ν∂µFµν = 0 perchè è la contrazione di un terminesimmetrico, ∂ν∂µ, e di uno antisimmetrico, Fµν .

Valgono ancora le corrispondenze utilizzate per ottenere la (3.2.2)? La traccia1 della (3.2.3) è

R− 1

2R · 4 = 8πT =⇒ R = −8πT

che, sostituito nella (3.2.3), porta a

Rµν = 8π

(Tµν −

1

2gµνT

)(3.2.4)

In situazioni in cui la teoria newtoniana è applicabile, l’energia della materia, misurata da un osservatoreche è in buona approssimazione in quiete rispetto alle masse, è molto più grande degli sforzi materiali,ovvero

T = Tµµ ≈ T 00 = −ρ = −Tσλ vσvλ

ma la (3.2.4) implica

Rµν vµvν = 8πTµν v

µvν − 4πgµν vµvν T = 4πTµν v

µvν

essendo gµνvµvν = −1 ed avendo sostituito a T la sua espressione approssimata. Le (3.2.3) sono le

equazioni di Einstein della relatività generale (1915). L’intero contenuto della relatività generale puòessere riassunto nel modo seguente:

• lo spaziotempo è una varietà differenziabile munita di una metrica gµν lorentziana;

• la curvatura di g è legata alla distribuzione di materia dalle (3.2.3).

In sintesi, “la materia dice allo spaziotempo come curvarsi”; d’altra parte, nelle varietà curve le particellesi muovono lungo delle geodetiche, vedi (2.3.37), cioè “lo spaziotempo dice alla materia come muoversi”.

1la traccia di gµν è gµν gµν = 4.


3.3 Gravità linearizzataL’obiettivo che ci prefiggiamo ora è vedere se in approssimazione di spazio piatto si trovano le equazioni“classiche”; consideriamo a questo proposito gµν come piccola perturbazione della metrica di Minkowski

gµν = ηµν + hµν =⇒ gµν = ηµν − hµν

avendo alzato ed abbassato gli indici con η e con |hµν | << 1; notiamo infatti che

gµν gρν =(ηµν − hµν)(ηρν + hρν) = δµρ + ϑ(h2)

Scriviamo quindi la formula per

• i simboli di Christoffel:

Γµνρ =1

2gµλ(gρλ,ν + gλν,ρ − gνρ,λ) =

1

2ηµλ(hρλ,ν + hλν,ρ − hνρ,λ) + ϑ(h2)

• per il tensore di Riemann, sfruttando il fatto che

Rσρµν = ∂µΓσνρ − ∂νΓσµρ + ϑ(h2)

perciò:

Rαµβν =1

2(hαν,µβ + hµβ,να − hµν,αβ − hαβ,µν)

• per il tensore di Ricci:

Rµν = Rβµβν =1

2

(hβν,µβ + h β

µβ,ν − hβ

µν, β − hββ,µν

)

• per la curvatura:

R = Rνν =1

2

(hβ ν

ν, β + hν ββ,ν − h

ν βν, β − h

β νβ, ν

)= hβ ν

ν, β − hν βν, β

Introduciamo ora la quantità

hαβ := hαβ −1

2ηαβ h

σσ =⇒ hββ = hββ −

1

24h σ

σ = −hββ

Ma allora possiamo ricavare il tensore h da h:

hαβ = hαβ +1

2ηαβ h

σσ =⇒ hαβ = hαβ −

1

2ηαβ h

σσ

A questo punto possiamo calcolare il tensore di Einstein:

Gµν = Rµν−1

2Rgµν = Rµν−

1

2Rηµν+ϑ(h2) =

1

2

(hβν,µβ + h β

µβ,ν − hβ

µν, β − hββ,µν

)−1

2ηµν

(hβ ν

ν, β − hν βν, β

)

avendo sfruttato il fatto che R = ϑ(h); ora sia h := h σσ , per cui

Gµν =1

2

(hβν,µβ −

1

2ηβν h,µβ + h β

µβ,ν −1

2ηµβ h

β,ν − h β

µν, β +1

2ηµν h

β, β − h

ββ,µν +

1

2ηββ h,µν

)+

− 1

2ηµν

(hβ ρ

ρ, β −1

2ηβρ h

ρ, β − h

ρ βρ, β +

1

2ηρρ h

β, β

)

Semplificando l’espressione si trova che

Gµν =1

2

(hβν,µβ + h β

µβ,ν − hβ

µν, β − ηµν hβ ρρ, β

)(3.3.1)

3.3. Gravità linearizzata 63

Apriamo ora una parentesi sulle trasformazioni di gauge, e consideriamo una trasformazione dicoordinate infinitesima

xµ 7→ x′µ = xµ + ξµ(x)

Ricordando quanto visto con i vettori di Killing, sappiamo che

gµν 7→ g′µν =∂xα

∂x′µ∂xβ

∂x′νgαβ dove

∂x′µ

∂xα= δµα + ∂αξ

µ

ma a noi serve∂xα

∂x′µ= δαµ − ∂µξα

e verifichiamo che sia proprio l’inversa

∂x′µ

∂xα∂xα

∂x′ν=(δµα + ∂αξ

µ)(δαν − ∂νξα) = δµν

Quindi:

g′µν =(δαµ − ∂µξα

)(δβν − ∂νξβ

)gαβ =

(δαµ δ

βν − δαµ ∂νξβ − δβν ∂µξα

)gαβ

= gµν − ∂νξβ gµβ − ∂µξα gαν

Ora usiamo che gµν = ηµν + hµν , perciò

ηµν + h′µν = ηµν + hµν − ∂νξβ(ηµβ + hµβ)− ∂µξα(ηαν + hαν)

trascurando i termini ϑ(ξ · h) otteniamo

h′µν = hµν − ∂νξµ − ∂µξν (3.3.2)

che è analogo a A′µ = Aµ − ∂µχ, solo che ξ è un oggetto ad un indice da simmetrizzare, poichè h ed h′sono oggetti simmetrici.

Esercizio 3.1. Dimostrare che queste trasformazioni lasciano invarianti il tensore di Riemann, così comele trasformazioni di gauge lasciano invariato il tensore di Faraday.

Andiamo a ricavare l’espressione di h′µν dalla (3.3.2):

h′µν = h′µν −1

2ηµν h

′ σσ = hµν − ∂νξµ − ∂µξν −

1

2ηµν(h

σσ − 2∂σξ

σ)

da cui deriva cheh′µν = hµν − ∂νξµ − ∂µξν + ηµν ∂σξ

σ

Proposizione 3.3.1. Definito il gauge di Lorentz come la condizione

∂µh′µν = 0 (3.3.3)

allora è sempre possibile trovare una trasformazione di gauge in modo tale che h′µν soddisfi la (3.3.3).

Dimostrazione Imponiamo il gauge di Lorentz:

0 = ∂µh′µν = ∂µhµν − ∂ν ∂µξµ − ∂µ ∂µξν + ηµν∂µ ∂σξ

σ = ∂µhµν −2ξν

si ottiene perciò l’equazione differenziale2ξν = ∂µhµν (3.3.4)

che ammette sempre soluzione.


Chiusa la parentesi sulle trasformazioni di gauge, sostituendo la (3.3.4) nella (3.3.1) otteniamo

Gµν = −1

22hµν = 8πTµν

che implica2hµν = −16πTµν (3.3.5)

che sono le equazioni di Einstein linearizzate nel gauge di Lorentz, e vengono anche dette equazioni diPauli-Fierz. Nel caso non ci siano sorgenti, per cui Tµν = 0 si ottiene l’equazione di d’Alembert

2hµν = 0

la cui soluzione particolare è l’onda gravitazionale piana

hµν = eµν eikαx

α

(3.3.6)

dove eµν è un tensore simmetrico e costante, kα = (ω,k) è il quadrivettore d’onda costante, dove k èil solito vettore d’onda tridimensionale, e vale che1 kα kα = 0, cioè kα è un vettore di tipo luce, il chesignifica che le onde gravitazionali si propagano alla velocità della luce. I fronti d’onda sono dati da

kµxµ = t

dove t è una costante, e, senza perdere di generalità, supponiamo che l’onda propaghi in direzione z, percui k1 = 0 = k2:

kµxµ = k0x

0 + k3x3 = t

differenziando

−ω dt+ k3 dx3 = 0 =⇒ dx3

dt=

ω

k3=: vf

dove vf è la velocità di fase dell’onda; in generale

vf =ω

|k|

Ci ricordiamo però che

kµkµ = −

(k0)2

+(k3)2

= 0 =⇒ k3 = ±k0 =⇒ vf = ±1 = ±c

La soluzione dell’equazione di Pauli-Fierz per una fissata sorgente Tµν(x) è ottenuta tramite la funzionedi Green definita da

2Gµν(x) = −16πηµν δ(4)(x) (3.3.7)

Verifichiamo che effettivamente sia soluzione

hµν(x) =

∫d4x′ Gµρ(x− x′)T ρν (x) =⇒ 2xhµν(x) =

∫d4x′ 2xGµρ(x− x′)︸︷︷︸

−16πηµρ δ(4)(x−x′)

T ρν (x) = −16πTµν(x)

1basta sostituire la (3.3.6) nella (3.3.5) omogenea.

3.4. Il limite newtoniano della relatività generale 65

3.4 Il limite newtoniano della relatività generaleUno dei test cruciali della relatività generale è costituito dal fatto che deve ridursi alla teoria newtonianaquando la gravità è debole, il moto delle sorgenti avviene a velocità in modulo molto minori di c egli sforzi materiali sono molto più piccoli della densità di energia1. Nel caso di gravità debole, valel’approssimazione lineare della relatività generale, mentre le ipotesi sulle sorgenti possono essere formulatenel modo seguente: esiste un sistema di coordinate globale ed inerziale in modo tale che

Tµν ≈ ρ uµuν con u = ∂t

Allora varrà che Tti ≈ 0 perchè le velocità, e quindi le densità di momento, sono piccole, e che Tij ≈ 0,perchè gli sforzi sono piccoli. Siccome le sorgenti variano lentamente, la geometria dello spaziotempocambia poco col tempo, per cui trascuriamo le derivate temporali di hµν . Le equazioni di Pauli-Fierzdiventano

∆hij = 0 = ∆hit ∆htt = −16πρ (3.4.1)

dove ∆ = ∂i ∂i; l’unica soluzione di ∆hij = 0 regolare all’infinito è hij = 0.

Esercizio 3.2. Dimostrare che la soluzione hij = k con k costante può essere eliminata da una trasfor-mazione delle coordinate.

Allo stesso modo hit = 0; rimane solo quella non banale, per cui, ricordando che h tt = −htt, si ha

hµν = hµν −1

2ηµν h

σσ =⇒

htt = htt −1

2htt =

1

2htt

hij = hij +1

2δij htt =

1

2δij htt

perciò, definendo φ := −1

4htt:

hµν = −(4uµuν + 2ηµν)φ

Si ottiene perciò l’equazione di Poisson classica, sostituendo φ in ∆htt = −16πρ:

∆φ = 4πρ

Consideriamo ora il moto di un corpo “test”, ovvero tale da poter trascurare la sua curvatura dellospaziotempo, nello spaziotempo curvo dotato della metrica

gµν = ηµν + hµν

L’equazione delle geodetiche è data dalla (2.3.37):

d2xµ

dτ2+ Γµρσ

dxρ

dτ

dxσ

dτ= 0

In approssimazione classica, ovvero |v| << c, avremo che2 (xρ) ≈ (1, 0, 0, 0) e τ ≈ t, γ → 1, perciòdall’equazione delle geodetiche segue che

d2xµ

dt2= −Γµtt = −1

2ηµα(hαt,t + hαt,t − htt,α)

avendo usato la (2.3.33); poichè le sorgenti si muovono lentamente trascuriamo hαt,t e htt,t, perciò rimanesolamente

Γµtt = −1

2ηµi htt,i =⇒

Γttt = 0

Γitt = −1

2htt,i =

∂φ

∂xi

Dunque l’equazione delle geodetiche diventa l’equazione di Newton

d2xi

dt2= − ∂φ

∂xi(3.4.2)

1sempre usando unità in cui c = 1.2indicando con x la derivata di x rispetto a τ .


3.5 La soluzione di SchwarzschildCi poniamo ora il problema1 di trovare la geometria dello spaziotempo all’esterno di una distribuzione dimassa statica2 e sfericamente distribuita. Perchè è importante trovare questa geometria? I motivi sonodue:

i) costituisce un test classico della relatività generale tramite i campi gravitazionali nel nostro siste-ma solare, assieme alla precessione delle orbite dei pianeti, alla deviazione della luce, al redshiftgravitazionale, alla dilatazione del tempo, etc.;

ii) i corpi sufficientemente massivi sono instabili, e subiscono un collasso gravitazionale che porta allaformazione di buchi neri. Dopo un collasso di un corpo con simmetria sferica, l’intera geometriadello spaziotempo è descritta dalla soluzione di Schwarzschild, che quindi ci insegna molto nel limitedella relatività generale in cui i campi gravitazionali sono forti.

Il fatto che una stella collassi in un punto causa il fallimento della descrizione della gravità attuale: ciòci dice che c’è bisogno di una formulazione nuova, quantistica, della gravità, così come la fisica classicanon era in grado di descrivere perchè l’atomo non collassi su se stesso.

3.5.1 Derivazione della soluzione di SchwarzschildVogliamo trovare tutte le metriche statiche e sfericamente simmetriche che soddisfino Rµν = 0, in quantonel vuoto

Gµν = 0 =⇒ Rµν −1

2Rgµν = 0 =⇒ R− 1

2R 4 = 0 =⇒ R = 0 =⇒ Rµν = 0

Prima però dobbiamo definire più precisamente il significato di “statico” e “sfericamente simmetrico”.

Definizione 3.1. Uno spaziotempo viene chiamato stazionario se possiede un vettore di Killing ξ ditipo tempo; si dimostra che tale condizione è equivalente a richiedere l’esistenza di un gruppo ad unparametro di isometrie φt le cui orbite (cioè l’insieme dei punti che risultano quando il gruppo agisce sudi un dato punto) siano curve di tipo tempo.

Figura 3.1: il vettore ξ di tipo tempo esprime la simmetria dello spaziotempo sotto traslazioni temporali.

Definizione 3.2. Uno spaziotempo è statico se è stazionario e se esiste inoltre un’ipersuperficie Σortogonale alle orbite dell’isometria, ovvero quelle lungo cui c’è invarianza sotto traslazione temporale.

Si possono introdurre delle coordinate convenienti per spazitempi statici nel modo seguente: se ξ 6= 0ovunque su Σ, ogni punto p in un intorno di Σ (quindi su Σ) giace su di un’unica orbita di ξ che passaper Σ.Scegliamo delle coordinate arbitrarie xi, i = 1, 2, 3 per ξ ed assegnamo al punto p le coordinate

(t, xi

)

dove t è il parametro dell’orbita che parte da Σ e finisce in p, e xi sono le coordinate dell’intersezionedell’orbita con Σ.

1risolto da Karl Schwarzschild nel 1916.2ovvero non rotante, non pulsante ed in quiete.

3.5. La soluzione di Schwarzschild 67

Poichè ξ = ∂t è vettore di Killing, le componenti della metrica in questo sistema di coordinate sonoindipendenti da t. Inoltre, siccome la superficie Σt, definita come l’insieme dei punti di coordinatatemporale t, è la immagine di Σ sotto l’isometria φt, segue che ogni Σt è ortogonale a ξ, per cui la metricaha la forma

ds2 = −V(x1, x2, x3

)dt2 +

3∑

i,j=1

hij(x1, x2, x3

)dxidxj (3.5.1)


Osservazione 3.1. Notiamo che ds2 non dipende da t poichè ξ non dipende da t e che non vi sonotermini misti dtdxi in quanto ξ ⊥ Σ.

Definizione 3.3. Uno spaziotempo viene chiamato sfericamente simmetrico se il suo gruppo diisometrie contiene un sottogruppo SO(3) e se le orbite di questo sottogruppo sono delle 2-sfere.

Osservazione 3.2. Lo spaziotempo di Schwarzschild ammette 4 vettori di Killing, che sono ∂t e i tregeneratori di SO(3).

La metrica dello spaziotempo induce una metrica su ciascuna di queste 2-sfere. A causa della simmetriarotazionale, questa metrica deve essere un multiplo della metrica sulla S2 con raggio 1, cioè si può scrivere

ds2 = r2(dϑ2 + sin2ϑ dϕ2

)

Osservazione 3.3. La coordinata r non ha necessariamente il significato di una distanza della superficiedella sfera dal centro, poichè il centro può non esistere, ad esempio con una topologia R × S2, vedasi lafigura sottostante; nonostante ciò, chiamiamo coordinata radiale la quantità r.

Figura 3.3: cilindro dato da R× S2.

Se lo spaziotempo è statico e a simmetria sferica, e se il vettore di Killing di tipo tempo ξ è unico, ξdev’essere ortogonale alle 2-sfere introdotte sopra perchè, essendo unico, ξ deve essere invariante sottole simmetrie rotazionali, per cui la proiezione su ogni S2 dev’essere zero. Per questo motivo le 2-sferegiacciono interamente sulla superficie Σt; scegliendo le coordinate (r, ϑ, ϕ) su Σ, la metrica assume laforma

ds2 = −f(r) dt2 + h(r) dr2 + r2(dϑ2 + sin2ϑdϕ2

)(3.5.2)


Esercizio 3.3. Calcolare Rµν per la metrica (3.5.2).

A partire dalla (3.5.2), le equazioni di Einstein diventano:

Rµν = 0 =⇒

Rtt = 0 =⇒ 1

2(fh)

− 12

d

dr

[(fh)

− 12

df

dr

]+

1

rfh

df

dr= 0

Rrr = 0 =⇒ −1

2(fh)

− 12

d

dr

[(fh)

− 12

df

dr

]+

1

rh2

dh

dr= 0

Rϑϑ = 0 =⇒ −1

2

1

rfh

df

dr+

1

2

1

rh2

dh

dr+

1

r2

(1− 1

h

)= 0

Rµν = 0 se µ 6= ν

Rϕϕ = 0 =⇒ Rϑϑ = 0

Indicando con f =df

dr, si ha, sommando le prime due equazioni:

f

f+h

h= 0 =⇒ f =

k

h

dove k è una costante che può essere posta pari ad 1 riscalando t 7→ k−32 t. Con h = f−1 la terza equazione

diventa

−1

2

f

r+

1

2rf2

(− 1

f2

)f +

1

r2(1− f) = 0 =⇒ −f +

1− fr

= 0

cioèd

dr(rf) = 1 =⇒ f = 1 +

c

r

dove c è una costante; tale equazione, assieme ad h = f−1 soddisfa tutte le equazioni del sistema.Sostituendo quanto trovato per f ed h nella (3.5.2) si trova

ds2 = −(

1 +c

r

)dt2 +

(1 +

c

r

)−1

dr2 + r2(dϑ2 + sin2ϑdϕ

)(3.5.3)

che è la soluzione di Schwarzschild.

Osservazione 3.4. Con r → +∞ la metrica (3.5.3) è piatta, perciò si dice che la metrica di Schwarzschildè asintoticamente piatta. Questo ci permette di interpretare tale metrica come campo gravitazionaleall’esterno di un corpo isolato.

Vale il

Teorema 3.5.1. Ogni soluzione dell’equazione di Einstein nel vuoto, con simmetria sferica, è statica(Teorema di Birkhoff).

Osservazione 3.5. Il teorema di Birkhoff implica che la soluzione è quella di Schwarzschild anche senzafare l’ipotesi di staticità. Inoltre, la costante c può essere determinata paragonando il moto di un corpo“test” nel regime in cui il campo gravitazionale è debole (r → +∞) col moto della teoria newtoniana, percui |v| << c, τ ≈ t: l’equazione delle geodetiche era, secondo la (3.4.2):

d2xi

dt2= − ∂φ

∂xiφ = −M

r

da paragonare cond2xα

dt2= −Γαtt

perciò imponiamo che

Γitt = −∂iM

r


Ma Γitt = giα Γαtt ≈ ηiα Γαtt poichè la metrica è quasi piatta con r → +∞, perciò

Γitt = Γitt =1

2(git,t + git,t − gtt,i) = −1

2∂igtt = −∂i

M

r=⇒ gtt =

2M

r+ c

dove c è una costante, ma sappiamo che

gtt −−−−−→r→+∞

−1 =⇒ c = −1 =⇒ gtt = −(

1− 2M

r

)= −

(1 +

c

r

)

perciò nel limite newtoniano c = −2M . Per r = 2M abbiamo una singolarità nella metrica1. Nel casodel Sole 2M ∼ 3 km, molto all’interno del Sole, dove Tµν 6= 0, cioè non accade quanto abbiamo descrittofin’ora.

3.5.2 Geodetiche della geometria di Schwarzschild

Per studiare il comportamento di raggi di luce e di corpi massicci nel campo gravitazionale all’esternodi una distribuzione di massa a simmetria sferica dobbiamo determinare le geodetiche della metricadi Schwarzschild. Questo compito diventa abbastanza facile se facciamo uso delle simmetrie dellospaziotempo. Se ξ è Killing e se u è il vettore tangente ad una geodetica, ξ · u è costante lungo lageodetica:

∇u(ξ · u) = 0 ξ = ∂t ξ · u =: −ELa quantità ξ · u viene assunta come “energia per unità di massa”, e si conserva lungo la geodetica inquanto asintoticamente, per r →∞, la metrica di Schwarzschild tende a quella di Minkowski, perciò

−ξ · u = −ξα ηαβ uβ = −ξ0 η00 u0 = u0 =

p0

m=E

m

essendo ξ0 = 1 e η00 = −1; se ξ = ∂ϕ allora ξ ·u =: L è il “momento angolare per unità di massa”, infatti,per r →∞

ξ · u = ξα gαβ uβ = ξφ gφφ u

φ = r2 sin2ϑuφ =1

mr2 sin2ϑ pφ

essendo ξφ = 1 e Lz = r2 sin2ϑ φ = pφ = xpy − ypx in coordinate sferiche. Inoltre

gµν uµuν = −κ =

−1 per geodetiche di tipo tempo

0 per geodetiche di tipo lucee uµ =

dxµ

dτ= xµ

come al solito τ è il parametro affine per geodetiche nulle e il tempo proprio per quelle di tipo tempo.Perciò avremo

− κ = −(

1− 2M

r

)t2 +

(1− 2M

r

)−1

r2 + r2ϑ2 + r2 sin2ϑ φ2 (3.5.4)

A causa della simmetria ϑ 7→ π − ϑ della metrica di Schwarzschild, l’intera geodetica giace nel “pianoequatoriale” ϑ = π/2, se il punto iniziale ed il vettore tangente iniziale giacciono in questo “piano”.Dato il punto iniziale ed il vettore tangente iniziale, la geodetica è univocamente determinata; se lageodetica passante per p e tangente ad u uscisse dal piano equatoriale, ve ne sarebbe un’altra speculareper simmetria - come raffigurato nel disegno - quindi non sarebbe determinata univocamente, e perciò lageodetica rimane nel piano. Inoltre, ogni geodetica può essere portata ad una geodetica inizialmente (equindi sempre) equatoriale tramite una rotazione, perciò possiamo limitarci al caso ϑ = π/2, per cui si la(3.5.4) diventa

−κ = −(

1− 2M

r

)t2 +

(1− 2M

r

)−1

r2 + r2φ2

1ricordiamo che le dimensioni di M sono metri in quanto la costante gravitazionale è stata fissata ad 1.



Ora usiamo le grandezze conservate, che abbiamo chiamato E ed L:

E = −gµν ξµuν con ξ = ∂t =⇒ E = −gttut =

(1− 2M

r

)t

L = gµν ξµuν con ξ = ∂φ =⇒ L = gφφu

φ = r2φ

perciò

−κ = − E2

1− 2M

r

+r2

1− 2M

r

+L2

r2

da cuiE2

2=r2

2+

1

2

(1− 2M

r

)(L2

r2+ κ

)(3.5.5)

cioè il moto radiale della geodetica è quello di una particella non relativistica di massa 1 ed energia E2/2in un potenziale efficace

V =κ2− κ

M

r+L2

2r2− ML2

r3(3.5.6)

dove il termine proporzionale adM/r ricorda il potenziale Newtoniano, quello L2/2r2 è il solito potenzialecentrifugo e ML2/r3 è una correzione relativistica. Cerchiamo ora gli estremanti per V :

i) caso geodetiche di tipo tempo, per cui κ = 1

0 =∂V

∂r= r−4

(Mr2 − L2r + 3ML2

)= 0 =⇒ r± =

L2 ±√L4 − 12L2M2

2M

perciò se L2 < 12M2 non ci sono estremi, mentre se L2 > 12M2 si ha che r+ è un minimo, mentrer− è un massimo del potenziale, cui corrisponde un’orbita circolare instabile non esistente nellateoria newtoniana.

ii) nel gaso di geodetiche nulle, κ = 0: il potenziale efficace è

V (r) =L2

2r3(r − 2M)

che ha un massimo in r = 3M pari a V (3M) =L2

54M2.


Ecco rappresentati i tre casi visti: a partire dall’alto, i primi due grafici si riferiscono al caso κ = 1 conrispettivamente L2 < 12M2 e L2 > 12M2, mentre il terzo si riferisce al caso κ = 0.


3.6 I test classici della relatività generale

3.6.1 Deviazione della luce

La traiettoria della luce è per definizione data dalle geodetiche nulle; in particolare avremo che i fotonivengono catturati qualora si realizzi la condizione che

E2

2>

L2

54M2=⇒ L2

E2< 27M2

Se invece varrà cheE2

2<

L2

54M2

allora il fotone entrante raggiunge un raggio minimo r0 e si allontana di nuovo all’infinito, e sarà proprioquesto il fenomeno di nostro interesse. Definiamo a tal proposito la quantità

b :=L

E

che prende il nome di parametro d’impatto apparente1. La distanza minima r0 soddisfa

E2

2= V (r0) =

L2

2r30

(r0 − 2M) =⇒ r30 − b2(r0 − 2M) = 0

Figura 3.1: deflessione di un raggio di luce causata dalla curvatura dello spaziotempo.

Andiamo a calcolare δφ:dφ

dr=φ

r=L

r2

[E2 − L2

r3(r − 2M)

]− 12

(3.6.1)

che è un’equazione differenziale piuttosto complicata, che risolveremo perturbativamente.1nel caso di spaziotempo piatto, b sarebbe il parametro d’impatto, ovvero la distanza minima dall’origine r = 0. Nella

geometria curva, b non rappresenta più tale quantità.

3.6. I test classici della relatività generale 73

Osservazione 3.6. Definitay :=

M

2r− 1

12l’equazione differenziale (3.6.1) diventa

(dy

dφ

)2

= 4y3 − g2 y − g3

dove g2 = 1/12, g3 = 1/216 −M2/4b2: la soluzione di questa nuova equazione è una funzione y(φ) cheprende il nome di funzione ellittica di Weierstrass, ed y viene indicata con P(φ), mentre g2 e g3 sonodetti invarianti ellittici .

Definita u = r−1, vale chedφ

dr= − 1

r2

dφ

du, perciò

du

dφ= − 1

L

(E2 − L2u2 + 2ML2u3

) 12 =⇒ [u′(φ)]

2= b−2 − u2 + 2Mu3 =⇒ 2u′u′′ = −2uu′ + 6Mu2u′

da cuiu′′ + u = 3Mu2 (3.6.2)

Nello spaziotempo piatto M = 0, i raggi di luce sono delle rette, infatti dalla (3.6.2) si ottiene che

u′′0 + u0 = 0 =⇒ u0 = C sin(φ− φ0)

Con r → ∞ allora u0 = 0, perciò φ = φ0 ∨ φ = φ0 + π. Per il valore massimo di u0, coincidente conφ = φ0 + π/2, si avrà la distanza minima dall’origine, per cui

r = r0 = b =⇒ 1

b= C

Per ottenere una soluzione approssimativa della (3.6.2) poniamo u = u0 + δu dove δu = ϑ(M/b2

);

sostituendo otteniamo

u′′0 + δu′′ + u0 + δu′′ = 3M[u2

0 + 2u0 δu+(δu)2]

=⇒ δu′′ + δu = 3Mu20 =

3M

b2sin2(φ− φ0)

essendoci serviti del fatto che u0 soddisfa la (3.6.2) con M = 0 e che 2u0 δu+(δu)2 è trascurabile rispetto

ad u20, poichè tale quadrato è moltiplicato per M e δu = ϑ(M). Scegliendo φ0 = 0 la soluzione è data da

δu =M

b2(1 + cosφ)

2=⇒ u =

1

b

[sinφ+

M

b(1 + cosφ)

2+ ϑ

(M2

b2

)]

Nel caso del Sole1 2M ' 3 km; ciò che ci interessa trovare sono gli angoli per cui u = 0, ovvero r →∞, eciò avviene banalmente per φ = π, ma anche per

sinφ+M

b(1 + cosφ)

2= 0

Sappiamo che per M = 0 il secondo angolo è φ = 0, perciò poniamo φ = 0 + δφ, sempre con φ = ϑ

(M

b

)

≈δφ︷︸︸︷sin(δφ) +

M

b

[1 +

≈1︷︸︸︷cos(δφ)

]2= 0

perciò

δφ = −4M

b(3.6.3)

Per un raggio di luce che passa vicino alla superficie del Sole si ha che |δφ| ∼ 1.75′′; tale deflessione fumisurata da Eddington nel 1920 con circa il 10% d’errore, il che fa sospettare di un ritocco alla misura.La deviazione di onde radio provenienti dai quasar conferma la (3.6.3) con la precisione dell’1%, misuredi Fomalont e Sramek effettuate nel 1976.

1nel sistema solare M/b << 1; infatti, anche scegliendo il b minimo, dato dal raggio corrispondente alla superficie delSole, cioè circa 7 · 105 km, si ottiene un valore M/b ≈ 10−7.


Figura 3.2: deflessione di un raggio di luce passante vicino alla superficie solare.

3.6.2 Precessione del perielio

Consideriamo il caso di κ = 1 e detta u = 1/r, calcoliamo

r4

(du

dφ

)2

=

(dr

dφ

)2

=r2

φ2=E2 − 1 +

2M

r− L2

r2+

2ML2

r3

L2

r4

Allora avremo che(

du

dφ

)2

=1

b2− 1

L2+

2M

L2u− u2 + 2Mu3 =⇒ 2u′u′′ =

2M

L2u′ − 2uu′ + 6Mu2u′

da cui

u′′ + u =M

L2+ 3Mu2 (3.6.4)

Notiamo la presenza del termine aggiuntivo 3Mu2 rispetto alla teoria Newtoniana, per cui invece valeva

u′′0 + u0 =M

L2=⇒ u0 =

M

L2(1 + ε cosφ)

e le cui soluzioni dell’equazione differenziale sono coniche. Andiamo a risolvere la (3.6.4) perturbativa-mente1 usando lo stesso metodo impiegato per la (3.6.2), cioè sostituiamo la soluzione Newtoniana neltermine quadratico in u: otteniamo perciò

u′′ + u =M

L2+ 3Mu2

0 =M

L2+

3M3

L4(1 + ε cosφ)

2

che, risolta, porta a

u = u0 +3M3

L4

[1 + εφ sinφ+ ε2

(1

2− cos2φ

6

)](3.6.5)

Il termine più importante della (3.6.5) è quello proporzionale a φ sinφ, che è illimitato, perciò trascuriamole altre correzioni ed otteniamo

u =M

L2

[1 + ε cosφ+

3M2

L2φε sinφ

]≈ M

L2

1 + ε cos

[(1− 3M2

L2

)φ

]

1questa soluzione è valida per M << 1.


che è ancora una soluzione periodica, ma non con periodo 2π; per fare l’approssimazione è necessario chesia M/L << 1. Calcoliamo il periodo di u:

(1− 3M2

L2

)φ = 2π =⇒ φ =

2π

1− 3M2

L2

≈ 2π

(1 +

3M2

L2

)

perciò

∆φ =6πM2

L2(3.6.6)

Figura 3.3: schematizzazione della precessione del perielio.

Nella teoria Newtoniana il semiasse maggiore è dato da

a =L2

M(1− ε2)

Tale valore può essere utilizzato in approssimazione di campo gravitazionale debole, quindi è sufficiente-mente precisa per i nostri fini: sostituendo nella (3.6.6) otteniamo

∆φ =6πM

a(1− ε2)

Vediamo dunque che ∆φ è grande se ε è grande ed a è piccolo, che è proprio il caso di Mercurio, per cui∆φ è dell’ordine di grandezza del raggio di Schwarzschild del Sole (∼ 103m) diviso per il raggio dell’orbita(∼ 109 m). Per Mercurio si ha che

a ≈ 58 · 106 km M = M = 1.48 km ε ≈ 0.2δφteo

T= 0.1′′

dove T ∼ 0.24 anni è il periodo di rivoluzione di Mercurio. Si ottiene quindi che ∆φteo(100 anni) = 43′′;il valore osservato togliendo gli effetti degli altri pianeti, compresa la precessione dell’asse terrestre è∆φmis(100 anni) = 42.56′′, e tale misura risale a prima della formulazione della relatività generale.

Vediamo ora un metodo alternativo per ottenere informazioni sulla precessione: avevamo visto cheesistevano due estremanti per il potenziale efficace, r±, dati da

r± =L2 ±

√L4 − 12L2M2

2M


e che nel caso di κ = 1 e L2 > 12M2, r+ era un minimo, per cui esiste un’orbita stabile per tale valore dir. Ciò che ora facciamo è considerare piccole oscillazioni intorno a tale minimo, ottenendo così un motoarmonico con frequenza radiale data da

ω2r =

d2V

dr2

∣∣∣∣r+

=M(r+ − 6M)

r3+(r+ − 3M)

(3.6.7)

dove è stata usata l’espressione di r± per eliminare L2. D’altra parte, la frequenza angolare è data da

ω2φ = φ2 =

L2

r4+

avendo supposto un’orbita quasi circolare; perciò

ω2φ =

M

r2+(r+ − 3M)

(3.6.8)

Nel limite Newtoniano r+ >> M , perciò

ωr ≈ ωφ(

=

√M

r3+

←− 3a legge di Keplero

)

ωr = ωφ significherebbe che un pianeta torna ad un dato valore di r esattamente dopo un periodo orbitale,cioè le orbite si chiuderebbero; apriamo una piccola parentesi su questo fatto, sottolineando che le orbitesi chiudono se e solo se la quantità A, detta vettore di Runge-Lenz e definita come

A := p× L−mM r

r

si conserva. Si dimostra infatti che A punta verso il perielio, e quindi se è costante non si verificaprecessione; si dimostra anche che A = 0 è caratteristico di un potenziale proporzionale ad 1/r.

In generale ωr 6= ωφ, cioè le orbite non si chiudono e il perielio precede con frequenza di precessione datada, detto ∆τ il periodo radiale:

ωp =∆φ

∆τ=ωφ∆τ − 2π

∆τ= ωφ − ωr

perciò

ωp = −[√

1− 6M

r+− 1

]ωφ (3.6.9)

3.6.3 Dilatazione del tempoConsideriamo due osservatori statici O1, per cui r = r1, ed O2, per cui r = r2 → ∞, entrambi con irelativi (r, ϑ, ϕ) costanti; per loro varrà

ds2 = −(

1− 2M

r

)dt2 = −dτ2 (3.6.10)

dove τ è il tempo proprio dei due osservatori, dato da

dτ =

√1− 2M

rdt

Per O2 avremo dunque che

∆τ =

t2∫

t1

dt = t2 − t1 = ∆t


mentre per O1 varrà che

∆τ =

t2∫

t1

√1− 2M

r1dt =

√1− 2M

r1∆t < ∆t

cioè per O1 il tempo scorre più lentamente; inoltre notiamo che con r1 → 2M si ha ∆τ → 0, cioèsull’orizzonte degli eventi di un buco nero il tempo si ferma! Abbiamo visto dunque che a distanze diverseda un corpo massivo il tempo scorre a velocità diversa, ed è proprio questa l’accortezza da utilizzare perinviare i satelliti GPS a 2 · 107 m d’altezza: essi sono infatti dotati di orologi atomici settati ad unafrequenza minore del secondo, così che in orbita tornino “a posto”.

3.6.4 Redshift gravitazionaleConsideriamo due osservatori statici, cioè tali che la loro quadrivelocità sia parallela a ∂t vettore diKilling1, O1, O2 con quadrivelocità rispettivamente u1 ed u2. Supponiamo che O1, situato in p1, mandiun segnale di luce ad O2, che lo riceve in p2.


La frequenza di emissione sarà data daω1 = −kµuµ1

∣∣∣p1

mentre quella misurata da O2 saràω2 = −kµuµ2

∣∣∣p2

Poichè u2i = −1 (i = 1, 2) e ui ‖ ∂t =: ξ allora

uµi =ξµ√−ξ2

∣∣∣∣∣pi

inoltre, poichè ξ è vettore di Killing e k è tangente ad una geodetica, varrà che

ω1

ω2=

√−ξ2

∣∣∣p2√

−ξ2∣∣∣p1

ma−ξ2 = −gµν ξµ ξν = −gtt ξt ξt = −gtt = 1− 2M

r1questa condizione è equivalente a richiedere(r, ϑ, ϕ) costanti.


essendo ξ = ∂t; perciò

ω1

ω2=

1− 2M

r2

1− 2M

r1

12

(3.6.11)

avendo indicato con ri la coordinata radiale di Oi. Notiamo che se r2 > r1 allora ω2 < ω1, cioè lafrequenza diminuisce all’aumentare della distanza da un corpo massivo; sapendo che l’energia di un fotoneè E = ~ω, questo fatto si poteva prevedere intuitivamente considerando che il fotone risalendo il potenzialegravitazionale perde energia. Supponiamo ora cheM << r1,2, cioè ci poniamo nell’approssimazione limiteTerra-Sole, e andiamo a sviluppare la (3.6.11):

∆ω

ω≈ −M

r1+M

r2=⇒ ~∆ω ≈ ~ω

(−Mr1

+M

r2

)

dove si nota il termine pari alla solita differenza di potenziale Newtoniana. Tale variazione dell’energia diun fotone è stata verificata da Pound e Rebka nel 1960, usando l’effetto Mössbauer per misurare la ∆ωdi fotoni che “cadono giù” da una torre. Si ebbe così la conferma della predizione della relatività generalecon un’incertezza dell’1%.

3.7 L’estensione di Kruskal del buco nero di SchwarzschildRiscriviamo la metrica di Schwarzschild (3.5.3)

ds2 = −V (r) dt2 +dr2

V (r)+ r2

(dϑ2 + sin2ϑ+ dϕ2

)

dove V (r) = 1− 2M

r; tale metrica presenta delle singolarità in:

i) r = 0: singolarità essenziale di curvatura, infatti si ha che gli invarianti di curvatura, che nondipendono dalle coordinate in quanto trasformano come scalari, ivi divergono, come, ad esempio,Rµνρσ R

µνρσ ∼ r−6;

ii) r = 2M : gli invarianti di curvatura, ad esempio quello appena visto, non divergono per r = 2M , eciò significa che tale punto è solo una singolarità delle coordinate.

Vogliamo quindi trovare un sistema di coordinate che non abbia questa singolarità; per illuminare lanatura del problema, consideriamo un esempio più semplice, la metrica di Rindler (2.3.12):

ds2 = −x2 dt2 + dx2

definita per t ∈ R e x > 0, presenta una singolarità in x = 0. Tale singolarità non è di curvatura, perchèlo spaziotempo di Rindler, come quello di Minkowski, è piatto, e sappiamo inoltre che le geodetichefiniscono con lunghezza finita in x = 0 (quindi la singolarità non è all’infinito); si dimostra che gli scalaridi curvatura non divergono in x = 0.

3.7. L’estensione di Kruskal del buco nero di Schwarzschild 79

Vediamo ora un approccio sistematico per trovare un sistema di coordinate buone:

• introduciamo una famiglia di geodetiche che vanno verso la singolarità usando il parametro affinelungo le geodetiche come coordinata. Torna comodo considerare le geodetiche nulle, che si trovanoimponendo

0 = ds2 = −x2 dt2 + dx2 =⇒ dx2

x2= dt2 =⇒ t = ± log x+ c

• introduciamo delle coordinate nulleu := t− log x

v := t+ log x=⇒

x = e(v−u)/2

t =1

2(v + u)

con u, v ∈ R

Per u costante abbiamo geodetiche nulle outgoing, ovvero uscenti dalla singolarità:

x∗ := log x c = t− x∗dx∗dt

= 1 > 0

Per v costante abbiamo delle geodetiche ingoing, entranti nella singolarità:

dx∗dt

= −1 < 0

La metrica di Rindler diventa:

ds2 = −ev−u dudv

U := −e−uV := ev

=⇒ ds2 = −dU dV

con U < 0 e V > 0; la trasformazione finale sarà

T :=V + U

2

X :=V − U

2

=⇒ ds2 = −dT 2 + dX2

che è la metrica di Minkowski. Invertendo le varie relazioni, si ha che la relazione tra le coordinateoriginali (t, x) e quelle “di Minkowski” (T,X) è

x =√X2 − T 2

t = atanh(T

X

) =⇒X = x cosh t

T = x sinh t

Ora non c’è più la singolarita in x = 0, si ha infatti U = 0 o V = 0, quindi possiamo estendere lospaziotempo permettendo U, V ∈ R.


Figura 3.1: disegno riassuntivo: il quarto di piano colorato è il Rindler wedge.

La natura delle singolarità delle coordinate:

• sulle linee nulle X = ±T abbiamo t = ±∞, il che ci dice che è una brutta coordinata;

• gli osservatori su x = cost hanno accelerazione propria costante e tale che

√aµaµ =

1

x

x→0−−−→ +∞

cioè anche quella è una brutta coordinata.

Paragoniamo gli osservatori statici nello spaziotempo di Schwarzschild, che hanno accelerazione propria

√aµaµ =

(1− 2M

r

)− 12 M

r2

che diverge con r → 2M , con la quadriaccelerazione nello spazio di Rindler, che invece diverge con x→ 0.Considerando che

(xµ) =

trϑϕ

=

τ/√v

r0

ϑ0

ϕ0

=⇒ (uµ) =

1/√v

000

essendo v = 1− 2M

re τ il tempo proprio: allora

aµ = ∇uuµ = ∇v−1/2∂t uµ =

1√v∇tuµ =

1√v

(∂tuµ + Γµtνu

ν) =1√v

Γµtt1√v

=1

vΓµtt

Il comportamento della coordinata t della metrica di Schwarzschild per r → 2M è analogo alla t di Rindlerquando x → 0, perciò la singolarità della metrica di Schwarzschild per r → 2M è strettamente analogaalla singolarità della metrica di Rindler per x→ 0. Per studiare la singolarità delle coordinate, è rilevantesolo la metrica bidimensionale

ds2 = −(

1− 2M

r

)dt2 +

(1− 2M

r

)−1

dr2 (3.7.1)


Usiamo lo stesso metodo usato prima, troviamo le geodetiche nulle:

dt2 =

(r

r − 2M

)2

dr2 =⇒ t = ±r∗ + k

dove

r∗ := r + 2M log( r

2M− 1)

=⇒ dr∗dr

=1

1− 2M

r

(3.7.2)

Definiamo ora u e v come u := t− r∗v := t+ r∗

=⇒ u, v ∈ R (3.7.3)

perciò

ds2 = −(

1− 2M

r

)dudv (3.7.4)

dove r è una funzione di u e v definita implicitamente tramite

r∗(r) =v − u

2(3.7.5)

Usando la (3.7.5) otteniamo

ds2 = −2Me−r/2M

re(v−u)/4M dudv (3.7.6)

in cui, se r → 2M , u → ∞ o v → −∞, perciò è ancora singolare. Confrontando con il caso di Rindler,introduciamo nuove coordinate U e V :

U = −e−u/4M

V = ev/4M(3.7.7)

dette coordinate di Kruskal , per cui ovviamente U < 0, V > 0, e da cui

ds2 = −32M3 e−r/2M

rdU dV (3.7.8)

che non è più singolare per r → 2M , infatti si ha U = 0 o V = 0; possiamo perciò estendere la soluzione diSchwarzschild permettendo ad U e V di assumere tutti i valori compatibili con r > 0.1 La trasformazionefinale è data da

T =V + U

2

X =V − U

2

=⇒ ds2 =32M3 e−r/2M

r

(−dT 2 + dX2

)+ r2

(dϑ2 + sin2ϑdϕ2

)(3.7.9)

La relazione tra (t, r) e (T,X) è data da

( r

2M− 1)er/2M = X2 − T 2

t

2M= 2 atanh

( TX

) (3.7.10)

per cui, se r è costante si ha X2 − T 2 = k, cioè un’iperbole, mentre se t è costante si ha T/X = k, cioèuna retta; notiamo inoltre che se r > 0 allora X2 − T 2 > −1. La retta U = 0 si indica con H+ e vienedetta orizzonte del futuro, mentre quella V = 0 si indica con H− e viene detta orizzonte del passato.

1oltre r = 0 non si può andare perchè c’è la singolarità di curvatura.


Figura 3.2: rappresentazione dello spaziotempo considerato: le regioni colorate sono vietate, in quantorappresentano il luogo dei punti r < 0.

Gli assi U e V individuano quattro zone del piano, indicate in figura con i numeri romani, per cuiosserviamo che:

• le singolarità r = 0 sono di tipo spazio e non sono linee di tipo tempo all’origine delle coordinate;

• la regione I con r > 2M è asintoticamente piatta;

• ogni osservatore che entra nella regione II non può mai più uscirvi; in un intervallo finito del tempoproprio raggiunge la singolarità. In particolare, anche ogni segnale di luce che l’osservatore emettefinirà nella singolarità. Per questo, la regione II viene detta buco nero, e H+ è il cosiddettoorizzonte degli eventi;

• la regione IV ha esattamente le stesse proprietà della regione II, ma col tempo rovesciato. Ogniosservatore nella regione IV deve venire dalla singolarità r = 0 (in un tempo proprio finito), e deveuscire da questa regione: per questo motivo H+ si chiama orizzonte del passato e la regione IVviene detta buco bianco;

• la regione III rappresenta un’altra regione asintoticamente piatta, un altro universo;

• nell’estensione di Kruskal ogni punto è una 2-sfera.

Per capire meglio la geometria dello spaziotempo, consideriamo la superficie di tipo spazio t = 0 (T = 0),allora

ds2 =

(1− 2M

r

)−1

dr2 + r2(dϑ2 + sin2ϑ dϕ2

)

Grazie alla simmetria sferica, limitiamoci al piano ϑ =π

2, per cui

ds2 =

(1− 2M

r

)−1

dr2 + r2 dϕ2 (3.7.11)

Vogliamo immergere questa geometria bidimensionale in R3; la metrica dello spazio euclideo in coordinatecilindriche è

ds2 = dz2 + dr2 + r2 dϕ2 (3.7.12)


Consideriamo ora z = z(r), ovvero una superficie di rotazione in R3. La metrica indotta su questasuperficie sarà

ds2 =

[1 +

(dz(r)

dr

)2]

dr2 + r2 dϕ2 =

(1− 2M

r

)−1

dr2 + r2 dϕ2

dove l’ultima uguaglianza è stata imposta da noi: otteniamo dunque

1 +

(dz(r)

dr

)2

=

(1− 2M

r

)−1

=⇒ r = 2M +z2

8M(3.7.13)

Figura 3.3: ponte di Einsten-Rosen, anche detto wormhole: è una topologia di tipo R×S2, per ϑ fissato.

Tale ipersuperficie t = 0 si estende da r =∞ attraverso r = 2M ad r =∞, e quindi consiste di un ponteche connette due universi identici, cioè le regioni I e III.

Osservazione 3.7. Un osservatore nella regione I non può comunicare con un osservatore nella regioneIII; ogni segnale di luce mandato dalla regione III verso la regione I finisce nel buco nero.

Nel 1783 John Michell si chiese come calcolare la velocità di fuga di un oggetto in funzione del raggio delcorpo da cui è attratto:

1

2mv2 = G

Mm

r

v=c=⇒ r =

2GM

c2

ottenendo così il raggio di Schwarzschild avendo tuttavia usato una teoria “sbagliata”.

I buchi neri possono essere dotati di carica, elettrica o magnetica, che porta alla soluzione di Reissner-Nordström, possono ruotare (soluzione di Kerr, vedi esercizio nel foglio 6), o possono portare cariche emomento angolare (soluzione di Kerr-Newman). Valgono le quattro leggi dei buchi neri, che stannoin stretta analogia con le leggi della termodinamica; per esempio, la prima legge diche che

dM = TdS + ΩdJ (3.7.14)

con T = κ/2π, κ = forza sulla superficie ed S = A/4, essendo A l’area dell’orizzonte. Tempo fa sipensava che l’analogia con la termodinamica fosse solo formale, ma nel 1974 Hawking scoprì che i buchineri irradiano come un corpo nero con temperatura

T =~κ2π


fenomeno quantistico, in quanto a livello classico i buchi neri sono totalmente neri, noto come effettoHawking . I buchi neri sono così oggetti dotati di temperatura ed entropia, quindi la relazione tra le leggidei buchi neri e della termodinamica è ben di più di un’analogia!

Rimangono tuttavia delle questioni aperte: se S è l’entropia di un buco nero, quali sono i microstati,ricordando che S = kB logN , che danno luogo a quest’entropia? Questo problema rappresenta unadelle chiavi per una teoria quantistica della gravità. Alcuni progressi nella spiegazione dell’entropia deibuchi neri sono stati dati dalla teoria delle stringhe1. Nessuno ha mai misurato l’effetto Hawking inastronomia, in quanto T ∼ M−1, tuttavia si possono vedere effetti simili con buchi neri analoghi, comei vortici nei fluidi (orizzonte per il suono) ed indice di rifrazione modificato con luce laser con cui s’èmisurato tale effetto.

1a tale proposito, è consigliata la lettura de L’universo elegante, di Brian Greene.

Capitolo 4

Cosmologia

4.1 Omogeneità ed isotropiaQuale soluzione delle equazioni di Einstein descrive il nostro universo? Per rispondere a questa domanda,abbiamo bisogno di alcune ipotesi motivate dalle osservazioni: faremo l’ipotesi che l’universo sia omo-geneo ed isotropo. Già dai tempi di Copernico sappiamo che la nostra posizione nell’universo non èprivilegiata; se ci trovassimo in un’altra regione dell’universo, le caratteristiche di base del nostro intornosarebbero le stesse (cioè l’universo è omogeneo, detto in parole povere). È inoltre naturale assumere chel’universo sia isotropo, cioè tale che nessuna direzione spaziale sia preferita.

Le osservazioni su scala sufficientemente grande danno dei risultati che non dipendono dalla direzione incui guardiamo, e sperimentalmente si osserva che:

• la distribuzione delle galassie è omogenea ed isotropa su scale molto grandi;

• conferma dell’omogeneità e dell’isotropia è data anche dalla radiazione di fondo di raggi X, raggi γe microonde1, si trova infatti che le anisotropie sono dell’ordine

dT

T' 10−5

Definizione 4.1. Uno spaziotempoM è spazialmente omogeneo se esiste una famiglia ad un para-metro di ipersuperfici Σt di tipo spazio che fogliano M tale che ∀t e per due punti qualsiasi p, q ∈ Σtesista sempre un’isometria f della metrica gµν con f(p) = q.


Apriamo una piccola parentesi sulle isometrie: date M, N varietà (differenziabili pseudo-)riemanniane,dotate rispettivamente di una metrica g ed una γ, la funzione f : M→ N tale che p 7→ f(p) = q è taleche

f∗γ = g

1detto Cosmic Microwave Background, abbreviato in CMB.

86 Capitolo 4. Cosmologia

dove f∗, o pullback, è definito come

(f∗γ) (u, v) := γ(Df(u), Df(v)) (4.1.1)

cioè per un’isometria vale cheg(u, v) = γ(Df(u), Df(v))

SeM = N , γ = g allorag(u, v) = g(Df(u), Df(v)) f∗g = g

che significa che se muoviamo la metrica tramite f , essa non cambia. Ricordiamo che, dette yα ed xµ lecoordinate locali rispettivamente di q e p, allora

yα = fα(xµ) Df(u) = uµ∂fα

∂xµ∂α

Definizione 4.2. Uno spaziotempo è spazialmente isotropo in ogni punto se esiste una congruenzadi curve1 di tipo tempo (osservatori), con vettori tangenti uµ tale che:

i) lo spaziotempo sia unione di queste curve;

ii) dato un punto p qualsiasi e due vettori s1, s2 in p perpendicolari ad u, esiste sempre un’isometriache lascia p ed u invariati e ruota s1 in s2.


Tali condizioni significano che in universo isotropo è impossibile costruire un vettore perpendicolare adu geometricamente preferito. In un universo omogeneo ed isotropo, le ipersuperfici Σt di omogeneitàdevono essere perpendicolari ai vettori tangenti u, altrimenti potremmo costruire un vettore spazialegeometricamente preferito, ottenuto intersecando una Σt con un piano perpendicolare ad u.

gµν induce una metrica hµν(t) su Σt restringendo l’azione di g ai vettori tangenti a Σt; poichè le Σt sonoperpendicolari ai vettori u vale che

gµν = −uµuν + hµν(t) =⇒ gµνuν

︸︷︷︸uµ

= −uµ uνuν︸︷︷︸−1

+hµνuν =⇒ hµνu

ν = 0

cioè h è proiettore sul complemento ortogonale ad u. Quali sono i vincoli sulla geometria spaziale,descritta da h, imposti dall’omogeneità e dall’isotropia? Consideriamo il tensore di Riemann R

(3) ijkl

costruito a partire da hij su Σt; se alziamo l’indice j con hij ed antisimmetrizziamo in i, j ed in k, lpossiamo interpretare il risultato come una mappa lineare L dallo spazio vettoriale W delle 2-forme in pin se stesso, L : W →W . Definiamo, presa ω 2-forma, la quantità

ωkl := R(3) ij

kl ωij (4.1.2)1ovvero se ogni curva può essere mappata in un’altra tramite un’isometria.

4.1. Omogeneità ed isotropia 87

e notiamo che, dette x1, x2, x3 le coordinate su Σt, una base di W è data da

dx1 ∧ dx2,dx2 ∧ dx3,dx1 ∧ dx3

perciò la dimensione di W è 3, quindi L è una matrice 3× 3. Inoltre, sfruttando la proprietà del tensoredi Riemann per cui

R(3) ij

kl = R(3) ij

kl

deduciamo che L è simmetrica, e possiamo quindi scegliere una base ortonormale di autovettori di L comebase di W . Tutti gli autovalori di L devono essere uguali (altrimenti esisterebbe una 2-forma preferita,e, quindi, un vettore preferito ottenuto definendo ad esempio vk := ωijε

ijk) perciò

L = k1

dove k è una funzione, intendendo con tale scrittura che

R(3) ij

kl = kδi[kδjl] (4.1.3)

L’isotropia impone che k sia funzione al più del tempo1, quindi si può fare anche a meno della richiestadi omogeneità (l’isotropia in ogni punto implica l’omogeneità). Uno spazio che soddisfi la (4.1.3) conk costante si chiama spazio a curvatura costante: Eisenhart nel 1949 dimostrò che uno spazio acurvatura costante n-dimensionale, con segnatura n (cioè tale che g abbia solo autovalori positivi), èisomorfo a

Hn spazio iperbolico con k < 0

Sn n-sfera con k > 0

En spazio euclideo con k = 0

cioè la geometria spaziale dell’universo può essere solo iperbolica, sferica o piatta.

Osservazione 4.1. Il caso S3 è particolarmente interessante2, perchè descrive un universo finito e senzabordo (“universo chiuso”). S3 è l’ipersuperficie in R4 definita da

(x1)2

+(x2)2

+(x3)2

+(x4)2

= l2

Poniamo ora x4 = l cosψ, perciò (x1)2

+(x2)2

+(x3)2

= l2 sin2ψ

che è una 2-sfera con raggio l sinψ: usiamo quindi la nostra solita parametrizzazione

x1 = l sinψ sinϑ cosϕ

x2 = l sinψ sinϑ sinϕ

x3 = l sinψ cosϑ

quindi la metrica sarà data da

ds2 = l2[dψ2 + sin2ψ

(dϑ2 + sin2ϑ dϕ2

)](4.1.4)

e chiamiamo dΩ1, in cui il pedice si riferisce a k = 1, la quantità

dΩ21 = dψ2 + sin2ψ

(dϑ2 + sin2ϑ dϕ2

)

In modo simile si costruisce la metrica su H3:

ds2 = l2[dψ2 + sinh2 ψ

(dϑ2 + sin2ϑ dϕ2

)]= l2 dΩ2

−1 (4.1.5)

mentre la metrica su E3 sarà semplicemente, usando coordinate cartesiane:

ds2 = dx2 + dy2 + dz2 = dΩ20

e, in coordinate sferiche:ds2 = dψ2 + ψ2

(dϑ2 + sin2ϑ dϕ2

)(4.1.6)

1la dimostrazione di ciò si trova a pagina 94 del Wald; il punto di partenza è la seconda identità di Bianchi.2per evidenze sperimentali sappiamo che le sezioni spaziali dell’universo sono a k = 0.


Come coordinate in 4 dimensioni scegliamo coordinate iperboliche (k < 0), sferiche (k > 0), o cartesiane(k = 0) su una delle superfici omogenee Σt, dopodichè estendiamo tali coordinate a tutte le altre Σttramite i nostri osservatori con vettore tangente u (“osservatori isotropi”), cioè ciascun osservatore hadelle coordinate spaziali fisse. Infine, etichettiamo ogni superficie col tempo proprio τ misurato da unorologio portato da uno degli osservatori isotropi: a causa dell’omogeneità, tutti gli osservatori isotropidevono misurare la stessa differenza di tempo tra due ipersuperfici.

Figura 4.3: se i due tempi non fossero uguali, avremmo modo di distinguere i due punti.

Giungiamo quindi alla metrica in 4 dimensioni:

ds2 = −dτ2 + a2(τ) dΩ2k (4.1.7)

dove a(τ) è il fattore di scala, determinato dalle equazioni di Einstein, che assorbe la dipendenza di kdal tempo, facendo così in modo che k possa valere solo 0 o ±1. La (4.1.7) è nota come metrica diFriedmann-Lemaître-Robertson-Walker , in futuro abbreviata con FLRW. Nella (4.1.7) ovviamente si èinteso

dΩ2k = dψ2 + f2

k (ψ)(dϑ2 + sin2ϑdϕ2

)con fk(ψ) =

ψ k = 0

sinψ k = 1

sinhψ k = −1

Per ottenere a(τ) sostituiamo la (4.1.7) nelle equazioni di Einstein: non è corretto tuttavia usare cometali quelle valide nel vuoto! Cosa prendiamo quindi come Tµν? Se l’energia/la massa dell’universo vienesolo dalla materia ordinaria, concentrata in galassie, possiamo approssimare queste ultime come dei granidi polvere, che è giustificato su scale cosmiche. Cosa vuol dire polvere dal punto di vista fisico? Vuol direche la pressione P è 0, essendo ciò giustificato dal fatto che le velocità random delle galassie sono piccole,quindi la pressione di questa polvere di galassie è trascurabile. Inoltre, le linee di mondo delle galassiedevono coincidere con quelle degli osservatori isotropi, altrimenti il moto relativo delle galassie e degliosservatori potrebbe essere usato per definire una direzione spaziale preferita:

Tµν = ρ uµuν

essendo ρ la densità di massa della materia, mediata su 2 − 5 · 107 anni luce, ed u è il vettore tangentealla traiettoria degli osservatori isotropi, ovvero u = ∂τ ; ρ = ρ(τ) è considerata costante nello spazio.

4.1. Omogeneità ed isotropia 89

Nell’universo c’è anche la radiazione, che ha come equazione di stato

P =ρ

3(4.1.8)

Il suo contributo attuale è trascurabile, ma nell’universo primordiale era il contributo dominante, perciòuseremo per Tµν la forma del fluido perfetto:

Tµν = ρ uµuν + P(gµν + uµuν)

che contiene entrambi i casi, ed è la forma più generale di un tensore compatibile con l’omogeneità el’isotropia. La radiazione è descritta dal tensore di Faraday Fµν e “porta con sè” un contributo

Tµν ∼ Fµρ F ρν −

1

4gµν Fαβ F

αβ =⇒ Tµµ = Fµρ Fρ

µ −1

44Fαβ F

αβ = 0

La traccia T νν del fluido perfetto vale:

T νν = ρ(−1) + P (4− 1) = −ρ+ 3P!= 0

ottenendo così la (4.1.8). Riportiamo ora dei fatti per commentare quanto visto fin’ora: dal 1997 sappiamoche nell’universo il 73% è energia oscura, il 22% è materia oscura ed il 5% è materia ordinaria. Èstato infatti osservato che l’universo si espande accelerando, il che ha portato a chiedersi cosa possavincere l’effetto gravitazionale attrattivo: è stata quindi ipotizzata l’esistenza di questa energia oscura,e dell’antigravità. La materia oscura ha invece effetti gravitazionali attrattivi ed interagisce poco con lamateria normale: delle spiegazioni in merito alla materia oscura potrebbero essere contenute nella teoriadella supersimmetria. In ogni caso, il modello più semplice per rendere conto dell’energia oscura è quellodella costante cosmologica Λ; le equazioni di Einstein assumono quindi la forma, introducendovela:

Gµν = −Λgµν (4.1.9)

Andando a confrontare quest’equazione con quella di un fluido perfetto, tramite le equazioni di Einstein,si ha che

−Λgµν = Gµν = 8πTµν = 8π[ρ uµuν + P (gµν + uµuν)]

perciò

P = −ρ = − Λ

8π(4.1.10)

che è l’equazione di stato dell’energia oscura; notiamo che, essendo Λ > 0, l’energia oscura ha pressionenegativa.

FUN FACT: la densità di energia associata a Λ è circa 1 keV cm−3.


4.2 Dinamica di un universo omogeneo ed isotropoCi prefiggiamo ora l’obiettivo di determinare l’evoluzione di un universo omogeneo ed isotropo, e per fareciò sostituiamo la metrica di FLRW (4.1.7) nelle equazioni di Einstein: si ottiene il seguente sistema diequazioni1

3a2

a2= 8πρ− 3k

a2

3a

a= −4π(ρ+ 3P )

(4.2.1)

note come equazioni di Friedmann. Aggiungendo l’equazione di stato ρ = ρ(P ) si hanno tante incognitequante equazioni. Se ρ > 0 e P ≥ 0, l’universo non può essere statico, ma dev’essere in espansione o incontrazione!

Osservazione 4.2. In questa espansione/contrazione, la distanza tra osservatori isotropi, in particolaregalassie, cambia col tempo, ma non esiste un centro preferito di espansione/contrazione, proprio comei punti sulla superficie di un palloncino che si gonfia/sgonfia - non esiste un centro sulla superficie delpalloncino.

È inoltre da osservare che le equazioni di Friedmann tengono conto dell’energia oscura tramite ρ e P .

4.2.1 La legge di HubbleSe la distanza misurata nella superficie di omogeneità tra due osservatori isotropi al tempo τ è R, quantovale la velocità v = R?

Figura 4.4: le due linee rappresentano le linee di mondo dei due osservatori.

R è dato dalla metrica: considerando dτ infinitesimo, abbiamo

ds2 = −dτ2 + a2(τ) dΩ2

ma dτ = 0 sulle superfici, perciò

R(τ) = a(τ)

∫dΩ

1senza dimostrazione, vedi esercizi. Per approfondimenti, si vedano le pagine 96/7 del Wald.

4.2. Dinamica di un universo omogeneo ed isotropo 91

e, allo stesso modo:

R(τ + dτ) = a(τ + dτ)

∫dΩ = a(τ + dτ)

R(τ)

a(τ)

Sviluppiamo al primo ordine con Taylor:

R(τ + dτ) = R(τ) +dR

dτdτ =

[a(τ) +

da

dτdτ

]R

a

perciò

v =dR

dτ=a

aR =: HR (4.2.2)

essendo H = a/a la costante1 di Hubble. La (4.2.2) è nota come legge di Hubble, ed è stata confermatadall’osservazione del redshift di galassie distanti, per cui risulta a > 0. La conferma di questa predizionedella relatività rappresenta un successo enorme della teoria. Purtroppo lo sviluppo storico annebbiò questosuccesso: Einstein era scontento di un universo dinamico, “voleva” un universo statico, ed introdusse diconseguenza la costante cosmologica. Apriamo ora una piccola parentesi sull’universo statico di Einstein:imponiamo perciò a = cost. = R, perciò, sfruttando la 1a equazione di Friedmann, abbiamo:

R2 =3k

8πρ(4.2.3)

Se ρ > 0 allora k = 1 (studiare come esercizio il caso ρ < 0 =⇒ k = −1); dalla 2a equazione diFriedmann si ha

P = −ρ3< 0 (4.2.4)

Einstein usò

ρ = ρΛ + ρmat. =Λ

8π+ ρmat.

P = PΛ = − Λ

8π

essendo Pmat. = 0, in quanto polvere. Dalla (4.2.4) segue

− Λ

8π= −1

3

(Λ

8π+ ρmat.

)=⇒ ρmat. =

Λ

4π=⇒ ρ =

3Λ

8π

perciò, sfruttando la (4.2.3):

R2 =1

Λ=

1

4πρmat.(4.2.5)

che porta a

ds2 = −dτ2 +1

Λ

[dψ2 + sin2ψ

(dϑ2 + sin2ϑ dϕ2

)]

che è la metrica dell’universo statico e chiuso di Einstein, la cui topologia è R× S3.

L’energia oscura è l’energia del vuoto, che in realtà non è esattamente vuoto a causa della conti-nua creazione ed annichilazione di particelle; dai conti tale energia risulta più grande del valore mi-surato di un fattore 10120. La teoria supersimmetrica prevede processi analoghi a quelli di creazioneed annichilazione, solo che hanno energia quasi uguale a quella tra antiparticelle, ma di segno op-posto. Nasce così il problema della costante cosmologica: come mai esiste, e come mai è così pic-cola? Con a > 0 e, dalla seconda equazione di Friedmann, a < 0, si avrebbe il seguente scenario:

1varia lentamente nel tempo.


l’espansione dell’universo deve essere stata semprepiù veloce se andiamo indietro nel tempo. In uncerto punto a = 0; dal disegno si ha

tanϕ =a(τ)

T= a =⇒ T =

a

a= H−1

Se il tasso di espansione fosse sempre stato quel-lo che osserviamo oggi, avremmo avuto a = 0 untempo T = H−1 fa. In realtà, H−1 fornisce soloun limite superiore all’età dell’universo. a = 0 cor-risponde a ciò che va sotto il nome di Big Bang , incui la distanza tra tutti i punti dello spazio è 0, ela curvatura e densità di materia è pari a ∞. È importante sottolineare che il Big Bang non rappresentaun’esplosione di materia concentrata in un punto di uno spaziotempo non singolare preesistente; siccomela struttura stessa dello spaziotempo è singolare al Big Bang, non ha senso chiedere quale sia lo statodell’universo ad un tempo antecedente ad esso. Non c’è nessun modo per estendere lo spaziotempo oltrela singolarità del Big Bang. La conclusione coerente con quanto detto è che l’universo iniziò con esso: èchiaro però che molto vicino a tale singolarità ci aspettiamo che gli effetti quantistici diventino importantie che le predizioni della relatività generale classica falliscano.

A partire dalla metricads2 = −dτ2 + a2(τ) dΩ2

k

avevamo visto le equazioni di Friedmann:

3a2

a2= 8πρ− 3k

a2

3a

a= −4π(ρ+ 3P )

Ora vogliamo ricavare delle leggi di conservazione, e scriviamo pertanto l’evoluzione della densità dimassa, a partire dalla prima equazione di Friedmann:

3a2 = 8πρa2 − 3k =⇒ 6aa = 16πρaa+ 8πρa2

sostituendo ora ad a la sua espressione data dalla seconda equazione di Friedmann si ottiene

ρ+3a

a(ρ+ P ) = 0 (4.2.6)

Vediamo la (4.2.6) nel caso di

1. polvere, P = 0, si ha la conservazione della massa:

0 = ρa3 + 3ρaa2 =d

dt

(ρa3)

=⇒ ρa3 =: c1

2. radiazione, P = ρ/3:

0 = ρa4 + 4ρaa3 =d

dt

(ρa4)

=⇒ ρa4 =: c2

Nonostante il contributo della radiazione sia trascurabile nell’universo presente, era dominantenell’universo primordiale, in cui a→ 0.

Risolviamo le equazioni di Friedmann per i vari casi:

1. per la polvere:3a2

a2= 8πρ− 3k

a2=

8πc1a3− 3k

a2=⇒ a2 − c′1

a+ k = 0

essendo c′1 = 8πc1/3.

4.2. Dinamica di un universo omogeneo ed isotropo 93

Risolvendo tale equazione tramite separazione delle variabili si ottengono i seguenti risultati:

k = 1(S3)

k = 0(E3)

k = −1(H3)

a =c′12(1− cos η)

a =3

√9c′14τ2

a =c′12(cosh η − 1)

τ =c′12(η − sin η) τ =

c′12(sinh η − η)

Notiamo che nel caso k = 1, la curva (a(η), τ(η)) descrive una cicloide.Per k = 0,−1 l’universo si espande per sempre, e con a→∞ si ha

a→ 0 k = 0

a→ 1 k = −1

e a viene vista come la velocità di espansione. Per k = 1 l’universo si espande, raggiunge un valoremassimo ac = C per cui a = 0, e poi si contrae per finire in un big crunch, corrispondente ad a = 0.

Secondo le odierne osservazioni cosmologiche, il destino dell’universo, tra circa 1011 anni, sarà unbig rip (dato dalla equazione di stato), ovvero una situazione per cui a→∞ in un ∆τ finito.


2. Nel caso della radiazione, la soluzione della prima equazione di Friedmann è

3a2

a= 8πρ− 3k

a2=

8πc2a4− 3k

a2=⇒ a2 − c′2

a2+ k = 0

dove c′2 := 8πc2/3. Come prima, si ottiene che:

k = 1(S3)

k = 0(E3)

k = −1(H3)

a =

√√√√√c′2

1−

(1− τ√

c′2

)2 a = (4c′2)

14√τ a =

√√√√√c′2

(1 +

τ√c′2

)2

− 1

ed il comportamento al variare di k è quello raffigurato nella figura precedente.

3. Nel caso della costante cosmologica (“energia oscura”), per cui:

ρ =Λ

8π= cost.

ricaviamo dalla prima equazione di Friedmann:

3a2

a2= Λ− 3k

a2=⇒

a =

√3

Λcosh

(τ

√Λ

3

)k = 1

a = exp

(τ

√Λ

3

)k = 0

a =

√3

Λsinh

(τ

√Λ

3

)k = −1

Osservazione 4.3. In questo caso, le tre soluzioni sono isometriche, ovvero vale che

a

a=

Λ

3> 0

e si parla di universo di de Sitter : un universo siffatto è in espansione accelerata, proprio comequello che si misura oggi.

4.3. Redshift cosmologico 95

Osservazione 4.4. Gli effetti della costante cosmologica sono trascurabili con a → 0, ovveroindietro nel tempo; in tali situazioni sono più importanti la materia ordinaria e, soprattutto, laradiazione, quindi quando l’universo è abbastanza piccolo possiamo trascurare il contributo di Λ.

4. Nel caso di universo vuoto, si ha ρ = 0 = P : allora la prima equazione di Friedmann implica che

3a2

a2= −3k

a2

per la quale l’unico valore ammissibile di k è −1, in quanto il primo membro è sempre positivo. Siha allora che a2 = 1 =⇒ a = τ da cui

ds2 = −dτ2 + τ2[dψ2 + sinh2 ψ

(dϑ2 + sin2ϑdϕ2

)]

che caratterizza il cosiddetto universo di Milne. In realtà tale metrica è quella di Minkowski

ds2 = −dt2 + dr2 + r2(dϑ2 + sin2ϑ dϕ2

)

usando il seguente cambio di coordinate:t = τ coshψ

r = τ sinhψ

4.3 Redshift cosmologico

Figura 4.1: rappresentazione della situazionedescritta.

Consideriamo la seguente situazione: una stella inp1 emette un fotone con frequenza ω1, che noi ri-ceviamo in p2 con frequenza ω2. Sappiamo che,detto kµ il quadrivettore d’onda, vale:

ω1,2 = −kµuµ1,2Possiamo sempre trovare un vettore di Killing ξche punta nella direzione della proiezione di kµ suΣ1 in p1 e punta nella direzione della proiezione dikµ su Σ2 in p2.

Esempio 4.1. Consideriamo Σ piatta, k = 0; sen-za perdere generalità, possiamo assumere che laproiezione di kµ su Σ1 in p1 sia sulla direzione ∂x,cosa che possiamo sempre fare a meno di rotazioni,per cui

〈k, ∂y〉 = 〈k, ∂z〉 = 0

inizialmente. Poichè ∂y, ∂z sono di Killing, allora

〈k, ∂y〉 = 〈k, ∂z〉 = 0

anche in p2, cioè la proiezione di kµ su Σ2 in p2

punta in direzione ∂x e ξ = ∂x è il vettore di Killingche cercavamo.

Un ragionamento simile si può fare anche per S3, H3; inoltre, possiamo calcolare le norme con la metricarelativa, che dipende dal solo fattore di scala a:

√〈ξ, ξ〉|p1〈ξ, ξ〉|p2

=a(τ1)

a(τ2)


Scomponiamo kµ come

kµ = A

⊥Σ︷︸︸︷uµ +B

ξµ√ξ2

ma kµ è di tipo luce, perciò:

kµkµ = 0 =⇒(Auµ +B

ξµ√ξ2

)(Auµ +B

ξµ√ξ2

)= −A2 +B2 = 0 =⇒ A = B

avendo sfruttato che ξµuµ = 0. Abbiamo perciò:

kµ = A

(uµ +

ξµ√ξ2

)

moltiplicando ad ambo i lati per kµ si ottiene

0 = A

(uµk

µ +ξµk

µ

√ξ2

)=⇒ −uµkµ =

ξµkµ

√ξ2

=⇒ ω1,2 =ξµk

µ

√ξ2

∣∣∣∣∣p1,2

=⇒ ω2

ω1=

√ξ2∣∣∣p1√

ξ2∣∣∣p2

=a(τ1)

a(τ2)

ricordando che ξµkµ|p1 = ξµkµ|p2 poichè ξ è Killing e k è tangente alla geodetica. Quando l’universo si

espande, la lunghezza d’onda di ogni fotone aumenta in proporzione all’espansione. Andiamo a calcolareil fattore di redshift:

z :=λ2 − λ1

λ1=ω1

ω2− 1 =

a(τ2)

a(τ1)− 1 (4.3.1)

Vogliamo ora calcolare R = R(z), cioè la distanza in funzione di z:

ds2 = −dτ2 + a2(τ) dΩ2k

La prima equazione di Friedmann con materia e costante cosmologica implica che

3a2

a2= 8πρ− 3k

a2con ρ = ρmat. + ρΛ, ρrad. = 0

La luce si muove lungo geodetiche nulle, per cui ds2 = 0: vale dunque

τ2∫

τ1

dτ

a(τ)=

p2∫

p3

dΩk =R

a(τ2)=⇒ R = a(τ2)

a(τ2)∫

a(τ1)

1

a(τ)

dτ

da︸︷︷︸1/a

da = a(τ2)

a(τ2)∫

a(τ1)

da

aa

A questo punto utilizziamo la prima equazione di Friedmann per eliminare a:

R = a(τ2)

a(τ2)∫

a(τ1)

da

a

√8π

3(ρmat. + ρΛ) a2 − k

y=a(τ)a(τ2)

= a(τ2)

1∫

a(τ1)

a(τ2)

a(τ2) dy

ya(τ2)

√8π

3(ρmat. + ρΛ) y2 a2(τ2)− k

Introducendo la costante di Hubble odierna H0 := a(τ2)/a(τ2) si ottiene:

R =1

H0

1∫

(1+z)−1

dy

y

√8π

3H20

(ρmat. + ρΛ) y2 − k

a2(τ2)

(4.3.2)

4.3. Redshift cosmologico 97

Apriamo ora una breve parentesi per elaborare ulteriormente l’integrale della (4.3.2). Dalla primaequazione di Friedmann si ha k = 0 per

ρ = ρcrit. =3H2

8π(4.3.3)

Definiamo il parametro di densità ΩI come

ΩI :=ρIρcrit.

(4.3.4)

dove I è un indice che può assumere uno dei valori tra m, k, Λ; allora la prima equazione di Friedmanndiventa1:

1 =∑

I

ΩI (4.3.5)

Indicando con una “o” a pedice di certe quantità il loro valore odierno, si ha che:

8π

3H20

= ρ−1crit.,o ρΛ = ρΛ,o = cost.

ed inoltre sappiamo che a3(τ2)ρm,o = a3(τ)ρm, perciò:

ρm = ρm,o

(a(τ2)

a(τ)

)3

=ρm,o

y3=⇒ 8π

3H20

(ρm + ρΛ) = ρ−1crit.,o

(ρm,o

y3+ ρΛ,o

)=

Ωm,o

y3+ ΩΛ,o

Chiudiamo dunque la parentesi sostituendo questo risultato nella (4.3.2), per cui si ottiene:

R =1

H0

1∫

(1+z)−1

dy

y

√Ωm,o

y+ y2ΩΛ,o + Ωk,o

(4.3.6)

A questo punto ci interessa valutare l’integrale in (4.3.6) nei casi particolari di:

1. galassie vicine, perciò con piccolo redshift z → 0, per cui è possibile effettuare lo sviluppo alprim’ordine (1 + z)−1 ≈ 1− z. Abbiamo

R = H−10

1∫

1−z

f(y) dy

Indicando con F una funzione tale che F ′(y) = f(y), allora

R = H−10 [F (1)− F (1− z)] = H−1

0 [F (1)− F (1) + F ′(1)z + o(z)] = H−10 f(1)z

avendo effettuato uno sviluppo centrato in 1 al primo ordine di F (1− z). Ma f(1) è nota:

f(1) =1√

Ωm,o + ΩΛ,o + Ωk,o︸︷︷︸=1 per (4.3.5)

= 1 =⇒ R = H−10 z

che è la relazione lineare scoperta da Hubble;

2. solo contributo della costante cosmologica, ovvero k = 0 = ρm: vale

R = H−10

1∫

(1+z)−1

dy

y2√

ΩΛ,o= H−1

0 Ω−1/2Λ,o︸︷︷︸=1

[−1 + 1 + z] = H−10 z

1usando a/a = H, ricavando H2 dalla (4.3.3), dividendo tutto per 3H2 e definendo Ωk = −k/a2H2.


3. solo contributo della materia, più simile alle condizioni del Big Bang, per cui k = 0 = Λ:

R = H−10

1∫

(1+z)−1

dy√yΩm,o

= H−10 Ω−1/2

m,o︸︷︷︸=1

2[1− (1 + z)−1/2

]= 2H−1

0

[1− (1 + z)−1/2

]

4.4 Phantom energy, Big Rip, orizzonti cosmologici, coordinatenormali di Riemann

L’equazione di stato più generale èP = ωρ

essendo ω una costante tale che

ω =

0 polvere1

3radiazione

−1 costante cosmologica

È usata anche l’equazione di stato di Chaplygin:

P = − λ

ρ2

dove λ è una costante. Sfruttiamo l’equazione di stato più generale per risolvere le equazioni di Friedmann:

ρ+ 3(ρ+ P )a

a= 0 =⇒ ρ+ 3ρ(1 + ω)

a

a= 0 =⇒ ρ

ρ= −3(1 + ω)

a

a=⇒ log ρ = logC − 3(1 + ω) log a

ovveroρ = Ca−3(1+ω) (4.4.1)

Sostituiamo questo risultato nella prima equazione di Friedmann:

3a2

a2= 8πρ− 3k

a2= 8πCa−3(1+ω) − 3k

a2

da cui

a2 =8πC

3a−(1+3ω) − k (4.4.2)

Apriamo ora una parentesi: dalla seconda equazione di Friedmann

3a

a= −4π(ρ+ 3P ) = −4πρ(1 + 3ω)

si nota che l’espansione accelera con 1 + 3ω < 0 =⇒ ω < −1/3. Poniamoci in questa condizione, cioè−1− 3ω > 0: con a grande possiamo trascurare il termine −k, quindi possiamo integrare la (4.4.2):

a =

√8πC

3a−(1+3ω)/2 =⇒ a(1+3ω)/2 da =

√8πC

3dτ =⇒ 2

3(1 + ω)a3(1+ω)/2 =

√8πC

3(τ − τ0)

da cui

a =

[3(1 + ω)

2

√8πC

3(τ − τ0)

]2/3(1+ω)

(4.4.3)

4.4. Phantom energy, Big Rip, orizzonti cosmologici, coordinate normali di Riemann 99

Se ω < −1 allora τ < τ0; con τ → τ0 a diverge. Il valore discrimine ω = −1 è detto phantom divide,mentre l’energia con ω < −1 è detta phantom energy .

Figura 4.1: rappresentazione della situazione.

Consideriamo ora la metrica FLRW, con k = 0:

ds2 = −dτ2 + a2(τ) dx2

e supponiamo che un segnale venga mandato da(τ = 0,x = x1) a P . Essendo un segnale luminoso

ds2 = 0 =⇒ dx2 =dτ2

a2(τ)

perciò

|x0 − x1| =t0∫

0

dτ

a(τ)(4.4.4)

Vogliamo che l’osservatore O sia in grado di rice-vere segnali da qualsiasi altro osservatore isotropo(cioè nessun orizzonte), cioè che possa “vedere tut-to”: dev’essere allora |x1| → ∞, ma allora, per la(4.4.4), anche l’integrale deve divergere. Che condizioni deve soddisfare a affinchè l’integrale diverga?Dev’essere a(τ) ≤ ατ , per qualche costante α, con τ → 0, cioè l’universo si espande sufficientementepiano. Però, per tutti i modelli FLRW, tale integrale converge e ci sono quindi orizzonti.

Esempio 4.2. Consideriamo la polvere, perciò k = 0: allora abbiamo che

a(τ) = Cτ2/3

con C costante; la (4.4.4) dà

|x0 − x1| = C−1

τ0∫

0

dτ

τ2/3=

3 3√τ0C

cioè, per dati (τ0,x0), questa è l’equazione che determina l’orizzonte x1.

Consideriamo un sistema di coordinate vicino ad un punto p tale chegµν |p = ηµν

gµν,α|p = 0

Come si fa a costruire un tale sistema di coordinate? Sia v ∈ TpM, e si individui la geodetica xµ(λ)univocamente determinata dalle condizioni

xµ(0) = pdxµ

dλ

∣∣∣∣λ=0

= vµ


Definizione 4.3. La mappa esponenziale è quell’applicazione exp : TpM → M che associa a vµ ∈TpM il punto xµ(1).

Si può mostrare che exp è un diffeomorfismo in un intorno di p; in questo modo si può usare v per definireun sistema di coordinate locali vicino a p che vengono chiamate coordinate normali di Riemann.

Se xµ(λ) risolve l’equazione delle geodetiche

d2xµ

dλ2+ Γµνρ

dxν

dλ

dxρ

dλ= 0

allora anche xµ(aλ), con a costante, è una soluzione: con a = 2 avremo la stessa soluzione che parte avelocità doppia. Vale che

exp : avµ 7→ xµ(a) (4.4.5)

Scegliamo una base ortonormale eα di TpM, cioè tale che

〈eα, eβ〉 = ηαβ = gαβ |p (4.4.6)

dopodichè scriviamo v = vαeα e chiamiamo q = exp(v); a questo punto definiamo le coordinate normalidi Riemann del punto q come le componenti vα di v. Le coordinate normali di Riemann del punto xµ(λ)saranno, per la (4.4.5), le componenti λvα di λv; però xµ(λ) = λvµ soddisfa l’equazione delle geodetiche,notando che xµ = vµ:

0 + Γµνρ(λvα) vνvρ = 0

λ=0=⇒ Γµνρ(0) vνvρ = 0 ∀v =⇒ Γµ(νρ)(0) = 0

Se la connessione è simmetrica, cioè la torsione è nulla, allora si ha che

Γµ[νρ] = 0 =⇒ Γµνρ(0) = 0 (4.4.7)

che è proprio quanto volevamo dimostrare.

Osservazione 4.5. Nel caso di torsione nonnulla, non possiamo più concludere che vale la (4.4.7), equindi in p la derivata covariante non si riduce a quella standard: non si ha più un sistema inerziale,perciò se la torsione è diversa da 0 cade il principio di equivalenza.

Esempio 4.3. Se si immerge la S2 in R3, si può identificare lo spazio tangente al polo nord col solopiano (x, y). Etichettiamo un vettore al polo nord con le componenti (v, w): verificare che la mappaesponenziale è

exp : (v, w) 7→(ϑ =

√v2 + w2, ϕ = arctg

(w

v

))

Suggerimento: le geodetiche che passano per il polo nord hanno ϕ costante e ϑ = aλ.La metrica sulla 2-sfera è

ds2 = dϑ2 + sin2ϑ dϕ2 =(v dv + w dw)2

v2 + w2+ sin2

√v2 + w2

(v dw − w dv)2

v2 + w2

Sviluppiamo sin√v2 + w2 come

sin√v2 + w2 =

√v2 + w2 − 1

3!(v2 + w2)3/2 + ϑ

(v2 + w2

)5/2

perciò

sin2√v2 + w2 ≈ v2 + w2 − 1

3

(v2 + w2

)2+ ϑ(v2 + w2

)3

da cui

ds2 = dv2 + dw2

︸︷︷︸metrica piatta

−1

3(

correzioni quadratiche︷︸︸︷v2 dw2 + w2 dv2 − 2vw dvdw) + . . .︸︷︷︸

termini quadratici in v, w

È importante che le derivate prime della metrica in v = w = 0 siano 0, così che i simboli di Christoffelnel polo nord siano 0.

4.4. Phantom energy, Big Rip, orizzonti cosmologici, coordinate normali di Riemann 101

Possiamo concludere con i seguenti commenti:

• le coordinate normali di Riemann rappresentano la migliore approssimazione allo spazio piatto chesi può fare;

• gli osservatori inerziali si muovono lungo geodetiche di tipo tempo. Le coordinate normali di Rie-mann forniscono un sistema localmente inerziale, il quale assomiglia, a meno di termini del secondoordine, allo spaziotempo piatto; localmente la fisica è quella dello spaziotempo piatto, e questa è latraduzione matematica del principio di equivalenza.

Testi consigliati

[1] K. S. Thorne & J. A. Wheeler C. W. Misner. Gravitation. W.H. Freeman and Company, New York,NY 10010, 1973.

[2] S. M. Carroll. Lecture Notes on General Relativity. University of California, Santa Barbara, CA93106, 1997.

[3] R. M. Wald. General Relativity. The University of Chicago Press, Chicago, IL 60637, 1984.

[4] S. Weinberg. Gravitation and Cosmology. John Wiley & Sons, Inc., San Francisco, CA 94104, 1972.

Questo documento è pubblicato secondo il testo della licenza libera CC BY-SA 3.0. 2012-13

Indice analitico

algebra di Lie, 28atlante, 7

Big Bang, 92big crunch, 93big rip, 93boost di Lorentz, 26buco bianco, 82buco nero, 82

campotensoriale, 28vettoriale, 28

carta, 7cicloide, 93coefficienti di connessione, 35congruenza di curve, 86connessione, 35

covariantemente costante, 38di Levi-Civita, 40metrica, 38simmetrica, 39

cono luce, 30coordinate

di Kruskal, 81normali di Riemann, 100

costantecosmologica, 89di Hubble, 91

derivatacovariante, 35esterna, 23

derivazione, 13diffeomorfismo, 11differenziale, 17

effetto Hawking, 84energia oscura, 91equazione

della deviazione geodetica, 51delle geodetiche, 42di continuità relativistica, 58di Eulero, 59di Navier-Stokes relativistica, 58di stato di Chaplygin, 98

equazionidi Friedmann, 90di Pauli-Fierz, 64

esperimento di Eötvös, 5

fluido perfetto, 58forma differenziale, 17funzione ellittica di Weierstrass, 73

geodetica, 42

indice di una forma quadratica, 31invarianti ellittici, 73isomorfismo canonico, 30

legge di Hubble, 91linearizzazione locale, 12

mappa esponenziale, 100massa

dinamica, 28gravitazionale, 5inerziale, 5

metricaasintoticamente piatta, 68di Friedmann-Lemaître-Robertson-Walker, 88

onda gravitazionale, 64orizzonte

degli eventi, 82del futuro, 81del passato, 81

p-forma, 21parametro

affine, 49d’impatto apparente, 72

parentesi di Lie, 28phantom divide, 99phantom energy, 99ponte di Einstein-Rosen, 83prima identità di Bianchi, 45principio di equivalenza

debole, 5di Einstein, 6

prodottoesterno, 21simmetrizzato, 30tensoriale, 19

proiezione stereografica, 9pullback, 86

quattro leggi dei buchi neri, 83

Rindler wedge, 80

scalare di curvatura, 46seconda identità di Bianchi, 45segnatura, 31simboli di Christoffel, 40soluzioni isometriche, 94spazio

a curvatura costante, 87cotangente, 17tangente, 12topologico, 7topologico di Hausdorff, 7

spaziotempodi Minkowski, 31di Rindler, 32sfericamente simmetrico, 67spazialmente isotropo, 86spazialmente omogeneo, 85statico, 66stazionario, 66

tensore, 19degli sforzi, 57di Einstein, 46di Faraday, 23di Ricci, 46di Riemann, 44energia momento, 57metrico, 30

teorema di Birkhoff, 68topologia, 7torsione, 39trasformazioni di

gauge, 25Lorentz, 26

trasporto parallelo, 34

universochiuso, 87di de Sitter, 94di Milne, 95

varietà, 7(pseudo-)riemanniana, 30differenziabile, 8

vettorecontravariante, 17covariante, 17di Killing, 54tangente, 13

wormhole, 83

Date post:	15-Feb-2019
Category:	Documents
Upload:	vankiet
View:	661 times
Download:	114 times

Appunti del corso di Introduzione alla Relatività Generale · Appunti del corso di Introduzione...

Documents