Materiali per un corso di Storia della Matematica · scartes solo il precursore della moderna...

Materiali per un corso diStoria della Matematica

(versione preliminare)

M. Galuzzi

8 giugno 2010

1

2

Indice

1 Introduzione 7

1.1 Cosa l’insegnamento della storia della matematica non e . . 7

1.2 Storia e bellezza della matematica . . . . . . . . . . . . . . . 10

1.3 Il linguaggio da utilizzare . . . . . . . . . . . . . . . . . . . . 12

1.4 Chi non amava la matematica . . . . . . . . . . . . . . . . . 14

1.5 La ‘distanza’ dall’insegnamento . . . . . . . . . . . . . . . . 16

2 Qualche considerazione preliminare sulla matematica greca 19

2.1 Le caratteristiche di una teoria matematica: gli Elementi di

Euclide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2 Dimostrare seguendo un percorso rigoroso . . . . . . . . . . 22

2.3 Esporre solo la sintesi, non l’analisi . . . . . . . . . . . . . . 23

2.4 Ancora sul metodo dell’analisi . . . . . . . . . . . . . . . . . 26

2.5 L’algebra e la matematica greca . . . . . . . . . . . . . . . . 29

2.6 Occorre evitare l’anacronismo . . . . . . . . . . . . . . . . . 31

2.7 Ma non bisogna enfatizzare le differenze . . . . . . . . . . . 33

2.8 La tangente ad una curva nell’antichita: Apollonio . . . . . . 34

2.9 Un cenno al calcolo del volume della sfera di Archimede . . . 35

3 Il metodo geometrico e le Collezioni di Pappo 39

3.1 L’inserzione di due medie proporzionali: intersezione di coniche 41

3.2 La νεÜσις: l’inserzione di due medie proporzionali . . . . . . 42

3.3 La νεÜσις: la trisezione dell’angolo . . . . . . . . . . . . . . 45

4 La soluzione dell’equazione di terzo e quarto grado 47

4.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3

4.2 La formula risolutiva dell’equazione di terzo grado . . . . . . 49

4.3 Descartes e l’equazione di quarto grado . . . . . . . . . . . . 54

4.4 Un cenno all’analisi di Lagrange delle soluzioni dell’equazione

di terzo e quarto grado . . . . . . . . . . . . . . . . . . . . . 57

4.5 Lagrange e il Teorema dell’elemento primitivo . . . . . . . . 64

5 Il teorema sui polinomi simmetrici 71

5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

5.2 La regola di Newton per le somme di potenze delle radici . . 73

5.3 La dimostrazione di Maclaurin della regola di Newton . . . . 74

5.4 La dimostrazione di Lagrange della regola di Newton . . . . 78

5.5 La prima dimostrazione del teorema: Waring . . . . . . . . . 80

5.6 La dimostrazione di Gauss . . . . . . . . . . . . . . . . . . . 82

5.7 La dimostrazione di Cauchy . . . . . . . . . . . . . . . . . . 87

6 Verso il calcolo differenziale 91

6.1 Il metodo per le tangenti di Descartes . . . . . . . . . . . . . 92

6.2 La risposta di Fermat . . . . . . . . . . . . . . . . . . . . . . 96

6.3 Le difficolta da superare (viste a posteriori) . . . . . . . . . . 99

6.4 Let Newton be. . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7 Il De Analysi di Newton 105

7.1 Le regole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

7.2 Le applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . 111

7.3 Applicazione ad altri problemi dello stesso genere . . . . . . 113

8 La serie di Lagrange 117

8.1 Serie e serie formali . . . . . . . . . . . . . . . . . . . . . . . 117

8.2 La prima formulazione . . . . . . . . . . . . . . . . . . . . . 119

8.3 La formulazione nella Theorie des fonctions analytiques . . . 128

8.4 La dimostrazione di Laplace . . . . . . . . . . . . . . . . . . 131

8.5 Qualche applicazione alla combinatoria . . . . . . . . . . . . 133

9 Frazioni continue 137

9.1 Radici quadrate: algoritmi . . . . . . . . . . . . . . . . . . . 138

4

9.2 Principali proprieta . . . . . . . . . . . . . . . . . . . . . . . 141

9.3 Il metodo di Lagrange . . . . . . . . . . . . . . . . . . . . . 151

9.4 Il teorema di Galois . . . . . . . . . . . . . . . . . . . . . . . 158

9.5 Appendice: sulle possibili fonti per la memoria di Galois sulle

frazioni continue . . . . . . . . . . . . . . . . . . . . . . . . 166

10 Il teorema di Sturm 173

10.1 La memoria di Cauchy del 1815 . . . . . . . . . . . . . . . . 173

10.2 Il teorema di Sturm . . . . . . . . . . . . . . . . . . . . . . . 181

10.3 Osservazioni complementari . . . . . . . . . . . . . . . . . . 186

10.4 Un risultato piu generale . . . . . . . . . . . . . . . . . . . . 189

11 Galois e l’origine dell’algebra moderna 191

11.1 Una breve introduzione sul concetto di gruppo di Galois . . 192

11.2 Un lemma preliminare . . . . . . . . . . . . . . . . . . . . . 194

11.3 La risolvente di Galois . . . . . . . . . . . . . . . . . . . . . 195

11.4 Il gruppo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

11.5 Il teorema fondamentale . . . . . . . . . . . . . . . . . . . . 200

11.6 Esempi di calcolo del gruppo di Galois . . . . . . . . . . . . 203

11.7 Generalizzazione del concetto di risolvente . . . . . . . . . . 209

11.8 Gli esempi di Galois . . . . . . . . . . . . . . . . . . . . . . 210

11.9 La dimostrazione di Artin relativa al primo esempio di Galois 214

11.10La Proposizione II della Memoria di Galois . . . . . . . . . . 216

11.11La Proposizione III della Memoria di Galois . . . . . . . . . 222

11.12La risolubilita per radicali . . . . . . . . . . . . . . . . . . . 223

11.13L’esempio dell’equazione di quarto grado . . . . . . . . . . . 227

11.14Il Teorema di Abel . . . . . . . . . . . . . . . . . . . . . . . 228

12 Da Galois a Artin 231

12.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

12.2 Estensione di morfismi . . . . . . . . . . . . . . . . . . . . . 232

12.3 L’uso dei caratteri . . . . . . . . . . . . . . . . . . . . . . . . 235

12.4 Un’applicazione importante del Teorema 13 . . . . . . . . . 238

12.5 La sezione H della Galoissche Theorie di Artin . . . . . . . . 242

12.6 La teoria di Artin e le estensioni semplici. . . . . . . . . . . 252

5

13 La Trasformata Rapida di Fourier 257

13.1 Qualche premessa sulla serie di Fourier . . . . . . . . . . . . 258

13.2 La divisione fra polinomi . . . . . . . . . . . . . . . . . . . . 261

13.3 Verso la scrittura di un programma . . . . . . . . . . . . . . 266

13.4 Conclusione . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

13.5 Appendice: alcuni programmi . . . . . . . . . . . . . . . . . 268

Bibliografia 273

6

Capitolo 1

Introduzione

I contenuti di questo capitolo sono stati utilizzati come introduzione ad un

corso di storia della matematica per gli studenti della Scuola di Specializza-

zione (Silsis). Il lettore ideale era dunque il futuro insegnante. Ma mi sem-

bra che molte considerazioni abbiano un interesse che trascende l’obiettivo

dell’insegnamento e che dunque possano essere utili anche al di fuori di

questo contesto.

1.1 Cosa l’insegnamento della storia della

matematica non e

Seguendo un modulo espositivo caro a Benedetto Croce,1 si puo cominciare

con il dire che cosa l’insegnamento della storia della matematica non e (o

non deve essere).

1Si veda, ad esempio [Croce, 1976]. Molte delle considerazioni che seguono si trovano,

sia pure in altra forma, nella mia Premessa a [Weil, 2002]. Ma si consiglia vivamente la

lettura del testo stesso di Andre Weil.

7

Questo insegnamento2 non puo ridursi all’uso di un manuale, per quanto

ben fatto questo possa essere. Un manuale contiene (in genere) utili infor-

mazioni: gli Elementi3 di Euclide sono composti di tredici libri. Di essi

sei sono dedicati alla geometria piana. Il teorema di Pitagora e dimostrato

nella proposizione I.47,. . .

Tuttavia, gia quando affermiamo il ‘dato di fatto’ che Euclide non uti-

lizza il quinto postulato4 per le prime ventotto proposizioni del primo libro,

e doveroso accompagnare questo dato di fatto con una interpretazione. Ad

esempio:

• Euclide gia presagisce la possibilita di una geometria non euclidea e

con le prime ventotto proposizioni si spinge innanzi in questa direzio-

ne.

• Per semplici motivi di eleganza formale, preferisce dimostrare alcune

istanze piu deboli di certe proposizioni (ad esempio la I.16, che afferma

che un angolo esterno di un triangolo e maggiore di ciascuno degli

angoli interni ad esso opposti.5

• Non possiamo argomentare in modo plausibile a partire da un te-

sto che ha subito numerose modifiche nel corso di piu di venti seco-

2Le considerazioni che seguono si rivolgono all’insegnamento della storia in generale

ma valgono,– mi sembra,– a maggior ragione, se vengono riferite ad una pratica di questo

insegnamento intercalato, per cosı dire, nell’insegnamento, a varı livelli, della matematica

stessa.3Un’ottima traduzione italiana e [Euclide, 1970], ristampata recentemente.4E utile rammentare che la formulazione euclidea di questo postulato e: “Se una

retta venendo a cadere su due rette forma gli angoli interni da una stessa parte minori

di due angoli retti, le due rette, prolungate indefinitamente, si incontreranno dalla parte

in cui i due angoli sono minori dei due angoli retti.” La formulazione che si incontra in

molti libri moderni (spesso attribuita ad Euclide) e quella di Playfair (in realta, come

dice esplicitamente lo stesso Playfair nella sua edizione degli Elementi, la fomulazione e

di Proclo): “Data una retta ed un punto esterno esiste una ed una sola parallela per il

punto alla retta data”. Si tratta di una formulazione nella quale si mescolano esistenza

ed unicita.5Questa proposizione e un ovvio corollario del teorema sulla somma degli angoli

interni. Per la sua dimostrazione richiede la possibilita di raddoppiare un segmento

arbitrario.

8

li. Puo darsi che gli Elementi riflettano una ‘sedimentazione’ delle

proposizioni che non rifletta, se non in modo impreciso, la volonta

euclidea.

Poiche la trasmissione reale del sapere non puo che consistere nel comu-

nicare cio che e un nostro sicuro possesso, e chiaro che dobbiamo formare

una nostra precisa opinione. Il che non puo avvenire senza un confronto

con il testo euclideo.6

Ancor piu evidente e necessario diventa un confronto personale con il

testo se si vuol suggerire un significato generale agli Elementi. Essi culmi-

nano con il tredicesimo libro, ossia con l’analisi dei poliedri regolari,– i solidi

platonici,– e riflettono con cio un evidente interesse per l’indagine platoni-

ca sulla natura delle idee matematiche o manifestano un evidente influsso

aristotelico nella loro architettura logica?

Da secoli questo problema viene discusso, ed una qualsiasi ragionevole

esposizione del contenuto degli Elementi non puo prescindere da una precisa

valutazione della loro natura.

Ovviamente, non c’e ragione per la quale la nostra opinione su una que-

stione matematica non venga a coincidere in fine, del tutto od in parte,

con quella dell’autore di un buon manuale. Ma e cosa radicalmente di-

versa accettare passivamente l’opinione di Kline, o di Boyer o di Zeuthen,

dall’esprimere un consenso fondato su una conoscenza dei testi che essi stessi

hanno considerato.

Si puo essere partecipi dell’opinione di Gino Loria, che vedeva in De-

scartes solo il precursore della moderna geometria analitica, ancora assai

lontano dalla sua reale natura.7 O si puo sostenere un’interpretazione radi-

calmente contraria (che e quella di chi scrive8). Ma, in ogni caso, sara assai

poco significativo consentire con l’uno o l’altro giudizio senza un preciso

riscontro con il testo cartesiano.

6Ed ancora, dietro la ovvieta di questa osservazione, si cela una scelta: potremo

accontentarci di una traduzione in una lingua moderna del testo di Euclide o dovremo

confrontarci con il testo greco? E quanto profonda deve essere la conoscenza di questa

lingua? Un’utile lettura e comunque [Mugler, 1958].7Si veda [Loria, 1923].8Si veda [Galuzzi, 2002].

9

Quanto diversa efficacia possa avere la presentazione della geometria

analitica accompagnata da informazioni storiche che siano un reale possesso

del docente, piuttosto che la banale ripetizione dell’opinione di Loria, o

dell’opinione contrapposta, e troppo evidente perche si debba soffermarsi

su questo punto.

1.2 Storia e bellezza della matematica

E certamente desiderabile che molti amino la matematica, la sua razionalita,

la sua bellezza. Ma cosı come non tutti amano la poesia o la musica,–

od un certo genere di musica o di poesia,– allo stesso modo non e giusto

pretendere che tutti partecipino dello stesso ardore intellettuale di fronte

alla matematica.

Si consideri una delle prime ‘scoperte’ dei pitagorici. Si guardi la figura

seguente

∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ .

∗ ∗ . .

Essa esibisce in modo ‘visivo’ il fatto che la somma di numeri dispari

successivi fornisce i quadrati.9

1+ 3 = 4, 1+ 3+ 5 = 9, 1+ 3+ 5+ 7 = 16, . . .

E l’immagine grafica e (forse) ben piu convincente della identita

m2 + 2m+ 1 = (m+ 1)2.

Tuttavia, anche una comprensione piena e profonda di questa proprieta

dei numeri interi, non necessariamente suscita il desiderio di scoprire altre

proprieta della stessa natura. La fascinazione della teoria dei numeri, la

regina della matematica, puo non agire per tutti allo stesso modo. E chi

9Molte proprieta ‘visive’ dei numeri interi (e molto altro) si trova nell’affascinante

volume [Conway e Guy, 1999].

10

non subisce questo fascino provera una noia variamente graduata a sentir

narrare di Pitagora e dei suoi adepti.

Se e giusto e necessario che tutti i cittadini raggiungano il (modesto) li-

vello di conoscenze matematiche necessarie per la vita pratica, se e auspica-

bile che tutti giungano a possedere quegli strumenti di razionalita minimale

che consentano poi di esprimere le proprie scelte politiche in modo consape-

vole, non ne segue come corollario che tutti debbano amare la matematica

in pari misura.

Chi ama la musica, e per cio desidera avvicinarsi alla pratica musicale,

per esempio imparando a suonare uno strumento, sa che per raggiungere

il fine desiderato, avra bisogno di una certa tecnica: scale, scale per terza,

scale cromatiche. . .

Eseguire una scala cromatica non e molto gratificante. Ma, sino ad ora,

almeno, non e pratica diffusa far precedere, o far seguire, questo esercizio

da informazioni sulla storia della musica che abbiano il fine di renderlo piu

attraente. E se e vero che nel periodo del predominio della tonalita, l’uso

di cromatismi (soprattutto discendenti) serviva a comunicare un senso di

smarrimento e di incertezza (come spesso accade nelle arie di Mozart) e

ancor piu vero che e la conoscenza tecnica che favorisce la comprensione

storica e non viceversa.

Chi ha provato piacere nel giungere alla soluzione di un problema geome-

trico mediante l’uso di riga e compasso, provera del pari piacere nell’appren-

dere che ogni problema geometrico, trattato algebricamente, e ancora riso-

lubile con gli stessi strumenti se la sua soluzione dipende solamente dalla

successiva soluzione di equazioni di secondo grado.

Ma il complesso di manipolazioni algebriche che consentono di ricondur-

re la soluzione di alcuni tipi di equazioni di grado superiore al secondo alla

successiva risoluzione di equazioni di secondo grado di per se puo non essere

molto attraente.

In generale, puo apparire piuttosto tedioso cio che puo essere acquisito

solo con un certo numero di ripetizioni di una pratica ‘manipolativa’.10 Si

10Questo pero non significa certo accettare questa pratica in modo acritico. Non

riesco per esempio a comprendere perche non possa sostituirsi alla trattazione separata

delle equazioni biquadratiche e reciproche l’osservazione che il cambiamento di variabili

11

tratta tuttavia dell’equivalente della tecnica musicale. E non c’e musica

senza tecnica. Ed e improprio e fuorviante che qui la storia debba avervi al-

tro ruolo di quello di un eventuale possibile espediente, da usare, comunque,

con cautela.

1.3 Il linguaggio da utilizzare

E piuttosto evidente che, anche quando compiamo ogni sforzo per descrive-

re un’acquisizione matematica nel linguaggio del tempo nel quale e avvenu-

ta, in realta possiamo solo avvicinarci a questo linguaggio attraverso una

mediazione.

Se, utilizzando la scrittura di Viete, consideriamo l’‘equazione’

B in E adæquabitur C in E bis+ Eq, (1.1)

per esprimere cio che in termini moderni scriveremmo (E indica l’incognita)

bx = 2cx+ x2, (1.2)

possiamo compiere ogni sforzo ragionevole per ‘allontanare’ la (1.1) dal-

la (1.2), ma non c’e alcun modo per rimuovere il nostro patrimonio di

conoscenze attuale per immaginare di seguire le argomentazioni di Viete

esattamente come uno studioso della fine del Cinquecento.11

Di cio occorre essere consapevoli, e questa consapevolezza implica un

confronto serrato e preciso con i testi. Si consideri la soluzione abituale

dell’equazione di secondo grado per ‘completamento del quadrato’. Abbia-

mo, per passi successivi:

ax2 + bx+ c = 0. (1.3)

x← 1−y1+y

muta un’equazione reciproca in un’equazione avente solo termini di grado pari

e viceversa.11Non conosco miglior descrizione (satirica) dell’ingenuita dello storico che presume

di ‘calarsi nell’epoca di cui tratta’ del racconto “Pierre Menard autore del Chisciotte” in

[Borges, 1978].

12

Raccogliendo

a

(x2 +

b

ax+

c

a

)= 0. (1.4)

Ponendo

b

a= p,

c

a= q, (1.5)

abbiamo

x2 + px+ q = 0. (1.6)

Ora possiamo procedere, dapprima riscrivendo:

x2 + 2p

2x+ q = 0, (1.7)

e poi, aggiungendo e togliendo una stessa quantita,

x2 + 2p

2x+

p2

4+ q−

p2

4= 0. (1.8)

Quindi

(x+

p

2

)2+ q−

p2

4= 0. (1.9)

Di qui si ottiene, portando a secondo membro e quadrando, la formula

risolutiva abituale.

Questo modo di soluzione era noto, si dice, ancor prima di Euclide.

Tuttavia soltanto alla fine del Cinquecento si ha un linguaggio algebrico

di forza sufficiente per descrivere le manipolazioni eseguite.

La scelta di presentare la soluzione moderna dell’equazione di secondo

grado sembra inevitabile. Ci si puo chiedere ora se, accanto a questa pre-

sentazione sia utile aggiungere qualche informazione storica. Ora se questa

informazione e molto generale e si limita a dire che i babilonesi ancor prima

dei greci conoscevano la soluzione, non e di grande profitto. Ne lo diviene

13

con l’aggiunta di varı orpelli retorici. Se diviene piu specifica, esaminan-

do, per esempio, la soluzione data nel libro secondo degli Elementi ad un

problema la cui formulazione puo essere formulata come la ricerca delle so-

luzioni di un’equazione di secondo grado, la mediazione della quale parlavo

all’inizio di questa sezione, va posta in modo corretto.

Possiamo, e vero, solo avvicinarci al linguaggio di Euclide, ma lo sforzo

per questo avvicinamento va compiuto, per evitare che il risultato euclideo

appaia banale.

1.4 Chi non amava la matematica

Benedetto Croce, certamente un grande intellettuale, con pari certezza non

amava la matematica:

La matematica, in quanto matematica, non conosce, ma stabili-

sce formule di eguaglianza; non serve a conoscere, ma a contare

e a calcolare il gia conosciuto.

Per contare e calcolare, la matematica ha bisogno di formole, e,

per stabilire queste, di certi principi supremi, che si chiamano, a

volta a volta, definizioni, assiomi e postulati. Cosı l’aritmetica

ha bisogno della serie numerica la quale, movendo dall’unita, si

ottiene aggiungendo sempre un’unita al numero precedente.12

Dall’osservazione che ogni numero intero si ottiene dall’unita con un

procedere uniforme (1, 1+ 1, 1+ 1+ 1, . . . ) Croce traeva la conclusione che

tutti i numeri sono fondamentalmente uguali. O meglio, che le loro diversita

non possono occupare seriamente i nostri pensieri.

Certamente Benedetto Croce era in grado di cogliere la differenza tra

numeri primi e composti e di visualizzare geometricamente questa differen-

za.

12Cfr. [Croce, 1909, p. 253].

14

Un numero primo, non puo avere una rappresentazione bidimensionale

come quella di un numero non primo. Abbiamo, ad esempio

12 = 3× 4 =∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗

Un numero primo non puo che rappresentarsi su una linea:

7 = ∗ ∗ ∗ ∗ ∗ ∗ ∗

Qual e il valore concettuale di questa differenza? Qual e il valore concet-

tuale della esistenza di infiniti numeri primi? Assai modesto per Benedetto

Croce.

Per un matematico invece i numeri esibiscono qualita, differenze, strut-

ture che solo una profonda analisi concettuale puo cogliere.

Due numeri, come 23 e 29, sarebbero del tutto uguali, secondo Croce.

Ma essi sono profondamente diversi per un matematico! Perche possiamo

scrivere

29 = 25+ 4,

ossia 29 e somma di quadrati, mentre, come e facile verificare, non puo

accadere la stessa cosa per 23. In generale, un numero dispari della forma

4n+ 3 non puo essere somma di quadrati.

Ma quali numeri sono somma di quadrati e quali non lo sono? La rispo-

sta e tutt’altro che facile13 e mette in gioco la necessita di analisi profonde

della struttura dei numeri interi che vanno ben al di la dello stanco ripetersi

dell’aggiunta dell’unita.

Benedetto Croce giudicava il complesso di ricerche come queste, un gioco

futile. In generale pensava che la matematica avesse, nelle sue parti piu

elementari, come in quelle piu avanzate, solo un’utilita pratica.

Non possiamo rimproverarlo per questo. Possiamo invece addebitargli

a colpa grave l’aver edificato un sistema filosofico che ha teorizzato co-

13Sia n un intero positivo, e poniamo n = b2c. Allora n si puo scrivere come somma

di due quadrati se e solo se nessun numero primo della forma 4k + 3 divide c. Si veda

[Goldman, 2002, p. 164].

15

me un valore fondamentale del pensiero cio che era solo una sua persona-

le valutazione, creando (assieme a Gentile) la mostruosita filosofica delle

pseudo-scienze.

Ma possiamo ricavarne la lezione che intelligenza e sottovalutazione

della matematica possono coesistere e che non e certo compito della sto-

ria della matematica eliminare questa sottovalutazione, che corrisponde ad

una sorta di predisposizione individuale. Occorre sempre rammentare che

l’intelligenza non ha un’unica forma.

1.5 La ‘distanza’ dall’insegnamento

Abbiamo sin qui concluso che si puo non amare la matematica senza per

questo dover essere giudicati privi di capacita intellettive.14 Abbiamo illu-

strato il punto di vista secondo il quale l’uso della storia non va inteso come

un modo accattivante e giocoso per rendere attraente una disciplina che, se

attrae, attrae di per se. Abbiamo chiarito che un eventuale uso della storia

nella didattica deve avvenire mediante un confronto con i testi. Rimane

un ultimo punto: ammesso che la conoscenza storica sia, per il docente,

un potente stimolo per una didattica personale e profonda, e possa essere

per lo studente un modo di penetrare ancora piu a fondo nella conoscenza

della disciplina, quanto ‘vicina’ deve essere la conoscenza storica alla pratica

didattica?

Quali testi occorre conoscere per insegnare la geometria elementare?

Gli Elementi? Le Grundlagen di Hilbert? Le ricerche di Emil Artin sul

problema della coordinatizzazione?

A prima vista sembra evidente che la scelta debba cadere su cio che e

piu vicino alla pratica didattica. . . O su cio che l’uso ha consacrato.

Tuttavia una riflessione piu attenta mostra che le connessioni possono

essere meno evidenti.

14Ma credo d’aver chiarito che non amare la matematica non implica che si debba

esibire con stupido compiacimento la propria incapacita di comprenderla. Ne soprattutto

che si debba poi lasciare intendere che il fastidio per la sua (presunta) banalita sia la

necessaria premessa per cogliere i piu alti valori dello spirito.

16

Si supponga d’avere il problema di dover insegnare l’ortografia e la sin-

tassi italiana. Quali conoscenze occorre possedere e quali testi della nostra

letteratura occorre aver letto?

Non sembra che Pirandello sia tra i primi autori che occorra considera-

re.15 Ma si considerino queste frasi, tratte in ordine sparso, dalle novelle

Padron Dio e La casa dell’agonia della raccolta Una giornata:

Sdrajato per terra, s’immergeva in quel silenzio [. . . ]

Se questo fosse finalmente sopravvenuto, lui ne avrebbe provato

dispiacere [. . . ]

Sul rettangolo azzurro della finestra spiccava un vaso di geranii

rossi [. . . ]

Pirandello era un profondo conoscitore della lingua italiana.16 Aveva

anche scritto importanti contributi teorici sulla lingua. Sceglie ‘lui’ e ‘lei’

come soggetto perche giudica ‘egli’ ed ‘ella’ forme troppo letterarie. Prefe-

risce che la ‘i’ intervocalica si trasformi in ‘j’. Preferisce ‘geranii’ a ‘geranı’

od a ‘gerani’.

L’importanza che le sue Novelle per un anno hanno avuta,- e conti-

nueranno ad avere,- nella cultura italiana dimostra con chiara evidenza

l’importanza di una scelta linguistica che ponga la lingua letteraria a breve

distanza dal parlare comune. Le scelte di ‘j’ ed ‘ii’ non hanno invece avuto

largo seguito.

Non dobbiamo trarne la conclusione che ci vuole molta cautela nel pro-

porre degli usi grammaticali che allontanino dalla lingua parlata (egli, ella)?

O che, simmetricamente, e difficile introdurre cio che la pratica della lingua

corrente va semplificando (la j intervocalica, la doppia i)?

15Naturalmente non intendo qui esprimere un parere autorevole sulla lingua italiana.

Intendo invece sottolineare il fatto che, accanto ai riferimenti consueti ai ‘padri’ della

lingua, Petrarca, Dante, Manzoni, ecc. si trovano anche altri autori ai quali e utile e

stimolante riferirsi. Anche se Pirandello era un profondo conoscitore della lingua italiana

(si veda, per esempio, l’Appendice di Simona Costa a [Pirandello, 1993]) il riferimento a

Pirandello non e tra i piu diffusi nell’insegnamento della sintassi italiana.16Si veda la nota 15.

17

Andrea Camilleri, nella Nota Mani avanti, apposta al romanzo Il corso

delle cose, spiega le ragioni del suo ‘linguaggio’ personale. Le sue scelte

linguistiche si riconnettono idealmente alle ragioni che spingevano Piran-

dello (autore per altro che gli e estremamente familiare) a prediligere ‘lui’ e

‘lei’. E va anche oltre trasponendo termini dalla parlata siciliana che stanno

divenendo familiari a molti lettori.17

Quanto la lettura di Pirandello, od anche di Camilleri, puo essere di

profitto a chi vuole ‘insegnare’ l’uso corretto della lingua italiana? La ri-

sposta mi pare ovvia. Come e ovvio che la lettura d’un testo da riconnettersi

immediatamente alla pratica didattica quotidiana non sia il modo migliore

per conferire a questa pratica sostanza e dignita.18

17Si veda la premessa al Glossario posta in appendice di [Camilleri, 2000].18Ovviamente non e in discussione il mutare della lingua sul lungo periodo (il latino e

le lingue romanze. . . ). Ne, in generale, il mutare della lingua anche su periodi piu brevi

(San Paolo non usa piu l’ottativo nella lingua greca; il passato remoto tende a sparire

dall’uso corrente della lingua italiana . . . ). Cio che voglio sottolineare e come in uno

stesso periodo, quando le strutture essenziali sembrano ben codificate, la lettura degli

autori puo offrire prospettive assai ricche.

18

Capitolo 2

Qualche considerazionepreliminare sulla matematicagreca

Come il titolo indica, non pretendo in questo capitolo di esporre, e neppure

di abbozzare, una storia della matematica greca. Mi limito a delinearne

alcuni aspetti, che avranno particolare importanza nel ‘recupero’ della ma-

tematica greca a partire dal Rinascimento, senza pretendere, neppure in

questo caso, di esaurire l’argomento. Su alcuni aspetti passo molto rapi-

damente, poiche si tratta di cose ben note.1 Mi soffermo invece su alcune

particolarita alle quali si da abitualmente meno rilievo.

L’idea del ‘miracolo greco’ e un po’ invecchiata.2 Tuttavia nella nostra

cultura alcuni caratteri fondamentali della scienza greca, e in particolare

1Si veda per esempio [Kline, 1991, vol. 1, capitoli III-VIII]. In questa prima stesura

la bibliografia e ridotta al minimo.2Un esempio di questo tipo di considerazione per la scienza greca si trova nella storia

della matematica, per altri aspetti notevole, di Loria [1950]. La difficolta ad accogliere

strutture dimostrative diverse rispetto all’ideale greco spiega anche le difficolta ed il

ritardo con le quali valutiamo le opere matematiche di altre civilta. Si veda, ad esempio,

[Chemla e Shuchun, 2004].

19

della matematica greca, continuano ad avere un ruolo rilevante. Alcuni di

questi caratteri che abbiamo ereditato dai greci, infatti, sono ancora presenti

(e operativi), spesso anche in modo inconsapevole, nel nostro modo di agire

all’interno di una teoria scientifica o nelle applicazioni della teoria stessa.

2.1 Le caratteristiche di una teoria

matematica: gli Elementi di Euclide

Ancora oggi la struttura degli Elementi di Euclide si pone come modello

per esporre una teoria scientifica: assiomi, postulati, teoremi, corollari ecc.

formano oggetto dell’insegnamento della geometria che viene impartito nella

scuola secondaria superiore e viene assunto come il modo stesso di fare

matematica.3 In questo insegnamento si sottolinea non tanto (o non solo)

il valore dei risultati, quanto la valenza strutturale. Non sempre pero ci si

sofferma a riflettere adeguatamente su alcune caratteristiche.

La separazione tra aritmetica e geometria, tramatematica ‘teorica’ e ‘pratica’

I libri VII-X degli Elementi contengono cio che si potrebbe definire l’inizio

della teoria dei numeri: numeri primi, proprieta dei numeri primi, il celebre

‘algoritmo di Euclide’, ecc. Ma questa aritmetica non ha alcuna valenza

pratica. Sono riflessioni, anche profonde, sulla struttura dei numeri: pari,

dispari, primi, quadrati, soluzioni di equazioni di secondo grado o biquadra-

tiche a coefficienti interi (per esprimerci in termini moderni...) Non vi sono

calcoli numerici e i numeri compaiono sempre in forma simbolica (aggregati

arbitrari di unita indicati con una lettera maiuscola). Ecco l’esempio di un

enunciato, che chiarisce questo aspetto:

Teorema 2.1 (VII.21) I numeri primi tra loro sono i piu piccoli tra quelli

che hanno lo stesso rapporto.

3L’algebra elementare, la trigonometria, il calcolo differenziale che sono anch’essi, in

varia misura, oggetti di insegnamento nella scuola secondaria superiore, sono presenta-

ti invece, per lo piu, in modo pratico-operativo. I valori teoretici vengono demandati

all’insegnamento geometrico.

20

I numeri dei quali si considera il rapporto sono indicati con A, B. Euclide

procede per assurdo4 e introduce due numeri C, D piu piccoli dei precedenti

e che abbiano lo stesso rapporto. Quindi “C misura A tante volte quante D

misura B”, ecc. Tutto procede in modo simbolico. Non viene offerto alcun

esempio numerico.

Nei libri I-VI dedicati alla geometria piana e nei libri XI-XIII dedicati

alla geometria solida non compare alcuna valenza numerica, alcuna misura.

Accanto alla aritmetica ed alla geometria per i greci sussistono la logi-

stica e la geometria pratica, come discipline separate, ed anche, in un certo

senso ‘inferiori’.5

Naturalmente negli Elementi si trovano anche dimostrate uguaglianze

di figure (noi diremmo oggi dell’estensione di figure). Ma vediamo su un

esempio come si dimostrano queste uguaglianze.

Teorema 2.2 (I.35) I parallelogrammi che sono sulla stessa base e tra le

stesse parallele sono uguali tra loro.

Figura 2.1: La Proposizione I.35 degli Elementi

Per ipotesi AD = EF, e quindi AE = DF. Dalla definizione di paralle-

logrammo, si ha che AB = CD,EB = FC. I triangoli ABE, DCF sono

uguali. Se si toglie da entrambi il triangolo DGE si ha che i quadrilateri

ABGD, FCGE sono uguali. Aggiungendo ad entrambi il triangolo BCG si

ottiene l’asserto. 2

4La predilezione greca per le dimostrazioni per assurdo meriterebbe un’ampia

trattazione. . .5La separazione che ancor oggi spesso si opera tra ‘matematica’ e ‘matematica

applicata’, con implicito un giudizio di valore, risente, forse, di questa antica tradizione.

21

Osservazione 2.1 Naturalmente questo tipo di argomentazione, per de-

composizione/sovrapposizione individuando parti uguali non e sempre pos-

sibile. Il metodo di esaustione (che vedremo) e assai piu sosfisticato. Si

noti tuttavia la completa assenza di dati numerici o comunque di calcoli.

2.2 Dimostrare seguendo un percorso

rigoroso

Consideriamo la I.5 degli Elementi: “Gli angoli alla base di un triangolo

isoscele sono uguali”. Euclide dispone a questo punto solo del primo criterio

di uguaglianza: se due triangoli hanno uguali due lati e l’angolo compreso

sono uguali. Ecco la dimostrazione della I.5:

Figura 2.2: La Proposizione I.5 degli Elementi

AB si prolunga sino a D e AC sino ad E in modo che sia BD = CE. I

triangoli ADC e AEB sono uguali, per il primo criterio. Quindi CD = BE

e ADC = AEB. Allora anche i triangoli BDC e CEB sono uguali. Quindi

DBC = ECB. Allora anche gli angoli supplementari CBA e BCA sono

uguali. 2

22

Osservazione 2.2 La dimostrazione puo anche ottenersi, in modo assai

piu intuitivo con la bisettrice o con la mediana, o con l’altezza. Ma Euclide

a questo punto non ne ha ancora dimostrato l’esistenza. Euclide segue que-

sto percorso dimostrativo per mostrare come questo teorema richieda una

quantita minima di presupposti.6

2.3 Esporre solo la sintesi, non l’analisi

Nella I.1, Euclide dimostra l’esistenza di un triangolo equilatero, fornendone

una costruzione.

Figura 2.3: La Proposizione I.1 d’Euclide

L’idea dimostrativa e molto semplice. Ma da dove viene?

Supponiamo il problema risolto. Se immaginiamo che il triangolo equilatero

esista, sia ABC, sara CB = AB. E quindi C sta sul cerchio di raggio AB con

centro in B. Ancora CA = AB, e quindi C sta anche sul cerchio di centro

6Analoga osservazione si puo fare per la I.17: “In ogni triangolo la somma di due agoli

e sempre minore di due retti”. La dimostrazione non richiede il postulato delle parallele.

Da questo postulato, usato pero successivamente, il risultato segue immediatamente.

Proclo (cf. [Friedlein, 1873, 250.20-251.2]. Un’ottima traduzione italiana e [Proclo,

1978].) riferisce in merito alla tradizione che attribuisce questo risultato a Talete. Il

carattere agonico della cultura greca potrebbe suggerire qui una sorta di ‘tour de force’

da parte di Euclide. Su questo aspetto della cultura greca si puo vedere preliminarmente

[Zhmud, 2006] (si pensi a Temistocle insonne per la gloria di Milziade, come riferisce

Plutarco).

23

A ed ugual raggio AB. Qui termina l’analisi, piuttosto evidente. Ora inizia

la sintesi : basta costruire questi due cerchi e si trova C.7 Euclide non

espone la analisi. Si puo immaginare che sia per la ragione che, in questo

caso, questa analisi e evidente. Ma Euclide non espone l’analisi neppure

quando questa e tutt’altro che evidente. La forma degli Elementi e sempre

rigorosamente sintetica.

Osservazione 2.3 Questa forma espositiva ha creato un modello, che ha

affascinato alcuni tra i piu illustri scienziati, tra i quali, come vedremo,

Newton. Mentre ha suscitato forti reazioni negative in altri, come Descar-

tes.

Un esempio meno evidente

Nella II.11, Euclide insegna a costruire la parte aurea di un segmento. Mi

limito ad indicare la costruzione ed a fornirne una demostrazione algebrica

(corrispondente alla costruzione di Euclide).

Figura 2.4: La parte aurea di un segmento

Si tratta di individuare sul segmento AB il punto H tale che AH2 =

AB × HB. Si considera il quadrato ABCD. Sia AB = a e sia E il punto

7I rilievi critici in merito all’esistenza della intersezione risalgono all’antichita.

Euclide assume quest’esistenza come un fatto evidente.

24

medio di AC. Allora EB = a√52. Se EF = EB come in figura, si ha

AF = a

√5

2−a

2.

Posto AH = AF si verifica facilmente che il segmento AH fornisce la

soluzione richiesta.8 2

Consideriamo ora la IV.10, che richiede una costruzione.

Teorema 2.3 (Prop. IV.10) Costruire un triangolo isoscele avente cia-

scuno dei due angoli alla base che sia il doppio dell’angolo rimanente.

Euclide da la costruzione e dimostra che quanto costruito e una soluzione.

Ma non espone l’analisi, che potrebbe essere la seguente.9

Figura 2.5: Il lato del decagono regolare

Sia ABD il triangolo isoscele richiesto, per il quale dunque ADB =

2CAD, e si tracci la bisettrice CD dell’angolo ADB. Dunque per ipotesi

CAD = CDA e quindi AC = CD. Ma, come si vede immediatamente,

DCB = ADB e, ancora per ipotesi ADB = ABD. Quindi DCB = DBC

e quindi DC = DB. Si osservi ora che BAD e BDC sono uguali e quindi

DB e tangente al cerchio per i punti A,C,D, e quindi AB × CB = BD2 =

CD2 = AC2. Se si suppone dato il segmento AB, dalla II.11, segue che il

8In termini algebrici: posto AH = x, l’equazione che individua H e x2 = a(a− x), la

quale ha una sola radice positiva data appunto da x = a√52

− a2.

9Questa analisi e esposta da Heath, nel suo commento alla Proposizione. Si veda

[Euclid, 1956, vol. 2, pp. 99-100].

25

punto C e dato. Ma anche il cerchio di centro A e raggio AB e dato. Poiche

BD = AC anche il punto D e dato. Si tratta ora semplicemente di eseguire

la costruzione. 2

2.4 Ancora sul metodo dell’analisi

Un esempio interessante, assai piu elaborato, di analisi e data dalla Propo-

sizione IV.4 delle Collezioni di Pappo.10

Figura 2.6: Una proposizione di Pappo. 1

Con riferimento alla Figura 2.6, si tratta di dimostrare questo: P e un

punto sul prolungamento del diametro BC del cerchio ABC di centro O. PA

e tangente al cerchio. H e un punto diametralmente opposto ad A e PQR

e una secante arbitraria che interseca il cerchio in Q e R. I segmenti HQ,

HR intersecano il diametro in M, N. Cio posto, O risulta essere il punto

medio del segmento MN.

La dimostrazione di Pappo, e stata descritta come un modello del meto-

do dell’analisi da Hintikka e Remes [1974, Capitolo 3] e procede interamente

per via geometrica. In cio che segue tengo conto naturalmente sia del testo

di Pappo che della loro analisi.11

10Cf. [Pappus, 1982, pp. 140-142].11I principali testi greci contenti riflessioni sull’analisi e la sintesi sono considerati in

[Panza, 1997].

26

Supponiamo dunque che O sia il punto medi di MN e si tracci la retta

RS parallela aMN, e sia T il punto di intersezione di RS con AH. Allora T

e il punto medio del segmento RS (se e solo O e punto medio di MN).


Si tracci ora il segmento di perpendicolare OU da O sulla retta PQ e si

congiunga U con T .


Evidentemente QU = UR e dunque UT ∥ SQ. Ne segue che RUT =

UQS = RQH = RAH = RAT e quindi i punti A,U, T, R sono conciclici.

27


Abbiamo allora AUR = ATR (sono angoli che insistono entrambi sull’arco

AR). Ma ATR = AOP (per il parallelismo di TR e OP) e quindi anche

AUR = AUP = AOP. Dall’analisi segue quindi che anche i punti A,U,O, P

sono su uno stesso cerchio.


Ma questo e vero perche UOP,AOP sono due triangoli rettangoli aventi

la stessa ipotenusa OP. Nel processo deduttivo ogni passo e invertibile, e

quindi dalla proprieta vera evidenziata come conclusione si puo retrocedere

verso l’enunciato iniziale. Ecco in dettaglio in cosa consistono gli elementi

la dimostrativi.12

12Riproduco molto semplificata l’analisi di Hintikka e Remes.

28

a) Vengono tracciate delle linee ausiliarie (utilizzando il parallelismo e la

perpendicolarita) che determinano altri punti (RS, EN, N, T);

b) si applica Elementi, VI.2;

c) si applica Elementi, III.3;

d) si applica la Elementi, III.21;

e) si applica la reciproca di Elementi, III.21;

f) si applica Elementi, III.20.

Si noti che in questa dimostrazione tutti i passi sono invertibili. Ma questo

rappresenta in genere piu un ideale dimostrativo che il vero procedere delle

dimostrazioni matematiche.

2.5 L’algebra e la matematica greca

Il problema della ‘algebra geometrica’ e stato oggetto di un ampio dibattito

negli ultimi anni. Alcune proposizioni degli Elementi, in particolare quelle

del libro II, sembrano suggerire in modo naturale un’interpretazione alge-

brica, anche se la loro dimostrazione e rigorosamente geometrica. Inoltre

l’uso di queste stesse proposizioni in contesti piu elaborati (ad esempio nelle

Coniche di Apollonio) non sembra dissimile da quello che si effettua con le

usuali manipolazioni algebriche. Si e anche avanzata l’ipotesi che i greci

avessero un’algebra che, per qualche ragione, hanno preferito tenere nasco-

sta (forse considerando l’algebra come una sorta di analisi: uno strumento

di indagine, ma non uno strumento espositivo). Piu cautamente, Zeuthen

ha suggerito che, accostando al libro secondo degli Elementi una rilettu-

ra algebrica, molti testi matematici greci assai piu elaborati e complessi,

divengono piu trasparenti. Siamo cosı in grado di coglierne piu sempli-

cemente la ‘struttura’. L’anacronismo e un pericolo evidente...Ma d’altro

canto, il rifiuto di ogni supporto algebrico rende la comprensione di questi

testi accessibile solo a pochi specialisti.13

13Una fiera opposizione all’uso dell’algebra per leggere i testi greci si trova in [Unguru,

1975]. Si tratta di un articolo che ha originato un’aspra polemica. Per valutare lo ‘stato

29

Ecco un esempio. La II.7: se C e un punto arbitrario del segmento

AB, il quadrato su AB e quello su BC sono uguali a due volte il rettangolo

AB× BC e il quadrato di CA. In termini piu accessibili:

AB2 + BC2 = 2AB× BC+AC2.

Posto AB = a,AC = x si ha (per sempio: si possono anche scegliere le

indeterminate in altro modo)

a2 + (a− x)2 = 2a(a− x) + x2. (2.1)

La trascrizione algebrica elimina la necessita della dimostrazione. Essa dun-

que non puo corrispondere all’idea di Euclide. Diversa cosa e pero, una

volta compiuta la dimostrazione, associarvi la formulazione algebrica (2.1)

per avere un modo facile per ricordarla e riutilizzarla.

Un esempio di applicazione ‘algebrico’

La II.13 degli Elementi esprime la proprieta che in molti manuali viene

descritta come ‘teorema di Carnot’ (nel caso particolare dell’angolo acuto).

dell’arte’ attuale (soprattutto dal punto di vista di Unguru) si puo vedere [Christianidis,

2004].

30

Con riferimento alla figura (ove AD ⊥ BC e B < π2) si tratta di

dimostrare (in termini moderni. . . ) che

AC2 = CB2 +AB2 − 2CB× BD. (2.2)

Dalla II.8 si ha che CB2 + BD2 = 2BC × BD + CD2. Si aggiunge AD2 da

ambo le parti:

CB2 + BD2 +AD2 = 2BC× BD+ CD2 +AD2.

Ma dalla I.47 (teorema di Pitagora) si ha che BD2 +AD2 = AB2 e CD2 +

AD2 = AC2. Sostituendo, si ha CB2 + AB2 = 2BC × BD + AC2. Traspo-

nendo il termine 2BC× BD si ottiene la (2.2).

Osservazione 2.4 Si noti che la II.8 viene utilizzata senza alcuna figura

ausiliria, come una identita da utilizzarsi all’interno di una dimostrazione.14

2.6 Occorre evitare l’anacronismo

La celebre dimostrazione dell’irrazionalita del rapporto tra la diagonale ed

il lato di un quadrato, alla quale Aristotele fa allusione, dovrebbe essere non

molto dissimile da quella esposta da Alessandro d’Afrodisia.15 La riformulo

con un minimo di strumenti algebrici.

14Tuttavia l’uso che ho fatto di notazioni semi-algebriche diverse da quelle degli

Elementi influisce non poco sul carattere della dimostrazione . . .15Cf. la nota di Vitrac: [Euclide, 2001, vol. 3, pp. 411-417]. Si vedano anche [Knorr,

1975; Stillwell, 2002].

31

Sia dato il quadrato ABCD. Il quadrato costruito sulla sua diagonale

BDB ′D ′ e evidentemente doppio del quadrato ABCD. Sia mn

il rapporto

tra la diagonale BD ed il lato AB, con m e n privi di divisori comuni. Si

ha allora

m2 = 2n2. (2.3)

Ne consegue che m deve essere pari. Sia dunque m = 2h. Sostituendo nella

(2.3) si ha

4h2 = 2n2, ossia 2h2 = n2. (2.4)

Anche n deve essere pari. La contraddizione si puo rimuovere solo esclu-

dendo che il rapporto tra BD e AB sia espresso da una frazione come mn.

2

A partire da quest’idea si puo facilmente mostrare che ogni x ∈ N che

non sia un quadrato e tale che√x non e un numero razionale.

Sia mn= x e consideriamo le scomposizioni in fattori primi di m, n e x.

Sia m = pα1

1 pα2

2 · · ·pαi

i , n = qβ1

1 qβ2

2 · · ·qβj

j , x = rγ11 rγ22 · · · rγkk . Dove almeno

uno degli esponenti γ (ad esempio γ1) deve essere dispari. Da m2 = xn2

otteniamo

p2α1

1 p2α2

2 · · ·p2αi

i = rγ11 rγ22 · · · rγkk · q2β1

1 q2β2

2 · · ·q2βj

j . (2.5)

Nel membro a destra della (2.5) r1 compare con un esponente dispari, mentre

nel membro a sinistra deve comparire con un esponente pari. Ancora una

volta abbiamo un assurdo.

Per attribuire compiutamente questa dimostrazione alla matematica gre-

ca dobbiamo pero pensare che gia in essa sia stata dimostrata la unicita della

32

decomposizione di ogni intero in fattori primi. Un anacronismo evidente.

Questo risultato sara dimostrato solo molti secoli dopo da Gauss [1801].16

2.7 Ma non bisogna enfatizzare le differenze

Si consideri la celebre proposizione IX.20:

Teorema 2.4 (Prop. IX.20) I numeri primi sono piu numerosi di ogni

moltitudine di numeri primi proposta.

Ecco la dimostrazione di Euclide. I numeri primi proposti siano solamente

A,B,C. Si consideri il prodotto ABC (“il piu piccolo numero misurato

da A,B,C”) e si aggiunga l’unita. Sia N = ABC + 1. Se N e primo

abbiamo i numeri primi A,B,C,N piu numerosi dei precedenti. Se N non

e primo sara misurato da un numero primo G. Non e possibile che G

sia uno dei primi proposti A,B,C. Se infatti lo fosse dovrebbe dividere

contemporaneamente il prodotto ABC e il numero N e quindi anche la

differenza N − ABC = 1. Ma questo e impossibile. Allora abbiamo i

numeri primi A,B,C,G in numero maggiore di A,B,C. 2

Il linguaggio di Euclide e certo diverso da quello di oggi. Ma sembra

difficile negare che qui vi sia una ‘idea’ formulata una volta per tutte.

La proposizione riformulata con p1, p2, . . . pn e N = p1 · p2 · · ·pn +

1, non sembra divenire molto diversa. Naturalmente questo non significa

voler trascurare il vantaggio di un simbolismo adeguato. In questo caso un

simbolismo piu elaborato sembra ininfluente.

16Nel Teeteto di Platone (147d -148b) si trova pero un’argomentazione che, assumendo

implicitamente l’unicita della decomposizione, corrisponde alla stessa idea. Nella VII.30

e VII.31 degli Elementi si trovano gli strumenti per dimostrare l’esistenza e l’unicita della

decomposizione. Ma di fatto il risultato non e formulato.

33

2.8 La tangente ad una curva nell’antichita:

Apollonio

Le Coniche17 di Apollonio meriterebbero uno studio approfondito, soprat-

tutto per non ridurre ogni considerazione sulla matematica greca ai ‘fonda-

menti’, come se i matematici greci non avessero altro scopo nel loro operare

che porre su salde basi risultati assai semplici.

Un altro grande autore che puo allontanarci definitivamente da que-

st’idea e Archimede, del quale vedremoun risultato nella prossima sezione.

Ecco ora come Apollonio nella I.33 caratterizza la tangente alla parabola.

Figura 2.11: La tangente alla parabola

Con riferimento alla Figura 2.11 sia VX un diametro della parabola e

siano VX e XY l’ascissa e l’ordinata di uno dei suoi punti. Se la retta TY e

tale che VT = VX allora questa retta e tangente alla parabola.18

Supponiamo per assurdo che la retta TY prolungata tagli Y ′X ′ in Z.

Dalla proprieta definitoria della parabola, abbiamo

VX : VX ′ = XY2 : X ′Y ′2.

17Per il testo dei primi quattro libri si puo utilizzare la traduzione francese [Apollo-

nius, 1923]. I libri IV-VII sono disponibili in inglese [Apollonius, 1990]. E in corso di

elaborazione una nuova fondamentale edizione. Per ora si ha solo [Apollonius, 2008a],

[Apollonius, 2008b]. Il testo di Commandino si trova anche in rete. Testi introduttivi

molto importanti sono [Heath, 1896] e soprattutto [Zeuthen, 1886].18Cf. [Apollonius, 1923, pp. 60-61].

34

Dalla similitudine dei triagoli TXY, TX ′Z si ha anche

TX2 : TX ′2 = XY2 : X ′Z2.

Poiche X ′Z < X ′Y ′, abbiamo

VX

VX ′ <TX2

TX ′2 .

Per proseguire l’argomentazione con piu chiarezza utilizzo il simbolismo

algebrico, anche se, naturalmente, questi simboli non si trovano in Apol-

lonio. Questa ‘traduzione’ non altera (a mio giudizio) in modo essenziale

l’argomento.19 Sia VX = x, VX ′ = y. Allora TX = 2x e TX ′ = x+ y. Si ha:

x

y<

4x2

(x+ y)2

ossia

(x+ y)2 < 4xy

e di conseguenza

(x− y)2 < 0.

Abbiamo trovato una conseguenza assurda. E facile notare che il concetto

di tangente utilizzato da Apollonio e lo stesso di quello utilizzato da Euclide

(nel libro III).20

2.9 Un cenno al calcolo del volume della

sfera di Archimede

Concludo questo capitolo con un breve cenno ad un risultato di Archimede:

il calcolo del volume della sfera. Il testo di Archimede al quale faccio riferi-

19Per una fiera opposizione a questo atteggiamento disinvolto si puo vedere [Fried e

Unguru, 2001].20Ecco quanto afferma Lagrange: “Suivant les anciens geometres, une ligne droite est

tangente d’une courbe, lorsque ayant un point commune avec la courbe, on ne peut mener

par ce point aucune droite entre elle et la courbe. ([Lagrange, 1847, p. 167])”. L’idea di

considerare una tangente come una secante che abbia i punti di intersezione coincidenti

e attribuita da Lagrange a una fase ben successiva, quando: “ . . . par l’application de

l’algebre a la geometrie, les courbes ont ete soumises a l’analyse (ibid.)”.

35

mento e la famosa Lettera ad Eratostene21 e precisamente la Proposizione

2. Procedo in modo molto libero, utilizzando strumenti algebrici.

Consideriamo la figura seguente.

Figura 2.12: Archimede ed il volume della sfera

Nella figura 2.12 sono rappresentate le sezioni di una sfera, di un cilindro

e di un cono. . . Archimede naturalmente non fa uso di strumenti algebrici,

ma l’originalita del suo procedimento e tale da non venire modificata se

anche ci concediamo questa licenza.

Poniamo AX = x e AB = AH = 2r. L’area del cerchio di raggio XY

(sezione del cono) e V = πx2. L’area del cerchio di raggio XZ (sezione della

sfera) e S = πx(2r− x). L’area della sezione del cilindro e C = π4r2. Si ha

allora:

V + S = 2πrx,V + SC

=x

2r. (2.6)

21Si veda [Archimede, 1974, pp. 556-610].

36

Immaginiamo una bilancia con il fulcro in A e i due bracci AX e AH.

Dalla 2.6, abbiamo

Cx = 2(V + S)r. (2.7)

Possiamo ‘bilanciare’ il peso di 2(V + S) posto in H con il peso di C posto

in X. Allora, immaginando di bilanciare tutte le infinite sezioni della sfera:

Vol(V) + Vol(S) = Vol(C)2

Ma Vol(V) = 13V(C) e quindi

Vol(S) = 1

6Vol(C).

Evidentemente Vol(C) = 8πr3, e quindi Vol(S) = 43πr3 il celeberrimo

risultato di Archimede.

37

Capitolo 3

Il metodo geometrico e leCollezioni di Pappo

Anche se sono proprio le opere della matematica greca, in particolare gli

Elementi, che si presentano ai nostri occhi con i caratteri di una teoria scien-

tifica compiuta, le discussioni in merito al carattere ed alla struttura di una

teoria scientifica nella cultura greca non sono opera dei matematici. Esse

sono patrimonio dei filosofi, in primis di Platone ed Aristotele. Vi e dunque

una ‘filosofia della matematica’ all’interno della quale si danno riflessioni

anche profonde e tecnicamente aggiornate. Tuttavia il carattere ‘esterno’

di questa discussione non consente di dirimere questioni importanti. In che

misura, per esempio, gli Elementi corrispondano ai dettami degli Analitici

Secondi di Aristotele o si inquadrino all’interno della filosofia platonica e,

da sempre, oggetto di discussione.

E solo nella tarda antichita con Pappo (attivo intorno al 320) che si da

una riflessione sul metodo matematico e sulla struttura della disciplina per

opera di un matematico.1

1Un testo che puo considerarsi di filosofia della matematica, ma fortemente connes-

so alla disciplina e dato dal Commento al primo libro degli Elementi del filosofo neo-

platonico Proclo (412-485) (si veda la nota 6). Questo testo ha avuto molta importanza

39

Il testo di Pappo, tradotto dal Commandino in latino nell’era moderna

(1589) ha suscitato un grande interesse tra i piu grandi matematici del Sei-

cento fornendo loro lo spunto per profonde riflessioni sul metodo da impiega-

re nelle dimostrazioni matematiche e nella loro esposizione; sugli strumenti

dimostrativi leciti; sul giusto rapporto da istituire con la matematica clas-

sica e con l’algebra, disciplina originariamente inventata dagli arabi e poi

profondamente trasformata nel Rinascimento italiano e, a fine Cinquecento,

ulteriormente potenziata da Francois Viete e dalla sua scuola.2

Agli algebristi italiani del Rinascimento si debbono le formule risolutive

per l’equazione di terzo e quarto grado: formule tuttavia che, in alcuni casi3

utilizzavano in maniera ‘spregiudicata’ nuove entita numeriche, i numeri

complessi.

Due dei problemi classici dell’antichita, la duplicazione del cubo4 e la

trisezione dell’angolo, formulati in termini algebrici, conducono ad equazioni

di terzo grado. Gia nell’antichita si presagiva il fatto che questi problemi

non fossero risolubili con riga e compasso (anche se una dimostrazione non

era possibile con gli strumenti disponibili) e si erano proposte soluzioni

mediante il potenziamento della struttura deduttiva degli Elementi, con

tecniche che vedremo in dettaglio (intersezione di coniche o l’inserzione).

Molte di queste soluzioni sono presentate nelle Collezioni di Pappo. Si

comprende bene quindi come il confronto tra quanto esposto da Pappo e le

dimostrazioni algebriche dovesse costituire un tema di ricerca del piu grande

interesse. Di qui l’importanza di questo autore nel recupero seicentesco. Per

nel dibattito sulla natura della matematica (De certitudine mathematicarum) suscitato

dal Piccolomini tra Cinquecento e Seicento. E un dibattito, tuttavia, che riguarda piu

la natura delle verita matematiche in rapporto alle verita filosofiche che la matematica

in quanto tale. Si discute amapiamente, ad esempio sulla ‘demonstratio potissima’.

Si puo vedere [De Pace, 1993], [Freguglia, 1999] e l’Introduzione di L. Maieru a

[Barozzi, 1586].2Sull’origine dell’algebra si puo vedere l’Introduzione di R. Rashed a [Al-Khwarizmı,

2007].3Nel caso di un’equazione di terzo grado avente tre radici reali, la formula di Cardano

contiene delle quantita complesse e le soluzioni reali si ottengono come somma di numeri

complessi coniugati. Un metodo risolutivo che, in assenza di una idea precisa sulla natura

dei numeri complessi non poteva che destare gravi interrogativi.4Piu in generale l’inserzione di due medie proporzionali tra due quantita date.

40

questa ragione qui di seguito si da un cenno di alcuni dei contenuti delle

Collezioni.

3.1 L’inserzione di due medie

proporzionali: intersezione di coniche

Ecco l’inizio del Libro III delle Collezioni di Pappo, dove accanto ai proble-

mi piani (risolubili con riga e compasso) viene presentata l’esistenza di altri

problemi (pur in assenza di un criterio dimostrativo che delimiti le classi:

di fatto certi problemi erano stati risolti con altri mezzi piu potenti.5

Gli Antichi hanno distinto i problemi geometrici in tre generi: i

problemi piani, i problemi solidi ed i problemi lineari [. . . ] Re-

sta il terzo genere di problemi detti lineari perche oltre alle linee

gia dette [rette, circonferenze e coniche] ne ammettono altre per

la loro costruzione delle quali l’origine e piu varia e comples-

sa, come [le spirali], le quadratrici, le concoidi e le cissoidi che

possiedono proprieta numerose e stupefacenti.6

Un tipo importante di problema solido e dato dalla inserzione di due

medie proporzionali tra due grandezze date.

Problema 3.1 Dati due segmenti a, b si debbono determinare due segmen-

ti x e y, tali che

a : x = x : y = y : b. (3.1)

Utilizando liberamente gli strumenti algebrici, la (3.1) si puo riscrivere come{ay = x2

bx = y2(3.2)

di modo che una prima soluzione puo consistere nel determinare il punto di

intersezione di due parabole.

5Per molti degli argomenti trattati in questo capitolo un utile riferimento e dato da

[Bos, 2001]. Si veda anche il mio saggio-recensione di questo testo [Galuzzi, 2001b].6Cf. [Pappus, 1982, vol. 1, p. 21].

41

Si dice che Menecmo abbia trovato questa soluzione la quale, per essere

giudicata soddisfacente, richiede di ammettere che si possano tracciare due

sezioni coniche (cosı come si puo fare per i cerchi). O, alternativamente,

che il punto P abbia in se qualche particolarita in piu di quella di essere

l’intersezione di due parabole.7

Ovviamente, dalla (3.2) abbiamo, eliminando y, x3 = a2b, sicche per

noi e evidente che il segmento OP ′ non puo essere determinato, in generale,

con riga e compasso. In particolare, per a = 1, b = 2 si ha l’equazione

irriducibile x3 − 2 = 0 corrispondente alla duplicazione del cubo.8

3.2 La νεÜσις: l’inserzione di due medie

proporzionali

Una costruzione ideata per superare il vincolo imposto (probabilmente)

dall’uso della riga e del compasso e la νεÜσις, l’inclinazione. Nel caso piu

semplice si tratta di accettare come lecita questa costruzione.

7In effetti le parabole sono in posizione particolare. A priori si potrebbe immaginare

che questa particolarita abbia un ruolo essenziale. . .8Per assurdo, se x3−2 = 0 fosse riducibile, dovrebbe essere x3−2 = (x−a)(x2+px+q)

e quindi dovrebbe esistere un numero razionale mn

tale che m3 = 2n3, e si puo procedere

in modo simile a quanto visto per√2.

42

Figura 3.1: L’inclinazione

Sono date due semirette a, b aventi l’origine O in comune. Sono dati

anche un segmento HK (in lunghezza) ed un punto P non appartenente

alle semirette (si veda la Figura 3.3). Si richiede di poter ‘inclinare’ una

semiretta per P in modo che le intersezioniH ′, K ′ con a, b diano un segmento

di lunghezza uguale a quella di HK.

La possibilita di disporre di questa costruzione consente di risolvere il

problema di inserire due segmenti medi proporzionali tra due segmenti dati.

Ecco la soluzione di Erone.9

9Cf. [Pappus, 1982, vol. 1, pp. 45-47].

43

Figura 3.2: La soluzione di Erone

Iniziamo con l’illustrare la figura. Nel rettangolo ABCD, si ha

BC = AD = a,AB = DC = b.

L e il punto medio di AB ed E e il punto medio di BC. Il punto H e

l’intersezione di DL e CB. Sulla perpendicolare EZ a BC si determina Z in

modo che sia CZ = AL.

TracciataHZ, sia CT parallela aHZ. Ecco ora ove interviene l’inclinazione:

ZK deve essere tracciata in modo che sia TK = AL.

Vediamo ora, on l’aiuto di un po’ di algebra, come procede la dimostra-

zione.10 Sia BC = a,AB = b,AM = x,CK = y. Abbiamo allora:

EK2 = (a+ y)y+a2

4,

EZ2 =b2

4−a2

4,

KZ2 = EK2 + EZ2 = (a+ y)y+b2

4,

HK = 2a+ y,

HK : CK = KZ : ZT ⇒ HK2 : CK2 = KZ2 : TK2.10Questa riscrittura algebrica non altera (ma e la mia opinione) la struttura

dimostrativa. La dimostrazione originale si trova nelle pagine citate nella Nota 9.

44

Quindi, sostituendo, si ottiene:

(2a+ y)2 : y2 =

[(a+ y)y+

b2

4

]:b2

4. (3.3)

Dalla (3.3), semplificando ed eliminando il fattore a+y si ottiene ab2 = y3

e quindi, dalla similitudine dei triangoli ACK, MAD si ottiene x3 = a2b.

3.3 La νεÜσις: la trisezione dell’angolo

Utilizzando questa costruzione e possibile anche effettuare la trisezione

dell’angolo. Vediamo dapprima il contenuto della Proposizione 31 del quar-

to libro delle Collezioni che collega l’inserzione all’intersezione di coniche.11

Figura 3.3: Un altro uso dell’inclinazione

ABCD e un rettangolo dato. E anche dato in lunghezza un segmento

(di lunghezza c). Dal vertice A si vuol condurre una semiretta in modo che

detto F il punto nel quale questa semiretta incontra il prolungamento di BC

dalla parte di C ed E l’intersezione di AF con il lato DC sia EF un segmento

di lunghezza assegnata.

Si immagini il problema risolto e sia DH uguale ad EF e parallelo a

questo segmento. Se il punto F e dato, anche H e dato e viceversa. Si noti

11Cf. [Pappus, 1982, vol. 1, pp. 210-211]. In realta si utilizza una conica ed un

cerchio: una differenza poco sensibile per noi, ma essenziale per i greci ed ancora nel

Seicento.

45

che H sta su un cerchio di raggio assegnato, poiche EF e dato in grandezza

(EF = c). Dalla I.43 degli Elementi si ha ABCD = AKLM, e dunque

BC×AB = KL× LM. Ma KL = BF e LM = FH. Quindi

BC×AB = BF× FH.

Il punto H appartiene allora ad un’iperbole (equilatera) di asintoti BC e AB.

Il punto H e determinato dall’intersezione di quest’iperbole con il cerchio

di centro D e raggio c. Qui termina l’analisi di Pappo. Nella sintesi viene

affermato che il punto G si trova sull’intersezione delle due curve.

Vediamo ora, con la Proposizione 32, come si possa trisecare un angolo.12

Figura 3.4: La trisezione dell’angolo

Sia ACB l’angolo dato e si conduca dal punto A di un suo lato la per-

pendicolare AB sull’altro lato. Si completi il rettangolo ABCD come nella

Figura 3.4. Si operi ora un’inclinazione: dal vertice C si tracci una semi-

retta in modo che il segmento FG della Figura 3.4 sia doppio del segmento

CA. Sia H il punto medio di FG.

I triangoli AGH e CHA sono evidentemente isosceli. Di conseguenza,

essendo AHC = 2AGH, si ha ACH = 2AGH. Poiche AG e parallela a BC,

si ha AGH = FCB Quindi FCB = 13ACB. 2

12Ibid., pp. 212-213.

46

Capitolo 4

La soluzione dell’equazione diterzo e quarto grado

4.1 Premessa

In questo capitolo presento la soluzione dell’equazione di terzo grado in ter-

mini moderni. La ragione sta nel fatto che per leggere i testi matematici

del Cinquecento, occorre un’adeguata preparazione filologica (non solo ma-

tematica) che non puo essere raggiunta in breve tempo. E, per comprendere

cio che segue, e importante impadronirsi della soluzione di quest’equazione.

Per mostrare le difficolta di una presentazione fedele ai testi, mi limito

ad un esempio tratto da Bombelli, un algebrista del tardo Cinquecento,

relativo all’equazione di secondo grado:

Quando si haveranno potenze e Tanti eguali a numero ci sono

due modi. Il primo e questo. Partasi ogni cosa per la quantita

delle potenze, poi si piglia la meta delli Tanti e si quadra ed il

produtto si aggionge al numero e della somma se ne piglia il lato

47

e di detto lato se ne cava la meta delli Tanti, e quello che restara

sara la valuta del Tanto.1

Bombelli stesso da un esempio

12︸︷︷︸ + 6 1︸︷︷︸ eguale a 16

...piglisi il mezzo delli Tanti, ch’e 3, quadrisi fa 9, giongasi a 16

fa 25 e di questo se ne piglia il lato che e 5 e di esso se ne cava

il mezzo delli Tanti, resta 2, et 2 vale il Tanto (ibidem).

Per comprendere la regola mettiamo a confronto la scrittura di Bombelli

12︸︷︷︸ + 6 1︸︷︷︸ eguale a 16.

con quella moderna

x2 + 6x = 16

Ecco i passi da compiere:

6 −→ 6/2 = 3

32 −→ 9

9, 16 −→ 9+ 16 = 25

25 −→ √25 = 5

5, 3 −→ 5− 3 = 2.

Il confronto con la semplicita con la quale si ottiene oggi l’unica soluzione

positiva dovrebbe risultare convincente.

x2 + 2ax = b −→ x =√a2 + b− a.

La soluzione dell’equazione di quarto grado con il metodo di Descartes

che vedremo in seguito e invece sostanzialmente fedele al testo originale.

1Cf. [Bombelli, 1966, p. 190]

48

4.2 La formula risolutiva dell’equazione di

terzo grado

Consideriamo un’equazione di terzo grado, che immaginiamo gia ridotta

alla forma2

x3 + px+ q = 0. (4.1)

Poniamo x = u+ v. Ne segue

x3 = (u+ v)3 = u3 + v3 + 3uv(u+ v) =

= u3 + v3 + 3uv · x,

e dunque

x3 − 3uvx−(u3 + v3

)= 0. (4.2)

Se ora le quantita u, v verificano il sistema{u3 + v3 = −q

uv = −p

3

, (4.3)

x = u + v e una soluzione della (4.1). Possiamo dunque ottenere una

soluzione della (4.1) ricercando le eventuali soluzioni del sistema (4.3).

Poniamo

z1 = u3, z2 = v

3 (4.4)

e consideriamo il sistema associato: z1 + z2 = −q

z1 z2 = −p3

27

.

Le soluzioni di questo sistema sono le radici z1 e z2 dell’equazione

z2 + q z−p3

27= 0. (4.5)

Supponiamo di avere ricavato i due valori z1, z2 soluzioni della (4.5).

Sia oraU una qualsiasi radice cubica di z1, ed indichiamola conU = 3√z1.

2Si veda [Cauchy, 1821, pp. 354-364].

49

Dalla (4.3) ricaviamo in corrispondenza il valore V = −p

3 3√z1

e dunque

otteniamo una soluzione dell’equazione (4.1) della forma

U+ V = 3√z1 −

p

3 3√z1. (4.6)

Ma dalla relazione V = −p

3 3√z1

si trae

V3 = −p3

27z1

e dunque V3 = z2. Quindi anche V e una radice cubica di z2. Possiamo

dunque scrivere la formula risolutiva

3

√−q

2+

√q2

4+p3

27+

3

√−q

2−

√q2

4+p3

27(4.7)

La quale va interpretata opportunamente: bisogna tener conto del fatto che

le due radici cubiche debbono essere tali che il loro prodotto dia −p3

27.

Posto quindi ω = cos 2π3+ i sin 2π

3, tutte le radici cubiche di z1 sono

date da U,ωU,ω2U e, analogamente le radici cubiche di z2 sono date da

V,ωV,ω2 V. Se V e scelta in modo tale che UV = −p3

27, abbiamo, per le tre

radici dell’equazione, le espressioni:

x1 = U+ V,

x2 = ωU+ω2V,

x3 = ω2U+ωV.

Ne consegue che tutte le radici sono esprimibili nella forma (4.7), con le

convenzioni poste.

Esempio 4.1 Consideriamo l’equazione

z3 − z− 1 = 0,

50

dove p = −1, q = −1. L’equazione ha una sola radice reale (≃ 1.32471 . . . ).La formula risolutiva da

3

√1

2+

√1

4−1

27+

3

√1

2−

√1

4−1

27.

Eseguendo i calcoli si trova il valore della radice.

Ecco un secondo esempio


z3 + z− 2 = 0,

che ha evidentemente la radice z=1. Abbiamo ora p = 1, q = −2. Dobbia-

mo estrarre la radice cubica di 1+ 29

√21 e di 1− 2

9

√21. Si ha(

1

2± 1

6

√21

)3= 1± 2

9

√21

Abbiamo allora, per la radice reale dell’equazione

1

2+1

6

√21+

1

2−1

6

√21 = 1.

Sia ω = cos 2π3

+i sin 2π3

= − 12+ 1

2i√3 . Allora ω2 =

(−12+ 1

2i√3)2

=

−12− 1

2i√3.

Abbiamo per le altre due radici

ωU+ω2V =

(−1

2+1

2i√3

)(1

2+1

6

√21

)+(

−1

2−1

2i√3

)(1

2−1

6

√21

)=

= −1

2+1

2i√7,

e

ω2U+ωV =

(−1

2−1

2i√3

)(1

2+1

6

√21

)+(

−1

2+1

2i√3

)(1

2−1

6

√21

)=

51

= −1

2−1

2i√7. �

Esaminiamo ora l’equazione (4.5), e supponiamo che il suo discriminante

∆ = q2 + 4p3

27

sia strettamente positivo. z1 e z2 sono allora due numeri reali distinti e

possiamo scegliere U e V come le radici cubiche reali di z1 e z2. Ne segue

che U+V e un numero reale; ma ωU+ω2V e ω2U+ωV sono sicuramente

numeri complessi, poiche si ha

ωU+ω2V =

(−1

2+1

2i√3

)U+

(−1

2−1

2i√3

)V =

−1

2(U+ V) +

1

2i√3 (U− V)

e

ω2U+ωV =

(−1

2−1

2i√3

)U+

(−1

2+1

2i√3

)V =

−1

2(U+ V) −

1

2i√3 (U− V)

Se invece ∆ = 0, abbiamo la radice 2U, e la radice doppia −U, come si

verifica facilmente.

Sia ora invece

∆ =q2

4+p3

27< 0

(il che impone, ovviamente, che p sia negativo).

Poniamo le due radici complesse (e coniugate) della (4.5) in forma tri-

gonometrica, ossia nella forma ρ (cos θ± i sin θ) . Ne segue che ρ2 = −p3

27.

Utilizzando la (4.6) possiamo scrivere le tre radici nella forma

ρ1/3(cos

θ

3+ i sin

θ

3

)3√1

−p

3

1

ρ1/3(cos θ

3+ i sin θ

3

)3√1=

52

ρ1/3(cos

θ

3+ i sin

θ

3

)3√1+

ρ2/31

ρ1/3(cos θ

3+ i sin θ

3

)3√1=

ρ1/3[(

cosθ

3+ i sin

θ

3

)3√1+

(cos

θ

3− i sin

θ

3

)13√1

].

Sostituendo a 3√1 i suoi tre valori

1, cos2π

3+ i sin

2π

3, cos

4π

3+ i sin

4π

3

otteniamo, per le radici i valori

2ρ1/3 cosθ

3, 2ρ1/3 cos

θ+ 2π

3, 2ρ1/3 cos

θ+ 4π

3.

Si osservi che i tre valori trovati sono tutti reali e tuttavia sono stati

trovati attraverso l’utilizzo dei numeri complessi. E il cosiddetto caso ir-

riducibile, per lungo tempo un argomento di disputa nella matematica a

partire dal Cinquecento.3


x3 − 7x+ 6 = 0.

Ad essa dobbiamo associare l’equazione

z2 + 6z+343

27= 0,

la quale ha le radici −3± 109i√3. Si ha ora

ρ =7

9

√21,

3Poiche la realta di tutte le radici e data da −q2

4− p3

27> 0, si assume questa quantita

come discriminante della equazione di terzo grado. Questa scelta corrisponde alla defi-

nizione abituale del discriminante tramite il risultante tra il polinomio ed il polinomio

derivato. Sulla storia del caso irriducibile si puo vedere [Cossali, 1996].

53

e

cos θ =−379

√21

= −9

49

√21,

sin θ =109

√3

79

√21

=10

49

√7.

Questo implica θ3= π

3− 1

3arccos

(949

√21)

Dunque una prima soluzione e data da

23

√7

9

√21 cos

(π

3−1

3arccos

(9

49

√21

))= 2

e le altre soluzioni sono date da

23

√7

9

√21 cos

(π

3−1

3arccos

(9

49

√21

)+2π

3

)= −3,

23

√7

9

√21 cos

(π

3−1

3arccos

(9

49

√21

)+4π

3

)= 1.

4.3 Descartes e l’equazione di quarto grado

Nel terzo libro della Geometrie Descartes vuol dimostrare che un proble-

ma classico che conduce ad un’equazione di quarto grado irriducibile puo

tuttavia essere risolto con riga e compasso. Per far questo egli associa

all’equazione data una risolvente di terzo grado, utilizzando una radice del-

la quale le soluzioni dell’equazione originale si possono ottenere risolvendo

due equazioni di secondo grado.

Poiche la risolvente puo essere associata ad un’equazione qualsiasi, in

realta il procedimento di Descartes permette di ricondurre la soluzione di

un’equazione di quarto grado alla soluzione dell’equazione di terzo grado e

cosı e sempre stato interpretato (a partire da Newton), anche se l’intenzione

di Descartes era diversa.

Consideriamo un’equazione di quarto grado della forma

x4 + px2 + qx+ r = 0, (4.8)

54

e chiediamoci se sia possibile scrivere

x4 + px2 + qx+ r = (x2 + αx+ β)(x2 − αx+ γ).

Otteniamo il sistema: β+ γ = p+ α2

β− γ = −q

αβγ = r

Dalle prime due:

β =α3 + pα− q

2α, γ =

α3 + pα+ q

2α.

Tenendo conto dell’ultima:

α6 + 2pα4 + (p2 − 4r)α2 − q2 = 0. (4.9)

Abbiamo un’equazione di terzo grado in α2. Una soluzione di quest’equazione

consente di ottenere le soluzioni dell’equazione originale risolvendo due

equazioni di secondo grado.

In particolare, se immaginiamo che l’equazione (4.9) sia riducibile pos-

siamo ottenere α2 con al piu l’estrazione successiva di radicali quadratici e

questa proprieta si estende alle soluzioni di (4.8).

Descartes e il problema del quadrato

Supponiamo che il problema di inserzione considerato nella Sezione 3.3 si

riduca al caso particolare nel quale il rettangolo sia un quadrato.4

4Si veda [Descartes, 1954, pp. 180–192].

55

Figura 4.1: Il problema del quadrato

Sia a il lato del quadrato. Utilizzando il teorema di Pitagora, la pro-

porzionalita, e scegliendo l’incognita come in figura, si giunge rapidamente

all’equazione5

x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4 = 0. (4.10)

Se eliminiamo il termine in x3, sostituendo x con x+ a2, si ha

x4 +

(1

2a2 − c2

)x2 − (a3 + ac2)x+

5

16a4 −

1

4a2c2 = 0. (4.11)

Descartes ha da considerare un’equazione di quarto grado (irriducibile)

dall’apparenza non invitante.

Nel nostro caso, dalla (4.11) si ottiene la risolvente

α6 + (a2 − 2c2)α4 + (c4 − a4)α2 − a2(a2 + c2)2 = 0.

Questa risolvente ha la radice√a2 + c2. Procedendo nel modo previsto,

otteniamo per la soluzione cercata (che deve avere valore compreso tra

0 e a):

1

2a+

1

2

√a2 + c2 −

√1

4c2 −

1

2a2 +

1

2a√a2 + c2.

5CH = a − x. Dal teorema di Pitagora si ricava CK. Si osserva poi che i triangoli

ABH e KCH sono simili . . .

56

In termini moderni, possiamo dire che l’aggiunzione di√a2 + c2 a Q(a, c)

rende il polinomio

x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4

riducibile. In effetti

x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4 =

=(x2 −

(a+

√a2 + c2

)x+ a2

)(x2 −

(a−

√a2 + c2

)x+ a2

).

4.4 Un cenno all’analisi di Lagrange delle

soluzioni dell’equazione di terzo e

quarto grado

Nella celebre memoria di Lagrange [1770], si trova un’analisi profonda dei

motivi per i quali le equazioni di terzo e quarto grado sono risolubili per

radicali.

Consideriamo di nuovo l’equazione

x3 + px+ q = 0 (4.12)

e consideriamo questa volta direttamente il cambiamento di variabili dato

da

x = y−p

3y.

Otteniamo l’equazione (risolvente):

y6 + qy3 −p3

27= 0.

Sia

r =3

√−q

2+

√q2

4+p3

27

e indichiamo con 1, α, β (= α2) le tre radici dell’unita. Le tre soluzioni

dell’equazione (4.12), che indichiamo con a, b, c, sono date da:

a = r−p

3r, b = rα−

p

3rα, c = rα2 −

p

3rα2.

57

Quindi, come si verifica facilmente,6

r =a

(1− α)(1− β)+

αb

(α− 1)(α− β)+

βc

(β− 1)(β− α).

Da

x3 − 1 = (x− 1)(x− α)(x− β)

si ha

3x2 = (x− α)(x− β) + (x− 1)(x− β) + (x− 1)(x− α).

Quindi:

3 = (1− α)(1− β)

3α2 = (α− 1)(α− β)

3β2 = (β− 1)(β− α).

Allora

r =a

3+b

3α+c

3β.

Essendo αβ = 1,

r =a+ bβ+ cα

3.

I ruoli di α e β si possono scambiare, e quindi la soluzione r puo essere

espressa come:

r =a+ bα+ cβ

3.

Dalla forma di

r =a+ bα+ cα2

3

si capisce perche la ridotta ha grado 6.

6Si ponga, per semplicita, p3r

= s. Allora

a− b = (1− α)(r+

s

α

), a− c = (1− β)

(r+

s

β

)e quindi α(a−b)

1−α= αr+ s, β(a−c)

1−β= βr+ s. Si considera la differenza, ecc.

58

Che succede infatti permutando a, b, c?

a+ bα+ cα2

3= u

a+ cα+ bα2

3= v

b+ aα+ cα2

3= vα

b+ cα+ aα2

3= vα2

c+ aα+ bα2

3= uα

c+ bα+ aα2

3= uα2

La ridotta e quindi data da

(y3 − u3)(y3 − v3).

Consideriamo ora una funzione delle radici della forma

Aa+ Bb+ Cc.

E possibile fare in modo che le 6 quantita che si ottengono permutando

a, b, c siano radici di un’equazione di sesto grado con solo termini di grado

multiplo di 3? Sia r una radice, ad esempio quella data da r = Aa+Bb+Cc.

Per ottenere quanto richiesto, anche αr e βr = α2r debbono essere radici.

Supponiamo che sia

α(Aa+ Bb+ Cc) = Aa+ Bc+ Cb

Ne segue che αA = A e dunque α = 1.7 Ancora, se

α(Aa+ Bb+ Cc) = Ab+ Ba+ Cc

si ottiene α = 1. Se invece si ha

α(Ab+ Ba+ Cc) = Ab+ Bc+ Ca

7Per quale ragione? Si fornisca una dimostrazione per esercizio.

59

otteniamo αA = C,αB = A,αC = B e quindi C = αA,B = α2A,α3A = A,

in accordo con α3 = 1.

Se supponiamo A = 1 si ha la soluzione

A = 1, B = α,C = α2.

Siano

u = a+ αb+ α2c, v = a+ αc+ α2b

le due radici soluzione dalle quali si ottengono le altre moltiplicando per

α,α2. Allora

y6 − (u3 + v3)y3 + u3v3 = 0.

Le quantita coinvolte sono simmetriche in a, b, c, e si ha, come si verifica

facilmente

y6 + 27qy3 − 27n3 = 0.

Il metodo di Tschirnaus

Data un’equazione di secondo grado,

x2 + px+ q = 0

con x = a+ y possiamo ridurci alla forma

y2 − α = 0.

Analogamente. Sia

f = x3 +mx2 + nx+ p = 0, g = x2 − bx− a− y = 0

Se calcoliamo il resto della divisione di f per g, abbiamo:(n+ a+ y+ bm+ b2

)x+ ym+ p+ am+ ab+ yb

Possiamo ora ricavare il valore di x e sostituire [. . . ] Eguagliando a zero i

coefficienti di grado 2, 1, abbiamo:

a =mb+m2 − 2n

3,

(m2 − 3n)b2 + (2m2 − 7mn+ 9p)b+

m4 − 4m2n+ 6mp+ n2 = 0.

60

L’equazione si riduce alla forma

y3 − C = 0.

Esempio 4.4 Sia x3 − 3x− 1 = 0 e poniamo x2 − bx− a− y = 0. Allora

x = −−1+ ba+ by

y+ b2 − 3+ a

Sostituendo, si verifica facilmente che a = 2 (perche m = 0 . . . ) e b

verifica:

3b2 − 3b+ 3 = 0.

Quindi, possiamo porre

b =1−

√3 i

2.

L’equazione si riduce a

y3 +9+ 3

√3 i

2= 0.

Vediamo di approfondire la struttura dei calcoli. Posto

x2 = bx+ a+ y

la quantita y deve essere determinata da

y3 + C = 0.

Dunque

y = −3√C, y = −α

3√C, −α2

3√C.

Se le radici sono x0, x1, x2:

x20 = bx0 + a−3√C

x21 = bx1 + a− α3√C

x22 = bx2 + a− α23√C

Moltiplicando per 1, α, α2 e sommando:

b =x20 + αx

21 + α

2x22x0 + αx1 + α2x2

.

61

La soluzione dell’equazione dipende da una funzione razionale delle radici

dell’equazione.

Quanti sono i valori possibili sulle permutazioni?

Se b0, b1 sono i due valori possibili [. . . ] di b, l’equazione di secondo

grado

t2 − (b0 + b1)t+ b0b1 = 0

ha i coefficienti nel campo base, perche questi coefficienti sono invarianti su

tutte le permutazioni.

La soluzione dell’equazione di terzo grado dipende da funzioni razionali

delle radici: o

x0 + αx1 + α2x2,

oppurex20 + αx

21 + α

2x22x0 + αx1 + α2x2

.

(La soluzione dipende anche dalle radici dell’unita).

Ancora sull’equazione di quarto grado

x4 +mx3 + nx2 + px+ q = 0.

Consideriamo la funzione delle radici

(a, b, c, d) 7→ ab+ cd.

Questa funzione ha solo tre valori:

ab+ cd, ac+ bd, ad+ bc.

L’equazione di terzo grado

[x− (ab+ cd)][x− (ac+ bd)][x− (ad+ bc)] = 0

ha i coefficienti funzioni simmetriche di a, b, c, d. Indicando le funzioni

simmetriche con σi, abbiamo:

x3 − σ2x2 + (σ1σ3 − 4 σ4)x+ 4 σ2σ4 − σ1

2σ4 − σ32.

62

Se conosciamo u = ab+ cd, poiche ab · cd = q, dall’equazione

t2 − ut+ q = 0

ricaviamo ab = t ′ e cd = t ′′. Poi

−p = ab(c+ d) + cd(a+ b) =

= t ′(c+ d) + t ′′(a+ b),

−m = a+ b+ c+ d.

Quindi

a+ b =p−mt ′

t ′ − t ′′, c+ d =

p−mt ′′

t ′ − t ′′.

Infine a e b saranno radici di

x2 −p−mt ′

t ′ − t ′′+ t ′ = 0,

mentre c e d saranno radici di

x2 −p−mt ′′

t ′ − t ′′+ t ′′ = 0.


x4 − 25 x2 + 60 x− 36 = 0.

La risolvente di terzo grado diviene:

x3 + 25 x2 + 144 x = 0

che ha le radici 0,−9,−16. Abbiamo allora

t2 − 36 = 0

e quindi t ′ = 6, t ′′ = −6. Dobbiamo risolvere le equazioni:

x2 −60

12x+ 6 = 0

x2 +60

12x− 6 = 0.

Otteniamo 1, 2, 3,−6.

Ancora una volta si nota come la soluzione dipende dalla scelta di una

funzione opportuna delle radici che assume solo 3 valori.

63

4.5 Lagrange e il Teorema dell’elemento

primitivo

Un altro risultato estremamente importante contenuto in [Lagrange, 1770]

e una prima versione del Teorema dell’elemento primitivo. Sia f(x) un

polinomio avente le radici

x1, x2, . . . , xn.

Il risultato puo essere enunciato in questo modo:

Teorema 4.1 Siano

t(x1, x2, . . . , xn), y(x1, x2, . . . , xn)

due funzioni delle radici tali che ogni permutazione delle radici che modifica

y modifica anche t. Allora y e funzione razionale di t.8

Siano t1, t2, . . . , tr i valori distinti che la funzione t assume sulle permuta-

zioni delle radici. Segue facilmente dall’ipotesi che tutte le permutazioni che

mutano t nel valore ti portano y in uno stesso valore yi e, se una permuta-

zione σ porta ti in tj in corrispondenza yi viene mutato in yj.9 Siano allora

y1, y2, . . . , yr i valori di y (non necessariamente tutti distinti) corrispondenti

ai valori t1, t2, . . . , tr. Consideriamo le quantita

tk1y1 + tk2y2 + · · ·+ tkryr,

per k = 0, 1, . . . , r−1. A causa del teorema sui polinomi simmetrici, queste

quantita sono note, e quindi possiamo porre, per ogni k

t01y1 + t02y2 + · · ·+ t0ryr = m0,

t11y1 + t12y2 + · · ·+ t1ryr = m1,

. . . . . . . . .

tr−11 y1 + tr−12 y2 + · · ·+ tr−1r yr = mr−1.

(4.13)

8In altra parole: Lagrange costruisce una funzione razionale Φ(x) tale

che, se (i1 i2 in) e una arbitraria permutazione degli indici (1 2 . . . n) si ha

Φ(t(xi1 , xi2 , . . . , xin)) = y(xi1 , xi2 , . . . , xin). Cf. [Lagrange, 1770, pp. 374-381].9Lo si dimostri per esercizio. Naturalmente non e detto che sia yi = yj.

64

Moltiplichiamo la prima riga per n0, la seconda per n1,. . . , la r−1-esima

per nr−1 e sommiamo. Allora

m0n0 +m1n1 +m2n2 + · · ·+mr−1nr−1 =

= (n0 + n1t1 + n2t21 + · · ·+ nr−1tr−11 )y1

+ (n0 + n1t2 + n2t22 + · · ·+ nr−1tr−12 )y2

. . . . . . . . . . . . . . . . . . . . . . . .

+ (n0 + n1tr + n2t2r + · · ·+ nr−1tr−1r )yr.

(4.14)

Utilizziamo queste quantita nk per formare il polinomio

ν(t) = nr−1tr−1 + · · ·+ n1t+ n0,

lasciando queste quantita da determinarsi successivamente.

Possiamo allora riscrivere la (4.14) nella forma

m0n0 +m1n1 + · · ·+mr−1nr−1

= ν(t1)y1 + ν(t2)y2 + · · ·+ ν(tr)yr

Vogliamo ora determinare ν(t) in modo che sia

ν(tj) = 0 for j = k,

Sia, a tale scopo,

θ(t) = (t− t1)(t− t2) · · · (t− tr).

questo polinomio ha, per il teorema sui polinomi simmetrici, i coefficienti

nel campo base, e possiamo porre

θ(t) = ν(t)(t− tk).

Solo la quantita tk compare come un elemento non nel campo base.

Abbiamo

yk =m0n0 +m1n1 + · · ·+mr−1nr−1

ν(tk)(4.15)

Se scriviamo esplicitamente il polinomio θ(t), avremo

θ(t) = artr + ar−1t

r−1 + · · ·+ a1t+ a0,

65

e quindi (dall’algoritmo della divisione)

n0 = a1 + a2tk + · · ·+ ar−1tr−2k + artr−1k ,

n1 = a2 + a3tk + · · ·+ artr−2k ,

n2 = a3 + · · ·+ artr−3k ,

. . . . . . . . . . . . . . .

nr−1 = ar.

(4.16)

Si osservi ora che θ ′(t) = ν ′(t)(t− tk) + ν(t) e quindi

ν(tk) = θ′(tk). (4.17)

Le (4.16) danno le quantita nj in termini delle quantita aj e di tk; ν(tk) e

dato dalla (4.17) e si tratta quindi di sostituire nella (4.15) per ottenere ykin funzione di tk. Ma la procedura non dipende dalla scelta di k e dunque

cio che otteniamo e in realta y in funzione di t.

Per dare maggiore espressivita al risultato, possiamo porre

c0 = m0a1 +m1a2 + · · ·+mr−1ar,

c1 = m0a2 + · · ·+mr−2ar,

. . . . . . . . .

cr−1 = m0ar,

e

ϕ(t) = c0 + c1t+ · · ·+ cr−1tr−1.

Si ha allora, come si verifica immediatamente,

y(t) =ϕ(t)

θ ′(t). �

Esempio 4.6 Consideriamo l’equazione x2 + px+ q = 0, e siano x1, x2 le

radici. Sia

t(x1, x2) = x1 − x2, y(x1, x2) = x1.

Allora:

θ(t) = [t− (x1 − x2)][t− (x2 − x1)] = a0 + a1t+ a2t2 = 4q− p2 + t2

66

e

m0 = (x1 − x2)0x1 + (x2 − x1)

0x2 = −p,

m1 = (x1 − x2)1x1 + (x2 − x1)

1x2 = (x1 − x2)2 = p2 − 4q.

Di conseguenza

c0 = −p · 0+ (p2 − 4q) · 1c1 = −p · 1

Si conclude che

y(t) =p2 − 4q− pt

2t. 2 (4.18)

Ecco un esempio piu significativo.

Esempio 4.7 Si consideri l’equazione x3 + px + q = 0, avente le radici

x1, x2, x3 e sia t(x1, x2, x3) = x1x2, y(x1, x2, x3) = x1+x2. Allora la funzione

t assume i tre valori x1x2, x1x3, x2x3 e in corrispondenza y assume i valori

x1 + x2, x1 + x3, x2 + x3. Si ha allora, come si verifica facilmente,

θ(t) = −q2 − pt2 + t3,

e quindi a0 = −q2, a1 = 0, a2 = −p, a3 = 1.

m0 = (x1x2)0(x1 + x2) + (x1x3)

0(x1 + x3) + (x2x3)0(x2 + x3) = 0,

m1 = (x1x2)1(x1 + x2) + (x1x3)

1(x1 + x3) + (x2x3)1(x2 + x3) = 3q,

m2 = (x1x2)2(x1 + x2) + (x1x3)

2(x1 + x3) + (x2x3)2(x2 + x3) = pq.

Quindi

c0 = m0a1 +m1a2 +m2a3 = −2pq,

c1 = m0a2 +m1a3 = 3q,

c2 = m0a3 = 0.

Di conseguenza

y(t) =−2pq+ 3qt

−2pt+ 3t2. 2

67

Osservazione 4.1 Consideriamo il caso particolarmente semplice di una

funzione t che assuma i tre valori t1, t2, t3 ai quali corrispondano i valori

y1, y2, y3. Dobbiamo allora risolvere il sistema (si rammentino le (4.13))

y1 + y2 + y3 = m0

t1y1 + t2y2 + t3y3 = m1

t21y1 + t22y2 + t

23y3 = m1

e si tratta di mostrare che ogni elelemto yi della soluzione puo essere espres-

so come funzione solamente di ti.10

Esplicitando il valore di y1, per esempio, si notera che t2 e t3 com-

paiono simmetricamente nella soluzione e quindi la soluzione stessa puo

essere espressa mediante t1 e le funzioni simmetriche elementari date dai

coefficienti del polinomio (t− t1)(t− t2)(t− t3).

A partire da questa osservazione si puo riformulare il risultato di La-

grange. Si noti pero che questa soluzione e piuttosto anacronistica.

Il corollario seguente ha la piu grande importanza.

Corollario 4.1 (Teorema dell’elemento primitivo) La funzione delle

radici V(x1, x2, . . . , xn) assuma n! valori distinti. Allora le radici possono

essere espresse come funzioni del valore V1 = V(x1, x2, . . . , xn).

In queste ipotesi, evidentemente, V e invariante solo per la permutazione

identica e ovviamente le proiezioni πi(x1, x2, . . . , xn−1) = xi sono invarian-

ti per questa permutazione. Con il metodo di Lagrange possiamo allo-

ra costruire n funzioni φi(x) tali che per ogni permutazione σ si abbia

πi(xσ(1), xσ(2), . . . , xσ(n) = xσ(i) = φi(V(xσ(1), xσ(2), . . . , xσ(n))). In particola-

re la permutazione identica da xi = φi(V1). 2

Un esempio ulteriore mostra l’efficacia del risultato di Lagrange in questo

caso.11

10Cf. [Edwards, 1984, pp. 34-35].11Il caso dell’equazione di secondo grado, esaminato in precedenza (vedi a pagina

66) e troppo semplice per risultare convincente. L’ho esposto solamente per mostra la

meccanica dell’algoritmo.

68

Esempio 4.8 Consideriamo l’equazione x3+px+q = 0, che abbia le radici

x1, x2, x3 e poniamo ancora t(x1, x2, x3) = x1 − x2, y(x1, x2, x3) = x1.

Allora

θ(t) =∏i =j

(t− (xi − xj)) = 4p3 + 27q2 + 9p2t2 + 6pt4 + t6.

Si ha poi:

m0 = 0,m1 = −6p,m2 = −9q,m3 = 18p2,m4 = 27pq,m5 = −66p3−81q2.

Con i valori dei coefficienti di θ e con i valori mk possiamo calcolare i valori

cj. Si ha:

c0 = −12p3 − 81q2, c1 = −27pq, c2 = −18p2, c3 = −9q, c4 = −6p, c5 = 0.

Si ha allora

y = −1

2· 2p x

4 + 3 qx3 + 6 p2x2 + 9 pqx+ 4 p3 + 27 q2

x (x4 + 4 px2 + 3 p2)

e, come si verifica facilmente, y(x1 − x2) = x1. Scegliendo invece come

funzione y la proiezione su x2 si ha (ovviamente)

y =1

2· 2p x

4 − 3 qx3 + 6 p2x2 − 9 pqx+ 4 p3 + 27 q2

x (x4 + 4 px2 + 3 p2)

e y(x1 − x2) = x2. Infine con la proiezione su x3 si ha

y =3q

p+ x2

e y(x1 − x2) = x3 (= −x1 − x2). L’elemento x1 − x2 permette quindi di

esprimere le tre radici. Ossia, nei termini dell’algebra moderna:

Q(x1, x2, x3) = Q(x1 − x2).

69

Capitolo 5

Il teorema sui polinomisimmetrici

5.1 Introduzione

Inizio questo capitolo con alcune osservazioni per dare unita ad un argo-

mento che si svolge in un percorso di piu di trecento anni.1

I polinomi che si considerano in questo capitolo all’inizio avevano ori-

ginariamente (nei lavori di Newton, Maclaurin, Leibniz, ecc.) i loro coeffi-

cienti non specificati. Possiamo considerarli come numeri reali (o complessi,

talvolta). Al termine del capitolo invece, i polinomi che compaiono nella

dimostrazione di Artin hanno i coefficienti in un campo arbitrario. Poiche

la natura dei coefficienti non interviene in modo essenziale, a patto natu-

ralmente che essi formino un campo (o un anello commutativo in certi casi)

non specificgero la loro natura, affidandomi al contesto perche sia chiara la

loro natura.

Un polinomioφ(x1, x2, . . . , xn) nelle indeterminatex1, x2, . . . , xn, che man-

tenga lo stesso valore per tutte le permutazioni di x1, x2, . . . , xn e detto un

1Un breve ma interessante resoconto di qesto argomento e [Funkhouser, 1930].

71

polinomio simmetrico nelle variabili x1, x2, . . . , xn.

Tra i polinomi simmetrici quelli dati da

σ1 = x1 + x2 + · · ·+ xnσ2 = x1x2 + · · ·+ x1xn + x2x3 + · · ·+ xn−1xn. . . . . . . . .

σn = x1x2 · · · xn

(5.1)

sono di particolare importanza e sono detti polinomi simmetrici elementari.2

Si ha evidentemente

(x− x1)(x− x2) · · · (x− xn) = xn−σ1xn−1+σ2xn−2+ · · ·+(−1)nσn. (5.2)

Osservazione 5.1 In molte situazioni le indeterminate x1, x2, . . . , xn sa-

ranno sostituite dalle radici di un’equazione di grado n con coefficenti nu-

merici o con coefficienti a loro volta delle indeterminate.

Nelle pagine seguenti i simboli Sk saranno usati somme di potenze della

forma xk1+xk2+ · · ·+xkn. Usero invece Sn per indicare il gruppo simmetrico,

ossia il gruppo di tutte le permutazioni degli indici 1, 2, . . . , n. Con σ, τ, . . .

indichero le singole permutazioni di Sn. La possibile confusione tra σ(j) e

σj sara chiarita dal contesto.

Il teorema del quale voglio descrivere lo sviluppo storico e il seguente.

Teorema 5.1 Ogni polinomio simmetrico nelle indeterminate x1, x2, . . . , xnpuo essere scritto in modo unico come un polinomio nelle σ1, σ2, . . . , σn. ⋄

Nel seguito del capitolo vedremo alcune dimostrazioni dapprima di casi

particolari e poi del teorema nella sua generalita. Nella Sezione seguente,

poiche la matematica coinvolta non e molto complicata ho mantenuto le

notazioni di Newton e di Maclaurin. Nel seguito pero occorrera midificare

le notazioni originali per dare untia alla trattazione.

2La loro considerazione risale a Viete.

72

5.2 La regola di Newton per le somme di

potenze delle radici

Un primo risultato sui polinomi simmetrici e dato da Newton nella sua

Arithmetica Universalis.3

Le somme di potenze delle radici di un’equazione arbitraria (nella qua-

le quindi le radici possono essere considerate come indeterminate: si veda

l’osservazione 5.1) possono essere espresse mediante i coefficienti dell’equazione

stessa (le funzioni simmetriche elementari delle radici).

Newton considera una equazione arbitraria i cui coefficienti egli indica

con p, q, r, s, t, v, . . . , scritta nella forma

xn − pxn−1 + qxn−2 − rxn−3 + · · · = 0

e da questa regola:

si ponga p = a, pa− 2q = b, pb−qa+ 3r = c, pc−qb+ ra−

4s = d [. . . ] e cosı all’infinito, mantenendo la struttura della

progressione. E a sara la somma delle radici, b la somma dei

quadrati delle radici, c la somma dei cubi, . . .

Newton lascia la dimostrazione al suo lettore.

Esempio 5.1 Consideriamo l’equazione x4 − x3 − x + 1 = 0. Vogliamo

calcolare la somma delle potenze di ordine 5 delle sue radici. Si ha allora

p = 1, q = 0, r = 1, s = 1 (e i coefficienti successivi, anche quelli di ‘grado

negativo’, debbono considerarsi nulli). Quindi

S1 = 1,

S2 = pS1 − 2q = 1 · 1− 2 · 0 = 1,S3 = pS2 − qS1 + 3r = 1 · 1− 0 · 1+ 3 · 1 = 4,S4 = pS3 − qS2 + rS1 − 4s = 1 · 4− 0 · 1+ 1 · 1− 4 = 1,

S5 = pS4 − qS3 + rS2 − sS1 − 5 · 0 = 1 · 1− 0 · 4+ 1 · 1− 1 · 1 = 1.3Si veda [Newton, 1964, vol. 2, p. 202]. Si vedano anche [Newton, 1981, vol. 1, pp.

519-20], [Newton, 1981, vol. 4, pp. 360-61] e le utili e istruttive note di Whiteside.

73

E chiaro come il calcolo puo procedere. Si noti che arriviamo alla conoscen-

za di Sk con k arbitrario senza conoscere le radici

5.3 La dimostrazione di Maclaurin della

regola di Newton

La prima dimostrazione della regola di Newton e data da Maclaurin. Egli4

inizia con il considerare un’equazione della forma

xn −Axn−1 + Bxn−2 + · · ·+ Kx2 − Lx+M = 0 (5.3)

ed indica le radici con a, b, c, d, . . . 5

Egli comincia con il considerare il caso di una somma di potenze r-esime,

con r > n (il caso piu semplice). Abbiamo evidentemente le identita

ar −Aar−1 + Bar−2 + · · ·− Lar−n+1 +Mar−n = 0,

br −Abr−1 + Bbr−2 + · · ·− Lbr−n+1 +Mbr−n = 0,

cr −Acr−1 + Bcr−2 + · · ·− Lcr−n+1 +Mcr−n = 0,

· · · · · · · · ·

Sommando tutte le righe, e indicando con Sk la somma ak+bk+ ck+ · · · ,6abbiamo

Sr −ASr−1 + BSr−2 + · · ·− LSr−n+1 +MSr−n = 0. (5.4)

In seguito Maclaurin considera il caso di r ≤ n. Se H e il coefficiente che

contiene le summe dei prodotti delle radici presi a r a r egli deve dimostrare

che7

Sr −ASr−1 + BSr−2 + · · ·− rH = 0. (5.5)

4Cf. [Maclaurin, 1748, pp. 286-296].5 Poiche non abbiamo ipotesi sulla parita di n, l’equazione (5.3) potrebbe anche

terminare con −Kx2 + Lx −M. Ma la dimostrazione di Maclaurin procederebbe nello

stesso modo.6Maclaurin non utlizza una simbologia speciale per indicare queste somme di potenze.

io credo che questo piccolo abuso notazionale non crei una grande differenza.7Si veda la nota 5 per il segno di H.

74

Maclaurin considera separatamente i casi facili dati da r = n−1 e r = n−2,

per i quali la soluzione e semplice (e rientra nel caso generale). Il caso

generale e trattato con l’aiuto del lemma seguente.

Lemma 5.1 Si consideri il primo coefficiente A (= S1) dell’equazione (5.3),

il coefficiente G e H il coefficiente che lo segue immediatamente. Se con

A ′×G ′ indichiamo la somma di tutti i termini del prodotto A×G nei quali

si trova il quadrato di ogni radice a2 o b2 o c2, &c., allora

A ′ ×G ′ = A×G− rH. ⋄

Dimostrazione.- La dimostrazione di Maclaurin consiste di un esem-

pio paradigmatico. Consideriamo

D = abcd+ abce+ abcf+ · · ·+ bcde+ bcdf+ . . .

e moltiplichiamolo per A = a + b + c + d + . . . Se nel prodotto A × Dtutti i termini nei quali si trovano a2, b2, c2, . . . sono scelti (per formare

A ′ × D ′), ognuno dei termini restanti comparira tante volte quanti sono

i fattori che formano un termine del coefficiente seguente E. Il termine

abcde, per esempio, e ottenuto moltiplicando ognuna delle cinque radici

a, b, c, d, e per il prodotto delle altre quattro che formano un termine di D.

Quindi

A×D−A ′ ×D ′ = 5E.

E evidente che non vi sono difficolta per dare una dimostrazione piu formale

del caso generale. ♢Comunque un altro esempio puo essere utile.

Esempio 5.2 Vediamo un caso piu semplice di quello scelto da Maclauirin.

Consideriamo l’equazione

(x− a)(x− b)(x− c)(x− d)(x− e)

e il coefficiente dato da

D = abc+ abd+ abe+ acd+ ace+ ade+ bcd+ bce+ bde+ cde.

75

Formiamo il prodotto

A×D = (a+b+c+d+e)(abc+abd+abe+acd+ace+ade+bcd+bce+bde+cde).

Otterremo un termine che non contiene a2 solo scegliendo in D un ter-

mine che non contiene a il che evidentemente si puo fare in 4 modi. Il

ragionamento si puo ripetere per b, c, d, e. Quindi in questo caso

A×D−A ′ ×D ′ = 4E.

Maclaurin ora osserva che in ciascuno dei coefficienti A,B,C,D, . . . con

l’eccezione dell’ultimo M, quando si sceglie una radice, ad esempio a, pos-

siamo suddividere la somma dei termini in due parti: quella data dalla

somma di tutti i termini contenenti a e l’altra data dai rimanenti. Egli

utilizza le notazioni

G(+a, G(−a

con ovvio significato. Chiaramente

G = G(+a +G(−a and H(+a = aG(−a (5.6)

G = G(+b +G(−b and H(+b = bG(−b (5.7)

. . . . . . . . .

Partendo dall’equazione (5.3) scriviamo il polinomio generalizzato

xr −Axr−1 + Bxr−2 + · · ·+Gx+H+I

x−K

x2+ · · ·+ M

xn−r. (5.8)

Sostituendo a, b, c, . . . successivamente al posto di x otteniamo8

ar −Aar−1 + Bar−2 + · · ·+Ga+H+I

a−K

a2+ · · ·+ M

an−r

br −Abr−1 + Bbr−2 + · · ·+Gb+H+I

b−K

b2+ · · ·+ M

bn−r

cr −Acr−1 + Bcr−2 + · · ·+Gc+H+I

c−K

c2+ · · ·+ M

cn−r

. . . . . . . . .

8Ancora una volta la notazione usata da Mclaurin va interpretata ragionevolmente.

76

Con le notazioni usate in (5.6), (5.7), ecc. si ha

Ga = aG(+a + aG(−a, (5.9)

−H = −aG(−a −H(−a, (5.10)

I

a= H(−a +

I(−a

a, (5.11)

−K

a2= −

I(−a

a−K(−a

a2, (5.12)

. . . = . . . . . . . . .

M

an−r= −

L(−a

an−r. (5.13)

Esempio 5.3 Consideriamo cinque radici a, b, c, d, e e verifichiamo che

nel caso in cui sia

H = abc+ abd+ abe+ acd+ ace+ ade + bcd+ bce+ bde+ cde

si haI

a= H(−a +

I(−a

a.

Infatti I = abcd+ abce+ abde+ acde+ bcde e si ha quindi

I

a= bcd+ bce+ bde+ cde+

bcde

a. 2

Consideriamo di nuovo le identita (5.9),. . . , (5.13). Sommando da ambo le

parti e cancellando opportunamente si ha

Ga−H+I

a−K

a2+ · · ·+ M

an−r= aG(+a

e similmente

Gb−H+I

b−K

b2+ · · ·+ M

bn−r= bG(+b,

Gc−H+I

c−K

c2+ · · ·+ M

cn−r= cG(+c,

. . . . . . . . .

77

Ma

aG(+a + bG(+b + cG(+c + · · · = A ′ ×G ′.

Per il lemma 5.1, A ′ ×G ′ = A×G− rH = GS1 − rH. Ne segue che

Sr −ASr−1 + BSr−2 + · · ·+GS1 − rH = 0,

come si doveva dimostrare. �

5.4 La dimostrazione di Lagrange della

regola di Newton

Lagrange da una dimostrazione semplice ed elegante del risultato di Newton

in [Lagrange, 1808, Note VI].9

Sia

f(x) =

n∑k=0

akxn−k = a0(x− x1)(x− x2) · · · (x− xn), (5.14)

alloraak

a0= (−1)kσk. (5.15)

Il duplice modo di scrivere il polinomio f(x) corrisponde al doppio modo di

scrivere la sua derivata.

f′ (x) = na0xn−1 + (n− 1)a1x

n−2 + (n− 2)a2xn−3 + . . . =

= a0 {(x− x2) · · · (x− xn) + (x− x1) (x− x3) · · · (x− xn) + . . .}

Di conseguenza

f′ (x)

f (x)=na0x

n−1 + (n− 1)a1xn−2 + (n− 2)a2x

n−3 + . . .

a0xn + a1xn−1 + a2xn−2 + a3xn−3 + . . .+ an,

9Un’altra dimostrazione che si estende anche al caso di potenze negative si trova

in [Lagrange, 1768], dove la famosa ‘serie di Lagrange’ compare per la prima volta.

Un’altra dimostrazione di Lagrange si trova in [Lagrange, 1808, Note XI]. Si veda anche

[Serret, 1877, Section II, chapitre II]. Dimostrazioni interessanti della regola di Newton,

in qualche modo mirate ad ottenere unas ‘formula chiusa’ si trovano in [Waring, 1991,

Problem I] e in [Euler, 1771].

78

ef′ (x)

f (x)=

1

x− x1+

1

x− x2+ · · ·+ 1

x− xn. (5.16)

Utilizzando la serie geometrica,10 la formula (5.16) da

1

x− x1+

1

x− x2+ · · ·+ 1

x− xn=1

x

1

1−x1

x

+1

x

1

1−x2

x

+ · · · =

=1

x

{[1+

x1

x+(x1x

)2+ · · ·

]+

[1+

x2

x+(x2x

)2+ · · ·

]+ · · ·

}=

=n

x+ (x1 + x2 + · · · xn)

1

x2+(x21 + x

22 + · · ·+ x2n

) 1x3

+

+(x31 + x

32 + · · ·+ x3n

) 1x4

+ · · ·

Ne segue che

f′ (x)

f (x)=S0

x+S1

x2+S2

x3+S3

x4+ · · ·

e di conseguenza

na0xn−1 + (n− 1)a1x

n−2 + (n− 2)a2xn−3 + · · · =

=[a0x

n + a1xn−1 + a2x

n−2 + · · ·+ an] [S0x

+S1

x2+S2

x3+S3

x4+ · · ·

].

Lagrange paragona ora il coefficiente di xn−r−1 nei due membri della equa-

zione precedente. Quindi

(n− r)ar = a0Sr + a1Sr−1 + a2Sr−2 + · · ·+ arS0.

S0 = n, e di conseguenza

a0Sr + a1Sr−1 + a2Sr−2 + · · ·+ rar =r−1∑i=0

aiSr−i + rar = 0. (5.17)

Si noti che, ponendo ar = 0 per r > n, la formula (5.17) risulta valida per

ogni r.

Dividendo per a0 e usando le (5.15) otteniamo la formulazione abituale.10La argomentazione di Lagrange puo essere collocata idealmente nel contesto delle

serie formali, poiche le radici xk sono considerate come indeterminate.

79

5.5 La prima dimostrazione del teorema:

Waring

Waring e il primo che dimostra il Teorema 5.1 nella sua forma generale.

Io seguo la formulazione data nell’eccellente traduzione inglese di Weeks

di [Waring, 1770], che contiene la formulazione definitiva dei risultato di

Waring.11 Io mi limito a presentare la dimostrazione ‘algoritmica’ data

da Waring12, perche la soluzione per serie, sebbene molto elegante13 e di

difficile utilizzo.14

Waring comincia con l’osservare che se un polinomio simmetrico nelle

indeterminare x1, x2, . . . , xn contiene un termine della forma

a · xn1

1 xn2

2 · · · xnr

r

esso contiene anche necessariamente tutti i termini della forma

a · xn1

σ(1) · · · xnr

σ(r)

che si ottengono applicando una permutazione arbitraria σ, appartenente

al gruppo simmetrico Sn, all’arrangiamento (1 2 · · ·n). Di conseguenza il

polinomio simmetrico contiene

a ·∑σ∈Sn

xn1

σ(1) · · · xnr

σ(r). (5.18)

L’idea di Waring e quella di esprimere ogni somma (5.18) mediante un

polinomio nelle somme

Sk = xk1 + x

k2 + · · ·+ xkn.

Poiche le somme Sk, a loro volta, mediante la regola di Newton, possono es-

sere espresse mediante le σj date in (5.1), ogni somma del tipo (5.18), e dun-

que l’intero polinomio simmetrico puo essere trasformato in un polinomio

nelle σj.11Si veda [Waring, 1991].12Ibidem, [Waring, 1991, pp. 12-13].13Ibidem, p. 1114Ho anche considerato l’esposizione di Bourdon [1831, pp. 487–491]. Ho modifica-

to lievemente le notazioni per mettere in maggior risalto la strategia di Waring. Una

dimostrazione moderna delle formule di Waring si trova in [Murnaghan, 1931].

80

Per denotare la somma (5.18), si puo usare la notazione (molto prossima

a quella usata da Waring)

a · T [xn1

1 xn2

2 · · · xnr

r ].

Se (5.18) contiene una sola indeterminata, per esempio x1, ovviamente

si ha

a · T [xn1

1 ] = a · Sn1. (5.19)

Supponiamo ora che nella (5.18) vi siano due indeterminate, ossia che

essa abbia la forma

a · T [xn1

1 xn2

2 ]. (5.20)

Il prodotto

Sn1· Sn2

contiene certamente tutti i termini di T [xn1

1 xn2

2 ], ma esso contiene anche

tutti i termini di Sn1+n2. Si ha quindi

T [xn1

1 xn2

2 ] = Sn1· Sn2

− Sn1+n2. (5.21)

Il meccanismo ricorsivo e ora piuttosto chiaro:

T [xn1

1 xn2

2 . . . xnr

r xnr+1

r+1 ] = T [xn1

1 xn2

2 . . . xnr

r ] · Snr+1+

−T [xn1+nr+1

1 xn2

2 . . . xnr

r ] − · · ·− T [xn1

1 xn2

2 . . . xnr+nr+1r ].

(5.22)

Osservazione 5.2 Si noti che nel risultato di Waring gli esponenti n1, n2, . . .

sono puri simboli, e dunque il risultato non dipende dalla loro natura.

Si consideri, ad esempio, il polinomio simmetrico (generalizzato)

T [xa yb zc] = xaybzc+ xayczb+ xbzayc+ xbzcya+ xcyazb+ xczbya. (5.23)

Il meccanismo ricorsivo da

T [xa yb zc] = T [xa yb]Sc − T [x(a+c) yb] − T [xa y(b+c)]

= T [xa yb](xc + yc + zc) − T [x(a+c) yb] − T [xa y(b+c)].

81

Ma

T [xa yb] = SaSb − Sa+b = (xa + ya + za)(xb + yb + zb) − (xa+b + ya+b + za+b).

T [xa+c yb] = Sa+cSb − Sa+b+c =

= (xa+c + ya+b + za+b)(xb + yb + zb) − (xa+b+c + ya+b+c + za+b+c).

T [xa yb+c] = SaSb+c − Sa+b+c =

= (xa + ya + za)(xb+c + yb+c + zb+c) − (xa+b+c + ya+b+c + za+b+c).

Quindi

T [xa yb zc] = SaSbSc − SaSb+c − SbSa+c − ScSa+b + 2Sa+b+c.

Ponendo a = b = 1, c = −1, per proseguire l’esempio, abbiamo

2

(xy

z+xz

y+yz

x

)=

= (x+ y+ z)2(1

x+1

y+1

z

)−

(1

x+1

y+1

z

)(x2 + y2 + z2) − 4(x+ y+ z).

L’importanza del risultato di Waring e evidente. Ma al tempo stesso e

difficile immaginare una utilzzazione ‘pratica’ del suo algoritmo.

Esercizio 5.1 Utilizando un sistema di computer algebra, si scriva un pro-

gramma che implementi il metodo di Waring.

5.6 La dimostrazione di Gauss

L’elegante dimostrazione di Gauss del Teorema 5.1 e contenuta nelle sezioni

4, 5 di [Gauss, 1816]. Questa dimostrazione fornisce anche un algoritmo

efficiente per esprimere un polinomio simmetrico φ(x1, x2, . . . , xn) come un

polinomio nelle σj. Inoltre Gauss dimostra anche per la prima volta l’unicita

della rappresentazione.15

15Questa dimostrazione e spesso riprodotta nei manuali moderni, a partire dai classici

volumi [van der Waerden, 1930, 1931]. Si veda anche la traduzione inglese (con diverso

titolo): [van der Waerden, 1991, pp. 99-101].

82

Gauss inizia ponendo un ordine totale nell’insieme di tutti i monomi nelle

indeterminate x1, x2, . . . , xn. Per rendere l’esposizione ancora piu chiara

denotero questa relazione d’ordine con ≻.

Gauss stabilisce che per due monomi nelle indeterminate x1, x2, . . . , xn

xk11 x

k22 · · · xknn , x

l11 x

l22 · · · xlnn

si ha

xk11 x

k22 · · · xknn ≻ xl11 x

l22 · · · xlnn (5.24)

se esiste un r < n tale che

ki = li for i = 1, 2, . . . , r and kr+1 > lr+1.

Si noti che questo ordinamento puo essere esteso a tutti i termini che

compongono un polinomio nelle variabili x1, x2, . . . , xn, purche due addendi

del tipo a·xk11 xk22 · · · xknn , b·xk11 x

k22 · · · xknn siano sostituiti da un unico termine

dato da (a+ b) · xk11 xk22 · · · xknn .

Osservazione 5.3 Si noti che, fissato un monomioM esistono infiniti mo-

nomi N con M ≻ N. Ma se uniamo la richiesta che il grado del monomio

N sia minore od uguale a quello di M allora il numero diviene finito.

Consideriamo, per esempio, le indeterminate x1, x2, x3. Si ha evidente-

mente x1 = x11x02x03 ≻ x01x

i2xk3 per ogni scelta di i e k in N. Ma se fissiamo

il grado di un monomio P = xi11 x

i22 x

i33 , scegliendo un intero n per questo

grado, le scelte possibili per i monomi minori di P vanno effettuate tra le

terne di interi positivi soluzioni di i1 + i2 + i3 ≤ n.16

Esercizio 5.2 Date le variabili x1, x2, x3 si dispongano in ordine decrescen-

te per l’ordine dato da ≻ tutti i monomi di grado minore od uguale a 2

minori di x21. ♢

Siaφ(x1, x2, . . . , xn) un polinomio simmetrico. Come aveva gia osservato

Waring, se φ contiene un termine della forma

a · xk11 xk22 · · · xknn

16Si veda pero la nota 19.

83

esso deve contenere anche tutti i termini dati da

a ·∑σ∈Sn

xk1σ(1)x

k2σ(2) · · · x

knσ(n).

Ne segue che il termine massimo, per l’ordine ≻ e necessariamente della

forma

a · xk11 xk22 · · · xknn , con k1 ≥ k2 ≥ · · · ≥ kn. (5.25)

Altrimenti, se per i < j fosse ki < kj, la permutazione che scambia i con j

produrrebbe un termine piu grande per l’ordinamento ≻.

Osservazione 5.4 SiaM = a·xk11 xk22 · · · xknn il termine massimo per l’ordi-

namento dato contenuto in un polinomio simmetrico p(x1, x2, . . . , xn) e sia

m = k1 + k2 + · · · + kn il grado di M. Allora p e un polinomio di grado

m.17

Infatti, se il polinomio p contenesse un monomio N = b · xj11 xj22 · · · xjnn

con n = j1+j2+ · · ·+jn, tale che n > m, dovrebbe verificarsi per almeno un

esponente ji, la disuguaglianza ji > ki. Ma, essendo p simmetrico, anche

il monomio P = b · xji1 xs22 · · · xsnn , corrispondente ad una permutazione degli

esponenti j1, j2, . . . , jn che porti ji al primo posto dovrebbe essere un termine

di p; ed e evidentemente, in tal caso, P ≻M, il che e assurdo. 2

Se il termine piu grande di φ e

a · xk11 xk22 · · · xknn .

con k1 ≥ k2 ≥ · · · ≥ kn, il polinomio

φ1 = φ− a · σk1−k21 σk2−k32 · · ·σkn−1−kn

n−1 σknn , (5.26)

costruito con le funzioni simmetriche elementari, ha grado minore od ugale

a quello di φ ed un termine massimo strettamente minore.18

17Si veda ancora la nota 19.18Si noti che il grado di σk1−k2

1 σk2−k3

2 · · ·σknn e dato da

k1 − k2 + 2(k2 − k3) + · · ·+ (n− 1)(kn−1 − kn) + kn = k1 + k2 + · · ·+ kn

che e, per quanto osservato, il grado di φ.

84

Esempio 5.4 Sia

φ(x1, x2, x3) = x31x22 + x

31x23 + x

32x21 + x

32x23 + x

33x21 + x

33x22.

Il termine massimo e evidentemente x31x22. Abbiamo k1 = 3, k2 = 2, k3 = 0.

Il polinomio φ1 e allora dato da

φ1 = φ− σ3−21 σ2−02 σ03 = φ− (x1 + x2 + x3)(x1x2 + x1x3 + x2x3)2.

Il polinomio che otteniamo

−2 x13x2x3 − 5 x1

2x22x3 − 5 x1

2x2x32 − 2 x1x2

3x3 − 5 x1x22x3

2 − 2 x1x2x33

ha lo stesso numero di termini, ma il termine massimo −2x31x2x3 e stretta-

mente minore.

Ritornando al discorso generale, si osservi che φ1 e a sua volta un

polinomio simmetrico e il suo termine piu grande ha la forma

b · xl11 xl22 · · · xlnn

con l1 ≥ l2 ≥ · · · ≥ ln e puo essere, come abbiamo visto nell’esempio,

k1 = l1, k2 = l2, . . . , ma per almeno uno degli lj, con j = 1, 2, . . . , n, deve

essere lj < kj.

Si puo osservare che il polinomio φ1 puo avere talvolta lo stesso numero

di termini di φ od anche un numero maggiore, ma questo numero e ne-

cessariamente finito e poiche il numero di monomi di dato grado minori di

un monomio dato e finito, il numero dei termini non puo superare questo

numero.

Possiamo visualizzare il processo in questo modo: un polinomio simme-

trico ha un monomio M piu grande, rispetto all’ordinamento ≻, di grado

m, edm e anche il grado del polinomio. Nella lista di tutti i monomi minori

diM con grado minore od uguale a m alcuni saranno presenti, altri no; ma

se il numero totale dei monomi minori diM e e di grado minore di m e lM,

la lista non puo avere piu di lM termini. Con il metodo di Gauss si genera

un polinomio simmetrico per il quale il monomio piu grande M1 e tale che

M ≻ M1 ed ha grado m1 ≤ m. Se il numero dei monomi minori di M1 e

85

di grado minore di m1 e Lm1, si ha certamente Lm > Lm1

. Ne consegue che

il processo puo essere iterato e deve condurre necessariamente al polinomio

nullo.

Dunque, procedendo nel modo indicato, avremo

φ(x1, . . . , xn) − a · σk1−k21 σk2−k32 · · ·σknn − b · σl1−l21 σ

l2−l32 · · ·σlnn − · · · = 0

e

φ(x1, . . . , xn) = a · σk1−k21 σk2−k32 · · ·σknn + b · σl1−l21 σ

l2−l32 · · ·σlnn + . . .

e la rappresentazione richiesta.19

Esempio 5.5 Si consideri il polinomio nelle variabili x1, x2, x3

φ = x12x2

2x32 + x1

3x2 + x23x1 + x1

3x3 + x33x1 + x2

3x3 + x33x2,

Il termine piu grande per l’ordinamento dato e x31x2. Dobbiamo considerare

φ−σ3−11 σ2 = x12x2

2x32−2 x1

2x22−5 x1

2x2x3−2 x12x3

2−5 x1x22x3−5 x1x2x3

2−2 x22x3

2.

Il nuovo termine piu grande e x21x22x23. Dunque

φ−σ3−11 σ2−σ2−21 σ2−22 σ23 = −2 x1

2x22−5 x1

2x2x3−2 x12x3

2−5 x1x22x3−5 x1x2x3

2−2 x22x3

2.

Questa volta abbiamo −2x21x22, e quindi

φ− σ21σ2 − σ23 − (−2σ22) = −x1

2x2x3 − x1x22x3 − x1x2x3

2.

Infine abbiamo

φ− σ21σ2 − σ23 − (−2σ22) − (−σ1σ3) = 0. ♢

Per dimostrare l’unicita, supponiamo per assurdo che vi siano due rappre-

sentazioni differenti

φ(x1, . . . , xn) = F(σ1, . . . , σn) = G(σ1, . . . , σn).

19In realta le considerazioni sul grado servono solamente per semplificare la dimostra-

zione. Si puo dimostrare facilmente che l’algoritmo di Gauss si arresta dopo un numero

finito di passi riflettendo solamente sull’ordinamento dei monomi.

86

dove F e G sono polinomi diversi nelle variabili X1, X2, . . . , Xn che divengono

uguali quando si effettua la sostituzione

Xj = σj (5.27)

Si noti che F−G non puo ridursi ad un solo monomio (lo si dimostri per

esercizio) e due monomi diversi

M · Xk11 · · ·Xknn , N · Xl11 · · ·Xlnn

di

F(X1, . . . , Xn) −G(X1, . . . , Xn)

producono termini di grado piu alto diversi per ≻, dati da

M · xk1+k2+···+kn1 x

k2+···+kn2 · · · xknn , N · xl1+l2+···+ln

1 xl2+···+ln2 · · · xlnn ,

quando si effettuano le sostituzioni (5.27). Dunque c’e necessariamente un

termine massimo per ≻ una volta che sono eseguite le sostituzioni (5.27) e

F−G non puo divenire il polinomio nullo. 2

5.7 La dimostrazione di Cauchy

La dimostrazione di Cauchy si trova in [Cauchy, 1829, pp. 132–33]. Si

tratta di una brillante dimostrazione per induzione.20

Si consideri l’equazione

xn − σ1xn−1 + σ2x

n−2 + · · ·+ (−1)nσn = 0 (5.28)

che abbia le radici x1, x2, . . . , xn. Sia φ(x1, x2, . . . , xn) un polinomio simme-

trico nelle variabili x1, x2, . . . , xn. Possiamo certamente scrivere φ mettendo

in evidenza la variabile x1, ossia nella forma

φ = A0xm1 +A1x

m−11 + · · ·+Am. (5.29)

20Anche questa conosce un certo favore. Si veda per esempio [Mignotte e Stefanescu,

1999].

87

dove i coefficienti Ak debbono essere polinomi simmetrici nelle n−1 variabili

x2, x3, . . . , xn.

Siano τ1, τ2, . . . , τn−1 le funzioni simmetriche elementari delle n − 1

variabili x2, . . . , xn. Sia dunque

τ1 = x2 + . . .+ xn,

τ2 = x2x3 + . . .+ xn−1xn,

. . . . . . . . .

τn−1 = x2x3 · · · xn.

Di conseguenza

σ1 = τ1 + x1,

σ2 = τ2 + τ1 · x1,σ3 = τ3 + τ2 · x1,. . . . . . . . .

σn = 0+ τn−1x1.

Da queste uguaglianze si deduce anche

τ1 = σ1 − x1,

τ2 = σ2 − τ1x1 = σ2 − σ1x1 + x21,

τ3 = σ3 − σ2x1 + σ1x21 − x

31,

. . . . . . . . .

0 = σn − σn−1x1 + σn−2x21 + . . .+ (−1)n xn1 .

(5.30)

Supponiamo ora che il Teorema 5.1 sia valido per n− 1 radici (indeter-

minate). Allora i coefficienti Ak in (5.29) possono essere espressi mediante

le funzioni τk. Se sostituiamo in (5.29) le τk con le espressioni date dal-

le (5.30), possiamo scrivere φ come un polinomio nella variabile x1, i cui

ciefficienti sono soltanto funzioni delle σk. Possiamo quindi scrivere

φ = B0xp1 + B1x

p−11 + · · ·+ Bp21 (5.31)

21Considerando l’ultima delle (5.30), che corrisponde semplicemente a dire che x1verifica la (5.28), possiamo anche suppore che sia p < n il che puo semplificare quanto

segue (come? Lo si dimostri per esercizio).

88

A causa della simmetria di φ, il polinomio

B0xp + B1x

p−1 + · · ·+ Bp (5.32)

mantiene lo stesso valore con la sostituzione delle radici x1, x2, . . . , xn al po-

sto di x.22 Se dividiamo questo polinomio per il polinomio a primo membro

di (5.28) otteniamo per il resto un polinomio della forma

λ0xn−1 + λ1x

n−2 + · · ·+ λn−1. (5.33)

Il polinomio

λ0xn−1 + λ1x

n−2 + · · ·+ λn−1 −φ (5.34)

puo essere riscritto, utilizzando l’ultima uguaglianza delle (5.30), come un

polinomio di grado n − 1 che ha le n radici x1, x2, . . . , xn e di conseguenza

e identicamente nullo. Questo implica φ = λn−1. Quindi φ e un polinomio

nelle σk. Cauchy sottolinea il fatto che questo teorema consente il calcolo

effettivo, per ricorrenza, di φ come polinomio nelle σk. 2

Esempio 5.6 Consideriamo le tre indeterminate x1, x2, x3 radici di

x3 − σ1x2 + σ2x− σ3 = 0, (5.35)

e sia dato il polinomio

φ = φ (x1, x2, x3) = x21 + x

22 + x

23 + x1x2x3.

Esso puo riscriversi nella forma

φ = x22 + x23 + x2x3 · x1 + x21 =

= (x2 + x3)2 − 2x2x3 + x2x3 · x1 + x21 =

= τ21 − 2τ2 + τ2 · x1 + x21.

La sostituzione delle σ al posto delle τ da

φ = (σ1 − x1)2 − 2

(σ2 − σ1x1 + x

21

)+(σ2 − σ1x1 + x

21

)x1 + x

21 =

= σ21 − 2σ2 + σ2x1 − σ1x21 + x

31.

22In effetti Cauchy (si veda [Cauchy, 1829, p. 133]) da la sua dimostrazione consi-

derando un polinomio il cui comportamento e quello di (5.32) e lascia al suo lettore la

comprensione del meccanismo ricorsivo.

89

Si tratta ora di dividere il polinomio

x3 − σ1x2 + σ2x+ σ

21 − 2σ2,

per il polinomio (5.35). Otteniamo per il resto direttamente

σ21 − 2σ2 + σ3.

Dunque φ = σ21 − 2σ2 + σ3. ♢

90

Capitolo 6

Verso il calcolo differenziale

Nella presentazione moderna del calcolo differenziale si inizia con l’introdurre

il concetto di limite, dopo avere illustrato il concetto di funzione. Una fun-

zione f(x) ha per limite l per x che tende ad x0 quando ad ogni scelta di una

quantita positiva arbitraria ϵ e possibile collegare una quantita positiva δ

in modo che la disuguaglianza |f(x) − l| < ϵ sia soddisfatta per ogni x tale

che 0 < |x − x0| < δ. Strettamente connesso alla definizione di limite e il

concetto di funzione continua.

La derivata viene poi introdotta considerando il limite del rapporto in-

crementale. Una funzione f(x) e derivabile in x0 quando esiste il limite

dif(x0 + h) − f(x0)

h

per h che tende a 0.

I concetti di limite, continuita e derivabilita vengono poi sottoposti ad

un’analisi critica molto raffinata. Un funzione puo essere continua solo in un

punto.1 Una funzione continua in un punto non e necessariamente derivabile

1Si pensi alla funzione di Dirichlet:

D(x) =

{0 per x ∈ Q1 per x ∈ Q

91

in quel punto2, ecc.

Al termine dell’analisi critica, quando si esplora il patrimonio delle fun-

zioni elementari, che in genere sono continue e derivabili indefinitamente,

salvo che in alcuni punti eccezionali, si danno le applicazioni geometriche del

calcolo differenziale. Tra queste la tangente nel punto (x0, f(x0)) al grafico

della funzione f(x):

y− f(x0) = f′(x0)(x− x0). (6.1)

Qui spesso il rigore viene meno. Per certe curve elementari, come le co-

niche, la tangente (geometrica) e definita indipendentemente dal calcolo

differenziale, e si verifica che la (6.1) fornisce esattamente la tangente nota.

Per le curve algebriche il concetto di tangente puo essere collegato all’esistenza

di radici doppie (o multiple) e, modificando per esempio la (6.1) median-

te l’uso della derivazione parziale, possiamo ancora dar senso all’idea che

questa equazione fornisca una retta che coincide con la tangente nota.

Ma per altre curve abbiamo (senza il calcolo) solo un concetto intuitivo

di tangente geometrica, come posizione limite della secante. Se assegnamo

a questa posizione limite un esplicato rigoroso, otteniamo esattamente la

(6.1). Affermare quindi che la (6.1) e la tangente nel punto (x0, f(x0)) e

esattamente come affermare la derivabilita in quel punto.

Nel percorso storico che ha condotto al calcolo differenziale si e posto

all’origine proprio il concetto di tangente ad una curva algebrica. Per ge-

neralizzare questo concetto e venuto alla luce il concetto di funzione e solo

successivamente i concetti di continuita e derivabilita hanno raggiunto la

loro forma attuale.

6.1 Il metodo per le tangenti di Descartes

Questo metodo e introdotto nel Libro Secondo della celebre Geometrie.3

Ne presento qui un’esposizione in termini ‘modernizzati’, con il che, natu-

ralmente molti problemi storici importanti vengono posti in ombra.

La funzione xD(x) e continua solo in 0.2L’esempio piu diffuso e quello di |x| per x = 0.3Cf. [Descartes, 1954].

92

Figura 6.1: Il metodo delle tangenti di Descartes

Il punto P appartenga alla curva di equazione f(x, y) = 0. L’idea di

Descartes e quella di determinare un cerchio, con centro sulla retta y = 04

che abbia la stessa tangente in P della curva data. Poiche in un cerchio

la tangente e perpendicolare al raggio, questo equivale a determinare la

normale alla curva data. Si tratta dunque di terminare un punto Y in modo

tale che il cerchio di centro Y e raggio YP abbia la stessa tangente della

curva data. Poniamo OY = v. La circonferenza di centro Y e raggio PY = r

se Y non e determinato con esattezza (come Y ′ nella figura) intersechera la

curva in P ed in un punto ‘vicino’ P ′. Si tratta di esprimere la condizione

algebrica per la quale questa ‘vicinanza’ sparisca e i due punti P e P ′ vengano

a coincidere.

L’equazione della circonferenza di centro Y e raggio r e

(v− x)2 + y2 = r2.

Eliminando y tra le due equazioni5

f(x, y) = 0, (v− x)2 + y2 = r2,

otteniamo una equazione ϕ(x, [v, r]) = 0 che deve avere una radice doppia.

( Se indichiamo con (x, y) il punto generico dato, dovremmo utilizzare delle4Qui davvero procedo in modo molto sbrigativo. . .5Descartes non dispone ancora di una teoria dell’eliminazione. Ma e chiaro che, in

questo caso, dopo aver sostituito y con√r2 − (v− x)2 basta una semplice quadratura

per ottenere l’equazione risultante.

93

variabili ausiliarie X, Y per ottenere una equazioneϕ(X, x) con una radice

doppia per X = x, ∀x...Ma sono sottigliezze.) Si tratta dunque di esprimere

la condizione per la quale un’equazione algebrica abbia una radice doppia.

Descartes ha qui l’idea straordinaria di utilizzare il metodo dei coefficienti

indeterminati. Se un’equazione algebrica f(x) = 0 ha la radice doppia α

deve essere della forma

(x− α)2g(x).

Si tratta dunque di esplicitare questa condizione.

Consideriamo l’esempio semplice di y2 = 2px.6 Allora

(v− x)2 + 2px− r2 = 0,

ossia

x2 + 2(p− v)x+ v2 − r2 = 0.

L’equazione deve essere della forma

x2 − 2αx+ α2 = 0.

Dal confronto, si ha

v = p+ α.

Se indichiamo ancora con x l’ascissa del punto generico, abbiamo

v = p+ x.

Abbiamo unmetodo, in linea di principio applicabile ad ogni curva algebrica.

Descartes ha l’intuizione fondamentale (pur non possedendo ancora gli

strumenti adeguati per dimostrarlo) che questo metodo, al di la delle dif-

ficolta di calcolo conduce sempre, nel caso delle curve algebriche ad una

soluzione del problema.

Ma quali difficolta dobbiamo affrontare? Vediamo un esempio un po’

piu difficile: il calcolo della tangente alla curva di equazione y = x3.

6Che Descartes non considera, probabilmente perche e appunto troppo semplice.

94

Figura 6.2: Il metodo per la curva y = x3

Il calcolo procede nello stesso modo. Dobbiamo considerare il sistema{y− x3 = 0

(v− x)2 + y2 = r2(6.2)

L’eliminazione della variabile y conduce all’equazione

x6 + x2 − 2vx+ v2 − r2 = 0, (6.3)

che va confrontata con

(x− α)2(x4 + ax3 + bx2 + cx+ d) = 0. (6.4)

Dal confronto dei termini di quinto grado si ha 2α − a = 0, e dunque

a = 2α. Sostituendo nell’equazione che si ottiene eguagliando i termini di

quarto grado si ha b = 3α2, . . . Si arriva a concludere che v = α+3α5.7 Ma

consideriamo un caso appena un po’ piu complicato:

f(x, y) = x3 + y3 − 1 = 0,

e aggiungiamo l’equazione della circonferenza:

(v− x)2 + y2 = r2.

7Se y = x3, si ha yy ′ = 3x5 e quindi v = x+ yy ′ = x+ 3x5.

95

Cosa si ottiene eliminando y?

x6 − 3 vx5 +(15/2 v2 − 3/2 r2

)x4+(

−1+ 6 vr2 − 10 v3)x3+(

−9 v2r2 + 15/2 v4 + 3/2 r4)x2+(

−3 v5 + 6 v3r2 − 3 vr4)x

− 1/2 r6 + 1/2+ 1/2 v6+

3/2 v2r4 − 3/2 v4r2 = 0.

E dobbiamo confrontare questa equazione con

(x− α)2(x4 + ax3 + bx2 + cx+ d).

Si comprende bene il fatto che le difficolta di calcolo sono davvero grandi!

Osservazione 6.1 Ai nostri occhi, il metodo di Descartes sembra segnare

un enorme progresso. Non si tratta piu di formulare una congettura sulla

tangente per poi verificarne l’esattezza, ricorrendo alla dimostrazione per

assurdo. Abbiamo invece da portare a termine un calcolo. Tuttavia, noi

sappiamo (a posteriori) che il calcolo deve condurre ad una soluzione,8 ma

i contemporanei vedevano soprattutto le difficolta di calcolo, all’apparenza

insormontabili.

6.2 La risposta di Fermat

Fermat, dopo aver letto Geometrie di Descartes propone immediatamente

un metodo migliore :9 Il problema del calcolo della tangente e in realta un

problema di minimo. In effetti il clacolo della tangente significa trattare

la curva che si considera come una retta in un intorno del punto desidera-

to. La distanza di un punto da una retta e minima quando si traccia la

perpendicolare.

8Perche, se l’equazione della curva algebrica e f(x, y) = 0, la quantita v, calcolata

per il punto P della curva e xP − yP ·{

fxfy

}P.

9Cf. [Fermat, 1922, vol. I, pp. 133-36].

96

Figura 6.3: La risposta di Fermat

Il segmento YP deve avere lunghezza minima. Consideriamo ancora

f(x, y) = 0, (v− x)2 + y2 = r2.

si tratta di rendere minima la quantita r (o r2, il che e lo stesso).

Ora Fermat possiede un suo metodo per risolvere problemi di massimo

e minimo che espone, nella risposta che da a Descartes, proponendo un

esempio classico: tra tutti i rettangoli di dato perimetro il quadrato e quello

di area massima.

Figura 6.4: Un problema classico

Il prodotto AP × PB deve essere massimo con

AP + PB = p.

Sia AP = x: la quantita x(p−x) deve essere estremale. Dunque deve essere,

introducendo una quantita ‘opportuna’ e:10

x(p− x) = (x+ e)(p− x− e)10Qui semplifico molto. In realta Fermat parla di ‘adegualizzazione’ che poi si trasfor-

ma in uguaglianza. Sulla mancanza di rigore del procedimento di Fermat c’e un’ampia

letteratura.

97

Fermat conduce i calcoli nel modo seguente:

x(p− x) = x(p− x) + e(p− x) − ex− e2

Considera la adegualizzazione come un’uguaglianza.

x(p− x) = x(p− x) + e(p− x) − ex− e2

Poi trascura la quantita e2.

0 = 0+ e (p− x− x)

Considera poi la quantita a coefficiente di e e la eguaglia a 0.

p− 2x = 0⇒ x =p

2.

Abbiamo ritrovato la soluzione classica. Si noti che il metodo non distinge

tra massimi e minimi (o punti di flesso). In questo caso l’esistenza di un

massimo e affidata all’ovvia intuizione geometrica relativa al problema.

Vediamo comunque il metodo di Fermat all’opera ancora con y = x3.

Eliminando la y tra questa equazione e (v− x)2 + y2 = r2 otteniamo

r2 = x6 + x2 − 2vx+ v2

Si tratta ora di sostituire x con x + e e di eliminare i termini uguali nella

adegualizzazione. Poi dobbiamo eliminare tutti i terminin che sono molti-

plicati per la quantita e elevata ad una potenza maggiore di 1. Si comprende

immediatamente che il risultato e (di fatto, la derivazione e ancora lontana)

e · ddxr2. (6.5)

Abbiamo quindi

e · (6x5 + 2x− 2v).

Dunque v = 3x5 + x. Otteniamo, ma in modo molto piu rapido, quanto

visto in precedenza.

98

6.3 Le difficolta da superare (viste a

posteriori)

Consideriamo, utilizzando le notazioni moderne, l’esempio dato da

y = f(x), (v− x)2 + y2 = r2.

Abbiamo

(v− x)2 + f(x)2 = (v− x− e)2 + f(x+ e)2.

Il calcolo diviene

2(v− x) e = f(x+ e)2 − f(x)2.

Sviluppando f(x+e) (prima della formula di Taylor!) avremo un coefficiente

per e1 (che indichiamo, non a caso con f ′(x)), un coefficiente per e2, che

indichiamo con g(x), ecc.

2(v− x) e =(f(x) + ef′(x) + e2g(x) + e3h(x) + . . .

)2− f(x)2

= f(x)2 + 2f(x)f′(x) e + f ′(x)2e2 − f(x)2 =

= 2f(x)f′(x) e .

Quindi

v− x = f(x)f′(x).

Ma un’equazione della forma

y− f(x) = 0

non e un dato naturale nel contesto delle curve algebriche.

Ma anche in questo caso ‘artificiale’ dal punto di vista della matematica

del Seicento, il problema del calcolo della tangente diviene quello di svelare

una struttura. Ecco un esempio per chiarire la difficolta. Sia

f(x) =x+ 1

x− 1,

allora

v = x+ f(x)f′(x) =x4 − 3 x3 + 3 x2 − 3 x− 2

(x− 1)3.

99

Qundo si ottiene il risultato finale, diviene difficile individuare le tappe (gli

algoritmi) che conducono a questo risultato. Naturalmente la situazione e

ancora piu complicata se abbiamo un’equazione del tipo f(x, y) = 0.

Ma tutto e chiaro oggi, con i moltiplicatori di Lagrange:

ϕ(x, y) = (v− x)2 + y2

e una quantita che bisogna minimizzare con il legame dato da

f(x, y) = 0.

Allora

∇f = λ∇ϕ,

ossia ∂f∂x

∂f∂y

= λ

∂ϕ

∂x

∂ϕ

∂y

= λ

−2(v− x)

2y

Quindi

v = x− y∂f∂x∂f∂y

.

Si tratta quindi di comprendere la struttura di calcolo di questo risultato.

Per esempio, se

f(x, y) = x3 + y3 − 1 = 0,

si ha

v =xy2 − x2

y2.

Si tratta di evidenziare, guardando questo risultato, il ruolo delle operazioni

(identiche dal punto di vista algoritmico)

f ∂f

∂x,

f ∂f

∂y,

che si cela nel risultato finale.

100

6.4 Let Newton be. . .

Nel momento in cui Newton inizia a considerare le sue ricerche sul calcolo

egli possiede le conoscenze seguenti.11

• Il metodo per le tangenti di Descartes con tutti gli arrichhimenti rac-

colti da van Schooten nella sua seconda edizione latina della Geome-

trie.12

• (in termini moderni) ∫a0

xndx =an+1

n+ 1;

• La linearita di∫.

Dopo molti tentativi egli arriva a considerare l’iperbole di equazione

ax = y2 − x2.

Figura 6.5: Gli inizi di Newton

11Il percorso intellettuale degli anni giovanili di Newton e analizzato in dettaglio in

Panza [2005]. In ? si trova un’analisi profonda e accurata dell’evoluzione delle idee

newtoniane sul metodo sino agli anni della vecchiaia.12Cf. [Descartes, 61]. In particolare vi si trova esposto il contributo di Fermat visto

nella Sezione 6.2.

101

Newton ha l’idea fondamentale di prendere per v direttamente la sotto-

normale, il che significa che egli calcolera direttamente yy ′ e non x + yy ′.

Accanto all’incremento o (una notazione che egli riprende da Gregory), in-

troduce l’ordinata z, corrispondente a x + o.13 Newton considera le due

equazioni:

a(x+ o) = z2 − (x+ o)2,

v2 + y2 = (v− o)2 + z2

La seconda puo sempre essere sostituita da

z2 = y2 + 2vo.

Sostituendo nella prima, si ha:

ax+ ao = y2 + 2vo −x2 − 2xo+ o2 .

Quindi, con le modalita viste,

v =a

2+ x.

Il suo approccio non tarda a divenire piu sistematico: la seconda ordinata

appare ormai direttamente data da

z2 = y2 + 2vo,

o, all’occorrenza come14

z =√y2 + 2vo = y

(1+

vo

y2

)= y+

vo

y.

13Evidentemente o allude a 0. Newton in questo periodo non ha alcuna preoccupazione

fondazionale.14Newton sa gia, in seguito alla sua lettura di Wallis che

(1+ x)α = 1+ αx+α(α− 1)

1 · 2x2 + . . .

Cf. Whiteside [1961]. Su Wallis si puo vedere il libro recente [Maieru, 2007].

102

In generale (anche se questa generalita si puo dedurre solo dal moltiplicarsi

degli esempi)

f

(x+ o, y+

vo

y

)= 0

e quindi∂f

∂xo +

∂f

∂y

v

yo = 0.

Il risultato precedente appare ‘empiricamente’. Ma Newton comincia a

riflettere sulla ‘cellula fondamentale’

xmyn.

Supponiamo d’avere

f(x, y) = axmyn − b = 0.

Il calcolo ‘pratico’ di v con il nuovo approccio da

a (x+ o)m(y+

vo

y

)n= b

ossia

a (xm +mxm−1o+ . . . )

(yn + nyn−1

vo

y+ . . .

)= b.

Dunque

axmyn + a

(mxm−1yno+ nyn−1xm

vo

y+ . . .

)= b.

Le operazioni che sono coinvolte nel calcolo di v cominciano ad emergere.

mxm−1yn + nyn−1xm · vy= 0.

Newton non tardera a capire che l’essenza del calcolo e data da

xm mxm−1. (6.6)

e naturalmente non tarda a comprendere il legame con l’operazione inversa,

data da

xm xm+1

m+ 1. (6.7)

Le linee essenziali che conducono al calcolo differenziale sono tracciate.

103

Osservazione 6.2 V’e tuttavia un’osservazione importante da aggiungere.

Anche se Newton con i concetti di fluente e flussione giungera molto vicino

a quelli di funzione e di derivata, tuttavia non dara mai un rilievo esplicito

alle regole di derivazione, al contrario di quanto fara Leibniz.

Sia Q(x) una ‘quantita’ dipendente da una quantita fondamentale x. Il

passaggio da Q(x) a Q ′(x) (mi permetto di utilizzare la notazione di La-

grange) avviene per Newton attraverso una mediazione. Si tratta dapprima

di esprimere Q(x) come una somma (finita o infinita) di termini del tipo

Q(x) = axα + bxβ + cxγ + · · · ,

dove a, b, c, . . . sono delle costanti e α,β, γ, . . . dei numeri razionali. Poi

l’algoritmo si applica ad ogni singola cellula e si estende per linearita.

Vedremo tutto questo in dettaglio nel prossimo capitolo.

Anche quando Newton introduce dei simboli come

X, ·X, X·

per denotare delle espressioni che noi indicheremmo con

f(x, y), x∂f

∂x, y∂f

∂y15

si tratta al piu di abbreviazioni comode per indicare l’estensione per lineari-

ta, seguita dalla moltiplicazione per x o per y dell’operazione del tipo (6.6)

eseguita sulle ‘cellule fondamentali’ rispetto all’una od all’altra variabile

(considerando la seconda variabile come una ‘costante’).

15Cf. [Newton, 1981, vol. 1, pp. 289-294]

104

Capitolo 7

Il De Analysi di Newton

Il titolo completo di questo testo e De Analysi per Æquationes Numero Ter-

minorum Infinitas.1 L’uso moderno di abbreviarlo in De Analysi non e solo

per comodita. Indica anche l’idea che l’analisi sia una disciplina autonoma.

Newton, soprattutto negli ultimi anni della sua vita,2 era ben lungi dal con-

dividere quest’idea e cercava invece di restaurare quello che, a suo giudizio,

era l’ideale della scienza greca, un’immaginaria prisca sapientia.

Su invito di Barrow, Newton aveva inviato questo testo a Collins per

informarlo sui progressi compiuti. Si tratta quindi di un’esposizione sche-

matica, che mira ad informare sui risultati ottenuti piuttosto che ad orga-

nizzarli in un quadro rigoroso.3 Proprio per queste ragioni e uno dei testi

piu significativi, ove si coglie lo sviluppo delle idee ancora in fieri.

1Il testo latino, con la traduzione inglese a fronte di Whiteside, si trova in [Newton,

1981, vol. 2, pp. 206-247]. Una traduzione inglese di un tempo di poco successivo a quello

di Newton, della quale anche faro uso, si trova in [Newton, 1964, vol. 1, pp. 3-25]. John

Stewart, l’editore di questo testo (nel 1745) ritiene opportuno, come vedremo, aggiungere

delle dimostrazioni quando ritiene che il testo di Newton non sia piu ‘all’altezza dei

tempi’.2Cf. [Guicciardini, 2009].3Cf. l’Introduzione di Whiteside a [Newton, 1964].

105

7.1 Le regole

Il testo inizia con queste parole:

Il Metodo Generale, che ho inventato un considerevole tempo fa,

per misurare la quantita delle curve per mezzo di serie infinite

nel numero dei termini, e in cio che segue, piuttosto spiegato

brevemente che dimostrato accuratamente.4

Con riferimento alla figura a lato, Newton indica la baseAB con x, l’ordinata

BD assunta come perpendicolare alla base, con y.

Poi a, b, c, . . . indicano delle quantita

date mentre m e n sono numeri interi.

Poste queste convenzioni,vengono intro-

dotte delle regole. La prima e formulata nel

modo seguente:

Regola 7.1 Se axmn = y allora

AreaABD =an

m+ nx

m+nn .5

Al di la dell’evidente valore ‘intrinseco’ della

regola, va osservato il profondo significato dell’uso di un simbolismo ade-

guato. In effetti dobbiamo proprio a Newton un progresso enorme nell’uso

del simbolismo.6

Newton dimostra questa regola solo alla fine del testo. Ma per maggior

chiarezza e meglio vedere la dimostrazione immediatamente. Si notera che,

pur affermando che la relazione tra x ed y puo essere arbitraria, Newton

ritiene opportuno utilizzare dapprima un ‘esempio paradigmatico’.

4“The General Method, which I have devised some considerable Times ago, for mea-

suring the Quantity of Curves, by Means of Series, infinite in the Number of Terms, is

rather shortly explained, than accurately demonstrated in what follows” [Newton, 1964,

vol. 1, p. 3]. La traduzione e mia. Anche nel seguito le traduzioni sono mie.5Newton lascia all’evidenza fornita dalla figura il fatto che sia y(0)=0.6Su questo aspetto si puo vedere [Serfati, 2005], un testo interessante anche se non

esente da certi rilievi critici.

106

Figura 7.1: La figura del De Analysi

Sia dunque, con riferimento alla Figura 7.1, AB = x, BD = y,AreaABD =

z, ‘nel momento iniziale’. Sia poi Bβ = o, BH = v, ove v e determinato in

modo che

Rettangolo BβKH = Superficie BβδD.7

Di conseguenza, se Aβ = x + o, si ha AδB = z + ov. Newton sceglie ora

come esempio la curva che sottende l’area z tale che

z2 =4

9x3.

Allora

(z+ ov)2 =4

9(x+ o)3

e dunque

z2 + 2zov+ o2v2 =4

9

(x3 + 3x2o+ 3xo2 + o3

).

Ora, se si suppone che Bβ diminuisca continuamente fino ad

annullarsi, od a scomparire, v ed y in questo caso diverranno

uguali. . . 8

7Bisognera attendere un secolo e mezzo per metter in discussione questa possibilita. . .8“Now if we suppose Bβ to be diminished infinitely and to vanish, or to be nothing,

v and y in that Case will be equal . . . ” [Newton, 1964, p. 341].

107

Dunque4

9× 3x2 = 2× 2

3x3/2y,

ossia

y =√x.

Ecco ora la dimostrazione generale. Sia

n

m+ nax

m+nn = z. (7.1)

Per semplificare Newton pone nam+n

= c,m+ n = p, in modo che la (7.1) si

riduce a

cnxp = zn. (7.2)

A questo punto sostituisce x + o al posto di x e z + ov al posto di z (o

z + oy: Newton afferma sbrigativamente che e la stessa cosa). Applica

quindi la formula del binomio.9

cn(xp + poxp−1 + · · · ) = zn + noyzn−1 + · · · . (7.3)

Ottiene quindi

cnpxp−1 = nyzn−1. (7.4)

Risostituendo, arriva a concludere che

axmn = y. (7.5)

Newton conclude che, reciprocamente, se axmn = y, sara

n

m+ nax

m+nn = z. 2

Cio che Newton ha dimostrato puo anche interpretarsi come una prima

formulazione del Teorema fondamentale de calcolo.

9Sulla scoperta di questa formula, a partire dalla lettura di Wallis si puo vedere

[Whiteside, 1961].

108

Newton in effetti dispone di tre quanti-

ta, x, y, z disposte come nella figura accanto.

Ecco come si puo riassumere il tutto: se il

legame tra x e z e dato da axα = z, si ha

y = αaxα−1. Se si ha invece y = bxβ, si ha

z = bβ+1xβ+1.

Poiche, come vedremo nella seconda rego-

la, ogni quantita (per Newton) e data da una

somma, eventualmente infinita, di termini del

tipo axα il risultato ha un valore piu generale,

valido per ogni quantita.

Ovviamente piu che una dimostrazione completa si ha qui un compito

affidato alla matematica successiva.

Vediamo ora la seconda regola.

Regola 7.2 Se il valore di y e composto di parecchi termini, conseguente-

mente l’area sara composta dalle aree che risultano da ognuno dei termini.10

Newton si limita a fornire degli esempi per chiarire la regola. Ovviamente

quando si ha un termine della forma x−1 la regola viene ad essere in difetto.

In questo caso e possibile applicare la regola solo se, per esprimersi in termini

moderni, l’integrazione si calcola a partire da un valore β > 0.

La terza regola ha nel contesto della matematica newtoniana un’importanza

fondamentale.

Regola 7.3 Ma se il valore di y o di ognuno dei suoi termini e piu compo-

sto dei precedenti, deve essere ridotto in termini piu semplici, effettuando

l’operazione sulle lettere nello stesso modo con il quale gli aritmetici di-

vidono in numeri decimali, estraggono la radice quadrata, o risolvono le

10“If the Value of y be made up of several such Terms, the Area likewise shall be made

up of the Areas which result from every one of the terms” [Newton, 1964, p. 322]. In

altre parole∫e un operatore lineare.

109

equazioni affette; e successivamente, con le regole precedenti voi scoprirete

le superfici cercate corrispondenti alle curve date.11

Si tratta di trasformare una quantita y data mediante una certa espres-

sione, in un serie di potenze. Ovviamente qui Newton non puo indicare un

metodo generale (anche perche rimane nel vago il modo con il quale y e

assegnata) e deve quindi limitarsi ad esempi paradigmatici. Ecco il primo

esempio.

Sia y =a2

b+ xe vediamo come si deve effettuare la divisione in termini

simbolici.

a2 =a2

b(b+ x) −

a2

bx,

−a2

bx = −

a2

b2x (b+ x) +

a2x2

b2

a2x2

b2=

a2

b3x2 (b+ x) −

a2

b3x3,

. . . . . . . . . . . . . . .

Quindia2

b+ x=a2

b−a2

b

x

b+a2

b

x2

b2− · · ·

Un altro esempio interessante (sul quale non mi soffermo) e dato da

√a2 + x2 = a+

x2

2a−x4

8a3+ · · ·

Si tratta di esempi oggi ben noti i quali tuttavia al tempo di Newton rap-

presentano dei risultati d’avanguardia. Naturalmente la convergenza delle

serie e affidata all’intuizione geometrica.

11“But if the Value of y, or any of it’s Terms be more compounded than the foregoing,

it must be reduced into more simple Terms; by performing the Operation in Letters , after

the same Manner as Arithmeticians divide in Decimal Numbers, extract the Square Root,

or esolve affected Equations; and afterwards by the preceding Rules you will discover the

Superficies of the Curve sought.”[Newton, 1964, p. 324]

110

7.2 Le applicazioni

Chiarite le regole ed il loro uso, Newton presenta delle applicazioni. La pri-

ma applicazione e un metodo per approssimare le radici di un’equazione nu-

merica (il csiddetto metodo delle tangenti di Newton). Il metodo viene poi

esteso anche alle equazioni aventi dei coefficienti letterali: un’applicazione

importante, che consente data una equazione del tipo f(x, y) = 0 di ottenere

lo sviluppo in serie di x o di y. Si tratta di applicazioni ben note, che oggi

vengono riproposte in modo analogo (anche se, ovviamente, con maggior

rigore)

Vediamo dapprima il calcolo approssimato della radice reale dell’equazione

x3 − 2x− 5 = 0.12

L’approssimazione delle radici: il caso numerico

Newton considera l’equazione (f(x) e un’aggiunta mia)

f(x) = x3 − 2x− 5 = 0 (7.6)

e osserva che l’equazione ha una radice compresa tra 2 e 2+ 110.13

La sostituzione data da x = 2+ p nell’equazione fornisce

g(p) = p3 + 6p2 + 10p− 1 = 0.

A questo punto Newton ritiene ragionevole trascurare le potenze di ordine

maggiore di 1 di p e risolve l’equazione 10p− 1 = 0, il che da p = 110.14

12Per la comodita del lettore utilizzo la variabile x invece della y di Newton.13Sostituendo il valore 2 in f(x)si ottiene -1, mentre sostituendo 2+ 1

10si ottiene 61

1000.

Inoltre dalla regola dei segni (di Descartes) si ha che l’equazione f(x) = 0 ha una sola

radice positiva.14A posteriori possiamo notare che

f(2+ p) = f(2) + f ′(2)p+ f ′′(2)p2

2!+ f ′′′(2)

p3

3!.

Quindi Newton calcola p = − f(2)f ′(2) .

111

Si puo procedere con l’equazione g(p) = 0 nello stesso modo. Posto

p = 110+ q, si ha

h(q) = g

(1

10+ q

)= q3 + 6.3q2 + 11.23q+ 0.061 = 0

e si procede nello stesso modo, considerando i termini sino al primo grado

11.23q− 0.061 = 0. Quindi q ≃ −0.0054, e se ci si arresta a questo punto

(ma Newton fa un passo ulteriore) si ha, indicata con x0 la radice

x0 ≃ 2+ p+ q ≃ 2.094.

Osservazione 7.1 Si notera che

h(q) = g

(1

10+ q

)= f

(2+

1

10+ q

)e quindi il secondo passaggio e dato da

2+1

10−f(2+ 1

10

)f ′(2+ 1

10

) .Appare il noto algoritmo iterativo dato da

xn+1 = xn −f(xn)

f ′(xn).

Newton non fornisce tuttavia alcuna argomentazione in merito alla conver-

genza del procedimento, ne vi accosta un’interpretazione geometrica.

L’approssimazione delle radici: il caso delle equazioniaffette

Consideriamo ora l’equazione

y3 + a2y− 2a3 + axy− x3 = 0. (7.7)

Si tratta di un’equazione in y ove compaiono sia una costante a sia una

quantita variabile x. Newton vuole ottenere y come una serie di potenze in

x (che dipende anche dal parametro a).

112

La dimostrazione di Newton ha carattere un po’ qualitativo. Egli infatti

introduce delle nuove variabili p, q, r, . . . alle quali assegna un doppio ruo-

lo: esse trasformano progressivamente l’equazione di partenza f(y; x, a) in

equazioni successive fp(p, x, a), fq(q, x, a), . . . ma poi in queste equazioni

assumono il ruolo ausiliario di monomi di grado 1, 2, 3, . . . che permettono

il passaggio alle equazioni successive.

Ora, per x = 0, si ha l’equazione y3 + a2y − 2a3 = 0, che ha la radice

y = a. Se indichiamo la serie di potenze che vogliamo ottenere con S,

abbiamo allora, arrestandoci al termine costante, S = a+ · · ·Ora Newton pone nell’equazione (7.7) y = p+ a. Ottiene quindi

4a2p+ 3ap2 + p3 + a2x+ apx− x3 = 0. (7.8)

Ora assegna a p un altro ruolo: quello di essere un monomio della forma kx1

che eguagli a zero i termini di primo grado nella (7.8). Newton considera

allora 4a2p e a2x e pone 4a2p + a2x = 0 e quindi p = − 14x. La serie S

diviene S = a − 14x + · · · Procedendo nello stesso ordine di idee, Newton

pone p = − 14x+ q nella (7.8) (ove ora p e di nuovo una variabile) e ottiene

4a2q+ 3aq2 −1

2aqx−

1

16ax2 + q3 −

3

4q2x+

3

16qx2 −

65

64x3 = 0. (7.9)

Se ora si immagina che q sia della forma kx2 e si procede come in precedenza,

si deve porre 4a2q− 116ax2 = 0, ossia q = 1

64ax2. A questo punto abbiamo

S = a−1

4x+

1

64ax2 + · · · (7.10)

ed e chiaro come possiamo ottenere i termini successivi.

7.3 Applicazione ad altri problemi dello

stesso genere

A questo punto, Newton dispone di potenti tecniche per associare a quan-

tita legate da equazioni algebriche sviluppi in serie di potenze e dispone un

algoritmo di calcolo per l’area sottostante ad una data curva. Per procedere

113

oltre deve chiarire che la natura dell’algoritmo non e legata alla raffigura-

zione geometrica. Questa non e altro che un supporto visivo per collegare

la variazione di due quantita. E deve anche mostrare che non vi e alcuna

ragione per la quale la dipendenza debba esprimersi mediante quantita di

genere diverso, come un’estensione lineare da una parte ed una superficie

dall’altra. Tutto cio per noi appare di scarso rilievo, poiche ogni quantita

viene ridotta alla sua valutazione numerica, ma, ovviamente, non e la stessa

cosa per Newton.

Sia ora ABD una curva qualsiasi e AHKB un rettangolo disposto come

in figura, tale che AH = BK = 1. Si immagini il movimento uniforme della

linea DBK a partire dalla posizione AH in modo che questo moto descriva

le due aree.

Figura 7.2: Le applicazioni

Ecco quanto Newton afferma:

. . . dal momento BD dato con continuita voi potete, per mezzo

delle regole precedenti, investigare l’area ABD descritta da esso

o paragonarla con la’area AK (x) che e descritta dal momento

1.

Ora con gli stessi mezzi con i quali la superficie ABD, data

in ogni istante dal suo momento, e scoperta per mezzo delle

regole precedenti, con mezzi simili una qualsiasi altra quantita

114

puo essere investigata a partire dai suoi momenti nello stesso

modo.15

Sviluppi in serie di funzioni elementari

Vediamo uno degli esempi successivi (che ho un po’ modificato).

Figura 7.3: La lunghezza dell’arco

Nella Figura 7.316 il raggio del semicerchio CA sia 1. Sia CB = x

e D,H siano punti ‘infinitamente vicini’ di modo che la linea DT possa

confondersi con la tangente. Vogliamo valutare la lunghezza dell’arco LD.

Il momento dell’arco LD e DH, mentre il momento di CB e BK. Ora

DH : BK = DT : BT = CD : BD. Ora BK = 1, CD = 1, BD =√1− x2 e

quindi

DH

BK=

1√1− x2

=

√1− x2

1− x2. (7.11)

15“. . . from the moment BD continually given, you can, by Means of the preceding

Rules, investigate the area ABD described by it, or compare it with AK (x), which is

described by the moment 1.

Now by thw same Means that the Superficies ABD from it’s Moment being at all

Times given, is discovered by the foregoing Rules, by the like Means may any other

Quantity be investigated from it’s Moment given in like manner.”[Newton, 1964, p. 17]16Per comodita ho ribaltato la figura di Newton

115

Ora 11−x2

= 1+x2+x4+ . . . ,√1− x2 = 1− x2

4− x4

8+ · · · .17 Si tratta quindi

di integrare termine a termine il prodotto di queste due serie. Si ottiene

arc(LD) = x+1

6x3 +

3

40x5 + · · · 18 (7.12)

Successivamente Newton,‘estraendo la radice dell’equazione’, ottiene anche

la serie del seno,

x = z−1

6z3 +

1

120z5 + · · ·

e da questa quella del coseno. In merito alla struttura dei termini delle serie

ottenute, osserva che

. . . quando 5 o 6 termini di queste radici sono noti, in genere, si

puo continuare a piacere, osservando l’analogia della progressio-

ne.19

Il De Analysi termina con alcune considerazioni sulla convergenza. New-

ton non possiede ancora gli strumenti necessari per analizzare compiutamen-

te il problema e si limita a suggerire che la quaestione possa essere trattata

sul modello della Proposizione X.1 degli Elementi. Newton osserva che, nel

caso della serie geometrica

1+ x+ x2 + x3 + · · · ,

posto x = 12si ha (come e evidente) x = 1

2(x + x2 + x3 + . . . ) e x2 =

12(x2 + x3 + . . . ), ecc. Naturalmente questo garantisce la convergenza della

serie per x ≤ 12. Un risultato non entusiasmante. E non e facile comprendere

come possa essere modificato per ottenere risultati piu generali.

17Il prodotto delle due serie da∑∞

n=0 cnx2n, ove cn =

∑nk=0(−1)

k(1/2k

)=

(−1)n(−1/2n

). Un risultato certo accessibile a Newton. Si veda [Gould, 1972, p. 1].

18Ovviamente si tratta della serie dell’arcoseno. Certamente Newton era in grado di

assegnare una formula per il termine generale, ma qui si accontenta di calcolare un certo

numero di termini.19“. . . when 5 or 6 Terms of those roots are known, they may be continued at Pleasure

for most Part, by observing the Analogy of the Progression”. [Newton, 1964, p. 20]

116

Capitolo 8

La serie di Lagrange

8.1 Serie e serie formali

Nel Settecento l’uso degli sviluppi in serie che abbiamo visto nel De analysi

di Newton acquista un rilievo enorme, soprattutto nell’opera di Eulero e di

Lagrange. Tuttavia vi e una differenza importante rispetto all’uso attuale

che occorre segnalare. Questa differenza puo essere ben illustrata da un

esempio. Consideriamo la ‘uguaglianza’ seguente:

1

1− x= 1+ x+ x2 + x3 + · · · (8.1)

La (8.1) puo essere considerata una scrittura incompleta, che va riscritta

nella forma1

1− x= 1+ x+ x2 + x3 + · · · , |x| < 1. (8.2)

Naturalmente, se vogliamo interpretare la (8.1) assegnando un valore ad x,

la (8.2) e una riscrittura indispensabile. Ma possiamo interpretare la (8.1)

anche nell’ambito della teoria delle serie formali. Oggetti del tipo

a0 + a1x+ a2x2 + · · · (8.3)

117

che vengono sommati e moltiplicati o manipolati in vario modo e per i quali,

quando il termine di grado 0 e non nullo, esiste anche l’inverso. In questo

contesto, l’uguaglianza (8.1) significa la possibilita di scrivere

1

1− x= a0 + a1x+ a2x

2 + · · · (8.4)

ossia

1+ 0 x+ 0 x2 + · · · = (1− x)(a0 + a1x+ a2x2 + · · · ). (8.5)

Quindi l’uguaglianza si traduce nelle infinite equazioni

1 = a0,

0 = a1 − a0,

0 = a2 − a1,

. . . . . . . . . . . .

che giustificano la (8.1) nell’ambito della teoria delle serie formali. Nel

Settecento i due aspetti sono separati in modo meno netto. In genere uno

sviluppo in serie viene ottenuto formalmente a partire da un problema e le

riflessioni sulla convergenza vengono demandate, talvolta, alla concretezza

del problema oroginario.

Vediamo un esempio introduttivo: Consideriamo l’equazione di secondo

grado

x2 + px+ q = 0.

Abbiamo per questa equazione la formula risolutiva

x = −p

2±√p2

4− q = −

p

2± |p|

2

√1−

4q

p2.

Utilizzando la serie binomiale possiamo scrivere

x = −p

2± |p|

2

{1+

1

2

(−4q

p2

)+1

8

(−4q

p2

)2+ . . .

}Otteniamo cosı due serie che certamente convergono per infinite scelte di

p e q (quando la serie binomiale risulta convergente) e dunque le due serie

forniscono, in questo caso, un altro modo per risolvere l’equazione. Ma

si puo notare che l’equazione puo avere radici reali e tuttavia la serie di

Lagrange non risultare convergente. . .

118

8.2 La prima formulazione

La serie di Lagrange si ottiene in questo ordine di idee.1 Sia data l’equazione

0 = a0 − a1y+ a2y2 − . . . (8.6)

che supponiamo abbia le radici α1, α2, α3, . . .2 Possiamo supporre che sia

a0 = 0, perche, ovviamente siamo interessati alla ricerca di radici non

nulle. Si puo ulteriormente supporre che sia a1 = 1, il che non alte-

ra la generalita del problema. Possiamo ora scrivere (rammentando che

a0 = (−1)nα1α2 · · ·αn)

a0 − y+ a2y2 − . . . = a0

(1−

y

α1

)(1−

y

α2

)(1−

y

α3

)· · · (8.7)

Dividendo ambo i membri per −y, possiamo scrivere ancora

1−a0

y− a2y+ a3y

2 + . . . =a0

α1

(1−

α1

y

)(1−

y

α2

)(1−

y

α3

)· · · (8.8)

Prendiamo ora i logaritmi di ambo i membri della (8.8):

log

(1−

a0

y− a2y+ a3y

2 + . . .

)=

loga0

α1+ log

(1−

α1

y

)+ log

(1−

y

α2

)+ . . .

(8.9)

Lagrange ora prosegue sviluppando in serie da ambo le parti e confron-

tando i rispettivi sviluppi. Discuteremo in seguito brevemente la possibilita

di operare in questo modo, ma per ora limitiamoci a seguire quanto fa

Lagrange. Indichiamo, per semplicita con Y la quantita data da

Y =a0

y+ a2y− a3y

2 + . . .

e rammentiamo che

−log(1− t) = t+t2

2+t3

3+ · · ·

1La prima formulazione si trova in [Lagrange, 1768].2Lagrange scrive 0 = a− bx+ cx2 − dx3 + . . . ed indica le radici con p, q, r, . . .

119

Abbiamo allora, sviluppando in serie:

Y +Y2

2+Y3

3+ . . . = log

α1

a0+ (8.10)

+

(α1

y

)+1

2

(α1

y

)2+1

3

(α1

y

)3+ . . .

+

(y

α2

)+1

2

(y

α2

)2+1

3

(y

α2

)3+ . . .

+

(y

α3

)+1

2

(y

α3

)2+ ...

...

Il secondo membro della (8.10) ha la forma di una “serie di Laurent”, e vi si

trova un solo termine che contiene y−1 e questo termine ha come coefficiente

α1. Lagrange assume ora (implicitamente) l’ipotesi che sia possibile riscri-

vere la serie a primo membro nella stessa forma, evidenziando le potenze

positive e negative di y. In questa ipotesi, il coefficiente di y−1 nella serie

a primo membro da uno sviluppo in serie che fornisce il valore della radice

α1 . Analogamente il coefficiente di y−2 del secondo membro e 12α21 e dal

confronto con l’analogo coefficiente a primo membro possiamo ottenere il

valore α21...

Una questione va chiarita se vogliamo interpretare in termini ‘moder-

ni’ quanto fa Lagrange. Poiche lo sviluppo scritto a secondo membro ha

evidentemente la forma di una serie di Laurent, ed ha significato solo per

|y| > |α1|, |y| < |α2|, |y| < |α3|, ...

bisogna supporre che le radici siano ordinate in modo che α1 sia la radice

di modulo minimo. Cio che (eventualmente) si ottiene e dunque il valore

della radice di modulo minimo ed il valore delle potenze successive.

Veniamo comunque al problema che ora affronta Lagrange, rimandando

le osservazioni critiche. Si tratta di calcolare i coefficienti di y−1, y−2, y−3, . . .

dello sviluppo

Y +Y2

2+Y3

3+ . . . ,

ove

Y =a0

y+ a2y− a3y

2 + . . .

120

Sia

X = a2y− a3y2 + . . .

Possiamo scrivere

− log (1− Y) = − log

(1−

a0

y− X

)= − log

(1−

a0

y

)−log

1− X

1−a0

y

.Questa manipolazione permette di scrivere ora

− log (1− Y) = Y +Y2

2+Y3

3+ . . . = (8.11)

=a0

y+1

2

a20y2

+1

3

a30y3

+1

4

a40y4

+ . . .+

X

1−a0

y

+1

2

X2(1−

a0

y

)2 + 1

3

X3(1−

a0

y

)3 + 1

4

X4(1−

a0

y

)4 + . . .Si tratta di calcolare il contributo al coefficiente di y−1 del generico

termine1

n

Xn(1−

a0

y

)n .A questo punto Lagrange ha un’altra intuizione di grande efficacia. Egli

comprende che la struttura del calcolo diviene trasparente se si rinuncia al

calcolo esplicito di Xn e ci si limita ad indicare opportunamente i coefficienti

delle potenze successive. Con lieve variazione di simboli, possiamo dunque

scrivere3

Xn = bn,0 + bn,1y+ bn,2y2 + bn,3y

3 + ...

Si ha poi, evidentemente (in notazione moderna)

1

(1− t)n=∑

k

(n+ k− 1

k

)tk.

3Per la verita tutti i termini noti bn,0 sono nulli. Lagrange tuttavia non tiene conto

di questa particolarita.

121

A questo punto il contributo al termine in y−1 di

Xn(1−

a0

y

)nsi riduce al calcolo del coefficiente di grado −1 del prodotto

(bn,0 + bn,1y+ bn,2y

2 + bn,3y3 + ...

)(∑k

(n+ k− 1

k

)(a0

y

)k).

Si ha dunque

bn,0

(n

1

)a0 + bn,1

(n+ 1

2

)a20 + bn,2

(n+ 2

3

)a30 + . . .

e la somma va estesa fin tanto che vi sono termini bn,i non nulli. 4

Se ora guardiamo la struttura della (8.11), abbiamo, con tutta evidenza

per il coefficiente di y−1

a0 +

+b1,0a0 + b1,1a20 + b1,2a

30 + . . .

+1

2

(2b2,0a0 + 3b2,1a

20 + 4b3,1a

30 + . . .

)+

+1

3

(3b3,0a0 + 6b2,0a

20 + . . .

)+

. . .

Abbiamo dunque il valore di α1. In modo analogo si possono dedurre i

valori di α21, α22, . . .

4Se il polinomio di partenza ha grado m, il polinomio X ha grado m − 1, e dunque

Xn ha grado n (m− 1) .

122

Ma Lagrange non si arresta qui! Osservando la struttura della somme

infinite che danno α1, α21, α

31, . . . egli osserva che si puo scrivere

α1 =

{y+ 1 ·

[Xy+

1

2!

d(X2y2

)dy

+1

3!

d2(X3y3

)dy2

+ . . .

]}y=a0

,

α21 =

{y2 + 2 ·

[Xy2 +

1

2!

d(X2y3

)dy

+1

3!

d2(X3y4

)dy2

+ . . .

]}y=a0

,

α31 =

{y3 + 3 ·

[Xy3 +

1

2!

d(X2y4

)dy

+1

3!

d2(X3y5

)dy2

+ . . .

]}y=a0

,

. . .

(8.12)

e dunque, in generale

αm1 =

{ym +m ·

∞∑k=0

1

(k+ 1) !

dk(Xk+1ym+k

)dyk

}y=a0

.

Esempio 8.1 Sia data l’equazione a − y + cy2 = 0. Abbiamo, in questo

caso X = cy. Per calcolare la radice α1 dobbiamo dunque dapprima valutare

la serie

y+ cy2 +1

2!

d(c2y4

)dy

+1

3!

d2(c3y6

)dy2

+1

4!

d3(c4y8

)dy3

+ . . . =

= y+

∞∑k=0

ck+1

k+ 1

(2k+ 2

k

)yk+2,

e poi sostituire in essa il valore y = a. Abbiamo dunque per soluzione

a+

∞∑k=0

ck+1

k+ 1

(2k+ 2

k

)ak+2,

che e esattamente il valore che proviene dallo sviluppo in serie di

1

2c

(1−

√1− 4ca

),

ossia della radice di modulo minimo. Gia si intuisce da questo esempio

come la soluzione data da Lagrange abbia dei limiti di validita. Lo sviluppo

dato e infatti convergente solo per

|ca| <1

4.

123

Continuiamo comunque l’esposizione di cio che Lagrange fa rimandando

alla conclusione di questo paragrafo le critiche. La struttura delle formule

(8.12) suggerisce di dare a quanto trovato la forma seguente. Scriviamo

l’equazione originaria (8.6) nella forma

a− y+φ(y) = 0. (8.13)

La quantita che abbiamo indicato con X e ora semplicementeφ(y)

y.

Indicata con α la radice di modulo minimo, avremo

αm =

ym +m ·

∞∑k=0

1

(k+ 1) !

dk

(φ(y)

yk+1

k+1

ym+k

)dyk

y=a

=

=

{ym +m ·

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1ym−1

)dyk

}y=a

(8.14)

La (8.14) puo essere scritta accanto alla (8.13) qualunque sia il significato

che si voglia attribuire alla funzione φ(y) [...]. E siamo giunti al “Teorema”

che si trova al cuore della memoria di Lagrange.

Secondo il concetto di funzione che egli andra poi compiutamente svi-

luppando [...] ma che e gia ora ben presente nei suoi tratti essenziali, una

funzione “arbitraria” F(y) di y e data semplicemente da

F(y) = c0 + c1y+ c2y2 + c3y

3 + . . .

124

Ma dalla (8.14) deduciamo, valutando F in α

F(α) = c0 + c1α+ c2α2 + c3α

3 + . . . =

c0+

c1

{y1 + 1 ·

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1y1−1

)dyk

}y=a

+

c2

{y2 + 2 ·

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1y2−1

)dyk

}y=a

+

c3

{y3 + 3 ·

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1y3−1

)dyk

}y=a

+

. . .

Ma questo significa:

F(α) = F(a) +

{ ∞∑j=1

cj · j ·∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1yj−1

)dyk

}y=a

=

= F(a) +

{ ∞∑j=1

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1cj· · j · yj−1

)dyk

}y=a

=

= F(a) +

∞∑j=1

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1

d

dy

(cj · yj

))dyk

y=a

.

Immaginiamo ora di poter invertire l’ordine delle sommatorie. Avremo

allora

F(α) = F(a) +

∞∑k=0

1

(k+ 1) !

dk

(φ(y)k+1

∞∑j=1

d

dy

(cj · yj

))dyk

y=a

=

= F(a) +

∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1

dF(y)

dy

)dyk

y=a

(8.15)

125

La (8.15) costituisce la celeberrima“Formula di inversione di Lagrange”.

Ecco ora alcune osservazioni. Qual e il significato della serie (8.15) ?

E piu facile comprenderlo se esaminiamo dapprima il caso particolare di

grande importanza dato da F(y) = y . In tal caso la (8.15) diviene:

α = a+

{ ∞∑k=0

1

(k+ 1) !

dk(φ(y)k+1

)dyk

}y=a

. (8.16)

Il significato della (8.16) e che essa fornisce una serie infinita, nella varia-

bile a e negli altri eventuali parametri contenuti inφ(y) la quale formalmen-

te verifica l’equazione (8.13). Abbiamo cioe una soluzione di quest’ultima

equazione nell’ambito della teoria delle serie formali. Analogamente, la

(8.15) significa che, se noi sostituiamo in F(y), assegnata con un certo svi-

luppo in serie, al posto di y la serie data dalla (8.16) otteniamo lo stesso

risultato che da la serie a secondo membro della (8.15). Ancora una volta

si ha un’identita nell’ambito delle serie formali.

Ma la dimostrazione di Lagrange e atta a sostenere questo risultato? Nel

caso in cui φ(y) e un polinomio la dimostrazione data si colloca agevolmente

nell’ambito della teoria delle serie formali. Ma Lagrange sembra alludere

(e di fatto poi utilizzera il suo risultato in questo senso) alla possibilita che

φ(y) abbia un significato piu ampio.5

E possibile riformulare il risultato in questo modo nell’ambito di una

struttura dimostrativa omogenea?

E difficile affermarlo, perche il passagio dalla (8.9) alla (8.10) presuppone

un numero finito di radici (o almeno di un intervallo finito tra la radice di

modulo minimo e quella immediatamente superiore). Anche nell’ambito

della teoria delle serie formali vi e una divergenza tra il risultato enunciato

e la dimostrazione fornita.

Ma questo e solo il primo problema: di grande importanza e anche il pro-

blema di decidere in merito alla convergenza delle serie proposte. Lagrange

si occupera di questo problema nella parte terminale del suo saggio.

Ma, seppure in modo molto ingegnoso, non fara che valutare l’ordine di

infinitesimo del termine generale in qualche esempio concreto.[Questa parte

5Come si vede nella memoria [Lagrange, 1769].

126

va completata. Nella memoria vi e anche una riproposizione dei risultati in

termini formali . . . .]

Aggiungo invece qualche osservazione sul problema della convergenza. Il

secondo membro della (8.10) si presenta, come abbiamo gia osservato, nella

forma di una serie di Laurent. Indicando la radice di modulo minimo con

α e le rimanenti radici con αi, la convergenza e garantita per |α| < |y| <

min(|αi|).

Guardiamo ora il primo membro. Potremo scrivere

− log (1− y) = y+y2

2+y3

3+ . . .

soltanto se |y| < 1. Questa disuguaglianza sara verificata in un certo aperto

del piano complesso, sia essoA. Indichiamo con Γ la corona circolare definita

da |α| < |y| < min(|αi|). Sia Sia B l’intersezione di A e Γ . La regione B e

ovviamente un aperto del piano complesso.

127

8.3 La formulazione nella Theorie des

fonctions analytiques

Lagrange, nella Theorie des fonctions analytiques del 1797 riprende la que-

stione dell’equazione funzionale, tenendo conto (implicitamente) delle criti-

che di Laplace.6

Lagrange scrive ora l’equazione nella forma piu conveniente

y = t+ xf(y) (8.17)

per la quale non e piu necessario supporre che f(y) sia un polinomio e for-

nisce una nuova dimostrazione (o meglio una traccia dimostrativa che il

lettore dovrebbe completare) che tiene conto delle idee di Laplace (che tut-

tavia non viene nominato), ma ha un andamento un po’ diverso. Lagrange

comincia con l’osservare che lo sviluppo in serie di y secondo le potenze di x

iniziera con i due termini t+ xf(t). Se infatti immaginiamo che lo sviluppo

di f(y) sia dato da

f(y) = b0 + b1y+ b2y2 + . . . ,

e che sia

y = a0 + a1x+ a2x2 + . . . ,

avremo

a0 + a1x+ a2x2 + . . . = t+ x

{b0 + b1

(a0 + a1x+ a2x

2 + . . .)+

+b2(a0 + a1x+ a2x

2 + . . .)2

+ . . . } .

Allora evidentemente a0 = t, e a1 = b0+b1a0+b2a20+ . . . = b0+b1t+

b2t2 + . . . = f(t).

Cio premesso, deduciamo, al modo di Laplace, differenziando la (8.17)

rispetto a t e rispetto ad x, le nuove equazioni

∂y

∂t= 1+ xf′(y)

∂y

∂t,

∂y

∂x= f(y) + xf′(y)

∂y

∂x.

6Si vedano le memorie [Laplace, 1780], [Laplace, 1779]. Per il testo di Lagrange

utilizzo la terza edizione: [Lagrange, 1847].

128

E dunque

∂y

∂x= f(y)

∂y

∂t. (8.18)

Ora pero, Lagrange procede diversamente rispetto a Laplace, ed osserva

che dalla (8.17) si trae

f(y) =y− t

x.

Abbiamo percio

x∂y

∂x− (y− t)

∂y

∂t= 0. (8.19)

Supponiamo ora che sia

y = t+ a1x+ a2x2 + a3x

3 + . . . ,

ove, naturalmente ai = ai(t) (e gia sappiamo che a1 = f(t). Ma Lagrange

procede per ora in generale rinviando al seguito la considerazione di questo

fatto). Avremo percio:

∂y

∂x= a1 + 2a2x+ 3a3x

2 + . . . ,

∂y

∂t= 1+

da1

dtx+

da2

dtx2 +

da3

dtx3 + . . .

Sostituendo nella (8.19) abbiamo

a1x+ 2a2x2 + 3a3x

3 + . . . =(a1x+ a2x

2 + a3x3 + . . .

)(1+

da1

dtx+

da2

dtx2 +

da3

dtx3 + . . .

).

Dividendo per x si ottiene:

a1+2a2x+3a3x2+. . . =

(a1 + a2x+ a3x

2 + . . .)(1+

da1

dtx+

da2

dtx2 +

da3

dtx3 + . . .

)129

Gia sappiamo che a1 = f(t). Abbiamo ora:

2a2 = a1da1

dt+ a2,

3a3 = a1da2

dt+ a2

da1

dt+ a3,

4a4 = a1da3

dt+ a2

da2

dt+ a3

da1

dt+ a4,

. . .

nan = a1dan−1

dt+ a2

dan−2

dt+ . . .+ an−2

da2

dt+ an−1

da1

dt+ an

Si ha dunque, con tutta evidenza:

a2 =d

dt

(1

2a21

),

a3 =1

2

d

dt(a1a2),

a4 =1

3

d

dt

(a1a3 +

1

2a22

),

. . .

an =1

n− 1

d

dt(a1an−1 + a2an−2 + . . .),

dove, se n e pari il prodotto dei termini an/2dan/2

dtva dimezzato. A questo

punto Lagrange, esaminando i primi casi, osserva che in generale

an =1

n!

dn−1

dtn−1[f(t)n] , (8.20)

lasciando al lettore i dettagli dimostrativi. Si puo pensare di utilizzare la

formula di Lebniz:

dn

dtn[u(t)v(t)] =

n∑r=0

(n

r

)dr

dtr[u(t)]

dn−r

dtn−r[v(t)] (8.21)

adattandola adn−1

dtn−1[f(t)n−1f(t)]. (8.22)

130

ma la dimostrazione non e immediata. Ovviamente Lagrange gia conosce

il risultato e quindi puo trascurare i dettagli dimostrativi lasciandoli al

lettore.7

Nella sezione successiva accenno brevemente alla dimostrazione data da

Laplace in [Laplace, 1780] in precedenza che puo essere adattata al caso in

questione.

Utilizzando la scrittura (8.20) abbiamo, per l’espressione della radice:

y = t+

∞∑n=1

xn

n!

dn−1

dtn−1[f(t)n] (8.23)

ove il parametro a e ora indicato con t ed abbiamo semplificato la notazione

per le derivate calcolate in t. Ovviamente, ponendo x = 1 si ritrova la (8.15)

nella formulazione originaria.

In corrispondenza a questa nuova situazione, abbiamo anche per una

arbitraria funzione F(y)

F(y) = F(t) +

∞∑n=1

xn

n!

dn−1

dtn−1

[dF(t)

dtf(t)n

]. (8.24)

8.4 La dimostrazione di Laplace

In questa sezione adatto i contenuti di [Laplace, 1780] per dimostrare la

(8.20). Tuttavia il risultato di Laplace e piu generale. Partendo infatti da

y = φ(t+ xf(y))

7Nel caso polinomiale, la dimostrazione data con le formule (8.12) e sufficiente. Qui

pero si tratta di ua situazione piu generale e non si puo adattare quella dimostrazione. Per

una semplice dimostrazione nel contesto della teoria delle funzioni analitiche si puo vedere

[Prasolov, 2004, pp. 37-40]. Un’elegante dimostrazione in un contesto algebrico ‘vicino’

a quello di Lagrange si trova in rete nelle Lezioni di Meccanica Celeste (capitolo 1) di

A. Giorgilli (si veda http://newrobin.mat.unimi.it/users/giorgilli/). Una dimostrazione

moderna nel contesto delle serie formali e data da [Henrici, 1964]. Lo stesso Lagrange

riprende la questione in [Lagrange, 1808] (si veda ache [Lagrange, 1826]), ma ancora una

volta si affida ad una sorta di induzione qualtativa.

131

egli ottiene, per una arbitraria funzione u = u(y)(∂nu

∂xn

)x=0

=∂n−1

∂tn−1

[fn(φ(t))

∂u(φ(t))

∂t

].

Il risultato di Lagrange si ottiene con φ = id. Si noti che ponendo invece

f(y) = 1 si ottiene la formula di Taylor.

Riprendiamo la (8.18), e consideriamo un’arbitraria funzione

u = u(y) = q0 + q1x+ q2x2 + · · · ,

ove i coefficienti qi sono, naturalmente, funzioni di t. Per comodita utiliz-

ziamo ora la notazione per le derivate parziali per evidenziare il ruolo (for-

male) delle molte manipolazioni succesive. Incominciamo con il dimostrare

che∂nu

∂xn=∂n−1

∂tn−1

[fn(y)

∂u

∂t

]. (8.25)

Abbiamo, per la formula di derivazione delle funzioni composte e per la

(8.18),∂u

∂x=∂u

∂y

∂y

∂x= f(y)

∂u

∂y

∂y

∂t. (8.26)

Dunque∂u

∂x=∂

∂t

∫f(y)

∂u

∂ydy (8.27)

e quindi∂2u

∂x2=

∂2

∂t∂x

∫f(y)

∂u

∂ydy. (8.28)

Ora, nella (8.27) si puo sostituire u con∫f(y)∂u

∂ydy e si ottiene:

∂∫f(y)∂u

∂ydy

∂x=∂

∂t

∫f(y)

∂

∂y

[∫f(y)

∂u

∂ydy

]dy =

∂

∂t

∫f2(y)

∂u

∂ydy. (8.29)

Dalla (8.28) e dalla (8.29) si ottiene

∂2u

∂x2=∂2

∂t2

∫f2(y)

∂u

∂ydy. (8.30)

132

Si tratta ora di procedere nello stesso modo, sostituendo∫f2(y)∂u

∂ydy al posto

di u nella (8.27), e si giunge a

∂nu

∂xn=∂n

∂tn

∫fn(y)

∂u

∂ydy. (8.31)

Ma si ha

∂n

∂tn

∫fn(y)

∂u

∂ydy =

∂n−1

∂tn−1

[fn(y)

∂u

∂y

∂y

∂t

]=∂n−1

∂tn−1

[fn(y)

∂u

∂t

]. (8.32)

La (8.25) e dimostrata. Si osservi ora che

qn =1

n!

(∂nu

∂xn

)x=0

e che per x = 0 si ha y = t. Dunque

qn =1

n!

∂n−1

∂tn−1

[fn(t)

∂u

∂t

](8.33)

In particolare per u(y) = y si ottiene la (8.20).

8.5 Qualche applicazione alla combinatoria

Partiamo dall’equazione consueta8

y = t+ xf(y),

e sia, questa volta,

y = t+ xey.

Scegliamo ora F(y) = eay, abbiamo allora:

eay = eat +

∞∑n=1

xn

n!

dn−1

dtn−1

[aeatent

]=

= eat + a

∞∑n=1

xn

n!

dn−1

dtn−1

[e(a+n)t

]=

= eat + a

∞∑n=1

xn

n!(a+ n)n−1 e(a+n)t.

8Si veda [Hurwitz, 1902], [Riordan, 1968].

133

In particolare, per t = 0, ossia per y = xey, abbiamo

eay = a

∞∑n=0

xn

n!(a+ n)n−1 .9

Possiamo riscrivere questa formula sostituendo b al posto di a, e si ha

in questo caso:

eby = b

∞∑n=0

xn

n!(b+ n)n−1 .

Ma eayeby = e(a+b)y, e dunque:

ab

{ ∞∑n=0

xn

n!(a+ n)n−1

}{ ∞∑n=0

xn

n!(b+ n)n−1

}=

= (a+ b)

∞∑n=0

xn

n!(a+ b+ n)n−1 .

Ne deduciamo immediatamente

(a+ b) (a+ b+ n)n−1 = ab

n∑k=0

(n

k

)(a+ k)k−1 (b+ n− k)n−k−1 ,

ossia una identita dovuta ad Abel.

Torniamo ora a considerare la uguaglianza

eay = a

∞∑n=0

xn

n!(a+ n)n−1 , (y = xey) .

Ponendo in essa a = 1, otteniamo

ey =

∞∑n=0

xn

n!(n+ 1)n−1 .

9Si noti che, modificando la sommatoria iniziando con il valore n = 1 si aggiunge

1. . . Quindi eay si ottiene facendo iniziare la somma con 0.

134

e dunque

y = xey = x

∞∑n=0

xn

n!(n+ 1)n−1 =

=

∞∑n=0

xn+1

n!(n+ 1)n−1 =

∞∑n=0

xn+1

(n+ 1) !(n+ 1)n =

=

∞∑n=1

xn

n!nn−1.

Abbiamo quindi uno sviluppo in serie che descrive la soluzione di y = xey

(nel senso delle serie formali). Naturalmente queste manipolazioni non for-

niscono informazioni sulla convergenza e in effetti la serie trovata e diver-

gente.10 Tuttavia il risultato trovato ha grande importanza nel contesto

della combinatorica.11

10Si noti che nn−1

n! →∞.11Si veda [Wilf, 1994]. La formula e utilizzata per il conteggio degli alberi etichettati.

135

Capitolo 9

Frazioni continue

Lo scopo di questo capitolo e quello di presentare alcune semplici proprieta

delle frazioni continue. Nella parte finale vedremo uno dei primi risultati

ottenuti da Evariste Galois.

Galois e, nella storia della matematica, l’eroe romantico per eccellenza.

Proprio per questa ragione, la possibilita di parlare di Galois puo essere

un’ottima occasione per attirare l’attenzione degli studenti e per un loro

coinvolgimento attivo. Al tempo stesso, bisogna evitare che la presentazio-

ne si risolva in pura ideologia e che le vicende biografiche siano la premessa

per affermazioni generiche del tipo ‘Galois e il fondatore dell’algebra mo-

derna’, ‘Galois e l’inventore della teoria dei gruppi’, ecc. senza che a queste

affermazioni faccia seguito una presentazione, ancorche minimale, dei suoi

contributi scientifici.1 Ovviamente, non e possibile presentare la Teoria di

Galois senza un’adeguata premessa algebrica. E pero possibile presentare

il suo risultato sulle frazioni continue senza la necessita di troppe premes-

1Comunque, la presentazione piu equilibrata, a mio giudizio, delle vicende biografiche

di Galois e [Auffray, 2004] (con qualche imprecisione matematica). Anche notevole e

[Rothman, 1982]. Interessante, anche se molto fantasioso, e [Toti Rigatelli, 1996]. Il

romanzo di Petsinis [Petsinis, 1997], tradotto anche in italiano, e di gradevole lettura

anche se la presentazione della matematica attribuita a Galois e inadeguata.

137

se. Certamente questo risultato non e paragonabile per importanza ai suoi

profondi teoremi algebrici. Si tratta pero, comunque, di un lavoro notevole.

9.1 Radici quadrate: algoritmi

Consideriamo l’algoritmo per estrarre la radice quadrata. Esso si fonda

sulla seguente proprieta che puo essere utilizzata per un calcolo ricorsivo.

(x1 + x2)2 = x21 + (2x1 + x2)x2

(x1 + x2 + x3)2 = (x1 + x2)

2 + (2x1 + 2x2 + x3)x3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

(x1 + · · ·+ xn−1 + xn)2 = (x1 + · · ·+ xn−1)2 + (2x1 + · · ·+ 2xn−1 + xn)xn

Questa semplice proprieta e alla base del calcolo aritmetico abituale.

Ad esempio, per calcolare√2 dobbiamo dapprima individuare il piu grande

intero x1 per il quale sia

x21 < 2.

Dunque x1 = 1 =1010

Poi si tratta di individuare il piu grande intero x2 tale che

(20+ x2)x2 < 100,

il che da x2 = 4 =40100

. Ora occorre calcolare x3 in modo che

(240+ x3)x3

non superi 400 e si ottiene x3 = 1, . . .

Il calcolo procede con sempre maggior complessita, ed occorre utilizzare

tutto quanto trovato in precedenza. Per calcolare la cifra successiva, occorre

determinare il piu grande intero x4 tale che

(2820+ x4)x4 < 11900, ecc.

138

Si consideri invece lo schema di calcolo seguente per√2 (che verra giu-

stificato in seguito):

p−1 = 1, q−1 = 0;

p0 = 1, q1 = 1;

pk+1 = 2 · pk + pk−1; (9.1)

qk+1 = 2 · qk + qk−1. (9.2)

Consideriamo (per k ≥ 0) le frazioni

pk

qk.

Si ha facilmente:1

1,3

2,7

5,17

12,41

29,99

70,239

169, . . .

Si osservi ora che:

• Il calcolo e molto semplice;

• le frazioni approssimano molto rapidamente√2;

• Non occorre, ad ogni passo ‘ricapitolare’ tutto il procedimento;

• Cio che di specifico compare di√2 e solo la parte intera 1, ed il

‘periodo’, 2.

Con√5 il calcolo procede in modo molto simile, occorre pero porre a0 = 2

e modificare le (9.1),(9.2), ponendo

pk+1 = 4 · pk + pk−1;qk+1 = 4 · qk + qk−1.

Abbiamo2

1,9

4,38

17,161

72,682

305, . . .

139

Il tipo di calcolo che abbiamo visto per√2,√5 si estende ad ogni numero

della forma√n con questo schema piu generale:

p−1 = 1, q−1 = 0;

p0 = c0, q1 = 1;

pk+1 = ck+1pk + pk−1; (9.3)

qk+1 = ck+1qk + qk−1,

dove c0 = ⌊√n⌋ e i numeri ck non sono piu necessariamente tutti uguali, ma

si ripetono da un certo posto in poi (su questo otterremo un risultato piu

preciso nella Sezione 9.4). Ad esempio, per√19, abbiamo per i successivi

ck

4, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, . . .

Possiamo scrivere, per indicare l’algoritmo:

√19 = [4, 2, 1, 3, 1, 2, 8 ]

E possibile che questo tipo di calcolo per gli irrazionali quadratici abbia

preceduto quello modellato sulla la teoria delle proporzioni, tradizionalmen-

te attribuita ad Eudosso.2 E un calcolo tuttavia, molto particolare. E molto

facile calcolare il reciproco di un numero: se γ = [c0, c1, c2, . . . ] e un numero

positivo (c0 ≥ 0),γ−1 = [0, c0, c1, c2, . . . ]

Ma non esiste alcun algoritmo semplice per la somma!

Ad esempio: √2 = [1, 2 ],

√5 = [2, 4 ]

Ma √2+

√5 = [3, 1, 1, 1, 6, 8, 1, 2, 1, 2, 2, 1, 101, 13, 1 . . . ]

Fino ad ora non e stata notata alcuna regolarita.

2Si vedano, in particolare, i molti lavori di Fowler. Tra questi, in partico-

lare, [Fowler, 1987]. Una rapida esposizione della teoria di Eudosso si trova in

[Galuzzi e Rovelli, 1997].

140

9.2 Principali proprieta

Ad Eulero si deve prima esposizione sistematica della teoria delle frazioni

continue.3 La teoria e stata ripresa e sviluppata poi da Lagrange nelle note

aggiunte alla traduzione francese dell’Algebra di Eulero.4

Un primo aspetto con il quale compaiono naturalmente le frazioni con-

tinue e quello della ricerca di frazioni ‘piu semplici’.5 Data la frazione

345723

245125= 1.410394697,

abbiamo24

17= 1.411764706,

55

39= 1.410256410 (9.4)

Queste frazioni semplici si trovano (come vedremo) mediante lo sviluppo

in frazione continua.

L’algoritmo di Euclide si lega naturalmente alle frazioni continue finite.

Si tratta di un altro modo, conveniente, di rappresentare i numeri razionali.

Consideriamo la frazione137

101.

137 = 1 · 101+ 36101 = 2 · 36+ 2936 = 1 · 29+ 729 = 4 · 7+ 1

Allora, dalla prima riga:

137

101= 1+

36

101= 1+

1

101

36

.

3Nella Introductio in analysin infinitorum, del 1748. Si puo vedere la facilmente

accessibile traduzione inglese: [Euler, 1988, cap. XVIII].4Si tratta di [Euler, 1773]). Si veda anche [Lagrange, 1879, vol. VII].5Una chiara concisa e rigorosa presentazione degli aspetti essenziali della teoria delle

frazioni continue e [Bombieri e van der Poorten, 1995].

Si puo vedere anche il classico [Hardy e Wright, 1971] o i piu recenti [Lorentzen e

Waadeland, 1992; Rockett e Szus, 1992]. [Olds, 1968] e un testo elementare ma ben

fatto.

141

Dalla seconda riga:

137

101= 1+

1

2+29

36

= 1+1

2+1

36

29

Con i numeri trovati: 1, 2, 1, 4 possiamo costruire la frazione continua:

1+1

2+1

1+1

4

Le frazioni piu semplici sono quelle che si ottengono usando solo ‘una parte’

della lista

[1, 2, 1, 4].

In questo modo sono stae ottenute le frazioni (9.4).

Ecco un altro esempio: l’algoritmo per√2:

(√2− 1)(

√2+ 1) = 1.

Allora (!)√2− 1 =

1√2+ 1

=1√

2− 1+ 2

Quindi√2− 1 =

1

2+1

√2+ 1

Si puo procedere indefinitamente: otteniamo la frazione continua infinita

1+1

2+1

2+1

2+ . . .

.

Vedremo in seguito come precisare questa nozione; per ora ci limitiamo a

questa definizione:

142

Definizione 9.1 Una frazione continua (aritmetica) finita e data da

c0 +1

c1 +1

c2 + . . .+1

ch

, (ci ≥ 1 per i ≥ 1).

Evidentemente e solo un altro modo (vantaggioso) di scrivere un numero

razionale.

Definizione 9.2 Le successive frazioni

p0

q0= c0,

p1

q1= c0 +

1

c1,p2

q2= c0 +

1

c1 +1

c2

, . . .

sono dette convergenti. I numeri ci sono detti quozienti parziali.

Mostriamo ora che pk, qk verificano le formule seguenti (ove, per como-

dita, si introducono anche p−1 e q−1):

p−1 = 1, p0 = c0,

pk+1 = ck+1 · pk + pk−1q−1 = 0, q0 = 1,

qk+1 = ck+1 · qk + qk−1.

(9.5)

Siapk

qkla k-esima convergente. Esaminiamo il passaggio alla convergente

successiva: si tratta di effettuare la sostituzione

ck+1 ←− ck+1 + 1

ck+2.

Allora: (ck+1 +

1ck+2

)pk + pk−1(

ck+1 +1

ck+2

)qk + qk−1

=pk+1 +

pkck+2

qk+1 +qkck+2

=ck+2pk+1 + pkck+2qk+1 + qk

Abbiamo verificato le (9.5).

143

Osservazione 9.1 Si noti che possiamo scrivere:(pk pk−1

qk qk−1

)(ck+1 1

1 0

)=

(ck+1pk + pk−1 pk

ck+1qk + qk−1 qk

),

e quindi (c0 1

1 0

)(c1 1

1 0

)· · ·

(ck+1 1

1 0

)=

(pk+1 pk

qk+1 qk

). (9.6)

Ne segue che

pk+1qk − pkqk+1 = (−1)k. (9.7)

Corollario 9.1 Le frazionipk

qkdate dalle (9.5) sono ridotte ai minimi

termini.

Corollario 9.2 Trasponendo il prodotto matriciale (9.6), abbiamo

pk

pk−1= [ck, ck−1, . . . , c0],

qk

qk−1= [ck, ck−1, . . . , c1].

Un’equazione diofantea

Una semplice applicazione: risolviamo, quando possibile, l’equazione

mx+ ny = 1.

Supponiamo m,n primi fra loro, e sviluppiamo in frazione continua fino ad

ottenerem

n=pk+1

qk+1.

Abbiamo per la proprieta (9.7)

mqk − pkn = (−1)k.

Esempio 9.1 Risolviamo

27x+ 43y = 1.

144

Abbiamo27

43=

1

1+1

1+1

1+1

2+1

5

La penultima ridotta vale 58. Allora

27 · 8− 43 · 5 = 1. �

Osservazione 9.2 Da

pk+1qk − pkqk+1 = (−1)k,

deduciamo ∣∣∣∣pk+1qk+1−pk

qk

∣∣∣∣ = 1

qk+1qk. (9.8)

Consideriamo la differenza

pk+1

qk+1−pk

qk=

(−1)k

qkqk+1.

Poiche, come abbiamo visto

q−1 = 0, q0 = 1, qk+1 = ak+1 · qk + qk−1,

si ha q1 ≥ 1, q2 ≥ 2, . . . e, in generale, qk ≥ fk, ove fk e il k-esimo numero

di Fibonacci.

La proprieta (9.8) permette di dare un senso preciso al concetto di frazione

continua infinita. Consideriamo una successione di interi c0, c1, c2, . . . con

ci ≥ 1 per i ≥ 1. Possiamo definire mediante le (9.5) le frazioni pkqk

dette

ancora convergenti parziali. Ossia, ancora una volta poniamo

p−1 = 1, p0 = c0,

pk+1 = ck+1 · pk + pk−1q−1 = 0, q0 = 1,

qk+1 = ck+1 · qk + qk−1.

(9.9)

145

Si noti che il calcolo di pkqk

coinvolge solo gli interi c0, c1, . . . , ck e dunque le

convergenti parziali sono ben definite.

La convergenza della frazione continua aritmeticainfinita

Abbiamo

pk+1

qk+1=p0

q0+

k∑i=0

(pi+1

qi+1−pi

qi

)=p0

q0+

k∑i=0

(−1)i

qiqi+1.

La serie (a segni alternati) ∞∑i=0

(−1)i

qiqi+1

e convergente, e quindi il limite

γ = limk→∞

pk

qk

esiste. Per definizione questo limite e il valore della frazione continua.

Si noti che la convergenza avviene alternatamente dal di sotto e dal di

sopra.

Esempio 9.2 Consideriamo ancora la frazione continua

[1, 2, 2, 2, . . . ]

Abbiamo

p : 1, 1, 1 · 2+ 1 = 3, 3 · 2+ 1 = 7, 7 · 2+ 3 = 17, . . .q : 0, 1, 1 · 2+ 0 = 2, 2 · 2+ 1 = 5, 5 · 2+ 2 = 12, . . .

Quindi, le convergenti sono

1,3

2,7

5,17

12, . . .

Abbiamo

1, 1.5, 1.4, 1.416666 . . . ,

procedendo nel calcolo si ha

41

29,99

70= 1.414285714.

146

Si ottengono approssimazioni molto buone. Su questo si veda la Sezione

9.2. Comunque ora ha un senso preciso dire che le convergenti parziali

costituiscono una successione convergente. Rimane ancora da stabilire che

la convergenza e verso√2. Questo si vedra tra breve.

Come abbiamo gia osservato, le frazioni continue finite

ph

qh= [c0, c1, . . . , ch]

sono dette le convergenti del numero reale γ definito dalla frazione continua.

Definizione 9.3 Le code

γh+1 = [ch+1, ch+2, . . .]

sono dette quozienti completi.

Formalmente, possiamo scrivere

γ = [c0, c1, . . . , ch, γh+1].

Abbiamo

γ−ph

qh= (−1)h

[1

qhqh+1−

1

qh+1qh+2+ . . .

].

Ne consegue che ∣∣∣∣γ−ph

qh

∣∣∣∣ < 1

qhqh+1.

Osservando che qh+1 = ch+1qh + qh−1 si ha anche∣∣∣∣γ−ph

qh

∣∣∣∣ < 1

ch+1q2h

.

Se dunque si ha un quoziente parziale ch+1 molto grande si ha una buona

approssimazione.

147

Osservazione 9.3 Si noti che una gran parte delle considerazioni svolte

su [c0, c1, . . . , cn] o su [c0, c1, . . . , cn, . . . ] nell’ipotesi che i ci siano interi,

hanno in realta un significato piu ampio.6 Ad esempio, si ha, utilizzando le

convenzioni precedenti per [c0, c1, . . . , cn, α], ove α e una indeterminata o

un numero reale ed i ci sono interi (maggiori di 1 per i ≥ 1),

[c0, c1, . . . , cn, α] =pnα+ pn−1qnα+ qn1

,

ove le quantita pn, qn, pn−1, qn−1 hanno il valore ottenuto in precedenza

considerando solamente [c0, c1, . . . , cn].

Osserviamo ora che se un numero reale x (non appartenente a Q) e dato

da [c0, c1, . . .], si ha

x = [c0, c1, . . .] = c0 +1

[c1, c2, . . .]

e dunque

c0 = ⌊x⌋ e, posto x1 = [c1, c2, . . .] = (x− c0)−1, (9.10)

si ha c1 = ⌊x1⌋. Avremo, in generale

ch = ⌊xh⌋ e xh+1 = (xh − ch)−1. (9.11)

Se x e numero reale (non razionale) e calcoliamo le quantita ch date

dalle (9.10), (9.11) abbiamo, per quanto posto nell’Osservazione 9.3,

x = [c0, c1, . . . , cn, xn+1] =pnxn+1 + pn−1qnxn+1 + qn−1

(9.12)

Di conseguenza ∣∣∣∣x− pn

qn

∣∣∣∣ = ∣∣∣∣pnxn+1 + pn−1qnxn+1 + qn−1−pn

qn

∣∣∣∣ ==

1

qn(qnxn+1 + qn−1).

(9.13)

6In effetti in [Hardy e Wright, 1971], all’inizio, le quantita ci sono semplicemente

delle variabili.

148

Ma xn+1 > qn+1 e quindi si ha certamente∣∣∣∣x− pn

qn

∣∣∣∣ < 1

qnqn+1(9.14)

e dunque pnqn

converge ad x.7

Esercizio 9.1 Spesso quando certe proprieta risultano ‘evidenti’, non si

vuol perdere troppo tempo per dimostrarle. Si esaminino vari testi dedicati

alle frazioni continue per verificare se il collegamento tra numeri reali e

loro rappresentazione come frazioni continue e dato in modo rigoroso. E

naturalmente si puo estendere l’analisi anche alle considerazioni precedenti.

Esempio 9.3 Rivediamo lo sviluppo in frazione continua di x =√2. Ab-

biamo

c0 = ⌊x⌋ = 1

e

x1 =(√2− 1

)−1=

1√2− 1

=

√2+ 1

2− 1=

√2+ 1.

Allora

c1 = ⌊x1⌋ = 2

ed anche

x2 =[(√

2+ 1)− 2]−1

=1√2− 1

=√2+ 1, ecc.

Dunque √2 = [1, 2, 2, 2, . . .].

Esempio 9.4 Osserviamo che

√5− 1

2=

1

1+

√5− 1

27Si veda anche la nota (11) posta a commento del metodo di approssimazione di

Lagrange.

149

e dunque

1+

√5− 1

2=

√5+ 1

2= [1, 1, 1, . . .].

Il piu ‘semplice’ sviluppo in frazione continua corrisponde alla parte aurea.8

Qualche approfondimento

Definizione 9.4 Sia ξ un numero reale. Diremo che p

qe una migliore

approssimazione razionale di ξ se e solo se per ogni altra frazione rscon

s > 0 la disuguaglianza ∣∣∣ξ− r

s

∣∣∣ < ∣∣∣∣ξ− p

q

∣∣∣∣implica s > q.

Teorema 9.1 Le convergenti di una frazione continua aritmetica, di ordi-

ne maggiore od uguale ad 1, relative ad un numero reale ξ, sono migliori

approssimazioni.

Dimostrazione. Vediamo un Lemma preliminare.

Lemma 9.1 Consideriamo ξ,ed una convergente pnqn. Sia r

s= pn

qncon 0 <

s < qn. Allora

|sξ− r| ≥ |qn−1ξ− pn−1| > |qnξ− pn|.

Dimostrazione. Esistono due numeri interi x, y tali che{pn x+ pn−1y = r

qn x+ qn−1y = s.

(La matrice ha determinante ±1.) Non puo evidentemente essere y = 0.

Per ipotesi s < qn e quindi o x = 0 oppure x e y sono di segno opposto.

Consideriamo l’identita

sξ− r = x(qnξ− pn) + y(qn−1ξ− pn−1).

8Sulla sezione aurea, si veda l’ottimo libro [Livio, 2003]. Si puo vedere anche

[Scimone, 1997].

150

Le due quantita entro parentesi hanno segno opposto (le convergenti sono

alternatamente maggiori e minori di ξ) ed anche x e y hanno segno opposto.

Allora

|sξ− r| = |x(qnξ− pn)|+ |y(qn−1ξ− pn−1)|

Poiche y = 0, abbiamo

|sξ− r| ≥ |qn−1ξ− pn−1|.

Si ha sempre

|qnξ− pn| < |qn−1ξ− pn−1|.

Dimostrazione (del Teorema). Consideriamo ancora ξ, pnqn. Sia r

s= pn

qnuna

frazione che verifica ∣∣∣ξ− r

s

∣∣∣ ≤ ∣∣∣∣ξ− pn

qn

∣∣∣∣con 0 < s < qn. Allora moltiplicano il primo membro per s ed il secondo

per qn, abbiamo

|sξ− r| ≤ |qnξ− pn|

in contraddizione con il Lemma. �

9.3 Il metodo di Lagrange

Il polinomio f(x) = f0(x), di grado n, abbia un’unica radice positiva γ ∈ Q9,

e sia

⌊γ⌋ = c0.10

Il nuovo polinomio

f1(x) = ±xnf0(c0 +

1

x

)9Di qui in poi supponiamo sempre di avere a che fare con radici non razionali.

10In realta e sufficiente supporre che tra c0 e c0+1 cada un’unica radice. I riferimenti

bibliografici ed un’esposizione del fatto che il metodo di Lagrange, attraverso l’uso del

teorema di Vincent, conduce anche autonomamente alla separazione delle radici sono

dati in [Alesina e Galuzzi, 1998].

151

ha un’unica radice maggiore di 1 (evidentemente non razionale), perche la

trasformazione

x← c0 +1

x

fornisce la corrispondenza biunivoca

(c0, c0 + 1)� (∞, 1).Sia c1 la parte intera della radice positiva di f1(x). Si ponga:

f2(x) = ±xnf1(c1 +

1

x

)Evidentemente, procedendo nello stesso modo, si ottiene la radice espressa

come frazione continua:

γ = [c0, c1, c2, . . . ].

Infatti, il cambiamento di variabili dato da [c0, c1, . . . , ch, x] corrisponde alla

sostituzione

x← phx+ ph−1qhx+ qh−1

,

seguita dalla moltiplicazione per (qhx + qh−1)−n (una quantita certamente

non nulla) e quando x assume un valore tra 0 e∞ la frazione phx+ph−1

qhx+qh−1assume

valori compresi tra ph−1

qh−1e phqh. Il metodo di approssimazione di Lagrange e

dunque intrinsecamente legato alle frazioni continue.11

Esempio 9.5 Sia f0(x) = x2 − 2, c0 = 1. Allora

f1(x) = −x2

((1+

1

x

)2− 2

)= x2 − 2x− 1.

La parte intera della radice di f1(x) e 2.

f2(x) = −x2

((2+

1

x

)2− 2

(2+

1

x

)− 1

)=

= x2 − 2x− 1 = f1(x)11Si noti come il metodo di Lagrange puo essere applicato anche all’equazione x−γ = 0

per fornire lo sviluppo in frazione continua proprio di γ.

152

Allora, ancora una volta:

√2 = [1, 2, 2, 2, . . . ].

Esercizio 9.2 Determinare lo sviluppo in frazione continua della soluzione

positiva di

x2 − (n2 + 1) = 0, n ∈ N

e della soluzione positiva di

x2 − (n2 − 1) = 0, n ∈ N.

Se il polinomio f0(x) ha una sola radice γ con parte intera ⌊c0⌋, dopoil primo passaggio si ottiene un polinomio che ha una sola radice positiva e

maggiore di 1. Sia

f(x) = (x− γ)(x− α)(x− β) · · ·

e supponiamo che due radici reali α,β siano disposte come in figura.

Con il metodi di Lagrange otteniamo il polinomio

f1(x) = [(c0 − γ)x+ 1][(c0 − α)x+ 1][(c0 − β)x+ 1] · · ·

Ora1

γ− c0> 1,

1

α− c0< 0, 0 <

1

β− c0< 1.

Dopo due passaggi otteniamo un polinomio con una sola radice positiva.

Esempio 9.6 Il polinomio

f0(x) = x3 − 10x2 + 31x− 29

ha le radici (approssimate)

α = 1.753, γ = 3.445, β = 4.801.

153

Il calcolo di f1(x) da

x3 + 2x2 − x+ 1,

il quale ha le radici

−0.801, 0.554, 2.246.

Quindi

f2(x) = x3 − 3 x2 − 4 x− 1

il quale ha le radici

−0.692,−0.356, 4.048.

Si noti poi che

3+1

2+1

4

=31

9= 3.4,

e una buona approssimazione della radice γ.

Il teorema di Lagrange sugli irrazionali quadratici

Consideriamo una frazione continua puramente periodica:

γ = [c0, c1, . . . , cn].

Mostriamo che γ e radice di un’equazione di secondo grado.

Sia, per semplicita,12

γ = [a, b, c].

Allora

γ = a+1

b+1

c+1

γ

.

12Le dimostrazioni seguenti sono condotte su esempi ‘paradigmatici’ come spesso nella

matematica tra fine Settecento e meta dell’Ottocento. Ma non si incontra alcuna difficolta

nel riproporle in linguaggio moderno.

154

Quindi esistono delle quantita A,B,C,D (con AD− BC = ±1) tali che

γ =A+ Bγ

C+Dγ.13

Supponiamo ora che vi sia un anti-periodo:

γ = [a, b, c, d, e].

Quindi

γ− a =1

b+1

[c, d, e]

,

1

γ− a= b+

1

[c, d, e],

Γ =1

−b+1

γ− a

= [c, d, e].

Allora Γ e radice di un’equazione di secondo grado. E chiaro che, con una

semplice sostituzione, ancora si ottiene che γ e radice di un’equazione di

secondo grado

Esempio 9.7 γ = [1, 2, 3]. Allora

1

γ− 1= 2+

1

[3],γ− 1

3− 2γ= [3] = Γ.

Allora

Γ 2 − 3Γ − 1 = 0

e quindi

3γ2 − 5γ+ 1 = 0.

Abbiamo dunque5

6+1

6

√13 = [1, 2, 3]. �

13Si rammenti la (9.7).

155

Osservazione 9.4 Dato il polinomio di secondo grado14

f0(x) = a0x2 + b0x+ c0

una qualsiasi trasformazione della forma

x←− n0 + 1

x

lascia invariato il discriminante.15

Si ha infatti il nuovo polinomio

(a0n20 + b0n0 + c0)x

2 + (b0 + 2a0n0)x+ a0.

Il calcolo diretto da:

(b0 + 2a0n0)2 − 4a0(a0n

20 + b0n0 + c0) = b

20 − 4a0c0.

Sia ora f0(x) un polinomio di secondo grado irriducibile e supponiamo

dapprima che abbia radici reali γ, δ con parte intera diversa.

γ ∈ (c0, c0 + 1), δ ∈ (c0, c0 + 1).

Dopo al piu due passaggi (con il metodo di Lagrange) abbiamo un polinomio

con una radice positiva (e maggiore di 1) ed una negativa.16 Questo significa

che il prodotto del coefficiente del termine di grado 0 per il coefficiente del

termine di grado 2 deve essere negativo. Quindi, nell’ipotesi δ > γ, avremo

f2(x) = a2x2 + b2x+ c2, con a2c2 < 0.

Sia ora

fh(x) = ahx2 + bhx+ ch, con ahch < 0, b

2h − 4ahch > 0.

14Nell’esposizione seguente tengo conto di [Ballieu, 1942].15Il risultato e evidente se pensiamo la trasformazione in due passi: una traslazione

seguita dal passaggio all’equazione reciproca.16Si noti che la radice negativa, con una ulteriore trasformazione del procedimento

di Lagrange, viene trasformata in una radice ancora negativa ma di modulo inferiore

all’unita.

156

Allora anche fh+1(x) ha la stessa proprieta.

Scriviamo fh(x) in modo da porre in evidenza il fatto che ha radici reali

di segno opposto:

fh(x) = ah(x− α)(x+ β), con α,β > 0.

Se na = ⌊α⌋, il polinomio fh+1(x) ha le radici

1

α− na, −

1

β+ na.

Abbiamo ancora radici di segno opposto, il che implica ah+1ch+1 < 0.

Fissato il valore del discriminate

∆ = b2h − 4ahch,

se

ahch < 0

abbiamo solo un numero finito di polinomi con discriminante ∆.

Nell’ipotesi di radici γ, δ con parte intera diversa, dopo un numero fi-

nito di trasformazioni del metodo di Lagrange dobbiamo ritrovare lo stesso

polinomio.

Sia ora ⌊γ⌋ = ⌊δ⌋ e siano

γ1, δ1, . . . γ2, δ2, . . .

le radici dei polinomi f1(x), f2(x), . . . Non puo essere indefinitamente

⌊γh⌋ = ⌊δh⌋

perche il polinomio f0(x) ha radici distinte. Dopo un numero finito di pas-

saggi ricadiamo nel caso delle radici con diversa parte intera. Concludiamo

quindi con il

Teorema 9.2 Ogni frazione continua che sia definitivamente periodica do-

po un numero finito di quozienti parziali converge ad un irrazionale qua-

dratico. Viceversa ogni irrazionale quadratico ha uno sviluppo in frazione

continua periodico da un certo posto in poi.

157

Esercizio 9.3 Si consideri l’equazione data

f0(x) = 431x2 − 1238x+ 889 = 0.

Utilizzando il metodo di Lagrange si determini fn(x) in modo che questo

polinomio eguagliato a zero abbia radici con parte intera diversa.

9.4 Il teorema di Galois

Galois ha dimostrato il teorema sulle frazioni continue immediatamente pe-

riodiche quando era ancora allievo al Collegio Louis-Le-Grand. Si tratta di

un risultato notevole, indipendentemente dalle considerazioni sulla giovane

eta dell’autore.17

Teorema 9.3 Se un’equazione ha una radice puramente periodica γ, l’equazione

ha un’altra radice δ il cui valore si ottiene dividendo -1 per la frazione

puramente periodica il cui periodo e l’inverso di quello di γ.

Dimostrazione. Galois si limita a considerare18

x = [a, b, c, d ].

x e dunque soluzione dell’equazione

X = a+1

b+1

c+1

d+1

X

(9.15)

17Si veda [Galois, 1976, pp. 364-377]. Un’esposizione del risultato di Galois si trova

anche in [De Nuccio, 2001]. Si veda anche [Galuzzi, 2009].18Si veda la nota 12.

158

L’equazione (12.10) puo essere riscritta:

1

a− X= −

b+

1

c+1

d+1

X

. (9.16)

Procedendo. . .

− X =1

d+1

c+1

b+1

a− X

(9.17)

Dunque−1

[d, c, b, a]

e l’altra radice dell’equazione. �

Esempio 9.8 l’equazione

x2 − 10x− 6 = 0

ha le radici

5±√31.

Abbiamo

5+√31 = [10, 1, 1, 3, 5, 3, 1, 1],

−1

5−√31

= [1, 1, 3, 5, 3, 1, 1, 10]. �

Osservazione 9.5 Sia

γ = [c0, c1, . . . , cn ]

159

una frazione continua puramente periodica soluzione di un’equazione di

secondo grado. Lo sviluppo di γ e tale che c0 ≥ 1 e, poiche γ e certamente

un numero irrazionale si ha

γ > 1.

Poiche, come abbiamo visto, la radice coniugata δ e data da− 1

[cn, . . . , c1, c0]e anche cn ≥ 1. Si ha dunque anche

−1 < δ < 0.

Vediamo ora il risultato reciproco.

Teorema 9.4 Siano γ, δ le due radici reali di un’equazione di secondo grado

e sia

γ > 1, −1 < δ < 0.

Allora lo sviluppo in frazione continua di γ e puramente periodico.

Dimostrazione. Per il Teorema di Lagrange, lo sviluppo di γ deve es-

sere periodico da un certo posto in poi. Si tratta di dimostrare che e

immediatamente periodico. Sia dapprima l’antiperiodo di lunghezza 1.

γ = [p, a, b, c, d] = p+1

A.

Con

x← p+1

x,

la prima trasformata ha la radice A.

Allora ha anche la radice−1

B, dove B = [d, c, b, a]. L’equazione originale

ha la radice

p+1

−1

B

= p− B.

p− B e compreso tra 0 e -1 se e solo se ⌊B⌋ = p, ossia d = p, e

γ = [d, a, b, c].

160

La stessa argomentazione si applica a

γ = [p, q, a, b, c, d ].

In questo caso otteniamo

− 1 < p−1

B− q< 0. (9.18)

Ora, osserva Galois, la quantita p− 1B−q

verifica la disuguaglianza (9.18)

se e solo se1

B− q= p+ θ, con 0 < θ < 1,

ossia ⌊1

B− q

⌋= p.

Poiche B > q e B− q < 1, abbiamo

⌊B⌋ = q.

Dunque

B = [q, p, . . . ]

e

γ = [c, d, a, b ].

Galois lascia al lettore il completamento dell’argomentazione. E molto

facile, pero, dare una forma strutturata a cio che Galois trascura.

Proposizione 9.1 Supponiamo che, per ogni n-upla di interi c0, c1, . . . , cn−1,

con ci ≥ 1 e per ogni ξ reale, dalla disuguaglianza

−1 < c0 +1

c1 + . . .+

1

cn−1 − ξ

< 0

si tragga la conclusione che

ξ = [cn−1, . . . , c1, c0, . . . ].

Allora la proprieta si puo estendere ad ogni n+ 1-upla.

161

Dimostrazione. Sia

−1 < c0 +1

c1 + . . .+

1

cn−1 +1

cn − ξ

< 0,

e poniamo

η = −1

cn − ξ.

Abbiamo allora

η = [cn−1, . . . , c1, c0, . . . ],

e, essendo,

ξ = cn +1

η,

ne deduciamo la proprieta richiesta. �

Osservazione 9.6 Sia a = ⌊√n⌋, con n non quadrato. Allora il polinomio

(x− a−√n)(x− a+

√n) = x2 − 2ax+ (a2 − n)

ha una radice maggiore di 1 ed una radice in (−1, 0).

Osservazione 9.7 (Galois) Supponiamo che un’equazione di secondo gra-

do abbia una radice il cui sviluppo in frazione continua sia non solo periodico

ma anche simmetrico. Allora l’equazione ha la forma

ax2 − bx− a = 0. (9.19)

In effetti, se γ e una radice, l’altra radice deve essere −γ−1. Abbiamo

allora

γx2 − (γ2 − 1)x− γ = 0.19

Viceversa, se e data un’equazione della forma (9.19) si verifica imme-

diatamente che ha una radice positiva maggiore di 1 ed una fra 0 e -1.

�19Si noti che una tale equazione puo ridursi a coefficienti interi.

162

Lo sviluppo di√n

Sia a = ⌊√n⌋. L’equazione

(x− a)2 − n

ha una radice γ = a +√n puramente periodica (si veda l’Osservazione

(9.6)). Quindi

a+√n = [c0, c1, . . . , ck−1, ck ].

Allora

√n = [c0 − a, c1, c2, . . . , ck−1, ck, c0, c1 . . . , ck−1, ck, c0 . . . ].

D’altra parte−1

a−√n

= [ck, ck−1, . . . , c1, c0 ],

e quindi √n = [a, ck, ck−1, . . . , c1, c0, ck, ck−1, . . . ].

Ne segue che

c0 = 2a, c1 = ck, c2 = ck−1, . . .

Ad esempio, come abbiamo visto a pag. 140,

√19 = [4, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, . . . ].

Dimostrazione di Ballieu del teorema di Galois

Galois nella sua prima memoria che abbiamo esaminato utilizza il me-

todo di Lagrange per analizzare un esempio (si tratta dell’esempio dato

dall’equazione 3x2 − 16x− 18 = 0).20

Tuttavia, come abbiamo visto, non utilizza il metodo di Lagrange per

dimostrare il suo risultato. Una dimostrazione che utilizza il metodo di

Lagrange e data da Ballieu, in [Ballieu, 1942]. Ecco in breve questa dimo-

strazione.

20Cf. [Galois, 1976, p. 375].

163

Notiamo che data

f(x) = ax2 + bx+ c (9.20)

i coefficienti di

ϕ(x) = −x2f

(n+

1

x

)= αx2 + βx+ γ (9.21)

sono dati da

α = −(an2 + bn+ c) = −f(n),

β = −(b+ 2an) = −f ′(n),

γ = −a = −f ′′(n)

2.

(9.22)

Reciprocamente, abbiamo

f(x) = −(x− n)2ϕ

(1

x− n

)(9.23)

e quindi

a = −γ,

b = −β+ 2γn,

c = −γn2 + βn− α.

(9.24)

Per comodita, introduciamo anche il polinomio

F(x) = −γx2 + βx− α. (9.25)

Se ora l’equazione di secondo grado (9.20) ha una radice puramente perio-

dica ξ, deve essere ξ > 1 e l’altra radice deve essere compresa tra -1 e 0,

perche queste condizioni sono realizzate dopo un numero finito di passi (si

consideri il comportamento delle radici per le successive trasformazioni di

Lagrange esaminato a pag. 9.3).

Vediamo che le condizioni sono anche sufficienti. In effetti se un’equazione

ha una radice positiva maggiore di uno ed una radice compresa tra -1 e 0,

tutte le successive trasformate hanno questa proprieta.

164

Considerando i valori in -1,0,1, avremo, per un’equazione della forma

(9.20), ottenuta con una certa parte intera n,

a− b+ c > 0, c < 0, a+ b+ c < 0.

Tenendo conto delle (9.24), abbiamo

a− b+ c = −γ(n+ 1)2 + β(n+ 1) − α = F(n+ 1) > 0

e

c = −γn2 + βn− α = F(n) < 0.

Il polinomio F(x) ha una sola radice positiva (si rammenti che γ e α han-

no segni discordi) e dunque la parte intera della radice e n. Ne segue

che dall’equazione con coefficienti α,β, γ, tramite la radice positiva di F(x)

possiamo risalire ai coefficienti a, b, c.

Se dunque un’equazione si ripete accade lo stesso dell’equazione prece-

dente.


x2 − 10x− 4 = 0,

la quale ha le radici 5±√29. Abbiamo

5+√29 = [10, 2, 1, 1, 2 ].

Possiamo anche ‘procedere a ritroso’. Scriviamo l’equazione corrispondente

alla (9.25):

4x2 − 10x− 1 = 0.

Poiche si ha un cambiamento di segno in (2, 3), otteniamo per il quoziente

parziale che precede 10, il valore 2. Ora utilizziamo la (9.23), ed otteniamo:

4x2 − 6x− 5 = 0.

Allora, per retrocedere ulteriormente, dobbiamo considerare

5x2 − 6x− 4 = 0.

Si ha un cambiamento di segno fra 1 e 2, ecc.

165

9.5 Appendice: sulle possibili fonti per la

memoria di Galois sulle frazioni

continue

L’idea di completare il risultato di Lagrange considerando il caso delle frazio-

ni continue immediatamente periodiche puo parere naturale, ed e possibile

che Galois abbia esaminato un certo numero di casi numerici per determi-

nare la situazione geometrica delle radici di un’equazione di secondo grado

che abbia una soluzione data da una frazione continua immediatamente

periodica.

Tuttavia nella sua memoria compare una ‘simmetria’ che riesce difficile

da comprendere se ci si limita al terreno delle equazioni algebriche. Al

termine della dimostrazione vista a pagina 159, Galois aggiunge: “in cio

che precede noi abbiamo supposto che la radice proposta fosse piu grande

dell’unita, ma, se fosse

x =1

a+1

b+1

c+1

d+1

a+1

b+ . . .

(9.26)

si concluderebbe per uno dei valori di 1x, x,

1

x= a+

1

b+1

c+1

d+1

a+1

b+ . . .

(9.27)

ecc.”21 Galois utilizzando la tecnica vista in precedenza raggiunge la con-21Cf. [Galois, 1976, p. 369].

166

clusione che x = −[d, c, b, a].

In altre parole, se una radice e della forma 1

[a,b,c,d]l’altra radice e della

forma −[d, c, b, a]. Naturalmente per considerare ‘immediatamente perio-

diche’ anche le frazioni continue corrispondenti a questi due numeri biso-

gna modificare lievemente la definizione. Infatti nel primo caso lo sviluppo

abituale da [0, a, b, c, d], mentre nel secondo caso occorre distinguere tra

c = 1 e c = 1. Si ha infatti rispettivamente (verificarlo per esercizio e

considerare anche i casi di periodi piu brevi) [−(d+ 1), 1, c− 1, d, c, b, a] e

[−(d+ 1), c+ 1, d, d, c, b, a].

Questo completamento della dimostrazione che corrisponde a considera-

re il caso di un’equazione ottenuta con il cambiamento di variabili x← − 1x

non sembra molto naturale nel contesto degli irrazionali quadratici e sembra

suggerire una dipendenza dalla teoria delle forme quadratiche binarie.

La teoria delle forme quadratiche binarie iniziata da Lagrange, aveva

ricevuto dei contributi importanti da Legendre, nel suo Essai del 1798 e

Galois connosceva certamente la seconda edizione del 1808.22 Nell’opera

di Legendre il legame tra le formes quadratiche e le frazioni continue e

esplicito e Galois poteva certo trarne profitto. In particulare nel Capitolo

IX, Legendre dimostra il risultato di Lagrange sugli irrazionali quadratici.

E il Capitolo si conclude con delle ((Considerations diverses sur la resolution

de l’equation fy2 + gyz+ hz2 = ±D )), che collegano le soluzioni per interi

di questa equazione alle frazioni continue. Nel Capitolo seguente si ha una

dimostrazione (per la verita un po’ complicata) del fatto che per il caso delle

equazioni di secondo grado (( . . . la periode comprise dans le developpement

d’une racine est l’inverse de la periode comprise dans le developpement de

l’autre racine )).23

I risultati di Legendre sono strettamente connessi alla memoria di Ga-

lois, ma mi sembra tuttavia che la piu rigorosa organizzazione sistemati-

ca dell’opera di Gauss offra un punto di partenza migliore per il giovane

Galois.24

22Cf. [Galuzzi, 2001a].23Naturalmente da un certo posto in poi.24Nei manoscritti di Galois, raccolti in MS 2108 nella Bibliotheque de l’Institut de

France, non vi sono molte tracce dell’interesse di Galois per le forme quadratiche. Tut-

167

Nella Sezione cinque delle Disquisitiones Arithmeticae25 Gauss conside-

ra delle forme quadratiche binarie

ax2 + 2bxy+ cy2, a, b, c ∈ Z (9.28)

per le quali utilizza la notazione (a, b, c) e per le quali il determinante,

b2 − ac e in genere indicato con D.26

Nell’Articolo §183 Gauss da la definizione di forma ridotta:27

((Nous appellerons formes reduites les formes (a, b, c)28 dans

lesquelles a, pris positivement, est compris entre√D + b et√

D − b, b etant positif et <√D, et le determinant D etant

positif et non carre. ))29

Si associ alla forma (9.28) l’equazione

a+ 2bω+ cω2 = 0 (9.29)

diremo che −b−√D

ce la prima radice dell’equazione (9.29), mentre −b+

√D

c

sara detta la seconda radice.

tavia nella pagina 149b di MS 2108 si osserva come Galois abbia esaminato la pos-

sibilita di rappresentare l’unita con una forma quadratica data da p2 − Apq + Bq2.

Si puo porre evidentemente q = 0 e p = 1. Ma Galois considera anche il caso del

(( determinante ))A2 − 4B = −3 (Galois utilizza questo termine che e presente nella tra-

duzione francese delle Disquisitiones Arithmeticae, ma che non e utilizzato da Legendre

e Lagrange. Tuttavia, diversamente da Gauss, non suppone che il termine centrale sia

un intero pari). In questo caso la rappresentazione e data anche da q = ±1, p = Aq±12

.

Nella stessa pagina si trovano anche degli altri calcoli di difficile interpretazione. Bour-

gne e Azra hanno eliminato questa pagina nella loro edizione, giudicando i contenuti dei

calcoli poco significativi.25Faccio riferimento alla traduzione francese del 1807: [Gauss, 1807]. I riferimenti a

questo testo saranno dati nel seguito con RA. La lettura di questa opera di Gauss da

parte di Galois e ben documentata. Cf. l’Appendice II, di Bourgne e Azra: [Galois, 1976,

p. 526]. La mia ipotesi e che questa lettura sia stata molto precoce.26Il termine (( determinant )) e usato nella traduzione francese, come si e gia osservato

nella nota 24.27Per il caso di determinante positivo.28(A,B,C) nel testo originale.29Cf. RA, p. 161.

168

La definizione di Gauss equivale alla richiesta che l’equazione (9.29)

abbia due radici reali e opposte, e tali che il modulo della prima radice

sia maggiore dell’unita mentre il modulo della seconda radice sia minore

dell’unita.30

Osservazione 9.8 Si osserva facilmente che la richiesta puo essere sosti-

tuita semplicemente da quella che l’equazione (9.29) abbia due radici di

segno diverso delle quali l’una di modulo maggiore di 1 e l’altra di modulo

minore di 1.31

Un altra definizione importante e quella di forme contigue:

(( Si les formes (a, b, c), (a ′, b ′, c ′) ont le meme determinant, et

qu’on ait c = a ′ et b+b ′ ≡ 0 (mod. c), nous dirons qu’elle sont

contigues, et quand une designation plus exacte sera necessaire,

nous dirons que la premiere est contigue a la seconde par la

premiere partie, et que la seconde est contigue a la premiere par

la derniere partie. ))32

Una forma a ′x ′2 + 2b ′x ′y ′ + c ′y ′2 contigua alla forma ax2 + 2bxy + cy2

e tale che b ′ = −b − c δ. Poiche a ′ = c e le due forme debbono avere lo

stesso determinante, si vede che e la transformazione di variabili(x

y

)=

(0 1

−1 δ

)(x ′

y ′

)(9.30)

che muta la seconda forma nella prima.

30Dirichlet [1894, pp. 176-77] da direttamente questa definizione e io credo che questa

proprieta fosse evidente per un lettore come il giovane Galois. Un’ottima traduzione

italiana della terza edizione del testo di Dirichlet, compiuta da Aureliano Faifofer, e

[Dirichlet, 1881].31Si puo sempre supporre che il coefficiente b sia positivo. Naturalmente in termini

di forme quadratiche non e la stessa cosa, ma si puo passare da una forma (a, b, c) alla

(a,−b, c) con il cambiamento di variabili dato da x ← −x, y ← y e gli interi ottenibili

dalla prima forma sono anche ottenibili dalla seconda e viceversa.32Cf. RA, p. 125.

169

Si vede anche facilmente che l’equazione di secondo grado corrispondente

alla (9.29) e data dal cambiamento di variabile ω← δ− 1w. In altre parole:

w2

{a+ b

(δ−

1

ω

)+ c

(δ−

1

ω

)2}= a ′ + 2b ′ω+ c ′ω2. (9.31)

Un risultato importante che collega la nozione di forma ridotta e quella

di contiguita e il seguente:

(( Pour toute forme reduite (a, b, c), on peut en trouver une ega-

lement reduite qui lui soit contigue par l’une ou l’autre partie ;

mais on n’en pourra trouver qu’une )).33

L’algoritmo che permette il calcolo della forma contigua (a destra) e che

nello stesso tempo ne dimostra l’esistenza e, per quanto abbiamo osservato,

il seguente. Si pone a ′ = c; b ′ deve verificare b ′ ≡ −b (mod. c) e deve

essere compreso tra√D − |c| e

√D. Evidentemente c’e un solo b ′ che

verifica questa doppia condizione. Infine si calcola c ′ =b ′2 −D

a ′ .

Gauss, che, probabilmente per una scelta di stile non vuole associare ad

una forma quadratica degli irrazionali quadratici, non collega l’algoritmo

mediante il quale si passa da una forma ridotta alla forma ridotta contigua

alle radici dell’equazione (9.29). Ma il legame e cosı evidente che e difficile

immaginare che il giovane Galois non l’abbia scorto immediatamente.

In una forma ridotta (a, b, c), b e un numero positivo e la radice di

modulo piu grande dell’equazione a + 2bω + cω2 = 0 e, come abbiamo

osservato,

ζ =−b−

√D

c(9.32)

Sia δ = ±⌊ζ⌋, ove occorre scegliere lo stesso segno di quello di ζ. Il cam-

biamento di variabili che conduce all’equazione associata alla nuova forma

quadratica e dato da questo valore di δ:

ω ′ ← δ−1

ω(9.33)

33Cf. RA, p. 162

170

Fatta astrazione dal segno, troviamo la trasformata di Lagrange.34

Infine un altro risultato importante che poteva essere una fonte di ispi-

razione per Galois e dato dalla periodicita delle forme ridotte. Si dimostra

facilmente35 che il numero delle forme ridotte di dato determinante positivo

D e finito. In maniera del tutto simile a quella con la quale si dimostra

l’esistenza di una sola forma ridotta contigua a destra alla forma (a, b, c) si

dimostra l’sistenza di una sola forma contigua a sinistra ( ′a, ′ b, ′ c). Basta

porre ′a = a, ′b = −b (mod. ′c), con ′b compreso tra√D − |c| e

√D,

′a =′b2 −D

′c.

Se F e una forma ridotta di determinante D e si calcolano le forme

contigue F ′, F ′′, . . . si deve arrivare a due forme F(m) e F(m+n) identiche.

Mas F(m−1) e F(m+n−1) debbono essere identiche a loro volta, per cio che

abbiamo osservato . . . ((Ainsi dans la progression F, F ′, F ′′, etc. pourvu qu’on

la continue assez loin, on retrouvera enfin la forme F )).36

Il legame tra questo risultato e le frazioni continue immediatamente pe-

riodiche non e esplicito nel testo di Gauss, ma non e neppure troppo lontano.

Consideriamo il caso paradigmatico di una forma quadratica ridotta tale che

l’equazione associata abbia una radice positiva piu grande dell’unita. Se si

prendono i valori assoluti degli interi δ che compaiono nei calcoli delle forme

contigue che formano un periodo si ha in corrispondenza lo sviluppo in fra-

zione contina di questa radice. Poiche dopo un numero finito di passaggi la

periodicita impone che si debba ottenere la forma quadratica di partenza,

lo sviluppo in frazione continua della radice deve essere immediatamente

periodico, anche se il periodo puo essere (a causa dei cambiamenti di segni)

di lunghezza inferiore.

Osservazione 9.9 In questa sezione si sono semplicemente introdotti que-

gli elementi della teoria delle forma quadratiche binarie che potrebbero sug-

gerire un legame con la memoria di Galois. Naturalmente interrogativi del

tipo: “Perche si introducono le forme quadratiche binarie?”, “Quali problemi

34Si veda anche [Dirichlet, 1894, p. 183].35Cf. RA, pp. 163-16436Cf. RA, pp. 164-65. Si veda anche [Weber, 1895, 387-88] ove il risultato e dato

direttamente per gli irrazionali quadratici e le frazioni continue.

171

si vogliono risolvere?”, ecc. sono piu che legittimi. Una rapida introduzione

per rispondere a queste curiosita si trova in [Dieudonne, 1986, pp. 165-173].

172

Capitolo 10

Il teorema di Sturm

10.1 La memoria di Cauchy del 1815

La memoria, pubblicata da Cauchy nel 1815 nel Journal de l’Ecole Poly-

technique1 rappresenta un contributo notevole al problema di determinare

l’esatto numero di radici reali che un’equazione algebrica possiede in un

certo intervallo. Le ipotesi richieste da Cauchy sono un po’ piu onerose di

quelle richieste dal teorema di Sturm, e Cauchy non completa tutti i det-

tagli dimostrativi. Inoltre, i procedimenti di calcolo utilizzati sono molto

pesanti, soprattutto in un periodo in cui la teoria della eliminazione non

ha ancora tratto beneficio dalla teoria delle matrici, che si sviluppera negli

anni successivi.2

Gran parte della memoria contiene calcoli ingegnosi, ma anche un po’

faticosi, per sostituire ad un sistema di due equazioni un nuovo sistema,

costituito da equazioni di grado piu basso, per le quali l’eliminazione sia

piu agevole. Non esporro tutti i dettagli di questi calcoli3 e mi limitero a

presentare l’idea fondamentale.

1Cf. Cauchy [1815a].2Anche con contributi importanti dello stesso Cauchy.3Che, tuttavia, potrebbero rivelarsi di grande utilita in un’indagine futura.

173

Consideriamo un’equazione polinomiale di grado n, che indichiamo (di-

versamente da Cauchy, che usa la scrittura X = 0) con

f(z) = 0 (10.1)

Dovremo spesso fare riferimento al grafico rappresentativo.

Poniamoci nell’ipotesi che l’equazione considerata non abbia radici mul-

tiple, e che neppure le equazioni ausiliare, che verranno descritte in seguito,

abbiano radici multiple.

Cauchy osserva che e possibile classificare i punti di massimo e di minimo

secondo il comportamento descritto qui di seguito.

Supponiamo di percorrere il grafico nella direzione delle ascisse positive

e di arrestarci in un punto di massimo o di minimo. Diremo che il punto

e un vertice di prima specie, se, procedendo nella direzione delle ascisse

positive a partire dal punto stesso, la curva si avvicina all’asse delle ascisse,

mentre diremo che il punto e un vertice di seconda specie in caso contrario.

Se il punto di massimo o di minimo ha ascissa z0, esso sara (in generale)

un vertice di prima specie se

f(z0)f′′(z0) < 0,

mentre sara un vertice di seconda specie se

f(z0)f′′(z0) > 0.

Nella figura seguente, i punti di prima specie sono indicati con V , mentre

quelli di seconda specie sono indicati con v.

174

Figura 10.1: Vertici di prima e seconda specie

Cauchy formula la semplice relazione che lega il numero dei punti di

intersezione con l’asse delle ascisse con il numero dei vertici di prima e

seconda specie. Indichiamo con i il numero delle intersezioni del grafico con

l’asse delle ascisse, con P il numero dei vertici di prima specie e con S il

numero dei vertici di seconda specie.

Se consideriamo la porzione di grafico compresa tra due radici consecu-

tive α1 ed α2, indicando con P[α1,α2] il numero dei vertici di prima specie e

con S[α1,α2] il numero dei vertici di seconda specie, sara evidentemente

P[α1,α2] − S[α1,α2] = 1

Si osservi poi che nelle porzioni di grafico che precedono la prima radice

o seguono l’ultima radice la differenza P − S deve essere zero. Da queste

osservazioni segue immediatamente che, per l’intero grafico

P − S = i− 1 (10.2)

La (10.2) e stata scritta supponendo i ≥ 2, ma e facile osservare che

essa vale anche per i = 1 e i = 0.

Si osservi che, se si considera il numero di radici nel tratto compreso tra

due punti A e B possiamo immaginare di prolungare il grafico secondo le

direzioni indicate dalle tangenti in A e B senza aggiungere vertici. Poiche in

175

Figura 10.2: Il conteggio di Cauchy

tal modo e possibile che vengano aggiunte una o due radici dobbiamo tener

conto di queste radici nel conteggio totale per utilizzare ancora la formula

di Cauchy.

Ecco un esempio completamente esplicativo. Consideriamo la curva rap-

presentata nella figura seguente. Completando il grafico con i prolungamenti

che partono da A e B nelle due direzioni, abbiamo tre radici. Nel nostro

caso abbiamo P = 2 e S = 0 e, il semplice utilizzo della (10.2) produce il

valore 3. Ma una radice e stata aggiunta. In un caso come quello illustrato

dalla figura dobbiamo utilizzare la formula

P − S = i

Si notera che l’argomentazione di Cauchy ha carattere completamente

topologico: nel considerare la forma dei grafici non interviene minimamente

il modo analitico con il quale essi sono generati.

Ecco comunque quanto Cauchy arriva agevolmente a concludere:

• se si forma la differenza tra il numero dei vertici di prima e di seconda

specie, dapprima dal lato delle ascisse positive e poi dal lato delle

ascisse negative, la somma di queste due differenze, aumentata di

un’unita sara uguale al numero di punti di intersezione della curva

con l’asse delle ascisse;

176

• l’eccesso della prima differenza sulla seconda sara superiore o inferiore

di un’unita alla differenza che esiste tra il numero delle radici positive

ed il numero delle radici negative a seconda che, avvicinandosi all’asse

delle ordinate dalla parte delle ascisse positive il grafico si avvicini

all’asse delle ascisse o se ne allontani.

Vediamo la traduzione analitica di questi risultati

Consideriamo la coppia di equazioni

f′(z) = 0, y+ f(z)f′′(z) = 0. (10.3)

L’eliminazione della variabile z tra le due equazioni (10.3) produce un’equazione

in y, che possiamo indicare con

g(y) = 0,

di grado n− 1, la quale ha per radici i valori opposti a quelli che assume la

quantita f(z)f′′(z) in corrispondenza ai valori dove f′(z) e nulla.

Se supponiamo che l’equazione di partenza f(z) = 0 non abbia radici

multiple e che altrettanto accada per l’equazione f′(z) = 0, non puo essere

contemporaneamente per un certo valore α, f′(α) = 0 e f(α) · f ′′(α) = 0.Poiche la condizione

f′(α) = 0 e f(α)f ′′(α) < 0

equivale ad un vertice di prima specie, mentre la condizione

f′(α) = 0 e f(α)f ′′(α) > 0

equivale ad un vertice di seconda specie, abbiamo il seguente teorema.

Teorema 10.1 Il numero di radici reali dell’equazione f(z) = 0 sorpassa

sempre di un’unita la differenza che esiste tra il numero di radici positive

ed il numero di radici negative dell’equazione ausiliaria g(y) = 0.

Esempio 10.1 Consideriamo il polinomio di secondo grado

f(z) = z2 + pz+ q.

177

Dobbiamo eliminare y tra

2z+ p = 0

e

y+ (z2 + pz+ q) · 2.

Si ottiene

2y− p2 + 4q = 0

e si ricava la condizione usuale per la realta delle radici.

Esercizio 10.1 Si ottenga la condizione per la realta delle radici di

z3 + pz+ q = 0.

Naturalmente, il passaggio da f(z) a g(y) e semplicemente la riduzio-

ne del problema di determinare il numero di radici reali ad un livello di

complessita inferiore. Ma Cauchy supera questa difficoltaintroducendo una

seconda equazione ausiliaria (ancora occorre l’ipotesi che f′(z) e f′′(z) non

abbiano radici comuni): quella che si ottiene dalla eliminazione di z tra le

due equazioni

f′(z) = 0, x+ zf(z)f′′(z) = 0.

Indichiamo con h(x) = 0 questa nuova equazione. Anch’essa e di grado

n − 1 nella variabile x e serve, grazie all’introduzione di z a fattore, per

contare i vertici di prima e seconda specie dalla parte delle ascisse positive

o negative. Si ha il seguente teorema.

Teorema 10.2 La differenza tra il numero delle radici positive e negative

dell’equazione f(z) = 0 e superiore o inferiore di una unita alla stessa

differenza, nell’equazione ausiliaria h(x) = 0 a seconda che il prodotto dei

due ultimi coefficienti dell’equazione proposta sia negativo o positivo.

I due teoremi precedenti, in una situazione generale, forniscono un sem-

plice4 algoritmo per valutare il numero di radici reali di un’equazione f(z) =

0.

4Semplice dal punto di vista concettuale, naturalmente.

178

Algoritmo 10.1 Ecco una breve descrizione.

• Associamo ad f(z) = 0 l’equazione ausiliaria g(y) = 0. Si tratta

di decidere la differenza tra il numero di radici positive ed il numero

di radici negative di questa equazione ausiliaria e di sommarvi poi

un’unita.

• La differenza che cerchiamo puo essere ottenuta, in forza del teorema

precedente, valutando la differenza tra il numero di radici positive e

negative dell’equazione h1(x) = 0 che si ottiene dalla eliminazione di

x tra

g′(y) = 0 e x+ yg(y)g′′(y) = 0.

Si tratta di aggiungere o togliere una unita a seconda del segno del

prodotto dei due ultimi coefficienti di g(y).

• A partire da h1(x), formiamo con le stesse modalita una nuova equa-

zione h2(x) = 0, memorizzando la necessita di aggiungere o togliere

una unita (e scegliendo opportunamente i nomi delle variabili).

• Procediamo in questo modo, costruendo le equazioni h1(x) = 0, h2(x) =

0, . . ., di grado n−1, n−2, . . . fino a che non si arrivi ad un’equazione

hk(x) = 0 per la quale la differenza tra il numero delle radici positive

e negative sia noto (per esempio hk(x) sia di primo grado).

• A questo punto basta aggiungere o togliere unita, secondo quanto ab-

biamo memorizzato, per risalire alla differenza tra il numero delle

radici positive e negative di g(y) = 0, e dunque al numero di radici

reali di f(z) = 0.

Prima di ogni commento critico, e opportuno vedere un esempio.

Esempio 10.2 Vogliamo conoscere il numero di radici reali dell’equazione

f(z) = z3 − z2 + z+ 1 = 0.

179

Questo numero si ottiene aggiungendo 1 al numero che esprime la differenza

tra il numero delle radici positive e quello delle radici negative di g(y) = 0,

ossia dell’equazione che si ottiene eliminando la variabile z tra

f′(z) = 3z2 − 2z+ 1 = 0

e

y+ f(z)f′′(z) = y+ (z3 − z2 + z+ z) · (6z− 2) = 0.

Si ottiene

g(y) = 81y2 − 96y+ 1056 = 3(27y2 − 32y+ 352)

Si tratta di eliminare la variabile y tra

g′(y) = 6(27y− 16y) = 0

e

x+ yg(y)g′′(y) = x+ y(81y2 − 96y+ 1056) · 162 = 0.

Un calcolo non molto invitante da eseguire a mano. Si ottiene:

h(x) = 3x+ 295936 = 0.

Quest’equazione ha una sola radice negativa e dunque la differenza tra il

numero delle radici positive e negative vale −1. Poiche nell’equazione

g(y) = 0 il prodotto dei due ultimi coefficienti e negativo, dobbiamo ag-

giungere 1 per avere la differenza tra il numero delle radici positive e quello

delle radici negative di g(y). Si ottiene 0 (in effetti g(y) = 0 non ha radici

reali).

Poiche la differenza tra il numero delle radici positive e negative di g(y) e

0, abbiamo che l’equazione f(z) = 0 ha una sola radice reale.

Il metodo di Cauchy, se applicato in modo banale, come nell’esempio

precedente, conduce facilmente a notevoli complicazioni di calcolo. Inoltre

e assai facile trovare casi ove esso non e applicabile, perche si trovano radici

nulle nelle equazioni ausiliarie o per altre ragioni. Rappresenta tuttavia un

progresso concettuale notevole, poiche mostra che, in linea di principio, e

180

possibile risolvere il problema del numero delle radici reali costruendo una

catena di polinomi di grado decrescente.

Gran parte del seguito della memoria di Cauchy, sul quale non mi soffer-

mo, consiste nel cercare di sostituire alle equazioni ausiliarie altre equazioni

piu opportune, in modo da eliminare le difficolta di calcolo per rendere il

metodo applicabile, almeno nel caso delle equazioni di grado piu basso. I

procedimenti di Cauchy sono spesso assai ingegnosi ma, almeno, al momento

presente, si rivelano di scarsa utilita pratica.

10.2 Il teorema di Sturm

A meta degli anni venti dell’Ottocento, la situazione in merito al problema

di separare le radici di un’equazione algebrica sembra ben consolidata. La

memoria di Cauchy che abbiamo esaminato nella sezione precedente non ha

trovato particolari consensi.5

E poi difficile immaginare un ‘miglioramento’ rispetto al teorema di

Budan-Fourier.

La sequenza di polinomi

S(z) : f0(z) = f(z), f1(z) = f′(z), f2(z) = f

′′(z), . . . , fn(z) = f(n)(z),

si collega in modo del tutto naturale al polinomio f(z): per ogni valore α

i valori della sequenza S(α) contengono l’informazione essenziale che per-

mette di costruire f(α+ z) nel modo piu semplice: attraverso la formula di

Taylor.

D’altra parte le difficolta connesse al controllo del numero di variazioni

di S(z) sembrano ineliminabili. Si puo immaginare di ridurre f(z) ad avere

solo radici semplici: in questo modo il passaggio per una radice implica esat-

tamente il calo di una variazione per la sequenza S(z). Ma come controllare

con precisione l’effetto delle radici di f′(z) ? Sembra necessario qualche

strumento piu raffinato, che tenga conto, ad esempio, della struttura delle

sequenze dei segni, e vada al di la del mero conteggio.

5Un’analisi critica dei risultati esposti da Cauchy, dovuta con grande probabilita a

Legendre, conclude in modo piuttosto scettico [da completare].

181

Il risultato ottenuto dal giovane matematico ginevrino nel 1829, giunge

del tutto inatteso: sia per la completezza della soluzione sia per la tecnica

dimostrativa di sbalorditiva semplicita.6

La dimostrazione seguente riproduce sostanzialmente il testo di Sturm7.

In effetti il teorema di Sturm e uno di quei risultati classici e definitivi che,

come il teorema di Euclide sull’infinita dei numeri primi, sembrano collocati

fuori dal tempo.

Iniziamo con il supporre che f(z) e f′(z) non abbiano radici comuni,

ossia che f(z) abbia solo radici semplici. E assai facile ricondursi a questa

situazione, e dunque non abbiamo una limitazione essenziale.

Costruiamo, attraverso l’algoritmo di Euclide, lievemente modificato,

la seguente successione di polinomi: poniamo all’inizio

f0(z) = f(z), f1(z) = f′(z).

Poi proseguiamo, con successive divisioni, fino a trovare un ultimo polinomio

fp(z), che dia un resto non nullo, nel modo seguente:

f0(z) = q1(z)f1(z) − f2(z), (10.4)

f1(z) = q2(z)f2(z) − f3(z),

. . . . . . . . .

fp−2(z) = qp−1(z)fp−1(z) − fp(z).

Osserviamo che:

• fp(z) deve essere necessariamente una costante non nulla, perche f0(z)

e f1(z) non hanno zeri in comune.6Molto importante per il ricco contenuto informativo e tuttora l’articolo di Gino

Loria Loria [1938]

Gli sviluppi che hanno condotto dal teorema di Sturm verso l’algebra moderna e la

logica sono esposti nell’ottimo libro di Hourya Sinaceur Sinaceur [1991]. Un importante

articolo che descrive gli sviluppi del teorema di Sturm sino agli anni venti e Mignosi

[1925].7L’annuncio del risultato si trova in una nota del 1829 nel Bullettin des Sciences

mathematiques de Ferussac. La dimostrazione e poi pubblicata in Sturm [1835].

Per i dettagli bibliografici si veda comunque Sinaceur [1991]. E lo stesso Sturm che

manifesta nell’articolo del 1829 il suo profondo debito verso Fourier, con il quale era in

rapporti assai amichevoli.

182

• Per un qualsiasi numero reale α non puo verificarsi, per due indici

consecutivi, k e k+ 1

fk(α) = fk+1(α) = 0.

Se k = 0 si tratta semplicemente dell’ipotesi che f0(z) e f1(z) siano

privi di radici comuni. Se k > 0, anche fk−1(α) = 0, e si perviene

ancora a concludere che f0(α) = f1(α) = 0, in contrasto con l’ipotesi

iniziale.

• Se per un certo valore α e per k ≥ 1, si ha fk(α) = 0 si ha anche

fk−1(α)fk+1(α) < 0.

Infatti, come abbiamo osservato al punto precedente, nell’ipotesi che

fk(a) sia nullo, si ha fk−1(α)fk+1(α) = 0 e dalle identita (10.4)

abbiamo

fk−1(α) = −fk+1(α).

Consideriamo ora due arbitrari numeri reali a e b, con a < b.e suppo-

niamo che f0(a)f0(b) = 0. Esaminiamo il comportamento della sequenza

S(z) : f0(z), f1(z), f2(z), . . . , fp(z).

Mentre z cresce da a verso b, se si ha, per un certo valore z = β,

fk(β) = 0, con k > 0, abbiamo in corrispondenza queste possibilita:

• fk(z) si annulla ma non cambia segno nell’intorno di β: allora il

numero di variazioni di S(z) rimane inalterato.

• fk(z) si annulla passando da un valore negativo ad un valore positi-

vo. Sappiano pero che i termini adiacenti sono non nulli per z = β

e di segno opposto. Con il passaggio per β abbiamo allora queste

possibilita [− − +

]−→ [

− + +],

oppure [+ − −

]−→ [

+ + −]

le quali entrambe lasciano inalterato il numero di variazioni.

183

• fk(z) si annulla passando da un valore positivo ad un valore negativo.

Questa volta si ha[− + +

]−→ [

− − +],

oppure [+ + −

]−→ [

+ − −]

ed il numero di variazioni rimane lo stesso.

In ogni caso, dunque, il passaggio per uno zero di fk(z) con k > 0 non

altera il numero di variazioni di S(z). Vediamo l’effetto del passaggio per

uno zero di f0(z).

Poiche non vi sono radici multiple, se γ e uno zero di f0(z), il polinomio

f0(z) passa da valori negativi a valori positivi a seconda che sia f1(γ) positivo

o negativo (attenzione: l’ipotesi che non vi siano radici multiple ricorre

continuamente !). Abbiamo allora queste possibilita[− +

]−→ [

+ +],[

+ −]−→ [

− −]

le quali entrambe implicano la perdita di una variazione.

Ecco la conclusione.

Teorema 10.3 ( Sturm) Il numero degli zeri di f(z) compresi tra a e b e

esattamente uguale al numero di variazioni perdute dalla sequenza S(z) nel

passaggio da a a b.

Esempio 10.3 Consideriamo il polinomio

f0(z) = z4 − z+ 1.

Abbiamo

f1(z) = 4z3 − 1.

Poi

z4 − z+ 1 =1

4z(4z3 − 1) − (

3

4z− 1)

184

e

f2(z) =3

4z− 1.

Poi

4z3 − 1 = (16

3z2 +

64

9z+

256

27)(3

4z− 1) − (−

229

27),

e quindi

S(z) =

[z4 − z+ 1, 4z3 − 1,

3

4z− 1,−

229

27

].

Ora

S(0) =

[1,−1,−1,−

229

27

]e

S(∞) = [1, 1, 1,−1].

Poiche le due sequenze presentano lo stesso numero di variazioni, non vi

sono radici reali e positive. Poiche

S(−∞) = [1,−1,−1,−1]

si conclude che l’equazione proposta non ha radici reali.

Osservazione 10.1 Si consideri invece quanto si puo ricavare dal teorema

di Fourier. Abbiamo la sequenza

F(z) = [z4 − z+ 1, 4z3 − 1, 12z2, 24z, 24].

Allora

F(0) = [1,−1, 0, 0, 24],

F(∞) = [1, 1, 1, 1, 1]

e concludiamo soltanto che possono esservi 2 o 0 radici reali e positive.

Poi

F(1) = [1, 3, 1, 1, 24]

e le eventuali radici sono tra 0 e 1. Si comprende facilmente che tutto

cio che si puo ottenere e semplicemente una successione di intervalli di

ampiezza decrescente dove cercare le eventuali radici. Ma non si arriva mai

ad una situazione ove si possa decidere che non vi sono radici reali.

185

10.3 Osservazioni complementari

Il teorema di Sturm, non ha solamente un significato numerico. Anzi: esso

permette di avere importanti informazioni sulla struttura delle equazioni,

anche se assegnate in modo simbolico.

Qra vediamo qualche esempio.

Osservazione 10.2 La condizione affinche un polinomio f0(z) di grado n

(privo di radici multiple) abbia tutte le radici reali e che nella successione

di Sturm

S(z) = [f0(z), f1(z), . . . , fp(z)] (10.5)

sia p = n e che i coefficienti direttori dei polinomi fk(z) siano tutti dello

stesso segno. Infatti in tal caso, indicando con V(z) il numero di variazioni

della (10.5) nel punto z (con ovvio significato per V(−∞) e V(∞)) abbiamo

V(−∞) − V(∞) = n.

Cosı, per il polinomio di secondo grado z2 + pz+ q, abbiamo

S(z) =

[z2 + pz+ q, 2z+ p,−q+

1

4p2].

Allora

V(−∞) =

[1,−1, sign(−q+

1

4p2)

],

mentre

V(∞) =

[1, 1, sign(−q+

1

4p2)

].

Si ritrova la condizione familiare

p2 − 4q > 0.

Nel caso dell’equazione di terzo grado,8

z3 + pz+ q = 0,

8E un esempio che lo stesso Sturm ha cura di proporre. Cf. [Sturm, 1835, pp. 298-99]

186

si ha

S(z) =

[z3 + pz+ q, 3z2 + p,−

2

3pz− q,−1/4

4p3 + 27q2

p2

],

e deve essere

p < 0 e 4p3 + 27q2 < 0.

La seconda condizione implica la prima, e dunque basta

4p3 + 27q2 < 0.

Si notera che per le equazioni di grado superiore, le condizioni che si de-

ducono immediatamente dal teorema di Sturm sono meno trasparenti . Si

provi con

z4 + pz2 + qz+ r.

Data l’importanza della situazione in cui la sequenza di f(z) ha esatta-

mente n+ 1 termini e opportuno dare una definizione.

Definizione 10.1 La sequenza di Sturm del polinomio f(z) e regolare se e

composta esattamente da n + 1 polinomi. In tal caso, evidentemente fk(z)

ha grado n− k e tutti i quozienti hanno grado 1.

Esercizio 10.2 Si consideri l’equazione generica della forma

zn + az+ b = 0.

Si determini la condizione sui parametri a, b in modo che essa abbia il

numero massimo possibile di radici reali. Qual’e questo numero ?

Si osserva facilmente che la dimostrazione del teorema di Sturm consta

di due parti distinte:

• la costruzione, attraverso l’algoritmo di Euclide della successione di

polinomi

S(z) = [f0(z), f1(z), . . . , fp(z)] ;

187

• l’analisi della sequenza stessa, al fine di concludere che solo il passaggio

per uno zero di f0(z) puo causare la perdita di una variazione.

Per effettuare l’analisi della sequenza S(z) non occorre sapere come la se-

quenza stessa venga costruita: basta disporre di una sequenza che possieda

queste proprieta:

1) le funzioni di S(z) sono continue in [a, b];

2) f0(z) non si annulla in a ed in b, ed ha una derivata continua in (a, b);9

3) fp(z) non si annulla in alcun punto di (a, b) ed ha quindi segno costante;

4) se a ≤ α ≤ b, non puo essere contemporaneamente

fj(α) = fj+1(α) = 0, per j = 0, 1, . . . , n− 1;

5) se si ha

fj(α) = 0

allora

fj−1(α) · fj+1(α) < 0 per j = 1, 2, . . . , n− 1;

6) se f0(α) = 0, la derivata f′0(α) e diversa da 0 e f1(α) ha il segno di f′0(α).

Una qualsiasi sequenza con le proprieta 1) - 6) permette di trarre la

stessa conclusione.

Definizione 10.2 Una sequenza con le proprieta precedenti si dice sequen-

za di Sturm generalizzata.

Useremo invece il nome di ‘sequenza di Sturm’ per denotare esattamente

la sequenza costruita a partire da f0(z) e f1(z) = f′0(z).

9Si puo eliminare questa ipotesi e formulare il punto 6) nel modo seguente: in un

intorno di una radice reale α le due funzioni V0 e V1 hanno segno opposto per x < α e

lo stesso segno per x > α.

188

Esempio 10.4 (Sylvester) Si consideri il polinomio

f0(z) = 1+z

1!+z2

2!+ . . .+

zn

n!.

Vogliamo mostrare che l’equazione f0(z) = 0 ha al piu una radice reale

(necessariamente negativa). Osserviamo, a tal fine che

f0(z) − f′0(z) =

zn

n!

e

S(z) = [f0(z), f′0(z),−z

n]

e una sequenza di Sturm in (−∞,−ε).Sia n pari: per z = −∞, si ha S(−∞) = [1,−1,−1] mentre S(−ε) = (ap-

plicando la funzione sign)= [1, 1,−1]. Non vi sono radici.

Sia n dispari: S(−∞) = [−1, 1, 1], mentre S(−ε) = [1, 1, 1]. Si ha esat-

tamente una radice in (−∞,−ε). Per la arbitrarieta di ε si conclude che

esiste una radice negativa in (−∞, 0).10.4 Un risultato piu generale

A conclusione della sua memoria, Sturm fa un’osservazione importante.

Supponiamo di costruire una successione di polinomi, con il metodo di

Sturm

f0(z), f1(z), f2(z), . . . , fp(z) (10.6)

assumendo semplicemente che f1(z) sia un arbitrario polinomio di grado

inferiore a quello di f0(z) privo di fattori in comune con f0(z). Questa volta,

quando la variabile z passa per uno zero di f0(z) il segno del rapportof0(z)

f1(z)non e piu controllabile con il Lemma ??. Puo passare da un valore positivo

ad uno negativo o viceversa; od avere segno costante. Ma, ancora una

volta, l’annullarsi di una funzione intermedia non puo cambiare il numero

di variazioni. Si ha il seguente teorema.

Teorema 10.4 Il numero di radici dell’equazione f0(z) = 0, comprese tra

due numeri a, b, per le quali il rapportof0(z)

f1(z)passa da valori negativi a

189

valori positivi meno il numero di radici dell’equazione f0(z) = 0, comprese

tra gli stessi numeri, per le quali il rapportof0(z)

f1(z)passa da valori positivi

a valori negativi e uguale al numero di variazioni perdute nella successione

(10.6) nel passaggio da a a b.

Cauchy porra esattamente questa nozione (con f0(z) e f1(z) scambiate)

a fondamento della propria generalizzazione del teorema di Sturm.

190

Capitolo 11

Galois e l’origine dell’algebramoderna

In questo capitolo espongo per sommi capi il contenuto della memoria fon-

damentale di Galois: [Galois, 1976, pp. 43-71]. Kaplansky, nel suo bel libro

(cfr. [Kaplansky, 1972, p.10]) osserva:“It was Galois’ remarkable discovery

that many questions concerning a field are best studied by transforming

them into group theoretical questions in the group of automorphisms of

the field.” Il che e verissimo, ma se un lettore, partendo unicamente dalla

lettura del libro di Kaplansky, volesse leggere il testo originale di Galois,

si troverebbe in qualche difficolta. Per questo nella sezione successiva mi

propongo di creare un breve raccordo tra le moderne nozioni algebriche e

la presentazione di Galois.1

1Vi sono numerosi testi che, in vari modi, si pongono questo stesso obiettivo.

Per quanto segue ho considerato soprattutto [Tignol, 2001]. Nel seguito saranno dati

riferimenti piu precisi.

191

11.1 Una breve introduzione sul concetto

di gruppo di Galois

Nella memoria originale di Galois il ‘gruppo di Galois’ e definito direttamen-

te come un gruppo di sostituzioni sulle radici. Per comprendere al meglio i

suoi risultati e meglio premettere la concezione che Galois possiede di grup-

po di sostituzioni, prescindendo per ora dall’ipotesi che gli elementi sui quali

si operano le sostituzioni siano le radici di un’equazione.2

Consideriamo allora n elementi x1, x2, . . . , xn. Una sostituzione σ e

semplicemente una applicazione biunivoca dell’insieme {x1, x2, . . . , xn} in se

stesso. Abitualmente si denotano le sostituzioni nella forma

σ =

(x1 x2 . . . xn

xi1 xi2 . . . xin

)(11.1)

per indicare in modo visivamente assai chiaro che si ha σ(xk) = xik . Poi-

che le sostituzioni sono particolari funzioni (biunivoche), la composizione

di funzioni e associativa, valgono le leggi di cancellazione a sinistra ed a

destra, e possiamo sempre immaginare che sia data anche la sostituzione

identica, che indichiamo con 1, la richiesta che Galois pone perche un insie-

me di sostituzioni {1, σ, τ, . . .} formi un gruppo e semplicemente la chiusura

rispetto alla composizione.3

Galois da spesso una formulazione ‘visiva’, attraverso una tabella, della

nozione di gruppo.4 Consideriamo, ad esempio il sottogruppo, del grup-

po totale di permutazioni su x1, x2, x3, x4, generato da 1, σ = (x1 x2), τ =

(x3 x4). Per ottenere tutti gli elementi del gruppo basta aggiungere στ =

(x1 x2)(x3 x4).2Galois conosce la pionieristica memoria di Cauchy [1815b], che cita piu volte.3I gruppi di sostituzioni sono particolari gruppi finiti, per i quali la definizione e

assai semplice. Ecco come la presenta Serret (usando il termine ‘sistema di sostituzioni

coniugate invece di ‘gruppo’): “Essendo date piu sostituzioni formate con n lettere, se,

moltiplicandole una piu volte le une per le altre o per se stesse non si ottengono altro

che sostituzioni contenute nell’insieme (suite) di quelle date, esse costituiscono cio che

Cauchy ha chiamato un sistema di sostituzioni coniugate. . . ” [Serret, 1879, p. 278].4Cf. [Edwards, 1984, p. 48-51]. Tuttavia mi pare che Edwards assegni troppo valore

esplicativo a cio che per Galois e semplicemente una comoda visualizzazione. In molti

casi Galois opera in termini del tutti simili a quelli attuali.

192

Guardiamo ora la seguente tabella la quale elenca gli allineamenti che

si ottengono da x1 x2 x3 x4 applicando le permutazioni σ, τ, στ ad essa.

x1 x2 x3 x4

x2 x1 x3 x4

x1 x2 x4 x3

x2 x1 x4 x3

(11.2)

La chiusura rispetto alla composizione equivale a dire che, se riordiniamo le

colonne in funzione di un riga qualsiasi, per riavere l’ordinamento ‘naturale’,

si riottengono (pur non nello stesso ordine) le stesse righe. Scegliamo ad

esempio la quarta riga. Per riavere gli elementi nell’ordine x1, x2, x3, x4occorre scambiare la prima e la seconda colonna e la terza e la quarta. Si

ha allorax2 x1 x4 x3

x1 x2 x4 x3

x2 x1 x3 x4

x1 x2 x3 x4

(11.3)

La tabella (11.3) differisce dalla (11.2) solo per l’ordinamento delle righe.

Le verifiche compiute in funzione di altre righe mostrano l’invarianza (nei

termini detti) del risultato.5

Un teorema che Galois utilizza sistematicamente

Sia p(x) un polinomio irriducibile e sia q(x) un altro polinomio qualsiasi.

Supponiamo che in una opportuna estensione del campo base i due polinomi

abbiano la radice α in comune. Allora p(x) divide q(x).

Sia infatti d(x) il massimo comun divisore, allora, per certi due polinomi

a(x), b(x) si ha

d(x) = a(x)p(x) + b(x)q(x)

e quindi d(α) = 0.

Poiche p(x) e irriducibile il massimo comun divisore, che non puo essere

di grado 0 avendo la radice α, deve coincidere (a meno di una costante) con

p(x) stesso, e quindi p(x) divide q(x).

5Cf. [Edwards, 1984, pp. 48-51].

193

Naturalmente questo significa anche che tutte le radici di p(x) debbono

essere radici di q(x) (in una opportuna estensione, ove queste radici esistano,

ovviamente).6 Il risultato si estende in modo ovvio al caso in cui q(x) sia

una funzione razionale.

Ecco ora un breve cenno (in termini un po’ modernizzati) della presen-

tazione originale.

11.2 Un lemma preliminare

Sia φ(x) = 0 un’equazione priva di radici multiple avente i coefficienti in

un campo K di caratteristica 0. Siano x1, x2, . . . , xn le radici dell’equazione

ed indichiamo con P l’insieme delle permutazioni delle radici.

Lemma 11.1 E possibile determinare una funzione razionale

V : P → K(x1, x2, . . . , xn)

iniettiva. In particolare si possono scegliere n elementi del campo K, a1, a2, . . . , an,

tali che la funzione definita da

V : (xi1 xi2 . . . xin) 7→ a1xi1 + a2xi2 + · · ·+ anxin

sia iniettiva.7

Dimostrazione. (Dedekind) Poniamo ai = hi−1 e consideriamo il polinomio

p(t) =∏

i1,i2,...,in

[t− (xi1 + xi2h+ · · ·+ xinhn−1)]

Il polinomio p(t) ha due radici coincidenti se e solo se si ha un’uguaglianza

della forma

xi1 + xi2h+ · · ·+ xinhn−1 = xj1 + xj2h+ · · ·+ xjnhn−1.6Galois da il risultato in questa forma: cf. [Galois, 1976, p. 47].7La dimostrazione di Dedekind’s si trova in [Scharlau, 1981, p. 81]. Si veda anche

[Edwards, 1984, p. 36].

194

dove (xi1 xi2 . . . xin) e (xj1 xi2 . . . xjn) sono due permutazioni distinte. Se

consideriamo il discriminante del polinomio p(t) (che non e identicamente

nullo: lo si dimostri per esercizio), abbiamo un polinomio in h che ha solo

un numero finito di radici.

Basta allora scegliere h in modo che non sia una radice. 2

Esempio 11.1 Consideriamo il caso semplice ma gia esplicativo, di un’equazione

di secondo grado, con due radici distinte x1, x2. Sia

φ(x) = x2 + px+ q = (x− x1)(x− x2).

Dobbiamo allora considerare

p(t) = [t− (x1 + hx2)][t− (x2 + hx1)] =

= t2 − (x1 + x2)(1+ h)t+ x1x2 + (x21 + x22)h+ x1x2h

2(11.4)

Il discriminate del polinomio p(t) risulta

(h− 1)2 (x1 − x2)2

ed e dunque sufficiente prendere h diverso da 1. �

11.3 La risolvente di Galois

Ad una funzione V con le caratteristiche indicate si da spesso il nome

di risolvente di Galois. Scegliamo ora un valore di V , ad esempio quello

corrispondente alla permutazione identica (che indichiamo con 1)

V1 = V(x1, x2, . . . , xn)

e sia F(V) il suo polinomio minimo.8

Osservazione 11.1 Tutte le radici di F(V) hanno la forma

V(xi1, xi2 , . . . , xin).

8Poiche x1, x2, . . . , xn sono radici di un polinomio a coefficienti nel campo base K

anche ogni valore di V e radice di un polinomio a coefficienti nel campo base. Esiste

dunque il polinomio minimo di V1.

195

Dimostrazione. Indichiamo con Vσ, Vτ, . . . i valori che assume V1 quando

applichiamo a (x1 x2 . . . xn) tutte le permutazioni σ, τ, . . . e consideriamo

f(V) = (V − V1)(V − Vσ)(V − Vτ) · · ·

Il polinomio f(V) ha i coefficienti in K, per il teorema sui polinomi simme-

trici, ed ha la radice V1. Dalle proprieta del polinomio minimo segue che

F(V)|f(V).9 �Dimostriamo ora che K(V1) e il campo di decomposizione di φ(x). Dia-

mo al teorema la forma scelta da Galois.

Teorema 11.1 Sia

V : P → K(x1, x2, . . . , xn)

una funzione iniettiva e sia

V1 = V(x1, x2, . . . , xn).

Allora tutte le radici di φ(x) = 0 sono funzioni razionali di V1.10

Dimostrazione. Introduciamo una variabile t e consideriamo il polinomio

p(t) = [t− V(x1, x2, x3, . . . )][t− V(x1, x3, x2, . . . )] · · · (11.5)

che si ottiene considerando tutte le permutazioni che fissano una radice, ad

esempio x1. Questo polinomio ha per coefficienti funzioni simmetriche delle

altre radici x2, . . . , xn. Se indichiamo con u1, u2, . . . , un le funzioni simme-

triche delle radici x1, x2, . . . , xn e con v1, v2, . . . , vn−1 le funzioni simmetriche

delle sole radici x2, . . . , xn, possiamo utilizzare le relazioni

v1 = u1 − x1, v2 = u2 − u1x1 + x21, . . . (11.6)

per riscrivere il polinomio (11.23) come un polinomio nelle due variabili t, x1a coefficienti in K. Indichiamo questo polinomio con p(t, x1).

9In termini piu vicini a quelli di Galois si puo definire F(V) come il fattore irriducibile

di f(V) che contiene la radice V1.10Una chiara descrizione della dimostrazione di Galois’ si trova in Radloff [2002]. Si

veda anche la mia recensione di questo articolo sulla rivista Mathematical Reviews.

196

Abbiamo identicamente p(V1, x1) = 0, dalla quale identita possiamo

dedurre che l’equazione

p(V1, x) = 0

ha la radice x1.

Poiche abbiamo anche φ(x1) = 0, le due equazioni p(V1, x) = 0, φ(x) =

0, hanno certamente in comune almeno la radice x1.

Se d(x) e il massimo comun divisore di questi due polinomi abbiamo

dunque d(x1) = 0.

Per la definizione di massimo comun divisore, gli eventuali altri valori

per i quali si annulla vanno ricercati tra x2, x3, . . . , ossia tra i valori che

annullano φ(x). Ma se, ad esempio, d(x2) = 0 necessariamente anche

p(V1, x2) = 0.

Ora basta riflettere sul modo con il quale e costruito p(t, x1) (a partire

dalle (11.23)) per comprendere che essendo p(t, x2) costruito nello stesso

modo, ponendo la radice x2 al posto di x1, se fosse p(V1, x2) = 0, V1 do-

vrebbe coincidere con uno dei valori V(x2, xi2 , . . . ) e dunque la funzione V

non sarebbe iniettiva sulle permutazioni.11

Se d(x) ha la sola radice x1 si tratta dunque, con il metodo delle divisioni

successive, di determinare un polinomio di primo grado nella variabile x a

partire da φ(x) e da p(V1, x). Eguagliando a 0 il risultato si ottiene x1 nei

termini di V1. In modo analogo si procede per esprimere le altre radici. 2

Esempio 11.2 Consideriamo l’equazione di terzo grado x3 + px + q = 0,

e siano x1, x2, x3 le sue radici. Se l’equazione e irriducibile, una funzione V

e data da

V = x1 − x2.12

Abbiamo:

p(t) = [t−(x1−x2)][t−(x1−x3)] = t2−[2x1−(x2+x3)]t+x

21−(x2+x3)x1+x2x3.

11Si veda la nota 13, ove e dato un esempio chiarificatore.12Vi sono due tipologie di verifiche da effettuare: se x1 − x2 = x2 − x1 si ha x1 = x2.

Se x1 − x2 = x2 − x3 si ha 2x2 = x1 + x3, ossia 3x2 = x1 + x2 + x3 = 0. Gli altri casi

sono simili.

197

Tenendo conto di x2+x3 = −x1, x1(x2+x3)+x2x3 = p, ossia x2x3 = p−x21,

otteniamo

p(t, x1) = t2 − 3x1t+ p+ 3x

21.

13 Dobbiamo ora (ponendo per semplicita V1 = V) considerare i polinomi

x3 + px+ q, 3x2 − 3Vx+ p+ V2.

Il resto della divisione del primo per il secondo da

2

3

(V2 + p

)x−

1

3V3 −

1

3Vp+ q.

Allora, risolvendo:

x1 =1

2V −

3

2

q

p+ V2. (11.7)

Considerando invece p(t) = [t − (x1 − x2)][t − (x3 − x2)] e ripetendo il

procedimento, otteniamo

x2 = −1

2V −

3

2

q

p+ V2.14 (11.8)

Infine, con p(t) = [t− (x1 − x2)][t− (x2 − x1)] si ha

x3 =3q

p+ V2. 2 (11.9)

11.4 Il gruppo

Sia φ(x) un polinomio avente le radici x1, x2, . . . , xn e sia V(x1, . . . , xn)

una risolvente di Galois. Sia F(V) il polinomio minimo di V1. Siano

V1, V2, . . . , Vr le radici del polinomio minimo (r ≤ n!).Poiche queste radici corrispondono biunivocamente a certe sostituzioni

di Sn si tratta di dimostrare che queste sostituzioni formano un gruppo.

Per Galois la cosa e evidente, ed egli si limita sostanzialmente a scrivere

13Questo polinomio ha le radici x1 − x2, x1 − x3. Il polinomio p(t, x2) ha invece le

radici x2 − x1, x2 − x3, ecc.14Ovviamente si tratta di una semplice verifica, perche V = x1 − x2.

198

la tabella che corrisponde al gruppo. Poiche per ogni radice xi si ha xi =

fi(V1), la tabella e15

V1 f1(V1) f2(V1) . . . fn(V1)

V2 f1(V2) f2(V2) . . . fn(V2)

. . . . . . . . . . . . . . .

Vr f1(Vr) f2(Vr) . . . fn(Vr)

(11.10)

Galois da due esempi, che vedremo nella Sezione 11.8, ma non si arresta

a dimostrare che la tabella (11.10) costituisce effettivamente un gruppo.

Poiche la dimostrazione, per quanto semplice, non e del tutto evidente,

vediamo la dimostrazione di Serret.

La dimostrazione di Serret

La cosa non risulta totalmente evidente a Serret, il quale da la dimostrazione

seguente.16 Abbiamo allora

x1 = f1(V1), x2 = f2(V1), . . . , xn = fn(V1). (11.11)

Ora

∀k,φ(xk) = 0⇒ φ(fk(V1)) = 0

e quindi V1 e una radice di φ(fk(V)). Di conseguenza ogni radice di F(V) e

radice di φ(fk(V)) e quindi fk(Vi) e radice di φ(x).

Questo significa che, sostituendo Vi al posto di V1 nelle (11.11) otteniamo

ancora delle radici. Mostriamo che sono distinte.

Infatti, da

fk(Vi) = fj(Vi)

segue che Vi e radice di fk(V)−fj(V) = 0, ma allora anche fk(V1)−fj(V1) =

0, il che comporta la contraddizione xk = xj.

Consideriamo ora le permutazioni

1, σ, τ, . . .

15Ho cambiato lievemente le notazioni. Si veda [Galois, 1976, p. 53].16Cf. [Serret, 1879, p. 447-448]. Ho semplicemente modificato un po’ l’aspetto grafico.

Si tenga anche presente la nota 3 di questo capitolo.

199

individuate dalle radici di F(V) = 0. Sia Vi una di queste radici: essa ha la

forma

Vi = V(xi1 , xi2, . . . , xin)

ma, essendo tutte le radici funzioni razionali di V1, avremo

Vi = θ(V1).

Questo significa che V1 e radice di F(θ(V)). Allora anche F(θ(Vj)) = 0 e

quindi per un certo k sara θ(Vj) = Vk. Denotiamo con σi la permutazione

che fa passare dall’allineamento delle radici corrispondente a V1 a quello

corrispondente Vi, con σk la permutazione che fa passare dall’allineamento

delle radici corrispondente a V1 a quello corrispondente Vk e con σj, infine,

la permutazione che fa passare dall’allineamento delle radici corrispondente

a V1 a quello corrispondente Vj. Quindi σiσj = σk. Le permutazioni cor-

rispondenti alle radici di F(V) formano un gruppo. Si tratta del gruppo di

Galois.

11.5 Il teorema fondamentale

In questa sezione esponiamo la proprieta fondamentale del gruppo di Galois.

Da questa proprieta segue anche la possibilita veirificare la coincidenza con

la definizione moderna. In questo caso la dimostrazione di Galois e semplice

e bella.

Teorema 11.2 (Proposizione I) Il gruppo G di permutazioni definito dal

polinomio F(V) e tale che ogni funzione delle radici che rimane invariata

per le permutazioni di G ha valore in K e viceversa, ogni funzione delle

radici che assume valore in K rimane invariata per le permutazioni di G.17

Dimostrazione. Sia g(x1, . . . , xn) una funzione delle radici. Poiche tutte le

radici sono funzioni razionali di V1, sara

g(x1, . . . , xn) = ψ(V1).

17Cf. [Galois, 1976, pp. 51-53].

200

Se la funzione g rimane invariata per le sostituzioni σ, τ, . . . avremo18

ψ(V1) = ψ(Vσ) = ψ(Vτ) = . . .

Il numero di queste sostituzioni (uguale al grado di F(V)) e r, e avremo

ψ(V1) = ψ(Vσ) = ψ(Vτ) = · · · = 1

r(ψ(V1) +ψ(Vσ) +ψ(Vτ) + . . . ) .

Ne segue che ψ(V1) e una funzione simmetrica delle radici di F(V) e dunque

ha una valore esprimibile attraverso i suoi coefficienti, che sono elementi del

campo base K.

Viceversa, se si ha g(V1) = k, abbiamo che V1 e radice della equazione

g(V) − k = 0.

Questa equazione ammette allora anche tutte le altre radici di F(V) ed il

suo valore e quindi invariato per le sostituzioni del gruppo di Galois. 2

Osservazione 11.2 Si noti che nella dimostrazione precedente non abbia-

mo utilizzato il fatto che le sostituzioni corrispondenti alle radici di F(V)

formano un gruppo. Questo teorema puo quindi precederne la verifica. E

interessante osservare che anche nella profonda ed elegante versione della

teoria data da Emil Artin, alcuni risultati importanti sono dati su un insie-

me finito di automorfismi, indipendentemente dalla struttura di gruppo. Si

vedano per esempio il Teorema 13 e le sue conseguenze in [Artin, 1988, pp.

29-33].

Osservazione 11.3 Si noti che due funzioni delle radici di un dato poli-

nomio che, considerate come funzioni di variabili indipendenti sono diverse

possono divenire uguali quando considerate, appunto, come funzioni delle

radici. Ad esempio, data l’equazione x3+px+q = 0 e indicate con r1, r2, r3le sue radici, si ha h(r1, r2, r3) = r1 + r2 = k(r1, r2, r3) = −r3. Tuttavia,

se h(x1, x2, . . . , xn) e k(x1, x2, . . . , xn) sono tali che per una data equazione

18Se g(x1, x2, . . . , xn) = g1(x1,x2,...,xn)g2(x1,x2,...,xn) , occorre naturalmente che sia

g2(σ(x1), σ(x2), . . . , σ(xn)) = 0. Lo si dimostri per esercizio, oppure si veda [Tignol,

2001, pp. 250-252].

201

avente le radici r1, r2, . . . , rn si ha h(r1, r2, . . . , rn) = k(r1, r2, . . . , rn),- ossia

h(r1, r2, . . . , rn) − k(r1, r2, . . . , rn) = 0,- per ogni permutazione σ del grup-

po di Galois si ha h(σ(r1), σ(r2), . . . , σ(rn)) = k(σ(r1), σ(r2), . . . , σ(rn)).

Infatti

h(r1, r2, . . . , rn) = h(f1(V1), f2(V1), . . . , fn(V1)) = H(V1) =

= k(f1(V1), f2(V1), . . . , fn(V1)) = K(V1)

e, evidentemente,

h(σ(r1), σ(r2), . . . , σ(rn)) = H(Vσ),

k(σ(r1), σ(r2) . . . , σ(rn)) = K(Vσ)

Ma l’equazione H(V)−K(V) ha la radice V1 e quindi deve ammettere anche

la radice Vσ. il che mostra appunto che

h(σ(r1), . . . , σ(rn)) = H(Vσ) = k(σ(r1), . . . , σ(rn)) = K(Vσ).

E allora possibile associare ad ogni permutazione del gruppo di Galois G

un automorfismo di E = K(x1, . . . , xn) che fissa gli elementi di K. Poiche

viceversa ogni tale automorfismo corrisponde ad una permutazione delle

radici, abbiamo che il gruppo di Galois e esattamente il gruppo di tutte

le permutazioni delle radici che corrispondono ad automorfismi di E che

fissano il campo base K.

Jordan e la definizione del gruppo di Galois

La descrizione di Jordan del fatto che le sostituzioni corrispondenti alle radi-

ci V1, V2, . . . , Vr formino un gruppo, per quanto temporalmente successiva a

quella di Serret, forse coglie meglio l’idea di Galois. Intanto Jordan anticipa

la dimostrazione del teorema 11.2, che qualifica giustamente come ‘teorema

fondamentale’. Una semplice ispezione alla struttura dimostrativa mostra

che e possibile farlo. Poi osserva:

Il ne reste plus qu’a demontrer que les susbtitutions 1, a, b, . . .

forment un groupe, ce qui ne presente pas de difficulte.19

19Cf. [Jordan, 1870, p. 258]. Con 1, a, b, . . . Jordan indica le sostituzioni che

corrispondono a V1, V2, V3 . . . .

202

In effetti il polinomio F(V) ha esattamente le radici che corrispondono alle

sostituzioni 1, a, b, . . . , ossia

F(V) = (V − V1)(V − Va)(V − Vb) · · ·

poiche i suoi coefficienti sono razionalmente noti essi non cambiano (a cau-

sa del teorema 11.2) per l’azione di una qualsiasi sostituzione scelta fra

1, a, b, . . . , per esempio per a. Ne segue che (utilizzando la trasparente

notazione di Jordan)

F(V) = (V − Va)(V − Va2)(V − Vba) · · ·

Ma il polinomio F(V) puo restare identico a se stesso se e solo se mantiene

le stesse radici, e quindi le sostituzioni a, a2, ab, . . . debbono coincidere,

a meno dell’ordine con le 1, a, b, . . . . Ovviamente questo ragionamento si

puo ripetere per ogni sostituzione di 1, a, b, . . . il che mostra la chiusura

rispetto alla composizione.

11.6 Esempi di calcolo del gruppo di Galois

Anche se il gruppo di Galois e calcolabile con un algoritmo concettualmen-

te semplice, il calcolo diretto comporta spesso complicazioni notevoli. Per

questa ragione e assai raro trovare nella vasta letteratura su Galois (soprat-

tutto nesi saggi di carattere storico) il calcolo del gruppo effettuato in base

alla definizione.

Tuttavia l’esame dei casi piu semplici, ove l’algoritmo e effettivamente

applicabile, non e privo di interesse. Da infatti concretezza ad una teoria

che, occorre sottolinearlo, non si affida a risultati di natura esistenziale ma

consta di procedure effetive.

L’equazione irriducibile di terzo grado

Consideriamo il caso dell’equazione di terzo grado nella forma

x3 + px+ q = 0 (11.12)

203

e supponiamo che il polinomio a primo membro della (11.12) sia irriducibile.

Allora una risolvente e data da V(x1, x2, x3) = x1 − x2. Utilizzando questa

risolvente, abbiamo

F(t) =∏xi =xj

[t− (xi − xj)] = t6 + 6pt4 + 9p2t2 + 4p3 + 27q2 (11.13)

Ora, come si vede facilmente, si ha

F(t) =(t3 + 3pt+

√−4p3 − 27q2

)(t3 + 3pt−

√−4p3 − 27q2

).

Se quindi il discriminante dell’equazione (11.12), ∆ = −4p3 − 27q2, e un

quadrato perfetto il polinomio F(t) si fattorizza ed il gruppo di Galois si

riduce al gruppo ciclico di ordine 3. In caso contrario il gruppo e dato daS3.

Ad esempio, per l’equazione x3−3x+1 = 0, si ha F(t) = t6−18t4+81t2−81.

Poiche il discriminante di x3 − 3x+ 1 vale 81, si ha

t6 − 18t4 + 81t2 − 81 = (t3 − 9t− 9)(t3 − 9t+ 9).

Si puo poi verificare che, se le radici di (11.12) sono quelle date approssi-

mativamente da

r1 = 0.3473, r2 = 1.5320, r3 = −1.8794

il polinomio t3− 9t− 9 ha le radici r1− r2, r2− r3, r3− r1 e quindi il gruppo

di Galois e il gruppo ciclico generato da (r1 r2 r3).

Altri esempi

Consideriamo l’equazione x3 − 2 = 0. Ponendo p = 0 e q = −2 nella

(11.13) si ottiene t6 + 108 = 0. Poiche −108 non e un quadrato in Q,

questo polinomio e irriducibile e il gruppo di Galois e G3. Naturalmente la

situazione cambia se immaginiamo di aggiungere una radice cubica primitiva

dell’unita, ossia una quantita α tale che α2 + α+ 1 = 0. In tal caso

(6+ 12α)2 (= 6i√3) = 36+ 144α+ 144α2 =

= 36+ 144(α+ α2) = 36+ 144 · (−1) = −108(11.14)

204

e quindi

t6 + 108 = [t3 − (6+ 12α)][t3 + (6+ 12α)].20

Otteniamo il gruppo ciclico di ordine 3. Quindi in Q(α) il gruppo di Galois

di x3− 2 = 0 si riduce al gruppo ciclico di ordine 3. Dobbiamo ora scegliere

il polinomio che individua il nostro gruppo.

Sia r1 =3√2, r2 =

3√2α, r3 =

3√2α2. Il polinomio che ha la radice r1− r2

e che individua questo gruppo e allora t3 + 6+ 12α.

Per arrivare alla individuazione delle singole radici, bisogna riuscire a

decomporre ulteriormente il polinomio t3+6+12α, il che significa conoscere

una delle radici cubiche di −6 − 12α (= −6i√3). Una volta noto il valore

V1 =3√

−6i√3 possiamo utilizzare le (11.7), (11.8), (11.8) per avere il valore

delle radici. Per esempio, in questo caso la (11.7) diviene

x1 =1

2V +

3

V2

e, come si verifica facilmente, ponendovi il valore V1 si ottiene la radice

reale, 3√2.

L’equazione di terzo grado con una radice razionale

Consideriamo l’equazione di terzo grado

x3 − 5x− 2 = 0

la quale ha le radici x1 = 1 +√2, x2 = 1 −

√2, x3 = −2. Anche in questo

caso V(x1, x2, x3) = x1 − x2 e una risolvente, come si verifica facilmente.

Utilizzando questa risolvente la (11.13) diviene

(t2 − 8)(t2 − 6t+ 7)(t2 + 6t+ 7).

Il primo fattore, che ha la radice V1 = x1− x2 = 1+√2− (1−

√2) = 2

√2,

individua il gruppo di Galois dell’equazione, dato da

x1 x2 x3

x2 x1 x320Si osservi che, per portare a termine questa decomposizione, non abbiamo usato la

conoscenza ‘esterna’ data da α = −12+ 1

2i√3, oppure α = −1

2− 1

2i√3, ma solo il fatto

che α2 + α = −1. In altre parole non abbiamo utilizzato l’immersione Q ⊂ C.

205

Gli altri due fattori, che individuano lo stesso gruppo, corrispondono a

x1 x3 x2

x2 x3 x1,

x3 x1 x2

x3 x2 x1.

L’equazione biquadratica

Naturalmente al crescere del grado l’uso diretto delle definizioni viste com-

porta calcoli piuttosto intricati. Consideriamo il caso dell’equazione biqua-

dratica

x4 + px2 + q = 0 (11.15)

che abbia le radici x1, x2, x3, x4. Una risolvente (per p,q generici) puo essere

data da

V(x1, x2, x3, x4) = x1 + 2x2 + 4x3. (11.16)

Utilizzando questa risolvente, otteniamo un polinomio di grado 24 con coef-

ficienti nelle variabili p, q e contenente anche interi piuttosto grandi. Indico

solo i primi termini:

t24 + 70pt22 + (2079p2 + 70q)t20 + (34500p3 + 2590pq)t18 + · · ·

Tuttavia questo polinomio si fattorizza. Il fattore contenente la radice

corrispondente alla permutazione identica e

t8 + 34pt6 + (321p2 + 322q)t4 + (544p3 + 5474pq)t2+

+ 256p4 − 9248p2q+ 83521q2.(11.17)

Sia ora

x1 =

√2

2

√−p+

√p2 − 4q, x2 = −x1, x3 =

√2

2

√−p−

√p2 − 4q, x4 = −x3.

Il gruppo di Galois e presentato dalla seguente tabella:

x1 x2 x3 x4

x1 x2 x4 x3

x2 x1 x3 x4

x2 x1 x4 x3

x3 x4 x1 x2

x3 x4 x2 x1

x4 x3 x1 x2

x4 x3 x2 x1

206

Si tratta evidentemente del gruppo generato da (x1 x2), (x3 x4), (x1 x4)(x2 x3).

Consideriamo un caso ancor piu particolare: l’equazione sia

x4 − 10x2 + 1. (11.18)

In tal caso il polinomio (11.17) si fattorizza ulteriormente, ed il fattore che

corrisponde alla permutazione identica e

t4 − 154t2 + 529.

Il gruppo di Galois si riduce a

x1 x2 x3 x4

x2 x1 x4 x3

x3 x4 x1 x2

x4 x3 x2 x1

,

Naturalmente questa riduzione corrisponde alla natura particolarmente sem-

plice delle radici dell’equazione (11.18):

x1 =√3+

√2, x2 = −x1, x3 =

√3−

√2, x4 = −x3.

La dimostrazione di Serret e il calcolo del prodotto dipermutazioni

La dimostrazione di Serret del fatto che le permutazioni corrispondenti al

fattore irriducibile F(V) formano un gruppo consente anche il calcolo del

prodotto di permutazioni. Naturalmente, anche in questo caso, il calcolo

risulta notevolmente complicato anche per equazioni di grado basso.

Consideriamo il caso dell’equazione x3+px+q = 0. Abbiamo gia visto

che, utilizzando per risolvente la funzione V = (x1, x2, x3) → x1 − x2, e

indicando con V1 il suo valore sulla permutazione identica, si ha

x1 =1

2V1 −

3

2

q

p+ V21, x2 = −

1

2V1 −

3

2

q

p+ V21, x3 =

3q

p+ V21,

ove, naturalmente

p = x1x2 + x1x3 + x2x3 = −(x21 + x22 + x1x2), q = x21x2 + x1x

22. (11.19)

207

Se p e q sono coefficienti generici, il gruppo di Galois risulta S3 ed i suoi

elementi sono dati da

x1 x2 x3 V1 x1 − x2x1 x3 x2 V2 x1 − x3x2 x1 x3 V3 x2 − x1x2 x3 x1 V4 x2 − x3x3 x1 x2 V5 x3 − x1x3 x2 x1 V6 x3 − x2

(11.20)

Sia σ la permutazione data da σ : V1 → V2 e τ data da τ : V1 → V5.

Vogliamo seguire le indicazioni date nella Sezione 11.4 per verificare che

στ =

(x1 x2 x3

x1 x3 x2

)(x1 x2 x3

x3 x1 x2

)=

(x1 x2 x3

x3 x2 x1

),

ossia che στ = V1 → V6.

Calcoliamo θ. Poiche V2 = x1 − x3, si ha

θ(V1) =1

2V1 −

9

2

q

p+ V12.

Si tratta ora di calcolare θ(V5). Poiche

V5 = x3 − x1 =9

2

q

p+ V21−1

2V1

si ha

θ(V5) =1

2

(9

2

q

p+ V21−1

2V1

)−9

2

q

p+

(9

2

q

p+ V21−1

2V1

)2 . (11.21)

Ponendo nella (11.21) V1 = x1 − x2 e tenendo conto delle (11.19) si ottiene

−x1 − 2x2. Ma V6 = x3 − x2 = (−x1 − x2) − x2 = −x1 − 2x2 e dunque il

risultato ottenuto e proprio V6.

Il valore pratico di questa verifica non e certo molto elevato. Si noti

tuttavia che essa ha un carattere algoritmico e come al tempo stesso le

uniche proprieta utilizzate per le radici sono quelle espresse dalle (11.19).

208

11.7 Generalizzazione del concetto di

risolvente

I calcoli che abbiamo visto nella sezione precedente sono piuttosto compli-

cati. in molti casi il calcolo del gruppo di Galois risulta assai piu semplice

se esso viene considerato direttamente come un gruppo di automorfismi.

Iniziamo con il generalizzare il concetto di risolvente:

Definizione 11.1 Sia φ(x) un polinomio privo di radici multiple a coeffi-

cienti in un dato campo K e siano x1, x2, . . . , xn le sue radici. Un elemento

V ∈ K(x1, x2, . . . , xn) e detto risolvente di Galois se si ha

xi ∈ K(V), per i = 1, 2, . . . , n.

Il gruppo di Galois puo ora essere descritto nel modo seguente: sia V una

risolvente di Galois. Abbiamo allora

xi = fi(V) per i = 1, 2, . . . , n,

ove fi(x) ∈ K(x). Siano V1, V2, . . . , Vm le radici del polinomio minimo di V

(si veda l’osservazione seguente). Si dimostra facilmente (seguendo le linee

di quanto visto in precedenza) che per ogni j = 1, 2, . . . ,m gli elementi

f1(Vj), f2(Vj), . . . fn(Vj)

costituiscano una permutazione delle radici x1, x2, . . . , xn e che l’insieme

delle permutazioni

σj : xi 7→ fi(Vj)

forma il gruppo di Galois di φ(x) suK.21

Osservazione 11.4 Si noti che ogni elemento u ∈ K(x1, x2, . . . , xn) e ra-

dice di un polinomio (e dunque di un polinomio monico irriducibile) a coef-

ficenti in K. Come abbiamo visto, il gruppo di Galois di K(x1, x2, . . . , xn)

e in particolare un gruppo di automorfismi. Siano u1 = u, u2, . . . , um le

diverse immagini di u per gli automorfismi di G e formiamo il polinomio

(x− u1)(x− u2) · · · (x− um). (11.22)21Si veda anche [Tignol, 2001, pp. 236-237].

209

Essendo G un gruppo, per ogni elemento σi ∈ G si ha che gli elemen-

ti σi(u1), σi(u2), . . . , σi(um) formano semplicemente una permutazione di

u1, u2, . . . , um, e dunque il polinomio (11.22) e invariante per l’azione di

σi. Per il Teorema Fondamentale esso e quindi a coefficienti in K.22

Esempio 11.3 Rivediamo il caso di φ(x) = x4 − 10x2 + 1. Se α e una

radice, anche −α e una radice, e altrettanto vale per 1α. Indicate allora le

4 radici con x1, x2, x3, x4 si ha

x1 = α, x2 = −α, x3 =1

α, x4 = −

1

α.

in questo caso particolarissimo possiamo quindi scegliere V = α e si ha

f1 = id, f2(x) = −x, f3(x) =1x, f4(x) = − 1

x.

Il gruppo e quindi presentato da

V V −V1

V−1

V

−V −V V −1

V

1

V

1

V 1

V−1

VV −V

−1

V −

1

V

1

V−V V

(11.23)

11.8 Gli esempi di Galois

Galois da due esempi. Il primo e quello del gruppo dell’equazione genera-

le di grado n che egli afferma essere l’intero gruppo Sn “puisque dans ce

cas, les fonctions symetriques sont seules determinable rationnellement”.23

Per Galois la cosa risulta evidente. In realta la dimostrazione non e im-

mediata (per noi). La vedremo dopo il secondo esempio, quello del gruppo

dell’equazionexp − 1

x− 1= 0, con p primo. (11.24)

22Si veda [Artin, 1988, pp. 35-36]. Si noti pero che Artin utilizza una elegante

definizione di estensione normale che gli permette di prescindere dall’uso del Teorema

Fondamentale. Si veda anche [Tignol, 2001, pp. 247-249].23Cf. [Galois, 1976, p. 51].

210

che Galois afferma essere il gruppo ciclico di ordine p− 1. Questo risultato

e facilmente deducibile da un risultato piu generale ben illustrato da Galois

nei materiali preparatori per la sua grande memoria.24 Ma la dimostrazione

del caso in questione non e poi riportata: evidentemente anche questa gli

sembrava ovvia ed ha giudicato inutile illustrarla.

Nei materiali preparatori troviamo questo risultato, che sembra mostrare

come Galois avesse gia un concetto di risolvente piu generale, simile a quello

visto nella Sezione 11.7.

Consideriamo un’equazione irriducibile p(x) = 0 tale che tutte le sue

radici si deducano razionalmente da una di esse. Indicando le radici con

x1, x2, x2, . . . , xm abbiamo quindi

x1, x2 = f2(x1), x3 = f3(x1), xm = fm(x1).25 (11.25)

Galois afferma che la seguente tabella di permutazioni costituisce il gruppo

dell’equazionex1 f2(x1) f3(x1) . . . fm(x1)

x2 f2(x2) f3(x2) . . . fm(x2)

x3 f2(x3) f3(x3) . . . fm(x3)

. . . . . . . . . . . . . . .

xm f2(xm) f3(xm) . . . fm(xm)

(11.26)

Galois non dimostra preliminarmente che la tabella (11.26) costituisca ef-

fettivamente un gruppo. Ma la dimostrazione in questo caso e assai fa-

cile. Le righe della tabella sono formate da radici, poiche evidentemente

p(fi(x1)) = 0 e quindi anche p(fi(xk)) = 0. Si tratta inoltre di permutazio-

ni, perche dall’ipotesi che possa essere fi(xk) = fj(xk) con i = j si deduce

(ancora una volta. . . ) che fi(x) − fj(x) ha la radice xk e dunque anche la

radice x1 il che implica fi(x1) = fj(x1), ossia la contraddizione i = j. E poi

facile adattare la dimostrazione di Serret che abbiamo visto: xi = fi(x1) e

dunque possiamo porre θ = fi. La composizione delle sostituzioni x1 → xi

e x1 → xj e dunque semplicemente x1 → fi(xj).

Ora ecco come Galois dimostra che questo gruppo e quello richiesto.

Una funzione delle radici ϕ(x1, x2, . . . , xm) a causa delle (11.25) puo essere

24Ibidem, pp. 89-91.25Ovviamente f1 = id.

211

scritta come una funzione di x1, ossia φ(x1). Se essa e invariante per le

sostituzioni (11.26) avremo

φ(x1) = φ(x2) = · · · = φ(xm)

e quindi

φ(x1) =1

m(φ(x1) +φ(x2) + · · ·+φ(xm))

ed e dunque funzione simmetrica delle radici di p(x), ossia una quantita

nota. Reciprocamente, se φ(x1) e una quantita nota, ossia φ(x1) = k,

l’equazione φ(x) − k = 0 dovra avere anche le radici x2, . . . , xm, il che

significa φ(x1) = φ(x2) = · · · = φ(xm).26

Osservazione 11.5 Si noti che data l’equazione p(x) = 0, l’equazione

F(V) che ne calcola il gruppo di Galois possiede la proprieta utilizzata per

questo calcolo del gruppo. Ossia il gruppo di F(V) si calcola nel modo indi-

cato. Ad esempio, l’equazione t6+6 pt4+9 p2t2+4 p3+27 q2 = 0 ha gruppo

di Galois di ordine 6 e dato dalle permutazioni viste, per ogni scelta di p e

q che lascino il polinomio irriducibile, poiche il polinomio a primo membro

e quello che calcola il gruppo di Galois dell’equazione x3+px+q = 0, come

abbiamo visto nella Sezione 11.6.

Siamo ora in grado di vedere il secondo esempio di Galois. Consideriamo,

per p primo l’equazione (che Gauss ha dinostrato essere irriducibile)

xp−1 + xp−2 + · · ·+ x+ 1 = 0. (11.27)

Sia x1 una sua radice e sia g una radice primitiva di Z∗p = {1, 2, . . . , p−1}.27

Le radici dell’equazione (11.27) possono essere scritte come

x1, x2 = xg mod p1 , x3 = x

g2 mod p1 , . . . , xp−1 = x

gp−2 mod p1 (11.28)

26Si noti la somiglianza di questa argomentazione con quella usata per il teorema

fondamentale. E probabilmente per questo che Galois ha deciso di non presentare questo

esempio e di lasciarne invece implicita l’applicazione al caso di xp−1x−1

. Una scelta naturale

per lui; ma solo per lui. . .27Ossia un intero g che sia il generatore del gruppo ciclico Z∗

p. Gauss ha dimostrato

l’esistenza di una tale radice primitiva. Ad esempio, per p = 7, una radice primitiva e 3.

212

sicche fi(x) = xgi−1 mod p. Ovviamente dal Piccolo Teorema di Fermat si ha

gp−1 ≡ g mod p.

Considerando la tabella corrispondente alla (11.26) si vede immedita-

mente che si ottiene il gruppo ciclico generato da (x1 x2 . . . xp−1).

Vediamo ora il primo esempio. Tignol28 ne propone una dimostrazione

che, a mio giudizio, si avvicina alle intenzioni di Galois. Tuttavia, come

vedremo, si incontra una difficolta. Tignol da una elegante dimostrazione

di questo lemma:

Lemma 11.2 Sia G un sottogruppo di Sn. E allora possibile determinare

una funzione di n indeterminate f(x1, x2, . . . , xn) tale che l’insieme I(f)

delle sostituzioni che lasciano invariata f sia esattamente il sottogruppo G.

Tignol considera il monomio m = x1x22x33 · · · xnn e costruisce f come

f =∑σ∈G

σ(m).

Poiche G e un gruppo, si ha, per ogni τ ∈ G, Gτ = G, e quindi (utilizzandola notazione funzionale) ∑

σ∈G

τ(σ(m)) =∑σ∈G

σ(m)

il che mostra che τ(f) = f per ogni τ ∈ G e quindi G ⊆ I(f). D’altra parte,

se ρ ∈ G, il monomio ρ(m) compare in ρ(f) ma non in f, e quindi ρ(f) = f,il che mostra che G = I(f). 2

Ora Tignol propone l’argomentazione seguente: l’equazione generale di

grado n e data da

p(x) = xn − σ1xn−1 + σ2x

n−2 − · · ·+ (−1)nσn = 0 (11.29)

ove p(x) e un polinomio a coefficienti nel campo F = k(σ1, σ2, . . . , σn) con

k estensione finita di Q e σ1, σ2,. . . , σn delle indeterminate. Tignol pone

anche

p(x) = (x− x1)(x− x2) · · · (x− xn). (11.30)

28Si veda [Tignol, 2001, p. 241]

213

(e possiamo immaginare che questo risutato sia ottenuto con il procedimento

di Kronecker). Si tratta di dimostrare che il gruppo di Galois dell’equazione

(11.29) su F e il gruppo di tutte le permutazioni di x1, x2, . . . , xn, e puo quindi

identificarsi con Sn. Se il gruppo di Galois dell’equazione (11.29) non e il

gruppo Sn, ma solo un sottogruppo G di questo gruppo, per il Lemma 11.2,

possiamo trovare una funzione razionale f(x1, x2, . . . , xn) non simmetrica,

ossia, afferma Tignol, non in F, ma tale che

f(σ(x1), σ(x2), . . . , σ(xn)) = f(x1, x2, . . . , xn) (11.31)

per ogni σ ∈ G. Ma questo contraddice il Teorema Fondamentale: f non

simmetrica non puo appartenere a F.

Si noti pero che in questa argomentazione le quantita x1, x2, . . . , xnnon sono indeterminate: sono le radici di (11.29).29 Inoltre i due cam-

pi k(σ1, σ2, . . . , σn) e k(x1, x2, . . . , xn) sono identificati. E possibile questa

identificazione? Il lemma puo essere utilizzato in questo caso?30 Nella

prossima Sezione vedremo la dimostrazione di Artin.

11.9 La dimostrazione di Artin relativa al

primo esempio di Galois

La migliore e piu completa dimostrazione di Artin si trova in [Artin, 1988,

pp. 77-78], ma utilizzo la piu nota versione inglese, [Artin, 1944, pp.

74-76]. Artin utilizza questo teorema (del quale vedremo in seguito la

dimostrazione):

Teorema 11.3 Sia σ un isomorfismo di un campo F su un campo F ′. Sia

f(x) ∈ F[x] e sia f ′(x) il polinomio i cui coefficienti corrispondono a quelli di

f(x) mediante σ. Siano poi E ed E ′ i campi di spezzamento di f(x) e f ′(x).

In queste condizioni l’isomorfismo σ puo essere esteso ad un isomorfismo

tra E ed E ′.29Si consideri questo semplice esempio: data la funzione f=x

21 − x

22 nelle due indeter-

minate x1, x2, essa e invariante solo per la permutazione identica. Ma se x1 e x2 sono le

radici di un’equazione della forma x2 − a = 0, si ha evidentemente I(f) = S2.30Si noti la cura con la quale Dedekind distingue tra radici ed indeterminate in

[Scharlau, 1981]. Tuttavia questa distinzione e gia presente nella memoria di Galois.

214

Inoltre, un risultato che segue immediatamente dal teorema fondamen-

tale sui polinomi simmetrici e il seguente: sia F(x1, x2, . . . , xn) il campo che

si ottiene aggiungendo ad F le n variabili x1, x2, . . . , xn e siano ai le funzioni

simmetriche elementari nelle xi, ossia

a1 = x1+x2+ · · ·+xn, a2 = x1x2+x1x3+ · · ·+xn−1xn, . . . , an = x1x2 · · · xn.

Il gruppo di Galois di F(x1, x2, . . . , xn) su F(a1, a2, . . . , an) e isomorfo a Sn.

Sia ora F un campo e, assegnate le variabili u1, u2, . . . , un, consideriamo

il campo F(u1, u2, . . . , un). Per equazione generale di grado n, si intende

l’equazione

f(x) = xn − u1xn−1 + u2x

n−2 − · · ·+ (−1)nun = 0. (11.32)

Sia E il campo di decomposizione di f(x) su F(u1, u2, . . . , un). In questo

campo f(x) abbia le radici v1, v2, . . . , vn, di modo che sara

u1 = v1+ v2+ · · ·+ vn, u2 = v1v2+ v1v3+ · · ·+ vn−1vn, . . . , un = v1v2 · · · vn.

Sia F(x1, x2, . . . , xn) il campo generato su F con le variabili x1, x2, . . . , xn.

Come in precedenza le ai siano le funzioni simmetriche elementari delle

variabili x1, x2, . . . , xn. Abbiamo quindi

f ′(x) = (x−x1)(x−x2) · · · (x−xn) = xn−a1xn−1+ · · ·+(−1)nan. (11.33)

Sia ora g(u1, u2, . . . , un) un polinomio che si annulla ponendo a1, a2, . . . , anal posto di u1, u2, . . . , un.

31 Se g(a1, a2, . . . , an) si annulla, allora anche

g(∑

xi,∑

xixk, . . .)= 0

e quindi tutti i termini si annullano (le xi sono variabili). Se sostituiamo le

quantita vi al posto delle xi avremo allora

g(∑

vi,∑

vivk, . . .)= 0,

ossia g(u1, u2, . . . , un) e il polinomio nullo. Quindi g(a1, a2, . . . , an) si

annulla solo se g e il polinomio nullo.

31Qui tengo conto anche di [Artin, 1988, p. 78], ove l’argomentazione e piu precisa.

215

Consideriamo ora la corrispondenza tra F(u1, u2, . . . , un) e il sottocampo

F(a1, a2, . . . , an) di F(x1, x2, . . . , xn). Si consideri un elelmento f(u1,u2,...,un)g(u1,u2,...,un)

del primo campo e gli si associ l’elemento f(a1,a2,...,an)g(a1,a2,...,an)

del secondo. Chiara-

mente e una applicazione suriettiva. Inoltre, se

f(a1, a2, . . . , an)

g(a1, a2, . . . , an)=f1(a1, a2, . . . , an)

g1(a1, a2, . . . , an)

allora fg1 − gf1 = 0. Ma per quanto abbiamo visto questo implica

f(u1, u2, . . . , un)g1(u1, u2, . . . , un)−f1(u1, u2, . . . , un)g(u1, u2, . . . , un) = 0

e quindif(u1, u2, . . . , un)

g(u1, u2, . . . , un)=f1(u1, u2, . . . , un)

g1(u1, u2, . . . , un)

e quindi la applicazione e un isomorfismo. Con questa corrispondenza,

f(x) corrisponde a f ′(x) ed E e F(x1, x2, . . . , xn) sono i rispettivi campi

di decomposizione. Quindi, per il teorema citato, l’isomorfismo puo es-

sere esteso ad un isomorfismo tra E e F(x1, x2, . . . , xn), e quindi il grup-

po di E su F(u1, u2, . . . , un) e isomorfo al gruppo di F(x1, x2, . . . , xn) su

F(a1, a2, . . . , an). Ma l’ultimo gruppo e isomorfo a Sn e quindi la proprieta

indicata da Galois e dimostrata.

Si noti come in questa dimostrazione il substrato concettuale e dato

dal fatto che le radici dell’equazione generale possono considerarsi come

indeterminate; ma la struttura dimostrativa e piuttosto articolata. Inoltre

e abbastanza intuitivo immaginare che l’equazione generale sia irriducibile,

ma nel Teorema 11.3 non si utilizzano polinomi irriducibili e quindi nella

dimostrazione vista non si usa neppure l’ipotesi che l’equazione generale sia

irriducibile. E invece utilizzato il fatto che per ogni polinomio e possibile

determinare il suo campo di spezzamento.

11.10 La Proposizione II della Memoria di

Galois

Una volta definito il gruppo di Galois di un’equazione, cio che segue in modo

naturale e l’indagine sulle modalita con le quali il gruppo viene modificato

216

aggiungendo delle quantita al campo base. Ecco come Galois formula la

questione.32

Teorema 11.4 (Proposizione II) Se si aggiunge ad un’equazione data la

radice r di un’equazione ausiliaria irriducibile, 1 puo succedere una di que-

ste due cose: o il gruppo dell’equazione non viene modificato, oppure si

suddivide in p gruppi ciascuno dei quali diviene il gruppo dell’equazione

proposta quando si aggiunge una radice dell’equazione ausiliaria; 2 questi

gruppi godranno della proprieta notevole che si passera dall’uno all’altro

operando in tutte le permutazioni del primo una stessa sostituzione delle

lettere.

Prima di vedere l’accenno di dimostrazione suggerito da Galois e ripreso da

Serret e opportuno vedere un esempio.

Consideriamo di nuovo il polinomio x4 − 10x2 + 1 dell’Esempio 11.3.

Poiche la radice V =√2 +

√3 e gia un elemento primitivo, il gruppo,

come si e visto, e dato dalle sostituzioni corrispondenti alle quattro radi-

ci V,−V, 1V,− 1

V. Consideriamo l’equazione ausiliaria x4 − 14x2 + 9 = 0 e

supponiamo di aggiungere a Q una sua radice r.33 Si ottiene allora:

x4 − 10x2 + 1 =

=

[x2 +

(11

3r−

1

3r3)x− 1

] [x2 −

(11

3r+

1

3r3)x− 1

].

(11.34)

Il gruppo di Galois corrisponde ora ad uno dei due fattori, e precisamente al

primo. Questo fattore ha le radici V e − 1V, come si verifica immediatamente,

e quindi il gruppo di Galois si riduce all’identita ed alla sostituzione σ data

da

σ =

V −V1

V−1

V

−1

V

1

V−V V

. (11.35)

Osservazione 11.6 Si noti che la verifica del fatto che V e − 1Vsiano radi-

ci del primo fattore del prodotto dato dalla (11.34) si ottiene con strumenti

32Cf. [Galois, 1976, p. 55].33Le radici di questa equazione sono ±

√2±

√5.

217

puramente algebrici, senza utilizzare la conoscenza delle radici in R dei due

polinomi, ossia ±√2±

√3 e ±

√2±

√5 per la quale conoscenza risulta evi-

dente l’estensione Q ↪→ Q(√2) e quindi il fatto che

√2 divenga un elemento

noto. Se infatti vogliamo eliminare r fra

V2 +

(11

3r−

1

3r3)V − 1 (11.36)

r4 − 14r2 + 9 (11.37)

dobbiamo utilizzare la matrice di Sylvester:

− 13V 0 11

3V V2 − 1 0 0 0

0 − 13V 0 11

3V V2 − 1 0 0

0 0 −13V 0 11

3V V2 − 1 0

0 0 0 −13V 0 11

3V V2 − 1

1 0 −14 0 9 0 0

0 1 0 −14 0 9 0

0 0 1 0 −14 0 9

.

Il determinante di questa matrice vale(V4 − 10V2 + 1

)2, ed e dunque nul-

lo. Poiche il risultato dell’eliminazione produce una quantita identicamente

nulla si ha che V e una radice di (11.36). Inoltre il prodotto delle radici e

−1, e quindi l’altra radice e − 1V.

Serret riprende la dimostrazione di Galois

In realta Serret fa qualcosa in piu di quanto propone Galois,34 suddividendo

anche le radici dell’equazione ausiliaria per precisarne l’effetto. Ma io mi

limito a proporre la prima parte della sua dimostrazione, omettendo la

verifica (per altro ovvia) con la quale si passa da un gruppo all’altro.

Sia V una risolvente di Galois e sia F(V) il polinomio minimo, le cui

radici V0, V1, . . . , Vν−1 individuano le sostituzioni del gruppo di Galois. Sia

34La dimostrazione di Serret occupa le pagine 643-651 di [Serret, 1879].

218

ψ(z) l’equazione ausiliaria irriducibile, che supponiamo di grado m, e sia

r una sua radice. Se l’aggiunta di r lascia il polinomio F(V) irriducibile il

gruppo di Galois rimane inalterato.

Supponiamo invece che l’aggiunta di r renda il polinomio F(V) riducibile,

e che sia λ(V, r) un fattore irriducibile di F(V) di grado µ.

Sostituiamo al posto di r una indeterminata z in λ(V, r) ed effettuiamo

la divisione di F(V) per λ(V, z). Avremo

F(V) = λ(V, z)Λ(V, z) +Θ(V, z). (11.38)

Dobbiamo avere identicamente

Θ(V, r) = 0, (11.39)

perche Θ e al piu di grado µ − 1, F(V) e irriducibile ed ha in comune con

l’equazione (11.39) le µ radici dell’equazione λ(V, r) = 0.

Ne segue che nel polinomio Θ(V, z) i coefficienti delle diverse potenze

di V debbono annullarsi per z = r e di conseguenza si annullano anche se

al posto di z si sostituisce una qualsiasi radice di ψ(z) = 0. Se dunque la

radici di ψ(z) sono

r, r1, . . . , rm−1

il polinomio F(V) sara divisibile per ogni funzione

λ(V, r), λ(V, r1), . . . , λ(V, rm−1).

Il prodotto di queste funzioni e una funzione intera di V avente i coefficienti

funzioni simmetriche delle radici di ψ(z), ed e dunque un polinomio Π(V)

avente i coefficienti nel campo base. Poiche tutte le radici di Π(V) sono

comprese tra le radici di F(V) = 0 e abbiamo supposto F(V) irriducibile,

avremo

Π(V) = [F(V)]q Π1(V), (11.40)

ove q e il piu grande esponente possibile. Evidentemente Π1(V) non puo che

essere una costante (che possiamo supporre l’unita, perche abbiamo sempre

operato con polinomi monici), perche altrimenti, dovendo essere tutte le

radici di Π1(V) radici di F(V), quest’ultimo polinomio dovrebbe dividere

Π1(V), il che contraddice quanto supposto per q.

219

Abbiamo allora

Π(V) = [F(V)]q, (11.41)

ossia

[F(V)]q == λ(V, r)λ(V, r1) · · · λ(V, rm−1). (11.42)

Per ipotesi λ(V, r) e irriducibile. E facile verificare che anche i polinomi

λ(V, ri) hanno la stessa proprieta.35

Si noti che fino a questo punto non abbiamo utilizzato la proprieta di

F(V) = 0 di essere un’equazione normale, ossia tale che le sue radici sono

esprimibili razionalmente mediante una qualunque di esse (o se si preferi-

sce che V e un elemento primitivo). Utilizziamo ora questa proprieta per

dimostrare che se due equazioni

λ(V, ri) = 0, λ(V, rj) = 0 (11.43)

hanno una radice in comune, esse hanno tutte le radici in comune. Siano

infatti Va e θ(Va) due radici della prima equazione di (11.43). Se Vb e una

radice della seconda equazione di (11.43), anche θ(Vb) sara una radice della

stessa equazione.

In effetti, si ha

λ(Va, ri) = 0, λ(θ(Va), ri) = 0, (11.44)

e quindi l’equazione λ(θ(V), ri) = 0 ammette la radice Va dell’equazione

λ(V, ri) = 0. Se supponiamo che θ(V) sia un polinomio (il che e lecito),

si puo dire che il polinomio λ(θ(V), ri) e divisibile per λ(V, ri), ossia che

il resto della divisione del polinomio λ(θ(V), z) per λ(V, z) e identicamente

nullo per z = ri. Utilizzando lo stesso ragionamento visto in precedenza si

conclude che questo resto si annulla anche per z = rj, ossia che λ(θ(V), rj)

e divisibile per λ(V, rj) e allora l’uguaglianza

λ(Vb, rj) = 0

implica

λ(θ(Vb), rj) = 0

35Lo si dimostri per esercizio. Oppure si veda [Serret, 1879, pp. 646-647].

220

e quindi Vb e radice della seconda delle equazioni (11.43). Se dunque le due

equazioni di (11.43) hanno una radice in comune, hanno in comune tutte le

radici.

Ne consegue che i fattori diversi di (11.42) sono ripetuti q volte. Avremo

cioe

λ(V, r) = λ(V, r(1)) = λ(V, r(2)) = · · · = λ(V, r(q−1)),λ(V, r1) = λ(V, r

(1)1 ) = λ(V, r

(2)1 ) = · · · = λ(V, r(p−1)1 ),

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

λ(V, rm−1) = λ(V, r(1)m−1) = λ(V, r

(2)m−1) = · · · = λ(V, r(p−1)m−1 ).

(11.45)

Di conseguenza

F(V) = λ(V, r)λ(V, r1) · · · λ(V, rp−1) (11.46)

Quindi le m radici di ψ(z) = 0 si ripartiscono in p gruppi di q radici

(con pq = m) ed ogni radice dello stesso gruppo da luogo ad un fattore

corrispondente alla nuova presentazione del gruppo di Galois. Tralascio

la parte finale dell’analisi di Serret che mostra come le varie presentazioni

sono collegate. In effetti Serret dimostra anche che i diversi gruppi che si

ottengono a seconda dei vari fattori sono coniugati.

Osservazione 11.7 Si noti che dalla dimostrazione di Serret segue anche

che l’indice del sottogruppo che si ottiene aggiungendo la radice r di ψ(z)

nel gruppo di Galois (ossia il numero dei laterali) divide il grado m di ψ(z).

In particolare, se m e primo l’indice del sottogruppo e esattamente m.

Esempio 11.4 Si consideri il polinomio

F(V) = V6 − 6V4 + 12V2− 10

e l’equazione ausiliaria z3 − 2 = 0. Abbiamo la decomposizione

F(V) = [V2 − (r+ 2)][V4 + (r− 4)V2 + r2 − 2r+ 4].

I fattori sono di grado diverso, poiche F(V) = 0 non e un’equazione normale.

Indicando con w una radice primitiva dell’unita, si ha

[V2 − (r+ 2)][V2 − (wr+ 2)][V2 − (w2r+ 2)] = F(V)

221

Operando con il secondo fattore si ha

[V4 + (r− 4)V2 + r2 − 2r+ 4]×[V4 + (wr− 4)V2 + (wr)2 − 2wr+ 4]×[V4 + (w2r− 4)V2 + (w2r)2 − 2w2r+ 4] = [F(V)]2.

(11.47)

11.11 La Proposizione III della Memoria di

Galois

Galois esamina successivamente il caso in cui si aggiungano al campo base

tutte le radici di un’equazione ausiliaria irriducibile. E afferma che in questo

caso il gruppo si riduce ad un sottogruppo normale del gruppo originario.

Originariamente aveva considerato solo il caso di un’equazione della forma

zp−a = 0 (con p primo e supponendo la presenza delle radice dell’unita sino

all’ordine p). Ma ripropone poi, probabilmente nella notte prima del duello,

un enunciato piu generale. Afferma poi “Si trovera la dimostrazione”.36

Serret propone il percorso dimostrativo seguente.

Teorema 11.5 Sia G il gruppo dell’equazione φ(x) = 0. Supponiamo di

aggiungere al campo base la radice di un’equazione irriducibile ψ(z) = 0 e

supponiamo che le radici di questa equazione ausiliaria si esprimano razio-

nalmente in funzione di una tra esse. Allora, se il gruppo G non rimane

invariato, il nuovo sottogruppo H ottenuto aggiungendo questa radice sara

un sottogruppo normale di G.

Consideriamo due radici r e ri = θ(r) di ψ(z) = 0. Si ha allora ψ(θ(r)) = 0

e, con il ragionamento consueto, si ha che r, θ(r), θ2(r), . . . , θk−1(r) sono

ancora radici e sara quindi ad un certo punto θk(r) = r. Questo significa

θk−1)(θ(r)) = r, ossia

θk−1(ri) = r.

Ne consegue che le radici r e ri sono esprimibili razionalmente l’una in

funzione dell’altra, e quindi il gruppo che H si ottiene aggiungendo r e lo

stesso di quello che si ottiene aggiungendo ri.

36Cf. [Galois, 1976, p. p. 57].

222

Poiche, come abbiamo visto questi gruppi sono coniugati, si ha che H

e un sottogruppo normale. 2 Questo teorema si applica ad un caso

importante:

Corollario 11.1 Se l’equazione ausiliaria e della forma zp = a, con p

primo e nell’ipotesi che il campo base contenga le radici p-esime dell’unita

ci si trova nelle condizioni del teorema precedente. O il gruppo rimane

inalterato o si riduce ad un sottogruppo normale di indice p.

Teorema 11.6 Sia G il gruppo di Galois dell’equazione φ(x) = 0 e suppo-

niamo che, aggiungendo tutte le radici di un’equazione irriducibile ψ(z) = 0

il gruppo G divenga un sottogruppo H di G. In tal caso H e un sottogruppo

normale di G.

Costruiamo una risolventeW per le radici r, r1, . . . , rm−1 di ψ(z) e sia π(Z)

il polinomio minimo di W. Come abbiamo visto, tutte le radici di π(Z) si

possono esprimere l’una in funzione dell’altra, e quindi basta applicare il

Teorema 11.5.

11.12 La risolubilita per radicali

La Proposizione IV ha l’enunciato seguente:

Teorema 11.7 Se si aggiunge ad una equazione il valore numerico di una

funzione delle sue radici, il gruppo dell’equazione si abbassera in modo da

non avere piu altre permutazioni se non quelle per le quali questa funzione

e invariabile.

La dimostrazione di Galois e semplice ed elegante, ed usa saggiamente il

teorema fondamentale.

In effetti, in seguito alla Proposizione I [ossia il Teorema Fon-

damentale: 11.2] ogni funzione nota deve essere invariabile per

le permutazioni del gruppo dell’equazione.37

37Ibid. p. 57.

223

Serret non pare soddisfatto di quanto afferma Galois, e fornisce una dimo-

strazione piuttosto elaborata.38 E un buon indice del fatto che le idee di

Galois stentavano ad essere accolte nella lora forma talvolta lapidaria.

Galois e ora in grado di indicare le condizioni per la risolubilita per radi-

cali. Si tratta naturalmente di ridurre progressivamente il gruppo dell’equa-

zione sin tanto che esso non si riduca all’identita e di operare queste riduzioni

con l’aggiunta di radicali che possiamo supporre di indice primo. Sia dun-

que p il numero minimo che corrisponde ad una radicale di indice p tale che

aggiungendo il suo valore (e supponendo che le radici dell’unita di ordine

p siano state aggiunte) riduca il gruppo G ad un sottogruppo H. Come

abbiamo visto H e allora un sottogruppo normale di indice p.

Supponiamo reciprocamente che H sia un sottogruppo normale di G di

indice primo p. Potremo allora, estraendo una semplice radice di ordine p

e aggiungendo questa radice, ridurre il gruppo ad H.

Per procedere introduco ora una argomentazione volta a determinare

una funzione delle radici che sia invariante esattamente sulle sostituzioni di

un sottogruppo H. A questo scopo modifico un po’ la dimostrazione data da

Cauchy nel 1845 per il caso di variabili invece che di radici di un’equazione.39

Galois probabilmente immagina che il suo lettore abbia gia familiarita con

questo risultato o meglio che sia auto-evidente.

Sia al solito

V = a1x1 + a2x2 + · · ·+ anxn,

una risolvente di Galois che assume n! valori. Indichiamo con V1, Vσ, Vτ, . . .

i valori che V assume per le sostituzioni di H. Consideriamo ora la quantita

θ = (t− V1)(t− Vσ)(t− Vτ) · · · (11.48)

dove t e da determinarsi. Applicando le sostituzioni di H si scambiano

semplicemente i fattori della (11.48), di modo che θ rimane inalterata.

Una sostituzione π ∈ H modifica θ in

θ ′ = (t− Vπ)(t− Vσπ)(t− Vτπ) · · ·38Cf. [Serret, 1879, pp. 654-657].39Cf. [Cauchy, 1845].

224

I valori Vπ, Vσπ, Vτπ, . . . sono diversi dai valori V1, Vσ, Vτ, . . . e di conseguen-

za ci sono infiniti valori di t per i quali θ ′ = θ. La stessa argomentazione

puo essere usata per una sostituzione ρ ∈ H. Posto

θ ′′ = (t− Vρ)(t− Vσρ)(t− Vτρ) · · ·

per una scelta opportuna di t, θ ′′ = θ e θ ′′ = θ ′ . Procedendo nello stesso

modo possiamo trovare un valore t tale che θ sia invariante solo per le

sostituzioni di H.

L’argomentazione di Galois procede ora nel modo seguente: sia θ una

funzione delle radici invariante per tutte e sole le permutazioni di H. Ope-

riamo ora su θ con le permutazioni di G per ottenere θ1, θ2, . . . , θp = θ (p

e il numero dei laterali di H). Ora, se 1, α, . . . , αp−1 sono le radici p-esime

dell’unita, la funzione

(θ+ αθ1 + α2θ2 + · · ·+ αp−1θp−1)p

e invariante per tutte le permutazioni del gruppo totale e dunque appartiene

al campo base. Se si estrae la radice p-esima di questa funzione si ha una

funzione delle radici invariante esattamente su H e quindi aggiungendola al

campo base il gruppo si riduce ad H.

E chiaro ora come si puo procedere se l’equazione e risolubile per radicali.

Basta iterare il procedimento di Galois fin tanto che non si giunga ad un

gruppo ridotto all’unita.

Il risultato di Galois abitualmente si formula quindi oggi in questo modo.

Teorema 11.8 Sia φ(x) = 0 un’equazione a coefficienti in un campo K e

sia G il suo gruppo di Galois. L’equazione e risolubile per radicali se e solo

se G contiene una sequenza di sottogruppi

G = G0 ⊃ G1 ⊃ G2 ⊃ · · · ⊃ Gt = id

tale che per i = 1, 2, . . . , t, Gi sia un sottogruppo normale di indice primo

in Gi−1. (E anche possibile che sia t = 0, ossia G = id.)

Prima di vedere l’esempio di Galois, e opportuno vedere un altro esempio

piu ‘concreto’ di carattere numerico.

225

Esempio 11.5 Consideriamo l’equazione x4 − 2 = 0, la quale ha le radici

x1 =4√2, x2 = i

4√2, x3 = − 4

√2, x4 = −i 4

√2. Il gruppo G di Galois si calcola

facilmente (in termini di automorfismi) ed e dato dalla seguente tabella:

x1 x2 x3 x4

x1 x4 x3 x2

x2 x1 x4 x3

x2 x3 x4 x1

x3 x2 x1 x4

x3 x4 x1 x2

x4 x1 x2 x3

x4 x3 x2 x1

(11.49)

Come si vede facilmente, se immaginiamo che i vertici consecutivi di un

quadrato siano etichettati con x1, x2, x3, x4, si tratta dei movimenti rigido

nello spazio che mutano un quadrato in se. Si tratta cioe del gruppo generato

da (x1 x2 x3 x4) e (x1 x3). Un suo sottogruppo H e dato da

x1 x2 x3 x4

x3 x2 x1 x4

x1 x4 x3 x2

x3 x2 x1 x4

(11.50)

Costruiamo ora una funzione delle radici invariante rispetto alle sostituzioni

di H. Occorre una risolvente, che in questo caso puo essere data da

V := (x1, x2, x3, x4)→ x1 − 2x2 + 4x3, (11.51)

la quale produce il polinomio F(V) = V8 + 476V4 + 114244 che individua il

gruppo di Galois. Dobbiamo ora considerare il polinomio

(V − x1 + 2 x2 − 4 x3) (V − x1 + 2 x4 − 4 x3) ·(V − x3 + 2 x2 − 4 x1) (V − x3 + 2 x4 − 4 x1)

(11.52)

Tenendo conto del fatto che le xi sono radici di x4−2 = 0 si vede facirlemnet

che questo polinomio diviene

V4 − 10√2V2 + 338 (11.53)

226

il che rende evidente che la possiamo scegliere la funzione sulle radici che

corrisponde al coeffieiente di V2. In effetti questo coefficiente e dato da

−18x21− 8x22 e dunque la funzione θ e data da θ : (x1, x2, x3, x4)→ −18x21−

8x22. Una radice primitiva dell’unita di ordine 2 e −1 e quindi l’elemento

cercato per ridurre il gruppo G e, come si verifica immediatamente 20√2. Si

tratta dunque di aggiungere semplicemente√2 per avere la decomposizione

V8+476V4+114244 = (V4−10√2V2+338)(V4+10

√2V2+338) (11.54)

il cui primo fattore da il nuovo gruppo di Galois, ossia H.

11.13 L’esempio dell’equazione di quarto

grado

Galois illustra il suo metodo con un esempio: quello dell’equazione di quar-

to grado. E da notare il fatto che Galois non si da neppure la pena di

scrivere l’equazione. Comincia con l’osservare che, aggiungendo al campo

base la radice quadrata del valore del discriminante dell’equazione, dato da

(indicando le radici con a, b, c, d)

(a− b)2(a− c)2(a− d)(b− c)2(b− d)2(c− d)2

il gruppo si riduce alle sostituzioni pari, ossia

abcd

badc

cdab

dcba

acdb

cabd

dbca

bdca

adbc

dacb

bcad

cbda

(11.55)

Questo gruppo contiene il sottogruppo (normale) dato da

abcd

badc

cdab

dcba

(11.56)

227

che ha indice tre nel gruppo (11.55) (il gruppo (11.55) si ripartisce in tre

gruppi nel linguaggio di Galois). Risolvendo un’equazione di terzo grado ci

si riduce al gruppo (11.56). Ma questo a sua volta contiene il sottogruppo

abcd

badc(11.57)

e quindi con la risoluzione di un’equazione di secondo grado il gruppo si

riduce a (11.57) e quindi basta un’ulteriore radicale quadratico per portare

a termine la soluzione.

Si noti la totale assenza di calcoli. Galois indica pero come il metodo di

Descartes e di Eulero seguano esattamente questo schema.

Un esempio numerico

Si consideri quanto esposto da Galois con l’analisi di Lagrange vista nella

sezione 4.4. Sivedra che le quantita necessarie per la soluzione sono proprio

quelle indicate da Galois. Sia, per esempio,

x4 − x+ 3 = 0. (11.58)

Il gruppo, che e originariamente S4 si riduce al gruppo alterno aggiungendo

la radice quadrata del discriminante:√6885. Indicate con a, b, c, d le radici

dell’equazione, il polinomio che ha le tre radici ab+ cd, ac+bd, ad+bc e

x3 − 12x− 1. (11.59)

Si vede facilmente che, disponendo dell’unita immaginaria, e di√6885,

occorre un solo radicale cubico per avere le soluzioni di x3− 12x− 1 = 0. E

ora semplice proseguire i calcoli secondo le indicazioni date da Lagrange.

11.14 Il Teorema di Abel

In questa sezione, utilizzando in parte strumenti piu moderni di quelli uti-

lizzati da Galois, viene dimostrato il teorema di Abel. Nel Teorema 11.8 che

caratterizza la risolubilita per radicali, viene evidenziata una proprieta del

228

gruppo G che in genere diviene oggetto (anche in altre forme, equivalenti o

piu generali) della definizione di gruppo risolubile.

Si noti che, essendo Gi un sottogruppo normale di indice primo di Gi−1,

il gruppo quoziente e un gruppo ciclico (perche di ordine primo) e quindi,

in particolare, abeliano. Nell’approccio originale di Galois G e un gruppo di

permutazioni ed i Gi sono sottogruppi, a loro volta gruppi di permutazioni.

Lemma 11.3 Sia G un gruppo di permutazioni formato su almeno 5 ele-

menti diversi (ad esempio permutazioni di 1, 2, 3, 4, 5). Supponiamo che G

contenga ogni tre-ciclo e sia N un sottogruppo normale di G con gruppo

quoziente abeliano. Allora anche N contiene ogni tre-ciclo.40

Dimostrazione. Sia f l’omomorfismo canonico f : G → G/N e sia (ab c)

un tre-ciclo aribitrario e siano d ed e due altri elementi arbitrari. Sia x =

(dba), y = (ae c). Costruiamo l’elemento

yxy−1x−1 = (ae c)(dba)(c e a)(abd) = (ab c).

Se f(x) = x ′, f(y) = y ′, si ha f(yxy−1x−1) = y ′x ′y ′−1x ′−1 = 1 perche G/N

e abeliano. Ma questo significa che l’elemento yxy−1x−1 = (ab c) sta nel

nucleo N, e quindi N contiene ogni tre-ciclo. 2

Corollario 11.2 Per n ≥ 5 il gruppo simmetrico Sn non e risolubile.

Dimostrazione. Infatti Sn contiene tutti i tre-cicli, e quindi non puo con-

tenere una catena di sottogruppi come quella descritta nel Teorema 11.8,

perche ognuno di questi sottogruppi dovrebbe contenere tutti i tre-cicli e

quindi la catena non puo terminare con l’unita. 2

Si ha ora.

Teorema 11.9 (Teorema di Abel) L’equazione generale di grado n ≥ 5non e risolubile per radicali.

Dimostrazione. Basta osservare che il gruppo di Galois dell’equazione ge-

nerale di grado n e il gruppo totale Sn. 2

40Cf. [Artin, 1988, pp. 72-73].

229

Osservazione 11.8 Come spesso accade, risultati fondamentali, che han-

no richiesto l’elaborazione di una complessa struttura dimostrativa41 risul-

tano quasi evidenti all’interno di un diverso contesto teorico. Questo non

deve indurre a pensare che questi risultati siano banali. Qui il ruolo della

memoria storica e fondamentale.

Esercizio 11.1 Si analizzino diverse definizioni di gruppo risolubile. In

particolare si esamini il ruolo dei commutatori.42

41Si veda ad esempio [Tignol, 2001, capitolo 13].42Si veda ad esempio [Herstein, 1982, pp. 263-274].

230

Capitolo 12

Da Galois a Artin

12.1 Introduzione

Il testo pubblicato da Emil Artin nel 1942, e poi in edizione rivista nel 1944,

rappresenta per molti aspetti un punto d’arrivo sulle ricerche della teoria

di Galois.1

La prima parte del testo2 espone dei risultati di algebra lineare che

ora sono divenuti familiari. Importante e pero l’idea di applicare l’algebra

lineare alla teoria di Galois. Se un campo E e un’estensione di un campo K

esso e anche in particolare uno spazio vettoriale su K e molti risultati della

teoria di Galois si ottengono come semplici risultati di algebra lineare.3 Se E

1In realta le vicende biografiche di Artin motivano un consistente ritardo nella pub-

blicazione dei suoi risultati. Il materiale era gia pronto negli anni trenta del Novecento.

In parte e confluito nella Moderne Algebra [1930], [1931] di van der Waerden (come lo

stesso van der Waerden ha avuto cura di precisare nell’Introduzione del suo libro). I testi

di Artin sono [Artin, 1942] e [Artin, 1944]. Ma io utilizzero l’edizione tedesca, [Artin,

1988], rielaborata e migliorata da Artin in occasione del suo ritorno in Germania.2Cf. [Artin, 1988, pp. 1-16].3Molti autori sottolineano anche l’importanza dell’idea di Artin di considerare come

punto di partenza i sottocampi di un dato campo anziche le estensioni di un campo. Si

tratta di un aspetto importante, ma va colto nel complesso delle sue articolazioni. Si

231

e un campo contente K indicheremo con (E/K) la dimensione (eventualmente

infinita) di E come spazio vettoriale su K e diremo che (E/K) e il grado di

E su K.

Un teorema ora familiare ad ogni studente che abbia seguito un corso

fondamentale di algebra e il seguente (del quale quindi ometto la dimostra-

zione).4

Teorema 12.1 (Teorema 6) Siano K, B, E tre campi tali che sia

K ⊂ B ⊂ E.

Allora

(E/K) = (E/B)(B/K).

Anche le considerazioni su polinomi ed elementi algebrici e d isomorfismi

tra campi sono ora parte del patrimonio comune di uno studente che abbia

seguito un corso fondamentale di algebra. Ma vale la pena di ricordare il

teorema seguente.

Teorema 12.2 (Teorema 7, Kronecker) Sia f(x) un polinomio non co-

stante a coefficienti in K. Allora esiste una estensione E di K nella quale

f(x) possiede una radice.

Si tratta semplicemente di considerare un fattore irriducibile f(x) di f(x)

e di quozientare l’anello K[x] con l’ideale generato da f(x). Se il grado di

f(x) e n, l’estensione E e data dai polinomi di grado n − 1, ove la somma

e definita in modo ovvio e il prodotto di due polinomi e valutato modulo

f(x). Si rammenti che l’inverso e dato utilizzzando l’identita di Bezout.

12.2 Estensione di morfismi

Il teorema seguente merita invece attenzione.

puo vedere comunque [Tignol, 2001, p. 306].4Aggiungo ad ogni teorema citato la numerazione originale di [Artin, 1988].

232

Teorema 12.3 (Teorema 8) Sia σ un isomorfismo tra il campo K e il

campo K ′. Sia f(x) un polinomio irriducibile in K[x] e f ′(x) l’immagine

(tramite σ) di f(x) in K ′[x]. Siano poi E = K(β), E ′ = K ′(β ′), dove

f(β) = 0 e f ′(β ′) = 0. Allora l’isomorfismo σ puo essere esteso ad un

isomorfismo σ tra K(β) e K ′(β ′) tale che l’immagine di β sia β ′.

Dim. Ogni elemento di E e della forma g(β), dove g(x) ∈ K[x] ed ha

grado minore del grado di f(x). Definiamo σ come σ(g(β)) = g ′(β ′).5

Chiaramente σ e un’applicazione di E su E ′. Che conservi la somma e

evidente. Il prodotto di g(β)h(β) in E e definito calcolando r(x) = g(x)h(x)

mod f(x) e valutando r(β). Dall’algoritmo della divisione abbiamo

g(x)h(x) = q(x)f(x) + r(x)

e quindi,

g ′(x)h ′(x) = q ′(x)f ′(x) + r ′(x)

dal che si ottiene g ′(β ′)h ′(β ′) = r ′(β ′). 2

Osservazione 12.1 Si noti che il Teorema 12.3 mostra che l’estensione

generata con l’aggiunta di una radice di un polinomio irriducibile dipende

solo dal polinomio e non dal carattere speciale della radice. Ad esempio

x3 − 2 e un polinomio che ha le tre radici 3√2, α

3√2, α2

3√2 (ove 3

√2 denota

la radice reale e α e una radice primitiva di x3 − 1 = 0). I campi Q( 3√2)

e Q(α 3√2) sono isomorfi (ponendo σ( 3

√2) = α

3√2). Ma il primo ha solo

elementi reali, mentre il secondo possiede anche elementi di C.

Come semplice conseguenza del Teorema di Kronecker (il Teorema 12.2)

si ha l’esistenza del campo di spezzamento di un polinomio p(x).

Teorema 12.4 (Teorema 9) Sia p(x) un polinomio in un campo K. Al-

lora esiste un campo di spezzamento E di p(x).

Vediamo ora la dimostrazione di un teorema gia usato in precedenza (cf.

p. 214)

5E chiaro cosa Artin intenda con g ′(β ′). Se si desidera la maggior precisione che si

usa oggi si veda [Rotman, 1998, p. 55].

233

Teorema 12.5 (Teorema 10) Sia σ un isomorfismo di un campo K su

un campo K ′. Sia p(x) un polinomio in K e p ′(x) l’immagine di p(x) in

K ′. Sia poi E il campo di spezzamento di p(x) e E ′ il campo di spezzamento

di p ′(x). Allora l’isomorfismo σ puo essere esteso ad un isomorfismo tra il

campo E ed il campo E ′.

Dim. Sia p(x) = (x − α1)(x − α2) · · · (x − αs) la decomposizione di p(x)

in E. Se tutte le radici αi sono in K, si ha E = K ed anche evidentemente

E ′ = K ′.

Artin procede per induzione sul numero n delle radici non in K. Possia-

mo supporre che sia n > 1 e assumere che il teorema sia stato dimostrato

nel caso che il numero delle radici al di fuori di K sia minore di n. Sia ora

α1 una radice non in K e sia f(x) il polinomio irriducibile avente la radi-

ce α1.6 Poiche si ha p(α1) = 0 si ha p(x) = f(x)g(x).7 Di conseguenza

p ′(x) = f ′(x)g ′(x). Sia ora p ′(x) = a(x − β1)(x − β2) · · · (x − βs) lo spez-

zamento di p ′(x) in E ′. In una estensione di E ′ il polinomio f ′(x) avra una

radice γ e sara quindi p ′(γ) = 0, ossia a(γ − β1)(γ − β2) · · · (γ − βs) = 0.

Allora γ coincidera con una delle radici βi.8 Possiamo supporre γ = β1. In

forza del Teorema 12.3 possiamo estendere l’isomorfismo σ ad un isomor-

fismo τ di K(α1) su K ′(β1). Ora il polinomio p(x) puo essere considerato

in K(α1) e il polinomio p ′(x) (considerato ora come l’immagine di p(x) per

τ) puo essere considerato in K ′(β1). E e il campo di spezzamento di p(x)

su K(α1), E′ e il campo di spezzamento di p ′(x) su K ′(β1). Il numero delle

radici di p(x) in K(α1) e aumentato di almeno una unita e quindi il numero

delle radici che non sono in K(α1) (ed a maggior ragione non sono in K) e

minore di n. Per l’ipotesi di induzione τ puo essere esteso ad un isomorfismo

tra E ed E ′ che, ovviamente, estende l’isomorfismo σ. 2

Corollario 12.1 Sia p(x) un polinomio in un campo K. Allora due campi

di spezzamento di p(x) sono isomorfi.

Dim. Basta applicare il Teorema 12.5 ponendo K = K ′ e con σ il morfismo

identico. 2

6Possiamo supporre f(x) monico.7Si osservi l’importanza di questo risultato utilizzato spesso da Galois.8E quindi si ha che γ ∈ E ′.

234

Un altro risultato importante del quale pero ometto la dimostrazione e

la unicita della decomposizione in fattori.

Teorema 12.6 Sia p(x) un polinomio in K e siano

p(x) = p1(x)p2(x) · · ·pr(x) = q1(x)q2(x) · · ·qs(x)

due fattorizzazioni di p(x) in fattori irriducibili in K ognuno dei quali di

grado almeno uno. Allora r = s e, con un opportuno riordino dei fattori, si

ha pi(x) = ciqi(x), dove i ci sono elementi di K.

12.3 L’uso dei caratteri

Utilizzando i caratteri, originariamente introdotti da Dedekind, Artin ot-

tiene ora risultati semplici, eleganti e molto significativi.

Definizione 12.1 Sia G un gruppo moltiplicativo, sia K un campo e sia

K∗ l’insieme degli elementi non nulli di K. Un carattere di G in K e una

applicazione σ : G→ K∗ tale che σ(αβ) = σ(α)σ(β).

Teorema 12.7 (Teorema 12. Teorema di Dedekind) Sia G un grup-

po e siano

σ1, σ2, . . . , σn

caratteri a due a due distinti di G in un campo K. Allora σ1, σ2, . . . , σnsono linearmente indipendenti, ossia, per ogni x in G si verifica

a1σ1(x) + a2σ2(x) + · · ·+ anσn(x) = 0

se e solo se

a1 = a2 = · · · = an = 0.

Dim. Procediamo per induzione. Per n = 1, si ha a1σ1(x) = 0 e poiche

σ1(x) = 0 deve essere a1 = 0. Supponiamo allora che il teorema sia stato

dimostrato per meno di n caratteri.

Supponiamo che sia

a1σ1(x) + a2σ2(x) + · · ·+ anσn(x) = 0 (12.1)

235

e sia α un elemento di G da determinarsi successivamente. Operiamo ora

in due modi: sostituiamo x con αx nella (12.1):

a1σ1(α)σ1(x) + a2σ2(α)σ2(x) + · · ·+ anσn(α)σn(x) = 0. (12.2)

Moltiplichiamo ora tutti i termini della (12.1) per σn(α):

a1σn(α)σ1(x) + a2σn(α)σ2(x) + · · ·+ anσn(α)σn(x) = 0. (12.3)

Sottraendo la (12.3) dalla (12.2) si ha

a1[σ1(α) − σn(α)]σ1(x) + · · ·+ an−1[σn−1(α) − σn(α)]σn−1(x). (12.4)

L’ipotesi di induzione da

a1[σ1(α) − σn(α)] = 0.

Poiche n > 1, σ1 e σn sono caratteri diversi. Quindi deve esistere un α

tale che σ1(α) = σn(α). Con questa scelta di α si ha a1 = 0. Ora si puo

applicare l’ipotesi di induzione alla (12.2) e ne segue che

a2 = a3 = · · · = an = 0. 2

Questo risultato ha una applicazione importante nel caso in cui G sia il

gruppo moltiplicativo di un campo E (l’insieme degli elementi non nulli) e

i caratteri sono isomorfismi di E in un campo E ′.

Corollario 12.2 Siano E ed E ′ due campi e σ1, σ2, . . . , σn siano isomorfi-

smi diversi di E in E ′. Allora σ1, σ2, . . . , σn sono indipendenti.

Artin da ora una definizione molto ‘moderna’, quella di campo fisso come

equalizzatore di morfismi. Intanto si ha questa definizione.

Definizione 12.2 Siano σ1, σ2, . . . , σn isomorfismi di un campo E in un

campo E ′. Un elemento a tale che σ1(a) = σ2(a) = · · · = σn(a) e detto un

punto fisso.

Un caso importante e quello in cui E = E ′ e σ1 = identita. Ecco ora il

campo fisso.

236

Lemma 12.1 L’insieme dei punti fissi di E e un sottocampo di E. Questo

sottocampo e detto il campo fisso di σ1, σ2, . . . , σn.

Ecco ora un teorema fondamentale

Teorema 12.8 (Teorema 13) Siano

σ1, σ2, . . . , σn

isomorfismi a due a due distinti di un campo E in un campo E ′ e sia K il

campo fisso di E. Allora

(E/K) ≥ n.

Dim. Mostriamo che l’ipotesi (E/K) = r < n conduce ad una contraddizio-

ne. Siano ω1,ω2, . . . ,ωr un sistema di generatori di E su K. Nel sistema

di equazioni

σ1(ω1)x1 + σ2(ω1)x2 + · · ·+ σn(ω1)xn = 0

σ1(ω2)x1 + σ2(ω2)x2 + · · ·+ σn(ω2)xn = 0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

σ1(ωr)x1 + σ2(ωr)x2 + · · ·+ σn(ωr)xn = 0

(12.5)

vi sono piu incognite che equazioni e quindi esiste una soluzione non banale

che si puo indicare ancora con x1, x2, . . . , xn. Per ogni elemento α di E

esistono degli elementi a1, a2, . . . , ar tali che α = a1ω1 + a2ω2 + · · ·arωr.

Moltiplichiamo ora la prima equazione per σ1(a1), la seconda per σ1(a2),

ecc. Poiche gli ai sono punti fissi, si ha σ1(ai) = σj(ai) e quindi si ha

σ1(a1ω1)x1 + σ2(a1ω1)x2 + · · ·+ σn(a1ω1)xn = 0

σ1(a2ω2)x1 + σ2(a2ω2)x2 + · · ·+ σn(a2ω2)xn = 0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

σ1(arωr)x1 + σ2(arωr)x2 + · · ·+ σn(arωr)xn = 0

(12.6)

Sommando queste equazioni, si ha

σ1(α)x1 + σ2(α)x2 + · · ·+ σn(α)xn = 0

e poiche gli xi non sono tutti nulli si ha una contraddizione: i σi non possono

essere indipendenti, in contraddizione con il Teorema 12.7. 2

237

Corollario 12.3 Siano σ1, σ2, . . . , σn automorfismi di un campo E e sia K

il campo fisso, formato dagli elementi di E che sono fissati dai σi. Allora

(E/K) ≥ n.9

Dim. Se tra i σi compare l’identita, basta applicare il teorema precedente.

Se l’dentita non compare, basta aggiungerla e si ha allora (E/K) ≥ n+1 2

Si osserva facilmente che l’insieme degli automorfismi di E che lasciano

invariato un sottocampo formano un gruppo.

12.4 Un’applicazione importante del

Teorema 13

Artin dedica l’intera Sezione G, Anwendugen und Beispiele zu Satz 13, a

due esempi. Uno di essi e esattamente il teorema sui polinomi simmetrici.

L’attenzione di Artin per questo esempio e anche testimoniata dal fatto che

l’edizione tedesca e assai diversa e ben piu articolata di quella inglese.10

Sia

E = k(x1, x2, . . . , xn)

il campo delle funzioni razionali nelle n indeterminate x1, x2, . . . , xn. Se

(ν1 ν2 . . . νn)

e una permutazione di

(1 2 . . . n)

possiamo sostituire in ogni funzione f(x1, x2, . . . , xn) di E la variabile x1 con

xν1 , x2 con xν2 ,. . . , xn con xνn .

L’applicazione di E in se stesso ottenuta in questo modo e un automorfi-

smo e ci sono n! automorfismi che possono essere ottenuti in questo modo.

Il campo fisso K e dato dalle funzioni simmetriche e il Corollario 12.3 mostra

che (E/K) ≥ n!.9Attenzione: qui non si tratta del campo fisso ma dell’insieme degli elementi che

rimangono invarianti.10Si confontino la Sezione G di Artin [1944] e di Artin [1988].

238

Artin ora considera il polinomio

f(x) = (x− x1)(x− x2) · · · (x− xn) = xn − σ1xn−1 + · · ·+ (−1)nσn, (12.7)

e osserva che il campo

S = k(σ1, σ2, . . . , σn)

di tutte le funzioni razionali di σ1, σ2, . . . , σn e contenuto in K. Si tratta di

dimostrare che S = K e che (E/K) = n!. Bastera per questo dimostrare che

(E/S) ≤ n!.11

Costruiamo la torre di campi

Sn ⊂ Sn−1 ⊂ Sn−2 ⊂ · · · ⊂ S2 ⊂ S1 = E

dove

Sn = S; Si−1 = Si(xi) = S(xi, xi+1, . . . , xn).

Possiamo ridurci a dimostrare che (Si−1/Si) ≤ i. Poiche Si−1 e ottenuto

da Si con l’aggiunta di xi a Si−1, dobbiamo trovare per ogni i un’equazione

per xi con coefficienti in Si di grado al piu i. I polinomi richiesti sono

semplicemente

Fi(x) =f(x)

(x− xi+1)(x− xi+2) · · · (x− xn)=

Fi+1(x)

(x− xi+1), (12.8)

dove Fn(x) = f(x).

Effettuando le divisioni, Fi(x) diviene un polinomio in x di grado i, il

cui coefficiente direttivo e 1 mentre gli altri coefficienti sono polinomi nelle

variabili

σ1, σ2, . . . , σn e xi+1, xi+2, . . . , xn.

Solamente degli interi compaiono come coefficienti in queste espressioni ed

e evidente che xi e una radice di Fi(x) = 0. Il teorema e cosı dimostrato.

Ma si noti che a questo punto non abbiamo ancora mostrato un algoritmo

con il quale una funzione simmetrica possa essere rappresentata come una

funzione delle σj.

11Essendo S ⊂ K si ha certamente (E/K) ≤ (E/S).

239

Artin procede per esibire questo algoritmo. Dall’uguaglianza (E/K) = n!

abbiamo anche che (Si−1/Si) = i, il che implica che lo spazio vettoriale Si−1su Si e generato da 1, xi, x

2i , . . . , x

i−1i . Di conseguenza, lo spazio vettoriale

E su S e generato dai seguenti n! elementi:

xν11 x

ν22 · · · xνnn dove νi ≤ i− 1.12 (12.9)

Un elemento arbitrario di E puo essere rappresentato in modo unico co-

me una combinazione lineare di questi n! elementi con coefficienti in S.

Supponiamo dunque che sia dato un polinomio arbitrario g(x1, x2, . . . , xn)

nelle variabili x1, x2, . . . , xn con coefficienti in E. Se g e simmetrico esso

appartiene al campo fisso

K = S = k(σ1, σ2, . . . , σn)

e d’altra parte puo essere scritto come una combinazione lineare degli ele-

menti (12.9), dove tutti i coefficienti sono zero con l’eccezione dei termini

ottenuti con ν1 = ν2 = · · · = νn = 0, che coincidono g. Dalla unicita della

rappresentazione segue che g e un polinomio nelle σ1, σ2, . . . , σn.

Sia ora g un polinomio arbitrario. Poiche F1(x1) = 0 e di primo grado in

x1, possiamo esprimere x1 come un polinomio nelle σi ed in x2, x3, . . . , xn.

Una volta che questo valore di x1 e sostituito in g(x1, x2, . . . , xn), poiche

F2(x2) = 0, possiamo esprimere x22 o le potenze piu elevate come polinomi

nelle variabili x3, . . . , xn e nelle σi, e x2 apparira al piu al primo grado. Si

puo proseguire con lo stesso pattern. F3(x3) = 0 e possiamo esprimere x33 o

le potenze di ordine piu elevato come polinomi nelle variabili x4, x5, . . . , xned in σi; e x3 apparira al piu al secondo grado.

Procedendo in questo modo, concludiamo che g(x1, x2, . . . , xn) puo es-

sere espresso come un polinomio nelle xi e nelle σj tale che il grado nella

variabile xi non ecceda i. Dunque g(x1, x2, . . . , xn) e una combinazione

lineare degli n! termini (12.9) e i coefficienti sono polinomi nelle σj.

Quindi Artin ha descritto un algoritmo generale che si applica ad ogni

polinomio simmetrico o non simmetrico. 2

12Se F, B, E sono tre campi tali che F ⊂ B ⊂ E e se gli elementi a1, a2, . . . , ar formano

una base di E su B mentre gli elementi b1, b2, . . . , bs formano una base di B su F, allora

gli elementi aibk, per i = 1, . . . r, k = 1 . . . s sono una base di E su F. E nella sostanza

il processo dimostrativo del Teorema 12.1.

240

Esempio 12.1 Si consideri il polinomio

g = x21 + x22 + a · x23.

Allora

F3(x) = f(x) = (x− x1)(x− x2)(x− x3) = x3 − σ1x

2 + σ2x− σ3

e

F2(x) =f(x)

x− x3= x2 − (σ1 + x3)x− σ1x3 + x

23 + σ2,

F1(x) =f(x)

(x− x3)(x− x2)= x+ x2 + x3 − σ1.

Ne segue che

x1 = σ1 − x2 − x3,

x22 = σ1(x2 + x3) − σ2 − x2x3 − x23,

x33 = σ1x23 − σ2x3 + σ3.

La eliminazione di x1 produce

2 x22 + σ1

2 − 2 σ1x3 − 2 σ1x2 + x32 + 2 x2x3 + ax3

2.

La successiva eliminazione di x22 da

σ21 − 2σ2 + (a− 1)x23,

e siamo giunti al termine, perche la piu alta potenza di x3 e 2.

Si noti che l’algoritmo di Artin consiste di un ‘data base’ dato dalle

expressioni delle potenze xii, che sono indipendenti dal polinomio g e da un

processo di successiva eliminazione di queste espressioni. Si noti anche che

il risultato puo dipendere dalla scelta della disposizione delle variabili. Per

esempio, con la scelta di x3, x1, x2, abbiamo

ax1x2 − aσ1x1 − x1x2 + σ1x1 − aσ1x2 − aσ2 + aσ12 − σ2 + σ1x2. 2

241

12.5 La sezione H della Galoissche Theorie

di Artin

Osservazione 12.2 Questa sezione del libro di Artin 13 e caratterizzata sia

da una grande eleganza espositiva sia da una grande chiarezza concettuale.

Per questa ragione, in quanto segue, in molti casi, ho semplicemente tradot-

to il testo di Artin. Ovviamente il lettore e pregato di utilizzare i contenuti

di questa sezione per puro uso personale.

Artin esamina il caso in cui i σi formino un gruppo finitoG = {σ1, σ2, . . . , σn}

di automorfismi di un campo E e K ne sia il campo fisso. Introduce la

funzione

S(α) = σ1(α) + σ2(α) + · · ·+ σn(α)

che gioca un ruolo importante.14

Applichiamo a S(α) un automorfismo σi: otteniamo la somma

σiσ1(α) + σiσ2(α) + · · ·+ σiσn(α).

Poiche G e un gruppo, gli automorfismi

σiσ1, σiσ2, . . . , σiσn

non sono altro che gli automorfismi

σ1, σ2, . . . , σn

scritti in un ordine diverso. Questo mostra che S(α) rimane invariata per

tutti i σi e dunque e un elemento di K.15 La funzione S(α), che viene anche

detta la traccia di α non e identicamente nulla, poiche questo sarebbe in

contraddizione con l’indipendenza lineare dei σ1, σ2, . . . , σn (in contrasto

con il Teorema di Dedekind, visto a p. 235).

Esercizio 12.1 Si considerino il gruppo G di automorfismi di C dato da

G = {id, σ}, dove σ(a + ib) = a − ib. Si calcoli la traccia di un elemento

α ∈ C.13E contenuta in [Artin, 1988, pp. 34-41].14Questa funzione non e utilizzata nella corrispondente Sezione di [Artin, 1944].15Si noti che questo risultato segue semplicemente dalla definizione di K.

242

Esercizio 12.2 Si considerino il gruppo G di Galois degli automorfismi di

Q(√2+

√3) che hanno per campo fisso Q (in base al Teorema Fondamen-

tale). Si calcoli la traccia di 1−√2

1+√3.

Teorema 12.9 (Teorema 14) Quando σ1, σ2, . . . , σn e un gruppo G di

automorfismi di un campo E e K e il campo fisso, si ha

(E/K) = n.

Dimostrazione. In conseguenza del Teorema 12.8 e sufficiente dimostrare

che n+1 elementi α1, α2, . . . , αn+1 di E sono sempre linearmente dipendenti.

Per questo scopo consideriamo il seguente sistema di equazioni lineari:

x1σ−11 (α1) + x2σ

−11 (α2) + · · ·+ xn+1σ−1

1 (αn+1) = 0

x1σ−12 (α1) + x2σ

−12 (α2) + · · ·+ xn+1σ−1

2 (αn+1) = 0

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

x1σ−1n (α1) + x2σ

−1n (α2) + · · ·+ xn+1σ−1

n (αn+1) = 0

(12.10)

in E. Il sistema ha una soluzione non banale perche il numero delle incognite

supera il numero delle equazioni. Possiamo supporre x1 = 0.Poiche le equazioni (12.10) possono essere moltiplicate per un fattore

arbitrario, possiamo supporre che x1 sia un elemento di E che abbia traccia

non nulla.16 Applichiamo ora σi alla i-esima equazione. Il risultato e:

σi(x1)α1 + σi(x2)α2 + · · ·+ σi(xn+1)αn+1 = 0.

Se sommiamo rispetto all’indice i, otteniamo:

S(x1)α1 + S(x2)α2 + · · ·+ S(xn+1)αn+1 = 0.

Poiche S(xν) appartiene a K e S(x1) = 0 abbiamo ottenuto una combina-

zione lineare che mostra la dipendenza. 2

Questo teorema ha due importanti corollari.

16Poiche x1 = 0 gli elementi della forma x1 ·y esauriscono gli elementi di E e tra questi

c’e almeno un elemento con traccia non nulla. Possaimo allora addirittura suppore che

questo elemento sia x1 stesso.

243

Corollario 12.4 Sotto le stesse ipotesi del Teorema 12.9 si ha: un qualsiasi

automorfismo di E che lascia invariante il campo K appartiene a G.

Dimostrazione. Sia σ diverso da ogni σi; puo allora essere aggiunto a G.

Poiche questo automorfismo non modifica K, otteniamo dal Teorema 12.8

che (E/K) ≥ n+ 1, in contraddizione con il Teorema 12.9. 2

Ne segue anche immediatamente:

Corollario 12.5 Gruppi finiti diversi di automorfismi di E hanno campi

fissi diversi.

Siamo ora giunti al punto in cui si vede concretamente come Artin consideri

non le estensioni di un campo ma i sottocampi di un campo dato.

Definizione 12.3 Una estensione E di un campo K e detta una estensione

normale di K quando K e il campo fisso di un gruppo finito di automorfismi.

La definizione seguente e motivata dal fatto che Artin considera campi di

caratteristica qualsiasi. In un campo di caratteristica finita un polinomio

irriducibile puo avere radici multiple. Questo naturalmente non capita in

caratteristica zero.

Definizione 12.4 Sia f(x) un polinomio di K[x]. Diremo che f(x) e un

polinomio separabile quando nessun suo fattore irriducibile possiede radici

multiple. Sia ora E una estensione di K. Diremo che un elemento α di E e

separabile quando e radice di un polinomio separabile. Diremo poi che una

estensione E di K e separabile quando ogni suo elemento e separabile.

Teorema 12.10 (Teorema 15) Sia E una estensione normale di K aven-

te il gruppo G. Allora E e una estensione separabile di K. Inoltre si ha: sia

α un elemento di E e siano α1, α2, . . . , αr le immagini a due a due distinte

di α che si ottengono con gli n automorfismi di G. Allora il polinomio

p(x) = (x− α1)(x− α2) · · · (x− αr)

e un polinomio irriducibile in K con la radice α.

244

Dimostrazione. Si moltiplichino gli n elementi di G per σi, il che produce

di nuovo tutti gli elementi di G. Questo mostra che gli r elementi

σi(α1), σi(α2), . . . , σi(αr)

formano una permutazione degli elementi

α1, α2, . . . , αr.

Di conseguenza i coefficienti del polinomio p(x) rimangono invariati per la

applicazione di σi. Quindi p(x) e un polinomio in K, ed e evidente che

p(x) e separabile. Poiche α stesso compare tra le immagini di α, p(x) ha

la radice α.

Se f(x) e un polinomio arbitrario in K per il quale si ha f(α) = 0, si ha

anche

σi(f(α)) = f(σi(α)) = 0.

quindi f(x) ammette tutte le radici α1, α2, . . . , αr e quindi e divisibile per

p(x).

Questo mostra la irriducibilita di p(x) e la dimostrazione e completa. 2

Esercizio 12.3 Si confronti questo terorema con l’Osservazione 11.4.

Corollario 12.6 Sia E una estensione normale di K, p(x) un polinomio

irriducibile in K che ha una radice in E. Allora p(x) si spezza in fattori

lineari.

Dimostrazione. A causa della unicita del polinomio irriducibile di α, il

polinomio p(x) costruito sul modello del Teorema 12.10 si spezza in fattori

lineari in E. 2

Teorema 12.11 (Teorema 16) Sia E una estensione normale di K con

gruppo G e sia B un campo intermedio. Allora E e una estensione normale

di B, il cui gruppo U e dato dagli automorfismi di G che lasciano il campo

B invariato.

245

Dimostrazione. Sia U il sottogruppo di quegli automorfismi di G che lascia-

no B invariato. Sia r l’ordine del gruppo U, e sia B ′ il campo fisso di U.

Quindi si ha B ⊂ B ′ e dobbiamo dimostrare che B = B ′.

Abbiamo (E/B ′) = r, e (E/B) ≥ r, ed e sufficiente mostrare che

(E/B) = r.

Se si applicano gli automorfismi σi diG a B si ottengono rappresentazioni

isomorfe di B.

Ma puo succedere che automorfismi diversi diano la stessa rappresenta-

zione. Sia infatti σi(β) = σj(β) per tutti i β in B.

Questo e equivalente a

σ−1i σj(β) = β

il che equivale ancora a dire che σ−1i σj appartiene a U.

Gli elementi di uno stesso laterale sono allora esattamente quelli che

generano la stessa immagine isomorfa di B.

Poniamo ora n = rs, di modo che s e il numero dei laterali. Gli elementi

di G generano dunque esattamente s immagini isomorfe di B. Il campo fisso

di queste s rappresentazioni diverse e naturalmente K, e quindi per causa

del Teorema 12.8 abbiamo (B/K) ≥ s. Le due disuguaglianze

(E/B) ≥ r, (B/K) ≥ s

danno

(E/K) ≥ n.

Ma deve valere l’uguaglianza e quindi

(E/B) = r, (B/K) = s.

Il nostro teorema e dunque dimostrato. 2

Dalla dimostrazione segue che, per ogni campo intermedio B di grado s

su K si danno s isomorfismi diversi che fissano gli elementi di K e ognuno di

questi isomorfismi viene prodotto da un elemento di G. Si vede facilmente

che non esiste alcun altro isomorfismo di B che fissi gli elementi di K in una

246

estensione arbitraria di E. Altrimenti lo si aggiunga agli s isomorfismi dati.

K dovrebbe essere il campo fisso di questi s+ 1 isomorfismi, e quindi per il

Teorema 13 (cfr. pag. 237) deve essere (B/K) ≥ s+ 1.Ad ogni sottogruppo U di G corrisponde, come gia sappiamo, un sotto-

campo B, ossia il campo fisso di U (che contiene K). A sottogruppi diversi

corrispondono sottocampi diversi, per il Corollario 12.5 del Teorema 12.9.

Infine nel Teorema 12.11 abbiamo dimostrato che ogni campo intermedio

e il campo fisso di un sottogruppo di G.

Questa corrispondenza fra sottogruppi e sottocampi e anche chiaramente

una corrispondenza biunivoca.

Siano U1 e U2 con campi fissi B1 e B2 e sia U1 ⊂ U2, allora e eviden-

temente B1 ⊃ B2. Sia ora B1 ⊃ B2, di modo che ogni automorfismo che

lascia fisso B1 lascia anche fisso B2; ne segue dunque U1 ⊂ U2. La nostra

corrispondenza inverte dunque la relazione di contenenza. Infine per que-

sto ordinamento l’intero gruppo G e associato a K, mentre all’identita e

associato l’intero campo E.

Si possono dunque utilizzare i sottogruppi di G per descrivere i campi

intermedi. Vediamo ora anche un altro utilizzo.

Sia B un campo intermedio che appartenga al sottogruppo U e sia σ un

elemento di G. L’immagine σ(B) di B ottenuta dall’applicazione di σ e un

campo intermedio. Ci chiediamo quale sia il sottogruppo che corrisponde

a σ(B). Gli elementi di σ(B) hanno la forma σ(β), dove β appartiene a

B. Dobbiamo chiederci quali sono gli elementi τ di G che lasciano invariato

σ(β), per i quali dunque si ha

τσ(β) = σ(β).

Questa equazione e equivalente a

σ−1τσ(β) = β,

e questo significa che σ−1τσ sta in U e che dunque τ e un elemento di

σUσ−1. Quindi σUσ−1 e il gruppo che appartiene a σ(B).

Possiamo anche conoscere le condizioni per le quali B e un’estensione

normale di K. Quando (B/K) = s abbiamo visto che, in generale, ci pos-

sono essere solamente s isomorfismi di B (che lasciano K invariato) in una

247

estensione contenuta in E e che tutti questi isomorfismi sono generati da

elementi di G.

Quando B e normale su K, d’altra parte, debbono esserci s automorfismi

di B e dunque ogni isomorfismo deve essere un automorfismo. Dunque

σ(B) = B per ogni σ in G. Per quanto visto in precedenza, abbiamo

σUσ−1 = U

per ogni σ di G. Un sottogruppo con questa proprieta e detto, come tutti

sanno, un sottogruppo normale di G.17

Dunque B e una estensione normale di K esattamente quando U e un

sottogruppo normale di G.

Supponiamo ora che il campo intermedio B sia una estensione normale

di K e che quindi U sia un sottogruppo normale di G. Ogni automorfismo di

B che lascia K invariato e dunque generato dalla applicazione di un elemento

σ di G a B. Ma ogni automorfismo del laterale σU applicato a B genera

lo stesso automorfismo che genera σ, e quindi gli automorfismi di B che

ricerchiamo sono in corrispondenza biunivoca con i laterali σU.

Siano σU e τU due tali laterali, allora essi generano gli automorfismi

di B che si ottengono applicando σ e τ. La loro composizione genera

l’automorfismo στ che si trova nel laterale στU. Poiche U e un sottogruppo

normale, questo laterale e il prodotto dei laterali σU e τU. Vediamo allora

che gli automorfismi di B si compongono esattamente come i laterali. Il

gruppo formato dai laterali di un sottogruppo normale si chiama, come e

ben noto, il gruppo quoziente G/U. In questo senso l’estensione normale B

di K ha come gruppo di automorfismi G/U.

Riassumendo ecco quanto abbiamo dimostrato.18

17Si noti che Artin fino a questo punto ha utilizzato assai pochi strumenti della teoria

dei gruppi. La differenza tra la trattazione di Artin e quella di Jordan [1870] e notevole

(non solo per la dimensione dei libri). In un certo senso Artin e piu vicino a Galois di

quanto non lo siano gli autori che nell’Ottocento hanno cercato di interpretarlo.18Come si vede, nell’edizione tedesca, Artin preferisce enunciare il Teorema

Fondamentale al termine di una discussione che ha chiarito tutti gli aspetti dimostrativi.

In Artin [1944] si ha invece l’approccio piu tradizionale: l’enunciato seguito dalla

dimostrazione.

248

Teorema 12.12 (Teorema fondamentale) Sia E una estensione norma-

le di K avente il gruppo G. Si associ ad ogni sottogruppo U di G il campo

fisso B: abbiamo cosı una corrispondenza biunivoca tra sottogruppi e sotto-

campi. Questa corrispondenza inverte la relazione di contenenza. Per ogni

campo intermedio B il gruppo associato consiste di quegli elementi di G che

lasciano fisso B. Si ha

(E/B) = |U|,

(B/K) = Indice di U in G = Numero dei laterali.

Ogni isomorfismo di B in una estensione di E che fissa gli elementi di K puo

essere ottenuto attraverso l’uso di un elemento σ di G, e gli elementi del

laterale σU generano lo stesso isomorfismo. B e una estensione normale di

K quando U e un sottogruppo normale di G. In questo caso il gruppo degli

automorfismi di B e il gruppo quoziente G/U.

Osservazione 12.3 Un ottimo commento relativo alla versione di Artin

del Teorema Fondamentale si trova in [Bewersdorff, 2006, pp. 149-150].

Importante e anche l’articolo di Kiernan [1972], al quale va pero aggiunto

[van der Waerden, 73].

Ecco ora una semplice condizione per esprimere il fatto che E e una

estensione normale di K.

Teorema 12.13 (Teorema 18) E e una estensione normale di K se e solo

se e il campo di spezzamento di un polinomio separabile.

Dimostrazione. 1. Sia E una estensione normale di K e ω1,ω2, . . . ,ωn sia

una base dello spazio vettoriale E su K. Sia pi(x) il polinomio irriducibile di

K[x] con la radice ωi. Abbiamo gia dimostrato (con il Teorema 12.10 ed il

Corollario 12.6) che pi(x) e separabile e che si spezza totalmente in fattori

lineari in E. Si ponga

p(x) = p1(x)p2(x) · · ·pn(x).

Allora il polinomio p(x) e separabile e si spezza in E in fattori lineari.

Poiche tra le radici di p(x) ci sono tutti gli ωi, il campo di spezzamento e

esattamente E.

249

2. Sia p(x) un polinomio separabile di K e sia E il campo di spezzamento.

Sia G il gruppo degli automorfismi di E che fissano K. Poiche (E/K) <∞,

si ha, per il Corollario 12.3 del Teorema 12.8, che anche G e un gruppo

finito. E sufficiente dimostrare che un elemento θ di E che rimane invariato

per tutti gli elementi di G e un elemento di K, ossia che K e il campo fisso

di G.

Se tutte le radici di p(x) sono in K, abbiamo E = K e la nostra afferma-

zione vale banalmente.

Supponiamo dunque ora che delle radici di p(x) ve ne siano n non in

K, dove n ≥ 1. Supponiamo che la nostra proprieta sia stata dimostrata

in tutti i casi in cui meno di n radici di p(x) non sono in K. Sia α1 una

radice di p(x) che non sta in K e sia p1(x) il polinomio irriducibile in K

con p1(α1) = 0. Poiche p(x) e separabile, il polinomio p1(x) non ha radici

multiple. Noi sostituiamo ora il campo base K con K(α1). Allora p(x) e

ancora un polinomio separabile su questo campo ed E e ancora il campo

di spezzamento. Ma ci sono meno di n radici di p(x) fuori da K(α1). Per

l’ipotesi induttiva E e una estensione normale di K(α1). Il gruppo U degli

automorfismi di E che fissano K(α1) ha esattamente K(α1) come campo

fisso, ed e un sottogruppo di G. Sia ora θ un elemento che e fissato da tutti

gli elementi di G. Allora esso e anche fissato da tutti gli elementi di U e

quindi appartiene a K(α1). Sia ora s il grado di p1(x). Allora θ ha la forma:

θ = c0 + c1α1 + c2α21 + · · ·+ cs−1αs−11 (12.11)

dove i ci sono in K.

Il polinomio p1(x) non ha radici multiple. Indichiamo le sue radici con

α1, α2, . . . , αs. Per il Teorema 12.3 abbiamo un isomorfismo σi che mappa

K(α1) su K(αi), per il quale K rimane fisso puntualmente e α1 va in αi. Il

morfismo σi muta p(x) in se stesso. Il campo E e il campo di spezzamento

di p(x) su K(α1) ed e anche il campo di spezzamento di p(x) su K(αi). Per

effetto del Teorema 11.3, il morfismo σi si puo estendere ad un morfismo

τi che mappa E su E ed e quindi un elemento di G. Allora θ deve essere

fissato anche da τi. Applichiamo τi a (12.11) ed abbiamo

θ = c0 + c1αi + c2α2i + · · ·+ cs−1αs−1i .

250

Il polinomio

c0 − θ+ c1x+ c2x2 + · · ·+ cs−1xs−1.

ha le s radici distinte α1, α2, . . . , αs. Allora il loro numero e maggiore del

suo grado e quindi tutti i suoi coefficienti, ed in particolare il termine di

grado zero, debbono essere nulli. Allora abbiamo

θ = c0

e dunque θ e un elemento di K. 2

Aggiungiamo alcune osservazioni circa il calcolo con gli automorfismi.

Una estensione normale E di K sara descritta in pratica attraverso la scelta

di elementi generatori, ossia come

E = K(α1, α2, . . . , αr).

Questo significa che ogni elemento θ e una funzione razionale di

α1, α2, . . . , αr

con coefficienti in K.

Quando si conosce l’effetto di un automorfismo σ di G sui generato-

ri αi l’automorfismo e descritto esattamente. Dunque σ e determinato

dall’assegnazione dei valori σ(αi).

Quando si conosce un polinomio f(x) di K[x] tale che f(αi) = 0, ne segue,

per la applicazione di σ che deve essere f(σ(αi)) = 0 e quindi σ(αi) deve

essere ancora una radice di f(x).

Quando per esempio E e il campo di spezzamento di un polinomio senza

radici multiple e quando α1, α2, . . . , αr sono le radici, allora gli elementi αipossono essere scelti come i generatori di E, ed e allora chiaro che σ generera

una certa permutazione tra queste radici. Con questa descrizione, la quale

non e in tutti i casi praticabile, G puo anche essere identificato con un certo

gruppo di permutazioni.

251

12.6 La teoria di Artin e le estensioni

semplici.

Come si e visto, il percorso dimostrativo che ha condotto Artin al Teorema

Fondamentale non ha fatto ricorso al Teorema dell’Elemento Primitivo.

Ora si tratta pero di chiarirne il ruolo all’interno della teoria. E intanto

opportuno dare alcune definizioni:

Definizione 12.5 Una estensione E di un campo K e detta algebrica quan-

do ogni elemento di E e algebrico su K.

Sono di immediata verifica i fatti seguenti:

• Se (E/K) e finita, ogni elemento di E e algebrico su K;

• Se E e generata aggiungendo un numero finito di elementi algebrici E

e algebrica e di grado finito;

• Piu in generale, ogni estensione che si ottiene aggiungendo elementi

algebrici a K e un’estensione algebrica.

Abbiamo ora il risultato seguente:

Teorema 12.14 Sia K ⊂ E1 ⊂ E2, dove E1 e algebrica su K e E2 e algebrica

su E1. Allora E2 e un’estensione algebrica di K.

Dimostrazione. Sia α un elemento di E2. Per ipotesi α soddisfa un’equazione

algebrica in E1 i cui coefficienti siano α1, α2, . . . , αr. Allora α e algebrico

sul campo E ′ = K(α1, α2, . . . , αr). Il campo E ′(α) e di grado finito su E ′ ed

E ′ e di grado finito su K; di conseguenza (E ′(α)/K) e finito. Dunque α e

algebrico su K. 2

Ancora una volta Artin procede in modo discorsivo, affidando poi ad un

teorema (il Teorema 12.15) il risultato ottenuto con questo stile argomen-

tativo.

Sia allora E = K(α1, α2, . . . , αr) e sia ogni αi separabile su K. Quindi il

polinomio irriducibile pi(x) con la radice αi non ha radici multiple.

252

Sia f(x) = p1(x)p2(x) · · ·pr(x) ed indichiamo con E ′ il campo di spezza-

mento di di f(x) su E. Allora E ′ e anche il campo di spezzamento di f(x)

su K e contiene E come campo intermedio. Per il Teorema 12.13, E ′ e una

estensione normale di K. Per il Teorema 12.10, E ′ e anche una estensione

separabile di K, e quindi anche E, possiede questa proprieta. La estensione

normale E ′ di K ha solo un numero finito di campi intermedi, esattamente

tanti quanti i sottogruppi del gruppo degli automorfismi [che fissano K].19

Dunque vi sono solo un numero finito di campi tra K ed E. Quindi:

Teorema 12.15 (Teorema 22) Sia E = K(α1, α2, . . . , αr) e sia ogni αiseparabile su K. Allora E e una estensione separabile di K e ci sono solo

un numero finito di campi intermedi tra K ed E. E puo essere esteso ad un

campo E ′ che e normale su K.

Lemma 12.2 Sia σ un isomorfismo che mappa K su K ′, sia p(x) un poli-

nomio in K senza radici multiple e sia p ′(x) la sua immagine mediante σ.

Allora anche p ′(x) non ha radici multiple.

Dimostrazione. Sia E il campo di spezzamento di p(x) su K ed E ′ il campo

di spezzamento di p ′(x) su K ′. Per il Teorema 11.3 possiamo estendere σ ad

un isomorfismo τ fra E ed E ′ Si applichi ora τ alla decomposizione di p(x)

in fattori lineari in E e si ottiene lo spezzamento di p ′(x) in fattori lineari

distinti in E ′. 2

Teorema 12.16 (Teorema 23) Sia K ⊂ E1 ⊂ E2 dove E1 e una estensio-

ne separabile di grado finito su K ed E2 e una estensione separabile di grado

finito su E1. Allora E2 e separabile su K.

Dimostrazione. Sia α un elemento di E2 e p(x) il polinomio irriducibile

corrispondente su E1. Per ipotesi p(x) non ha radici multiple. Si estenda E1ad un’estensione normale E su K ed indichiamo con G il suo gruppo degli

automorfismi. I fattori irriducibili di p(x) in E siano p1(x), p2(x), . . . , pr(x).

Essi sono a due a due diversi e non hanno radici multiple.

Si applichino ora a questi polinomi tutti gli automorfismi di G ed in-

dichiamo con q1(x), q2(x), . . . , qs(x) i polinomi diversi che si ottengono.

19A causa del Teorema fondamentale, naturalmente.

253

Ogni qi(x) e l’immagine di un polinomio pj(x). A causa del Lemma 12.2

ogni qi(x) ha radici semplici. A causa dell’unicita dell’equazione irriducibile

corrispondente ad una data radice, due polinomi qi(x) non hanno radici co-

muni. Le immagini dei qi(x) per ogni automorfismo σ di G sono s polinomi

diversi l’uno dall’altro, ognuno dei quali, a causa della proprieta del gruppo

G e ancora l’immagine di un polinomio pj(x). Vediamo dunque che σ per-

muta solamente i polinomi qi(x). Si ponga ora f(x) = q1(x)q2(x) · · ·qs(x).Il polinomio f(x) e tale che i suoi coefficienti rimangono invariati per l’azione

di G e dunque e un polinomio in K. f(x) non ha radici multiple ed e divisibi-

le per p(x), poiche ogni pi(x) si trova tra i qj(x). Di conseguenza f(α) = 0

e dunque α e separabile su K. 2

Artin e ora in grado di mostrare quali estensioni possono essere gene-

rate mediante l’aggiunzione di un singolo elemento algebrico α. Diremo

una tale estensione semplice e l’elemento che la genera sara detto, come in

precedenza, elemento primitivo.

Teorema 12.17 (Teorema 24, Teorema di Steinitz) Una estensione E

di K, di grado finito, e semplice se e solo se possiede un numero finito di

campi intermedi.

Dimostrazione. 1. Sia E = K(α) una estensione semplice (generata da

un elelmento algebrico) e sia p(x) il polinomio irriducibile appartenente ad

α con coefficiente direttivo 1.20 Sia B un campo intermedio e sia p1(x) il

polinomio irriducibile di α in B con ancora coefficiente direttivo 1. Allora

p1(x) e un divisore di p(x), di modo che per tutti i campi intermedi B

abbiamo solo un numero finito di possibilita per il polinomio p1(x).

Sia B0 il campo intermedio che si ottiene aggiungendo a K tutti i coef-

ficienti di p1(x). Si ha B0 ⊂ B, e se riusciamo a dimostrare che B0 = B ne

segue che abbiamo solo un numero finito di possibilita per B.

A questo scopo basta dimostrare che

(E/B) ≥ (E/B0).

20p(x) e il polinomio minimo.

254

Ora p1(x) e anche un polinomio in B0 con la radice α. Poiche E = B0(α) =

B(α), si ha che (E/B0) e minore od uguale al grado di p1(x), il quale da

parte sua e uguale a (E/B).

2. Sia ora E una estensione di grado finito su K, per la quale si diano solo

solo un numero finito di campi intermedi. Facciamo l’ipotesi supplementare

che K possieda un numero infinito di elementi.21

Siano α e β due elementi di E. Per ogni c in K costruiamo l’elemento

γc = α+ cβ

e l’estensione semplice

Kc = K(γc).

Tutti i Kc sono campi intermedi. Poiche abbiamo solo un numeri finito

di campi intermedi, ma abbiamo infinite scelte possibili per l’elemento c,

esistono certamente due elementi distinti c e d in modo che sia

Kc = Kd.

Allora poche sia γc che γd sono in Kc, anche la loro differenza (c− d)β

e in Kc. Ne segue che β si trova in Kc, e poiche vi si trova di conseguenza

anche α, abbiamo

K(α,β) ⊂ Kc.

Poiche K(c) ⊂ K(α,β) si ha

K(α,β) = K(γc).

L’aggiunzione di due elementi di E a K puo dunque essere sostituita dall’aggiunzione

di un singolo elemento. Poiche E viene generato dalla aggiunzione di un nu-

mero finito di elementi (per esempio i generatori dello spazio vettoriale E

su K), ne segue che E e una estensione semplice di K. 2

21Il caso di un numero finito di elementi e considerato successivamente.

255

Capitolo 13

La Trasformata Rapida diFourier

Nel 1965 J. W. Cooley e J. W. Tukey decidono di rendere pubblico un

algoritmo che riduce drasticamente il numero di operazioni necessarie per

calcolare la Trasformata Discreta di Fourier: si tratta dell’algoritmo della

Trasformata Rapida di Fourier.1 In breve tempo l’algoritmo si rivela decisi-

vo per il progresso della matematica e della tecnologia che da essa dipende

e negli anni successivi si ha una vera e propria esplosione di lavori dedicati

alla FFT. L’algoritmo viene riproposto in innumerevoli varianti e altri al-

goritmi che riducono similmente il numero delle operazioni necessarie per il

calcolo della Trasformata Discreta vengono presentati.2

Tra questi algoritmi ve n’e uno molto semplice ed elegante, proposto

da C.M. Fiduccia,3 che, all’interno di un sistema di computer algebra, puo

1Cf. [Cooley e Tukey, 1965]. Questo fondamentale articolo e anche riprodotto in

[Tukey, 1984]. E di uso comune l’acronimo inglese: FFT (Fast Fourier Transform).2Si veda, per esempio, [Cooley, 1990], [Cipra, 1993]. In [Heideman e Burrus, 1984]

vi sono 2418 referenze. Non tutte sono relative alla FFT, ma il dato e comunque

impressionante.3Cf. [Fiduccia, 1972]. L’algoritmo e anche molto efficace. Si veda [Bernstein, 2007].

257

essere descritto ‘a vari livelli’: da un’implementazione ingenua, che operi di-

rettamente sui polinomi, ad una versione piu raffinata che utilizzi gli array.4

Mi soffermero brevemente su questo punto.

Inoltre la FFT ha costituito un interessante oggetto di indagine storica.

Pareva incredibile che un algoritmo cosı importante fosse sorto dal nul-

la. Ed in effetti questa indagine ha mostrato molti ‘precursori’, tra i quali

primeggia l’esempio illustre di Gauss.5 In effetti nelle opere di Gauss si

trova uno scritto (inedito) che contiene un risultato sull’interpolazione tri-

gonometrica che, interpretato in termini di variabile complessa, produce un

algoritmo equivalente alla FFT.6 Naturalmente questa ‘equivalenza’ produ-

ce molti interrogativi, tra i quali quello del rapporto (mutevole nel tempo)

tra il disporre ordinatamente una serie di calcoli o il ridurre, a prezzo di

una minor semplicita, il loro numero.

13.1 Qualche premessa sulla serie di Fourier

Pongo rapidamente alcune premesse sulla serie di Fourier necessarie per la

comprensione di cio che segue.7

Lo sviluppo in serie di Fourier

Sia g(x) una funzione (periodica di periodo 2π) ed integrabile su [0, 2π]. La

successione dei suoi coefficienti di Fourier {ck} e definita da

ck =1

2π

∫ 2π0

g(x) e−ikxdx, (13.1)

4Una discussione interessante (ma datata 1978) su una maniera ottimale di imple-

mentare l’agoritmo di Fiduccia si trova in [Kahaner, 1978]. Per quanto il riferimento

all’articolo di Fiduccia compaia nella bibliografia, mi sembra che l’autore ne sottova-

luti l’importanza, come se l’idea scaturisse ‘naturalmente’ dalla stessa definizione di

trasformata discreta.5Cf. [Heideman e altri, 1985], [Cooley, 1994].6Cf. [Goldstine, 1977], [Heideman e altri, 1985], [Galuzzi, 1994].7Un’introduzione rapida all’argomento si trova in [Walker, 1991].

258

per ogni intero k. La serie di Fourier e definita corrispondentemente da

g(x) ∼

∞∑−∞ cke

ikx. (13.2)

L’uso del segno ∼ indica che non necessariamente la serie a secondo membro

della (13.2) deve convergere puntualmente alla funzione.

La Trasformata Discreta di Fourier

Supponiamo di approssimare l’integrale (13.1) mediante le somme di Rie-

mann, utilizzando una suddivisione in N parti uguali di [0, 2π] e scegliendo

l’estremo sinistro in ogni intervallo della suddivisione. Abbiamo dunque i

punti

xj = j ·2π

N, j = 0, 1, . . .N− 1.

ed il calcolo approssimato conduce a

ck =1

2π

N−1∑j=0

g(xj)e−ikj 2π

N · 2πN

=1

N

N−1∑j=0

g(xj)e−ikj 2π

N . (13.3)

Poniamo

w = e−i·2πN .

Evidentemente

wN = 1

e dunque w e una radice di ordine N dell’unita. La (13.3), ponendo anche

g(xj) = aj (il che significa in pratica considerare solo un campionamento

della funzione) diviene:

ck =1

N

N−1∑j=0

aj ·wk·j =1

N

N−1∑j=0

aj · [wk]j. (13.4)

Dalla (13.4) e immediato dedurre alcune conseguenze: la linearita: se

ad {aj} associamo {ck} e ad {a ′j} associamo {c ′k}, alla combinazione lineare

{λaj + λ′a ′j} risulta associato {λck + λ

′c ′k}.

259

Altrettanto evidente e la periodicita:8 basta osservare chew e una radice

dell’unita di ordine N per avere

cN+k = ck. (13.5)

La scrittura (13.4), e l’osservazione sulla periodicita data da (13.5)

motivano la seguente definizione (per la quale trascuro il fattore N−1).

Definizione 13.1 Siano dati gli N numeri complessi

a0, a1, . . . , aN−1 (13.6)

e sia w = e−2πNi. I numeri complessi

Ak =

N−1∑j=0

aj[wk]j =

N−1∑j=0

ajwkj, k = 0, 1 . . . ,N− 1 (13.7)

costituiscono la Trasformata di Fourier Discreta (DFT) dei numeri (13.6).

Questa trasformata puo essere pensata come un’operazione che ad un vettore

[a0, a1, . . . , aN−1] associa il nuovo vettore [A0, A1, . . . , AN−1].9 ⋄

Consideriamo il polinomio

p(z) = a0 + a1z+ a2z2 + · · ·+ aN−1z

N−1. (13.8)

Evidentemente dalla Definizione 13.1 si ha

Ak = p(wk). (13.9)

In termini matriciali, la (13.9) diviene:1 1 1 . . . 1

1 w w2 . . . wN−1

1 w2 w4 . . . w2(N−1)

......

......

...

1 wN−1 . . . . . . w(N−1)(N−1)

a0

a1

a2...

aN−1

=

A0

A1

A2...

AN−1

. (13.10)

8Ovviamente la periodicita dei coefficienti ck dipende dalla tecnica di approssimazio-

ne usata. Per il calcolo concreto si assume spesso empiricamente |k| < 18N. Cfr. [Walker,

1991, pp. 39-40].9Talvolta si assume anche w = e

2πN

i.

260

La matrice che compare a sinistra del segno uguale e evidentemente la

matrice di Vandermonde

V(1,w,w2, . . . , wN−1). (13.11)

La sua inversa, come si verifica immediatamente, e data da

1

NV(1,w−1, w−2, . . . , w−(N−1)). (13.12)

Quindi la DFT inversa si ottiene con

ak =1

N

N−1∑j=0

Ajw−kj. (13.13)

Osservazione 13.1 Consideriamo il polinomio

q(z) = A0 +A1z+ · · ·+AN−1zN−1. (13.14)

Per quanto abbiamo osservato, si ha

q(w−k) = N · ak, (13.15)

e dunque il calcolo della DFT equivale al calcolo del polinomio interpolante

di grado N− 1 sugli N nodi

(w−k,N · ak), k = 0, 1, . . . ,N− 1. ⋄

13.2 La divisione fra polinomi

Supponiamo di voler valutare un polinomio p(z) in

z1, z2, . . . , zn .

Se poniamo

f(z) = (z− z1)(z− z2) · · · (z− zn),

261

dall’algoritmo della divisione abbiamo

p(z) = q(z)f(z) + r(z) (13.16)

e dunque evidentemente

p(zi) = r(zi), per i = 1, 2, . . . , n.10

Questa proprieta e importante se la natura dei polinomi p(z) e f(z) e tale

da rendere facile il calcolo di r(z). Questo succede in particolare se p(z) e

un polinomio di grado 2n− 1 e f(z) ha la forma zn − α.

Se infatti

p(z) = c0 + c1z+ · · ·+ cn−1zn−1 + cnzn + · · · c2n−2z2n−2 + c2n−1z2n−1

si ha, come si verifica immediatamente,

r(z) = (c0 + cnα) + (c1 + cn+1α)z+ · · · (cn−1 + c2n−1α)zn−1. (13.17)

Se il polinomio va diviso anche per zn + α, avremo semplicemente da

cambiare il segno di α nella (13.17).

Un caso ancor piu particolare, ma importante, e dato dal problema di

valutare un polinomio p(z) di grado 2n− 1 sulle radici di

z2n − α2 = (zn − α)(zn + α).

In questo caso dobbiamo valutare

rα(z) = (c0 + cnα) + (c1 + cn+1α)z+ · · · (cn−1 + c2n−1α)zn−1 (13.18)

10Un elogio dell’algoritmo della divisione puo sembrare fuori luogo. Mi piace pero

ricordare che la celebre Regola di Sturm che consente di conoscere il numero esatto di

radici di un’equazione polinomiale p(x) = 0 in un dato intervallo si fonda sul’algoritmo di

Euclide aplicato a p(x), p ′(x), opportunamente modificato, ossia cambiando di segno al

resto ad ogni passaggio. La Regola di Horner, per ottimizzare il calcolo di un polinomio

p(x) in x = α si ottiene semplicemente calcolandi il resto di p(x)/(x−α), ecc. L’algoritmo

di Fiduccia non e certo il solo che utilizza un’opportuna decomposizione del polinomio

zN − wN ed il calcolo di resti (si veda ad esempio [Bruun, 1978]). Mi pare pero il piu

semplice ed efficace.

262

sulle radici di zn − α e

r−α(z) = (c0 − cnα) + (c1 − cn+1α)z+ · · · (cn−1 − c2n−1α)zn−1. (13.19)

sulle radici di zn + α.

Se pensiamo in termini vettoriali, al vettore che rappresenta il polinomio

p(z)

[c0, c1, . . . , cn−1| cn, . . . , c2n−1]

viene associato il vettore ottenuto giustapponendo i due resti.

[c0+cnα, c1+cn+1α, . . . , cn−1+c2n−1α| c0−cnα, c1−cn+1α, . . . , cn−1−c2n−1α]

Questa osservazione e alla base dell’algoritmo della Trasformata Rapida

di Fourier nella versione di C. M. Fiduccia. Un esempio puo servire da

introduzione.

Esempio 13.1 Si supponga di voler valutare un polinomio p(z), di grado

7 sulle N = 8 radici dell’unita soluzioni dell’equazione z8 − 1 = 0. Sia

w = e−i2π8

Si osservi la decomposizione rappresentata dall’albero seguente

z8 −w8

z4 −w0

z2 −w0

z−w0 z−w4

z2 −w4

z−w2 z−w6

z4 −w4

z2 −w2

z−w1 z−w5

z2 −w6

z−w3 z−w7

Ad ogni ‘livello’ il prodotto dei polinomi ricostruisce il polinomio origina-

le (si noti che, in generale, se w = e−i2πN , con N pari, si ha wk+N/2 = −wk).

Si tratta dunque di dividere p(z) per z4−w0 e per z4−w4 per ottenere i due

263

primi resti. I resti cosı ottenuti vanno divisi rispettivamente per z2 − w0,

z2 −w4; z2 −w2, z2 −w6 e cosı via discendendo lungo i rami dell’albero.

Alla fine, poiche calcolare il resto della divisione di un polinomio per il

polinomio di primo grado z − wk significa semplicemente valutare il po-

linomio stesso in wk, il polinomio assegnato all’inizio si trova valutato

rispettivamente in

w0, w4, w2, w6, w1, w5, w3, w7.

Si tratta allora semplicemente di riordinare i dati ottenuti per completare il

calcolo. ⋄

Osservazione 13.2 Si noti che nella sequenza precedente quando un espo-

nente non e ‘al suo posto’, il suo valore indica dove si trova la radice ‘giusta’

e quindi quale scambio va effettuato.11 ⋄

Dalle osservazioni precedenti e facile ricavare una prima descrizione ‘qua-

litativa’ dell’algoritmo di Fiduccia. Supponiamo che siano assegnati N dati

{ak}, con k = 0, 1, . . . , N − 1, ove N = 2n, il numero di dati tipico per la

Trasformata Rapida di Fourier. Formiamo il polinomio, di grado N− 1,

N−1∑k=0

akzk (13.20)

e sia w = e−2πiN . Si tratta di organizzare progressivamente il calcolo dei

resti come suggerito dall’esempio precedente. Al primo passaggio dovremo

calcolare i resti della divisione del polinomio dato per due binomi di grado

N/2, ove w compare con gli esponenti [0,N/2], ossia per i binomi zN/2 −

w0, zN/2 −wN/2. Indichiamo questi resti con rs, rd. Al secondo passaggio i

gradi dei binomi divengono N/4 e gli esponenti sono dati da

[0,N/2, 0+N/4,N/2+N4].

Naturalmente i primi due binomi servono per calcolare due resti corrispon-

denti ad rs, che indichiamo con rss, rsd, mentre gli altri due servono per

11Questa osservazione si deduce facilmente dalle proprieta dell’algoritmo di Buneman.

Cf. [Walker, 1991, pp. 54-56]. Si veda anche [Drouiche, 2001].

264

calcolare i resti corrispondenti ad rd, ossia rds, rdd. Si procede con la stessa

logica: si dimezza il grado dei binomi e si calcola la lista di esponenti

[0,N/2,N/4,N/2+N4,N/8,N/2+N/8,N/4+N/8,N/2+N/4+N/8],

per formare i binomi e cosı via.

Un nuovo esempio che mostri il calcolo ‘concreto’ puo essere utile.

Esempio 13.2 Consideriamo il polinomio z7 + z e supponiamo di volerlo

calcolare per i valori dati da e−2πi8k, con k = 0, 1, . . . , 7. L’albero visto

nell’Esempio 1, sostituendo i valori, da:

z8 − 1

z4 − 1

z2 − 1

z− 1 z+ 1

z2 + 1

z+ i z− i

z4 + 1

z2 + i

z− 1−i√2

z+ 1−i√2

z2 − i

z+ 1+i√2

z− 1+i√2

Se utilizziamo questi polinomi per calcolare i resti successivi, abbiamo il

nuovo albero dato da

z7 + z

z3 + z

2z

2 −2

0

0 0

−z3 + z

(1+ i)z

√2 −

√2

(1− i)z

−√2

√2

Sull’ultima riga compaiono i valori richiesti, nell’ordine dato dalle radici

di esponenti [0, 4, 2, 6, 1, 5, 3, 7] ⋄

265

13.3 Verso la scrittura di un programma

Un vantaggio (didattico) dell’uso di un sistema di computer algebra12 e dato

dal fatto che ci si puo avvicinare alla scrittura efficiente di un programma

‘per gradi’. Nel caso in questione, la scrittura finale dovrebbe accettare

come input una lista di dati13 e utilizzare le manipolazioni polinomiali che

abbiamo visto, trasformandole in termini di manipolazioni successive sulla

lista originaria.

Tuttavia anche una prima implementazione in termini di polinomi, con

l’utilizzo delle procedure sui polinomi fornite dal sistema, produce un algo-

ritmo facilmente comprensibile e di discreta efficienza.

Questa prima versione dell’algoritmo e posta in appendice. Il resto del-

le divisioni non viene calcolato utilizzando una procedura che ne sfrutti la

particolarita, ma semplicemente usando la funzione rem. Ovviamente as-

segnando i polinomi come liste di coefficienti ed utilizzando una procedura

apposita per il calcolo del resto si ottiene un programma piu efficiente. An-

che questa seconda versione e posta in appendice. Ho anche aggiunto due

versioni ricorsive dell’agloritmo di Cooley e Tukey.

13.4 Conclusione

Per concludere questo capitolo, voglio indicare alcune direzioni di ricerca

che mi sembra possano condurre a risultati vallidi.

• In primo luogo mi pare interessante saggiare la effettiva corrispon-

denza tra l’algoritno di Gauss e la moderna FFT di Cooley e Tukey.

Certo, l’utilizzo della variabile complessa, unito ad un po’ di pazien-

za nel riscrivere i calcoli, puo condurre effettivamenre ad individuare

algoritmi molto simili. Ma questa somiglianza e un’effettiva identita

o si tratta di una ‘modernizzazione’ storicamente poco significativa?

Non mancano esempi (come l’uso acritico dell’algebra geometrica per

leggere i testi greci) ove queste letture modernizzanti portano anche

a risultati di valore discutibile.

12Il sistema che utilizzo e Maple nella versione 13.13O un array.

266

• Quando e come il puro conteggio del numero delle operazioni arit-

metiche fa aggio su una disposizione dei calcoli piu onerosa ma ben

ordinata e trasparente? Sarebbe assai interessante vedere le tecniche

utilizzate nei vari osservatori trigonometrici. Qual e poi il ruolo del

computer in questa vicenda?

• Quali usi ha avuto la FFT e quale rilevanza nello sviluppo della

moderna tecnologia legata all’elettronica?14

• Infine, credo che l’analisi, dal punto di vista storico, dell’evoluzione

degli algoritmi piu significativi legati alla FFT ed alla sempre maggiore

flessibilita dei linguaggi di programmazione possa fornire molti spunti

interessanti di ricerca.15

14Mi limito a citare [Prestini, 2004].15La Trasformata di Hartley (si veda [Bracewell, 1986], [Peyre, 2004, Cap. V]), che

opera come la FFT, utilizzando pero solo valori reali, e certamente di grande importanza

quando si ha a che fare con dei segnali reali. Ma da quando i principali linguaggi di

programmazione possono utilizzare liberamente i numeri complessi si puo immaginare

che tenda ad avere avere un rilievo minore in altri casi.

267

13.5 Appendice: alcuni programmi

L’algoritmo di Fiduccia utilizzando direttamente i polinomi e le operazioni

su di essi. Naturalmente non si puo avere una prestazione ottimale.

FFT_pol:=proc(p,z)

local N,e,R,w,j,n,k,e,Q,r1,r2,i,temp;

N:=degree(p,z); # p deve essere un polinomio di grado 2^n-1,

e:=array(0..N,fill=0]);

R:=Array(0..N,[p]);

w:=exp(-2*Pi*I/(N+1)); # La prima radice dell’unita di ordine 2^n,

# in senso anti-orario.

j:=1;

while j<N do

n:=(N+1)/(2*j);

for k from 0 to j-1 do # Calcolo degli esponenti necessari.

e[k+j]:=e[k]+n;

od;

Q:=map(t->z^n-w^t,P); # I polinomi necessari per le divisioni.

for i from j-1 to 0 by -1 do

r1:=rem(R[i],Q[2*i],z); r2:=rem(R[i],Q[2*i+1],z);

R[2*i]:=r1; R[2*i+1]:=r2;

od;

j:=2*j;

od;

# Riordino dei dati.

for i from 1 to N-1 do # Il primo e l’ultimo elemento

# sono gia al loro posto.

if e[i] > i then

temp:=R[i];

R[i]:=R[e[i]];

R[e[i]]:=temp;

fi; od;

convert(R,list);

end:

268

Un programma meno ingenuo: nell’Array x vengono progressivamente

sostituiti ai dati iniziali i valori calcolati della FFT.

FFT:=proc(x)

local N,n,w,i,j,k,l,temp,a;

N:=ArrayNumElems(x)-1;

l:=Array(0..N,fill=0);

w:=evalf(2*Pi/(N+1));

j:=1;

while j < N do

n:=1/2*(N+1)/j;

for k from 0 to j-1 do

l[k+j]:=l[k]+n;

a:=l[2*k]*w;

for i from 2*k*n to (2*k+1)*n-1 do

temp:=x[i+n]*(cos(a)-I*sin(a));

x[i+n]:=x[i]-temp; x[i]:=x[i]+temp

od

od;

j:=2*j

od;

for i to N-1 do

if i<l[i] then temp:=x[i];

x[i]:=x[l[i]]; x[l[i]]:= temp

fi

od;

end:

269

La versione ricorsiva di Cooley e Tukey si basa sulle osservazioni se-

guenti. Consideriamo il polinomio p(z) =∑2n−1

k=0 akzk. Possiamo riscriverlo

nella forma

p(z) =

n−1∑k=0

a2kz2k + z

n−1∑k=0

a2k+1z2k. (13.21)

Introduciamo i due polinomi ausiliari

p0(Z) =

n−1∑k=0

a2kZk, p1(Z) =

n−1∑k=0

a2k+1Zk (13.22)

e sia w = e−2πi2n , u = w2. Si ha allora

p(wj) = p0(ujk) +wjp1(u

jk). (13.23)

Inoltre wj+n = −wj. Il calcolo del polinomio p(z) sulle radici dell’unita di

ordine 2n si riconduce quindi al calcolo di due polinomi sulle radici di ordine

n e, dopo le opportune moltiplicazioni per wj, per j = 0, 1, . . . , n−1, ad una

somma e ad una differenza. Il programma seguente utilizza direttamente i

polinomi (di grado 2n − 1), e gia risulta discretamente efficiente.

CooleyTukey:=proc(p,z,d)

local d1,p0,p1,q0,q1,w;

if d<=0 then return p end if;

d1:=(1/2)*d-1/2;

p0:=add(coeff(p,z,2*k)*z^k,k=0..d1);

p1:=add(coeff(p,z,2*k+1)*z^k,k=0..d1);

q0:=CooleyTukey(p0,z,d1);

q1:= CooleyTukey(p1,z,d1);

w:=evalf(exp(-(2*I)*Pi/(d+1)));

q1:=subs(z=w*z,q1);

sort(collect(evalf(q0+q1+z^((1/2)*d+1/2)*(q0-q1)), z), z)

end:

270

Ovviamente questa versione, che utilizza le liste, e assai piu efficiente.

CooleyTukey:=proc(y)

local n,u,v,c,w,ypari,ydispari,omega;

n:=nops(y);

if n=1 then return y; fi; # fine ricorsione

omega:=exp(-2*Pi*sqrt(-1)/n); # radici dell’unita’

w:=[seq(evalf(omega^p),p=0..(n/2)-1)];

ypari:=[seq(y[2*j],j=1..n/2)];

ydispari:=[seq(y[2*j-1],j=1..n/2)];

u:=CooleyTukey(ydispari);

v:=zip((x,y)->x*y,w,CooleyTukey(ypari));

c:=[op(u)+op(v),op(u)-op(v)];

end:

271

Bibliografia

Al-Khwarizmı (2007). Le commencement de l’algebre. Blanchard, Paris.

Texte etabli, traduit et commente par R. Rashed.

Alesina A.; Galuzzi M. (1998). A new proof of Vincent’s theorem.

L’Enseignement mathematique, 44, 219–256.

Apollonius (1923). Les Coniques d’Apollonius de Perge, Livres I–IV. De-

sclee, de Brouwer et Cie, Bruges. Tradution, avec une introduction et des

notes par P. Ver Eecke.

Apollonius (1990). Conics. Books V to VII. Springer-Verlag, New York.

Edited with Translation and Commentary by G. J. Toomer.

Apollonius (2008a). Coniques, volume 1.1: Livre I. Walter de Gruyer,

Berlin-New York.

Apollonius (2008b). Coniques, volume 1.2: Livre I. Walter de Gruyer,

Berlin-New York.

Archimede (1974). Opere. Utet, Torino. A cura di A. Frajese.

Artin E. (1942). Galois Theory. Notre Dame Lectures, University of Notre

Dame Press.

Artin E. (1944). Galois Theory. Notre Dame Lectures, University of Notre

Dame Press. Second revised edition.

273

Artin E. (1988). Galoissche Theorie. Verlag Harri Deutsch, Thun. German

translation by V. Ziegler.

Auffray J.-P. (2004). Evariste. Aleas, Lyon.

Ballieu M. (1942). Sur le developpement des irrationnelles quadratiques en

fractions continues regulieres. Mathesis, 54, 304–314.

Barozzi F. (1586). Admirandum illud geometricum problema tredecim modis

demonstratum. Apud Gratiosum Perchacinum, sumptibus Io. Baptistae

Fantini Patavini, Venetiis. Edited by L. Maieru, Bologna, 1991.

Bernstein D. J. (2007). The tangent FFT. In Boztas e Hsiao-feng Lu [2007],

pp. 291–300.

Bewersdorff J. (2006). Galois Theory for Beginners. A Historical

Perspective. AMS Chelsea publishing, Providence, Rhode Island.

Bombelli R. (1966). Algebra. Feltrinelli, Milano. Prima edizione integrale

a cura di E. Bortolotti.

Bombieri E.; van der Poorten A. J. (1995). Continued fractions of algebraic

numbers. In Computational Algebra and Number Theory. Sydney, 1992,

Math. Appl. 325, pp. 137–152, Dordrecht. Kluwer Acad. Publ.

Borges J. L. (1978). Finzioni. Einaudi, Torino. Traduzione italiana di F.

Lucentini.

Bos H. J. M. (2001). Redefining Geometrical Exactness. Descartes’ Tran-

sformation of the Early Modern Concept of Construction. Springer, New

York etc.

Bourdon L. P. M. (1831). Elemens d’Algebre. Bachelier pere et fils, Paris.

Boztas S.; Hsiao-feng Lu, (A cura di) (2007). Applied Algebra, Algebraic

Algorithms and Error-Correcting Codes, 17th International Symposium,

AAECC-17, volume 4851 di Lecture Notes in Computer Science. Springer.

Bracewell R. (1986). The Hartley Transform. The Clarendon Press, Oxford

University Press, Oxford, New York.

274

Brigham E. O. (1974). The Fast Fourier Transform. Prentice-Hall, New

Jersey.

Brown J. D.; Chu M. T.; Ellison D. C.; Plemmons R. J., (A cura di)

(1994). Proceedings of the Cornelius Lanczos international Centenary

Conference, Philadelphia, PA. SIAM.

Bruun G. (1978). z-Transform DFT Filters and FFT’s. IEEE Transactions

on Acoustic, Speech and Signal Processing, 26(1), 56–63.

Camilleri A. (2000). Un filo di fumo. Sellerio, Palermo. Tredicesima

edizione.

Cauchy A. L. (1815a). Memoire sur la determination du nombre des racines

reelles dans les equations algebriques. Journal de le Ecole Polytechnique,

10, 1–28. Œuvres (2), 1, 170-257.

Cauchy A. L. (1815b). Memoire sur le nombre des valeurs qu’une fonction

peut acquerir lorsqu’on y permute de toutes les manieres possibles les

quantites qu’elle renferme. Journal de L’Ecole Polytechnique, 10, 1–28.

Œ uvres, (2), 1, pp. 64-90.

Cauchy A. L. (1821). Analyse Algebrique. Chez Debure freres, Paris.

Riproduzione anastatica (J. Gabay, 1989).

Cauchy A. L. (1829). Sur la resolution des equations numeriques et sur la

theorie de l’elimination. Exercises de Mathematiques. Œuvres, 2nd series,

9, 87–161.

Cauchy A. L. (1845). Sur le nombre des valeurs egales ou inegales que peut

acquerir une fonction de n variables independantes, quand on permute

ces variables entre elles d’une maniere quelconque. Compte Rendus, pp.

779–797. Œuvres, (1), 9, pp. 323-341.

Chemla K.; Shuchun G., (A cura di) (2004). Les Neuf Chapitres, Paris.

Dunod.

Christianidis J., (A cura di) (2004). Classics in the History of Greek

Mathematics, Dordrecht, Boston, London. Kluwer Academic Publishers.

275

Cipra B. A. (1993). The FFT: making Technology fly. Siam News, 26(3),

pp. 1, 23.

Conway J. H.; Guy R. (1999). Il libro dei numeri. Hoepli, Milano.

Traduzione italiana di A. Zaccagnini.

Cooley J. W. (1990). How the FFT gained Acceptance. In Nash [1996], pp.

133–140.

Cooley J. W. (1994). Lanczos and the FFT; a Discovery before its Time.

In Brown e altri [1994], pp. 3–9.

Cooley J. W.; Tukey J. W. (1965). An Algorithm for the Machine Calcu-

lation of Complex Fourier series. Mathematics of computations, 19(2),

297–301.

Cossali P. (1996). La storia del caso irriducubuke. Istituto veneto di scienze

lettere ed arti, Venezia. Trascrizione, introduzione e note a cura di R.

Gatto.

Croce B. (1909). Logica come scienza del concetto puro. Laterza, Bari.

Seconda edizione interamente rifatta.

Croce B. (1976). Teoria e storia della storiografia. Laterza, Bari.

Undicesima edizione.

De Nuccio S. (2001). Le frazioni continue aritmetiche e le radici di

un’equazione algebrica di 2o grado. Una memoria di E. Galois. Periodico

di matematiche, 1(2), 45–63.

De Pace A. (1993). Le matematiche e il mondo. Ricerche su un dibattito in

Italia nella seconda meta del Cinquecento. FrancoAngeli, Milano.

Descartes R. (1659–61). Geometria a Renato Descartes anno 1637 Gallice

edita; postea autem Una cum Notis Florimondi De Beaune [. . . ]. Opera

atque Studio Francisci a Schooten[. . . ]. Apud Ludovicum & Danielem

Elzevirios, Amstelædami.

276

Descartes R. (1954). The Geometry of Rene Descartes with a Facsimile

of the first Edition. Dover, New York. Translated from the French and

Latin by D. E. Smith and M. L. Latham.

Dieudonne J. (1986). Abrege d’histoire des mathematiques. Hermann, Paris.

Dirichlet P. G. L. (1881). Lezioni sulla teoria dei numeri. Tipografia Emi-

liana. Con le appendici di R. Dedekind. Tradotte dalla terza edizione da

A. Faifofer.

Dirichlet P. G. L. (1894). Vorlesungen uber Zahlentheorie. Druck und Verlag

von Friedrich Vieweg und Sohn, Braunschweig. Herausgegeben und mit

Zusatzen versehen von R. Dedekind. Vierte umgearbeitete und vermehrte

Auflage.

Drouiche K. (2001). A New Efficient Computational Algorithm for Bit

Reversal Mapping. IEEE Transactions on Signal Processing, 49(1), 251–

254.

Edwards H. M. (1984). Galois Theory. Springer-Verlag, New York, etc.

Euclid (1956). The thirteen Books of the Elements. Dover, New York.

Second edition, revised by Additions. Introduction and Commentary by

Sir Thomas Heath.

Euclide (1970). Elementi. Utet, Torino. Traduzione italiana a cura di A.

Frajese e L. Maccioni.

Euclide (1990-2001). Les Elements. Presses Universitaires de France, Pa-

ris. Introduction par Maurice Caveing. Traduction et commentaires par

Bernard Vitrac.

Euler L. (1770 (1771)). Observationes circa radices aequationum. Novi

commentarii academiae scientiarum Petropolitanae, 15, 51–74. Opera

omnia (1) ,6, 263-286.

Euler L. (1774 (1773)). Elemens d’algebre. J.-M. Bruset, Lyon. Traduction

francaise.

277

Euler L. (1988). Introduction to the Analysis of the infinite. Springer-Verlag,

New York. English translation by J.D. Blanton.

Fermat P. d. (1891-1922). Œuvres de Fermat. Gauthier-Villars, Paris.

Publiees par les soins de MM. Paul Tannery et Charles Henry sous les

auspices du Ministere de l’instruction publique.

Ferrara F.; Giacardi. L.; Mosca M., (A cura di) (2009). Conferenze e

Seminari dell’Associazione Subalpina Mathesis. 2008-2009, Torino. Kim

Williams Books.

Fiduccia C. M. (1972). Polynomial evaluation via the division algori-

thm. The Fast Fourier Transform revisited. In Proc. 4th Annual ACM

Symposium on the Theory of Computing, pp. 88–93.

Fowler D. H. (1987). The mathematics of Plato’s Academy. ClarendonPress,

Oxford.

Freguglia P. (1999). La geometria fra tradizione e innovazione. Bollati

Boringhieri, Torino.

Fried M. N.; Unguru S. (2001). Apollonius of Perga’s Conica. Text, Context,

Subtext. Brill, Leiden - Boston - Koln.

Friedlein G. (1873). Procli Diadochi in primum Euclidis elementorum

librum commentarii. Teubner, Leipzig.

Funkhouser H. G. (1930). A short account of the history of symmetric

functions of roots of equations. The American mathematical monthly,

37, 357–365.

Galois E. (1976). Ecrits et memoires mathematiques d’Evariste Galois.

Gauthier-Villars, Paris. Publies par R. Bourgne et J. P. Azra. Prefa-

ce de J. Dieudonne. Deuxieme edition revue et augmente. Reimpression

autorisee, Editions J. Gabay, 1997.

Galuzzi M. (1994). L’interpolazione trigonometrica in Gauss, Bessel e Cau-

chy In Scritti in onore di Giovanni Melzi. A cura di Manara C., Faliva

G., Marchi M., pp. 173–212. Vita e Pensiero, Milano.

278

Galuzzi M. (2001a). Galois’ note on the approximative solution of numerical

equations (1830). Archive for history of exact sciences, 56, 29–37.

Galuzzi M. (2001b). L’esattezza in Cartesio. Lettera matematica, 41, 58–60.

Galuzzi M. (2002). Descartes e la geometria analitica. Bollettino della

Sezione Mathesis di Milano, 9, 18–34.

Galuzzi M. (2009). La Memoria di Galois sulle frazioni continue. In Ferrara

e altri [2009], pp. 127–136.

Galuzzi M.; Rovelli D. (1997). Storia della geometria e didattica: qualche

osservazione. In Quaderno 19/2 del Ministero della Pubblica Istruzione.

L’insegnamento della geometria, pp. 70–110. Liceo scientifico statale A.

Vallisneri, Lucca.

Gauss C. F. (1801). Disquisitiones arithmeticae. In commissis apud

Gerh.Flesicher, Jun., Lipsiae.

Gauss C. F. (1807). Recherches Arithmetiques. Courcier, Paris. Traduites

par A.- C.- M. Poullet-Delisle. Editions Jacques Gabay, 1989.

Gauss C. F. (1816). Demonstratio nova altera theoremati omnem functio-

nem algebraicam rationalem integralem unius variabilis in factores reales

primi vel secundi gradus resolvi posse. Commentationes societatis regiae

scientiarum Gottingensis recensiores, 3. In Werke, 3, 32–56.

Goldman J. R. (2002). The Queen of Mathematics. A K Peters, Natick,

Massachusetts.

Goldstine G. H. (1977). A History of numerical Analysis from the 16th

through the 19th Century. Studies in the History of Mathematics and

Physical Sciences, vol. 2. Springer-Verlag, New York-Heidelberg.

Gould H. W. (1972). Combinatorial Identities. Morgantown, W. Va.

Guicciardini N. (2009). Isaac Newton on Mathematical Certainty and

Method. MIT Press, Cambridge, Mass.

279

Hardy G. H.; Wright E. M. (1971). An Introduction to the Theory of

Numbers. Oxford University Press, Oxford. Fourth edition.

Heath T. L. (1896). Apollonius of Perga. Treatise on Conic Sections. Edited

in modern notation with introductions including an essay on the earlier

history of the subject by T.L. Heath. Cambridge at the University Press,

Cambridge.

Heideman M. T.; Burrus C. S. (1984). A Bibliography of Fast Transform and

Convolution Algorithms ii. Relazione tecnica, Rice University. Technical

Report Number 8402.

Heideman M. T.; Johnson D. H.; Burrus C. S. (1985). Gauss and the History

of the Fast Fourier Transform. Archive for history of exact sciences, 34,

265–277.

Henrici P. (1964). An algebraic proof of the Lagrange-Burman formula.

Journal of mathematical analysis and applications, 8, 218–224.

Herstein I. N. (1982). Algebra. Editori Riuniti, Roma. Traduzione italiana

di A. Machı.

Hintikka J.; Remes U. (1974). The Method of Analysis. D. Reidel Publishing

Company, Dordrecht - Boston.

Hurwitz A. (1902). uber Abel’s Verallgemeinerung der binomischen Formel.

Acta Mathematica, 26, 199 – 203.

Jordan C. (1870). Traite des substitutions et des equations algebriques.

Gauthier-Villars, Paris. Editions Jacques Gabay, 1989.

Kahaner D. K. (1978). The fast Fourier transform by polynomial evaluation.

Zeitschrift fur angewandte Mathematik und Physik, 29, 387–394.

Kaplansky I. (1972). Fields and Rings. The University of Chicago Press,

Chicago and London. Second edition.

Kiernan B. M. (1971-1972). The development of Galois theory from

Lagrange to Artin. Archive for history of exact sciences, 8, 40–154.

280

Kline M. (1991). Storia del pensiero matematico. Edizione italiana a cura

di A. Conte, 2 volumi, Einaudi, Torino.

Knorr W. R. (1975). Evolution of the Euclidean Elements. Reidel,

Dordrecht.

Lagrange J.-L. (1768). Nouvelle methode pour resoudre les equations litte-

rales par le moyen des series. Histoire de l’Academie Royale des Sciences

et Belles-Lettres (de Berlin), 24, 251–326. Œuvres 3: 5-73.

Lagrange J.-L. (1769). Sur le probleme de Kepler. Histoire de l’Academie

royale des Sciences et des Belles–Lettres (Berlin), 25 (1771), 204–233.

Lagrange J.-L. (1770). Reflexions sur la resolution algebrique des equations.

Memoires de l’Academie royale des sciences et Belles-Lettres de Berlin,

pp. 205–421. Publie dans 1772. Œuvres, 3, 205-421.

Lagrange J.-L. (1808). Traite de la resolution des equations numeriques de

tous les degres. Courcier, Paris. Nouvelle edition revue et augmentee par

l’auteur.

Lagrange J.-L. (1826). Traite de la resolution des equations numeriques de

tous les degres. Bachelier, Paris.

Lagrange J.-L. (1847). Theorie des fonctions analytiques, troisieme edition.

Bachelier, imprimeur-libraire, Paris. Œuvres 9, pp. 11– 421.

Lagrange J.-L. (1867–1879). Œuvres. Gauthier-Villars, Paris.

Laplace P. S. (1777(1780)). Memoire sur l’usage du calcul aux differences

partielles dans la theorie des suites. Memoires de l’Academie Royale des

Sciences de Paris. Œuvres, 9, pp. 313-335.

Laplace P. S. (1779). Memoire sur l’usage du calcul aux differences partielles

dans la theorie des suites. Memoires de l’academie Royale des Sciences

de Paris. Œuvres 10, pp. 1-89.

Legendre A.-M. (1798). Essai sur la theorie des nombres. Chez Duprat

Libraire, Paris.

281

Livio M. (2003). La sezione aurea. Rizzoli, Milano. Traduzione italiana di

S. Galli.

Lorentzen L.; Waadeland H. (1992). Continued fractions with applications.

North-Holland, Amsterdam -London - New York - Tokio.

Loria G. (1923). Da Descartes e Fermat a Monge e Lagrange. Contributo

alla storia della geometria analitica. Reale Accademia dei Lincei. Atti.

Memorie della classe di scienze matematiche fisiche e naturali (5), 14,

777–485.

Loria G. (1938). Charles Sturm et son œuvre mathematique (1803-1855).

L’Enseignement mathematique, 37, 249–274.

Loria G. (1950). Storia Delle Matematiche. Hoepli, Milano. Ristampa

anastatica, Istituto Editoriale Cisalpino-Goliardica, Milano, 1982.

Maclaurin C. (1748). Treatise of algebra. A. Millar and J. Nourse, London.

Maieru L. (2007). John Wallis. Una vita per un progetto. Rubbettino,

Soveria Mannelli.

Mignosi G. (1925). Teorema di Sturm e sue estensioni. Rendiconti del

Circolo Matematico di Palermo, 49, 1–164. Un lungo articolo di carattere

parzialmente storico sugli sviluppi del teorema di Sturm.

Mignotte M.; Stefanescu D. (1999). Polynomials. An Algorithmic Approach.

Springer, Singapore, Berlin, ecc.

Mugler C. (1958). Dictionnaire historique de la terminologie geometrique

des grecs. Librairie C. Klincksieck, Paris.

Murnaghan F. D. (1931). A simple derivation of Waring’s formulae. The

American mathematical monthly, 38, 219–222.

Nash S. G. (1996). A History of scientific Computing. Addison – Wesley,

Reading, Massachusetts.

282

Newton I. (1964). The Mathematical Works of Isaac Newton, edited by D.

T. Whiteside, volume 1. Johnson Reprint Corporation, New York and

London.

Newton I. (1967-1981). The Mathematical Papers of Isaac Newton, edited

by D. T. Whiteside. Cambridge University Press, Cambridge.

Olds C. D. (1968). Frazioni continue. Zanichelli, Bologna. Traduzione

italiana a cura di F. Speranza.

Otte M.; Panza M., (A cura di) (1997). Analysis and Synthesis in

Mathematics. History and Philosophy, Dordrecht, Boston, London.

Kluwer.

Panza M. (1997). Classical Sources for the Concepts of Analysis and

Synthesis. In [Otte e Panza, 1997].

Panza M. (2005). Newton et les origines de l’analyse: 1664-1666.

Blanchard, Paris.

Pappus (1982). La Collection mathematique, avec une Introduction et

des notes par Paul Ver Eecke. Nouveau tirage, Librairie scientifique et

technique Albert Blanchard, Paris.

Petsinis T. (1997). The French mathematician. Walker and Company, New

York.

Peyre G. (2004). L’algebre discrete de la transformee de Fourier. Ellipses,

Paris.

Pirandello L. (1937–38). Novelle per un anno. Mondadori, Milano. In 2

volumi. Comprende tutti i volumi dell’edizione Bemporad-Mondadori.

Pirandello L. (1993). La mosca. Mondadori, Milano. A cura di Simona

Costa.

Prasolov V. V. (2004). Polynomials. Springer, Berlin, etc. Translated from

the Russian by Dimitry Leites.

283

Prestini E. (2004). Applied Harmonic Analysis. Birkhauser, Boston, Basel,

Berlin.

Proclo (1978). Commento al I libro degli Elementi di Euclide. Giardini

Editori e Stampatori, Pisa. A cura di M. Timpanaro Cardini.

Radloff I. (2002). Evariste Galois: principles and applications. Historia

Mathematica, 29, 114–137.

Riordan J. (1968). Combinatorial identities. New York.

Rockett A. M.; Szus P. (1992). Continued Fractions. World Scientific,

Singapore, ecc.

Rothman T. (1982). Genius and biographers: the fictionalization of Evariste

Galois. American Mathematical Monthly, 89, 84–106.

Rotman J. (1998). Galois Theory. Springer-Verlag, New York, ecc. Second

edition.

Scharlau W., (A cura di) (1981). Richard Dedekind 1831-1981. Eine

Wurdigung zu seinem 150. Geburtstag, Braunschweig. F. Vieweg und

Sohn.

Scimone A. (1997). La sezione aurea. Sigma edizioni, Palermo.

Serfati M. (2005). La revolution symbolique. La constitution de l’ecriture

symbolique mathematique. Petra, Paris.

Serret J.-A. (1877). Cours d’algebre superieure, volume 1. Gauthier-Villars,

Paris. Quatrieme edition. Editions Jacques Gabay, 1992.

Serret J.-A. (1879). Cours d’algebre superieure, volume 2. Gauthier-Villars,

Paris. Quatrieme edition. Editions Jacques Gabay, 1992.

Sinaceur H. (1991). Corps et modeles. Vrin, Paris.

Stillwell J. (2002). Mathematics and its History. Springer, New York, etc.

284

Sturm C. (1835). Memoire sur la resolution des equations numeriques.

Memoires presentes par divers savans a l’Academie royale des Sciences

de l’Institut de France, VI, 273–318.

Tignol J.-P. (2001). Galois’ Theory of algebraic Equations. World Scientific,

River Edge, NJ.

Toti Rigatelli L. (1996). Evariste Galois. Birkhauser Verlag, Basel.

Translated from the Italian by John Denton.

Tukey J. W. (1984). The Collected Works of John W. Tukey. Volume

II: Time Series, 1965-1984. Wadsworth Advanced books & Software,

Monterey, California.

Unguru S. (1975). On the Need to rewrite the History of Greek

Mathematics. Archive for history of exact sciences, 15, 67–114.

van der Waerden B. L. (1930). Moderne Algebra, volume 1. Springer, Berlin.

van der Waerden B. L. (1931). Moderne Algebra, volume 2. Springer, Berlin.

van der Waerden B. L. (1972–73). Die Galois-Theorie von Heinrich Weber

bis Emil Artin. Archive for history of exact sciences, 9, 240–248.

van der Waerden B. L. (1991). Algebra. Springer-Verlag, New York, ecc.

English translation by F. Blum and R. Schulenberger.

Walker J. S. (1991). Fast Fourier Transforms. CRC Press, Boca Raton etc.

Waring E. (1770). Meditationes algebraicae. J. Archdeacon, Cambridge.

Waring E. (1991). Meditationes algebricae. American Mathematical Society,

Providence, Rhode Island. English translation by D. Weeks.

Weber H. (1895). Lehrbuch der Algebra. F. Vieweg und Sohn, Braunschweig.

Erster Band.

Weil A. (2002). Storia della matematica: perche e come. Collana LI-

DIM del Dipartimento di Matematica dell’Universita di Milano, 4, 1–30.

Introduzione e traduzione italiana a cura di M. Galuzzi.

285

Whiteside D. T. (1961). Newton’s Discovery of the General Binomial

Theorem. The mathematical Gazette, 16, 175–180.

Wilf H. S. (1994). Generatingfunctionology. Academic Press, Inc., Boston,

ecc.

Zeuthen H. G. (1886). Die Lehre von den Kegelschnitten in Altertum. Andr.

Fred. Host & Sohn, Kopenhagen.

Zhmud L. (2006). The Origin of the History of Science in Classical Anti-

quity. Walter de Gruyter, Berlin/New York. Translated from the Russian

by A. Chernoglazov.

286

Date post:	09-Nov-2018
Category:	Documents
Upload:	vantram
View:	213 times
Download:	0 times

Materiali per un corso di Storia della Matematica · scartes solo il precursore della moderna...

Documents