Materiali per un corso diStoria della Matematica
(versione preliminare)
M. Galuzzi
8 giugno 2010
1
2
Indice
1 Introduzione 7
1.1 Cosa l’insegnamento della storia della matematica non e . . 7
1.2 Storia e bellezza della matematica . . . . . . . . . . . . . . . 10
1.3 Il linguaggio da utilizzare . . . . . . . . . . . . . . . . . . . . 12
1.4 Chi non amava la matematica . . . . . . . . . . . . . . . . . 14
1.5 La ‘distanza’ dall’insegnamento . . . . . . . . . . . . . . . . 16
2 Qualche considerazione preliminare sulla matematica greca 19
2.1 Le caratteristiche di una teoria matematica: gli Elementi di
Euclide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Dimostrare seguendo un percorso rigoroso . . . . . . . . . . 22
2.3 Esporre solo la sintesi, non l’analisi . . . . . . . . . . . . . . 23
2.4 Ancora sul metodo dell’analisi . . . . . . . . . . . . . . . . . 26
2.5 L’algebra e la matematica greca . . . . . . . . . . . . . . . . 29
2.6 Occorre evitare l’anacronismo . . . . . . . . . . . . . . . . . 31
2.7 Ma non bisogna enfatizzare le differenze . . . . . . . . . . . 33
2.8 La tangente ad una curva nell’antichita: Apollonio . . . . . . 34
2.9 Un cenno al calcolo del volume della sfera di Archimede . . . 35
3 Il metodo geometrico e le Collezioni di Pappo 39
3.1 L’inserzione di due medie proporzionali: intersezione di coniche 41
3.2 La νεÜσις: l’inserzione di due medie proporzionali . . . . . . 42
3.3 La νεÜσις: la trisezione dell’angolo . . . . . . . . . . . . . . 45
4 La soluzione dell’equazione di terzo e quarto grado 47
4.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3
4.2 La formula risolutiva dell’equazione di terzo grado . . . . . . 49
4.3 Descartes e l’equazione di quarto grado . . . . . . . . . . . . 54
4.4 Un cenno all’analisi di Lagrange delle soluzioni dell’equazione
di terzo e quarto grado . . . . . . . . . . . . . . . . . . . . . 57
4.5 Lagrange e il Teorema dell’elemento primitivo . . . . . . . . 64
5 Il teorema sui polinomi simmetrici 71
5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 La regola di Newton per le somme di potenze delle radici . . 73
5.3 La dimostrazione di Maclaurin della regola di Newton . . . . 74
5.4 La dimostrazione di Lagrange della regola di Newton . . . . 78
5.5 La prima dimostrazione del teorema: Waring . . . . . . . . . 80
5.6 La dimostrazione di Gauss . . . . . . . . . . . . . . . . . . . 82
5.7 La dimostrazione di Cauchy . . . . . . . . . . . . . . . . . . 87
6 Verso il calcolo differenziale 91
6.1 Il metodo per le tangenti di Descartes . . . . . . . . . . . . . 92
6.2 La risposta di Fermat . . . . . . . . . . . . . . . . . . . . . . 96
6.3 Le difficolta da superare (viste a posteriori) . . . . . . . . . . 99
6.4 Let Newton be. . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7 Il De Analysi di Newton 105
7.1 Le regole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
7.2 Le applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.3 Applicazione ad altri problemi dello stesso genere . . . . . . 113
8 La serie di Lagrange 117
8.1 Serie e serie formali . . . . . . . . . . . . . . . . . . . . . . . 117
8.2 La prima formulazione . . . . . . . . . . . . . . . . . . . . . 119
8.3 La formulazione nella Theorie des fonctions analytiques . . . 128
8.4 La dimostrazione di Laplace . . . . . . . . . . . . . . . . . . 131
8.5 Qualche applicazione alla combinatoria . . . . . . . . . . . . 133
9 Frazioni continue 137
9.1 Radici quadrate: algoritmi . . . . . . . . . . . . . . . . . . . 138
4
9.2 Principali proprieta . . . . . . . . . . . . . . . . . . . . . . . 141
9.3 Il metodo di Lagrange . . . . . . . . . . . . . . . . . . . . . 151
9.4 Il teorema di Galois . . . . . . . . . . . . . . . . . . . . . . . 158
9.5 Appendice: sulle possibili fonti per la memoria di Galois sulle
frazioni continue . . . . . . . . . . . . . . . . . . . . . . . . 166
10 Il teorema di Sturm 173
10.1 La memoria di Cauchy del 1815 . . . . . . . . . . . . . . . . 173
10.2 Il teorema di Sturm . . . . . . . . . . . . . . . . . . . . . . . 181
10.3 Osservazioni complementari . . . . . . . . . . . . . . . . . . 186
10.4 Un risultato piu generale . . . . . . . . . . . . . . . . . . . . 189
11 Galois e l’origine dell’algebra moderna 191
11.1 Una breve introduzione sul concetto di gruppo di Galois . . 192
11.2 Un lemma preliminare . . . . . . . . . . . . . . . . . . . . . 194
11.3 La risolvente di Galois . . . . . . . . . . . . . . . . . . . . . 195
11.4 Il gruppo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
11.5 Il teorema fondamentale . . . . . . . . . . . . . . . . . . . . 200
11.6 Esempi di calcolo del gruppo di Galois . . . . . . . . . . . . 203
11.7 Generalizzazione del concetto di risolvente . . . . . . . . . . 209
11.8 Gli esempi di Galois . . . . . . . . . . . . . . . . . . . . . . 210
11.9 La dimostrazione di Artin relativa al primo esempio di Galois 214
11.10La Proposizione II della Memoria di Galois . . . . . . . . . . 216
11.11La Proposizione III della Memoria di Galois . . . . . . . . . 222
11.12La risolubilita per radicali . . . . . . . . . . . . . . . . . . . 223
11.13L’esempio dell’equazione di quarto grado . . . . . . . . . . . 227
11.14Il Teorema di Abel . . . . . . . . . . . . . . . . . . . . . . . 228
12 Da Galois a Artin 231
12.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
12.2 Estensione di morfismi . . . . . . . . . . . . . . . . . . . . . 232
12.3 L’uso dei caratteri . . . . . . . . . . . . . . . . . . . . . . . . 235
12.4 Un’applicazione importante del Teorema 13 . . . . . . . . . 238
12.5 La sezione H della Galoissche Theorie di Artin . . . . . . . . 242
12.6 La teoria di Artin e le estensioni semplici. . . . . . . . . . . 252
5
13 La Trasformata Rapida di Fourier 257
13.1 Qualche premessa sulla serie di Fourier . . . . . . . . . . . . 258
13.2 La divisione fra polinomi . . . . . . . . . . . . . . . . . . . . 261
13.3 Verso la scrittura di un programma . . . . . . . . . . . . . . 266
13.4 Conclusione . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
13.5 Appendice: alcuni programmi . . . . . . . . . . . . . . . . . 268
Bibliografia 273
6
Capitolo 1
Introduzione
I contenuti di questo capitolo sono stati utilizzati come introduzione ad un
corso di storia della matematica per gli studenti della Scuola di Specializza-
zione (Silsis). Il lettore ideale era dunque il futuro insegnante. Ma mi sem-
bra che molte considerazioni abbiano un interesse che trascende l’obiettivo
dell’insegnamento e che dunque possano essere utili anche al di fuori di
questo contesto.
1.1 Cosa l’insegnamento della storia della
matematica non e
Seguendo un modulo espositivo caro a Benedetto Croce,1 si puo cominciare
con il dire che cosa l’insegnamento della storia della matematica non e (o
non deve essere).
1Si veda, ad esempio [Croce, 1976]. Molte delle considerazioni che seguono si trovano,
sia pure in altra forma, nella mia Premessa a [Weil, 2002]. Ma si consiglia vivamente la
lettura del testo stesso di Andre Weil.
7
Questo insegnamento2 non puo ridursi all’uso di un manuale, per quanto
ben fatto questo possa essere. Un manuale contiene (in genere) utili infor-
mazioni: gli Elementi3 di Euclide sono composti di tredici libri. Di essi
sei sono dedicati alla geometria piana. Il teorema di Pitagora e dimostrato
nella proposizione I.47,. . .
Tuttavia, gia quando affermiamo il ‘dato di fatto’ che Euclide non uti-
lizza il quinto postulato4 per le prime ventotto proposizioni del primo libro,
e doveroso accompagnare questo dato di fatto con una interpretazione. Ad
esempio:
• Euclide gia presagisce la possibilita di una geometria non euclidea e
con le prime ventotto proposizioni si spinge innanzi in questa direzio-
ne.
• Per semplici motivi di eleganza formale, preferisce dimostrare alcune
istanze piu deboli di certe proposizioni (ad esempio la I.16, che afferma
che un angolo esterno di un triangolo e maggiore di ciascuno degli
angoli interni ad esso opposti.5
• Non possiamo argomentare in modo plausibile a partire da un te-
sto che ha subito numerose modifiche nel corso di piu di venti seco-
2Le considerazioni che seguono si rivolgono all’insegnamento della storia in generale
ma valgono,– mi sembra,– a maggior ragione, se vengono riferite ad una pratica di questo
insegnamento intercalato, per cosı dire, nell’insegnamento, a varı livelli, della matematica
stessa.3Un’ottima traduzione italiana e [Euclide, 1970], ristampata recentemente.4E utile rammentare che la formulazione euclidea di questo postulato e: “Se una
retta venendo a cadere su due rette forma gli angoli interni da una stessa parte minori
di due angoli retti, le due rette, prolungate indefinitamente, si incontreranno dalla parte
in cui i due angoli sono minori dei due angoli retti.” La formulazione che si incontra in
molti libri moderni (spesso attribuita ad Euclide) e quella di Playfair (in realta, come
dice esplicitamente lo stesso Playfair nella sua edizione degli Elementi, la fomulazione e
di Proclo): “Data una retta ed un punto esterno esiste una ed una sola parallela per il
punto alla retta data”. Si tratta di una formulazione nella quale si mescolano esistenza
ed unicita.5Questa proposizione e un ovvio corollario del teorema sulla somma degli angoli
interni. Per la sua dimostrazione richiede la possibilita di raddoppiare un segmento
arbitrario.
8
li. Puo darsi che gli Elementi riflettano una ‘sedimentazione’ delle
proposizioni che non rifletta, se non in modo impreciso, la volonta
euclidea.
Poiche la trasmissione reale del sapere non puo che consistere nel comu-
nicare cio che e un nostro sicuro possesso, e chiaro che dobbiamo formare
una nostra precisa opinione. Il che non puo avvenire senza un confronto
con il testo euclideo.6
Ancor piu evidente e necessario diventa un confronto personale con il
testo se si vuol suggerire un significato generale agli Elementi. Essi culmi-
nano con il tredicesimo libro, ossia con l’analisi dei poliedri regolari,– i solidi
platonici,– e riflettono con cio un evidente interesse per l’indagine platoni-
ca sulla natura delle idee matematiche o manifestano un evidente influsso
aristotelico nella loro architettura logica?
Da secoli questo problema viene discusso, ed una qualsiasi ragionevole
esposizione del contenuto degli Elementi non puo prescindere da una precisa
valutazione della loro natura.
Ovviamente, non c’e ragione per la quale la nostra opinione su una que-
stione matematica non venga a coincidere in fine, del tutto od in parte,
con quella dell’autore di un buon manuale. Ma e cosa radicalmente di-
versa accettare passivamente l’opinione di Kline, o di Boyer o di Zeuthen,
dall’esprimere un consenso fondato su una conoscenza dei testi che essi stessi
hanno considerato.
Si puo essere partecipi dell’opinione di Gino Loria, che vedeva in De-
scartes solo il precursore della moderna geometria analitica, ancora assai
lontano dalla sua reale natura.7 O si puo sostenere un’interpretazione radi-
calmente contraria (che e quella di chi scrive8). Ma, in ogni caso, sara assai
poco significativo consentire con l’uno o l’altro giudizio senza un preciso
riscontro con il testo cartesiano.
6Ed ancora, dietro la ovvieta di questa osservazione, si cela una scelta: potremo
accontentarci di una traduzione in una lingua moderna del testo di Euclide o dovremo
confrontarci con il testo greco? E quanto profonda deve essere la conoscenza di questa
lingua? Un’utile lettura e comunque [Mugler, 1958].7Si veda [Loria, 1923].8Si veda [Galuzzi, 2002].
9
Quanto diversa efficacia possa avere la presentazione della geometria
analitica accompagnata da informazioni storiche che siano un reale possesso
del docente, piuttosto che la banale ripetizione dell’opinione di Loria, o
dell’opinione contrapposta, e troppo evidente perche si debba soffermarsi
su questo punto.
1.2 Storia e bellezza della matematica
E certamente desiderabile che molti amino la matematica, la sua razionalita,
la sua bellezza. Ma cosı come non tutti amano la poesia o la musica,–
od un certo genere di musica o di poesia,– allo stesso modo non e giusto
pretendere che tutti partecipino dello stesso ardore intellettuale di fronte
alla matematica.
Si consideri una delle prime ‘scoperte’ dei pitagorici. Si guardi la figura
seguente
∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ .
∗ ∗ . .
Essa esibisce in modo ‘visivo’ il fatto che la somma di numeri dispari
successivi fornisce i quadrati.9
1+ 3 = 4, 1+ 3+ 5 = 9, 1+ 3+ 5+ 7 = 16, . . .
E l’immagine grafica e (forse) ben piu convincente della identita
m2 + 2m+ 1 = (m+ 1)2.
Tuttavia, anche una comprensione piena e profonda di questa proprieta
dei numeri interi, non necessariamente suscita il desiderio di scoprire altre
proprieta della stessa natura. La fascinazione della teoria dei numeri, la
regina della matematica, puo non agire per tutti allo stesso modo. E chi
9Molte proprieta ‘visive’ dei numeri interi (e molto altro) si trova nell’affascinante
volume [Conway e Guy, 1999].
10
non subisce questo fascino provera una noia variamente graduata a sentir
narrare di Pitagora e dei suoi adepti.
Se e giusto e necessario che tutti i cittadini raggiungano il (modesto) li-
vello di conoscenze matematiche necessarie per la vita pratica, se e auspica-
bile che tutti giungano a possedere quegli strumenti di razionalita minimale
che consentano poi di esprimere le proprie scelte politiche in modo consape-
vole, non ne segue come corollario che tutti debbano amare la matematica
in pari misura.
Chi ama la musica, e per cio desidera avvicinarsi alla pratica musicale,
per esempio imparando a suonare uno strumento, sa che per raggiungere
il fine desiderato, avra bisogno di una certa tecnica: scale, scale per terza,
scale cromatiche. . .
Eseguire una scala cromatica non e molto gratificante. Ma, sino ad ora,
almeno, non e pratica diffusa far precedere, o far seguire, questo esercizio
da informazioni sulla storia della musica che abbiano il fine di renderlo piu
attraente. E se e vero che nel periodo del predominio della tonalita, l’uso
di cromatismi (soprattutto discendenti) serviva a comunicare un senso di
smarrimento e di incertezza (come spesso accade nelle arie di Mozart) e
ancor piu vero che e la conoscenza tecnica che favorisce la comprensione
storica e non viceversa.
Chi ha provato piacere nel giungere alla soluzione di un problema geome-
trico mediante l’uso di riga e compasso, provera del pari piacere nell’appren-
dere che ogni problema geometrico, trattato algebricamente, e ancora riso-
lubile con gli stessi strumenti se la sua soluzione dipende solamente dalla
successiva soluzione di equazioni di secondo grado.
Ma il complesso di manipolazioni algebriche che consentono di ricondur-
re la soluzione di alcuni tipi di equazioni di grado superiore al secondo alla
successiva risoluzione di equazioni di secondo grado di per se puo non essere
molto attraente.
In generale, puo apparire piuttosto tedioso cio che puo essere acquisito
solo con un certo numero di ripetizioni di una pratica ‘manipolativa’.10 Si
10Questo pero non significa certo accettare questa pratica in modo acritico. Non
riesco per esempio a comprendere perche non possa sostituirsi alla trattazione separata
delle equazioni biquadratiche e reciproche l’osservazione che il cambiamento di variabili
11
tratta tuttavia dell’equivalente della tecnica musicale. E non c’e musica
senza tecnica. Ed e improprio e fuorviante che qui la storia debba avervi al-
tro ruolo di quello di un eventuale possibile espediente, da usare, comunque,
con cautela.
1.3 Il linguaggio da utilizzare
E piuttosto evidente che, anche quando compiamo ogni sforzo per descrive-
re un’acquisizione matematica nel linguaggio del tempo nel quale e avvenu-
ta, in realta possiamo solo avvicinarci a questo linguaggio attraverso una
mediazione.
Se, utilizzando la scrittura di Viete, consideriamo l’‘equazione’
B in E adæquabitur C in E bis+ Eq, (1.1)
per esprimere cio che in termini moderni scriveremmo (E indica l’incognita)
bx = 2cx+ x2, (1.2)
possiamo compiere ogni sforzo ragionevole per ‘allontanare’ la (1.1) dal-
la (1.2), ma non c’e alcun modo per rimuovere il nostro patrimonio di
conoscenze attuale per immaginare di seguire le argomentazioni di Viete
esattamente come uno studioso della fine del Cinquecento.11
Di cio occorre essere consapevoli, e questa consapevolezza implica un
confronto serrato e preciso con i testi. Si consideri la soluzione abituale
dell’equazione di secondo grado per ‘completamento del quadrato’. Abbia-
mo, per passi successivi:
ax2 + bx+ c = 0. (1.3)
x← 1−y1+y
muta un’equazione reciproca in un’equazione avente solo termini di grado pari
e viceversa.11Non conosco miglior descrizione (satirica) dell’ingenuita dello storico che presume
di ‘calarsi nell’epoca di cui tratta’ del racconto “Pierre Menard autore del Chisciotte” in
[Borges, 1978].
12
Raccogliendo
a
(x2 +
b
ax+
c
a
)= 0. (1.4)
Ponendo
b
a= p,
c
a= q, (1.5)
abbiamo
x2 + px+ q = 0. (1.6)
Ora possiamo procedere, dapprima riscrivendo:
x2 + 2p
2x+ q = 0, (1.7)
e poi, aggiungendo e togliendo una stessa quantita,
x2 + 2p
2x+
p2
4+ q−
p2
4= 0. (1.8)
Quindi
(x+
p
2
)2+ q−
p2
4= 0. (1.9)
Di qui si ottiene, portando a secondo membro e quadrando, la formula
risolutiva abituale.
Questo modo di soluzione era noto, si dice, ancor prima di Euclide.
Tuttavia soltanto alla fine del Cinquecento si ha un linguaggio algebrico
di forza sufficiente per descrivere le manipolazioni eseguite.
La scelta di presentare la soluzione moderna dell’equazione di secondo
grado sembra inevitabile. Ci si puo chiedere ora se, accanto a questa pre-
sentazione sia utile aggiungere qualche informazione storica. Ora se questa
informazione e molto generale e si limita a dire che i babilonesi ancor prima
dei greci conoscevano la soluzione, non e di grande profitto. Ne lo diviene
13
con l’aggiunta di varı orpelli retorici. Se diviene piu specifica, esaminan-
do, per esempio, la soluzione data nel libro secondo degli Elementi ad un
problema la cui formulazione puo essere formulata come la ricerca delle so-
luzioni di un’equazione di secondo grado, la mediazione della quale parlavo
all’inizio di questa sezione, va posta in modo corretto.
Possiamo, e vero, solo avvicinarci al linguaggio di Euclide, ma lo sforzo
per questo avvicinamento va compiuto, per evitare che il risultato euclideo
appaia banale.
1.4 Chi non amava la matematica
Benedetto Croce, certamente un grande intellettuale, con pari certezza non
amava la matematica:
La matematica, in quanto matematica, non conosce, ma stabili-
sce formule di eguaglianza; non serve a conoscere, ma a contare
e a calcolare il gia conosciuto.
Per contare e calcolare, la matematica ha bisogno di formole, e,
per stabilire queste, di certi principi supremi, che si chiamano, a
volta a volta, definizioni, assiomi e postulati. Cosı l’aritmetica
ha bisogno della serie numerica la quale, movendo dall’unita, si
ottiene aggiungendo sempre un’unita al numero precedente.12
Dall’osservazione che ogni numero intero si ottiene dall’unita con un
procedere uniforme (1, 1+ 1, 1+ 1+ 1, . . . ) Croce traeva la conclusione che
tutti i numeri sono fondamentalmente uguali. O meglio, che le loro diversita
non possono occupare seriamente i nostri pensieri.
Certamente Benedetto Croce era in grado di cogliere la differenza tra
numeri primi e composti e di visualizzare geometricamente questa differen-
za.
12Cfr. [Croce, 1909, p. 253].
14
Un numero primo, non puo avere una rappresentazione bidimensionale
come quella di un numero non primo. Abbiamo, ad esempio
12 = 3× 4 =∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗
Un numero primo non puo che rappresentarsi su una linea:
7 = ∗ ∗ ∗ ∗ ∗ ∗ ∗
Qual e il valore concettuale di questa differenza? Qual e il valore concet-
tuale della esistenza di infiniti numeri primi? Assai modesto per Benedetto
Croce.
Per un matematico invece i numeri esibiscono qualita, differenze, strut-
ture che solo una profonda analisi concettuale puo cogliere.
Due numeri, come 23 e 29, sarebbero del tutto uguali, secondo Croce.
Ma essi sono profondamente diversi per un matematico! Perche possiamo
scrivere
29 = 25+ 4,
ossia 29 e somma di quadrati, mentre, come e facile verificare, non puo
accadere la stessa cosa per 23. In generale, un numero dispari della forma
4n+ 3 non puo essere somma di quadrati.
Ma quali numeri sono somma di quadrati e quali non lo sono? La rispo-
sta e tutt’altro che facile13 e mette in gioco la necessita di analisi profonde
della struttura dei numeri interi che vanno ben al di la dello stanco ripetersi
dell’aggiunta dell’unita.
Benedetto Croce giudicava il complesso di ricerche come queste, un gioco
futile. In generale pensava che la matematica avesse, nelle sue parti piu
elementari, come in quelle piu avanzate, solo un’utilita pratica.
Non possiamo rimproverarlo per questo. Possiamo invece addebitargli
a colpa grave l’aver edificato un sistema filosofico che ha teorizzato co-
13Sia n un intero positivo, e poniamo n = b2c. Allora n si puo scrivere come somma
di due quadrati se e solo se nessun numero primo della forma 4k + 3 divide c. Si veda
[Goldman, 2002, p. 164].
15
me un valore fondamentale del pensiero cio che era solo una sua persona-
le valutazione, creando (assieme a Gentile) la mostruosita filosofica delle
pseudo-scienze.
Ma possiamo ricavarne la lezione che intelligenza e sottovalutazione
della matematica possono coesistere e che non e certo compito della sto-
ria della matematica eliminare questa sottovalutazione, che corrisponde ad
una sorta di predisposizione individuale. Occorre sempre rammentare che
l’intelligenza non ha un’unica forma.
1.5 La ‘distanza’ dall’insegnamento
Abbiamo sin qui concluso che si puo non amare la matematica senza per
questo dover essere giudicati privi di capacita intellettive.14 Abbiamo illu-
strato il punto di vista secondo il quale l’uso della storia non va inteso come
un modo accattivante e giocoso per rendere attraente una disciplina che, se
attrae, attrae di per se. Abbiamo chiarito che un eventuale uso della storia
nella didattica deve avvenire mediante un confronto con i testi. Rimane
un ultimo punto: ammesso che la conoscenza storica sia, per il docente,
un potente stimolo per una didattica personale e profonda, e possa essere
per lo studente un modo di penetrare ancora piu a fondo nella conoscenza
della disciplina, quanto ‘vicina’ deve essere la conoscenza storica alla pratica
didattica?
Quali testi occorre conoscere per insegnare la geometria elementare?
Gli Elementi? Le Grundlagen di Hilbert? Le ricerche di Emil Artin sul
problema della coordinatizzazione?
A prima vista sembra evidente che la scelta debba cadere su cio che e
piu vicino alla pratica didattica. . . O su cio che l’uso ha consacrato.
Tuttavia una riflessione piu attenta mostra che le connessioni possono
essere meno evidenti.
14Ma credo d’aver chiarito che non amare la matematica non implica che si debba
esibire con stupido compiacimento la propria incapacita di comprenderla. Ne soprattutto
che si debba poi lasciare intendere che il fastidio per la sua (presunta) banalita sia la
necessaria premessa per cogliere i piu alti valori dello spirito.
16
Si supponga d’avere il problema di dover insegnare l’ortografia e la sin-
tassi italiana. Quali conoscenze occorre possedere e quali testi della nostra
letteratura occorre aver letto?
Non sembra che Pirandello sia tra i primi autori che occorra considera-
re.15 Ma si considerino queste frasi, tratte in ordine sparso, dalle novelle
Padron Dio e La casa dell’agonia della raccolta Una giornata:
Sdrajato per terra, s’immergeva in quel silenzio [. . . ]
Se questo fosse finalmente sopravvenuto, lui ne avrebbe provato
dispiacere [. . . ]
Sul rettangolo azzurro della finestra spiccava un vaso di geranii
rossi [. . . ]
Pirandello era un profondo conoscitore della lingua italiana.16 Aveva
anche scritto importanti contributi teorici sulla lingua. Sceglie ‘lui’ e ‘lei’
come soggetto perche giudica ‘egli’ ed ‘ella’ forme troppo letterarie. Prefe-
risce che la ‘i’ intervocalica si trasformi in ‘j’. Preferisce ‘geranii’ a ‘geranı’
od a ‘gerani’.
L’importanza che le sue Novelle per un anno hanno avuta,- e conti-
nueranno ad avere,- nella cultura italiana dimostra con chiara evidenza
l’importanza di una scelta linguistica che ponga la lingua letteraria a breve
distanza dal parlare comune. Le scelte di ‘j’ ed ‘ii’ non hanno invece avuto
largo seguito.
Non dobbiamo trarne la conclusione che ci vuole molta cautela nel pro-
porre degli usi grammaticali che allontanino dalla lingua parlata (egli, ella)?
O che, simmetricamente, e difficile introdurre cio che la pratica della lingua
corrente va semplificando (la j intervocalica, la doppia i)?
15Naturalmente non intendo qui esprimere un parere autorevole sulla lingua italiana.
Intendo invece sottolineare il fatto che, accanto ai riferimenti consueti ai ‘padri’ della
lingua, Petrarca, Dante, Manzoni, ecc. si trovano anche altri autori ai quali e utile e
stimolante riferirsi. Anche se Pirandello era un profondo conoscitore della lingua italiana
(si veda, per esempio, l’Appendice di Simona Costa a [Pirandello, 1993]) il riferimento a
Pirandello non e tra i piu diffusi nell’insegnamento della sintassi italiana.16Si veda la nota 15.
17
Andrea Camilleri, nella Nota Mani avanti, apposta al romanzo Il corso
delle cose, spiega le ragioni del suo ‘linguaggio’ personale. Le sue scelte
linguistiche si riconnettono idealmente alle ragioni che spingevano Piran-
dello (autore per altro che gli e estremamente familiare) a prediligere ‘lui’ e
‘lei’. E va anche oltre trasponendo termini dalla parlata siciliana che stanno
divenendo familiari a molti lettori.17
Quanto la lettura di Pirandello, od anche di Camilleri, puo essere di
profitto a chi vuole ‘insegnare’ l’uso corretto della lingua italiana? La ri-
sposta mi pare ovvia. Come e ovvio che la lettura d’un testo da riconnettersi
immediatamente alla pratica didattica quotidiana non sia il modo migliore
per conferire a questa pratica sostanza e dignita.18
17Si veda la premessa al Glossario posta in appendice di [Camilleri, 2000].18Ovviamente non e in discussione il mutare della lingua sul lungo periodo (il latino e
le lingue romanze. . . ). Ne, in generale, il mutare della lingua anche su periodi piu brevi
(San Paolo non usa piu l’ottativo nella lingua greca; il passato remoto tende a sparire
dall’uso corrente della lingua italiana . . . ). Cio che voglio sottolineare e come in uno
stesso periodo, quando le strutture essenziali sembrano ben codificate, la lettura degli
autori puo offrire prospettive assai ricche.
18
Capitolo 2
Qualche considerazionepreliminare sulla matematicagreca
Come il titolo indica, non pretendo in questo capitolo di esporre, e neppure
di abbozzare, una storia della matematica greca. Mi limito a delinearne
alcuni aspetti, che avranno particolare importanza nel ‘recupero’ della ma-
tematica greca a partire dal Rinascimento, senza pretendere, neppure in
questo caso, di esaurire l’argomento. Su alcuni aspetti passo molto rapi-
damente, poiche si tratta di cose ben note.1 Mi soffermo invece su alcune
particolarita alle quali si da abitualmente meno rilievo.
L’idea del ‘miracolo greco’ e un po’ invecchiata.2 Tuttavia nella nostra
cultura alcuni caratteri fondamentali della scienza greca, e in particolare
1Si veda per esempio [Kline, 1991, vol. 1, capitoli III-VIII]. In questa prima stesura
la bibliografia e ridotta al minimo.2Un esempio di questo tipo di considerazione per la scienza greca si trova nella storia
della matematica, per altri aspetti notevole, di Loria [1950]. La difficolta ad accogliere
strutture dimostrative diverse rispetto all’ideale greco spiega anche le difficolta ed il
ritardo con le quali valutiamo le opere matematiche di altre civilta. Si veda, ad esempio,
[Chemla e Shuchun, 2004].
19
della matematica greca, continuano ad avere un ruolo rilevante. Alcuni di
questi caratteri che abbiamo ereditato dai greci, infatti, sono ancora presenti
(e operativi), spesso anche in modo inconsapevole, nel nostro modo di agire
all’interno di una teoria scientifica o nelle applicazioni della teoria stessa.
2.1 Le caratteristiche di una teoria
matematica: gli Elementi di Euclide
Ancora oggi la struttura degli Elementi di Euclide si pone come modello
per esporre una teoria scientifica: assiomi, postulati, teoremi, corollari ecc.
formano oggetto dell’insegnamento della geometria che viene impartito nella
scuola secondaria superiore e viene assunto come il modo stesso di fare
matematica.3 In questo insegnamento si sottolinea non tanto (o non solo)
il valore dei risultati, quanto la valenza strutturale. Non sempre pero ci si
sofferma a riflettere adeguatamente su alcune caratteristiche.
La separazione tra aritmetica e geometria, tramatematica ‘teorica’ e ‘pratica’
I libri VII-X degli Elementi contengono cio che si potrebbe definire l’inizio
della teoria dei numeri: numeri primi, proprieta dei numeri primi, il celebre
‘algoritmo di Euclide’, ecc. Ma questa aritmetica non ha alcuna valenza
pratica. Sono riflessioni, anche profonde, sulla struttura dei numeri: pari,
dispari, primi, quadrati, soluzioni di equazioni di secondo grado o biquadra-
tiche a coefficienti interi (per esprimerci in termini moderni...) Non vi sono
calcoli numerici e i numeri compaiono sempre in forma simbolica (aggregati
arbitrari di unita indicati con una lettera maiuscola). Ecco l’esempio di un
enunciato, che chiarisce questo aspetto:
Teorema 2.1 (VII.21) I numeri primi tra loro sono i piu piccoli tra quelli
che hanno lo stesso rapporto.
3L’algebra elementare, la trigonometria, il calcolo differenziale che sono anch’essi, in
varia misura, oggetti di insegnamento nella scuola secondaria superiore, sono presenta-
ti invece, per lo piu, in modo pratico-operativo. I valori teoretici vengono demandati
all’insegnamento geometrico.
20
I numeri dei quali si considera il rapporto sono indicati con A, B. Euclide
procede per assurdo4 e introduce due numeri C, D piu piccoli dei precedenti
e che abbiano lo stesso rapporto. Quindi “C misura A tante volte quante D
misura B”, ecc. Tutto procede in modo simbolico. Non viene offerto alcun
esempio numerico.
Nei libri I-VI dedicati alla geometria piana e nei libri XI-XIII dedicati
alla geometria solida non compare alcuna valenza numerica, alcuna misura.
Accanto alla aritmetica ed alla geometria per i greci sussistono la logi-
stica e la geometria pratica, come discipline separate, ed anche, in un certo
senso ‘inferiori’.5
Naturalmente negli Elementi si trovano anche dimostrate uguaglianze
di figure (noi diremmo oggi dell’estensione di figure). Ma vediamo su un
esempio come si dimostrano queste uguaglianze.
Teorema 2.2 (I.35) I parallelogrammi che sono sulla stessa base e tra le
stesse parallele sono uguali tra loro.
Figura 2.1: La Proposizione I.35 degli Elementi
Per ipotesi AD = EF, e quindi AE = DF. Dalla definizione di paralle-
logrammo, si ha che AB = CD,EB = FC. I triangoli ABE, DCF sono
uguali. Se si toglie da entrambi il triangolo DGE si ha che i quadrilateri
ABGD, FCGE sono uguali. Aggiungendo ad entrambi il triangolo BCG si
ottiene l’asserto. 2
4La predilezione greca per le dimostrazioni per assurdo meriterebbe un’ampia
trattazione. . .5La separazione che ancor oggi spesso si opera tra ‘matematica’ e ‘matematica
applicata’, con implicito un giudizio di valore, risente, forse, di questa antica tradizione.
21
Osservazione 2.1 Naturalmente questo tipo di argomentazione, per de-
composizione/sovrapposizione individuando parti uguali non e sempre pos-
sibile. Il metodo di esaustione (che vedremo) e assai piu sosfisticato. Si
noti tuttavia la completa assenza di dati numerici o comunque di calcoli.
2.2 Dimostrare seguendo un percorso
rigoroso
Consideriamo la I.5 degli Elementi: “Gli angoli alla base di un triangolo
isoscele sono uguali”. Euclide dispone a questo punto solo del primo criterio
di uguaglianza: se due triangoli hanno uguali due lati e l’angolo compreso
sono uguali. Ecco la dimostrazione della I.5:
Figura 2.2: La Proposizione I.5 degli Elementi
AB si prolunga sino a D e AC sino ad E in modo che sia BD = CE. I
triangoli ADC e AEB sono uguali, per il primo criterio. Quindi CD = BE
e ADC = AEB. Allora anche i triangoli BDC e CEB sono uguali. Quindi
DBC = ECB. Allora anche gli angoli supplementari CBA e BCA sono
uguali. 2
22
Osservazione 2.2 La dimostrazione puo anche ottenersi, in modo assai
piu intuitivo con la bisettrice o con la mediana, o con l’altezza. Ma Euclide
a questo punto non ne ha ancora dimostrato l’esistenza. Euclide segue que-
sto percorso dimostrativo per mostrare come questo teorema richieda una
quantita minima di presupposti.6
2.3 Esporre solo la sintesi, non l’analisi
Nella I.1, Euclide dimostra l’esistenza di un triangolo equilatero, fornendone
una costruzione.
Figura 2.3: La Proposizione I.1 d’Euclide
L’idea dimostrativa e molto semplice. Ma da dove viene?
Supponiamo il problema risolto. Se immaginiamo che il triangolo equilatero
esista, sia ABC, sara CB = AB. E quindi C sta sul cerchio di raggio AB con
centro in B. Ancora CA = AB, e quindi C sta anche sul cerchio di centro
6Analoga osservazione si puo fare per la I.17: “In ogni triangolo la somma di due agoli
e sempre minore di due retti”. La dimostrazione non richiede il postulato delle parallele.
Da questo postulato, usato pero successivamente, il risultato segue immediatamente.
Proclo (cf. [Friedlein, 1873, 250.20-251.2]. Un’ottima traduzione italiana e [Proclo,
1978].) riferisce in merito alla tradizione che attribuisce questo risultato a Talete. Il
carattere agonico della cultura greca potrebbe suggerire qui una sorta di ‘tour de force’
da parte di Euclide. Su questo aspetto della cultura greca si puo vedere preliminarmente
[Zhmud, 2006] (si pensi a Temistocle insonne per la gloria di Milziade, come riferisce
Plutarco).
23
A ed ugual raggio AB. Qui termina l’analisi, piuttosto evidente. Ora inizia
la sintesi : basta costruire questi due cerchi e si trova C.7 Euclide non
espone la analisi. Si puo immaginare che sia per la ragione che, in questo
caso, questa analisi e evidente. Ma Euclide non espone l’analisi neppure
quando questa e tutt’altro che evidente. La forma degli Elementi e sempre
rigorosamente sintetica.
Osservazione 2.3 Questa forma espositiva ha creato un modello, che ha
affascinato alcuni tra i piu illustri scienziati, tra i quali, come vedremo,
Newton. Mentre ha suscitato forti reazioni negative in altri, come Descar-
tes.
Un esempio meno evidente
Nella II.11, Euclide insegna a costruire la parte aurea di un segmento. Mi
limito ad indicare la costruzione ed a fornirne una demostrazione algebrica
(corrispondente alla costruzione di Euclide).
Figura 2.4: La parte aurea di un segmento
Si tratta di individuare sul segmento AB il punto H tale che AH2 =
AB × HB. Si considera il quadrato ABCD. Sia AB = a e sia E il punto
7I rilievi critici in merito all’esistenza della intersezione risalgono all’antichita.
Euclide assume quest’esistenza come un fatto evidente.
24
medio di AC. Allora EB = a√52. Se EF = EB come in figura, si ha
AF = a
√5
2−a
2.
Posto AH = AF si verifica facilmente che il segmento AH fornisce la
soluzione richiesta.8 2
Consideriamo ora la IV.10, che richiede una costruzione.
Teorema 2.3 (Prop. IV.10) Costruire un triangolo isoscele avente cia-
scuno dei due angoli alla base che sia il doppio dell’angolo rimanente.
Euclide da la costruzione e dimostra che quanto costruito e una soluzione.
Ma non espone l’analisi, che potrebbe essere la seguente.9
Figura 2.5: Il lato del decagono regolare
Sia ABD il triangolo isoscele richiesto, per il quale dunque ADB =
2CAD, e si tracci la bisettrice CD dell’angolo ADB. Dunque per ipotesi
CAD = CDA e quindi AC = CD. Ma, come si vede immediatamente,
DCB = ADB e, ancora per ipotesi ADB = ABD. Quindi DCB = DBC
e quindi DC = DB. Si osservi ora che BAD e BDC sono uguali e quindi
DB e tangente al cerchio per i punti A,C,D, e quindi AB × CB = BD2 =
CD2 = AC2. Se si suppone dato il segmento AB, dalla II.11, segue che il
8In termini algebrici: posto AH = x, l’equazione che individua H e x2 = a(a− x), la
quale ha una sola radice positiva data appunto da x = a√52
− a2.
9Questa analisi e esposta da Heath, nel suo commento alla Proposizione. Si veda
[Euclid, 1956, vol. 2, pp. 99-100].
25
punto C e dato. Ma anche il cerchio di centro A e raggio AB e dato. Poiche
BD = AC anche il punto D e dato. Si tratta ora semplicemente di eseguire
la costruzione. 2
2.4 Ancora sul metodo dell’analisi
Un esempio interessante, assai piu elaborato, di analisi e data dalla Propo-
sizione IV.4 delle Collezioni di Pappo.10
Figura 2.6: Una proposizione di Pappo. 1
Con riferimento alla Figura 2.6, si tratta di dimostrare questo: P e un
punto sul prolungamento del diametro BC del cerchio ABC di centro O. PA
e tangente al cerchio. H e un punto diametralmente opposto ad A e PQR
e una secante arbitraria che interseca il cerchio in Q e R. I segmenti HQ,
HR intersecano il diametro in M, N. Cio posto, O risulta essere il punto
medio del segmento MN.
La dimostrazione di Pappo, e stata descritta come un modello del meto-
do dell’analisi da Hintikka e Remes [1974, Capitolo 3] e procede interamente
per via geometrica. In cio che segue tengo conto naturalmente sia del testo
di Pappo che della loro analisi.11
10Cf. [Pappus, 1982, pp. 140-142].11I principali testi greci contenti riflessioni sull’analisi e la sintesi sono considerati in
[Panza, 1997].
26
Supponiamo dunque che O sia il punto medi di MN e si tracci la retta
RS parallela aMN, e sia T il punto di intersezione di RS con AH. Allora T
e il punto medio del segmento RS (se e solo O e punto medio di MN).
Figura 2.7: Una proposizione di Pappo. 2
Si tracci ora il segmento di perpendicolare OU da O sulla retta PQ e si
congiunga U con T .
Figura 2.8: Una proposizione di Pappo. 3
Evidentemente QU = UR e dunque UT ∥ SQ. Ne segue che RUT =
UQS = RQH = RAH = RAT e quindi i punti A,U, T, R sono conciclici.
27
Figura 2.9: Una proposizione di Pappo. 4
Abbiamo allora AUR = ATR (sono angoli che insistono entrambi sull’arco
AR). Ma ATR = AOP (per il parallelismo di TR e OP) e quindi anche
AUR = AUP = AOP. Dall’analisi segue quindi che anche i punti A,U,O, P
sono su uno stesso cerchio.
Figura 2.10: Una proposizione di Pappo. 5
Ma questo e vero perche UOP,AOP sono due triangoli rettangoli aventi
la stessa ipotenusa OP. Nel processo deduttivo ogni passo e invertibile, e
quindi dalla proprieta vera evidenziata come conclusione si puo retrocedere
verso l’enunciato iniziale. Ecco in dettaglio in cosa consistono gli elementi
la dimostrativi.12
12Riproduco molto semplificata l’analisi di Hintikka e Remes.
28
a) Vengono tracciate delle linee ausiliarie (utilizzando il parallelismo e la
perpendicolarita) che determinano altri punti (RS, EN, N, T);
b) si applica Elementi, VI.2;
c) si applica Elementi, III.3;
d) si applica la Elementi, III.21;
e) si applica la reciproca di Elementi, III.21;
f) si applica Elementi, III.20.
Si noti che in questa dimostrazione tutti i passi sono invertibili. Ma questo
rappresenta in genere piu un ideale dimostrativo che il vero procedere delle
dimostrazioni matematiche.
2.5 L’algebra e la matematica greca
Il problema della ‘algebra geometrica’ e stato oggetto di un ampio dibattito
negli ultimi anni. Alcune proposizioni degli Elementi, in particolare quelle
del libro II, sembrano suggerire in modo naturale un’interpretazione alge-
brica, anche se la loro dimostrazione e rigorosamente geometrica. Inoltre
l’uso di queste stesse proposizioni in contesti piu elaborati (ad esempio nelle
Coniche di Apollonio) non sembra dissimile da quello che si effettua con le
usuali manipolazioni algebriche. Si e anche avanzata l’ipotesi che i greci
avessero un’algebra che, per qualche ragione, hanno preferito tenere nasco-
sta (forse considerando l’algebra come una sorta di analisi: uno strumento
di indagine, ma non uno strumento espositivo). Piu cautamente, Zeuthen
ha suggerito che, accostando al libro secondo degli Elementi una rilettu-
ra algebrica, molti testi matematici greci assai piu elaborati e complessi,
divengono piu trasparenti. Siamo cosı in grado di coglierne piu sempli-
cemente la ‘struttura’. L’anacronismo e un pericolo evidente...Ma d’altro
canto, il rifiuto di ogni supporto algebrico rende la comprensione di questi
testi accessibile solo a pochi specialisti.13
13Una fiera opposizione all’uso dell’algebra per leggere i testi greci si trova in [Unguru,
1975]. Si tratta di un articolo che ha originato un’aspra polemica. Per valutare lo ‘stato
29
Ecco un esempio. La II.7: se C e un punto arbitrario del segmento
AB, il quadrato su AB e quello su BC sono uguali a due volte il rettangolo
AB× BC e il quadrato di CA. In termini piu accessibili:
AB2 + BC2 = 2AB× BC+AC2.
Posto AB = a,AC = x si ha (per sempio: si possono anche scegliere le
indeterminate in altro modo)
a2 + (a− x)2 = 2a(a− x) + x2. (2.1)
La trascrizione algebrica elimina la necessita della dimostrazione. Essa dun-
que non puo corrispondere all’idea di Euclide. Diversa cosa e pero, una
volta compiuta la dimostrazione, associarvi la formulazione algebrica (2.1)
per avere un modo facile per ricordarla e riutilizzarla.
Un esempio di applicazione ‘algebrico’
La II.13 degli Elementi esprime la proprieta che in molti manuali viene
descritta come ‘teorema di Carnot’ (nel caso particolare dell’angolo acuto).
dell’arte’ attuale (soprattutto dal punto di vista di Unguru) si puo vedere [Christianidis,
2004].
30
Con riferimento alla figura (ove AD ⊥ BC e B < π2) si tratta di
dimostrare (in termini moderni. . . ) che
AC2 = CB2 +AB2 − 2CB× BD. (2.2)
Dalla II.8 si ha che CB2 + BD2 = 2BC × BD + CD2. Si aggiunge AD2 da
ambo le parti:
CB2 + BD2 +AD2 = 2BC× BD+ CD2 +AD2.
Ma dalla I.47 (teorema di Pitagora) si ha che BD2 +AD2 = AB2 e CD2 +
AD2 = AC2. Sostituendo, si ha CB2 + AB2 = 2BC × BD + AC2. Traspo-
nendo il termine 2BC× BD si ottiene la (2.2).
Osservazione 2.4 Si noti che la II.8 viene utilizzata senza alcuna figura
ausiliria, come una identita da utilizzarsi all’interno di una dimostrazione.14
2.6 Occorre evitare l’anacronismo
La celebre dimostrazione dell’irrazionalita del rapporto tra la diagonale ed
il lato di un quadrato, alla quale Aristotele fa allusione, dovrebbe essere non
molto dissimile da quella esposta da Alessandro d’Afrodisia.15 La riformulo
con un minimo di strumenti algebrici.
14Tuttavia l’uso che ho fatto di notazioni semi-algebriche diverse da quelle degli
Elementi influisce non poco sul carattere della dimostrazione . . .15Cf. la nota di Vitrac: [Euclide, 2001, vol. 3, pp. 411-417]. Si vedano anche [Knorr,
1975; Stillwell, 2002].
31
Sia dato il quadrato ABCD. Il quadrato costruito sulla sua diagonale
BDB ′D ′ e evidentemente doppio del quadrato ABCD. Sia mn
il rapporto
tra la diagonale BD ed il lato AB, con m e n privi di divisori comuni. Si
ha allora
m2 = 2n2. (2.3)
Ne consegue che m deve essere pari. Sia dunque m = 2h. Sostituendo nella
(2.3) si ha
4h2 = 2n2, ossia 2h2 = n2. (2.4)
Anche n deve essere pari. La contraddizione si puo rimuovere solo esclu-
dendo che il rapporto tra BD e AB sia espresso da una frazione come mn.
2
A partire da quest’idea si puo facilmente mostrare che ogni x ∈ N che
non sia un quadrato e tale che√x non e un numero razionale.
Sia mn= x e consideriamo le scomposizioni in fattori primi di m, n e x.
Sia m = pα1
1 pα2
2 · · ·pαi
i , n = qβ1
1 qβ2
2 · · ·qβj
j , x = rγ11 rγ22 · · · rγkk . Dove almeno
uno degli esponenti γ (ad esempio γ1) deve essere dispari. Da m2 = xn2
otteniamo
p2α1
1 p2α2
2 · · ·p2αi
i = rγ11 rγ22 · · · rγkk · q2β1
1 q2β2
2 · · ·q2βj
j . (2.5)
Nel membro a destra della (2.5) r1 compare con un esponente dispari, mentre
nel membro a sinistra deve comparire con un esponente pari. Ancora una
volta abbiamo un assurdo.
Per attribuire compiutamente questa dimostrazione alla matematica gre-
ca dobbiamo pero pensare che gia in essa sia stata dimostrata la unicita della
32
decomposizione di ogni intero in fattori primi. Un anacronismo evidente.
Questo risultato sara dimostrato solo molti secoli dopo da Gauss [1801].16
2.7 Ma non bisogna enfatizzare le differenze
Si consideri la celebre proposizione IX.20:
Teorema 2.4 (Prop. IX.20) I numeri primi sono piu numerosi di ogni
moltitudine di numeri primi proposta.
Ecco la dimostrazione di Euclide. I numeri primi proposti siano solamente
A,B,C. Si consideri il prodotto ABC (“il piu piccolo numero misurato
da A,B,C”) e si aggiunga l’unita. Sia N = ABC + 1. Se N e primo
abbiamo i numeri primi A,B,C,N piu numerosi dei precedenti. Se N non
e primo sara misurato da un numero primo G. Non e possibile che G
sia uno dei primi proposti A,B,C. Se infatti lo fosse dovrebbe dividere
contemporaneamente il prodotto ABC e il numero N e quindi anche la
differenza N − ABC = 1. Ma questo e impossibile. Allora abbiamo i
numeri primi A,B,C,G in numero maggiore di A,B,C. 2
Il linguaggio di Euclide e certo diverso da quello di oggi. Ma sembra
difficile negare che qui vi sia una ‘idea’ formulata una volta per tutte.
La proposizione riformulata con p1, p2, . . . pn e N = p1 · p2 · · ·pn +
1, non sembra divenire molto diversa. Naturalmente questo non significa
voler trascurare il vantaggio di un simbolismo adeguato. In questo caso un
simbolismo piu elaborato sembra ininfluente.
16Nel Teeteto di Platone (147d -148b) si trova pero un’argomentazione che, assumendo
implicitamente l’unicita della decomposizione, corrisponde alla stessa idea. Nella VII.30
e VII.31 degli Elementi si trovano gli strumenti per dimostrare l’esistenza e l’unicita della
decomposizione. Ma di fatto il risultato non e formulato.
33
2.8 La tangente ad una curva nell’antichita:
Apollonio
Le Coniche17 di Apollonio meriterebbero uno studio approfondito, soprat-
tutto per non ridurre ogni considerazione sulla matematica greca ai ‘fonda-
menti’, come se i matematici greci non avessero altro scopo nel loro operare
che porre su salde basi risultati assai semplici.
Un altro grande autore che puo allontanarci definitivamente da que-
st’idea e Archimede, del quale vedremoun risultato nella prossima sezione.
Ecco ora come Apollonio nella I.33 caratterizza la tangente alla parabola.
Figura 2.11: La tangente alla parabola
Con riferimento alla Figura 2.11 sia VX un diametro della parabola e
siano VX e XY l’ascissa e l’ordinata di uno dei suoi punti. Se la retta TY e
tale che VT = VX allora questa retta e tangente alla parabola.18
Supponiamo per assurdo che la retta TY prolungata tagli Y ′X ′ in Z.
Dalla proprieta definitoria della parabola, abbiamo
VX : VX ′ = XY2 : X ′Y ′2.
17Per il testo dei primi quattro libri si puo utilizzare la traduzione francese [Apollo-
nius, 1923]. I libri IV-VII sono disponibili in inglese [Apollonius, 1990]. E in corso di
elaborazione una nuova fondamentale edizione. Per ora si ha solo [Apollonius, 2008a],
[Apollonius, 2008b]. Il testo di Commandino si trova anche in rete. Testi introduttivi
molto importanti sono [Heath, 1896] e soprattutto [Zeuthen, 1886].18Cf. [Apollonius, 1923, pp. 60-61].
34
Dalla similitudine dei triagoli TXY, TX ′Z si ha anche
TX2 : TX ′2 = XY2 : X ′Z2.
Poiche X ′Z < X ′Y ′, abbiamo
VX
VX ′ <TX2
TX ′2 .
Per proseguire l’argomentazione con piu chiarezza utilizzo il simbolismo
algebrico, anche se, naturalmente, questi simboli non si trovano in Apol-
lonio. Questa ‘traduzione’ non altera (a mio giudizio) in modo essenziale
l’argomento.19 Sia VX = x, VX ′ = y. Allora TX = 2x e TX ′ = x+ y. Si ha:
x
y<
4x2
(x+ y)2
ossia
(x+ y)2 < 4xy
e di conseguenza
(x− y)2 < 0.
Abbiamo trovato una conseguenza assurda. E facile notare che il concetto
di tangente utilizzato da Apollonio e lo stesso di quello utilizzato da Euclide
(nel libro III).20
2.9 Un cenno al calcolo del volume della
sfera di Archimede
Concludo questo capitolo con un breve cenno ad un risultato di Archimede:
il calcolo del volume della sfera. Il testo di Archimede al quale faccio riferi-
19Per una fiera opposizione a questo atteggiamento disinvolto si puo vedere [Fried e
Unguru, 2001].20Ecco quanto afferma Lagrange: “Suivant les anciens geometres, une ligne droite est
tangente d’une courbe, lorsque ayant un point commune avec la courbe, on ne peut mener
par ce point aucune droite entre elle et la courbe. ([Lagrange, 1847, p. 167])”. L’idea di
considerare una tangente come una secante che abbia i punti di intersezione coincidenti
e attribuita da Lagrange a una fase ben successiva, quando: “ . . . par l’application de
l’algebre a la geometrie, les courbes ont ete soumises a l’analyse (ibid.)”.
35
mento e la famosa Lettera ad Eratostene21 e precisamente la Proposizione
2. Procedo in modo molto libero, utilizzando strumenti algebrici.
Consideriamo la figura seguente.
Figura 2.12: Archimede ed il volume della sfera
Nella figura 2.12 sono rappresentate le sezioni di una sfera, di un cilindro
e di un cono. . . Archimede naturalmente non fa uso di strumenti algebrici,
ma l’originalita del suo procedimento e tale da non venire modificata se
anche ci concediamo questa licenza.
Poniamo AX = x e AB = AH = 2r. L’area del cerchio di raggio XY
(sezione del cono) e V = πx2. L’area del cerchio di raggio XZ (sezione della
sfera) e S = πx(2r− x). L’area della sezione del cilindro e C = π4r2. Si ha
allora:
V + S = 2πrx,V + SC
=x
2r. (2.6)
21Si veda [Archimede, 1974, pp. 556-610].
36
Immaginiamo una bilancia con il fulcro in A e i due bracci AX e AH.
Dalla 2.6, abbiamo
Cx = 2(V + S)r. (2.7)
Possiamo ‘bilanciare’ il peso di 2(V + S) posto in H con il peso di C posto
in X. Allora, immaginando di bilanciare tutte le infinite sezioni della sfera:
Vol(V) + Vol(S) = Vol(C)2
Ma Vol(V) = 13V(C) e quindi
Vol(S) = 1
6Vol(C).
Evidentemente Vol(C) = 8πr3, e quindi Vol(S) = 43πr3 il celeberrimo
risultato di Archimede.
37
Capitolo 3
Il metodo geometrico e leCollezioni di Pappo
Anche se sono proprio le opere della matematica greca, in particolare gli
Elementi, che si presentano ai nostri occhi con i caratteri di una teoria scien-
tifica compiuta, le discussioni in merito al carattere ed alla struttura di una
teoria scientifica nella cultura greca non sono opera dei matematici. Esse
sono patrimonio dei filosofi, in primis di Platone ed Aristotele. Vi e dunque
una ‘filosofia della matematica’ all’interno della quale si danno riflessioni
anche profonde e tecnicamente aggiornate. Tuttavia il carattere ‘esterno’
di questa discussione non consente di dirimere questioni importanti. In che
misura, per esempio, gli Elementi corrispondano ai dettami degli Analitici
Secondi di Aristotele o si inquadrino all’interno della filosofia platonica e,
da sempre, oggetto di discussione.
E solo nella tarda antichita con Pappo (attivo intorno al 320) che si da
una riflessione sul metodo matematico e sulla struttura della disciplina per
opera di un matematico.1
1Un testo che puo considerarsi di filosofia della matematica, ma fortemente connes-
so alla disciplina e dato dal Commento al primo libro degli Elementi del filosofo neo-
platonico Proclo (412-485) (si veda la nota 6). Questo testo ha avuto molta importanza
39
Il testo di Pappo, tradotto dal Commandino in latino nell’era moderna
(1589) ha suscitato un grande interesse tra i piu grandi matematici del Sei-
cento fornendo loro lo spunto per profonde riflessioni sul metodo da impiega-
re nelle dimostrazioni matematiche e nella loro esposizione; sugli strumenti
dimostrativi leciti; sul giusto rapporto da istituire con la matematica clas-
sica e con l’algebra, disciplina originariamente inventata dagli arabi e poi
profondamente trasformata nel Rinascimento italiano e, a fine Cinquecento,
ulteriormente potenziata da Francois Viete e dalla sua scuola.2
Agli algebristi italiani del Rinascimento si debbono le formule risolutive
per l’equazione di terzo e quarto grado: formule tuttavia che, in alcuni casi3
utilizzavano in maniera ‘spregiudicata’ nuove entita numeriche, i numeri
complessi.
Due dei problemi classici dell’antichita, la duplicazione del cubo4 e la
trisezione dell’angolo, formulati in termini algebrici, conducono ad equazioni
di terzo grado. Gia nell’antichita si presagiva il fatto che questi problemi
non fossero risolubili con riga e compasso (anche se una dimostrazione non
era possibile con gli strumenti disponibili) e si erano proposte soluzioni
mediante il potenziamento della struttura deduttiva degli Elementi, con
tecniche che vedremo in dettaglio (intersezione di coniche o l’inserzione).
Molte di queste soluzioni sono presentate nelle Collezioni di Pappo. Si
comprende bene quindi come il confronto tra quanto esposto da Pappo e le
dimostrazioni algebriche dovesse costituire un tema di ricerca del piu grande
interesse. Di qui l’importanza di questo autore nel recupero seicentesco. Per
nel dibattito sulla natura della matematica (De certitudine mathematicarum) suscitato
dal Piccolomini tra Cinquecento e Seicento. E un dibattito, tuttavia, che riguarda piu
la natura delle verita matematiche in rapporto alle verita filosofiche che la matematica
in quanto tale. Si discute amapiamente, ad esempio sulla ‘demonstratio potissima’.
Si puo vedere [De Pace, 1993], [Freguglia, 1999] e l’Introduzione di L. Maieru a
[Barozzi, 1586].2Sull’origine dell’algebra si puo vedere l’Introduzione di R. Rashed a [Al-Khwarizmı,
2007].3Nel caso di un’equazione di terzo grado avente tre radici reali, la formula di Cardano
contiene delle quantita complesse e le soluzioni reali si ottengono come somma di numeri
complessi coniugati. Un metodo risolutivo che, in assenza di una idea precisa sulla natura
dei numeri complessi non poteva che destare gravi interrogativi.4Piu in generale l’inserzione di due medie proporzionali tra due quantita date.
40
questa ragione qui di seguito si da un cenno di alcuni dei contenuti delle
Collezioni.
3.1 L’inserzione di due medie
proporzionali: intersezione di coniche
Ecco l’inizio del Libro III delle Collezioni di Pappo, dove accanto ai proble-
mi piani (risolubili con riga e compasso) viene presentata l’esistenza di altri
problemi (pur in assenza di un criterio dimostrativo che delimiti le classi:
di fatto certi problemi erano stati risolti con altri mezzi piu potenti.5
Gli Antichi hanno distinto i problemi geometrici in tre generi: i
problemi piani, i problemi solidi ed i problemi lineari [. . . ] Re-
sta il terzo genere di problemi detti lineari perche oltre alle linee
gia dette [rette, circonferenze e coniche] ne ammettono altre per
la loro costruzione delle quali l’origine e piu varia e comples-
sa, come [le spirali], le quadratrici, le concoidi e le cissoidi che
possiedono proprieta numerose e stupefacenti.6
Un tipo importante di problema solido e dato dalla inserzione di due
medie proporzionali tra due grandezze date.
Problema 3.1 Dati due segmenti a, b si debbono determinare due segmen-
ti x e y, tali che
a : x = x : y = y : b. (3.1)
Utilizando liberamente gli strumenti algebrici, la (3.1) si puo riscrivere come{ay = x2
bx = y2(3.2)
di modo che una prima soluzione puo consistere nel determinare il punto di
intersezione di due parabole.
5Per molti degli argomenti trattati in questo capitolo un utile riferimento e dato da
[Bos, 2001]. Si veda anche il mio saggio-recensione di questo testo [Galuzzi, 2001b].6Cf. [Pappus, 1982, vol. 1, p. 21].
41
Si dice che Menecmo abbia trovato questa soluzione la quale, per essere
giudicata soddisfacente, richiede di ammettere che si possano tracciare due
sezioni coniche (cosı come si puo fare per i cerchi). O, alternativamente,
che il punto P abbia in se qualche particolarita in piu di quella di essere
l’intersezione di due parabole.7
Ovviamente, dalla (3.2) abbiamo, eliminando y, x3 = a2b, sicche per
noi e evidente che il segmento OP ′ non puo essere determinato, in generale,
con riga e compasso. In particolare, per a = 1, b = 2 si ha l’equazione
irriducibile x3 − 2 = 0 corrispondente alla duplicazione del cubo.8
3.2 La νεÜσις: l’inserzione di due medie
proporzionali
Una costruzione ideata per superare il vincolo imposto (probabilmente)
dall’uso della riga e del compasso e la νεÜσις, l’inclinazione. Nel caso piu
semplice si tratta di accettare come lecita questa costruzione.
7In effetti le parabole sono in posizione particolare. A priori si potrebbe immaginare
che questa particolarita abbia un ruolo essenziale. . .8Per assurdo, se x3−2 = 0 fosse riducibile, dovrebbe essere x3−2 = (x−a)(x2+px+q)
e quindi dovrebbe esistere un numero razionale mn
tale che m3 = 2n3, e si puo procedere
in modo simile a quanto visto per√2.
42
Figura 3.1: L’inclinazione
Sono date due semirette a, b aventi l’origine O in comune. Sono dati
anche un segmento HK (in lunghezza) ed un punto P non appartenente
alle semirette (si veda la Figura 3.3). Si richiede di poter ‘inclinare’ una
semiretta per P in modo che le intersezioniH ′, K ′ con a, b diano un segmento
di lunghezza uguale a quella di HK.
La possibilita di disporre di questa costruzione consente di risolvere il
problema di inserire due segmenti medi proporzionali tra due segmenti dati.
Ecco la soluzione di Erone.9
9Cf. [Pappus, 1982, vol. 1, pp. 45-47].
43
Figura 3.2: La soluzione di Erone
Iniziamo con l’illustrare la figura. Nel rettangolo ABCD, si ha
BC = AD = a,AB = DC = b.
L e il punto medio di AB ed E e il punto medio di BC. Il punto H e
l’intersezione di DL e CB. Sulla perpendicolare EZ a BC si determina Z in
modo che sia CZ = AL.
TracciataHZ, sia CT parallela aHZ. Ecco ora ove interviene l’inclinazione:
ZK deve essere tracciata in modo che sia TK = AL.
Vediamo ora, on l’aiuto di un po’ di algebra, come procede la dimostra-
zione.10 Sia BC = a,AB = b,AM = x,CK = y. Abbiamo allora:
EK2 = (a+ y)y+a2
4,
EZ2 =b2
4−a2
4,
KZ2 = EK2 + EZ2 = (a+ y)y+b2
4,
HK = 2a+ y,
HK : CK = KZ : ZT ⇒ HK2 : CK2 = KZ2 : TK2.10Questa riscrittura algebrica non altera (ma e la mia opinione) la struttura
dimostrativa. La dimostrazione originale si trova nelle pagine citate nella Nota 9.
44
Quindi, sostituendo, si ottiene:
(2a+ y)2 : y2 =
[(a+ y)y+
b2
4
]:b2
4. (3.3)
Dalla (3.3), semplificando ed eliminando il fattore a+y si ottiene ab2 = y3
e quindi, dalla similitudine dei triangoli ACK, MAD si ottiene x3 = a2b.
3.3 La νεÜσις: la trisezione dell’angolo
Utilizzando questa costruzione e possibile anche effettuare la trisezione
dell’angolo. Vediamo dapprima il contenuto della Proposizione 31 del quar-
to libro delle Collezioni che collega l’inserzione all’intersezione di coniche.11
Figura 3.3: Un altro uso dell’inclinazione
ABCD e un rettangolo dato. E anche dato in lunghezza un segmento
(di lunghezza c). Dal vertice A si vuol condurre una semiretta in modo che
detto F il punto nel quale questa semiretta incontra il prolungamento di BC
dalla parte di C ed E l’intersezione di AF con il lato DC sia EF un segmento
di lunghezza assegnata.
Si immagini il problema risolto e sia DH uguale ad EF e parallelo a
questo segmento. Se il punto F e dato, anche H e dato e viceversa. Si noti
11Cf. [Pappus, 1982, vol. 1, pp. 210-211]. In realta si utilizza una conica ed un
cerchio: una differenza poco sensibile per noi, ma essenziale per i greci ed ancora nel
Seicento.
45
che H sta su un cerchio di raggio assegnato, poiche EF e dato in grandezza
(EF = c). Dalla I.43 degli Elementi si ha ABCD = AKLM, e dunque
BC×AB = KL× LM. Ma KL = BF e LM = FH. Quindi
BC×AB = BF× FH.
Il punto H appartiene allora ad un’iperbole (equilatera) di asintoti BC e AB.
Il punto H e determinato dall’intersezione di quest’iperbole con il cerchio
di centro D e raggio c. Qui termina l’analisi di Pappo. Nella sintesi viene
affermato che il punto G si trova sull’intersezione delle due curve.
Vediamo ora, con la Proposizione 32, come si possa trisecare un angolo.12
Figura 3.4: La trisezione dell’angolo
Sia ACB l’angolo dato e si conduca dal punto A di un suo lato la per-
pendicolare AB sull’altro lato. Si completi il rettangolo ABCD come nella
Figura 3.4. Si operi ora un’inclinazione: dal vertice C si tracci una semi-
retta in modo che il segmento FG della Figura 3.4 sia doppio del segmento
CA. Sia H il punto medio di FG.
I triangoli AGH e CHA sono evidentemente isosceli. Di conseguenza,
essendo AHC = 2AGH, si ha ACH = 2AGH. Poiche AG e parallela a BC,
si ha AGH = FCB Quindi FCB = 13ACB. 2
12Ibid., pp. 212-213.
46
Capitolo 4
La soluzione dell’equazione diterzo e quarto grado
4.1 Premessa
In questo capitolo presento la soluzione dell’equazione di terzo grado in ter-
mini moderni. La ragione sta nel fatto che per leggere i testi matematici
del Cinquecento, occorre un’adeguata preparazione filologica (non solo ma-
tematica) che non puo essere raggiunta in breve tempo. E, per comprendere
cio che segue, e importante impadronirsi della soluzione di quest’equazione.
Per mostrare le difficolta di una presentazione fedele ai testi, mi limito
ad un esempio tratto da Bombelli, un algebrista del tardo Cinquecento,
relativo all’equazione di secondo grado:
Quando si haveranno potenze e Tanti eguali a numero ci sono
due modi. Il primo e questo. Partasi ogni cosa per la quantita
delle potenze, poi si piglia la meta delli Tanti e si quadra ed il
produtto si aggionge al numero e della somma se ne piglia il lato
47
e di detto lato se ne cava la meta delli Tanti, e quello che restara
sara la valuta del Tanto.1
Bombelli stesso da un esempio
12︸︷︷︸ + 6 1︸︷︷︸ eguale a 16
...piglisi il mezzo delli Tanti, ch’e 3, quadrisi fa 9, giongasi a 16
fa 25 e di questo se ne piglia il lato che e 5 e di esso se ne cava
il mezzo delli Tanti, resta 2, et 2 vale il Tanto (ibidem).
Per comprendere la regola mettiamo a confronto la scrittura di Bombelli
12︸︷︷︸ + 6 1︸︷︷︸ eguale a 16.
con quella moderna
x2 + 6x = 16
Ecco i passi da compiere:
6 −→ 6/2 = 3
32 −→ 9
9, 16 −→ 9+ 16 = 25
25 −→ √25 = 5
5, 3 −→ 5− 3 = 2.
Il confronto con la semplicita con la quale si ottiene oggi l’unica soluzione
positiva dovrebbe risultare convincente.
x2 + 2ax = b −→ x =√a2 + b− a.
La soluzione dell’equazione di quarto grado con il metodo di Descartes
che vedremo in seguito e invece sostanzialmente fedele al testo originale.
1Cf. [Bombelli, 1966, p. 190]
48
4.2 La formula risolutiva dell’equazione di
terzo grado
Consideriamo un’equazione di terzo grado, che immaginiamo gia ridotta
alla forma2
x3 + px+ q = 0. (4.1)
Poniamo x = u+ v. Ne segue
x3 = (u+ v)3 = u3 + v3 + 3uv(u+ v) =
= u3 + v3 + 3uv · x,
e dunque
x3 − 3uvx−(u3 + v3
)= 0. (4.2)
Se ora le quantita u, v verificano il sistema{u3 + v3 = −q
uv = −p
3
, (4.3)
x = u + v e una soluzione della (4.1). Possiamo dunque ottenere una
soluzione della (4.1) ricercando le eventuali soluzioni del sistema (4.3).
Poniamo
z1 = u3, z2 = v
3 (4.4)
e consideriamo il sistema associato: z1 + z2 = −q
z1 z2 = −p3
27
.
Le soluzioni di questo sistema sono le radici z1 e z2 dell’equazione
z2 + q z−p3
27= 0. (4.5)
Supponiamo di avere ricavato i due valori z1, z2 soluzioni della (4.5).
Sia oraU una qualsiasi radice cubica di z1, ed indichiamola conU = 3√z1.
2Si veda [Cauchy, 1821, pp. 354-364].
49
Dalla (4.3) ricaviamo in corrispondenza il valore V = −p
3 3√z1
e dunque
otteniamo una soluzione dell’equazione (4.1) della forma
U+ V = 3√z1 −
p
3 3√z1. (4.6)
Ma dalla relazione V = −p
3 3√z1
si trae
V3 = −p3
27z1
e dunque V3 = z2. Quindi anche V e una radice cubica di z2. Possiamo
dunque scrivere la formula risolutiva
3
√−q
2+
√q2
4+p3
27+
3
√−q
2−
√q2
4+p3
27(4.7)
La quale va interpretata opportunamente: bisogna tener conto del fatto che
le due radici cubiche debbono essere tali che il loro prodotto dia −p3
27.
Posto quindi ω = cos 2π3+ i sin 2π
3, tutte le radici cubiche di z1 sono
date da U,ωU,ω2U e, analogamente le radici cubiche di z2 sono date da
V,ωV,ω2 V. Se V e scelta in modo tale che UV = −p3
27, abbiamo, per le tre
radici dell’equazione, le espressioni:
x1 = U+ V,
x2 = ωU+ω2V,
x3 = ω2U+ωV.
Ne consegue che tutte le radici sono esprimibili nella forma (4.7), con le
convenzioni poste.
Esempio 4.1 Consideriamo l’equazione
z3 − z− 1 = 0,
50
dove p = −1, q = −1. L’equazione ha una sola radice reale (≃ 1.32471 . . . ).La formula risolutiva da
3
√1
2+
√1
4−1
27+
3
√1
2−
√1
4−1
27.
Eseguendo i calcoli si trova il valore della radice.
Ecco un secondo esempio
Esempio 4.2 Consideriamo l’equazione
z3 + z− 2 = 0,
che ha evidentemente la radice z=1. Abbiamo ora p = 1, q = −2. Dobbia-
mo estrarre la radice cubica di 1+ 29
√21 e di 1− 2
9
√21. Si ha(
1
2± 1
6
√21
)3= 1± 2
9
√21
Abbiamo allora, per la radice reale dell’equazione
1
2+1
6
√21+
1
2−1
6
√21 = 1.
Sia ω = cos 2π3
+i sin 2π3
= − 12+ 1
2i√3 . Allora ω2 =
(−12+ 1
2i√3)2
=
−12− 1
2i√3.
Abbiamo per le altre due radici
ωU+ω2V =
(−1
2+1
2i√3
)(1
2+1
6
√21
)+(
−1
2−1
2i√3
)(1
2−1
6
√21
)=
= −1
2+1
2i√7,
e
ω2U+ωV =
(−1
2−1
2i√3
)(1
2+1
6
√21
)+(
−1
2+1
2i√3
)(1
2−1
6
√21
)=
51
= −1
2−1
2i√7. �
Esaminiamo ora l’equazione (4.5), e supponiamo che il suo discriminante
∆ = q2 + 4p3
27
sia strettamente positivo. z1 e z2 sono allora due numeri reali distinti e
possiamo scegliere U e V come le radici cubiche reali di z1 e z2. Ne segue
che U+V e un numero reale; ma ωU+ω2V e ω2U+ωV sono sicuramente
numeri complessi, poiche si ha
ωU+ω2V =
(−1
2+1
2i√3
)U+
(−1
2−1
2i√3
)V =
−1
2(U+ V) +
1
2i√3 (U− V)
e
ω2U+ωV =
(−1
2−1
2i√3
)U+
(−1
2+1
2i√3
)V =
−1
2(U+ V) −
1
2i√3 (U− V)
Se invece ∆ = 0, abbiamo la radice 2U, e la radice doppia −U, come si
verifica facilmente.
Sia ora invece
∆ =q2
4+p3
27< 0
(il che impone, ovviamente, che p sia negativo).
Poniamo le due radici complesse (e coniugate) della (4.5) in forma tri-
gonometrica, ossia nella forma ρ (cos θ± i sin θ) . Ne segue che ρ2 = −p3
27.
Utilizzando la (4.6) possiamo scrivere le tre radici nella forma
ρ1/3(cos
θ
3+ i sin
θ
3
)3√1
−p
3
1
ρ1/3(cos θ
3+ i sin θ
3
)3√1=
52
ρ1/3(cos
θ
3+ i sin
θ
3
)3√1+
ρ2/31
ρ1/3(cos θ
3+ i sin θ
3
)3√1=
ρ1/3[(
cosθ
3+ i sin
θ
3
)3√1+
(cos
θ
3− i sin
θ
3
)13√1
].
Sostituendo a 3√1 i suoi tre valori
1, cos2π
3+ i sin
2π
3, cos
4π
3+ i sin
4π
3
otteniamo, per le radici i valori
2ρ1/3 cosθ
3, 2ρ1/3 cos
θ+ 2π
3, 2ρ1/3 cos
θ+ 4π
3.
Si osservi che i tre valori trovati sono tutti reali e tuttavia sono stati
trovati attraverso l’utilizzo dei numeri complessi. E il cosiddetto caso ir-
riducibile, per lungo tempo un argomento di disputa nella matematica a
partire dal Cinquecento.3
Esempio 4.3 Consideriamo l’equazione
x3 − 7x+ 6 = 0.
Ad essa dobbiamo associare l’equazione
z2 + 6z+343
27= 0,
la quale ha le radici −3± 109i√3. Si ha ora
ρ =7
9
√21,
3Poiche la realta di tutte le radici e data da −q2
4− p3
27> 0, si assume questa quantita
come discriminante della equazione di terzo grado. Questa scelta corrisponde alla defi-
nizione abituale del discriminante tramite il risultante tra il polinomio ed il polinomio
derivato. Sulla storia del caso irriducibile si puo vedere [Cossali, 1996].
53
e
cos θ =−379
√21
= −9
49
√21,
sin θ =109
√3
79
√21
=10
49
√7.
Questo implica θ3= π
3− 1
3arccos
(949
√21)
Dunque una prima soluzione e data da
23
√7
9
√21 cos
(π
3−1
3arccos
(9
49
√21
))= 2
e le altre soluzioni sono date da
23
√7
9
√21 cos
(π
3−1
3arccos
(9
49
√21
)+2π
3
)= −3,
23
√7
9
√21 cos
(π
3−1
3arccos
(9
49
√21
)+4π
3
)= 1.
4.3 Descartes e l’equazione di quarto grado
Nel terzo libro della Geometrie Descartes vuol dimostrare che un proble-
ma classico che conduce ad un’equazione di quarto grado irriducibile puo
tuttavia essere risolto con riga e compasso. Per far questo egli associa
all’equazione data una risolvente di terzo grado, utilizzando una radice del-
la quale le soluzioni dell’equazione originale si possono ottenere risolvendo
due equazioni di secondo grado.
Poiche la risolvente puo essere associata ad un’equazione qualsiasi, in
realta il procedimento di Descartes permette di ricondurre la soluzione di
un’equazione di quarto grado alla soluzione dell’equazione di terzo grado e
cosı e sempre stato interpretato (a partire da Newton), anche se l’intenzione
di Descartes era diversa.
Consideriamo un’equazione di quarto grado della forma
x4 + px2 + qx+ r = 0, (4.8)
54
e chiediamoci se sia possibile scrivere
x4 + px2 + qx+ r = (x2 + αx+ β)(x2 − αx+ γ).
Otteniamo il sistema: β+ γ = p+ α2
β− γ = −q
αβγ = r
Dalle prime due:
β =α3 + pα− q
2α, γ =
α3 + pα+ q
2α.
Tenendo conto dell’ultima:
α6 + 2pα4 + (p2 − 4r)α2 − q2 = 0. (4.9)
Abbiamo un’equazione di terzo grado in α2. Una soluzione di quest’equazione
consente di ottenere le soluzioni dell’equazione originale risolvendo due
equazioni di secondo grado.
In particolare, se immaginiamo che l’equazione (4.9) sia riducibile pos-
siamo ottenere α2 con al piu l’estrazione successiva di radicali quadratici e
questa proprieta si estende alle soluzioni di (4.8).
Descartes e il problema del quadrato
Supponiamo che il problema di inserzione considerato nella Sezione 3.3 si
riduca al caso particolare nel quale il rettangolo sia un quadrato.4
4Si veda [Descartes, 1954, pp. 180–192].
55
Figura 4.1: Il problema del quadrato
Sia a il lato del quadrato. Utilizzando il teorema di Pitagora, la pro-
porzionalita, e scegliendo l’incognita come in figura, si giunge rapidamente
all’equazione5
x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4 = 0. (4.10)
Se eliminiamo il termine in x3, sostituendo x con x+ a2, si ha
x4 +
(1
2a2 − c2
)x2 − (a3 + ac2)x+
5
16a4 −
1
4a2c2 = 0. (4.11)
Descartes ha da considerare un’equazione di quarto grado (irriducibile)
dall’apparenza non invitante.
Nel nostro caso, dalla (4.11) si ottiene la risolvente
α6 + (a2 − 2c2)α4 + (c4 − a4)α2 − a2(a2 + c2)2 = 0.
Questa risolvente ha la radice√a2 + c2. Procedendo nel modo previsto,
otteniamo per la soluzione cercata (che deve avere valore compreso tra
0 e a):
1
2a+
1
2
√a2 + c2 −
√1
4c2 −
1
2a2 +
1
2a√a2 + c2.
5CH = a − x. Dal teorema di Pitagora si ricava CK. Si osserva poi che i triangoli
ABH e KCH sono simili . . .
56
In termini moderni, possiamo dire che l’aggiunzione di√a2 + c2 a Q(a, c)
rende il polinomio
x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4
riducibile. In effetti
x4 − 2ax3 + (2a2 − c2)x2 − 2a3x+ a4 =
=(x2 −
(a+
√a2 + c2
)x+ a2
)(x2 −
(a−
√a2 + c2
)x+ a2
).
4.4 Un cenno all’analisi di Lagrange delle
soluzioni dell’equazione di terzo e
quarto grado
Nella celebre memoria di Lagrange [1770], si trova un’analisi profonda dei
motivi per i quali le equazioni di terzo e quarto grado sono risolubili per
radicali.
Consideriamo di nuovo l’equazione
x3 + px+ q = 0 (4.12)
e consideriamo questa volta direttamente il cambiamento di variabili dato
da
x = y−p
3y.
Otteniamo l’equazione (risolvente):
y6 + qy3 −p3
27= 0.
Sia
r =3
√−q
2+
√q2
4+p3
27
e indichiamo con 1, α, β (= α2) le tre radici dell’unita. Le tre soluzioni
dell’equazione (4.12), che indichiamo con a, b, c, sono date da:
a = r−p
3r, b = rα−
p
3rα, c = rα2 −
p
3rα2.
57
Quindi, come si verifica facilmente,6
r =a
(1− α)(1− β)+
αb
(α− 1)(α− β)+
βc
(β− 1)(β− α).
Da
x3 − 1 = (x− 1)(x− α)(x− β)
si ha
3x2 = (x− α)(x− β) + (x− 1)(x− β) + (x− 1)(x− α).
Quindi:
3 = (1− α)(1− β)
3α2 = (α− 1)(α− β)
3β2 = (β− 1)(β− α).
Allora
r =a
3+b
3α+c
3β.
Essendo αβ = 1,
r =a+ bβ+ cα
3.
I ruoli di α e β si possono scambiare, e quindi la soluzione r puo essere
espressa come:
r =a+ bα+ cβ
3.
Dalla forma di
r =a+ bα+ cα2
3
si capisce perche la ridotta ha grado 6.
6Si ponga, per semplicita, p3r
= s. Allora
a− b = (1− α)(r+
s
α
), a− c = (1− β)
(r+
s
β
)e quindi α(a−b)
1−α= αr+ s, β(a−c)
1−β= βr+ s. Si considera la differenza, ecc.
58
Che succede infatti permutando a, b, c?
a+ bα+ cα2
3= u
a+ cα+ bα2
3= v
b+ aα+ cα2
3= vα
b+ cα+ aα2
3= vα2
c+ aα+ bα2
3= uα
c+ bα+ aα2
3= uα2
La ridotta e quindi data da
(y3 − u3)(y3 − v3).
Consideriamo ora una funzione delle radici della forma
Aa+ Bb+ Cc.
E possibile fare in modo che le 6 quantita che si ottengono permutando
a, b, c siano radici di un’equazione di sesto grado con solo termini di grado
multiplo di 3? Sia r una radice, ad esempio quella data da r = Aa+Bb+Cc.
Per ottenere quanto richiesto, anche αr e βr = α2r debbono essere radici.
Supponiamo che sia
α(Aa+ Bb+ Cc) = Aa+ Bc+ Cb
Ne segue che αA = A e dunque α = 1.7 Ancora, se
α(Aa+ Bb+ Cc) = Ab+ Ba+ Cc
si ottiene α = 1. Se invece si ha
α(Ab+ Ba+ Cc) = Ab+ Bc+ Ca
7Per quale ragione? Si fornisca una dimostrazione per esercizio.
59
otteniamo αA = C,αB = A,αC = B e quindi C = αA,B = α2A,α3A = A,
in accordo con α3 = 1.
Se supponiamo A = 1 si ha la soluzione
A = 1, B = α,C = α2.
Siano
u = a+ αb+ α2c, v = a+ αc+ α2b
le due radici soluzione dalle quali si ottengono le altre moltiplicando per
α,α2. Allora
y6 − (u3 + v3)y3 + u3v3 = 0.
Le quantita coinvolte sono simmetriche in a, b, c, e si ha, come si verifica
facilmente
y6 + 27qy3 − 27n3 = 0.
Il metodo di Tschirnaus
Data un’equazione di secondo grado,
x2 + px+ q = 0
con x = a+ y possiamo ridurci alla forma
y2 − α = 0.
Analogamente. Sia
f = x3 +mx2 + nx+ p = 0, g = x2 − bx− a− y = 0
Se calcoliamo il resto della divisione di f per g, abbiamo:(n+ a+ y+ bm+ b2
)x+ ym+ p+ am+ ab+ yb
Possiamo ora ricavare il valore di x e sostituire [. . . ] Eguagliando a zero i
coefficienti di grado 2, 1, abbiamo:
a =mb+m2 − 2n
3,
(m2 − 3n)b2 + (2m2 − 7mn+ 9p)b+
m4 − 4m2n+ 6mp+ n2 = 0.
60
L’equazione si riduce alla forma
y3 − C = 0.
Esempio 4.4 Sia x3 − 3x− 1 = 0 e poniamo x2 − bx− a− y = 0. Allora
x = −−1+ ba+ by
y+ b2 − 3+ a
Sostituendo, si verifica facilmente che a = 2 (perche m = 0 . . . ) e b
verifica:
3b2 − 3b+ 3 = 0.
Quindi, possiamo porre
b =1−
√3 i
2.
L’equazione si riduce a
y3 +9+ 3
√3 i
2= 0.
Vediamo di approfondire la struttura dei calcoli. Posto
x2 = bx+ a+ y
la quantita y deve essere determinata da
y3 + C = 0.
Dunque
y = −3√C, y = −α
3√C, −α2
3√C.
Se le radici sono x0, x1, x2:
x20 = bx0 + a−3√C
x21 = bx1 + a− α3√C
x22 = bx2 + a− α23√C
Moltiplicando per 1, α, α2 e sommando:
b =x20 + αx
21 + α
2x22x0 + αx1 + α2x2
.
61
La soluzione dell’equazione dipende da una funzione razionale delle radici
dell’equazione.
Quanti sono i valori possibili sulle permutazioni?
Se b0, b1 sono i due valori possibili [. . . ] di b, l’equazione di secondo
grado
t2 − (b0 + b1)t+ b0b1 = 0
ha i coefficienti nel campo base, perche questi coefficienti sono invarianti su
tutte le permutazioni.
La soluzione dell’equazione di terzo grado dipende da funzioni razionali
delle radici: o
x0 + αx1 + α2x2,
oppurex20 + αx
21 + α
2x22x0 + αx1 + α2x2
.
(La soluzione dipende anche dalle radici dell’unita).
Ancora sull’equazione di quarto grado
x4 +mx3 + nx2 + px+ q = 0.
Consideriamo la funzione delle radici
(a, b, c, d) 7→ ab+ cd.
Questa funzione ha solo tre valori:
ab+ cd, ac+ bd, ad+ bc.
L’equazione di terzo grado
[x− (ab+ cd)][x− (ac+ bd)][x− (ad+ bc)] = 0
ha i coefficienti funzioni simmetriche di a, b, c, d. Indicando le funzioni
simmetriche con σi, abbiamo:
x3 − σ2x2 + (σ1σ3 − 4 σ4)x+ 4 σ2σ4 − σ1
2σ4 − σ32.
62
Se conosciamo u = ab+ cd, poiche ab · cd = q, dall’equazione
t2 − ut+ q = 0
ricaviamo ab = t ′ e cd = t ′′. Poi
−p = ab(c+ d) + cd(a+ b) =
= t ′(c+ d) + t ′′(a+ b),
−m = a+ b+ c+ d.
Quindi
a+ b =p−mt ′
t ′ − t ′′, c+ d =
p−mt ′′
t ′ − t ′′.
Infine a e b saranno radici di
x2 −p−mt ′
t ′ − t ′′+ t ′ = 0,
mentre c e d saranno radici di
x2 −p−mt ′′
t ′ − t ′′+ t ′′ = 0.
Esempio 4.5 Consideriamo l’equazione
x4 − 25 x2 + 60 x− 36 = 0.
La risolvente di terzo grado diviene:
x3 + 25 x2 + 144 x = 0
che ha le radici 0,−9,−16. Abbiamo allora
t2 − 36 = 0
e quindi t ′ = 6, t ′′ = −6. Dobbiamo risolvere le equazioni:
x2 −60
12x+ 6 = 0
x2 +60
12x− 6 = 0.
Otteniamo 1, 2, 3,−6.
Ancora una volta si nota come la soluzione dipende dalla scelta di una
funzione opportuna delle radici che assume solo 3 valori.
63
4.5 Lagrange e il Teorema dell’elemento
primitivo
Un altro risultato estremamente importante contenuto in [Lagrange, 1770]
e una prima versione del Teorema dell’elemento primitivo. Sia f(x) un
polinomio avente le radici
x1, x2, . . . , xn.
Il risultato puo essere enunciato in questo modo:
Teorema 4.1 Siano
t(x1, x2, . . . , xn), y(x1, x2, . . . , xn)
due funzioni delle radici tali che ogni permutazione delle radici che modifica
y modifica anche t. Allora y e funzione razionale di t.8
Siano t1, t2, . . . , tr i valori distinti che la funzione t assume sulle permuta-
zioni delle radici. Segue facilmente dall’ipotesi che tutte le permutazioni che
mutano t nel valore ti portano y in uno stesso valore yi e, se una permuta-
zione σ porta ti in tj in corrispondenza yi viene mutato in yj.9 Siano allora
y1, y2, . . . , yr i valori di y (non necessariamente tutti distinti) corrispondenti
ai valori t1, t2, . . . , tr. Consideriamo le quantita
tk1y1 + tk2y2 + · · ·+ tkryr,
per k = 0, 1, . . . , r−1. A causa del teorema sui polinomi simmetrici, queste
quantita sono note, e quindi possiamo porre, per ogni k
t01y1 + t02y2 + · · ·+ t0ryr = m0,
t11y1 + t12y2 + · · ·+ t1ryr = m1,
. . . . . . . . .
tr−11 y1 + tr−12 y2 + · · ·+ tr−1r yr = mr−1.
(4.13)
8In altra parole: Lagrange costruisce una funzione razionale Φ(x) tale
che, se (i1 i2 in) e una arbitraria permutazione degli indici (1 2 . . . n) si ha
Φ(t(xi1 , xi2 , . . . , xin)) = y(xi1 , xi2 , . . . , xin). Cf. [Lagrange, 1770, pp. 374-381].9Lo si dimostri per esercizio. Naturalmente non e detto che sia yi = yj.
64
Moltiplichiamo la prima riga per n0, la seconda per n1,. . . , la r−1-esima
per nr−1 e sommiamo. Allora
m0n0 +m1n1 +m2n2 + · · ·+mr−1nr−1 =
= (n0 + n1t1 + n2t21 + · · ·+ nr−1tr−11 )y1
+ (n0 + n1t2 + n2t22 + · · ·+ nr−1tr−12 )y2
. . . . . . . . . . . . . . . . . . . . . . . .
+ (n0 + n1tr + n2t2r + · · ·+ nr−1tr−1r )yr.
(4.14)
Utilizziamo queste quantita nk per formare il polinomio
ν(t) = nr−1tr−1 + · · ·+ n1t+ n0,
lasciando queste quantita da determinarsi successivamente.
Possiamo allora riscrivere la (4.14) nella forma
m0n0 +m1n1 + · · ·+mr−1nr−1
= ν(t1)y1 + ν(t2)y2 + · · ·+ ν(tr)yr
Vogliamo ora determinare ν(t) in modo che sia
ν(tj) = 0 for j = k,
Sia, a tale scopo,
θ(t) = (t− t1)(t− t2) · · · (t− tr).
questo polinomio ha, per il teorema sui polinomi simmetrici, i coefficienti
nel campo base, e possiamo porre
θ(t) = ν(t)(t− tk).
Solo la quantita tk compare come un elemento non nel campo base.
Abbiamo
yk =m0n0 +m1n1 + · · ·+mr−1nr−1
ν(tk)(4.15)
Se scriviamo esplicitamente il polinomio θ(t), avremo
θ(t) = artr + ar−1t
r−1 + · · ·+ a1t+ a0,
65
e quindi (dall’algoritmo della divisione)
n0 = a1 + a2tk + · · ·+ ar−1tr−2k + artr−1k ,
n1 = a2 + a3tk + · · ·+ artr−2k ,
n2 = a3 + · · ·+ artr−3k ,
. . . . . . . . . . . . . . .
nr−1 = ar.
(4.16)
Si osservi ora che θ ′(t) = ν ′(t)(t− tk) + ν(t) e quindi
ν(tk) = θ′(tk). (4.17)
Le (4.16) danno le quantita nj in termini delle quantita aj e di tk; ν(tk) e
dato dalla (4.17) e si tratta quindi di sostituire nella (4.15) per ottenere ykin funzione di tk. Ma la procedura non dipende dalla scelta di k e dunque
cio che otteniamo e in realta y in funzione di t.
Per dare maggiore espressivita al risultato, possiamo porre
c0 = m0a1 +m1a2 + · · ·+mr−1ar,
c1 = m0a2 + · · ·+mr−2ar,
. . . . . . . . .
cr−1 = m0ar,
e
ϕ(t) = c0 + c1t+ · · ·+ cr−1tr−1.
Si ha allora, come si verifica immediatamente,
y(t) =ϕ(t)
θ ′(t). �
Esempio 4.6 Consideriamo l’equazione x2 + px+ q = 0, e siano x1, x2 le
radici. Sia
t(x1, x2) = x1 − x2, y(x1, x2) = x1.
Allora:
θ(t) = [t− (x1 − x2)][t− (x2 − x1)] = a0 + a1t+ a2t2 = 4q− p2 + t2
66
e
m0 = (x1 − x2)0x1 + (x2 − x1)
0x2 = −p,
m1 = (x1 − x2)1x1 + (x2 − x1)
1x2 = (x1 − x2)2 = p2 − 4q.
Di conseguenza
c0 = −p · 0+ (p2 − 4q) · 1c1 = −p · 1
Si conclude che
y(t) =p2 − 4q− pt
2t. 2 (4.18)
Ecco un esempio piu significativo.
Esempio 4.7 Si consideri l’equazione x3 + px + q = 0, avente le radici
x1, x2, x3 e sia t(x1, x2, x3) = x1x2, y(x1, x2, x3) = x1+x2. Allora la funzione
t assume i tre valori x1x2, x1x3, x2x3 e in corrispondenza y assume i valori
x1 + x2, x1 + x3, x2 + x3. Si ha allora, come si verifica facilmente,
θ(t) = −q2 − pt2 + t3,
e quindi a0 = −q2, a1 = 0, a2 = −p, a3 = 1.
m0 = (x1x2)0(x1 + x2) + (x1x3)
0(x1 + x3) + (x2x3)0(x2 + x3) = 0,
m1 = (x1x2)1(x1 + x2) + (x1x3)
1(x1 + x3) + (x2x3)1(x2 + x3) = 3q,
m2 = (x1x2)2(x1 + x2) + (x1x3)
2(x1 + x3) + (x2x3)2(x2 + x3) = pq.
Quindi
c0 = m0a1 +m1a2 +m2a3 = −2pq,
c1 = m0a2 +m1a3 = 3q,
c2 = m0a3 = 0.
Di conseguenza
y(t) =−2pq+ 3qt
−2pt+ 3t2. 2
67
Osservazione 4.1 Consideriamo il caso particolarmente semplice di una
funzione t che assuma i tre valori t1, t2, t3 ai quali corrispondano i valori
y1, y2, y3. Dobbiamo allora risolvere il sistema (si rammentino le (4.13))
y1 + y2 + y3 = m0
t1y1 + t2y2 + t3y3 = m1
t21y1 + t22y2 + t
23y3 = m1
e si tratta di mostrare che ogni elelemto yi della soluzione puo essere espres-
so come funzione solamente di ti.10
Esplicitando il valore di y1, per esempio, si notera che t2 e t3 com-
paiono simmetricamente nella soluzione e quindi la soluzione stessa puo
essere espressa mediante t1 e le funzioni simmetriche elementari date dai
coefficienti del polinomio (t− t1)(t− t2)(t− t3).
A partire da questa osservazione si puo riformulare il risultato di La-
grange. Si noti pero che questa soluzione e piuttosto anacronistica.
Il corollario seguente ha la piu grande importanza.
Corollario 4.1 (Teorema dell’elemento primitivo) La funzione delle
radici V(x1, x2, . . . , xn) assuma n! valori distinti. Allora le radici possono
essere espresse come funzioni del valore V1 = V(x1, x2, . . . , xn).
In queste ipotesi, evidentemente, V e invariante solo per la permutazione
identica e ovviamente le proiezioni πi(x1, x2, . . . , xn−1) = xi sono invarian-
ti per questa permutazione. Con il metodo di Lagrange possiamo allo-
ra costruire n funzioni φi(x) tali che per ogni permutazione σ si abbia
πi(xσ(1), xσ(2), . . . , xσ(n) = xσ(i) = φi(V(xσ(1), xσ(2), . . . , xσ(n))). In particola-
re la permutazione identica da xi = φi(V1). 2
Un esempio ulteriore mostra l’efficacia del risultato di Lagrange in questo
caso.11
10Cf. [Edwards, 1984, pp. 34-35].11Il caso dell’equazione di secondo grado, esaminato in precedenza (vedi a pagina
66) e troppo semplice per risultare convincente. L’ho esposto solamente per mostra la
meccanica dell’algoritmo.
68
Esempio 4.8 Consideriamo l’equazione x3+px+q = 0, che abbia le radici
x1, x2, x3 e poniamo ancora t(x1, x2, x3) = x1 − x2, y(x1, x2, x3) = x1.
Allora
θ(t) =∏i =j
(t− (xi − xj)) = 4p3 + 27q2 + 9p2t2 + 6pt4 + t6.
Si ha poi:
m0 = 0,m1 = −6p,m2 = −9q,m3 = 18p2,m4 = 27pq,m5 = −66p3−81q2.
Con i valori dei coefficienti di θ e con i valori mk possiamo calcolare i valori
cj. Si ha:
c0 = −12p3 − 81q2, c1 = −27pq, c2 = −18p2, c3 = −9q, c4 = −6p, c5 = 0.
Si ha allora
y = −1
2· 2p x
4 + 3 qx3 + 6 p2x2 + 9 pqx+ 4 p3 + 27 q2
x (x4 + 4 px2 + 3 p2)
e, come si verifica facilmente, y(x1 − x2) = x1. Scegliendo invece come
funzione y la proiezione su x2 si ha (ovviamente)
y =1
2· 2p x
4 − 3 qx3 + 6 p2x2 − 9 pqx+ 4 p3 + 27 q2
x (x4 + 4 px2 + 3 p2)
e y(x1 − x2) = x2. Infine con la proiezione su x3 si ha
y =3q
p+ x2
e y(x1 − x2) = x3 (= −x1 − x2). L’elemento x1 − x2 permette quindi di
esprimere le tre radici. Ossia, nei termini dell’algebra moderna:
Q(x1, x2, x3) = Q(x1 − x2).
69
Capitolo 5
Il teorema sui polinomisimmetrici
5.1 Introduzione
Inizio questo capitolo con alcune osservazioni per dare unita ad un argo-
mento che si svolge in un percorso di piu di trecento anni.1
I polinomi che si considerano in questo capitolo all’inizio avevano ori-
ginariamente (nei lavori di Newton, Maclaurin, Leibniz, ecc.) i loro coeffi-
cienti non specificati. Possiamo considerarli come numeri reali (o complessi,
talvolta). Al termine del capitolo invece, i polinomi che compaiono nella
dimostrazione di Artin hanno i coefficienti in un campo arbitrario. Poiche
la natura dei coefficienti non interviene in modo essenziale, a patto natu-
ralmente che essi formino un campo (o un anello commutativo in certi casi)
non specificgero la loro natura, affidandomi al contesto perche sia chiara la
loro natura.
Un polinomioφ(x1, x2, . . . , xn) nelle indeterminatex1, x2, . . . , xn, che man-
tenga lo stesso valore per tutte le permutazioni di x1, x2, . . . , xn e detto un
1Un breve ma interessante resoconto di qesto argomento e [Funkhouser, 1930].
71
polinomio simmetrico nelle variabili x1, x2, . . . , xn.
Tra i polinomi simmetrici quelli dati da
σ1 = x1 + x2 + · · ·+ xnσ2 = x1x2 + · · ·+ x1xn + x2x3 + · · ·+ xn−1xn. . . . . . . . .
σn = x1x2 · · · xn
(5.1)
sono di particolare importanza e sono detti polinomi simmetrici elementari.2
Si ha evidentemente
(x− x1)(x− x2) · · · (x− xn) = xn−σ1xn−1+σ2xn−2+ · · ·+(−1)nσn. (5.2)
Osservazione 5.1 In molte situazioni le indeterminate x1, x2, . . . , xn sa-
ranno sostituite dalle radici di un’equazione di grado n con coefficenti nu-
merici o con coefficienti a loro volta delle indeterminate.
Nelle pagine seguenti i simboli Sk saranno usati somme di potenze della
forma xk1+xk2+ · · ·+xkn. Usero invece Sn per indicare il gruppo simmetrico,
ossia il gruppo di tutte le permutazioni degli indici 1, 2, . . . , n. Con σ, τ, . . .
indichero le singole permutazioni di Sn. La possibile confusione tra σ(j) e
σj sara chiarita dal contesto.
Il teorema del quale voglio descrivere lo sviluppo storico e il seguente.
Teorema 5.1 Ogni polinomio simmetrico nelle indeterminate x1, x2, . . . , xnpuo essere scritto in modo unico come un polinomio nelle σ1, σ2, . . . , σn. ⋄
Nel seguito del capitolo vedremo alcune dimostrazioni dapprima di casi
particolari e poi del teorema nella sua generalita. Nella Sezione seguente,
poiche la matematica coinvolta non e molto complicata ho mantenuto le
notazioni di Newton e di Maclaurin. Nel seguito pero occorrera midificare
le notazioni originali per dare untia alla trattazione.
2La loro considerazione risale a Viete.
72
5.2 La regola di Newton per le somme di
potenze delle radici
Un primo risultato sui polinomi simmetrici e dato da Newton nella sua
Arithmetica Universalis.3
Le somme di potenze delle radici di un’equazione arbitraria (nella qua-
le quindi le radici possono essere considerate come indeterminate: si veda
l’osservazione 5.1) possono essere espresse mediante i coefficienti dell’equazione
stessa (le funzioni simmetriche elementari delle radici).
Newton considera una equazione arbitraria i cui coefficienti egli indica
con p, q, r, s, t, v, . . . , scritta nella forma
xn − pxn−1 + qxn−2 − rxn−3 + · · · = 0
e da questa regola:
si ponga p = a, pa− 2q = b, pb−qa+ 3r = c, pc−qb+ ra−
4s = d [. . . ] e cosı all’infinito, mantenendo la struttura della
progressione. E a sara la somma delle radici, b la somma dei
quadrati delle radici, c la somma dei cubi, . . .
Newton lascia la dimostrazione al suo lettore.
Esempio 5.1 Consideriamo l’equazione x4 − x3 − x + 1 = 0. Vogliamo
calcolare la somma delle potenze di ordine 5 delle sue radici. Si ha allora
p = 1, q = 0, r = 1, s = 1 (e i coefficienti successivi, anche quelli di ‘grado
negativo’, debbono considerarsi nulli). Quindi
S1 = 1,
S2 = pS1 − 2q = 1 · 1− 2 · 0 = 1,S3 = pS2 − qS1 + 3r = 1 · 1− 0 · 1+ 3 · 1 = 4,S4 = pS3 − qS2 + rS1 − 4s = 1 · 4− 0 · 1+ 1 · 1− 4 = 1,
S5 = pS4 − qS3 + rS2 − sS1 − 5 · 0 = 1 · 1− 0 · 4+ 1 · 1− 1 · 1 = 1.3Si veda [Newton, 1964, vol. 2, p. 202]. Si vedano anche [Newton, 1981, vol. 1, pp.
519-20], [Newton, 1981, vol. 4, pp. 360-61] e le utili e istruttive note di Whiteside.
73
E chiaro come il calcolo puo procedere. Si noti che arriviamo alla conoscen-
za di Sk con k arbitrario senza conoscere le radici
5.3 La dimostrazione di Maclaurin della
regola di Newton
La prima dimostrazione della regola di Newton e data da Maclaurin. Egli4
inizia con il considerare un’equazione della forma
xn −Axn−1 + Bxn−2 + · · ·+ Kx2 − Lx+M = 0 (5.3)
ed indica le radici con a, b, c, d, . . . 5
Egli comincia con il considerare il caso di una somma di potenze r-esime,
con r > n (il caso piu semplice). Abbiamo evidentemente le identita
ar −Aar−1 + Bar−2 + · · ·− Lar−n+1 +Mar−n = 0,
br −Abr−1 + Bbr−2 + · · ·− Lbr−n+1 +Mbr−n = 0,
cr −Acr−1 + Bcr−2 + · · ·− Lcr−n+1 +Mcr−n = 0,
· · · · · · · · ·
Sommando tutte le righe, e indicando con Sk la somma ak+bk+ ck+ · · · ,6abbiamo
Sr −ASr−1 + BSr−2 + · · ·− LSr−n+1 +MSr−n = 0. (5.4)
In seguito Maclaurin considera il caso di r ≤ n. Se H e il coefficiente che
contiene le summe dei prodotti delle radici presi a r a r egli deve dimostrare
che7
Sr −ASr−1 + BSr−2 + · · ·− rH = 0. (5.5)
4Cf. [Maclaurin, 1748, pp. 286-296].5 Poiche non abbiamo ipotesi sulla parita di n, l’equazione (5.3) potrebbe anche
terminare con −Kx2 + Lx −M. Ma la dimostrazione di Maclaurin procederebbe nello
stesso modo.6Maclaurin non utlizza una simbologia speciale per indicare queste somme di potenze.
io credo che questo piccolo abuso notazionale non crei una grande differenza.7Si veda la nota 5 per il segno di H.
74
Maclaurin considera separatamente i casi facili dati da r = n−1 e r = n−2,
per i quali la soluzione e semplice (e rientra nel caso generale). Il caso
generale e trattato con l’aiuto del lemma seguente.
Lemma 5.1 Si consideri il primo coefficiente A (= S1) dell’equazione (5.3),
il coefficiente G e H il coefficiente che lo segue immediatamente. Se con
A ′×G ′ indichiamo la somma di tutti i termini del prodotto A×G nei quali
si trova il quadrato di ogni radice a2 o b2 o c2, &c., allora
A ′ ×G ′ = A×G− rH. ⋄
Dimostrazione.- La dimostrazione di Maclaurin consiste di un esem-
pio paradigmatico. Consideriamo
D = abcd+ abce+ abcf+ · · ·+ bcde+ bcdf+ . . .
e moltiplichiamolo per A = a + b + c + d + . . . Se nel prodotto A × Dtutti i termini nei quali si trovano a2, b2, c2, . . . sono scelti (per formare
A ′ × D ′), ognuno dei termini restanti comparira tante volte quanti sono
i fattori che formano un termine del coefficiente seguente E. Il termine
abcde, per esempio, e ottenuto moltiplicando ognuna delle cinque radici
a, b, c, d, e per il prodotto delle altre quattro che formano un termine di D.
Quindi
A×D−A ′ ×D ′ = 5E.
E evidente che non vi sono difficolta per dare una dimostrazione piu formale
del caso generale. ♢Comunque un altro esempio puo essere utile.
Esempio 5.2 Vediamo un caso piu semplice di quello scelto da Maclauirin.
Consideriamo l’equazione
(x− a)(x− b)(x− c)(x− d)(x− e)
e il coefficiente dato da
D = abc+ abd+ abe+ acd+ ace+ ade+ bcd+ bce+ bde+ cde.
75
Formiamo il prodotto
A×D = (a+b+c+d+e)(abc+abd+abe+acd+ace+ade+bcd+bce+bde+cde).
Otterremo un termine che non contiene a2 solo scegliendo in D un ter-
mine che non contiene a il che evidentemente si puo fare in 4 modi. Il
ragionamento si puo ripetere per b, c, d, e. Quindi in questo caso
A×D−A ′ ×D ′ = 4E.
Maclaurin ora osserva che in ciascuno dei coefficienti A,B,C,D, . . . con
l’eccezione dell’ultimo M, quando si sceglie una radice, ad esempio a, pos-
siamo suddividere la somma dei termini in due parti: quella data dalla
somma di tutti i termini contenenti a e l’altra data dai rimanenti. Egli
utilizza le notazioni
G(+a, G(−a
con ovvio significato. Chiaramente
G = G(+a +G(−a and H(+a = aG(−a (5.6)
G = G(+b +G(−b and H(+b = bG(−b (5.7)
. . . . . . . . .
Partendo dall’equazione (5.3) scriviamo il polinomio generalizzato
xr −Axr−1 + Bxr−2 + · · ·+Gx+H+I
x−K
x2+ · · ·+ M
xn−r. (5.8)
Sostituendo a, b, c, . . . successivamente al posto di x otteniamo8
ar −Aar−1 + Bar−2 + · · ·+Ga+H+I
a−K
a2+ · · ·+ M
an−r
br −Abr−1 + Bbr−2 + · · ·+Gb+H+I
b−K
b2+ · · ·+ M
bn−r
cr −Acr−1 + Bcr−2 + · · ·+Gc+H+I
c−K
c2+ · · ·+ M
cn−r
. . . . . . . . .
8Ancora una volta la notazione usata da Mclaurin va interpretata ragionevolmente.
76
Con le notazioni usate in (5.6), (5.7), ecc. si ha
Ga = aG(+a + aG(−a, (5.9)
−H = −aG(−a −H(−a, (5.10)
I
a= H(−a +
I(−a
a, (5.11)
−K
a2= −
I(−a
a−K(−a
a2, (5.12)
. . . = . . . . . . . . .
M
an−r= −
L(−a
an−r. (5.13)
Esempio 5.3 Consideriamo cinque radici a, b, c, d, e e verifichiamo che
nel caso in cui sia
H = abc+ abd+ abe+ acd+ ace+ ade + bcd+ bce+ bde+ cde
si haI
a= H(−a +
I(−a
a.
Infatti I = abcd+ abce+ abde+ acde+ bcde e si ha quindi
I
a= bcd+ bce+ bde+ cde+
bcde
a. 2
Consideriamo di nuovo le identita (5.9),. . . , (5.13). Sommando da ambo le
parti e cancellando opportunamente si ha
Ga−H+I
a−K
a2+ · · ·+ M
an−r= aG(+a
e similmente
Gb−H+I
b−K
b2+ · · ·+ M
bn−r= bG(+b,
Gc−H+I
c−K
c2+ · · ·+ M
cn−r= cG(+c,
. . . . . . . . .
77
Ma
aG(+a + bG(+b + cG(+c + · · · = A ′ ×G ′.
Per il lemma 5.1, A ′ ×G ′ = A×G− rH = GS1 − rH. Ne segue che
Sr −ASr−1 + BSr−2 + · · ·+GS1 − rH = 0,
come si doveva dimostrare. �
5.4 La dimostrazione di Lagrange della
regola di Newton
Lagrange da una dimostrazione semplice ed elegante del risultato di Newton
in [Lagrange, 1808, Note VI].9
Sia
f(x) =
n∑k=0
akxn−k = a0(x− x1)(x− x2) · · · (x− xn), (5.14)
alloraak
a0= (−1)kσk. (5.15)
Il duplice modo di scrivere il polinomio f(x) corrisponde al doppio modo di
scrivere la sua derivata.
f′ (x) = na0xn−1 + (n− 1)a1x
n−2 + (n− 2)a2xn−3 + . . . =
= a0 {(x− x2) · · · (x− xn) + (x− x1) (x− x3) · · · (x− xn) + . . .}
Di conseguenza
f′ (x)
f (x)=na0x
n−1 + (n− 1)a1xn−2 + (n− 2)a2x
n−3 + . . .
a0xn + a1xn−1 + a2xn−2 + a3xn−3 + . . .+ an,
9Un’altra dimostrazione che si estende anche al caso di potenze negative si trova
in [Lagrange, 1768], dove la famosa ‘serie di Lagrange’ compare per la prima volta.
Un’altra dimostrazione di Lagrange si trova in [Lagrange, 1808, Note XI]. Si veda anche
[Serret, 1877, Section II, chapitre II]. Dimostrazioni interessanti della regola di Newton,
in qualche modo mirate ad ottenere unas ‘formula chiusa’ si trovano in [Waring, 1991,
Problem I] e in [Euler, 1771].
78
ef′ (x)
f (x)=
1
x− x1+
1
x− x2+ · · ·+ 1
x− xn. (5.16)
Utilizzando la serie geometrica,10 la formula (5.16) da
1
x− x1+
1
x− x2+ · · ·+ 1
x− xn=1
x
1
1−x1
x
+1
x
1
1−x2
x
+ · · · =
=1
x
{[1+
x1
x+(x1x
)2+ · · ·
]+
[1+
x2
x+(x2x
)2+ · · ·
]+ · · ·
}=
=n
x+ (x1 + x2 + · · · xn)
1
x2+(x21 + x
22 + · · ·+ x2n
) 1x3
+
+(x31 + x
32 + · · ·+ x3n
) 1x4
+ · · ·
Ne segue che
f′ (x)
f (x)=S0
x+S1
x2+S2
x3+S3
x4+ · · ·
e di conseguenza
na0xn−1 + (n− 1)a1x
n−2 + (n− 2)a2xn−3 + · · · =
=[a0x
n + a1xn−1 + a2x
n−2 + · · ·+ an] [S0x
+S1
x2+S2
x3+S3
x4+ · · ·
].
Lagrange paragona ora il coefficiente di xn−r−1 nei due membri della equa-
zione precedente. Quindi
(n− r)ar = a0Sr + a1Sr−1 + a2Sr−2 + · · ·+ arS0.
S0 = n, e di conseguenza
a0Sr + a1Sr−1 + a2Sr−2 + · · ·+ rar =r−1∑i=0
aiSr−i + rar = 0. (5.17)
Si noti che, ponendo ar = 0 per r > n, la formula (5.17) risulta valida per
ogni r.
Dividendo per a0 e usando le (5.15) otteniamo la formulazione abituale.10La argomentazione di Lagrange puo essere collocata idealmente nel contesto delle
serie formali, poiche le radici xk sono considerate come indeterminate.
79
5.5 La prima dimostrazione del teorema:
Waring
Waring e il primo che dimostra il Teorema 5.1 nella sua forma generale.
Io seguo la formulazione data nell’eccellente traduzione inglese di Weeks
di [Waring, 1770], che contiene la formulazione definitiva dei risultato di
Waring.11 Io mi limito a presentare la dimostrazione ‘algoritmica’ data
da Waring12, perche la soluzione per serie, sebbene molto elegante13 e di
difficile utilizzo.14
Waring comincia con l’osservare che se un polinomio simmetrico nelle
indeterminare x1, x2, . . . , xn contiene un termine della forma
a · xn1
1 xn2
2 · · · xnr
r
esso contiene anche necessariamente tutti i termini della forma
a · xn1
σ(1) · · · xnr
σ(r)
che si ottengono applicando una permutazione arbitraria σ, appartenente
al gruppo simmetrico Sn, all’arrangiamento (1 2 · · ·n). Di conseguenza il
polinomio simmetrico contiene
a ·∑σ∈Sn
xn1
σ(1) · · · xnr
σ(r). (5.18)
L’idea di Waring e quella di esprimere ogni somma (5.18) mediante un
polinomio nelle somme
Sk = xk1 + x
k2 + · · ·+ xkn.
Poiche le somme Sk, a loro volta, mediante la regola di Newton, possono es-
sere espresse mediante le σj date in (5.1), ogni somma del tipo (5.18), e dun-
que l’intero polinomio simmetrico puo essere trasformato in un polinomio
nelle σj.11Si veda [Waring, 1991].12Ibidem, [Waring, 1991, pp. 12-13].13Ibidem, p. 1114Ho anche considerato l’esposizione di Bourdon [1831, pp. 487–491]. Ho modifica-
to lievemente le notazioni per mettere in maggior risalto la strategia di Waring. Una
dimostrazione moderna delle formule di Waring si trova in [Murnaghan, 1931].
80
Per denotare la somma (5.18), si puo usare la notazione (molto prossima
a quella usata da Waring)
a · T [xn1
1 xn2
2 · · · xnr
r ].
Se (5.18) contiene una sola indeterminata, per esempio x1, ovviamente
si ha
a · T [xn1
1 ] = a · Sn1. (5.19)
Supponiamo ora che nella (5.18) vi siano due indeterminate, ossia che
essa abbia la forma
a · T [xn1
1 xn2
2 ]. (5.20)
Il prodotto
Sn1· Sn2
contiene certamente tutti i termini di T [xn1
1 xn2
2 ], ma esso contiene anche
tutti i termini di Sn1+n2. Si ha quindi
T [xn1
1 xn2
2 ] = Sn1· Sn2
− Sn1+n2. (5.21)
Il meccanismo ricorsivo e ora piuttosto chiaro:
T [xn1
1 xn2
2 . . . xnr
r xnr+1
r+1 ] = T [xn1
1 xn2
2 . . . xnr
r ] · Snr+1+
−T [xn1+nr+1
1 xn2
2 . . . xnr
r ] − · · ·− T [xn1
1 xn2
2 . . . xnr+nr+1r ].
(5.22)
Osservazione 5.2 Si noti che nel risultato di Waring gli esponenti n1, n2, . . .
sono puri simboli, e dunque il risultato non dipende dalla loro natura.
Si consideri, ad esempio, il polinomio simmetrico (generalizzato)
T [xa yb zc] = xaybzc+ xayczb+ xbzayc+ xbzcya+ xcyazb+ xczbya. (5.23)
Il meccanismo ricorsivo da
T [xa yb zc] = T [xa yb]Sc − T [x(a+c) yb] − T [xa y(b+c)]
= T [xa yb](xc + yc + zc) − T [x(a+c) yb] − T [xa y(b+c)].
81
Ma
T [xa yb] = SaSb − Sa+b = (xa + ya + za)(xb + yb + zb) − (xa+b + ya+b + za+b).
T [xa+c yb] = Sa+cSb − Sa+b+c =
= (xa+c + ya+b + za+b)(xb + yb + zb) − (xa+b+c + ya+b+c + za+b+c).
T [xa yb+c] = SaSb+c − Sa+b+c =
= (xa + ya + za)(xb+c + yb+c + zb+c) − (xa+b+c + ya+b+c + za+b+c).
Quindi
T [xa yb zc] = SaSbSc − SaSb+c − SbSa+c − ScSa+b + 2Sa+b+c.
Ponendo a = b = 1, c = −1, per proseguire l’esempio, abbiamo
2
(xy
z+xz
y+yz
x
)=
= (x+ y+ z)2(1
x+1
y+1
z
)−
(1
x+1
y+1
z
)(x2 + y2 + z2) − 4(x+ y+ z).
L’importanza del risultato di Waring e evidente. Ma al tempo stesso e
difficile immaginare una utilzzazione ‘pratica’ del suo algoritmo.
Esercizio 5.1 Utilizando un sistema di computer algebra, si scriva un pro-
gramma che implementi il metodo di Waring.
5.6 La dimostrazione di Gauss
L’elegante dimostrazione di Gauss del Teorema 5.1 e contenuta nelle sezioni
4, 5 di [Gauss, 1816]. Questa dimostrazione fornisce anche un algoritmo
efficiente per esprimere un polinomio simmetrico φ(x1, x2, . . . , xn) come un
polinomio nelle σj. Inoltre Gauss dimostra anche per la prima volta l’unicita
della rappresentazione.15
15Questa dimostrazione e spesso riprodotta nei manuali moderni, a partire dai classici
volumi [van der Waerden, 1930, 1931]. Si veda anche la traduzione inglese (con diverso
titolo): [van der Waerden, 1991, pp. 99-101].
82
Gauss inizia ponendo un ordine totale nell’insieme di tutti i monomi nelle
indeterminate x1, x2, . . . , xn. Per rendere l’esposizione ancora piu chiara
denotero questa relazione d’ordine con ≻.
Gauss stabilisce che per due monomi nelle indeterminate x1, x2, . . . , xn
xk11 x
k22 · · · xknn , x
l11 x
l22 · · · xlnn
si ha
xk11 x
k22 · · · xknn ≻ xl11 x
l22 · · · xlnn (5.24)
se esiste un r < n tale che
ki = li for i = 1, 2, . . . , r and kr+1 > lr+1.
Si noti che questo ordinamento puo essere esteso a tutti i termini che
compongono un polinomio nelle variabili x1, x2, . . . , xn, purche due addendi
del tipo a·xk11 xk22 · · · xknn , b·xk11 x
k22 · · · xknn siano sostituiti da un unico termine
dato da (a+ b) · xk11 xk22 · · · xknn .
Osservazione 5.3 Si noti che, fissato un monomioM esistono infiniti mo-
nomi N con M ≻ N. Ma se uniamo la richiesta che il grado del monomio
N sia minore od uguale a quello di M allora il numero diviene finito.
Consideriamo, per esempio, le indeterminate x1, x2, x3. Si ha evidente-
mente x1 = x11x02x03 ≻ x01x
i2xk3 per ogni scelta di i e k in N. Ma se fissiamo
il grado di un monomio P = xi11 x
i22 x
i33 , scegliendo un intero n per questo
grado, le scelte possibili per i monomi minori di P vanno effettuate tra le
terne di interi positivi soluzioni di i1 + i2 + i3 ≤ n.16
Esercizio 5.2 Date le variabili x1, x2, x3 si dispongano in ordine decrescen-
te per l’ordine dato da ≻ tutti i monomi di grado minore od uguale a 2
minori di x21. ♢
Siaφ(x1, x2, . . . , xn) un polinomio simmetrico. Come aveva gia osservato
Waring, se φ contiene un termine della forma
a · xk11 xk22 · · · xknn
16Si veda pero la nota 19.
83
esso deve contenere anche tutti i termini dati da
a ·∑σ∈Sn
xk1σ(1)x
k2σ(2) · · · x
knσ(n).
Ne segue che il termine massimo, per l’ordine ≻ e necessariamente della
forma
a · xk11 xk22 · · · xknn , con k1 ≥ k2 ≥ · · · ≥ kn. (5.25)
Altrimenti, se per i < j fosse ki < kj, la permutazione che scambia i con j
produrrebbe un termine piu grande per l’ordinamento ≻.
Osservazione 5.4 SiaM = a·xk11 xk22 · · · xknn il termine massimo per l’ordi-
namento dato contenuto in un polinomio simmetrico p(x1, x2, . . . , xn) e sia
m = k1 + k2 + · · · + kn il grado di M. Allora p e un polinomio di grado
m.17
Infatti, se il polinomio p contenesse un monomio N = b · xj11 xj22 · · · xjnn
con n = j1+j2+ · · ·+jn, tale che n > m, dovrebbe verificarsi per almeno un
esponente ji, la disuguaglianza ji > ki. Ma, essendo p simmetrico, anche
il monomio P = b · xji1 xs22 · · · xsnn , corrispondente ad una permutazione degli
esponenti j1, j2, . . . , jn che porti ji al primo posto dovrebbe essere un termine
di p; ed e evidentemente, in tal caso, P ≻M, il che e assurdo. 2
Se il termine piu grande di φ e
a · xk11 xk22 · · · xknn .
con k1 ≥ k2 ≥ · · · ≥ kn, il polinomio
φ1 = φ− a · σk1−k21 σk2−k32 · · ·σkn−1−kn
n−1 σknn , (5.26)
costruito con le funzioni simmetriche elementari, ha grado minore od ugale
a quello di φ ed un termine massimo strettamente minore.18
17Si veda ancora la nota 19.18Si noti che il grado di σk1−k2
1 σk2−k3
2 · · ·σknn e dato da
k1 − k2 + 2(k2 − k3) + · · ·+ (n− 1)(kn−1 − kn) + kn = k1 + k2 + · · ·+ kn
che e, per quanto osservato, il grado di φ.
84
Esempio 5.4 Sia
φ(x1, x2, x3) = x31x22 + x
31x23 + x
32x21 + x
32x23 + x
33x21 + x
33x22.
Il termine massimo e evidentemente x31x22. Abbiamo k1 = 3, k2 = 2, k3 = 0.
Il polinomio φ1 e allora dato da
φ1 = φ− σ3−21 σ2−02 σ03 = φ− (x1 + x2 + x3)(x1x2 + x1x3 + x2x3)2.
Il polinomio che otteniamo
−2 x13x2x3 − 5 x1
2x22x3 − 5 x1
2x2x32 − 2 x1x2
3x3 − 5 x1x22x3
2 − 2 x1x2x33
ha lo stesso numero di termini, ma il termine massimo −2x31x2x3 e stretta-
mente minore.
Ritornando al discorso generale, si osservi che φ1 e a sua volta un
polinomio simmetrico e il suo termine piu grande ha la forma
b · xl11 xl22 · · · xlnn
con l1 ≥ l2 ≥ · · · ≥ ln e puo essere, come abbiamo visto nell’esempio,
k1 = l1, k2 = l2, . . . , ma per almeno uno degli lj, con j = 1, 2, . . . , n, deve
essere lj < kj.
Si puo osservare che il polinomio φ1 puo avere talvolta lo stesso numero
di termini di φ od anche un numero maggiore, ma questo numero e ne-
cessariamente finito e poiche il numero di monomi di dato grado minori di
un monomio dato e finito, il numero dei termini non puo superare questo
numero.
Possiamo visualizzare il processo in questo modo: un polinomio simme-
trico ha un monomio M piu grande, rispetto all’ordinamento ≻, di grado
m, edm e anche il grado del polinomio. Nella lista di tutti i monomi minori
diM con grado minore od uguale a m alcuni saranno presenti, altri no; ma
se il numero totale dei monomi minori diM e e di grado minore di m e lM,
la lista non puo avere piu di lM termini. Con il metodo di Gauss si genera
un polinomio simmetrico per il quale il monomio piu grande M1 e tale che
M ≻ M1 ed ha grado m1 ≤ m. Se il numero dei monomi minori di M1 e
85
di grado minore di m1 e Lm1, si ha certamente Lm > Lm1
. Ne consegue che
il processo puo essere iterato e deve condurre necessariamente al polinomio
nullo.
Dunque, procedendo nel modo indicato, avremo
φ(x1, . . . , xn) − a · σk1−k21 σk2−k32 · · ·σknn − b · σl1−l21 σ
l2−l32 · · ·σlnn − · · · = 0
e
φ(x1, . . . , xn) = a · σk1−k21 σk2−k32 · · ·σknn + b · σl1−l21 σ
l2−l32 · · ·σlnn + . . .
e la rappresentazione richiesta.19
Esempio 5.5 Si consideri il polinomio nelle variabili x1, x2, x3
φ = x12x2
2x32 + x1
3x2 + x23x1 + x1
3x3 + x33x1 + x2
3x3 + x33x2,
Il termine piu grande per l’ordinamento dato e x31x2. Dobbiamo considerare
φ−σ3−11 σ2 = x12x2
2x32−2 x1
2x22−5 x1
2x2x3−2 x12x3
2−5 x1x22x3−5 x1x2x3
2−2 x22x3
2.
Il nuovo termine piu grande e x21x22x23. Dunque
φ−σ3−11 σ2−σ2−21 σ2−22 σ23 = −2 x1
2x22−5 x1
2x2x3−2 x12x3
2−5 x1x22x3−5 x1x2x3
2−2 x22x3
2.
Questa volta abbiamo −2x21x22, e quindi
φ− σ21σ2 − σ23 − (−2σ22) = −x1
2x2x3 − x1x22x3 − x1x2x3
2.
Infine abbiamo
φ− σ21σ2 − σ23 − (−2σ22) − (−σ1σ3) = 0. ♢
Per dimostrare l’unicita, supponiamo per assurdo che vi siano due rappre-
sentazioni differenti
φ(x1, . . . , xn) = F(σ1, . . . , σn) = G(σ1, . . . , σn).
19In realta le considerazioni sul grado servono solamente per semplificare la dimostra-
zione. Si puo dimostrare facilmente che l’algoritmo di Gauss si arresta dopo un numero
finito di passi riflettendo solamente sull’ordinamento dei monomi.
86
dove F e G sono polinomi diversi nelle variabili X1, X2, . . . , Xn che divengono
uguali quando si effettua la sostituzione
Xj = σj (5.27)
Si noti che F−G non puo ridursi ad un solo monomio (lo si dimostri per
esercizio) e due monomi diversi
M · Xk11 · · ·Xknn , N · Xl11 · · ·Xlnn
di
F(X1, . . . , Xn) −G(X1, . . . , Xn)
producono termini di grado piu alto diversi per ≻, dati da
M · xk1+k2+···+kn1 x
k2+···+kn2 · · · xknn , N · xl1+l2+···+ln
1 xl2+···+ln2 · · · xlnn ,
quando si effettuano le sostituzioni (5.27). Dunque c’e necessariamente un
termine massimo per ≻ una volta che sono eseguite le sostituzioni (5.27) e
F−G non puo divenire il polinomio nullo. 2
5.7 La dimostrazione di Cauchy
La dimostrazione di Cauchy si trova in [Cauchy, 1829, pp. 132–33]. Si
tratta di una brillante dimostrazione per induzione.20
Si consideri l’equazione
xn − σ1xn−1 + σ2x
n−2 + · · ·+ (−1)nσn = 0 (5.28)
che abbia le radici x1, x2, . . . , xn. Sia φ(x1, x2, . . . , xn) un polinomio simme-
trico nelle variabili x1, x2, . . . , xn. Possiamo certamente scrivere φ mettendo
in evidenza la variabile x1, ossia nella forma
φ = A0xm1 +A1x
m−11 + · · ·+Am. (5.29)
20Anche questa conosce un certo favore. Si veda per esempio [Mignotte e Stefanescu,
1999].
87
dove i coefficienti Ak debbono essere polinomi simmetrici nelle n−1 variabili
x2, x3, . . . , xn.
Siano τ1, τ2, . . . , τn−1 le funzioni simmetriche elementari delle n − 1
variabili x2, . . . , xn. Sia dunque
τ1 = x2 + . . .+ xn,
τ2 = x2x3 + . . .+ xn−1xn,
. . . . . . . . .
τn−1 = x2x3 · · · xn.
Di conseguenza
σ1 = τ1 + x1,
σ2 = τ2 + τ1 · x1,σ3 = τ3 + τ2 · x1,. . . . . . . . .
σn = 0+ τn−1x1.
Da queste uguaglianze si deduce anche
τ1 = σ1 − x1,
τ2 = σ2 − τ1x1 = σ2 − σ1x1 + x21,
τ3 = σ3 − σ2x1 + σ1x21 − x
31,
. . . . . . . . .
0 = σn − σn−1x1 + σn−2x21 + . . .+ (−1)n xn1 .
(5.30)
Supponiamo ora che il Teorema 5.1 sia valido per n− 1 radici (indeter-
minate). Allora i coefficienti Ak in (5.29) possono essere espressi mediante
le funzioni τk. Se sostituiamo in (5.29) le τk con le espressioni date dal-
le (5.30), possiamo scrivere φ come un polinomio nella variabile x1, i cui
ciefficienti sono soltanto funzioni delle σk. Possiamo quindi scrivere
φ = B0xp1 + B1x
p−11 + · · ·+ Bp21 (5.31)
21Considerando l’ultima delle (5.30), che corrisponde semplicemente a dire che x1verifica la (5.28), possiamo anche suppore che sia p < n il che puo semplificare quanto
segue (come? Lo si dimostri per esercizio).
88
A causa della simmetria di φ, il polinomio
B0xp + B1x
p−1 + · · ·+ Bp (5.32)
mantiene lo stesso valore con la sostituzione delle radici x1, x2, . . . , xn al po-
sto di x.22 Se dividiamo questo polinomio per il polinomio a primo membro
di (5.28) otteniamo per il resto un polinomio della forma
λ0xn−1 + λ1x
n−2 + · · ·+ λn−1. (5.33)
Il polinomio
λ0xn−1 + λ1x
n−2 + · · ·+ λn−1 −φ (5.34)
puo essere riscritto, utilizzando l’ultima uguaglianza delle (5.30), come un
polinomio di grado n − 1 che ha le n radici x1, x2, . . . , xn e di conseguenza
e identicamente nullo. Questo implica φ = λn−1. Quindi φ e un polinomio
nelle σk. Cauchy sottolinea il fatto che questo teorema consente il calcolo
effettivo, per ricorrenza, di φ come polinomio nelle σk. 2
Esempio 5.6 Consideriamo le tre indeterminate x1, x2, x3 radici di
x3 − σ1x2 + σ2x− σ3 = 0, (5.35)
e sia dato il polinomio
φ = φ (x1, x2, x3) = x21 + x
22 + x
23 + x1x2x3.
Esso puo riscriversi nella forma
φ = x22 + x23 + x2x3 · x1 + x21 =
= (x2 + x3)2 − 2x2x3 + x2x3 · x1 + x21 =
= τ21 − 2τ2 + τ2 · x1 + x21.
La sostituzione delle σ al posto delle τ da
φ = (σ1 − x1)2 − 2
(σ2 − σ1x1 + x
21
)+(σ2 − σ1x1 + x
21
)x1 + x
21 =
= σ21 − 2σ2 + σ2x1 − σ1x21 + x
31.
22In effetti Cauchy (si veda [Cauchy, 1829, p. 133]) da la sua dimostrazione consi-
derando un polinomio il cui comportamento e quello di (5.32) e lascia al suo lettore la
comprensione del meccanismo ricorsivo.
89
Si tratta ora di dividere il polinomio
x3 − σ1x2 + σ2x+ σ
21 − 2σ2,
per il polinomio (5.35). Otteniamo per il resto direttamente
σ21 − 2σ2 + σ3.
Dunque φ = σ21 − 2σ2 + σ3. ♢
90
Capitolo 6
Verso il calcolo differenziale
Nella presentazione moderna del calcolo differenziale si inizia con l’introdurre
il concetto di limite, dopo avere illustrato il concetto di funzione. Una fun-
zione f(x) ha per limite l per x che tende ad x0 quando ad ogni scelta di una
quantita positiva arbitraria ϵ e possibile collegare una quantita positiva δ
in modo che la disuguaglianza |f(x) − l| < ϵ sia soddisfatta per ogni x tale
che 0 < |x − x0| < δ. Strettamente connesso alla definizione di limite e il
concetto di funzione continua.
La derivata viene poi introdotta considerando il limite del rapporto in-
crementale. Una funzione f(x) e derivabile in x0 quando esiste il limite
dif(x0 + h) − f(x0)
h
per h che tende a 0.
I concetti di limite, continuita e derivabilita vengono poi sottoposti ad
un’analisi critica molto raffinata. Un funzione puo essere continua solo in un
punto.1 Una funzione continua in un punto non e necessariamente derivabile
1Si pensi alla funzione di Dirichlet:
D(x) =
{0 per x ∈ Q1 per x ∈ Q
91
in quel punto2, ecc.
Al termine dell’analisi critica, quando si esplora il patrimonio delle fun-
zioni elementari, che in genere sono continue e derivabili indefinitamente,
salvo che in alcuni punti eccezionali, si danno le applicazioni geometriche del
calcolo differenziale. Tra queste la tangente nel punto (x0, f(x0)) al grafico
della funzione f(x):
y− f(x0) = f′(x0)(x− x0). (6.1)
Qui spesso il rigore viene meno. Per certe curve elementari, come le co-
niche, la tangente (geometrica) e definita indipendentemente dal calcolo
differenziale, e si verifica che la (6.1) fornisce esattamente la tangente nota.
Per le curve algebriche il concetto di tangente puo essere collegato all’esistenza
di radici doppie (o multiple) e, modificando per esempio la (6.1) median-
te l’uso della derivazione parziale, possiamo ancora dar senso all’idea che
questa equazione fornisca una retta che coincide con la tangente nota.
Ma per altre curve abbiamo (senza il calcolo) solo un concetto intuitivo
di tangente geometrica, come posizione limite della secante. Se assegnamo
a questa posizione limite un esplicato rigoroso, otteniamo esattamente la
(6.1). Affermare quindi che la (6.1) e la tangente nel punto (x0, f(x0)) e
esattamente come affermare la derivabilita in quel punto.
Nel percorso storico che ha condotto al calcolo differenziale si e posto
all’origine proprio il concetto di tangente ad una curva algebrica. Per ge-
neralizzare questo concetto e venuto alla luce il concetto di funzione e solo
successivamente i concetti di continuita e derivabilita hanno raggiunto la
loro forma attuale.
6.1 Il metodo per le tangenti di Descartes
Questo metodo e introdotto nel Libro Secondo della celebre Geometrie.3
Ne presento qui un’esposizione in termini ‘modernizzati’, con il che, natu-
ralmente molti problemi storici importanti vengono posti in ombra.
La funzione xD(x) e continua solo in 0.2L’esempio piu diffuso e quello di |x| per x = 0.3Cf. [Descartes, 1954].
92
Figura 6.1: Il metodo delle tangenti di Descartes
Il punto P appartenga alla curva di equazione f(x, y) = 0. L’idea di
Descartes e quella di determinare un cerchio, con centro sulla retta y = 04
che abbia la stessa tangente in P della curva data. Poiche in un cerchio
la tangente e perpendicolare al raggio, questo equivale a determinare la
normale alla curva data. Si tratta dunque di terminare un punto Y in modo
tale che il cerchio di centro Y e raggio YP abbia la stessa tangente della
curva data. Poniamo OY = v. La circonferenza di centro Y e raggio PY = r
se Y non e determinato con esattezza (come Y ′ nella figura) intersechera la
curva in P ed in un punto ‘vicino’ P ′. Si tratta di esprimere la condizione
algebrica per la quale questa ‘vicinanza’ sparisca e i due punti P e P ′ vengano
a coincidere.
L’equazione della circonferenza di centro Y e raggio r e
(v− x)2 + y2 = r2.
Eliminando y tra le due equazioni5
f(x, y) = 0, (v− x)2 + y2 = r2,
otteniamo una equazione ϕ(x, [v, r]) = 0 che deve avere una radice doppia.
( Se indichiamo con (x, y) il punto generico dato, dovremmo utilizzare delle4Qui davvero procedo in modo molto sbrigativo. . .5Descartes non dispone ancora di una teoria dell’eliminazione. Ma e chiaro che, in
questo caso, dopo aver sostituito y con√r2 − (v− x)2 basta una semplice quadratura
per ottenere l’equazione risultante.
93
variabili ausiliarie X, Y per ottenere una equazioneϕ(X, x) con una radice
doppia per X = x, ∀x...Ma sono sottigliezze.) Si tratta dunque di esprimere
la condizione per la quale un’equazione algebrica abbia una radice doppia.
Descartes ha qui l’idea straordinaria di utilizzare il metodo dei coefficienti
indeterminati. Se un’equazione algebrica f(x) = 0 ha la radice doppia α
deve essere della forma
(x− α)2g(x).
Si tratta dunque di esplicitare questa condizione.
Consideriamo l’esempio semplice di y2 = 2px.6 Allora
(v− x)2 + 2px− r2 = 0,
ossia
x2 + 2(p− v)x+ v2 − r2 = 0.
L’equazione deve essere della forma
x2 − 2αx+ α2 = 0.
Dal confronto, si ha
v = p+ α.
Se indichiamo ancora con x l’ascissa del punto generico, abbiamo
v = p+ x.
Abbiamo unmetodo, in linea di principio applicabile ad ogni curva algebrica.
Descartes ha l’intuizione fondamentale (pur non possedendo ancora gli
strumenti adeguati per dimostrarlo) che questo metodo, al di la delle dif-
ficolta di calcolo conduce sempre, nel caso delle curve algebriche ad una
soluzione del problema.
Ma quali difficolta dobbiamo affrontare? Vediamo un esempio un po’
piu difficile: il calcolo della tangente alla curva di equazione y = x3.
6Che Descartes non considera, probabilmente perche e appunto troppo semplice.
94
Figura 6.2: Il metodo per la curva y = x3
Il calcolo procede nello stesso modo. Dobbiamo considerare il sistema{y− x3 = 0
(v− x)2 + y2 = r2(6.2)
L’eliminazione della variabile y conduce all’equazione
x6 + x2 − 2vx+ v2 − r2 = 0, (6.3)
che va confrontata con
(x− α)2(x4 + ax3 + bx2 + cx+ d) = 0. (6.4)
Dal confronto dei termini di quinto grado si ha 2α − a = 0, e dunque
a = 2α. Sostituendo nell’equazione che si ottiene eguagliando i termini di
quarto grado si ha b = 3α2, . . . Si arriva a concludere che v = α+3α5.7 Ma
consideriamo un caso appena un po’ piu complicato:
f(x, y) = x3 + y3 − 1 = 0,
e aggiungiamo l’equazione della circonferenza:
(v− x)2 + y2 = r2.
7Se y = x3, si ha yy ′ = 3x5 e quindi v = x+ yy ′ = x+ 3x5.
95
Cosa si ottiene eliminando y?
x6 − 3 vx5 +(15/2 v2 − 3/2 r2
)x4+(
−1+ 6 vr2 − 10 v3)x3+(
−9 v2r2 + 15/2 v4 + 3/2 r4)x2+(
−3 v5 + 6 v3r2 − 3 vr4)x
− 1/2 r6 + 1/2+ 1/2 v6+
3/2 v2r4 − 3/2 v4r2 = 0.
E dobbiamo confrontare questa equazione con
(x− α)2(x4 + ax3 + bx2 + cx+ d).
Si comprende bene il fatto che le difficolta di calcolo sono davvero grandi!
Osservazione 6.1 Ai nostri occhi, il metodo di Descartes sembra segnare
un enorme progresso. Non si tratta piu di formulare una congettura sulla
tangente per poi verificarne l’esattezza, ricorrendo alla dimostrazione per
assurdo. Abbiamo invece da portare a termine un calcolo. Tuttavia, noi
sappiamo (a posteriori) che il calcolo deve condurre ad una soluzione,8 ma
i contemporanei vedevano soprattutto le difficolta di calcolo, all’apparenza
insormontabili.
6.2 La risposta di Fermat
Fermat, dopo aver letto Geometrie di Descartes propone immediatamente
un metodo migliore :9 Il problema del calcolo della tangente e in realta un
problema di minimo. In effetti il clacolo della tangente significa trattare
la curva che si considera come una retta in un intorno del punto desidera-
to. La distanza di un punto da una retta e minima quando si traccia la
perpendicolare.
8Perche, se l’equazione della curva algebrica e f(x, y) = 0, la quantita v, calcolata
per il punto P della curva e xP − yP ·{
fxfy
}P.
9Cf. [Fermat, 1922, vol. I, pp. 133-36].
96
Figura 6.3: La risposta di Fermat
Il segmento YP deve avere lunghezza minima. Consideriamo ancora
f(x, y) = 0, (v− x)2 + y2 = r2.
si tratta di rendere minima la quantita r (o r2, il che e lo stesso).
Ora Fermat possiede un suo metodo per risolvere problemi di massimo
e minimo che espone, nella risposta che da a Descartes, proponendo un
esempio classico: tra tutti i rettangoli di dato perimetro il quadrato e quello
di area massima.
Figura 6.4: Un problema classico
Il prodotto AP × PB deve essere massimo con
AP + PB = p.
Sia AP = x: la quantita x(p−x) deve essere estremale. Dunque deve essere,
introducendo una quantita ‘opportuna’ e:10
x(p− x) = (x+ e)(p− x− e)10Qui semplifico molto. In realta Fermat parla di ‘adegualizzazione’ che poi si trasfor-
ma in uguaglianza. Sulla mancanza di rigore del procedimento di Fermat c’e un’ampia
letteratura.
97
Fermat conduce i calcoli nel modo seguente:
x(p− x) = x(p− x) + e(p− x) − ex− e2
Considera la adegualizzazione come un’uguaglianza.
x(p− x) = x(p− x) + e(p− x) − ex− e2
Poi trascura la quantita e2.
0 = 0+ e (p− x− x)
Considera poi la quantita a coefficiente di e e la eguaglia a 0.
p− 2x = 0⇒ x =p
2.
Abbiamo ritrovato la soluzione classica. Si noti che il metodo non distinge
tra massimi e minimi (o punti di flesso). In questo caso l’esistenza di un
massimo e affidata all’ovvia intuizione geometrica relativa al problema.
Vediamo comunque il metodo di Fermat all’opera ancora con y = x3.
Eliminando la y tra questa equazione e (v− x)2 + y2 = r2 otteniamo
r2 = x6 + x2 − 2vx+ v2
Si tratta ora di sostituire x con x + e e di eliminare i termini uguali nella
adegualizzazione. Poi dobbiamo eliminare tutti i terminin che sono molti-
plicati per la quantita e elevata ad una potenza maggiore di 1. Si comprende
immediatamente che il risultato e (di fatto, la derivazione e ancora lontana)
e · ddxr2. (6.5)
Abbiamo quindi
e · (6x5 + 2x− 2v).
Dunque v = 3x5 + x. Otteniamo, ma in modo molto piu rapido, quanto
visto in precedenza.
98
6.3 Le difficolta da superare (viste a
posteriori)
Consideriamo, utilizzando le notazioni moderne, l’esempio dato da
y = f(x), (v− x)2 + y2 = r2.
Abbiamo
(v− x)2 + f(x)2 = (v− x− e)2 + f(x+ e)2.
Il calcolo diviene
2(v− x) e = f(x+ e)2 − f(x)2.
Sviluppando f(x+e) (prima della formula di Taylor!) avremo un coefficiente
per e1 (che indichiamo, non a caso con f ′(x)), un coefficiente per e2, che
indichiamo con g(x), ecc.
2(v− x) e =(f(x) + ef′(x) + e2g(x) + e3h(x) + . . .
)2− f(x)2
= f(x)2 + 2f(x)f′(x) e + f ′(x)2e2 − f(x)2 =
= 2f(x)f′(x) e .
Quindi
v− x = f(x)f′(x).
Ma un’equazione della forma
y− f(x) = 0
non e un dato naturale nel contesto delle curve algebriche.
Ma anche in questo caso ‘artificiale’ dal punto di vista della matematica
del Seicento, il problema del calcolo della tangente diviene quello di svelare
una struttura. Ecco un esempio per chiarire la difficolta. Sia
f(x) =x+ 1
x− 1,
allora
v = x+ f(x)f′(x) =x4 − 3 x3 + 3 x2 − 3 x− 2
(x− 1)3.
99
Qundo si ottiene il risultato finale, diviene difficile individuare le tappe (gli
algoritmi) che conducono a questo risultato. Naturalmente la situazione e
ancora piu complicata se abbiamo un’equazione del tipo f(x, y) = 0.
Ma tutto e chiaro oggi, con i moltiplicatori di Lagrange:
ϕ(x, y) = (v− x)2 + y2
e una quantita che bisogna minimizzare con il legame dato da
f(x, y) = 0.
Allora
∇f = λ∇ϕ,
ossia ∂f∂x
∂f∂y
= λ
∂ϕ
∂x
∂ϕ
∂y
= λ
−2(v− x)
2y
Quindi
v = x− y∂f∂x∂f∂y
.
Si tratta quindi di comprendere la struttura di calcolo di questo risultato.
Per esempio, se
f(x, y) = x3 + y3 − 1 = 0,
si ha
v =xy2 − x2
y2.
Si tratta di evidenziare, guardando questo risultato, il ruolo delle operazioni
(identiche dal punto di vista algoritmico)
f ∂f
∂x,
f ∂f
∂y,
che si cela nel risultato finale.
100
6.4 Let Newton be. . .
Nel momento in cui Newton inizia a considerare le sue ricerche sul calcolo
egli possiede le conoscenze seguenti.11
• Il metodo per le tangenti di Descartes con tutti gli arrichhimenti rac-
colti da van Schooten nella sua seconda edizione latina della Geome-
trie.12
• (in termini moderni) ∫a0
xndx =an+1
n+ 1;
• La linearita di∫.
Dopo molti tentativi egli arriva a considerare l’iperbole di equazione
ax = y2 − x2.
Figura 6.5: Gli inizi di Newton
11Il percorso intellettuale degli anni giovanili di Newton e analizzato in dettaglio in
Panza [2005]. In ? si trova un’analisi profonda e accurata dell’evoluzione delle idee
newtoniane sul metodo sino agli anni della vecchiaia.12Cf. [Descartes, 61]. In particolare vi si trova esposto il contributo di Fermat visto
nella Sezione 6.2.
101
Newton ha l’idea fondamentale di prendere per v direttamente la sotto-
normale, il che significa che egli calcolera direttamente yy ′ e non x + yy ′.
Accanto all’incremento o (una notazione che egli riprende da Gregory), in-
troduce l’ordinata z, corrispondente a x + o.13 Newton considera le due
equazioni:
a(x+ o) = z2 − (x+ o)2,
v2 + y2 = (v− o)2 + z2
La seconda puo sempre essere sostituita da
z2 = y2 + 2vo.
Sostituendo nella prima, si ha:
ax+ ao = y2 + 2vo −x2 − 2xo+ o2 .
Quindi, con le modalita viste,
v =a
2+ x.
Il suo approccio non tarda a divenire piu sistematico: la seconda ordinata
appare ormai direttamente data da
z2 = y2 + 2vo,
o, all’occorrenza come14
z =√y2 + 2vo = y
(1+
vo
y2
)= y+
vo
y.
13Evidentemente o allude a 0. Newton in questo periodo non ha alcuna preoccupazione
fondazionale.14Newton sa gia, in seguito alla sua lettura di Wallis che
(1+ x)α = 1+ αx+α(α− 1)
1 · 2x2 + . . .
Cf. Whiteside [1961]. Su Wallis si puo vedere il libro recente [Maieru, 2007].
102
In generale (anche se questa generalita si puo dedurre solo dal moltiplicarsi
degli esempi)
f
(x+ o, y+
vo
y
)= 0
e quindi∂f
∂xo +
∂f
∂y
v
yo = 0.
Il risultato precedente appare ‘empiricamente’. Ma Newton comincia a
riflettere sulla ‘cellula fondamentale’
xmyn.
Supponiamo d’avere
f(x, y) = axmyn − b = 0.
Il calcolo ‘pratico’ di v con il nuovo approccio da
a (x+ o)m(y+
vo
y
)n= b
ossia
a (xm +mxm−1o+ . . . )
(yn + nyn−1
vo
y+ . . .
)= b.
Dunque
axmyn + a
(mxm−1yno+ nyn−1xm
vo
y+ . . .
)= b.
Le operazioni che sono coinvolte nel calcolo di v cominciano ad emergere.
mxm−1yn + nyn−1xm · vy= 0.
Newton non tardera a capire che l’essenza del calcolo e data da
xm mxm−1. (6.6)
e naturalmente non tarda a comprendere il legame con l’operazione inversa,
data da
xm xm+1
m+ 1. (6.7)
Le linee essenziali che conducono al calcolo differenziale sono tracciate.
103
Osservazione 6.2 V’e tuttavia un’osservazione importante da aggiungere.
Anche se Newton con i concetti di fluente e flussione giungera molto vicino
a quelli di funzione e di derivata, tuttavia non dara mai un rilievo esplicito
alle regole di derivazione, al contrario di quanto fara Leibniz.
Sia Q(x) una ‘quantita’ dipendente da una quantita fondamentale x. Il
passaggio da Q(x) a Q ′(x) (mi permetto di utilizzare la notazione di La-
grange) avviene per Newton attraverso una mediazione. Si tratta dapprima
di esprimere Q(x) come una somma (finita o infinita) di termini del tipo
Q(x) = axα + bxβ + cxγ + · · · ,
dove a, b, c, . . . sono delle costanti e α,β, γ, . . . dei numeri razionali. Poi
l’algoritmo si applica ad ogni singola cellula e si estende per linearita.
Vedremo tutto questo in dettaglio nel prossimo capitolo.
Anche quando Newton introduce dei simboli come
X, ·X, X·
per denotare delle espressioni che noi indicheremmo con
f(x, y), x∂f
∂x, y∂f
∂y15
si tratta al piu di abbreviazioni comode per indicare l’estensione per lineari-
ta, seguita dalla moltiplicazione per x o per y dell’operazione del tipo (6.6)
eseguita sulle ‘cellule fondamentali’ rispetto all’una od all’altra variabile
(considerando la seconda variabile come una ‘costante’).
15Cf. [Newton, 1981, vol. 1, pp. 289-294]
104
Capitolo 7
Il De Analysi di Newton
Il titolo completo di questo testo e De Analysi per Æquationes Numero Ter-
minorum Infinitas.1 L’uso moderno di abbreviarlo in De Analysi non e solo
per comodita. Indica anche l’idea che l’analisi sia una disciplina autonoma.
Newton, soprattutto negli ultimi anni della sua vita,2 era ben lungi dal con-
dividere quest’idea e cercava invece di restaurare quello che, a suo giudizio,
era l’ideale della scienza greca, un’immaginaria prisca sapientia.
Su invito di Barrow, Newton aveva inviato questo testo a Collins per
informarlo sui progressi compiuti. Si tratta quindi di un’esposizione sche-
matica, che mira ad informare sui risultati ottenuti piuttosto che ad orga-
nizzarli in un quadro rigoroso.3 Proprio per queste ragioni e uno dei testi
piu significativi, ove si coglie lo sviluppo delle idee ancora in fieri.
1Il testo latino, con la traduzione inglese a fronte di Whiteside, si trova in [Newton,
1981, vol. 2, pp. 206-247]. Una traduzione inglese di un tempo di poco successivo a quello
di Newton, della quale anche faro uso, si trova in [Newton, 1964, vol. 1, pp. 3-25]. John
Stewart, l’editore di questo testo (nel 1745) ritiene opportuno, come vedremo, aggiungere
delle dimostrazioni quando ritiene che il testo di Newton non sia piu ‘all’altezza dei
tempi’.2Cf. [Guicciardini, 2009].3Cf. l’Introduzione di Whiteside a [Newton, 1964].
105
7.1 Le regole
Il testo inizia con queste parole:
Il Metodo Generale, che ho inventato un considerevole tempo fa,
per misurare la quantita delle curve per mezzo di serie infinite
nel numero dei termini, e in cio che segue, piuttosto spiegato
brevemente che dimostrato accuratamente.4
Con riferimento alla figura a lato, Newton indica la baseAB con x, l’ordinata
BD assunta come perpendicolare alla base, con y.
Poi a, b, c, . . . indicano delle quantita
date mentre m e n sono numeri interi.
Poste queste convenzioni,vengono intro-
dotte delle regole. La prima e formulata nel
modo seguente:
Regola 7.1 Se axmn = y allora
AreaABD =an
m+ nx
m+nn .5
Al di la dell’evidente valore ‘intrinseco’ della
regola, va osservato il profondo significato dell’uso di un simbolismo ade-
guato. In effetti dobbiamo proprio a Newton un progresso enorme nell’uso
del simbolismo.6
Newton dimostra questa regola solo alla fine del testo. Ma per maggior
chiarezza e meglio vedere la dimostrazione immediatamente. Si notera che,
pur affermando che la relazione tra x ed y puo essere arbitraria, Newton
ritiene opportuno utilizzare dapprima un ‘esempio paradigmatico’.
4“The General Method, which I have devised some considerable Times ago, for mea-
suring the Quantity of Curves, by Means of Series, infinite in the Number of Terms, is
rather shortly explained, than accurately demonstrated in what follows” [Newton, 1964,
vol. 1, p. 3]. La traduzione e mia. Anche nel seguito le traduzioni sono mie.5Newton lascia all’evidenza fornita dalla figura il fatto che sia y(0)=0.6Su questo aspetto si puo vedere [Serfati, 2005], un testo interessante anche se non
esente da certi rilievi critici.
106
Figura 7.1: La figura del De Analysi
Sia dunque, con riferimento alla Figura 7.1, AB = x, BD = y,AreaABD =
z, ‘nel momento iniziale’. Sia poi Bβ = o, BH = v, ove v e determinato in
modo che
Rettangolo BβKH = Superficie BβδD.7
Di conseguenza, se Aβ = x + o, si ha AδB = z + ov. Newton sceglie ora
come esempio la curva che sottende l’area z tale che
z2 =4
9x3.
Allora
(z+ ov)2 =4
9(x+ o)3
e dunque
z2 + 2zov+ o2v2 =4
9
(x3 + 3x2o+ 3xo2 + o3
).
Ora, se si suppone che Bβ diminuisca continuamente fino ad
annullarsi, od a scomparire, v ed y in questo caso diverranno
uguali. . . 8
7Bisognera attendere un secolo e mezzo per metter in discussione questa possibilita. . .8“Now if we suppose Bβ to be diminished infinitely and to vanish, or to be nothing,
v and y in that Case will be equal . . . ” [Newton, 1964, p. 341].
107
Dunque4
9× 3x2 = 2× 2
3x3/2y,
ossia
y =√x.
Ecco ora la dimostrazione generale. Sia
n
m+ nax
m+nn = z. (7.1)
Per semplificare Newton pone nam+n
= c,m+ n = p, in modo che la (7.1) si
riduce a
cnxp = zn. (7.2)
A questo punto sostituisce x + o al posto di x e z + ov al posto di z (o
z + oy: Newton afferma sbrigativamente che e la stessa cosa). Applica
quindi la formula del binomio.9
cn(xp + poxp−1 + · · · ) = zn + noyzn−1 + · · · . (7.3)
Ottiene quindi
cnpxp−1 = nyzn−1. (7.4)
Risostituendo, arriva a concludere che
axmn = y. (7.5)
Newton conclude che, reciprocamente, se axmn = y, sara
n
m+ nax
m+nn = z. 2
Cio che Newton ha dimostrato puo anche interpretarsi come una prima
formulazione del Teorema fondamentale de calcolo.
9Sulla scoperta di questa formula, a partire dalla lettura di Wallis si puo vedere
[Whiteside, 1961].
108
Newton in effetti dispone di tre quanti-
ta, x, y, z disposte come nella figura accanto.
Ecco come si puo riassumere il tutto: se il
legame tra x e z e dato da axα = z, si ha
y = αaxα−1. Se si ha invece y = bxβ, si ha
z = bβ+1xβ+1.
Poiche, come vedremo nella seconda rego-
la, ogni quantita (per Newton) e data da una
somma, eventualmente infinita, di termini del
tipo axα il risultato ha un valore piu generale,
valido per ogni quantita.
Ovviamente piu che una dimostrazione completa si ha qui un compito
affidato alla matematica successiva.
Vediamo ora la seconda regola.
Regola 7.2 Se il valore di y e composto di parecchi termini, conseguente-
mente l’area sara composta dalle aree che risultano da ognuno dei termini.10
Newton si limita a fornire degli esempi per chiarire la regola. Ovviamente
quando si ha un termine della forma x−1 la regola viene ad essere in difetto.
In questo caso e possibile applicare la regola solo se, per esprimersi in termini
moderni, l’integrazione si calcola a partire da un valore β > 0.
La terza regola ha nel contesto della matematica newtoniana un’importanza
fondamentale.
Regola 7.3 Ma se il valore di y o di ognuno dei suoi termini e piu compo-
sto dei precedenti, deve essere ridotto in termini piu semplici, effettuando
l’operazione sulle lettere nello stesso modo con il quale gli aritmetici di-
vidono in numeri decimali, estraggono la radice quadrata, o risolvono le
10“If the Value of y be made up of several such Terms, the Area likewise shall be made
up of the Areas which result from every one of the terms” [Newton, 1964, p. 322]. In
altre parole∫e un operatore lineare.
109
equazioni affette; e successivamente, con le regole precedenti voi scoprirete
le superfici cercate corrispondenti alle curve date.11
Si tratta di trasformare una quantita y data mediante una certa espres-
sione, in un serie di potenze. Ovviamente qui Newton non puo indicare un
metodo generale (anche perche rimane nel vago il modo con il quale y e
assegnata) e deve quindi limitarsi ad esempi paradigmatici. Ecco il primo
esempio.
Sia y =a2
b+ xe vediamo come si deve effettuare la divisione in termini
simbolici.
a2 =a2
b(b+ x) −
a2
bx,
−a2
bx = −
a2
b2x (b+ x) +
a2x2
b2
a2x2
b2=
a2
b3x2 (b+ x) −
a2
b3x3,
. . . . . . . . . . . . . . .
Quindia2
b+ x=a2
b−a2
b
x
b+a2
b
x2
b2− · · ·
Un altro esempio interessante (sul quale non mi soffermo) e dato da
√a2 + x2 = a+
x2
2a−x4
8a3+ · · ·
Si tratta di esempi oggi ben noti i quali tuttavia al tempo di Newton rap-
presentano dei risultati d’avanguardia. Naturalmente la convergenza delle
serie e affidata all’intuizione geometrica.
11“But if the Value of y, or any of it’s Terms be more compounded than the foregoing,
it must be reduced into more simple Terms; by performing the Operation in Letters , after
the same Manner as Arithmeticians divide in Decimal Numbers, extract the Square Root,
or esolve affected Equations; and afterwards by the preceding Rules you will discover the
Superficies of the Curve sought.”[Newton, 1964, p. 324]
110
7.2 Le applicazioni
Chiarite le regole ed il loro uso, Newton presenta delle applicazioni. La pri-
ma applicazione e un metodo per approssimare le radici di un’equazione nu-
merica (il csiddetto metodo delle tangenti di Newton). Il metodo viene poi
esteso anche alle equazioni aventi dei coefficienti letterali: un’applicazione
importante, che consente data una equazione del tipo f(x, y) = 0 di ottenere
lo sviluppo in serie di x o di y. Si tratta di applicazioni ben note, che oggi
vengono riproposte in modo analogo (anche se, ovviamente, con maggior
rigore)
Vediamo dapprima il calcolo approssimato della radice reale dell’equazione
x3 − 2x− 5 = 0.12
L’approssimazione delle radici: il caso numerico
Newton considera l’equazione (f(x) e un’aggiunta mia)
f(x) = x3 − 2x− 5 = 0 (7.6)
e osserva che l’equazione ha una radice compresa tra 2 e 2+ 110.13
La sostituzione data da x = 2+ p nell’equazione fornisce
g(p) = p3 + 6p2 + 10p− 1 = 0.
A questo punto Newton ritiene ragionevole trascurare le potenze di ordine
maggiore di 1 di p e risolve l’equazione 10p− 1 = 0, il che da p = 110.14
12Per la comodita del lettore utilizzo la variabile x invece della y di Newton.13Sostituendo il valore 2 in f(x)si ottiene -1, mentre sostituendo 2+ 1
10si ottiene 61
1000.
Inoltre dalla regola dei segni (di Descartes) si ha che l’equazione f(x) = 0 ha una sola
radice positiva.14A posteriori possiamo notare che
f(2+ p) = f(2) + f ′(2)p+ f ′′(2)p2
2!+ f ′′′(2)
p3
3!.
Quindi Newton calcola p = − f(2)f ′(2) .
111
Si puo procedere con l’equazione g(p) = 0 nello stesso modo. Posto
p = 110+ q, si ha
h(q) = g
(1
10+ q
)= q3 + 6.3q2 + 11.23q+ 0.061 = 0
e si procede nello stesso modo, considerando i termini sino al primo grado
11.23q− 0.061 = 0. Quindi q ≃ −0.0054, e se ci si arresta a questo punto
(ma Newton fa un passo ulteriore) si ha, indicata con x0 la radice
x0 ≃ 2+ p+ q ≃ 2.094.
Osservazione 7.1 Si notera che
h(q) = g
(1
10+ q
)= f
(2+
1
10+ q
)e quindi il secondo passaggio e dato da
2+1
10−f(2+ 1
10
)f ′(2+ 1
10
) .Appare il noto algoritmo iterativo dato da
xn+1 = xn −f(xn)
f ′(xn).
Newton non fornisce tuttavia alcuna argomentazione in merito alla conver-
genza del procedimento, ne vi accosta un’interpretazione geometrica.
L’approssimazione delle radici: il caso delle equazioniaffette
Consideriamo ora l’equazione
y3 + a2y− 2a3 + axy− x3 = 0. (7.7)
Si tratta di un’equazione in y ove compaiono sia una costante a sia una
quantita variabile x. Newton vuole ottenere y come una serie di potenze in
x (che dipende anche dal parametro a).
112
La dimostrazione di Newton ha carattere un po’ qualitativo. Egli infatti
introduce delle nuove variabili p, q, r, . . . alle quali assegna un doppio ruo-
lo: esse trasformano progressivamente l’equazione di partenza f(y; x, a) in
equazioni successive fp(p, x, a), fq(q, x, a), . . . ma poi in queste equazioni
assumono il ruolo ausiliario di monomi di grado 1, 2, 3, . . . che permettono
il passaggio alle equazioni successive.
Ora, per x = 0, si ha l’equazione y3 + a2y − 2a3 = 0, che ha la radice
y = a. Se indichiamo la serie di potenze che vogliamo ottenere con S,
abbiamo allora, arrestandoci al termine costante, S = a+ · · ·Ora Newton pone nell’equazione (7.7) y = p+ a. Ottiene quindi
4a2p+ 3ap2 + p3 + a2x+ apx− x3 = 0. (7.8)
Ora assegna a p un altro ruolo: quello di essere un monomio della forma kx1
che eguagli a zero i termini di primo grado nella (7.8). Newton considera
allora 4a2p e a2x e pone 4a2p + a2x = 0 e quindi p = − 14x. La serie S
diviene S = a − 14x + · · · Procedendo nello stesso ordine di idee, Newton
pone p = − 14x+ q nella (7.8) (ove ora p e di nuovo una variabile) e ottiene
4a2q+ 3aq2 −1
2aqx−
1
16ax2 + q3 −
3
4q2x+
3
16qx2 −
65
64x3 = 0. (7.9)
Se ora si immagina che q sia della forma kx2 e si procede come in precedenza,
si deve porre 4a2q− 116ax2 = 0, ossia q = 1
64ax2. A questo punto abbiamo
S = a−1
4x+
1
64ax2 + · · · (7.10)
ed e chiaro come possiamo ottenere i termini successivi.
7.3 Applicazione ad altri problemi dello
stesso genere
A questo punto, Newton dispone di potenti tecniche per associare a quan-
tita legate da equazioni algebriche sviluppi in serie di potenze e dispone un
algoritmo di calcolo per l’area sottostante ad una data curva. Per procedere
113
oltre deve chiarire che la natura dell’algoritmo non e legata alla raffigura-
zione geometrica. Questa non e altro che un supporto visivo per collegare
la variazione di due quantita. E deve anche mostrare che non vi e alcuna
ragione per la quale la dipendenza debba esprimersi mediante quantita di
genere diverso, come un’estensione lineare da una parte ed una superficie
dall’altra. Tutto cio per noi appare di scarso rilievo, poiche ogni quantita
viene ridotta alla sua valutazione numerica, ma, ovviamente, non e la stessa
cosa per Newton.
Sia ora ABD una curva qualsiasi e AHKB un rettangolo disposto come
in figura, tale che AH = BK = 1. Si immagini il movimento uniforme della
linea DBK a partire dalla posizione AH in modo che questo moto descriva
le due aree.
Figura 7.2: Le applicazioni
Ecco quanto Newton afferma:
. . . dal momento BD dato con continuita voi potete, per mezzo
delle regole precedenti, investigare l’area ABD descritta da esso
o paragonarla con la’area AK (x) che e descritta dal momento
1.
Ora con gli stessi mezzi con i quali la superficie ABD, data
in ogni istante dal suo momento, e scoperta per mezzo delle
regole precedenti, con mezzi simili una qualsiasi altra quantita
114
puo essere investigata a partire dai suoi momenti nello stesso
modo.15
Sviluppi in serie di funzioni elementari
Vediamo uno degli esempi successivi (che ho un po’ modificato).
Figura 7.3: La lunghezza dell’arco
Nella Figura 7.316 il raggio del semicerchio CA sia 1. Sia CB = x
e D,H siano punti ‘infinitamente vicini’ di modo che la linea DT possa
confondersi con la tangente. Vogliamo valutare la lunghezza dell’arco LD.
Il momento dell’arco LD e DH, mentre il momento di CB e BK. Ora
DH : BK = DT : BT = CD : BD. Ora BK = 1, CD = 1, BD =√1− x2 e
quindi
DH
BK=
1√1− x2
=
√1− x2
1− x2. (7.11)
15“. . . from the moment BD continually given, you can, by Means of the preceding
Rules, investigate the area ABD described by it, or compare it with AK (x), which is
described by the moment 1.
Now by thw same Means that the Superficies ABD from it’s Moment being at all
Times given, is discovered by the foregoing Rules, by the like Means may any other
Quantity be investigated from it’s Moment given in like manner.”[Newton, 1964, p. 17]16Per comodita ho ribaltato la figura di Newton
115
Ora 11−x2
= 1+x2+x4+ . . . ,√1− x2 = 1− x2
4− x4
8+ · · · .17 Si tratta quindi
di integrare termine a termine il prodotto di queste due serie. Si ottiene
arc(LD) = x+1
6x3 +
3
40x5 + · · · 18 (7.12)
Successivamente Newton,‘estraendo la radice dell’equazione’, ottiene anche
la serie del seno,
x = z−1
6z3 +
1
120z5 + · · ·
e da questa quella del coseno. In merito alla struttura dei termini delle serie
ottenute, osserva che
. . . quando 5 o 6 termini di queste radici sono noti, in genere, si
puo continuare a piacere, osservando l’analogia della progressio-
ne.19
Il De Analysi termina con alcune considerazioni sulla convergenza. New-
ton non possiede ancora gli strumenti necessari per analizzare compiutamen-
te il problema e si limita a suggerire che la quaestione possa essere trattata
sul modello della Proposizione X.1 degli Elementi. Newton osserva che, nel
caso della serie geometrica
1+ x+ x2 + x3 + · · · ,
posto x = 12si ha (come e evidente) x = 1
2(x + x2 + x3 + . . . ) e x2 =
12(x2 + x3 + . . . ), ecc. Naturalmente questo garantisce la convergenza della
serie per x ≤ 12. Un risultato non entusiasmante. E non e facile comprendere
come possa essere modificato per ottenere risultati piu generali.
17Il prodotto delle due serie da∑∞
n=0 cnx2n, ove cn =
∑nk=0(−1)
k(1/2k
)=
(−1)n(−1/2n
). Un risultato certo accessibile a Newton. Si veda [Gould, 1972, p. 1].
18Ovviamente si tratta della serie dell’arcoseno. Certamente Newton era in grado di
assegnare una formula per il termine generale, ma qui si accontenta di calcolare un certo
numero di termini.19“. . . when 5 or 6 Terms of those roots are known, they may be continued at Pleasure
for most Part, by observing the Analogy of the Progression”. [Newton, 1964, p. 20]
116
Capitolo 8
La serie di Lagrange
8.1 Serie e serie formali
Nel Settecento l’uso degli sviluppi in serie che abbiamo visto nel De analysi
di Newton acquista un rilievo enorme, soprattutto nell’opera di Eulero e di
Lagrange. Tuttavia vi e una differenza importante rispetto all’uso attuale
che occorre segnalare. Questa differenza puo essere ben illustrata da un
esempio. Consideriamo la ‘uguaglianza’ seguente:
1
1− x= 1+ x+ x2 + x3 + · · · (8.1)
La (8.1) puo essere considerata una scrittura incompleta, che va riscritta
nella forma1
1− x= 1+ x+ x2 + x3 + · · · , |x| < 1. (8.2)
Naturalmente, se vogliamo interpretare la (8.1) assegnando un valore ad x,
la (8.2) e una riscrittura indispensabile. Ma possiamo interpretare la (8.1)
anche nell’ambito della teoria delle serie formali. Oggetti del tipo
a0 + a1x+ a2x2 + · · · (8.3)
117
che vengono sommati e moltiplicati o manipolati in vario modo e per i quali,
quando il termine di grado 0 e non nullo, esiste anche l’inverso. In questo
contesto, l’uguaglianza (8.1) significa la possibilita di scrivere
1
1− x= a0 + a1x+ a2x
2 + · · · (8.4)
ossia
1+ 0 x+ 0 x2 + · · · = (1− x)(a0 + a1x+ a2x2 + · · · ). (8.5)
Quindi l’uguaglianza si traduce nelle infinite equazioni
1 = a0,
0 = a1 − a0,
0 = a2 − a1,
. . . . . . . . . . . .
che giustificano la (8.1) nell’ambito della teoria delle serie formali. Nel
Settecento i due aspetti sono separati in modo meno netto. In genere uno
sviluppo in serie viene ottenuto formalmente a partire da un problema e le
riflessioni sulla convergenza vengono demandate, talvolta, alla concretezza
del problema oroginario.
Vediamo un esempio introduttivo: Consideriamo l’equazione di secondo
grado
x2 + px+ q = 0.
Abbiamo per questa equazione la formula risolutiva
x = −p
2±√p2
4− q = −
p
2± |p|
2
√1−
4q
p2.
Utilizzando la serie binomiale possiamo scrivere
x = −p
2± |p|
2
{1+
1
2
(−4q
p2
)+1
8
(−4q
p2
)2+ . . .
}Otteniamo cosı due serie che certamente convergono per infinite scelte di
p e q (quando la serie binomiale risulta convergente) e dunque le due serie
forniscono, in questo caso, un altro modo per risolvere l’equazione. Ma
si puo notare che l’equazione puo avere radici reali e tuttavia la serie di
Lagrange non risultare convergente. . .
118
8.2 La prima formulazione
La serie di Lagrange si ottiene in questo ordine di idee.1 Sia data l’equazione
0 = a0 − a1y+ a2y2 − . . . (8.6)
che supponiamo abbia le radici α1, α2, α3, . . .2 Possiamo supporre che sia
a0 = 0, perche, ovviamente siamo interessati alla ricerca di radici non
nulle. Si puo ulteriormente supporre che sia a1 = 1, il che non alte-
ra la generalita del problema. Possiamo ora scrivere (rammentando che
a0 = (−1)nα1α2 · · ·αn)
a0 − y+ a2y2 − . . . = a0
(1−
y
α1
)(1−
y
α2
)(1−
y
α3
)· · · (8.7)
Dividendo ambo i membri per −y, possiamo scrivere ancora
1−a0
y− a2y+ a3y
2 + . . . =a0
α1
(1−
α1
y
)(1−
y
α2
)(1−
y
α3
)· · · (8.8)
Prendiamo ora i logaritmi di ambo i membri della (8.8):
log
(1−
a0
y− a2y+ a3y
2 + . . .
)=
loga0
α1+ log
(1−
α1
y
)+ log
(1−
y
α2
)+ . . .
(8.9)
Lagrange ora prosegue sviluppando in serie da ambo le parti e confron-
tando i rispettivi sviluppi. Discuteremo in seguito brevemente la possibilita
di operare in questo modo, ma per ora limitiamoci a seguire quanto fa
Lagrange. Indichiamo, per semplicita con Y la quantita data da
Y =a0
y+ a2y− a3y
2 + . . .
e rammentiamo che
−log(1− t) = t+t2
2+t3
3+ · · ·
1La prima formulazione si trova in [Lagrange, 1768].2Lagrange scrive 0 = a− bx+ cx2 − dx3 + . . . ed indica le radici con p, q, r, . . .
119
Abbiamo allora, sviluppando in serie:
Y +Y2
2+Y3
3+ . . . = log
α1
a0+ (8.10)
+
(α1
y
)+1
2
(α1
y
)2+1
3
(α1
y
)3+ . . .
+
(y
α2
)+1
2
(y
α2
)2+1
3
(y
α2
)3+ . . .
+
(y
α3
)+1
2
(y
α3
)2+ ...
...
Il secondo membro della (8.10) ha la forma di una “serie di Laurent”, e vi si
trova un solo termine che contiene y−1 e questo termine ha come coefficiente
α1. Lagrange assume ora (implicitamente) l’ipotesi che sia possibile riscri-
vere la serie a primo membro nella stessa forma, evidenziando le potenze
positive e negative di y. In questa ipotesi, il coefficiente di y−1 nella serie
a primo membro da uno sviluppo in serie che fornisce il valore della radice
α1 . Analogamente il coefficiente di y−2 del secondo membro e 12α21 e dal
confronto con l’analogo coefficiente a primo membro possiamo ottenere il
valore α21...
Una questione va chiarita se vogliamo interpretare in termini ‘moder-
ni’ quanto fa Lagrange. Poiche lo sviluppo scritto a secondo membro ha
evidentemente la forma di una serie di Laurent, ed ha significato solo per
|y| > |α1|, |y| < |α2|, |y| < |α3|, ...
bisogna supporre che le radici siano ordinate in modo che α1 sia la radice
di modulo minimo. Cio che (eventualmente) si ottiene e dunque il valore
della radice di modulo minimo ed il valore delle potenze successive.
Veniamo comunque al problema che ora affronta Lagrange, rimandando
le osservazioni critiche. Si tratta di calcolare i coefficienti di y−1, y−2, y−3, . . .
dello sviluppo
Y +Y2
2+Y3
3+ . . . ,
ove
Y =a0
y+ a2y− a3y
2 + . . .
120
Sia
X = a2y− a3y2 + . . .
Possiamo scrivere
− log (1− Y) = − log
(1−
a0
y− X
)= − log
(1−
a0
y
)−log
1− X
1−a0
y
.Questa manipolazione permette di scrivere ora
− log (1− Y) = Y +Y2
2+Y3
3+ . . . = (8.11)
=a0
y+1
2
a20y2
+1
3
a30y3
+1
4
a40y4
+ . . .+
X
1−a0
y
+1
2
X2(1−
a0
y
)2 + 1
3
X3(1−
a0
y
)3 + 1
4
X4(1−
a0
y
)4 + . . .Si tratta di calcolare il contributo al coefficiente di y−1 del generico
termine1
n
Xn(1−
a0
y
)n .A questo punto Lagrange ha un’altra intuizione di grande efficacia. Egli
comprende che la struttura del calcolo diviene trasparente se si rinuncia al
calcolo esplicito di Xn e ci si limita ad indicare opportunamente i coefficienti
delle potenze successive. Con lieve variazione di simboli, possiamo dunque
scrivere3
Xn = bn,0 + bn,1y+ bn,2y2 + bn,3y
3 + ...
Si ha poi, evidentemente (in notazione moderna)
1
(1− t)n=∑
k
(n+ k− 1
k
)tk.
3Per la verita tutti i termini noti bn,0 sono nulli. Lagrange tuttavia non tiene conto
di questa particolarita.
121
A questo punto il contributo al termine in y−1 di
Xn(1−
a0
y
)nsi riduce al calcolo del coefficiente di grado −1 del prodotto
(bn,0 + bn,1y+ bn,2y
2 + bn,3y3 + ...
)(∑k
(n+ k− 1
k
)(a0
y
)k).
Si ha dunque
bn,0
(n
1
)a0 + bn,1
(n+ 1
2
)a20 + bn,2
(n+ 2
3
)a30 + . . .
e la somma va estesa fin tanto che vi sono termini bn,i non nulli. 4
Se ora guardiamo la struttura della (8.11), abbiamo, con tutta evidenza
per il coefficiente di y−1
a0 +
+b1,0a0 + b1,1a20 + b1,2a
30 + . . .
+1
2
(2b2,0a0 + 3b2,1a
20 + 4b3,1a
30 + . . .
)+
+1
3
(3b3,0a0 + 6b2,0a
20 + . . .
)+
. . .
Abbiamo dunque il valore di α1. In modo analogo si possono dedurre i
valori di α21, α22, . . .
4Se il polinomio di partenza ha grado m, il polinomio X ha grado m − 1, e dunque
Xn ha grado n (m− 1) .
122
Ma Lagrange non si arresta qui! Osservando la struttura della somme
infinite che danno α1, α21, α
31, . . . egli osserva che si puo scrivere
α1 =
{y+ 1 ·
[Xy+
1
2!
d(X2y2
)dy
+1
3!
d2(X3y3
)dy2
+ . . .
]}y=a0
,
α21 =
{y2 + 2 ·
[Xy2 +
1
2!
d(X2y3
)dy
+1
3!
d2(X3y4
)dy2
+ . . .
]}y=a0
,
α31 =
{y3 + 3 ·
[Xy3 +
1
2!
d(X2y4
)dy
+1
3!
d2(X3y5
)dy2
+ . . .
]}y=a0
,
. . .
(8.12)
e dunque, in generale
αm1 =
{ym +m ·
∞∑k=0
1
(k+ 1) !
dk(Xk+1ym+k
)dyk
}y=a0
.
Esempio 8.1 Sia data l’equazione a − y + cy2 = 0. Abbiamo, in questo
caso X = cy. Per calcolare la radice α1 dobbiamo dunque dapprima valutare
la serie
y+ cy2 +1
2!
d(c2y4
)dy
+1
3!
d2(c3y6
)dy2
+1
4!
d3(c4y8
)dy3
+ . . . =
= y+
∞∑k=0
ck+1
k+ 1
(2k+ 2
k
)yk+2,
e poi sostituire in essa il valore y = a. Abbiamo dunque per soluzione
a+
∞∑k=0
ck+1
k+ 1
(2k+ 2
k
)ak+2,
che e esattamente il valore che proviene dallo sviluppo in serie di
1
2c
(1−
√1− 4ca
),
ossia della radice di modulo minimo. Gia si intuisce da questo esempio
come la soluzione data da Lagrange abbia dei limiti di validita. Lo sviluppo
dato e infatti convergente solo per
|ca| <1
4.
123
Continuiamo comunque l’esposizione di cio che Lagrange fa rimandando
alla conclusione di questo paragrafo le critiche. La struttura delle formule
(8.12) suggerisce di dare a quanto trovato la forma seguente. Scriviamo
l’equazione originaria (8.6) nella forma
a− y+φ(y) = 0. (8.13)
La quantita che abbiamo indicato con X e ora semplicementeφ(y)
y.
Indicata con α la radice di modulo minimo, avremo
αm =
ym +m ·
∞∑k=0
1
(k+ 1) !
dk
(φ(y)
yk+1
k+1
ym+k
)dyk
y=a
=
=
{ym +m ·
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1ym−1
)dyk
}y=a
(8.14)
La (8.14) puo essere scritta accanto alla (8.13) qualunque sia il significato
che si voglia attribuire alla funzione φ(y) [...]. E siamo giunti al “Teorema”
che si trova al cuore della memoria di Lagrange.
Secondo il concetto di funzione che egli andra poi compiutamente svi-
luppando [...] ma che e gia ora ben presente nei suoi tratti essenziali, una
funzione “arbitraria” F(y) di y e data semplicemente da
F(y) = c0 + c1y+ c2y2 + c3y
3 + . . .
124
Ma dalla (8.14) deduciamo, valutando F in α
F(α) = c0 + c1α+ c2α2 + c3α
3 + . . . =
c0+
c1
{y1 + 1 ·
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1y1−1
)dyk
}y=a
+
c2
{y2 + 2 ·
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1y2−1
)dyk
}y=a
+
c3
{y3 + 3 ·
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1y3−1
)dyk
}y=a
+
. . .
Ma questo significa:
F(α) = F(a) +
{ ∞∑j=1
cj · j ·∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1yj−1
)dyk
}y=a
=
= F(a) +
{ ∞∑j=1
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1cj· · j · yj−1
)dyk
}y=a
=
= F(a) +
∞∑j=1
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1
d
dy
(cj · yj
))dyk
y=a
.
Immaginiamo ora di poter invertire l’ordine delle sommatorie. Avremo
allora
F(α) = F(a) +
∞∑k=0
1
(k+ 1) !
dk
(φ(y)k+1
∞∑j=1
d
dy
(cj · yj
))dyk
y=a
=
= F(a) +
∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1
dF(y)
dy
)dyk
y=a
(8.15)
125
La (8.15) costituisce la celeberrima“Formula di inversione di Lagrange”.
Ecco ora alcune osservazioni. Qual e il significato della serie (8.15) ?
E piu facile comprenderlo se esaminiamo dapprima il caso particolare di
grande importanza dato da F(y) = y . In tal caso la (8.15) diviene:
α = a+
{ ∞∑k=0
1
(k+ 1) !
dk(φ(y)k+1
)dyk
}y=a
. (8.16)
Il significato della (8.16) e che essa fornisce una serie infinita, nella varia-
bile a e negli altri eventuali parametri contenuti inφ(y) la quale formalmen-
te verifica l’equazione (8.13). Abbiamo cioe una soluzione di quest’ultima
equazione nell’ambito della teoria delle serie formali. Analogamente, la
(8.15) significa che, se noi sostituiamo in F(y), assegnata con un certo svi-
luppo in serie, al posto di y la serie data dalla (8.16) otteniamo lo stesso
risultato che da la serie a secondo membro della (8.15). Ancora una volta
si ha un’identita nell’ambito delle serie formali.
Ma la dimostrazione di Lagrange e atta a sostenere questo risultato? Nel
caso in cui φ(y) e un polinomio la dimostrazione data si colloca agevolmente
nell’ambito della teoria delle serie formali. Ma Lagrange sembra alludere
(e di fatto poi utilizzera il suo risultato in questo senso) alla possibilita che
φ(y) abbia un significato piu ampio.5
E possibile riformulare il risultato in questo modo nell’ambito di una
struttura dimostrativa omogenea?
E difficile affermarlo, perche il passagio dalla (8.9) alla (8.10) presuppone
un numero finito di radici (o almeno di un intervallo finito tra la radice di
modulo minimo e quella immediatamente superiore). Anche nell’ambito
della teoria delle serie formali vi e una divergenza tra il risultato enunciato
e la dimostrazione fornita.
Ma questo e solo il primo problema: di grande importanza e anche il pro-
blema di decidere in merito alla convergenza delle serie proposte. Lagrange
si occupera di questo problema nella parte terminale del suo saggio.
Ma, seppure in modo molto ingegnoso, non fara che valutare l’ordine di
infinitesimo del termine generale in qualche esempio concreto.[Questa parte
5Come si vede nella memoria [Lagrange, 1769].
126
va completata. Nella memoria vi e anche una riproposizione dei risultati in
termini formali . . . .]
Aggiungo invece qualche osservazione sul problema della convergenza. Il
secondo membro della (8.10) si presenta, come abbiamo gia osservato, nella
forma di una serie di Laurent. Indicando la radice di modulo minimo con
α e le rimanenti radici con αi, la convergenza e garantita per |α| < |y| <
min(|αi|).
Guardiamo ora il primo membro. Potremo scrivere
− log (1− y) = y+y2
2+y3
3+ . . .
soltanto se |y| < 1. Questa disuguaglianza sara verificata in un certo aperto
del piano complesso, sia essoA. Indichiamo con Γ la corona circolare definita
da |α| < |y| < min(|αi|). Sia Sia B l’intersezione di A e Γ . La regione B e
ovviamente un aperto del piano complesso.
127
8.3 La formulazione nella Theorie des
fonctions analytiques
Lagrange, nella Theorie des fonctions analytiques del 1797 riprende la que-
stione dell’equazione funzionale, tenendo conto (implicitamente) delle criti-
che di Laplace.6
Lagrange scrive ora l’equazione nella forma piu conveniente
y = t+ xf(y) (8.17)
per la quale non e piu necessario supporre che f(y) sia un polinomio e for-
nisce una nuova dimostrazione (o meglio una traccia dimostrativa che il
lettore dovrebbe completare) che tiene conto delle idee di Laplace (che tut-
tavia non viene nominato), ma ha un andamento un po’ diverso. Lagrange
comincia con l’osservare che lo sviluppo in serie di y secondo le potenze di x
iniziera con i due termini t+ xf(t). Se infatti immaginiamo che lo sviluppo
di f(y) sia dato da
f(y) = b0 + b1y+ b2y2 + . . . ,
e che sia
y = a0 + a1x+ a2x2 + . . . ,
avremo
a0 + a1x+ a2x2 + . . . = t+ x
{b0 + b1
(a0 + a1x+ a2x
2 + . . .)+
+b2(a0 + a1x+ a2x
2 + . . .)2
+ . . . } .
Allora evidentemente a0 = t, e a1 = b0+b1a0+b2a20+ . . . = b0+b1t+
b2t2 + . . . = f(t).
Cio premesso, deduciamo, al modo di Laplace, differenziando la (8.17)
rispetto a t e rispetto ad x, le nuove equazioni
∂y
∂t= 1+ xf′(y)
∂y
∂t,
∂y
∂x= f(y) + xf′(y)
∂y
∂x.
6Si vedano le memorie [Laplace, 1780], [Laplace, 1779]. Per il testo di Lagrange
utilizzo la terza edizione: [Lagrange, 1847].
128
E dunque
∂y
∂x= f(y)
∂y
∂t. (8.18)
Ora pero, Lagrange procede diversamente rispetto a Laplace, ed osserva
che dalla (8.17) si trae
f(y) =y− t
x.
Abbiamo percio
x∂y
∂x− (y− t)
∂y
∂t= 0. (8.19)
Supponiamo ora che sia
y = t+ a1x+ a2x2 + a3x
3 + . . . ,
ove, naturalmente ai = ai(t) (e gia sappiamo che a1 = f(t). Ma Lagrange
procede per ora in generale rinviando al seguito la considerazione di questo
fatto). Avremo percio:
∂y
∂x= a1 + 2a2x+ 3a3x
2 + . . . ,
∂y
∂t= 1+
da1
dtx+
da2
dtx2 +
da3
dtx3 + . . .
Sostituendo nella (8.19) abbiamo
a1x+ 2a2x2 + 3a3x
3 + . . . =(a1x+ a2x
2 + a3x3 + . . .
)(1+
da1
dtx+
da2
dtx2 +
da3
dtx3 + . . .
).
Dividendo per x si ottiene:
a1+2a2x+3a3x2+. . . =
(a1 + a2x+ a3x
2 + . . .)(1+
da1
dtx+
da2
dtx2 +
da3
dtx3 + . . .
)129
Gia sappiamo che a1 = f(t). Abbiamo ora:
2a2 = a1da1
dt+ a2,
3a3 = a1da2
dt+ a2
da1
dt+ a3,
4a4 = a1da3
dt+ a2
da2
dt+ a3
da1
dt+ a4,
. . .
nan = a1dan−1
dt+ a2
dan−2
dt+ . . .+ an−2
da2
dt+ an−1
da1
dt+ an
Si ha dunque, con tutta evidenza:
a2 =d
dt
(1
2a21
),
a3 =1
2
d
dt(a1a2),
a4 =1
3
d
dt
(a1a3 +
1
2a22
),
. . .
an =1
n− 1
d
dt(a1an−1 + a2an−2 + . . .),
dove, se n e pari il prodotto dei termini an/2dan/2
dtva dimezzato. A questo
punto Lagrange, esaminando i primi casi, osserva che in generale
an =1
n!
dn−1
dtn−1[f(t)n] , (8.20)
lasciando al lettore i dettagli dimostrativi. Si puo pensare di utilizzare la
formula di Lebniz:
dn
dtn[u(t)v(t)] =
n∑r=0
(n
r
)dr
dtr[u(t)]
dn−r
dtn−r[v(t)] (8.21)
adattandola adn−1
dtn−1[f(t)n−1f(t)]. (8.22)
130
ma la dimostrazione non e immediata. Ovviamente Lagrange gia conosce
il risultato e quindi puo trascurare i dettagli dimostrativi lasciandoli al
lettore.7
Nella sezione successiva accenno brevemente alla dimostrazione data da
Laplace in [Laplace, 1780] in precedenza che puo essere adattata al caso in
questione.
Utilizzando la scrittura (8.20) abbiamo, per l’espressione della radice:
y = t+
∞∑n=1
xn
n!
dn−1
dtn−1[f(t)n] (8.23)
ove il parametro a e ora indicato con t ed abbiamo semplificato la notazione
per le derivate calcolate in t. Ovviamente, ponendo x = 1 si ritrova la (8.15)
nella formulazione originaria.
In corrispondenza a questa nuova situazione, abbiamo anche per una
arbitraria funzione F(y)
F(y) = F(t) +
∞∑n=1
xn
n!
dn−1
dtn−1
[dF(t)
dtf(t)n
]. (8.24)
8.4 La dimostrazione di Laplace
In questa sezione adatto i contenuti di [Laplace, 1780] per dimostrare la
(8.20). Tuttavia il risultato di Laplace e piu generale. Partendo infatti da
y = φ(t+ xf(y))
7Nel caso polinomiale, la dimostrazione data con le formule (8.12) e sufficiente. Qui
pero si tratta di ua situazione piu generale e non si puo adattare quella dimostrazione. Per
una semplice dimostrazione nel contesto della teoria delle funzioni analitiche si puo vedere
[Prasolov, 2004, pp. 37-40]. Un’elegante dimostrazione in un contesto algebrico ‘vicino’
a quello di Lagrange si trova in rete nelle Lezioni di Meccanica Celeste (capitolo 1) di
A. Giorgilli (si veda http://newrobin.mat.unimi.it/users/giorgilli/). Una dimostrazione
moderna nel contesto delle serie formali e data da [Henrici, 1964]. Lo stesso Lagrange
riprende la questione in [Lagrange, 1808] (si veda ache [Lagrange, 1826]), ma ancora una
volta si affida ad una sorta di induzione qualtativa.
131
egli ottiene, per una arbitraria funzione u = u(y)(∂nu
∂xn
)x=0
=∂n−1
∂tn−1
[fn(φ(t))
∂u(φ(t))
∂t
].
Il risultato di Lagrange si ottiene con φ = id. Si noti che ponendo invece
f(y) = 1 si ottiene la formula di Taylor.
Riprendiamo la (8.18), e consideriamo un’arbitraria funzione
u = u(y) = q0 + q1x+ q2x2 + · · · ,
ove i coefficienti qi sono, naturalmente, funzioni di t. Per comodita utiliz-
ziamo ora la notazione per le derivate parziali per evidenziare il ruolo (for-
male) delle molte manipolazioni succesive. Incominciamo con il dimostrare
che∂nu
∂xn=∂n−1
∂tn−1
[fn(y)
∂u
∂t
]. (8.25)
Abbiamo, per la formula di derivazione delle funzioni composte e per la
(8.18),∂u
∂x=∂u
∂y
∂y
∂x= f(y)
∂u
∂y
∂y
∂t. (8.26)
Dunque∂u
∂x=∂
∂t
∫f(y)
∂u
∂ydy (8.27)
e quindi∂2u
∂x2=
∂2
∂t∂x
∫f(y)
∂u
∂ydy. (8.28)
Ora, nella (8.27) si puo sostituire u con∫f(y)∂u
∂ydy e si ottiene:
∂∫f(y)∂u
∂ydy
∂x=∂
∂t
∫f(y)
∂
∂y
[∫f(y)
∂u
∂ydy
]dy =
∂
∂t
∫f2(y)
∂u
∂ydy. (8.29)
Dalla (8.28) e dalla (8.29) si ottiene
∂2u
∂x2=∂2
∂t2
∫f2(y)
∂u
∂ydy. (8.30)
132
Si tratta ora di procedere nello stesso modo, sostituendo∫f2(y)∂u
∂ydy al posto
di u nella (8.27), e si giunge a
∂nu
∂xn=∂n
∂tn
∫fn(y)
∂u
∂ydy. (8.31)
Ma si ha
∂n
∂tn
∫fn(y)
∂u
∂ydy =
∂n−1
∂tn−1
[fn(y)
∂u
∂y
∂y
∂t
]=∂n−1
∂tn−1
[fn(y)
∂u
∂t
]. (8.32)
La (8.25) e dimostrata. Si osservi ora che
qn =1
n!
(∂nu
∂xn
)x=0
e che per x = 0 si ha y = t. Dunque
qn =1
n!
∂n−1
∂tn−1
[fn(t)
∂u
∂t
](8.33)
In particolare per u(y) = y si ottiene la (8.20).
8.5 Qualche applicazione alla combinatoria
Partiamo dall’equazione consueta8
y = t+ xf(y),
e sia, questa volta,
y = t+ xey.
Scegliamo ora F(y) = eay, abbiamo allora:
eay = eat +
∞∑n=1
xn
n!
dn−1
dtn−1
[aeatent
]=
= eat + a
∞∑n=1
xn
n!
dn−1
dtn−1
[e(a+n)t
]=
= eat + a
∞∑n=1
xn
n!(a+ n)n−1 e(a+n)t.
8Si veda [Hurwitz, 1902], [Riordan, 1968].
133
In particolare, per t = 0, ossia per y = xey, abbiamo
eay = a
∞∑n=0
xn
n!(a+ n)n−1 .9
Possiamo riscrivere questa formula sostituendo b al posto di a, e si ha
in questo caso:
eby = b
∞∑n=0
xn
n!(b+ n)n−1 .
Ma eayeby = e(a+b)y, e dunque:
ab
{ ∞∑n=0
xn
n!(a+ n)n−1
}{ ∞∑n=0
xn
n!(b+ n)n−1
}=
= (a+ b)
∞∑n=0
xn
n!(a+ b+ n)n−1 .
Ne deduciamo immediatamente
(a+ b) (a+ b+ n)n−1 = ab
n∑k=0
(n
k
)(a+ k)k−1 (b+ n− k)n−k−1 ,
ossia una identita dovuta ad Abel.
Torniamo ora a considerare la uguaglianza
eay = a
∞∑n=0
xn
n!(a+ n)n−1 , (y = xey) .
Ponendo in essa a = 1, otteniamo
ey =
∞∑n=0
xn
n!(n+ 1)n−1 .
9Si noti che, modificando la sommatoria iniziando con il valore n = 1 si aggiunge
1. . . Quindi eay si ottiene facendo iniziare la somma con 0.
134
e dunque
y = xey = x
∞∑n=0
xn
n!(n+ 1)n−1 =
=
∞∑n=0
xn+1
n!(n+ 1)n−1 =
∞∑n=0
xn+1
(n+ 1) !(n+ 1)n =
=
∞∑n=1
xn
n!nn−1.
Abbiamo quindi uno sviluppo in serie che descrive la soluzione di y = xey
(nel senso delle serie formali). Naturalmente queste manipolazioni non for-
niscono informazioni sulla convergenza e in effetti la serie trovata e diver-
gente.10 Tuttavia il risultato trovato ha grande importanza nel contesto
della combinatorica.11
10Si noti che nn−1
n! →∞.11Si veda [Wilf, 1994]. La formula e utilizzata per il conteggio degli alberi etichettati.
135
Capitolo 9
Frazioni continue
Lo scopo di questo capitolo e quello di presentare alcune semplici proprieta
delle frazioni continue. Nella parte finale vedremo uno dei primi risultati
ottenuti da Evariste Galois.
Galois e, nella storia della matematica, l’eroe romantico per eccellenza.
Proprio per questa ragione, la possibilita di parlare di Galois puo essere
un’ottima occasione per attirare l’attenzione degli studenti e per un loro
coinvolgimento attivo. Al tempo stesso, bisogna evitare che la presentazio-
ne si risolva in pura ideologia e che le vicende biografiche siano la premessa
per affermazioni generiche del tipo ‘Galois e il fondatore dell’algebra mo-
derna’, ‘Galois e l’inventore della teoria dei gruppi’, ecc. senza che a queste
affermazioni faccia seguito una presentazione, ancorche minimale, dei suoi
contributi scientifici.1 Ovviamente, non e possibile presentare la Teoria di
Galois senza un’adeguata premessa algebrica. E pero possibile presentare
il suo risultato sulle frazioni continue senza la necessita di troppe premes-
1Comunque, la presentazione piu equilibrata, a mio giudizio, delle vicende biografiche
di Galois e [Auffray, 2004] (con qualche imprecisione matematica). Anche notevole e
[Rothman, 1982]. Interessante, anche se molto fantasioso, e [Toti Rigatelli, 1996]. Il
romanzo di Petsinis [Petsinis, 1997], tradotto anche in italiano, e di gradevole lettura
anche se la presentazione della matematica attribuita a Galois e inadeguata.
137
se. Certamente questo risultato non e paragonabile per importanza ai suoi
profondi teoremi algebrici. Si tratta pero, comunque, di un lavoro notevole.
9.1 Radici quadrate: algoritmi
Consideriamo l’algoritmo per estrarre la radice quadrata. Esso si fonda
sulla seguente proprieta che puo essere utilizzata per un calcolo ricorsivo.
(x1 + x2)2 = x21 + (2x1 + x2)x2
(x1 + x2 + x3)2 = (x1 + x2)
2 + (2x1 + 2x2 + x3)x3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
(x1 + · · ·+ xn−1 + xn)2 = (x1 + · · ·+ xn−1)2 + (2x1 + · · ·+ 2xn−1 + xn)xn
Questa semplice proprieta e alla base del calcolo aritmetico abituale.
Ad esempio, per calcolare√2 dobbiamo dapprima individuare il piu grande
intero x1 per il quale sia
x21 < 2.
Dunque x1 = 1 =1010
Poi si tratta di individuare il piu grande intero x2 tale che
(20+ x2)x2 < 100,
il che da x2 = 4 =40100
. Ora occorre calcolare x3 in modo che
(240+ x3)x3
non superi 400 e si ottiene x3 = 1, . . .
Il calcolo procede con sempre maggior complessita, ed occorre utilizzare
tutto quanto trovato in precedenza. Per calcolare la cifra successiva, occorre
determinare il piu grande intero x4 tale che
(2820+ x4)x4 < 11900, ecc.
138
Si consideri invece lo schema di calcolo seguente per√2 (che verra giu-
stificato in seguito):
p−1 = 1, q−1 = 0;
p0 = 1, q1 = 1;
pk+1 = 2 · pk + pk−1; (9.1)
qk+1 = 2 · qk + qk−1. (9.2)
Consideriamo (per k ≥ 0) le frazioni
pk
qk.
Si ha facilmente:1
1,3
2,7
5,17
12,41
29,99
70,239
169, . . .
Si osservi ora che:
• Il calcolo e molto semplice;
• le frazioni approssimano molto rapidamente√2;
• Non occorre, ad ogni passo ‘ricapitolare’ tutto il procedimento;
• Cio che di specifico compare di√2 e solo la parte intera 1, ed il
‘periodo’, 2.
Con√5 il calcolo procede in modo molto simile, occorre pero porre a0 = 2
e modificare le (9.1),(9.2), ponendo
pk+1 = 4 · pk + pk−1;qk+1 = 4 · qk + qk−1.
Abbiamo2
1,9
4,38
17,161
72,682
305, . . .
139
Il tipo di calcolo che abbiamo visto per√2,√5 si estende ad ogni numero
della forma√n con questo schema piu generale:
p−1 = 1, q−1 = 0;
p0 = c0, q1 = 1;
pk+1 = ck+1pk + pk−1; (9.3)
qk+1 = ck+1qk + qk−1,
dove c0 = ⌊√n⌋ e i numeri ck non sono piu necessariamente tutti uguali, ma
si ripetono da un certo posto in poi (su questo otterremo un risultato piu
preciso nella Sezione 9.4). Ad esempio, per√19, abbiamo per i successivi
ck
4, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, . . .
Possiamo scrivere, per indicare l’algoritmo:
√19 = [4, 2, 1, 3, 1, 2, 8 ]
E possibile che questo tipo di calcolo per gli irrazionali quadratici abbia
preceduto quello modellato sulla la teoria delle proporzioni, tradizionalmen-
te attribuita ad Eudosso.2 E un calcolo tuttavia, molto particolare. E molto
facile calcolare il reciproco di un numero: se γ = [c0, c1, c2, . . . ] e un numero
positivo (c0 ≥ 0),γ−1 = [0, c0, c1, c2, . . . ]
Ma non esiste alcun algoritmo semplice per la somma!
Ad esempio: √2 = [1, 2 ],
√5 = [2, 4 ]
Ma √2+
√5 = [3, 1, 1, 1, 6, 8, 1, 2, 1, 2, 2, 1, 101, 13, 1 . . . ]
Fino ad ora non e stata notata alcuna regolarita.
2Si vedano, in particolare, i molti lavori di Fowler. Tra questi, in partico-
lare, [Fowler, 1987]. Una rapida esposizione della teoria di Eudosso si trova in
[Galuzzi e Rovelli, 1997].
140
9.2 Principali proprieta
Ad Eulero si deve prima esposizione sistematica della teoria delle frazioni
continue.3 La teoria e stata ripresa e sviluppata poi da Lagrange nelle note
aggiunte alla traduzione francese dell’Algebra di Eulero.4
Un primo aspetto con il quale compaiono naturalmente le frazioni con-
tinue e quello della ricerca di frazioni ‘piu semplici’.5 Data la frazione
345723
245125= 1.410394697,
abbiamo24
17= 1.411764706,
55
39= 1.410256410 (9.4)
Queste frazioni semplici si trovano (come vedremo) mediante lo sviluppo
in frazione continua.
L’algoritmo di Euclide si lega naturalmente alle frazioni continue finite.
Si tratta di un altro modo, conveniente, di rappresentare i numeri razionali.
Consideriamo la frazione137
101.
137 = 1 · 101+ 36101 = 2 · 36+ 2936 = 1 · 29+ 729 = 4 · 7+ 1
Allora, dalla prima riga:
137
101= 1+
36
101= 1+
1
101
36
.
3Nella Introductio in analysin infinitorum, del 1748. Si puo vedere la facilmente
accessibile traduzione inglese: [Euler, 1988, cap. XVIII].4Si tratta di [Euler, 1773]). Si veda anche [Lagrange, 1879, vol. VII].5Una chiara concisa e rigorosa presentazione degli aspetti essenziali della teoria delle
frazioni continue e [Bombieri e van der Poorten, 1995].
Si puo vedere anche il classico [Hardy e Wright, 1971] o i piu recenti [Lorentzen e
Waadeland, 1992; Rockett e Szus, 1992]. [Olds, 1968] e un testo elementare ma ben
fatto.
141
Dalla seconda riga:
137
101= 1+
1
2+29
36
= 1+1
2+1
36
29
Con i numeri trovati: 1, 2, 1, 4 possiamo costruire la frazione continua:
1+1
2+1
1+1
4
Le frazioni piu semplici sono quelle che si ottengono usando solo ‘una parte’
della lista
[1, 2, 1, 4].
In questo modo sono stae ottenute le frazioni (9.4).
Ecco un altro esempio: l’algoritmo per√2:
(√2− 1)(
√2+ 1) = 1.
Allora (!)√2− 1 =
1√2+ 1
=1√
2− 1+ 2
Quindi√2− 1 =
1
2+1
√2+ 1
Si puo procedere indefinitamente: otteniamo la frazione continua infinita
1+1
2+1
2+1
2+ . . .
.
Vedremo in seguito come precisare questa nozione; per ora ci limitiamo a
questa definizione:
142
Definizione 9.1 Una frazione continua (aritmetica) finita e data da
c0 +1
c1 +1
c2 + . . .+1
ch
, (ci ≥ 1 per i ≥ 1).
Evidentemente e solo un altro modo (vantaggioso) di scrivere un numero
razionale.
Definizione 9.2 Le successive frazioni
p0
q0= c0,
p1
q1= c0 +
1
c1,p2
q2= c0 +
1
c1 +1
c2
, . . .
sono dette convergenti. I numeri ci sono detti quozienti parziali.
Mostriamo ora che pk, qk verificano le formule seguenti (ove, per como-
dita, si introducono anche p−1 e q−1):
p−1 = 1, p0 = c0,
pk+1 = ck+1 · pk + pk−1q−1 = 0, q0 = 1,
qk+1 = ck+1 · qk + qk−1.
(9.5)
Siapk
qkla k-esima convergente. Esaminiamo il passaggio alla convergente
successiva: si tratta di effettuare la sostituzione
ck+1 ←− ck+1 + 1
ck+2.
Allora: (ck+1 +
1ck+2
)pk + pk−1(
ck+1 +1
ck+2
)qk + qk−1
=pk+1 +
pkck+2
qk+1 +qkck+2
=ck+2pk+1 + pkck+2qk+1 + qk
Abbiamo verificato le (9.5).
143
Osservazione 9.1 Si noti che possiamo scrivere:(pk pk−1
qk qk−1
)(ck+1 1
1 0
)=
(ck+1pk + pk−1 pk
ck+1qk + qk−1 qk
),
e quindi (c0 1
1 0
)(c1 1
1 0
)· · ·
(ck+1 1
1 0
)=
(pk+1 pk
qk+1 qk
). (9.6)
Ne segue che
pk+1qk − pkqk+1 = (−1)k. (9.7)
Corollario 9.1 Le frazionipk
qkdate dalle (9.5) sono ridotte ai minimi
termini.
Corollario 9.2 Trasponendo il prodotto matriciale (9.6), abbiamo
pk
pk−1= [ck, ck−1, . . . , c0],
qk
qk−1= [ck, ck−1, . . . , c1].
Un’equazione diofantea
Una semplice applicazione: risolviamo, quando possibile, l’equazione
mx+ ny = 1.
Supponiamo m,n primi fra loro, e sviluppiamo in frazione continua fino ad
ottenerem
n=pk+1
qk+1.
Abbiamo per la proprieta (9.7)
mqk − pkn = (−1)k.
Esempio 9.1 Risolviamo
27x+ 43y = 1.
144
Abbiamo27
43=
1
1+1
1+1
1+1
2+1
5
La penultima ridotta vale 58. Allora
27 · 8− 43 · 5 = 1. �
Osservazione 9.2 Da
pk+1qk − pkqk+1 = (−1)k,
deduciamo ∣∣∣∣pk+1qk+1−pk
qk
∣∣∣∣ = 1
qk+1qk. (9.8)
Consideriamo la differenza
pk+1
qk+1−pk
qk=
(−1)k
qkqk+1.
Poiche, come abbiamo visto
q−1 = 0, q0 = 1, qk+1 = ak+1 · qk + qk−1,
si ha q1 ≥ 1, q2 ≥ 2, . . . e, in generale, qk ≥ fk, ove fk e il k-esimo numero
di Fibonacci.
La proprieta (9.8) permette di dare un senso preciso al concetto di frazione
continua infinita. Consideriamo una successione di interi c0, c1, c2, . . . con
ci ≥ 1 per i ≥ 1. Possiamo definire mediante le (9.5) le frazioni pkqk
dette
ancora convergenti parziali. Ossia, ancora una volta poniamo
p−1 = 1, p0 = c0,
pk+1 = ck+1 · pk + pk−1q−1 = 0, q0 = 1,
qk+1 = ck+1 · qk + qk−1.
(9.9)
145
Si noti che il calcolo di pkqk
coinvolge solo gli interi c0, c1, . . . , ck e dunque le
convergenti parziali sono ben definite.
La convergenza della frazione continua aritmeticainfinita
Abbiamo
pk+1
qk+1=p0
q0+
k∑i=0
(pi+1
qi+1−pi
qi
)=p0
q0+
k∑i=0
(−1)i
qiqi+1.
La serie (a segni alternati) ∞∑i=0
(−1)i
qiqi+1
e convergente, e quindi il limite
γ = limk→∞
pk
qk
esiste. Per definizione questo limite e il valore della frazione continua.
Si noti che la convergenza avviene alternatamente dal di sotto e dal di
sopra.
Esempio 9.2 Consideriamo ancora la frazione continua
[1, 2, 2, 2, . . . ]
Abbiamo
p : 1, 1, 1 · 2+ 1 = 3, 3 · 2+ 1 = 7, 7 · 2+ 3 = 17, . . .q : 0, 1, 1 · 2+ 0 = 2, 2 · 2+ 1 = 5, 5 · 2+ 2 = 12, . . .
Quindi, le convergenti sono
1,3
2,7
5,17
12, . . .
Abbiamo
1, 1.5, 1.4, 1.416666 . . . ,
procedendo nel calcolo si ha
41
29,99
70= 1.414285714.
146
Si ottengono approssimazioni molto buone. Su questo si veda la Sezione
9.2. Comunque ora ha un senso preciso dire che le convergenti parziali
costituiscono una successione convergente. Rimane ancora da stabilire che
la convergenza e verso√2. Questo si vedra tra breve.
Come abbiamo gia osservato, le frazioni continue finite
ph
qh= [c0, c1, . . . , ch]
sono dette le convergenti del numero reale γ definito dalla frazione continua.
Definizione 9.3 Le code
γh+1 = [ch+1, ch+2, . . .]
sono dette quozienti completi.
Formalmente, possiamo scrivere
γ = [c0, c1, . . . , ch, γh+1].
Abbiamo
γ−ph
qh= (−1)h
[1
qhqh+1−
1
qh+1qh+2+ . . .
].
Ne consegue che ∣∣∣∣γ−ph
qh
∣∣∣∣ < 1
qhqh+1.
Osservando che qh+1 = ch+1qh + qh−1 si ha anche∣∣∣∣γ−ph
qh
∣∣∣∣ < 1
ch+1q2h
.
Se dunque si ha un quoziente parziale ch+1 molto grande si ha una buona
approssimazione.
147
Osservazione 9.3 Si noti che una gran parte delle considerazioni svolte
su [c0, c1, . . . , cn] o su [c0, c1, . . . , cn, . . . ] nell’ipotesi che i ci siano interi,
hanno in realta un significato piu ampio.6 Ad esempio, si ha, utilizzando le
convenzioni precedenti per [c0, c1, . . . , cn, α], ove α e una indeterminata o
un numero reale ed i ci sono interi (maggiori di 1 per i ≥ 1),
[c0, c1, . . . , cn, α] =pnα+ pn−1qnα+ qn1
,
ove le quantita pn, qn, pn−1, qn−1 hanno il valore ottenuto in precedenza
considerando solamente [c0, c1, . . . , cn].
Osserviamo ora che se un numero reale x (non appartenente a Q) e dato
da [c0, c1, . . .], si ha
x = [c0, c1, . . .] = c0 +1
[c1, c2, . . .]
e dunque
c0 = ⌊x⌋ e, posto x1 = [c1, c2, . . .] = (x− c0)−1, (9.10)
si ha c1 = ⌊x1⌋. Avremo, in generale
ch = ⌊xh⌋ e xh+1 = (xh − ch)−1. (9.11)
Se x e numero reale (non razionale) e calcoliamo le quantita ch date
dalle (9.10), (9.11) abbiamo, per quanto posto nell’Osservazione 9.3,
x = [c0, c1, . . . , cn, xn+1] =pnxn+1 + pn−1qnxn+1 + qn−1
(9.12)
Di conseguenza ∣∣∣∣x− pn
qn
∣∣∣∣ = ∣∣∣∣pnxn+1 + pn−1qnxn+1 + qn−1−pn
qn
∣∣∣∣ ==
1
qn(qnxn+1 + qn−1).
(9.13)
6In effetti in [Hardy e Wright, 1971], all’inizio, le quantita ci sono semplicemente
delle variabili.
148
Ma xn+1 > qn+1 e quindi si ha certamente∣∣∣∣x− pn
qn
∣∣∣∣ < 1
qnqn+1(9.14)
e dunque pnqn
converge ad x.7
Esercizio 9.1 Spesso quando certe proprieta risultano ‘evidenti’, non si
vuol perdere troppo tempo per dimostrarle. Si esaminino vari testi dedicati
alle frazioni continue per verificare se il collegamento tra numeri reali e
loro rappresentazione come frazioni continue e dato in modo rigoroso. E
naturalmente si puo estendere l’analisi anche alle considerazioni precedenti.
Esempio 9.3 Rivediamo lo sviluppo in frazione continua di x =√2. Ab-
biamo
c0 = ⌊x⌋ = 1
e
x1 =(√2− 1
)−1=
1√2− 1
=
√2+ 1
2− 1=
√2+ 1.
Allora
c1 = ⌊x1⌋ = 2
ed anche
x2 =[(√
2+ 1)− 2]−1
=1√2− 1
=√2+ 1, ecc.
Dunque √2 = [1, 2, 2, 2, . . .].
Esempio 9.4 Osserviamo che
√5− 1
2=
1
1+
√5− 1
27Si veda anche la nota (11) posta a commento del metodo di approssimazione di
Lagrange.
149
e dunque
1+
√5− 1
2=
√5+ 1
2= [1, 1, 1, . . .].
Il piu ‘semplice’ sviluppo in frazione continua corrisponde alla parte aurea.8
Qualche approfondimento
Definizione 9.4 Sia ξ un numero reale. Diremo che p
qe una migliore
approssimazione razionale di ξ se e solo se per ogni altra frazione rscon
s > 0 la disuguaglianza ∣∣∣ξ− r
s
∣∣∣ < ∣∣∣∣ξ− p
q
∣∣∣∣implica s > q.
Teorema 9.1 Le convergenti di una frazione continua aritmetica, di ordi-
ne maggiore od uguale ad 1, relative ad un numero reale ξ, sono migliori
approssimazioni.
Dimostrazione. Vediamo un Lemma preliminare.
Lemma 9.1 Consideriamo ξ,ed una convergente pnqn. Sia r
s= pn
qncon 0 <
s < qn. Allora
|sξ− r| ≥ |qn−1ξ− pn−1| > |qnξ− pn|.
Dimostrazione. Esistono due numeri interi x, y tali che{pn x+ pn−1y = r
qn x+ qn−1y = s.
(La matrice ha determinante ±1.) Non puo evidentemente essere y = 0.
Per ipotesi s < qn e quindi o x = 0 oppure x e y sono di segno opposto.
Consideriamo l’identita
sξ− r = x(qnξ− pn) + y(qn−1ξ− pn−1).
8Sulla sezione aurea, si veda l’ottimo libro [Livio, 2003]. Si puo vedere anche
[Scimone, 1997].
150
Le due quantita entro parentesi hanno segno opposto (le convergenti sono
alternatamente maggiori e minori di ξ) ed anche x e y hanno segno opposto.
Allora
|sξ− r| = |x(qnξ− pn)|+ |y(qn−1ξ− pn−1)|
Poiche y = 0, abbiamo
|sξ− r| ≥ |qn−1ξ− pn−1|.
Si ha sempre
|qnξ− pn| < |qn−1ξ− pn−1|.
Dimostrazione (del Teorema). Consideriamo ancora ξ, pnqn. Sia r
s= pn
qnuna
frazione che verifica ∣∣∣ξ− r
s
∣∣∣ ≤ ∣∣∣∣ξ− pn
qn
∣∣∣∣con 0 < s < qn. Allora moltiplicano il primo membro per s ed il secondo
per qn, abbiamo
|sξ− r| ≤ |qnξ− pn|
in contraddizione con il Lemma. �
9.3 Il metodo di Lagrange
Il polinomio f(x) = f0(x), di grado n, abbia un’unica radice positiva γ ∈ Q9,
e sia
⌊γ⌋ = c0.10
Il nuovo polinomio
f1(x) = ±xnf0(c0 +
1
x
)9Di qui in poi supponiamo sempre di avere a che fare con radici non razionali.
10In realta e sufficiente supporre che tra c0 e c0+1 cada un’unica radice. I riferimenti
bibliografici ed un’esposizione del fatto che il metodo di Lagrange, attraverso l’uso del
teorema di Vincent, conduce anche autonomamente alla separazione delle radici sono
dati in [Alesina e Galuzzi, 1998].
151
ha un’unica radice maggiore di 1 (evidentemente non razionale), perche la
trasformazione
x← c0 +1
x
fornisce la corrispondenza biunivoca
(c0, c0 + 1)� (∞, 1).Sia c1 la parte intera della radice positiva di f1(x). Si ponga:
f2(x) = ±xnf1(c1 +
1
x
)Evidentemente, procedendo nello stesso modo, si ottiene la radice espressa
come frazione continua:
γ = [c0, c1, c2, . . . ].
Infatti, il cambiamento di variabili dato da [c0, c1, . . . , ch, x] corrisponde alla
sostituzione
x← phx+ ph−1qhx+ qh−1
,
seguita dalla moltiplicazione per (qhx + qh−1)−n (una quantita certamente
non nulla) e quando x assume un valore tra 0 e∞ la frazione phx+ph−1
qhx+qh−1assume
valori compresi tra ph−1
qh−1e phqh. Il metodo di approssimazione di Lagrange e
dunque intrinsecamente legato alle frazioni continue.11
Esempio 9.5 Sia f0(x) = x2 − 2, c0 = 1. Allora
f1(x) = −x2
((1+
1
x
)2− 2
)= x2 − 2x− 1.
La parte intera della radice di f1(x) e 2.
f2(x) = −x2
((2+
1
x
)2− 2
(2+
1
x
)− 1
)=
= x2 − 2x− 1 = f1(x)11Si noti come il metodo di Lagrange puo essere applicato anche all’equazione x−γ = 0
per fornire lo sviluppo in frazione continua proprio di γ.
152
Allora, ancora una volta:
√2 = [1, 2, 2, 2, . . . ].
Esercizio 9.2 Determinare lo sviluppo in frazione continua della soluzione
positiva di
x2 − (n2 + 1) = 0, n ∈ N
e della soluzione positiva di
x2 − (n2 − 1) = 0, n ∈ N.
Se il polinomio f0(x) ha una sola radice γ con parte intera ⌊c0⌋, dopoil primo passaggio si ottiene un polinomio che ha una sola radice positiva e
maggiore di 1. Sia
f(x) = (x− γ)(x− α)(x− β) · · ·
e supponiamo che due radici reali α,β siano disposte come in figura.
Con il metodi di Lagrange otteniamo il polinomio
f1(x) = [(c0 − γ)x+ 1][(c0 − α)x+ 1][(c0 − β)x+ 1] · · ·
Ora1
γ− c0> 1,
1
α− c0< 0, 0 <
1
β− c0< 1.
Dopo due passaggi otteniamo un polinomio con una sola radice positiva.
Esempio 9.6 Il polinomio
f0(x) = x3 − 10x2 + 31x− 29
ha le radici (approssimate)
α = 1.753, γ = 3.445, β = 4.801.
153
Il calcolo di f1(x) da
x3 + 2x2 − x+ 1,
il quale ha le radici
−0.801, 0.554, 2.246.
Quindi
f2(x) = x3 − 3 x2 − 4 x− 1
il quale ha le radici
−0.692,−0.356, 4.048.
Si noti poi che
3+1
2+1
4
=31
9= 3.4,
e una buona approssimazione della radice γ.
Il teorema di Lagrange sugli irrazionali quadratici
Consideriamo una frazione continua puramente periodica:
γ = [c0, c1, . . . , cn].
Mostriamo che γ e radice di un’equazione di secondo grado.
Sia, per semplicita,12
γ = [a, b, c].
Allora
γ = a+1
b+1
c+1
γ
.
12Le dimostrazioni seguenti sono condotte su esempi ‘paradigmatici’ come spesso nella
matematica tra fine Settecento e meta dell’Ottocento. Ma non si incontra alcuna difficolta
nel riproporle in linguaggio moderno.
154
Quindi esistono delle quantita A,B,C,D (con AD− BC = ±1) tali che
γ =A+ Bγ
C+Dγ.13
Supponiamo ora che vi sia un anti-periodo:
γ = [a, b, c, d, e].
Quindi
γ− a =1
b+1
[c, d, e]
,
1
γ− a= b+
1
[c, d, e],
Γ =1
−b+1
γ− a
= [c, d, e].
Allora Γ e radice di un’equazione di secondo grado. E chiaro che, con una
semplice sostituzione, ancora si ottiene che γ e radice di un’equazione di
secondo grado
Esempio 9.7 γ = [1, 2, 3]. Allora
1
γ− 1= 2+
1
[3],γ− 1
3− 2γ= [3] = Γ.
Allora
Γ 2 − 3Γ − 1 = 0
e quindi
3γ2 − 5γ+ 1 = 0.
Abbiamo dunque5
6+1
6
√13 = [1, 2, 3]. �
13Si rammenti la (9.7).
155
Osservazione 9.4 Dato il polinomio di secondo grado14
f0(x) = a0x2 + b0x+ c0
una qualsiasi trasformazione della forma
x←− n0 + 1
x
lascia invariato il discriminante.15
Si ha infatti il nuovo polinomio
(a0n20 + b0n0 + c0)x
2 + (b0 + 2a0n0)x+ a0.
Il calcolo diretto da:
(b0 + 2a0n0)2 − 4a0(a0n
20 + b0n0 + c0) = b
20 − 4a0c0.
Sia ora f0(x) un polinomio di secondo grado irriducibile e supponiamo
dapprima che abbia radici reali γ, δ con parte intera diversa.
γ ∈ (c0, c0 + 1), δ ∈ (c0, c0 + 1).
Dopo al piu due passaggi (con il metodo di Lagrange) abbiamo un polinomio
con una radice positiva (e maggiore di 1) ed una negativa.16 Questo significa
che il prodotto del coefficiente del termine di grado 0 per il coefficiente del
termine di grado 2 deve essere negativo. Quindi, nell’ipotesi δ > γ, avremo
f2(x) = a2x2 + b2x+ c2, con a2c2 < 0.
Sia ora
fh(x) = ahx2 + bhx+ ch, con ahch < 0, b
2h − 4ahch > 0.
14Nell’esposizione seguente tengo conto di [Ballieu, 1942].15Il risultato e evidente se pensiamo la trasformazione in due passi: una traslazione
seguita dal passaggio all’equazione reciproca.16Si noti che la radice negativa, con una ulteriore trasformazione del procedimento
di Lagrange, viene trasformata in una radice ancora negativa ma di modulo inferiore
all’unita.
156
Allora anche fh+1(x) ha la stessa proprieta.
Scriviamo fh(x) in modo da porre in evidenza il fatto che ha radici reali
di segno opposto:
fh(x) = ah(x− α)(x+ β), con α,β > 0.
Se na = ⌊α⌋, il polinomio fh+1(x) ha le radici
1
α− na, −
1
β+ na.
Abbiamo ancora radici di segno opposto, il che implica ah+1ch+1 < 0.
Fissato il valore del discriminate
∆ = b2h − 4ahch,
se
ahch < 0
abbiamo solo un numero finito di polinomi con discriminante ∆.
Nell’ipotesi di radici γ, δ con parte intera diversa, dopo un numero fi-
nito di trasformazioni del metodo di Lagrange dobbiamo ritrovare lo stesso
polinomio.
Sia ora ⌊γ⌋ = ⌊δ⌋ e siano
γ1, δ1, . . . γ2, δ2, . . .
le radici dei polinomi f1(x), f2(x), . . . Non puo essere indefinitamente
⌊γh⌋ = ⌊δh⌋
perche il polinomio f0(x) ha radici distinte. Dopo un numero finito di pas-
saggi ricadiamo nel caso delle radici con diversa parte intera. Concludiamo
quindi con il
Teorema 9.2 Ogni frazione continua che sia definitivamente periodica do-
po un numero finito di quozienti parziali converge ad un irrazionale qua-
dratico. Viceversa ogni irrazionale quadratico ha uno sviluppo in frazione
continua periodico da un certo posto in poi.
157
Esercizio 9.3 Si consideri l’equazione data
f0(x) = 431x2 − 1238x+ 889 = 0.
Utilizzando il metodo di Lagrange si determini fn(x) in modo che questo
polinomio eguagliato a zero abbia radici con parte intera diversa.
9.4 Il teorema di Galois
Galois ha dimostrato il teorema sulle frazioni continue immediatamente pe-
riodiche quando era ancora allievo al Collegio Louis-Le-Grand. Si tratta di
un risultato notevole, indipendentemente dalle considerazioni sulla giovane
eta dell’autore.17
Teorema 9.3 Se un’equazione ha una radice puramente periodica γ, l’equazione
ha un’altra radice δ il cui valore si ottiene dividendo -1 per la frazione
puramente periodica il cui periodo e l’inverso di quello di γ.
Dimostrazione. Galois si limita a considerare18
x = [a, b, c, d ].
x e dunque soluzione dell’equazione
X = a+1
b+1
c+1
d+1
X
(9.15)
17Si veda [Galois, 1976, pp. 364-377]. Un’esposizione del risultato di Galois si trova
anche in [De Nuccio, 2001]. Si veda anche [Galuzzi, 2009].18Si veda la nota 12.
158
L’equazione (12.10) puo essere riscritta:
1
a− X= −
b+
1
c+1
d+1
X
. (9.16)
Procedendo. . .
− X =1
d+1
c+1
b+1
a− X
(9.17)
Dunque−1
[d, c, b, a]
e l’altra radice dell’equazione. �
Esempio 9.8 l’equazione
x2 − 10x− 6 = 0
ha le radici
5±√31.
Abbiamo
5+√31 = [10, 1, 1, 3, 5, 3, 1, 1],
−1
5−√31
= [1, 1, 3, 5, 3, 1, 1, 10]. �
Osservazione 9.5 Sia
γ = [c0, c1, . . . , cn ]
159
una frazione continua puramente periodica soluzione di un’equazione di
secondo grado. Lo sviluppo di γ e tale che c0 ≥ 1 e, poiche γ e certamente
un numero irrazionale si ha
γ > 1.
Poiche, come abbiamo visto, la radice coniugata δ e data da− 1
[cn, . . . , c1, c0]e anche cn ≥ 1. Si ha dunque anche
−1 < δ < 0.
Vediamo ora il risultato reciproco.
Teorema 9.4 Siano γ, δ le due radici reali di un’equazione di secondo grado
e sia
γ > 1, −1 < δ < 0.
Allora lo sviluppo in frazione continua di γ e puramente periodico.
Dimostrazione. Per il Teorema di Lagrange, lo sviluppo di γ deve es-
sere periodico da un certo posto in poi. Si tratta di dimostrare che e
immediatamente periodico. Sia dapprima l’antiperiodo di lunghezza 1.
γ = [p, a, b, c, d] = p+1
A.
Con
x← p+1
x,
la prima trasformata ha la radice A.
Allora ha anche la radice−1
B, dove B = [d, c, b, a]. L’equazione originale
ha la radice
p+1
−1
B
= p− B.
p− B e compreso tra 0 e -1 se e solo se ⌊B⌋ = p, ossia d = p, e
γ = [d, a, b, c].
160
La stessa argomentazione si applica a
γ = [p, q, a, b, c, d ].
In questo caso otteniamo
− 1 < p−1
B− q< 0. (9.18)
Ora, osserva Galois, la quantita p− 1B−q
verifica la disuguaglianza (9.18)
se e solo se1
B− q= p+ θ, con 0 < θ < 1,
ossia ⌊1
B− q
⌋= p.
Poiche B > q e B− q < 1, abbiamo
⌊B⌋ = q.
Dunque
B = [q, p, . . . ]
e
γ = [c, d, a, b ].
Galois lascia al lettore il completamento dell’argomentazione. E molto
facile, pero, dare una forma strutturata a cio che Galois trascura.
Proposizione 9.1 Supponiamo che, per ogni n-upla di interi c0, c1, . . . , cn−1,
con ci ≥ 1 e per ogni ξ reale, dalla disuguaglianza
−1 < c0 +1
c1 + . . .+
1
cn−1 − ξ
< 0
si tragga la conclusione che
ξ = [cn−1, . . . , c1, c0, . . . ].
Allora la proprieta si puo estendere ad ogni n+ 1-upla.
161
Dimostrazione. Sia
−1 < c0 +1
c1 + . . .+
1
cn−1 +1
cn − ξ
< 0,
e poniamo
η = −1
cn − ξ.
Abbiamo allora
η = [cn−1, . . . , c1, c0, . . . ],
e, essendo,
ξ = cn +1
η,
ne deduciamo la proprieta richiesta. �
Osservazione 9.6 Sia a = ⌊√n⌋, con n non quadrato. Allora il polinomio
(x− a−√n)(x− a+
√n) = x2 − 2ax+ (a2 − n)
ha una radice maggiore di 1 ed una radice in (−1, 0).
Osservazione 9.7 (Galois) Supponiamo che un’equazione di secondo gra-
do abbia una radice il cui sviluppo in frazione continua sia non solo periodico
ma anche simmetrico. Allora l’equazione ha la forma
ax2 − bx− a = 0. (9.19)
In effetti, se γ e una radice, l’altra radice deve essere −γ−1. Abbiamo
allora
γx2 − (γ2 − 1)x− γ = 0.19
Viceversa, se e data un’equazione della forma (9.19) si verifica imme-
diatamente che ha una radice positiva maggiore di 1 ed una fra 0 e -1.
�19Si noti che una tale equazione puo ridursi a coefficienti interi.
162
Lo sviluppo di√n
Sia a = ⌊√n⌋. L’equazione
(x− a)2 − n
ha una radice γ = a +√n puramente periodica (si veda l’Osservazione
(9.6)). Quindi
a+√n = [c0, c1, . . . , ck−1, ck ].
Allora
√n = [c0 − a, c1, c2, . . . , ck−1, ck, c0, c1 . . . , ck−1, ck, c0 . . . ].
D’altra parte−1
a−√n
= [ck, ck−1, . . . , c1, c0 ],
e quindi √n = [a, ck, ck−1, . . . , c1, c0, ck, ck−1, . . . ].
Ne segue che
c0 = 2a, c1 = ck, c2 = ck−1, . . .
Ad esempio, come abbiamo visto a pag. 140,
√19 = [4, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, 3, 1, 2, 8, 2, 1, . . . ].
Dimostrazione di Ballieu del teorema di Galois
Galois nella sua prima memoria che abbiamo esaminato utilizza il me-
todo di Lagrange per analizzare un esempio (si tratta dell’esempio dato
dall’equazione 3x2 − 16x− 18 = 0).20
Tuttavia, come abbiamo visto, non utilizza il metodo di Lagrange per
dimostrare il suo risultato. Una dimostrazione che utilizza il metodo di
Lagrange e data da Ballieu, in [Ballieu, 1942]. Ecco in breve questa dimo-
strazione.
20Cf. [Galois, 1976, p. 375].
163
Notiamo che data
f(x) = ax2 + bx+ c (9.20)
i coefficienti di
ϕ(x) = −x2f
(n+
1
x
)= αx2 + βx+ γ (9.21)
sono dati da
α = −(an2 + bn+ c) = −f(n),
β = −(b+ 2an) = −f ′(n),
γ = −a = −f ′′(n)
2.
(9.22)
Reciprocamente, abbiamo
f(x) = −(x− n)2ϕ
(1
x− n
)(9.23)
e quindi
a = −γ,
b = −β+ 2γn,
c = −γn2 + βn− α.
(9.24)
Per comodita, introduciamo anche il polinomio
F(x) = −γx2 + βx− α. (9.25)
Se ora l’equazione di secondo grado (9.20) ha una radice puramente perio-
dica ξ, deve essere ξ > 1 e l’altra radice deve essere compresa tra -1 e 0,
perche queste condizioni sono realizzate dopo un numero finito di passi (si
consideri il comportamento delle radici per le successive trasformazioni di
Lagrange esaminato a pag. 9.3).
Vediamo che le condizioni sono anche sufficienti. In effetti se un’equazione
ha una radice positiva maggiore di uno ed una radice compresa tra -1 e 0,
tutte le successive trasformate hanno questa proprieta.
164
Considerando i valori in -1,0,1, avremo, per un’equazione della forma
(9.20), ottenuta con una certa parte intera n,
a− b+ c > 0, c < 0, a+ b+ c < 0.
Tenendo conto delle (9.24), abbiamo
a− b+ c = −γ(n+ 1)2 + β(n+ 1) − α = F(n+ 1) > 0
e
c = −γn2 + βn− α = F(n) < 0.
Il polinomio F(x) ha una sola radice positiva (si rammenti che γ e α han-
no segni discordi) e dunque la parte intera della radice e n. Ne segue
che dall’equazione con coefficienti α,β, γ, tramite la radice positiva di F(x)
possiamo risalire ai coefficienti a, b, c.
Se dunque un’equazione si ripete accade lo stesso dell’equazione prece-
dente.
Esempio 9.9 Consideriamo l’equazione
x2 − 10x− 4 = 0,
la quale ha le radici 5±√29. Abbiamo
5+√29 = [10, 2, 1, 1, 2 ].
Possiamo anche ‘procedere a ritroso’. Scriviamo l’equazione corrispondente
alla (9.25):
4x2 − 10x− 1 = 0.
Poiche si ha un cambiamento di segno in (2, 3), otteniamo per il quoziente
parziale che precede 10, il valore 2. Ora utilizziamo la (9.23), ed otteniamo:
4x2 − 6x− 5 = 0.
Allora, per retrocedere ulteriormente, dobbiamo considerare
5x2 − 6x− 4 = 0.
Si ha un cambiamento di segno fra 1 e 2, ecc.
165
9.5 Appendice: sulle possibili fonti per la
memoria di Galois sulle frazioni
continue
L’idea di completare il risultato di Lagrange considerando il caso delle frazio-
ni continue immediatamente periodiche puo parere naturale, ed e possibile
che Galois abbia esaminato un certo numero di casi numerici per determi-
nare la situazione geometrica delle radici di un’equazione di secondo grado
che abbia una soluzione data da una frazione continua immediatamente
periodica.
Tuttavia nella sua memoria compare una ‘simmetria’ che riesce difficile
da comprendere se ci si limita al terreno delle equazioni algebriche. Al
termine della dimostrazione vista a pagina 159, Galois aggiunge: “in cio
che precede noi abbiamo supposto che la radice proposta fosse piu grande
dell’unita, ma, se fosse
x =1
a+1
b+1
c+1
d+1
a+1
b+ . . .
(9.26)
si concluderebbe per uno dei valori di 1x, x,
1
x= a+
1
b+1
c+1
d+1
a+1
b+ . . .
(9.27)
ecc.”21 Galois utilizzando la tecnica vista in precedenza raggiunge la con-21Cf. [Galois, 1976, p. 369].
166
clusione che x = −[d, c, b, a].
In altre parole, se una radice e della forma 1
[a,b,c,d]l’altra radice e della
forma −[d, c, b, a]. Naturalmente per considerare ‘immediatamente perio-
diche’ anche le frazioni continue corrispondenti a questi due numeri biso-
gna modificare lievemente la definizione. Infatti nel primo caso lo sviluppo
abituale da [0, a, b, c, d], mentre nel secondo caso occorre distinguere tra
c = 1 e c = 1. Si ha infatti rispettivamente (verificarlo per esercizio e
considerare anche i casi di periodi piu brevi) [−(d+ 1), 1, c− 1, d, c, b, a] e
[−(d+ 1), c+ 1, d, d, c, b, a].
Questo completamento della dimostrazione che corrisponde a considera-
re il caso di un’equazione ottenuta con il cambiamento di variabili x← − 1x
non sembra molto naturale nel contesto degli irrazionali quadratici e sembra
suggerire una dipendenza dalla teoria delle forme quadratiche binarie.
La teoria delle forme quadratiche binarie iniziata da Lagrange, aveva
ricevuto dei contributi importanti da Legendre, nel suo Essai del 1798 e
Galois connosceva certamente la seconda edizione del 1808.22 Nell’opera
di Legendre il legame tra le formes quadratiche e le frazioni continue e
esplicito e Galois poteva certo trarne profitto. In particulare nel Capitolo
IX, Legendre dimostra il risultato di Lagrange sugli irrazionali quadratici.
E il Capitolo si conclude con delle ((Considerations diverses sur la resolution
de l’equation fy2 + gyz+ hz2 = ±D )), che collegano le soluzioni per interi
di questa equazione alle frazioni continue. Nel Capitolo seguente si ha una
dimostrazione (per la verita un po’ complicata) del fatto che per il caso delle
equazioni di secondo grado (( . . . la periode comprise dans le developpement
d’une racine est l’inverse de la periode comprise dans le developpement de
l’autre racine )).23
I risultati di Legendre sono strettamente connessi alla memoria di Ga-
lois, ma mi sembra tuttavia che la piu rigorosa organizzazione sistemati-
ca dell’opera di Gauss offra un punto di partenza migliore per il giovane
Galois.24
22Cf. [Galuzzi, 2001a].23Naturalmente da un certo posto in poi.24Nei manoscritti di Galois, raccolti in MS 2108 nella Bibliotheque de l’Institut de
France, non vi sono molte tracce dell’interesse di Galois per le forme quadratiche. Tut-
167
Nella Sezione cinque delle Disquisitiones Arithmeticae25 Gauss conside-
ra delle forme quadratiche binarie
ax2 + 2bxy+ cy2, a, b, c ∈ Z (9.28)
per le quali utilizza la notazione (a, b, c) e per le quali il determinante,
b2 − ac e in genere indicato con D.26
Nell’Articolo §183 Gauss da la definizione di forma ridotta:27
((Nous appellerons formes reduites les formes (a, b, c)28 dans
lesquelles a, pris positivement, est compris entre√D + b et√
D − b, b etant positif et <√D, et le determinant D etant
positif et non carre. ))29
Si associ alla forma (9.28) l’equazione
a+ 2bω+ cω2 = 0 (9.29)
diremo che −b−√D
ce la prima radice dell’equazione (9.29), mentre −b+
√D
c
sara detta la seconda radice.
tavia nella pagina 149b di MS 2108 si osserva come Galois abbia esaminato la pos-
sibilita di rappresentare l’unita con una forma quadratica data da p2 − Apq + Bq2.
Si puo porre evidentemente q = 0 e p = 1. Ma Galois considera anche il caso del
(( determinante ))A2 − 4B = −3 (Galois utilizza questo termine che e presente nella tra-
duzione francese delle Disquisitiones Arithmeticae, ma che non e utilizzato da Legendre
e Lagrange. Tuttavia, diversamente da Gauss, non suppone che il termine centrale sia
un intero pari). In questo caso la rappresentazione e data anche da q = ±1, p = Aq±12
.
Nella stessa pagina si trovano anche degli altri calcoli di difficile interpretazione. Bour-
gne e Azra hanno eliminato questa pagina nella loro edizione, giudicando i contenuti dei
calcoli poco significativi.25Faccio riferimento alla traduzione francese del 1807: [Gauss, 1807]. I riferimenti a
questo testo saranno dati nel seguito con RA. La lettura di questa opera di Gauss da
parte di Galois e ben documentata. Cf. l’Appendice II, di Bourgne e Azra: [Galois, 1976,
p. 526]. La mia ipotesi e che questa lettura sia stata molto precoce.26Il termine (( determinant )) e usato nella traduzione francese, come si e gia osservato
nella nota 24.27Per il caso di determinante positivo.28(A,B,C) nel testo originale.29Cf. RA, p. 161.
168
La definizione di Gauss equivale alla richiesta che l’equazione (9.29)
abbia due radici reali e opposte, e tali che il modulo della prima radice
sia maggiore dell’unita mentre il modulo della seconda radice sia minore
dell’unita.30
Osservazione 9.8 Si osserva facilmente che la richiesta puo essere sosti-
tuita semplicemente da quella che l’equazione (9.29) abbia due radici di
segno diverso delle quali l’una di modulo maggiore di 1 e l’altra di modulo
minore di 1.31
Un altra definizione importante e quella di forme contigue:
(( Si les formes (a, b, c), (a ′, b ′, c ′) ont le meme determinant, et
qu’on ait c = a ′ et b+b ′ ≡ 0 (mod. c), nous dirons qu’elle sont
contigues, et quand une designation plus exacte sera necessaire,
nous dirons que la premiere est contigue a la seconde par la
premiere partie, et que la seconde est contigue a la premiere par
la derniere partie. ))32
Una forma a ′x ′2 + 2b ′x ′y ′ + c ′y ′2 contigua alla forma ax2 + 2bxy + cy2
e tale che b ′ = −b − c δ. Poiche a ′ = c e le due forme debbono avere lo
stesso determinante, si vede che e la transformazione di variabili(x
y
)=
(0 1
−1 δ
)(x ′
y ′
)(9.30)
che muta la seconda forma nella prima.
30Dirichlet [1894, pp. 176-77] da direttamente questa definizione e io credo che questa
proprieta fosse evidente per un lettore come il giovane Galois. Un’ottima traduzione
italiana della terza edizione del testo di Dirichlet, compiuta da Aureliano Faifofer, e
[Dirichlet, 1881].31Si puo sempre supporre che il coefficiente b sia positivo. Naturalmente in termini
di forme quadratiche non e la stessa cosa, ma si puo passare da una forma (a, b, c) alla
(a,−b, c) con il cambiamento di variabili dato da x ← −x, y ← y e gli interi ottenibili
dalla prima forma sono anche ottenibili dalla seconda e viceversa.32Cf. RA, p. 125.
169
Si vede anche facilmente che l’equazione di secondo grado corrispondente
alla (9.29) e data dal cambiamento di variabile ω← δ− 1w. In altre parole:
w2
{a+ b
(δ−
1
ω
)+ c
(δ−
1
ω
)2}= a ′ + 2b ′ω+ c ′ω2. (9.31)
Un risultato importante che collega la nozione di forma ridotta e quella
di contiguita e il seguente:
(( Pour toute forme reduite (a, b, c), on peut en trouver une ega-
lement reduite qui lui soit contigue par l’une ou l’autre partie ;
mais on n’en pourra trouver qu’une )).33
L’algoritmo che permette il calcolo della forma contigua (a destra) e che
nello stesso tempo ne dimostra l’esistenza e, per quanto abbiamo osservato,
il seguente. Si pone a ′ = c; b ′ deve verificare b ′ ≡ −b (mod. c) e deve
essere compreso tra√D − |c| e
√D. Evidentemente c’e un solo b ′ che
verifica questa doppia condizione. Infine si calcola c ′ =b ′2 −D
a ′ .
Gauss, che, probabilmente per una scelta di stile non vuole associare ad
una forma quadratica degli irrazionali quadratici, non collega l’algoritmo
mediante il quale si passa da una forma ridotta alla forma ridotta contigua
alle radici dell’equazione (9.29). Ma il legame e cosı evidente che e difficile
immaginare che il giovane Galois non l’abbia scorto immediatamente.
In una forma ridotta (a, b, c), b e un numero positivo e la radice di
modulo piu grande dell’equazione a + 2bω + cω2 = 0 e, come abbiamo
osservato,
ζ =−b−
√D
c(9.32)
Sia δ = ±⌊ζ⌋, ove occorre scegliere lo stesso segno di quello di ζ. Il cam-
biamento di variabili che conduce all’equazione associata alla nuova forma
quadratica e dato da questo valore di δ:
ω ′ ← δ−1
ω(9.33)
33Cf. RA, p. 162
170
Fatta astrazione dal segno, troviamo la trasformata di Lagrange.34
Infine un altro risultato importante che poteva essere una fonte di ispi-
razione per Galois e dato dalla periodicita delle forme ridotte. Si dimostra
facilmente35 che il numero delle forme ridotte di dato determinante positivo
D e finito. In maniera del tutto simile a quella con la quale si dimostra
l’esistenza di una sola forma ridotta contigua a destra alla forma (a, b, c) si
dimostra l’sistenza di una sola forma contigua a sinistra ( ′a, ′ b, ′ c). Basta
porre ′a = a, ′b = −b (mod. ′c), con ′b compreso tra√D − |c| e
√D,
′a =′b2 −D
′c.
Se F e una forma ridotta di determinante D e si calcolano le forme
contigue F ′, F ′′, . . . si deve arrivare a due forme F(m) e F(m+n) identiche.
Mas F(m−1) e F(m+n−1) debbono essere identiche a loro volta, per cio che
abbiamo osservato . . . ((Ainsi dans la progression F, F ′, F ′′, etc. pourvu qu’on
la continue assez loin, on retrouvera enfin la forme F )).36
Il legame tra questo risultato e le frazioni continue immediatamente pe-
riodiche non e esplicito nel testo di Gauss, ma non e neppure troppo lontano.
Consideriamo il caso paradigmatico di una forma quadratica ridotta tale che
l’equazione associata abbia una radice positiva piu grande dell’unita. Se si
prendono i valori assoluti degli interi δ che compaiono nei calcoli delle forme
contigue che formano un periodo si ha in corrispondenza lo sviluppo in fra-
zione contina di questa radice. Poiche dopo un numero finito di passaggi la
periodicita impone che si debba ottenere la forma quadratica di partenza,
lo sviluppo in frazione continua della radice deve essere immediatamente
periodico, anche se il periodo puo essere (a causa dei cambiamenti di segni)
di lunghezza inferiore.
Osservazione 9.9 In questa sezione si sono semplicemente introdotti que-
gli elementi della teoria delle forma quadratiche binarie che potrebbero sug-
gerire un legame con la memoria di Galois. Naturalmente interrogativi del
tipo: “Perche si introducono le forme quadratiche binarie?”, “Quali problemi
34Si veda anche [Dirichlet, 1894, p. 183].35Cf. RA, pp. 163-16436Cf. RA, pp. 164-65. Si veda anche [Weber, 1895, 387-88] ove il risultato e dato
direttamente per gli irrazionali quadratici e le frazioni continue.
171
si vogliono risolvere?”, ecc. sono piu che legittimi. Una rapida introduzione
per rispondere a queste curiosita si trova in [Dieudonne, 1986, pp. 165-173].
172
Capitolo 10
Il teorema di Sturm
10.1 La memoria di Cauchy del 1815
La memoria, pubblicata da Cauchy nel 1815 nel Journal de l’Ecole Poly-
technique1 rappresenta un contributo notevole al problema di determinare
l’esatto numero di radici reali che un’equazione algebrica possiede in un
certo intervallo. Le ipotesi richieste da Cauchy sono un po’ piu onerose di
quelle richieste dal teorema di Sturm, e Cauchy non completa tutti i det-
tagli dimostrativi. Inoltre, i procedimenti di calcolo utilizzati sono molto
pesanti, soprattutto in un periodo in cui la teoria della eliminazione non
ha ancora tratto beneficio dalla teoria delle matrici, che si sviluppera negli
anni successivi.2
Gran parte della memoria contiene calcoli ingegnosi, ma anche un po’
faticosi, per sostituire ad un sistema di due equazioni un nuovo sistema,
costituito da equazioni di grado piu basso, per le quali l’eliminazione sia
piu agevole. Non esporro tutti i dettagli di questi calcoli3 e mi limitero a
presentare l’idea fondamentale.
1Cf. Cauchy [1815a].2Anche con contributi importanti dello stesso Cauchy.3Che, tuttavia, potrebbero rivelarsi di grande utilita in un’indagine futura.
173
Consideriamo un’equazione polinomiale di grado n, che indichiamo (di-
versamente da Cauchy, che usa la scrittura X = 0) con
f(z) = 0 (10.1)
Dovremo spesso fare riferimento al grafico rappresentativo.
Poniamoci nell’ipotesi che l’equazione considerata non abbia radici mul-
tiple, e che neppure le equazioni ausiliare, che verranno descritte in seguito,
abbiano radici multiple.
Cauchy osserva che e possibile classificare i punti di massimo e di minimo
secondo il comportamento descritto qui di seguito.
Supponiamo di percorrere il grafico nella direzione delle ascisse positive
e di arrestarci in un punto di massimo o di minimo. Diremo che il punto
e un vertice di prima specie, se, procedendo nella direzione delle ascisse
positive a partire dal punto stesso, la curva si avvicina all’asse delle ascisse,
mentre diremo che il punto e un vertice di seconda specie in caso contrario.
Se il punto di massimo o di minimo ha ascissa z0, esso sara (in generale)
un vertice di prima specie se
f(z0)f′′(z0) < 0,
mentre sara un vertice di seconda specie se
f(z0)f′′(z0) > 0.
Nella figura seguente, i punti di prima specie sono indicati con V , mentre
quelli di seconda specie sono indicati con v.
174
Figura 10.1: Vertici di prima e seconda specie
Cauchy formula la semplice relazione che lega il numero dei punti di
intersezione con l’asse delle ascisse con il numero dei vertici di prima e
seconda specie. Indichiamo con i il numero delle intersezioni del grafico con
l’asse delle ascisse, con P il numero dei vertici di prima specie e con S il
numero dei vertici di seconda specie.
Se consideriamo la porzione di grafico compresa tra due radici consecu-
tive α1 ed α2, indicando con P[α1,α2] il numero dei vertici di prima specie e
con S[α1,α2] il numero dei vertici di seconda specie, sara evidentemente
P[α1,α2] − S[α1,α2] = 1
Si osservi poi che nelle porzioni di grafico che precedono la prima radice
o seguono l’ultima radice la differenza P − S deve essere zero. Da queste
osservazioni segue immediatamente che, per l’intero grafico
P − S = i− 1 (10.2)
La (10.2) e stata scritta supponendo i ≥ 2, ma e facile osservare che
essa vale anche per i = 1 e i = 0.
Si osservi che, se si considera il numero di radici nel tratto compreso tra
due punti A e B possiamo immaginare di prolungare il grafico secondo le
direzioni indicate dalle tangenti in A e B senza aggiungere vertici. Poiche in
175
Figura 10.2: Il conteggio di Cauchy
tal modo e possibile che vengano aggiunte una o due radici dobbiamo tener
conto di queste radici nel conteggio totale per utilizzare ancora la formula
di Cauchy.
Ecco un esempio completamente esplicativo. Consideriamo la curva rap-
presentata nella figura seguente. Completando il grafico con i prolungamenti
che partono da A e B nelle due direzioni, abbiamo tre radici. Nel nostro
caso abbiamo P = 2 e S = 0 e, il semplice utilizzo della (10.2) produce il
valore 3. Ma una radice e stata aggiunta. In un caso come quello illustrato
dalla figura dobbiamo utilizzare la formula
P − S = i
Si notera che l’argomentazione di Cauchy ha carattere completamente
topologico: nel considerare la forma dei grafici non interviene minimamente
il modo analitico con il quale essi sono generati.
Ecco comunque quanto Cauchy arriva agevolmente a concludere:
• se si forma la differenza tra il numero dei vertici di prima e di seconda
specie, dapprima dal lato delle ascisse positive e poi dal lato delle
ascisse negative, la somma di queste due differenze, aumentata di
un’unita sara uguale al numero di punti di intersezione della curva
con l’asse delle ascisse;
176
• l’eccesso della prima differenza sulla seconda sara superiore o inferiore
di un’unita alla differenza che esiste tra il numero delle radici positive
ed il numero delle radici negative a seconda che, avvicinandosi all’asse
delle ordinate dalla parte delle ascisse positive il grafico si avvicini
all’asse delle ascisse o se ne allontani.
Vediamo la traduzione analitica di questi risultati
Consideriamo la coppia di equazioni
f′(z) = 0, y+ f(z)f′′(z) = 0. (10.3)
L’eliminazione della variabile z tra le due equazioni (10.3) produce un’equazione
in y, che possiamo indicare con
g(y) = 0,
di grado n− 1, la quale ha per radici i valori opposti a quelli che assume la
quantita f(z)f′′(z) in corrispondenza ai valori dove f′(z) e nulla.
Se supponiamo che l’equazione di partenza f(z) = 0 non abbia radici
multiple e che altrettanto accada per l’equazione f′(z) = 0, non puo essere
contemporaneamente per un certo valore α, f′(α) = 0 e f(α) · f ′′(α) = 0.Poiche la condizione
f′(α) = 0 e f(α)f ′′(α) < 0
equivale ad un vertice di prima specie, mentre la condizione
f′(α) = 0 e f(α)f ′′(α) > 0
equivale ad un vertice di seconda specie, abbiamo il seguente teorema.
Teorema 10.1 Il numero di radici reali dell’equazione f(z) = 0 sorpassa
sempre di un’unita la differenza che esiste tra il numero di radici positive
ed il numero di radici negative dell’equazione ausiliaria g(y) = 0.
Esempio 10.1 Consideriamo il polinomio di secondo grado
f(z) = z2 + pz+ q.
177
Dobbiamo eliminare y tra
2z+ p = 0
e
y+ (z2 + pz+ q) · 2.
Si ottiene
2y− p2 + 4q = 0
e si ricava la condizione usuale per la realta delle radici.
Esercizio 10.1 Si ottenga la condizione per la realta delle radici di
z3 + pz+ q = 0.
Naturalmente, il passaggio da f(z) a g(y) e semplicemente la riduzio-
ne del problema di determinare il numero di radici reali ad un livello di
complessita inferiore. Ma Cauchy supera questa difficoltaintroducendo una
seconda equazione ausiliaria (ancora occorre l’ipotesi che f′(z) e f′′(z) non
abbiano radici comuni): quella che si ottiene dalla eliminazione di z tra le
due equazioni
f′(z) = 0, x+ zf(z)f′′(z) = 0.
Indichiamo con h(x) = 0 questa nuova equazione. Anch’essa e di grado
n − 1 nella variabile x e serve, grazie all’introduzione di z a fattore, per
contare i vertici di prima e seconda specie dalla parte delle ascisse positive
o negative. Si ha il seguente teorema.
Teorema 10.2 La differenza tra il numero delle radici positive e negative
dell’equazione f(z) = 0 e superiore o inferiore di una unita alla stessa
differenza, nell’equazione ausiliaria h(x) = 0 a seconda che il prodotto dei
due ultimi coefficienti dell’equazione proposta sia negativo o positivo.
I due teoremi precedenti, in una situazione generale, forniscono un sem-
plice4 algoritmo per valutare il numero di radici reali di un’equazione f(z) =
0.
4Semplice dal punto di vista concettuale, naturalmente.
178
Algoritmo 10.1 Ecco una breve descrizione.
• Associamo ad f(z) = 0 l’equazione ausiliaria g(y) = 0. Si tratta
di decidere la differenza tra il numero di radici positive ed il numero
di radici negative di questa equazione ausiliaria e di sommarvi poi
un’unita.
• La differenza che cerchiamo puo essere ottenuta, in forza del teorema
precedente, valutando la differenza tra il numero di radici positive e
negative dell’equazione h1(x) = 0 che si ottiene dalla eliminazione di
x tra
g′(y) = 0 e x+ yg(y)g′′(y) = 0.
Si tratta di aggiungere o togliere una unita a seconda del segno del
prodotto dei due ultimi coefficienti di g(y).
• A partire da h1(x), formiamo con le stesse modalita una nuova equa-
zione h2(x) = 0, memorizzando la necessita di aggiungere o togliere
una unita (e scegliendo opportunamente i nomi delle variabili).
• Procediamo in questo modo, costruendo le equazioni h1(x) = 0, h2(x) =
0, . . ., di grado n−1, n−2, . . . fino a che non si arrivi ad un’equazione
hk(x) = 0 per la quale la differenza tra il numero delle radici positive
e negative sia noto (per esempio hk(x) sia di primo grado).
• A questo punto basta aggiungere o togliere unita, secondo quanto ab-
biamo memorizzato, per risalire alla differenza tra il numero delle
radici positive e negative di g(y) = 0, e dunque al numero di radici
reali di f(z) = 0.
Prima di ogni commento critico, e opportuno vedere un esempio.
Esempio 10.2 Vogliamo conoscere il numero di radici reali dell’equazione
f(z) = z3 − z2 + z+ 1 = 0.
179
Questo numero si ottiene aggiungendo 1 al numero che esprime la differenza
tra il numero delle radici positive e quello delle radici negative di g(y) = 0,
ossia dell’equazione che si ottiene eliminando la variabile z tra
f′(z) = 3z2 − 2z+ 1 = 0
e
y+ f(z)f′′(z) = y+ (z3 − z2 + z+ z) · (6z− 2) = 0.
Si ottiene
g(y) = 81y2 − 96y+ 1056 = 3(27y2 − 32y+ 352)
Si tratta di eliminare la variabile y tra
g′(y) = 6(27y− 16y) = 0
e
x+ yg(y)g′′(y) = x+ y(81y2 − 96y+ 1056) · 162 = 0.
Un calcolo non molto invitante da eseguire a mano. Si ottiene:
h(x) = 3x+ 295936 = 0.
Quest’equazione ha una sola radice negativa e dunque la differenza tra il
numero delle radici positive e negative vale −1. Poiche nell’equazione
g(y) = 0 il prodotto dei due ultimi coefficienti e negativo, dobbiamo ag-
giungere 1 per avere la differenza tra il numero delle radici positive e quello
delle radici negative di g(y). Si ottiene 0 (in effetti g(y) = 0 non ha radici
reali).
Poiche la differenza tra il numero delle radici positive e negative di g(y) e
0, abbiamo che l’equazione f(z) = 0 ha una sola radice reale.
Il metodo di Cauchy, se applicato in modo banale, come nell’esempio
precedente, conduce facilmente a notevoli complicazioni di calcolo. Inoltre
e assai facile trovare casi ove esso non e applicabile, perche si trovano radici
nulle nelle equazioni ausiliarie o per altre ragioni. Rappresenta tuttavia un
progresso concettuale notevole, poiche mostra che, in linea di principio, e
180
possibile risolvere il problema del numero delle radici reali costruendo una
catena di polinomi di grado decrescente.
Gran parte del seguito della memoria di Cauchy, sul quale non mi soffer-
mo, consiste nel cercare di sostituire alle equazioni ausiliarie altre equazioni
piu opportune, in modo da eliminare le difficolta di calcolo per rendere il
metodo applicabile, almeno nel caso delle equazioni di grado piu basso. I
procedimenti di Cauchy sono spesso assai ingegnosi ma, almeno, al momento
presente, si rivelano di scarsa utilita pratica.
10.2 Il teorema di Sturm
A meta degli anni venti dell’Ottocento, la situazione in merito al problema
di separare le radici di un’equazione algebrica sembra ben consolidata. La
memoria di Cauchy che abbiamo esaminato nella sezione precedente non ha
trovato particolari consensi.5
E poi difficile immaginare un ‘miglioramento’ rispetto al teorema di
Budan-Fourier.
La sequenza di polinomi
S(z) : f0(z) = f(z), f1(z) = f′(z), f2(z) = f
′′(z), . . . , fn(z) = f(n)(z),
si collega in modo del tutto naturale al polinomio f(z): per ogni valore α
i valori della sequenza S(α) contengono l’informazione essenziale che per-
mette di costruire f(α+ z) nel modo piu semplice: attraverso la formula di
Taylor.
D’altra parte le difficolta connesse al controllo del numero di variazioni
di S(z) sembrano ineliminabili. Si puo immaginare di ridurre f(z) ad avere
solo radici semplici: in questo modo il passaggio per una radice implica esat-
tamente il calo di una variazione per la sequenza S(z). Ma come controllare
con precisione l’effetto delle radici di f′(z) ? Sembra necessario qualche
strumento piu raffinato, che tenga conto, ad esempio, della struttura delle
sequenze dei segni, e vada al di la del mero conteggio.
5Un’analisi critica dei risultati esposti da Cauchy, dovuta con grande probabilita a
Legendre, conclude in modo piuttosto scettico [da completare].
181
Il risultato ottenuto dal giovane matematico ginevrino nel 1829, giunge
del tutto inatteso: sia per la completezza della soluzione sia per la tecnica
dimostrativa di sbalorditiva semplicita.6
La dimostrazione seguente riproduce sostanzialmente il testo di Sturm7.
In effetti il teorema di Sturm e uno di quei risultati classici e definitivi che,
come il teorema di Euclide sull’infinita dei numeri primi, sembrano collocati
fuori dal tempo.
Iniziamo con il supporre che f(z) e f′(z) non abbiano radici comuni,
ossia che f(z) abbia solo radici semplici. E assai facile ricondursi a questa
situazione, e dunque non abbiamo una limitazione essenziale.
Costruiamo, attraverso l’algoritmo di Euclide, lievemente modificato,
la seguente successione di polinomi: poniamo all’inizio
f0(z) = f(z), f1(z) = f′(z).
Poi proseguiamo, con successive divisioni, fino a trovare un ultimo polinomio
fp(z), che dia un resto non nullo, nel modo seguente:
f0(z) = q1(z)f1(z) − f2(z), (10.4)
f1(z) = q2(z)f2(z) − f3(z),
. . . . . . . . .
fp−2(z) = qp−1(z)fp−1(z) − fp(z).
Osserviamo che:
• fp(z) deve essere necessariamente una costante non nulla, perche f0(z)
e f1(z) non hanno zeri in comune.6Molto importante per il ricco contenuto informativo e tuttora l’articolo di Gino
Loria Loria [1938]
Gli sviluppi che hanno condotto dal teorema di Sturm verso l’algebra moderna e la
logica sono esposti nell’ottimo libro di Hourya Sinaceur Sinaceur [1991]. Un importante
articolo che descrive gli sviluppi del teorema di Sturm sino agli anni venti e Mignosi
[1925].7L’annuncio del risultato si trova in una nota del 1829 nel Bullettin des Sciences
mathematiques de Ferussac. La dimostrazione e poi pubblicata in Sturm [1835].
Per i dettagli bibliografici si veda comunque Sinaceur [1991]. E lo stesso Sturm che
manifesta nell’articolo del 1829 il suo profondo debito verso Fourier, con il quale era in
rapporti assai amichevoli.
182
• Per un qualsiasi numero reale α non puo verificarsi, per due indici
consecutivi, k e k+ 1
fk(α) = fk+1(α) = 0.
Se k = 0 si tratta semplicemente dell’ipotesi che f0(z) e f1(z) siano
privi di radici comuni. Se k > 0, anche fk−1(α) = 0, e si perviene
ancora a concludere che f0(α) = f1(α) = 0, in contrasto con l’ipotesi
iniziale.
• Se per un certo valore α e per k ≥ 1, si ha fk(α) = 0 si ha anche
fk−1(α)fk+1(α) < 0.
Infatti, come abbiamo osservato al punto precedente, nell’ipotesi che
fk(a) sia nullo, si ha fk−1(α)fk+1(α) = 0 e dalle identita (10.4)
abbiamo
fk−1(α) = −fk+1(α).
Consideriamo ora due arbitrari numeri reali a e b, con a < b.e suppo-
niamo che f0(a)f0(b) = 0. Esaminiamo il comportamento della sequenza
S(z) : f0(z), f1(z), f2(z), . . . , fp(z).
Mentre z cresce da a verso b, se si ha, per un certo valore z = β,
fk(β) = 0, con k > 0, abbiamo in corrispondenza queste possibilita:
• fk(z) si annulla ma non cambia segno nell’intorno di β: allora il
numero di variazioni di S(z) rimane inalterato.
• fk(z) si annulla passando da un valore negativo ad un valore positi-
vo. Sappiano pero che i termini adiacenti sono non nulli per z = β
e di segno opposto. Con il passaggio per β abbiamo allora queste
possibilita [− − +
]−→ [
− + +],
oppure [+ − −
]−→ [
+ + −]
le quali entrambe lasciano inalterato il numero di variazioni.
183
• fk(z) si annulla passando da un valore positivo ad un valore negativo.
Questa volta si ha[− + +
]−→ [
− − +],
oppure [+ + −
]−→ [
+ − −]
ed il numero di variazioni rimane lo stesso.
In ogni caso, dunque, il passaggio per uno zero di fk(z) con k > 0 non
altera il numero di variazioni di S(z). Vediamo l’effetto del passaggio per
uno zero di f0(z).
Poiche non vi sono radici multiple, se γ e uno zero di f0(z), il polinomio
f0(z) passa da valori negativi a valori positivi a seconda che sia f1(γ) positivo
o negativo (attenzione: l’ipotesi che non vi siano radici multiple ricorre
continuamente !). Abbiamo allora queste possibilita[− +
]−→ [
+ +],[
+ −]−→ [
− −]
le quali entrambe implicano la perdita di una variazione.
Ecco la conclusione.
Teorema 10.3 ( Sturm) Il numero degli zeri di f(z) compresi tra a e b e
esattamente uguale al numero di variazioni perdute dalla sequenza S(z) nel
passaggio da a a b.
Esempio 10.3 Consideriamo il polinomio
f0(z) = z4 − z+ 1.
Abbiamo
f1(z) = 4z3 − 1.
Poi
z4 − z+ 1 =1
4z(4z3 − 1) − (
3
4z− 1)
184
e
f2(z) =3
4z− 1.
Poi
4z3 − 1 = (16
3z2 +
64
9z+
256
27)(3
4z− 1) − (−
229
27),
e quindi
S(z) =
[z4 − z+ 1, 4z3 − 1,
3
4z− 1,−
229
27
].
Ora
S(0) =
[1,−1,−1,−
229
27
]e
S(∞) = [1, 1, 1,−1].
Poiche le due sequenze presentano lo stesso numero di variazioni, non vi
sono radici reali e positive. Poiche
S(−∞) = [1,−1,−1,−1]
si conclude che l’equazione proposta non ha radici reali.
Osservazione 10.1 Si consideri invece quanto si puo ricavare dal teorema
di Fourier. Abbiamo la sequenza
F(z) = [z4 − z+ 1, 4z3 − 1, 12z2, 24z, 24].
Allora
F(0) = [1,−1, 0, 0, 24],
F(∞) = [1, 1, 1, 1, 1]
e concludiamo soltanto che possono esservi 2 o 0 radici reali e positive.
Poi
F(1) = [1, 3, 1, 1, 24]
e le eventuali radici sono tra 0 e 1. Si comprende facilmente che tutto
cio che si puo ottenere e semplicemente una successione di intervalli di
ampiezza decrescente dove cercare le eventuali radici. Ma non si arriva mai
ad una situazione ove si possa decidere che non vi sono radici reali.
185
10.3 Osservazioni complementari
Il teorema di Sturm, non ha solamente un significato numerico. Anzi: esso
permette di avere importanti informazioni sulla struttura delle equazioni,
anche se assegnate in modo simbolico.
Qra vediamo qualche esempio.
Osservazione 10.2 La condizione affinche un polinomio f0(z) di grado n
(privo di radici multiple) abbia tutte le radici reali e che nella successione
di Sturm
S(z) = [f0(z), f1(z), . . . , fp(z)] (10.5)
sia p = n e che i coefficienti direttori dei polinomi fk(z) siano tutti dello
stesso segno. Infatti in tal caso, indicando con V(z) il numero di variazioni
della (10.5) nel punto z (con ovvio significato per V(−∞) e V(∞)) abbiamo
V(−∞) − V(∞) = n.
Cosı, per il polinomio di secondo grado z2 + pz+ q, abbiamo
S(z) =
[z2 + pz+ q, 2z+ p,−q+
1
4p2].
Allora
V(−∞) =
[1,−1, sign(−q+
1
4p2)
],
mentre
V(∞) =
[1, 1, sign(−q+
1
4p2)
].
Si ritrova la condizione familiare
p2 − 4q > 0.
Nel caso dell’equazione di terzo grado,8
z3 + pz+ q = 0,
8E un esempio che lo stesso Sturm ha cura di proporre. Cf. [Sturm, 1835, pp. 298-99]
186
si ha
S(z) =
[z3 + pz+ q, 3z2 + p,−
2
3pz− q,−1/4
4p3 + 27q2
p2
],
e deve essere
p < 0 e 4p3 + 27q2 < 0.
La seconda condizione implica la prima, e dunque basta
4p3 + 27q2 < 0.
Si notera che per le equazioni di grado superiore, le condizioni che si de-
ducono immediatamente dal teorema di Sturm sono meno trasparenti . Si
provi con
z4 + pz2 + qz+ r.
Data l’importanza della situazione in cui la sequenza di f(z) ha esatta-
mente n+ 1 termini e opportuno dare una definizione.
Definizione 10.1 La sequenza di Sturm del polinomio f(z) e regolare se e
composta esattamente da n + 1 polinomi. In tal caso, evidentemente fk(z)
ha grado n− k e tutti i quozienti hanno grado 1.
Esercizio 10.2 Si consideri l’equazione generica della forma
zn + az+ b = 0.
Si determini la condizione sui parametri a, b in modo che essa abbia il
numero massimo possibile di radici reali. Qual’e questo numero ?
Si osserva facilmente che la dimostrazione del teorema di Sturm consta
di due parti distinte:
• la costruzione, attraverso l’algoritmo di Euclide della successione di
polinomi
S(z) = [f0(z), f1(z), . . . , fp(z)] ;
187
• l’analisi della sequenza stessa, al fine di concludere che solo il passaggio
per uno zero di f0(z) puo causare la perdita di una variazione.
Per effettuare l’analisi della sequenza S(z) non occorre sapere come la se-
quenza stessa venga costruita: basta disporre di una sequenza che possieda
queste proprieta:
1) le funzioni di S(z) sono continue in [a, b];
2) f0(z) non si annulla in a ed in b, ed ha una derivata continua in (a, b);9
3) fp(z) non si annulla in alcun punto di (a, b) ed ha quindi segno costante;
4) se a ≤ α ≤ b, non puo essere contemporaneamente
fj(α) = fj+1(α) = 0, per j = 0, 1, . . . , n− 1;
5) se si ha
fj(α) = 0
allora
fj−1(α) · fj+1(α) < 0 per j = 1, 2, . . . , n− 1;
6) se f0(α) = 0, la derivata f′0(α) e diversa da 0 e f1(α) ha il segno di f′0(α).
Una qualsiasi sequenza con le proprieta 1) - 6) permette di trarre la
stessa conclusione.
Definizione 10.2 Una sequenza con le proprieta precedenti si dice sequen-
za di Sturm generalizzata.
Useremo invece il nome di ‘sequenza di Sturm’ per denotare esattamente
la sequenza costruita a partire da f0(z) e f1(z) = f′0(z).
9Si puo eliminare questa ipotesi e formulare il punto 6) nel modo seguente: in un
intorno di una radice reale α le due funzioni V0 e V1 hanno segno opposto per x < α e
lo stesso segno per x > α.
188
Esempio 10.4 (Sylvester) Si consideri il polinomio
f0(z) = 1+z
1!+z2
2!+ . . .+
zn
n!.
Vogliamo mostrare che l’equazione f0(z) = 0 ha al piu una radice reale
(necessariamente negativa). Osserviamo, a tal fine che
f0(z) − f′0(z) =
zn
n!
e
S(z) = [f0(z), f′0(z),−z
n]
e una sequenza di Sturm in (−∞,−ε).Sia n pari: per z = −∞, si ha S(−∞) = [1,−1,−1] mentre S(−ε) = (ap-
plicando la funzione sign)= [1, 1,−1]. Non vi sono radici.
Sia n dispari: S(−∞) = [−1, 1, 1], mentre S(−ε) = [1, 1, 1]. Si ha esat-
tamente una radice in (−∞,−ε). Per la arbitrarieta di ε si conclude che
esiste una radice negativa in (−∞, 0).10.4 Un risultato piu generale
A conclusione della sua memoria, Sturm fa un’osservazione importante.
Supponiamo di costruire una successione di polinomi, con il metodo di
Sturm
f0(z), f1(z), f2(z), . . . , fp(z) (10.6)
assumendo semplicemente che f1(z) sia un arbitrario polinomio di grado
inferiore a quello di f0(z) privo di fattori in comune con f0(z). Questa volta,
quando la variabile z passa per uno zero di f0(z) il segno del rapportof0(z)
f1(z)non e piu controllabile con il Lemma ??. Puo passare da un valore positivo
ad uno negativo o viceversa; od avere segno costante. Ma, ancora una
volta, l’annullarsi di una funzione intermedia non puo cambiare il numero
di variazioni. Si ha il seguente teorema.
Teorema 10.4 Il numero di radici dell’equazione f0(z) = 0, comprese tra
due numeri a, b, per le quali il rapportof0(z)
f1(z)passa da valori negativi a
189
valori positivi meno il numero di radici dell’equazione f0(z) = 0, comprese
tra gli stessi numeri, per le quali il rapportof0(z)
f1(z)passa da valori positivi
a valori negativi e uguale al numero di variazioni perdute nella successione
(10.6) nel passaggio da a a b.
Cauchy porra esattamente questa nozione (con f0(z) e f1(z) scambiate)
a fondamento della propria generalizzazione del teorema di Sturm.
190
Capitolo 11
Galois e l’origine dell’algebramoderna
In questo capitolo espongo per sommi capi il contenuto della memoria fon-
damentale di Galois: [Galois, 1976, pp. 43-71]. Kaplansky, nel suo bel libro
(cfr. [Kaplansky, 1972, p.10]) osserva:“It was Galois’ remarkable discovery
that many questions concerning a field are best studied by transforming
them into group theoretical questions in the group of automorphisms of
the field.” Il che e verissimo, ma se un lettore, partendo unicamente dalla
lettura del libro di Kaplansky, volesse leggere il testo originale di Galois,
si troverebbe in qualche difficolta. Per questo nella sezione successiva mi
propongo di creare un breve raccordo tra le moderne nozioni algebriche e
la presentazione di Galois.1
1Vi sono numerosi testi che, in vari modi, si pongono questo stesso obiettivo.
Per quanto segue ho considerato soprattutto [Tignol, 2001]. Nel seguito saranno dati
riferimenti piu precisi.
191
11.1 Una breve introduzione sul concetto
di gruppo di Galois
Nella memoria originale di Galois il ‘gruppo di Galois’ e definito direttamen-
te come un gruppo di sostituzioni sulle radici. Per comprendere al meglio i
suoi risultati e meglio premettere la concezione che Galois possiede di grup-
po di sostituzioni, prescindendo per ora dall’ipotesi che gli elementi sui quali
si operano le sostituzioni siano le radici di un’equazione.2
Consideriamo allora n elementi x1, x2, . . . , xn. Una sostituzione σ e
semplicemente una applicazione biunivoca dell’insieme {x1, x2, . . . , xn} in se
stesso. Abitualmente si denotano le sostituzioni nella forma
σ =
(x1 x2 . . . xn
xi1 xi2 . . . xin
)(11.1)
per indicare in modo visivamente assai chiaro che si ha σ(xk) = xik . Poi-
che le sostituzioni sono particolari funzioni (biunivoche), la composizione
di funzioni e associativa, valgono le leggi di cancellazione a sinistra ed a
destra, e possiamo sempre immaginare che sia data anche la sostituzione
identica, che indichiamo con 1, la richiesta che Galois pone perche un insie-
me di sostituzioni {1, σ, τ, . . .} formi un gruppo e semplicemente la chiusura
rispetto alla composizione.3
Galois da spesso una formulazione ‘visiva’, attraverso una tabella, della
nozione di gruppo.4 Consideriamo, ad esempio il sottogruppo, del grup-
po totale di permutazioni su x1, x2, x3, x4, generato da 1, σ = (x1 x2), τ =
(x3 x4). Per ottenere tutti gli elementi del gruppo basta aggiungere στ =
(x1 x2)(x3 x4).2Galois conosce la pionieristica memoria di Cauchy [1815b], che cita piu volte.3I gruppi di sostituzioni sono particolari gruppi finiti, per i quali la definizione e
assai semplice. Ecco come la presenta Serret (usando il termine ‘sistema di sostituzioni
coniugate invece di ‘gruppo’): “Essendo date piu sostituzioni formate con n lettere, se,
moltiplicandole una piu volte le une per le altre o per se stesse non si ottengono altro
che sostituzioni contenute nell’insieme (suite) di quelle date, esse costituiscono cio che
Cauchy ha chiamato un sistema di sostituzioni coniugate. . . ” [Serret, 1879, p. 278].4Cf. [Edwards, 1984, p. 48-51]. Tuttavia mi pare che Edwards assegni troppo valore
esplicativo a cio che per Galois e semplicemente una comoda visualizzazione. In molti
casi Galois opera in termini del tutti simili a quelli attuali.
192
Guardiamo ora la seguente tabella la quale elenca gli allineamenti che
si ottengono da x1 x2 x3 x4 applicando le permutazioni σ, τ, στ ad essa.
x1 x2 x3 x4
x2 x1 x3 x4
x1 x2 x4 x3
x2 x1 x4 x3
(11.2)
La chiusura rispetto alla composizione equivale a dire che, se riordiniamo le
colonne in funzione di un riga qualsiasi, per riavere l’ordinamento ‘naturale’,
si riottengono (pur non nello stesso ordine) le stesse righe. Scegliamo ad
esempio la quarta riga. Per riavere gli elementi nell’ordine x1, x2, x3, x4occorre scambiare la prima e la seconda colonna e la terza e la quarta. Si
ha allorax2 x1 x4 x3
x1 x2 x4 x3
x2 x1 x3 x4
x1 x2 x3 x4
(11.3)
La tabella (11.3) differisce dalla (11.2) solo per l’ordinamento delle righe.
Le verifiche compiute in funzione di altre righe mostrano l’invarianza (nei
termini detti) del risultato.5
Un teorema che Galois utilizza sistematicamente
Sia p(x) un polinomio irriducibile e sia q(x) un altro polinomio qualsiasi.
Supponiamo che in una opportuna estensione del campo base i due polinomi
abbiano la radice α in comune. Allora p(x) divide q(x).
Sia infatti d(x) il massimo comun divisore, allora, per certi due polinomi
a(x), b(x) si ha
d(x) = a(x)p(x) + b(x)q(x)
e quindi d(α) = 0.
Poiche p(x) e irriducibile il massimo comun divisore, che non puo essere
di grado 0 avendo la radice α, deve coincidere (a meno di una costante) con
p(x) stesso, e quindi p(x) divide q(x).
5Cf. [Edwards, 1984, pp. 48-51].
193
Naturalmente questo significa anche che tutte le radici di p(x) debbono
essere radici di q(x) (in una opportuna estensione, ove queste radici esistano,
ovviamente).6 Il risultato si estende in modo ovvio al caso in cui q(x) sia
una funzione razionale.
Ecco ora un breve cenno (in termini un po’ modernizzati) della presen-
tazione originale.
11.2 Un lemma preliminare
Sia φ(x) = 0 un’equazione priva di radici multiple avente i coefficienti in
un campo K di caratteristica 0. Siano x1, x2, . . . , xn le radici dell’equazione
ed indichiamo con P l’insieme delle permutazioni delle radici.
Lemma 11.1 E possibile determinare una funzione razionale
V : P → K(x1, x2, . . . , xn)
iniettiva. In particolare si possono scegliere n elementi del campo K, a1, a2, . . . , an,
tali che la funzione definita da
V : (xi1 xi2 . . . xin) 7→ a1xi1 + a2xi2 + · · ·+ anxin
sia iniettiva.7
Dimostrazione. (Dedekind) Poniamo ai = hi−1 e consideriamo il polinomio
p(t) =∏
i1,i2,...,in
[t− (xi1 + xi2h+ · · ·+ xinhn−1)]
Il polinomio p(t) ha due radici coincidenti se e solo se si ha un’uguaglianza
della forma
xi1 + xi2h+ · · ·+ xinhn−1 = xj1 + xj2h+ · · ·+ xjnhn−1.6Galois da il risultato in questa forma: cf. [Galois, 1976, p. 47].7La dimostrazione di Dedekind’s si trova in [Scharlau, 1981, p. 81]. Si veda anche
[Edwards, 1984, p. 36].
194
dove (xi1 xi2 . . . xin) e (xj1 xi2 . . . xjn) sono due permutazioni distinte. Se
consideriamo il discriminante del polinomio p(t) (che non e identicamente
nullo: lo si dimostri per esercizio), abbiamo un polinomio in h che ha solo
un numero finito di radici.
Basta allora scegliere h in modo che non sia una radice. 2
Esempio 11.1 Consideriamo il caso semplice ma gia esplicativo, di un’equazione
di secondo grado, con due radici distinte x1, x2. Sia
φ(x) = x2 + px+ q = (x− x1)(x− x2).
Dobbiamo allora considerare
p(t) = [t− (x1 + hx2)][t− (x2 + hx1)] =
= t2 − (x1 + x2)(1+ h)t+ x1x2 + (x21 + x22)h+ x1x2h
2(11.4)
Il discriminate del polinomio p(t) risulta
(h− 1)2 (x1 − x2)2
ed e dunque sufficiente prendere h diverso da 1. �
11.3 La risolvente di Galois
Ad una funzione V con le caratteristiche indicate si da spesso il nome
di risolvente di Galois. Scegliamo ora un valore di V , ad esempio quello
corrispondente alla permutazione identica (che indichiamo con 1)
V1 = V(x1, x2, . . . , xn)
e sia F(V) il suo polinomio minimo.8
Osservazione 11.1 Tutte le radici di F(V) hanno la forma
V(xi1, xi2 , . . . , xin).
8Poiche x1, x2, . . . , xn sono radici di un polinomio a coefficienti nel campo base K
anche ogni valore di V e radice di un polinomio a coefficienti nel campo base. Esiste
dunque il polinomio minimo di V1.
195
Dimostrazione. Indichiamo con Vσ, Vτ, . . . i valori che assume V1 quando
applichiamo a (x1 x2 . . . xn) tutte le permutazioni σ, τ, . . . e consideriamo
f(V) = (V − V1)(V − Vσ)(V − Vτ) · · ·
Il polinomio f(V) ha i coefficienti in K, per il teorema sui polinomi simme-
trici, ed ha la radice V1. Dalle proprieta del polinomio minimo segue che
F(V)|f(V).9 �Dimostriamo ora che K(V1) e il campo di decomposizione di φ(x). Dia-
mo al teorema la forma scelta da Galois.
Teorema 11.1 Sia
V : P → K(x1, x2, . . . , xn)
una funzione iniettiva e sia
V1 = V(x1, x2, . . . , xn).
Allora tutte le radici di φ(x) = 0 sono funzioni razionali di V1.10
Dimostrazione. Introduciamo una variabile t e consideriamo il polinomio
p(t) = [t− V(x1, x2, x3, . . . )][t− V(x1, x3, x2, . . . )] · · · (11.5)
che si ottiene considerando tutte le permutazioni che fissano una radice, ad
esempio x1. Questo polinomio ha per coefficienti funzioni simmetriche delle
altre radici x2, . . . , xn. Se indichiamo con u1, u2, . . . , un le funzioni simme-
triche delle radici x1, x2, . . . , xn e con v1, v2, . . . , vn−1 le funzioni simmetriche
delle sole radici x2, . . . , xn, possiamo utilizzare le relazioni
v1 = u1 − x1, v2 = u2 − u1x1 + x21, . . . (11.6)
per riscrivere il polinomio (11.23) come un polinomio nelle due variabili t, x1a coefficienti in K. Indichiamo questo polinomio con p(t, x1).
9In termini piu vicini a quelli di Galois si puo definire F(V) come il fattore irriducibile
di f(V) che contiene la radice V1.10Una chiara descrizione della dimostrazione di Galois’ si trova in Radloff [2002]. Si
veda anche la mia recensione di questo articolo sulla rivista Mathematical Reviews.
196
Abbiamo identicamente p(V1, x1) = 0, dalla quale identita possiamo
dedurre che l’equazione
p(V1, x) = 0
ha la radice x1.
Poiche abbiamo anche φ(x1) = 0, le due equazioni p(V1, x) = 0, φ(x) =
0, hanno certamente in comune almeno la radice x1.
Se d(x) e il massimo comun divisore di questi due polinomi abbiamo
dunque d(x1) = 0.
Per la definizione di massimo comun divisore, gli eventuali altri valori
per i quali si annulla vanno ricercati tra x2, x3, . . . , ossia tra i valori che
annullano φ(x). Ma se, ad esempio, d(x2) = 0 necessariamente anche
p(V1, x2) = 0.
Ora basta riflettere sul modo con il quale e costruito p(t, x1) (a partire
dalle (11.23)) per comprendere che essendo p(t, x2) costruito nello stesso
modo, ponendo la radice x2 al posto di x1, se fosse p(V1, x2) = 0, V1 do-
vrebbe coincidere con uno dei valori V(x2, xi2 , . . . ) e dunque la funzione V
non sarebbe iniettiva sulle permutazioni.11
Se d(x) ha la sola radice x1 si tratta dunque, con il metodo delle divisioni
successive, di determinare un polinomio di primo grado nella variabile x a
partire da φ(x) e da p(V1, x). Eguagliando a 0 il risultato si ottiene x1 nei
termini di V1. In modo analogo si procede per esprimere le altre radici. 2
Esempio 11.2 Consideriamo l’equazione di terzo grado x3 + px + q = 0,
e siano x1, x2, x3 le sue radici. Se l’equazione e irriducibile, una funzione V
e data da
V = x1 − x2.12
Abbiamo:
p(t) = [t−(x1−x2)][t−(x1−x3)] = t2−[2x1−(x2+x3)]t+x
21−(x2+x3)x1+x2x3.
11Si veda la nota 13, ove e dato un esempio chiarificatore.12Vi sono due tipologie di verifiche da effettuare: se x1 − x2 = x2 − x1 si ha x1 = x2.
Se x1 − x2 = x2 − x3 si ha 2x2 = x1 + x3, ossia 3x2 = x1 + x2 + x3 = 0. Gli altri casi
sono simili.
197
Tenendo conto di x2+x3 = −x1, x1(x2+x3)+x2x3 = p, ossia x2x3 = p−x21,
otteniamo
p(t, x1) = t2 − 3x1t+ p+ 3x
21.
13 Dobbiamo ora (ponendo per semplicita V1 = V) considerare i polinomi
x3 + px+ q, 3x2 − 3Vx+ p+ V2.
Il resto della divisione del primo per il secondo da
2
3
(V2 + p
)x−
1
3V3 −
1
3Vp+ q.
Allora, risolvendo:
x1 =1
2V −
3
2
q
p+ V2. (11.7)
Considerando invece p(t) = [t − (x1 − x2)][t − (x3 − x2)] e ripetendo il
procedimento, otteniamo
x2 = −1
2V −
3
2
q
p+ V2.14 (11.8)
Infine, con p(t) = [t− (x1 − x2)][t− (x2 − x1)] si ha
x3 =3q
p+ V2. 2 (11.9)
11.4 Il gruppo
Sia φ(x) un polinomio avente le radici x1, x2, . . . , xn e sia V(x1, . . . , xn)
una risolvente di Galois. Sia F(V) il polinomio minimo di V1. Siano
V1, V2, . . . , Vr le radici del polinomio minimo (r ≤ n!).Poiche queste radici corrispondono biunivocamente a certe sostituzioni
di Sn si tratta di dimostrare che queste sostituzioni formano un gruppo.
Per Galois la cosa e evidente, ed egli si limita sostanzialmente a scrivere
13Questo polinomio ha le radici x1 − x2, x1 − x3. Il polinomio p(t, x2) ha invece le
radici x2 − x1, x2 − x3, ecc.14Ovviamente si tratta di una semplice verifica, perche V = x1 − x2.
198
la tabella che corrisponde al gruppo. Poiche per ogni radice xi si ha xi =
fi(V1), la tabella e15
V1 f1(V1) f2(V1) . . . fn(V1)
V2 f1(V2) f2(V2) . . . fn(V2)
. . . . . . . . . . . . . . .
Vr f1(Vr) f2(Vr) . . . fn(Vr)
(11.10)
Galois da due esempi, che vedremo nella Sezione 11.8, ma non si arresta
a dimostrare che la tabella (11.10) costituisce effettivamente un gruppo.
Poiche la dimostrazione, per quanto semplice, non e del tutto evidente,
vediamo la dimostrazione di Serret.
La dimostrazione di Serret
La cosa non risulta totalmente evidente a Serret, il quale da la dimostrazione
seguente.16 Abbiamo allora
x1 = f1(V1), x2 = f2(V1), . . . , xn = fn(V1). (11.11)
Ora
∀k,φ(xk) = 0⇒ φ(fk(V1)) = 0
e quindi V1 e una radice di φ(fk(V)). Di conseguenza ogni radice di F(V) e
radice di φ(fk(V)) e quindi fk(Vi) e radice di φ(x).
Questo significa che, sostituendo Vi al posto di V1 nelle (11.11) otteniamo
ancora delle radici. Mostriamo che sono distinte.
Infatti, da
fk(Vi) = fj(Vi)
segue che Vi e radice di fk(V)−fj(V) = 0, ma allora anche fk(V1)−fj(V1) =
0, il che comporta la contraddizione xk = xj.
Consideriamo ora le permutazioni
1, σ, τ, . . .
15Ho cambiato lievemente le notazioni. Si veda [Galois, 1976, p. 53].16Cf. [Serret, 1879, p. 447-448]. Ho semplicemente modificato un po’ l’aspetto grafico.
Si tenga anche presente la nota 3 di questo capitolo.
199
individuate dalle radici di F(V) = 0. Sia Vi una di queste radici: essa ha la
forma
Vi = V(xi1 , xi2, . . . , xin)
ma, essendo tutte le radici funzioni razionali di V1, avremo
Vi = θ(V1).
Questo significa che V1 e radice di F(θ(V)). Allora anche F(θ(Vj)) = 0 e
quindi per un certo k sara θ(Vj) = Vk. Denotiamo con σi la permutazione
che fa passare dall’allineamento delle radici corrispondente a V1 a quello
corrispondente Vi, con σk la permutazione che fa passare dall’allineamento
delle radici corrispondente a V1 a quello corrispondente Vk e con σj, infine,
la permutazione che fa passare dall’allineamento delle radici corrispondente
a V1 a quello corrispondente Vj. Quindi σiσj = σk. Le permutazioni cor-
rispondenti alle radici di F(V) formano un gruppo. Si tratta del gruppo di
Galois.
11.5 Il teorema fondamentale
In questa sezione esponiamo la proprieta fondamentale del gruppo di Galois.
Da questa proprieta segue anche la possibilita veirificare la coincidenza con
la definizione moderna. In questo caso la dimostrazione di Galois e semplice
e bella.
Teorema 11.2 (Proposizione I) Il gruppo G di permutazioni definito dal
polinomio F(V) e tale che ogni funzione delle radici che rimane invariata
per le permutazioni di G ha valore in K e viceversa, ogni funzione delle
radici che assume valore in K rimane invariata per le permutazioni di G.17
Dimostrazione. Sia g(x1, . . . , xn) una funzione delle radici. Poiche tutte le
radici sono funzioni razionali di V1, sara
g(x1, . . . , xn) = ψ(V1).
17Cf. [Galois, 1976, pp. 51-53].
200
Se la funzione g rimane invariata per le sostituzioni σ, τ, . . . avremo18
ψ(V1) = ψ(Vσ) = ψ(Vτ) = . . .
Il numero di queste sostituzioni (uguale al grado di F(V)) e r, e avremo
ψ(V1) = ψ(Vσ) = ψ(Vτ) = · · · = 1
r(ψ(V1) +ψ(Vσ) +ψ(Vτ) + . . . ) .
Ne segue che ψ(V1) e una funzione simmetrica delle radici di F(V) e dunque
ha una valore esprimibile attraverso i suoi coefficienti, che sono elementi del
campo base K.
Viceversa, se si ha g(V1) = k, abbiamo che V1 e radice della equazione
g(V) − k = 0.
Questa equazione ammette allora anche tutte le altre radici di F(V) ed il
suo valore e quindi invariato per le sostituzioni del gruppo di Galois. 2
Osservazione 11.2 Si noti che nella dimostrazione precedente non abbia-
mo utilizzato il fatto che le sostituzioni corrispondenti alle radici di F(V)
formano un gruppo. Questo teorema puo quindi precederne la verifica. E
interessante osservare che anche nella profonda ed elegante versione della
teoria data da Emil Artin, alcuni risultati importanti sono dati su un insie-
me finito di automorfismi, indipendentemente dalla struttura di gruppo. Si
vedano per esempio il Teorema 13 e le sue conseguenze in [Artin, 1988, pp.
29-33].
Osservazione 11.3 Si noti che due funzioni delle radici di un dato poli-
nomio che, considerate come funzioni di variabili indipendenti sono diverse
possono divenire uguali quando considerate, appunto, come funzioni delle
radici. Ad esempio, data l’equazione x3+px+q = 0 e indicate con r1, r2, r3le sue radici, si ha h(r1, r2, r3) = r1 + r2 = k(r1, r2, r3) = −r3. Tuttavia,
se h(x1, x2, . . . , xn) e k(x1, x2, . . . , xn) sono tali che per una data equazione
18Se g(x1, x2, . . . , xn) = g1(x1,x2,...,xn)g2(x1,x2,...,xn) , occorre naturalmente che sia
g2(σ(x1), σ(x2), . . . , σ(xn)) = 0. Lo si dimostri per esercizio, oppure si veda [Tignol,
2001, pp. 250-252].
201
avente le radici r1, r2, . . . , rn si ha h(r1, r2, . . . , rn) = k(r1, r2, . . . , rn),- ossia
h(r1, r2, . . . , rn) − k(r1, r2, . . . , rn) = 0,- per ogni permutazione σ del grup-
po di Galois si ha h(σ(r1), σ(r2), . . . , σ(rn)) = k(σ(r1), σ(r2), . . . , σ(rn)).
Infatti
h(r1, r2, . . . , rn) = h(f1(V1), f2(V1), . . . , fn(V1)) = H(V1) =
= k(f1(V1), f2(V1), . . . , fn(V1)) = K(V1)
e, evidentemente,
h(σ(r1), σ(r2), . . . , σ(rn)) = H(Vσ),
k(σ(r1), σ(r2) . . . , σ(rn)) = K(Vσ)
Ma l’equazione H(V)−K(V) ha la radice V1 e quindi deve ammettere anche
la radice Vσ. il che mostra appunto che
h(σ(r1), . . . , σ(rn)) = H(Vσ) = k(σ(r1), . . . , σ(rn)) = K(Vσ).
E allora possibile associare ad ogni permutazione del gruppo di Galois G
un automorfismo di E = K(x1, . . . , xn) che fissa gli elementi di K. Poiche
viceversa ogni tale automorfismo corrisponde ad una permutazione delle
radici, abbiamo che il gruppo di Galois e esattamente il gruppo di tutte
le permutazioni delle radici che corrispondono ad automorfismi di E che
fissano il campo base K.
Jordan e la definizione del gruppo di Galois
La descrizione di Jordan del fatto che le sostituzioni corrispondenti alle radi-
ci V1, V2, . . . , Vr formino un gruppo, per quanto temporalmente successiva a
quella di Serret, forse coglie meglio l’idea di Galois. Intanto Jordan anticipa
la dimostrazione del teorema 11.2, che qualifica giustamente come ‘teorema
fondamentale’. Una semplice ispezione alla struttura dimostrativa mostra
che e possibile farlo. Poi osserva:
Il ne reste plus qu’a demontrer que les susbtitutions 1, a, b, . . .
forment un groupe, ce qui ne presente pas de difficulte.19
19Cf. [Jordan, 1870, p. 258]. Con 1, a, b, . . . Jordan indica le sostituzioni che
corrispondono a V1, V2, V3 . . . .
202
In effetti il polinomio F(V) ha esattamente le radici che corrispondono alle
sostituzioni 1, a, b, . . . , ossia
F(V) = (V − V1)(V − Va)(V − Vb) · · ·
poiche i suoi coefficienti sono razionalmente noti essi non cambiano (a cau-
sa del teorema 11.2) per l’azione di una qualsiasi sostituzione scelta fra
1, a, b, . . . , per esempio per a. Ne segue che (utilizzando la trasparente
notazione di Jordan)
F(V) = (V − Va)(V − Va2)(V − Vba) · · ·
Ma il polinomio F(V) puo restare identico a se stesso se e solo se mantiene
le stesse radici, e quindi le sostituzioni a, a2, ab, . . . debbono coincidere,
a meno dell’ordine con le 1, a, b, . . . . Ovviamente questo ragionamento si
puo ripetere per ogni sostituzione di 1, a, b, . . . il che mostra la chiusura
rispetto alla composizione.
11.6 Esempi di calcolo del gruppo di Galois
Anche se il gruppo di Galois e calcolabile con un algoritmo concettualmen-
te semplice, il calcolo diretto comporta spesso complicazioni notevoli. Per
questa ragione e assai raro trovare nella vasta letteratura su Galois (soprat-
tutto nesi saggi di carattere storico) il calcolo del gruppo effettuato in base
alla definizione.
Tuttavia l’esame dei casi piu semplici, ove l’algoritmo e effettivamente
applicabile, non e privo di interesse. Da infatti concretezza ad una teoria
che, occorre sottolinearlo, non si affida a risultati di natura esistenziale ma
consta di procedure effetive.
L’equazione irriducibile di terzo grado
Consideriamo il caso dell’equazione di terzo grado nella forma
x3 + px+ q = 0 (11.12)
203
e supponiamo che il polinomio a primo membro della (11.12) sia irriducibile.
Allora una risolvente e data da V(x1, x2, x3) = x1 − x2. Utilizzando questa
risolvente, abbiamo
F(t) =∏xi =xj
[t− (xi − xj)] = t6 + 6pt4 + 9p2t2 + 4p3 + 27q2 (11.13)
Ora, come si vede facilmente, si ha
F(t) =(t3 + 3pt+
√−4p3 − 27q2
)(t3 + 3pt−
√−4p3 − 27q2
).
Se quindi il discriminante dell’equazione (11.12), ∆ = −4p3 − 27q2, e un
quadrato perfetto il polinomio F(t) si fattorizza ed il gruppo di Galois si
riduce al gruppo ciclico di ordine 3. In caso contrario il gruppo e dato daS3.
Ad esempio, per l’equazione x3−3x+1 = 0, si ha F(t) = t6−18t4+81t2−81.
Poiche il discriminante di x3 − 3x+ 1 vale 81, si ha
t6 − 18t4 + 81t2 − 81 = (t3 − 9t− 9)(t3 − 9t+ 9).
Si puo poi verificare che, se le radici di (11.12) sono quelle date approssi-
mativamente da
r1 = 0.3473, r2 = 1.5320, r3 = −1.8794
il polinomio t3− 9t− 9 ha le radici r1− r2, r2− r3, r3− r1 e quindi il gruppo
di Galois e il gruppo ciclico generato da (r1 r2 r3).
Altri esempi
Consideriamo l’equazione x3 − 2 = 0. Ponendo p = 0 e q = −2 nella
(11.13) si ottiene t6 + 108 = 0. Poiche −108 non e un quadrato in Q,
questo polinomio e irriducibile e il gruppo di Galois e G3. Naturalmente la
situazione cambia se immaginiamo di aggiungere una radice cubica primitiva
dell’unita, ossia una quantita α tale che α2 + α+ 1 = 0. In tal caso
(6+ 12α)2 (= 6i√3) = 36+ 144α+ 144α2 =
= 36+ 144(α+ α2) = 36+ 144 · (−1) = −108(11.14)
204
e quindi
t6 + 108 = [t3 − (6+ 12α)][t3 + (6+ 12α)].20
Otteniamo il gruppo ciclico di ordine 3. Quindi in Q(α) il gruppo di Galois
di x3− 2 = 0 si riduce al gruppo ciclico di ordine 3. Dobbiamo ora scegliere
il polinomio che individua il nostro gruppo.
Sia r1 =3√2, r2 =
3√2α, r3 =
3√2α2. Il polinomio che ha la radice r1− r2
e che individua questo gruppo e allora t3 + 6+ 12α.
Per arrivare alla individuazione delle singole radici, bisogna riuscire a
decomporre ulteriormente il polinomio t3+6+12α, il che significa conoscere
una delle radici cubiche di −6 − 12α (= −6i√3). Una volta noto il valore
V1 =3√
−6i√3 possiamo utilizzare le (11.7), (11.8), (11.8) per avere il valore
delle radici. Per esempio, in questo caso la (11.7) diviene
x1 =1
2V +
3
V2
e, come si verifica facilmente, ponendovi il valore V1 si ottiene la radice
reale, 3√2.
L’equazione di terzo grado con una radice razionale
Consideriamo l’equazione di terzo grado
x3 − 5x− 2 = 0
la quale ha le radici x1 = 1 +√2, x2 = 1 −
√2, x3 = −2. Anche in questo
caso V(x1, x2, x3) = x1 − x2 e una risolvente, come si verifica facilmente.
Utilizzando questa risolvente la (11.13) diviene
(t2 − 8)(t2 − 6t+ 7)(t2 + 6t+ 7).
Il primo fattore, che ha la radice V1 = x1− x2 = 1+√2− (1−
√2) = 2
√2,
individua il gruppo di Galois dell’equazione, dato da
x1 x2 x3
x2 x1 x320Si osservi che, per portare a termine questa decomposizione, non abbiamo usato la
conoscenza ‘esterna’ data da α = −12+ 1
2i√3, oppure α = −1
2− 1
2i√3, ma solo il fatto
che α2 + α = −1. In altre parole non abbiamo utilizzato l’immersione Q ⊂ C.
205
Gli altri due fattori, che individuano lo stesso gruppo, corrispondono a
x1 x3 x2
x2 x3 x1,
x3 x1 x2
x3 x2 x1.
L’equazione biquadratica
Naturalmente al crescere del grado l’uso diretto delle definizioni viste com-
porta calcoli piuttosto intricati. Consideriamo il caso dell’equazione biqua-
dratica
x4 + px2 + q = 0 (11.15)
che abbia le radici x1, x2, x3, x4. Una risolvente (per p,q generici) puo essere
data da
V(x1, x2, x3, x4) = x1 + 2x2 + 4x3. (11.16)
Utilizzando questa risolvente, otteniamo un polinomio di grado 24 con coef-
ficienti nelle variabili p, q e contenente anche interi piuttosto grandi. Indico
solo i primi termini:
t24 + 70pt22 + (2079p2 + 70q)t20 + (34500p3 + 2590pq)t18 + · · ·
Tuttavia questo polinomio si fattorizza. Il fattore contenente la radice
corrispondente alla permutazione identica e
t8 + 34pt6 + (321p2 + 322q)t4 + (544p3 + 5474pq)t2+
+ 256p4 − 9248p2q+ 83521q2.(11.17)
Sia ora
x1 =
√2
2
√−p+
√p2 − 4q, x2 = −x1, x3 =
√2
2
√−p−
√p2 − 4q, x4 = −x3.
Il gruppo di Galois e presentato dalla seguente tabella:
x1 x2 x3 x4
x1 x2 x4 x3
x2 x1 x3 x4
x2 x1 x4 x3
x3 x4 x1 x2
x3 x4 x2 x1
x4 x3 x1 x2
x4 x3 x2 x1
206
Si tratta evidentemente del gruppo generato da (x1 x2), (x3 x4), (x1 x4)(x2 x3).
Consideriamo un caso ancor piu particolare: l’equazione sia
x4 − 10x2 + 1. (11.18)
In tal caso il polinomio (11.17) si fattorizza ulteriormente, ed il fattore che
corrisponde alla permutazione identica e
t4 − 154t2 + 529.
Il gruppo di Galois si riduce a
x1 x2 x3 x4
x2 x1 x4 x3
x3 x4 x1 x2
x4 x3 x2 x1
,
Naturalmente questa riduzione corrisponde alla natura particolarmente sem-
plice delle radici dell’equazione (11.18):
x1 =√3+
√2, x2 = −x1, x3 =
√3−
√2, x4 = −x3.
La dimostrazione di Serret e il calcolo del prodotto dipermutazioni
La dimostrazione di Serret del fatto che le permutazioni corrispondenti al
fattore irriducibile F(V) formano un gruppo consente anche il calcolo del
prodotto di permutazioni. Naturalmente, anche in questo caso, il calcolo
risulta notevolmente complicato anche per equazioni di grado basso.
Consideriamo il caso dell’equazione x3+px+q = 0. Abbiamo gia visto
che, utilizzando per risolvente la funzione V = (x1, x2, x3) → x1 − x2, e
indicando con V1 il suo valore sulla permutazione identica, si ha
x1 =1
2V1 −
3
2
q
p+ V21, x2 = −
1
2V1 −
3
2
q
p+ V21, x3 =
3q
p+ V21,
ove, naturalmente
p = x1x2 + x1x3 + x2x3 = −(x21 + x22 + x1x2), q = x21x2 + x1x
22. (11.19)
207
Se p e q sono coefficienti generici, il gruppo di Galois risulta S3 ed i suoi
elementi sono dati da
x1 x2 x3 V1 x1 − x2x1 x3 x2 V2 x1 − x3x2 x1 x3 V3 x2 − x1x2 x3 x1 V4 x2 − x3x3 x1 x2 V5 x3 − x1x3 x2 x1 V6 x3 − x2
(11.20)
Sia σ la permutazione data da σ : V1 → V2 e τ data da τ : V1 → V5.
Vogliamo seguire le indicazioni date nella Sezione 11.4 per verificare che
στ =
(x1 x2 x3
x1 x3 x2
)(x1 x2 x3
x3 x1 x2
)=
(x1 x2 x3
x3 x2 x1
),
ossia che στ = V1 → V6.
Calcoliamo θ. Poiche V2 = x1 − x3, si ha
θ(V1) =1
2V1 −
9
2
q
p+ V12.
Si tratta ora di calcolare θ(V5). Poiche
V5 = x3 − x1 =9
2
q
p+ V21−1
2V1
si ha
θ(V5) =1
2
(9
2
q
p+ V21−1
2V1
)−9
2
q
p+
(9
2
q
p+ V21−1
2V1
)2 . (11.21)
Ponendo nella (11.21) V1 = x1 − x2 e tenendo conto delle (11.19) si ottiene
−x1 − 2x2. Ma V6 = x3 − x2 = (−x1 − x2) − x2 = −x1 − 2x2 e dunque il
risultato ottenuto e proprio V6.
Il valore pratico di questa verifica non e certo molto elevato. Si noti
tuttavia che essa ha un carattere algoritmico e come al tempo stesso le
uniche proprieta utilizzate per le radici sono quelle espresse dalle (11.19).
208
11.7 Generalizzazione del concetto di
risolvente
I calcoli che abbiamo visto nella sezione precedente sono piuttosto compli-
cati. in molti casi il calcolo del gruppo di Galois risulta assai piu semplice
se esso viene considerato direttamente come un gruppo di automorfismi.
Iniziamo con il generalizzare il concetto di risolvente:
Definizione 11.1 Sia φ(x) un polinomio privo di radici multiple a coeffi-
cienti in un dato campo K e siano x1, x2, . . . , xn le sue radici. Un elemento
V ∈ K(x1, x2, . . . , xn) e detto risolvente di Galois se si ha
xi ∈ K(V), per i = 1, 2, . . . , n.
Il gruppo di Galois puo ora essere descritto nel modo seguente: sia V una
risolvente di Galois. Abbiamo allora
xi = fi(V) per i = 1, 2, . . . , n,
ove fi(x) ∈ K(x). Siano V1, V2, . . . , Vm le radici del polinomio minimo di V
(si veda l’osservazione seguente). Si dimostra facilmente (seguendo le linee
di quanto visto in precedenza) che per ogni j = 1, 2, . . . ,m gli elementi
f1(Vj), f2(Vj), . . . fn(Vj)
costituiscano una permutazione delle radici x1, x2, . . . , xn e che l’insieme
delle permutazioni
σj : xi 7→ fi(Vj)
forma il gruppo di Galois di φ(x) suK.21
Osservazione 11.4 Si noti che ogni elemento u ∈ K(x1, x2, . . . , xn) e ra-
dice di un polinomio (e dunque di un polinomio monico irriducibile) a coef-
ficenti in K. Come abbiamo visto, il gruppo di Galois di K(x1, x2, . . . , xn)
e in particolare un gruppo di automorfismi. Siano u1 = u, u2, . . . , um le
diverse immagini di u per gli automorfismi di G e formiamo il polinomio
(x− u1)(x− u2) · · · (x− um). (11.22)21Si veda anche [Tignol, 2001, pp. 236-237].
209
Essendo G un gruppo, per ogni elemento σi ∈ G si ha che gli elemen-
ti σi(u1), σi(u2), . . . , σi(um) formano semplicemente una permutazione di
u1, u2, . . . , um, e dunque il polinomio (11.22) e invariante per l’azione di
σi. Per il Teorema Fondamentale esso e quindi a coefficienti in K.22
Esempio 11.3 Rivediamo il caso di φ(x) = x4 − 10x2 + 1. Se α e una
radice, anche −α e una radice, e altrettanto vale per 1α. Indicate allora le
4 radici con x1, x2, x3, x4 si ha
x1 = α, x2 = −α, x3 =1
α, x4 = −
1
α.
in questo caso particolarissimo possiamo quindi scegliere V = α e si ha
f1 = id, f2(x) = −x, f3(x) =1x, f4(x) = − 1
x.
Il gruppo e quindi presentato da
V V −V1
V−1
V
−V −V V −1
V
1
V
1
V 1
V−1
VV −V
−1
V −
1
V
1
V−V V
(11.23)
11.8 Gli esempi di Galois
Galois da due esempi. Il primo e quello del gruppo dell’equazione genera-
le di grado n che egli afferma essere l’intero gruppo Sn “puisque dans ce
cas, les fonctions symetriques sont seules determinable rationnellement”.23
Per Galois la cosa risulta evidente. In realta la dimostrazione non e im-
mediata (per noi). La vedremo dopo il secondo esempio, quello del gruppo
dell’equazionexp − 1
x− 1= 0, con p primo. (11.24)
22Si veda [Artin, 1988, pp. 35-36]. Si noti pero che Artin utilizza una elegante
definizione di estensione normale che gli permette di prescindere dall’uso del Teorema
Fondamentale. Si veda anche [Tignol, 2001, pp. 247-249].23Cf. [Galois, 1976, p. 51].
210
che Galois afferma essere il gruppo ciclico di ordine p− 1. Questo risultato
e facilmente deducibile da un risultato piu generale ben illustrato da Galois
nei materiali preparatori per la sua grande memoria.24 Ma la dimostrazione
del caso in questione non e poi riportata: evidentemente anche questa gli
sembrava ovvia ed ha giudicato inutile illustrarla.
Nei materiali preparatori troviamo questo risultato, che sembra mostrare
come Galois avesse gia un concetto di risolvente piu generale, simile a quello
visto nella Sezione 11.7.
Consideriamo un’equazione irriducibile p(x) = 0 tale che tutte le sue
radici si deducano razionalmente da una di esse. Indicando le radici con
x1, x2, x2, . . . , xm abbiamo quindi
x1, x2 = f2(x1), x3 = f3(x1), xm = fm(x1).25 (11.25)
Galois afferma che la seguente tabella di permutazioni costituisce il gruppo
dell’equazionex1 f2(x1) f3(x1) . . . fm(x1)
x2 f2(x2) f3(x2) . . . fm(x2)
x3 f2(x3) f3(x3) . . . fm(x3)
. . . . . . . . . . . . . . .
xm f2(xm) f3(xm) . . . fm(xm)
(11.26)
Galois non dimostra preliminarmente che la tabella (11.26) costituisca ef-
fettivamente un gruppo. Ma la dimostrazione in questo caso e assai fa-
cile. Le righe della tabella sono formate da radici, poiche evidentemente
p(fi(x1)) = 0 e quindi anche p(fi(xk)) = 0. Si tratta inoltre di permutazio-
ni, perche dall’ipotesi che possa essere fi(xk) = fj(xk) con i = j si deduce
(ancora una volta. . . ) che fi(x) − fj(x) ha la radice xk e dunque anche la
radice x1 il che implica fi(x1) = fj(x1), ossia la contraddizione i = j. E poi
facile adattare la dimostrazione di Serret che abbiamo visto: xi = fi(x1) e
dunque possiamo porre θ = fi. La composizione delle sostituzioni x1 → xi
e x1 → xj e dunque semplicemente x1 → fi(xj).
Ora ecco come Galois dimostra che questo gruppo e quello richiesto.
Una funzione delle radici ϕ(x1, x2, . . . , xm) a causa delle (11.25) puo essere
24Ibidem, pp. 89-91.25Ovviamente f1 = id.
211
scritta come una funzione di x1, ossia φ(x1). Se essa e invariante per le
sostituzioni (11.26) avremo
φ(x1) = φ(x2) = · · · = φ(xm)
e quindi
φ(x1) =1
m(φ(x1) +φ(x2) + · · ·+φ(xm))
ed e dunque funzione simmetrica delle radici di p(x), ossia una quantita
nota. Reciprocamente, se φ(x1) e una quantita nota, ossia φ(x1) = k,
l’equazione φ(x) − k = 0 dovra avere anche le radici x2, . . . , xm, il che
significa φ(x1) = φ(x2) = · · · = φ(xm).26
Osservazione 11.5 Si noti che data l’equazione p(x) = 0, l’equazione
F(V) che ne calcola il gruppo di Galois possiede la proprieta utilizzata per
questo calcolo del gruppo. Ossia il gruppo di F(V) si calcola nel modo indi-
cato. Ad esempio, l’equazione t6+6 pt4+9 p2t2+4 p3+27 q2 = 0 ha gruppo
di Galois di ordine 6 e dato dalle permutazioni viste, per ogni scelta di p e
q che lascino il polinomio irriducibile, poiche il polinomio a primo membro
e quello che calcola il gruppo di Galois dell’equazione x3+px+q = 0, come
abbiamo visto nella Sezione 11.6.
Siamo ora in grado di vedere il secondo esempio di Galois. Consideriamo,
per p primo l’equazione (che Gauss ha dinostrato essere irriducibile)
xp−1 + xp−2 + · · ·+ x+ 1 = 0. (11.27)
Sia x1 una sua radice e sia g una radice primitiva di Z∗p = {1, 2, . . . , p−1}.27
Le radici dell’equazione (11.27) possono essere scritte come
x1, x2 = xg mod p1 , x3 = x
g2 mod p1 , . . . , xp−1 = x
gp−2 mod p1 (11.28)
26Si noti la somiglianza di questa argomentazione con quella usata per il teorema
fondamentale. E probabilmente per questo che Galois ha deciso di non presentare questo
esempio e di lasciarne invece implicita l’applicazione al caso di xp−1x−1
. Una scelta naturale
per lui; ma solo per lui. . .27Ossia un intero g che sia il generatore del gruppo ciclico Z∗
p. Gauss ha dimostrato
l’esistenza di una tale radice primitiva. Ad esempio, per p = 7, una radice primitiva e 3.
212
sicche fi(x) = xgi−1 mod p. Ovviamente dal Piccolo Teorema di Fermat si ha
gp−1 ≡ g mod p.
Considerando la tabella corrispondente alla (11.26) si vede immedita-
mente che si ottiene il gruppo ciclico generato da (x1 x2 . . . xp−1).
Vediamo ora il primo esempio. Tignol28 ne propone una dimostrazione
che, a mio giudizio, si avvicina alle intenzioni di Galois. Tuttavia, come
vedremo, si incontra una difficolta. Tignol da una elegante dimostrazione
di questo lemma:
Lemma 11.2 Sia G un sottogruppo di Sn. E allora possibile determinare
una funzione di n indeterminate f(x1, x2, . . . , xn) tale che l’insieme I(f)
delle sostituzioni che lasciano invariata f sia esattamente il sottogruppo G.
Tignol considera il monomio m = x1x22x33 · · · xnn e costruisce f come
f =∑σ∈G
σ(m).
Poiche G e un gruppo, si ha, per ogni τ ∈ G, Gτ = G, e quindi (utilizzandola notazione funzionale) ∑
σ∈G
τ(σ(m)) =∑σ∈G
σ(m)
il che mostra che τ(f) = f per ogni τ ∈ G e quindi G ⊆ I(f). D’altra parte,
se ρ ∈ G, il monomio ρ(m) compare in ρ(f) ma non in f, e quindi ρ(f) = f,il che mostra che G = I(f). 2
Ora Tignol propone l’argomentazione seguente: l’equazione generale di
grado n e data da
p(x) = xn − σ1xn−1 + σ2x
n−2 − · · ·+ (−1)nσn = 0 (11.29)
ove p(x) e un polinomio a coefficienti nel campo F = k(σ1, σ2, . . . , σn) con
k estensione finita di Q e σ1, σ2,. . . , σn delle indeterminate. Tignol pone
anche
p(x) = (x− x1)(x− x2) · · · (x− xn). (11.30)
28Si veda [Tignol, 2001, p. 241]
213
(e possiamo immaginare che questo risutato sia ottenuto con il procedimento
di Kronecker). Si tratta di dimostrare che il gruppo di Galois dell’equazione
(11.29) su F e il gruppo di tutte le permutazioni di x1, x2, . . . , xn, e puo quindi
identificarsi con Sn. Se il gruppo di Galois dell’equazione (11.29) non e il
gruppo Sn, ma solo un sottogruppo G di questo gruppo, per il Lemma 11.2,
possiamo trovare una funzione razionale f(x1, x2, . . . , xn) non simmetrica,
ossia, afferma Tignol, non in F, ma tale che
f(σ(x1), σ(x2), . . . , σ(xn)) = f(x1, x2, . . . , xn) (11.31)
per ogni σ ∈ G. Ma questo contraddice il Teorema Fondamentale: f non
simmetrica non puo appartenere a F.
Si noti pero che in questa argomentazione le quantita x1, x2, . . . , xnnon sono indeterminate: sono le radici di (11.29).29 Inoltre i due cam-
pi k(σ1, σ2, . . . , σn) e k(x1, x2, . . . , xn) sono identificati. E possibile questa
identificazione? Il lemma puo essere utilizzato in questo caso?30 Nella
prossima Sezione vedremo la dimostrazione di Artin.
11.9 La dimostrazione di Artin relativa al
primo esempio di Galois
La migliore e piu completa dimostrazione di Artin si trova in [Artin, 1988,
pp. 77-78], ma utilizzo la piu nota versione inglese, [Artin, 1944, pp.
74-76]. Artin utilizza questo teorema (del quale vedremo in seguito la
dimostrazione):
Teorema 11.3 Sia σ un isomorfismo di un campo F su un campo F ′. Sia
f(x) ∈ F[x] e sia f ′(x) il polinomio i cui coefficienti corrispondono a quelli di
f(x) mediante σ. Siano poi E ed E ′ i campi di spezzamento di f(x) e f ′(x).
In queste condizioni l’isomorfismo σ puo essere esteso ad un isomorfismo
tra E ed E ′.29Si consideri questo semplice esempio: data la funzione f=x
21 − x
22 nelle due indeter-
minate x1, x2, essa e invariante solo per la permutazione identica. Ma se x1 e x2 sono le
radici di un’equazione della forma x2 − a = 0, si ha evidentemente I(f) = S2.30Si noti la cura con la quale Dedekind distingue tra radici ed indeterminate in
[Scharlau, 1981]. Tuttavia questa distinzione e gia presente nella memoria di Galois.
214
Inoltre, un risultato che segue immediatamente dal teorema fondamen-
tale sui polinomi simmetrici e il seguente: sia F(x1, x2, . . . , xn) il campo che
si ottiene aggiungendo ad F le n variabili x1, x2, . . . , xn e siano ai le funzioni
simmetriche elementari nelle xi, ossia
a1 = x1+x2+ · · ·+xn, a2 = x1x2+x1x3+ · · ·+xn−1xn, . . . , an = x1x2 · · · xn.
Il gruppo di Galois di F(x1, x2, . . . , xn) su F(a1, a2, . . . , an) e isomorfo a Sn.
Sia ora F un campo e, assegnate le variabili u1, u2, . . . , un, consideriamo
il campo F(u1, u2, . . . , un). Per equazione generale di grado n, si intende
l’equazione
f(x) = xn − u1xn−1 + u2x
n−2 − · · ·+ (−1)nun = 0. (11.32)
Sia E il campo di decomposizione di f(x) su F(u1, u2, . . . , un). In questo
campo f(x) abbia le radici v1, v2, . . . , vn, di modo che sara
u1 = v1+ v2+ · · ·+ vn, u2 = v1v2+ v1v3+ · · ·+ vn−1vn, . . . , un = v1v2 · · · vn.
Sia F(x1, x2, . . . , xn) il campo generato su F con le variabili x1, x2, . . . , xn.
Come in precedenza le ai siano le funzioni simmetriche elementari delle
variabili x1, x2, . . . , xn. Abbiamo quindi
f ′(x) = (x−x1)(x−x2) · · · (x−xn) = xn−a1xn−1+ · · ·+(−1)nan. (11.33)
Sia ora g(u1, u2, . . . , un) un polinomio che si annulla ponendo a1, a2, . . . , anal posto di u1, u2, . . . , un.
31 Se g(a1, a2, . . . , an) si annulla, allora anche
g(∑
xi,∑
xixk, . . .)= 0
e quindi tutti i termini si annullano (le xi sono variabili). Se sostituiamo le
quantita vi al posto delle xi avremo allora
g(∑
vi,∑
vivk, . . .)= 0,
ossia g(u1, u2, . . . , un) e il polinomio nullo. Quindi g(a1, a2, . . . , an) si
annulla solo se g e il polinomio nullo.
31Qui tengo conto anche di [Artin, 1988, p. 78], ove l’argomentazione e piu precisa.
215
Consideriamo ora la corrispondenza tra F(u1, u2, . . . , un) e il sottocampo
F(a1, a2, . . . , an) di F(x1, x2, . . . , xn). Si consideri un elelmento f(u1,u2,...,un)g(u1,u2,...,un)
del primo campo e gli si associ l’elemento f(a1,a2,...,an)g(a1,a2,...,an)
del secondo. Chiara-
mente e una applicazione suriettiva. Inoltre, se
f(a1, a2, . . . , an)
g(a1, a2, . . . , an)=f1(a1, a2, . . . , an)
g1(a1, a2, . . . , an)
allora fg1 − gf1 = 0. Ma per quanto abbiamo visto questo implica
f(u1, u2, . . . , un)g1(u1, u2, . . . , un)−f1(u1, u2, . . . , un)g(u1, u2, . . . , un) = 0
e quindif(u1, u2, . . . , un)
g(u1, u2, . . . , un)=f1(u1, u2, . . . , un)
g1(u1, u2, . . . , un)
e quindi la applicazione e un isomorfismo. Con questa corrispondenza,
f(x) corrisponde a f ′(x) ed E e F(x1, x2, . . . , xn) sono i rispettivi campi
di decomposizione. Quindi, per il teorema citato, l’isomorfismo puo es-
sere esteso ad un isomorfismo tra E e F(x1, x2, . . . , xn), e quindi il grup-
po di E su F(u1, u2, . . . , un) e isomorfo al gruppo di F(x1, x2, . . . , xn) su
F(a1, a2, . . . , an). Ma l’ultimo gruppo e isomorfo a Sn e quindi la proprieta
indicata da Galois e dimostrata.
Si noti come in questa dimostrazione il substrato concettuale e dato
dal fatto che le radici dell’equazione generale possono considerarsi come
indeterminate; ma la struttura dimostrativa e piuttosto articolata. Inoltre
e abbastanza intuitivo immaginare che l’equazione generale sia irriducibile,
ma nel Teorema 11.3 non si utilizzano polinomi irriducibili e quindi nella
dimostrazione vista non si usa neppure l’ipotesi che l’equazione generale sia
irriducibile. E invece utilizzato il fatto che per ogni polinomio e possibile
determinare il suo campo di spezzamento.
11.10 La Proposizione II della Memoria di
Galois
Una volta definito il gruppo di Galois di un’equazione, cio che segue in modo
naturale e l’indagine sulle modalita con le quali il gruppo viene modificato
216
aggiungendo delle quantita al campo base. Ecco come Galois formula la
questione.32
Teorema 11.4 (Proposizione II) Se si aggiunge ad un’equazione data la
radice r di un’equazione ausiliaria irriducibile, 1 puo succedere una di que-
ste due cose: o il gruppo dell’equazione non viene modificato, oppure si
suddivide in p gruppi ciascuno dei quali diviene il gruppo dell’equazione
proposta quando si aggiunge una radice dell’equazione ausiliaria; 2 questi
gruppi godranno della proprieta notevole che si passera dall’uno all’altro
operando in tutte le permutazioni del primo una stessa sostituzione delle
lettere.
Prima di vedere l’accenno di dimostrazione suggerito da Galois e ripreso da
Serret e opportuno vedere un esempio.
Consideriamo di nuovo il polinomio x4 − 10x2 + 1 dell’Esempio 11.3.
Poiche la radice V =√2 +
√3 e gia un elemento primitivo, il gruppo,
come si e visto, e dato dalle sostituzioni corrispondenti alle quattro radi-
ci V,−V, 1V,− 1
V. Consideriamo l’equazione ausiliaria x4 − 14x2 + 9 = 0 e
supponiamo di aggiungere a Q una sua radice r.33 Si ottiene allora:
x4 − 10x2 + 1 =
=
[x2 +
(11
3r−
1
3r3)x− 1
] [x2 −
(11
3r+
1
3r3)x− 1
].
(11.34)
Il gruppo di Galois corrisponde ora ad uno dei due fattori, e precisamente al
primo. Questo fattore ha le radici V e − 1V, come si verifica immediatamente,
e quindi il gruppo di Galois si riduce all’identita ed alla sostituzione σ data
da
σ =
V −V1
V−1
V
−1
V
1
V−V V
. (11.35)
Osservazione 11.6 Si noti che la verifica del fatto che V e − 1Vsiano radi-
ci del primo fattore del prodotto dato dalla (11.34) si ottiene con strumenti
32Cf. [Galois, 1976, p. 55].33Le radici di questa equazione sono ±
√2±
√5.
217
puramente algebrici, senza utilizzare la conoscenza delle radici in R dei due
polinomi, ossia ±√2±
√3 e ±
√2±
√5 per la quale conoscenza risulta evi-
dente l’estensione Q ↪→ Q(√2) e quindi il fatto che
√2 divenga un elemento
noto. Se infatti vogliamo eliminare r fra
V2 +
(11
3r−
1
3r3)V − 1 (11.36)
r4 − 14r2 + 9 (11.37)
dobbiamo utilizzare la matrice di Sylvester:
− 13V 0 11
3V V2 − 1 0 0 0
0 − 13V 0 11
3V V2 − 1 0 0
0 0 −13V 0 11
3V V2 − 1 0
0 0 0 −13V 0 11
3V V2 − 1
1 0 −14 0 9 0 0
0 1 0 −14 0 9 0
0 0 1 0 −14 0 9
.
Il determinante di questa matrice vale(V4 − 10V2 + 1
)2, ed e dunque nul-
lo. Poiche il risultato dell’eliminazione produce una quantita identicamente
nulla si ha che V e una radice di (11.36). Inoltre il prodotto delle radici e
−1, e quindi l’altra radice e − 1V.
Serret riprende la dimostrazione di Galois
In realta Serret fa qualcosa in piu di quanto propone Galois,34 suddividendo
anche le radici dell’equazione ausiliaria per precisarne l’effetto. Ma io mi
limito a proporre la prima parte della sua dimostrazione, omettendo la
verifica (per altro ovvia) con la quale si passa da un gruppo all’altro.
Sia V una risolvente di Galois e sia F(V) il polinomio minimo, le cui
radici V0, V1, . . . , Vν−1 individuano le sostituzioni del gruppo di Galois. Sia
34La dimostrazione di Serret occupa le pagine 643-651 di [Serret, 1879].
218
ψ(z) l’equazione ausiliaria irriducibile, che supponiamo di grado m, e sia
r una sua radice. Se l’aggiunta di r lascia il polinomio F(V) irriducibile il
gruppo di Galois rimane inalterato.
Supponiamo invece che l’aggiunta di r renda il polinomio F(V) riducibile,
e che sia λ(V, r) un fattore irriducibile di F(V) di grado µ.
Sostituiamo al posto di r una indeterminata z in λ(V, r) ed effettuiamo
la divisione di F(V) per λ(V, z). Avremo
F(V) = λ(V, z)Λ(V, z) +Θ(V, z). (11.38)
Dobbiamo avere identicamente
Θ(V, r) = 0, (11.39)
perche Θ e al piu di grado µ − 1, F(V) e irriducibile ed ha in comune con
l’equazione (11.39) le µ radici dell’equazione λ(V, r) = 0.
Ne segue che nel polinomio Θ(V, z) i coefficienti delle diverse potenze
di V debbono annullarsi per z = r e di conseguenza si annullano anche se
al posto di z si sostituisce una qualsiasi radice di ψ(z) = 0. Se dunque la
radici di ψ(z) sono
r, r1, . . . , rm−1
il polinomio F(V) sara divisibile per ogni funzione
λ(V, r), λ(V, r1), . . . , λ(V, rm−1).
Il prodotto di queste funzioni e una funzione intera di V avente i coefficienti
funzioni simmetriche delle radici di ψ(z), ed e dunque un polinomio Π(V)
avente i coefficienti nel campo base. Poiche tutte le radici di Π(V) sono
comprese tra le radici di F(V) = 0 e abbiamo supposto F(V) irriducibile,
avremo
Π(V) = [F(V)]q Π1(V), (11.40)
ove q e il piu grande esponente possibile. Evidentemente Π1(V) non puo che
essere una costante (che possiamo supporre l’unita, perche abbiamo sempre
operato con polinomi monici), perche altrimenti, dovendo essere tutte le
radici di Π1(V) radici di F(V), quest’ultimo polinomio dovrebbe dividere
Π1(V), il che contraddice quanto supposto per q.
219
Abbiamo allora
Π(V) = [F(V)]q, (11.41)
ossia
[F(V)]q == λ(V, r)λ(V, r1) · · · λ(V, rm−1). (11.42)
Per ipotesi λ(V, r) e irriducibile. E facile verificare che anche i polinomi
λ(V, ri) hanno la stessa proprieta.35
Si noti che fino a questo punto non abbiamo utilizzato la proprieta di
F(V) = 0 di essere un’equazione normale, ossia tale che le sue radici sono
esprimibili razionalmente mediante una qualunque di esse (o se si preferi-
sce che V e un elemento primitivo). Utilizziamo ora questa proprieta per
dimostrare che se due equazioni
λ(V, ri) = 0, λ(V, rj) = 0 (11.43)
hanno una radice in comune, esse hanno tutte le radici in comune. Siano
infatti Va e θ(Va) due radici della prima equazione di (11.43). Se Vb e una
radice della seconda equazione di (11.43), anche θ(Vb) sara una radice della
stessa equazione.
In effetti, si ha
λ(Va, ri) = 0, λ(θ(Va), ri) = 0, (11.44)
e quindi l’equazione λ(θ(V), ri) = 0 ammette la radice Va dell’equazione
λ(V, ri) = 0. Se supponiamo che θ(V) sia un polinomio (il che e lecito),
si puo dire che il polinomio λ(θ(V), ri) e divisibile per λ(V, ri), ossia che
il resto della divisione del polinomio λ(θ(V), z) per λ(V, z) e identicamente
nullo per z = ri. Utilizzando lo stesso ragionamento visto in precedenza si
conclude che questo resto si annulla anche per z = rj, ossia che λ(θ(V), rj)
e divisibile per λ(V, rj) e allora l’uguaglianza
λ(Vb, rj) = 0
implica
λ(θ(Vb), rj) = 0
35Lo si dimostri per esercizio. Oppure si veda [Serret, 1879, pp. 646-647].
220
e quindi Vb e radice della seconda delle equazioni (11.43). Se dunque le due
equazioni di (11.43) hanno una radice in comune, hanno in comune tutte le
radici.
Ne consegue che i fattori diversi di (11.42) sono ripetuti q volte. Avremo
cioe
λ(V, r) = λ(V, r(1)) = λ(V, r(2)) = · · · = λ(V, r(q−1)),λ(V, r1) = λ(V, r
(1)1 ) = λ(V, r
(2)1 ) = · · · = λ(V, r(p−1)1 ),
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
λ(V, rm−1) = λ(V, r(1)m−1) = λ(V, r
(2)m−1) = · · · = λ(V, r(p−1)m−1 ).
(11.45)
Di conseguenza
F(V) = λ(V, r)λ(V, r1) · · · λ(V, rp−1) (11.46)
Quindi le m radici di ψ(z) = 0 si ripartiscono in p gruppi di q radici
(con pq = m) ed ogni radice dello stesso gruppo da luogo ad un fattore
corrispondente alla nuova presentazione del gruppo di Galois. Tralascio
la parte finale dell’analisi di Serret che mostra come le varie presentazioni
sono collegate. In effetti Serret dimostra anche che i diversi gruppi che si
ottengono a seconda dei vari fattori sono coniugati.
Osservazione 11.7 Si noti che dalla dimostrazione di Serret segue anche
che l’indice del sottogruppo che si ottiene aggiungendo la radice r di ψ(z)
nel gruppo di Galois (ossia il numero dei laterali) divide il grado m di ψ(z).
In particolare, se m e primo l’indice del sottogruppo e esattamente m.
Esempio 11.4 Si consideri il polinomio
F(V) = V6 − 6V4 + 12V2− 10
e l’equazione ausiliaria z3 − 2 = 0. Abbiamo la decomposizione
F(V) = [V2 − (r+ 2)][V4 + (r− 4)V2 + r2 − 2r+ 4].
I fattori sono di grado diverso, poiche F(V) = 0 non e un’equazione normale.
Indicando con w una radice primitiva dell’unita, si ha
[V2 − (r+ 2)][V2 − (wr+ 2)][V2 − (w2r+ 2)] = F(V)
221
Operando con il secondo fattore si ha
[V4 + (r− 4)V2 + r2 − 2r+ 4]×[V4 + (wr− 4)V2 + (wr)2 − 2wr+ 4]×[V4 + (w2r− 4)V2 + (w2r)2 − 2w2r+ 4] = [F(V)]2.
(11.47)
11.11 La Proposizione III della Memoria di
Galois
Galois esamina successivamente il caso in cui si aggiungano al campo base
tutte le radici di un’equazione ausiliaria irriducibile. E afferma che in questo
caso il gruppo si riduce ad un sottogruppo normale del gruppo originario.
Originariamente aveva considerato solo il caso di un’equazione della forma
zp−a = 0 (con p primo e supponendo la presenza delle radice dell’unita sino
all’ordine p). Ma ripropone poi, probabilmente nella notte prima del duello,
un enunciato piu generale. Afferma poi “Si trovera la dimostrazione”.36
Serret propone il percorso dimostrativo seguente.
Teorema 11.5 Sia G il gruppo dell’equazione φ(x) = 0. Supponiamo di
aggiungere al campo base la radice di un’equazione irriducibile ψ(z) = 0 e
supponiamo che le radici di questa equazione ausiliaria si esprimano razio-
nalmente in funzione di una tra esse. Allora, se il gruppo G non rimane
invariato, il nuovo sottogruppo H ottenuto aggiungendo questa radice sara
un sottogruppo normale di G.
Consideriamo due radici r e ri = θ(r) di ψ(z) = 0. Si ha allora ψ(θ(r)) = 0
e, con il ragionamento consueto, si ha che r, θ(r), θ2(r), . . . , θk−1(r) sono
ancora radici e sara quindi ad un certo punto θk(r) = r. Questo significa
θk−1)(θ(r)) = r, ossia
θk−1(ri) = r.
Ne consegue che le radici r e ri sono esprimibili razionalmente l’una in
funzione dell’altra, e quindi il gruppo che H si ottiene aggiungendo r e lo
stesso di quello che si ottiene aggiungendo ri.
36Cf. [Galois, 1976, p. p. 57].
222
Poiche, come abbiamo visto questi gruppi sono coniugati, si ha che H
e un sottogruppo normale. 2 Questo teorema si applica ad un caso
importante:
Corollario 11.1 Se l’equazione ausiliaria e della forma zp = a, con p
primo e nell’ipotesi che il campo base contenga le radici p-esime dell’unita
ci si trova nelle condizioni del teorema precedente. O il gruppo rimane
inalterato o si riduce ad un sottogruppo normale di indice p.
Teorema 11.6 Sia G il gruppo di Galois dell’equazione φ(x) = 0 e suppo-
niamo che, aggiungendo tutte le radici di un’equazione irriducibile ψ(z) = 0
il gruppo G divenga un sottogruppo H di G. In tal caso H e un sottogruppo
normale di G.
Costruiamo una risolventeW per le radici r, r1, . . . , rm−1 di ψ(z) e sia π(Z)
il polinomio minimo di W. Come abbiamo visto, tutte le radici di π(Z) si
possono esprimere l’una in funzione dell’altra, e quindi basta applicare il
Teorema 11.5.
11.12 La risolubilita per radicali
La Proposizione IV ha l’enunciato seguente:
Teorema 11.7 Se si aggiunge ad una equazione il valore numerico di una
funzione delle sue radici, il gruppo dell’equazione si abbassera in modo da
non avere piu altre permutazioni se non quelle per le quali questa funzione
e invariabile.
La dimostrazione di Galois e semplice ed elegante, ed usa saggiamente il
teorema fondamentale.
In effetti, in seguito alla Proposizione I [ossia il Teorema Fon-
damentale: 11.2] ogni funzione nota deve essere invariabile per
le permutazioni del gruppo dell’equazione.37
37Ibid. p. 57.
223
Serret non pare soddisfatto di quanto afferma Galois, e fornisce una dimo-
strazione piuttosto elaborata.38 E un buon indice del fatto che le idee di
Galois stentavano ad essere accolte nella lora forma talvolta lapidaria.
Galois e ora in grado di indicare le condizioni per la risolubilita per radi-
cali. Si tratta naturalmente di ridurre progressivamente il gruppo dell’equa-
zione sin tanto che esso non si riduca all’identita e di operare queste riduzioni
con l’aggiunta di radicali che possiamo supporre di indice primo. Sia dun-
que p il numero minimo che corrisponde ad una radicale di indice p tale che
aggiungendo il suo valore (e supponendo che le radici dell’unita di ordine
p siano state aggiunte) riduca il gruppo G ad un sottogruppo H. Come
abbiamo visto H e allora un sottogruppo normale di indice p.
Supponiamo reciprocamente che H sia un sottogruppo normale di G di
indice primo p. Potremo allora, estraendo una semplice radice di ordine p
e aggiungendo questa radice, ridurre il gruppo ad H.
Per procedere introduco ora una argomentazione volta a determinare
una funzione delle radici che sia invariante esattamente sulle sostituzioni di
un sottogruppo H. A questo scopo modifico un po’ la dimostrazione data da
Cauchy nel 1845 per il caso di variabili invece che di radici di un’equazione.39
Galois probabilmente immagina che il suo lettore abbia gia familiarita con
questo risultato o meglio che sia auto-evidente.
Sia al solito
V = a1x1 + a2x2 + · · ·+ anxn,
una risolvente di Galois che assume n! valori. Indichiamo con V1, Vσ, Vτ, . . .
i valori che V assume per le sostituzioni di H. Consideriamo ora la quantita
θ = (t− V1)(t− Vσ)(t− Vτ) · · · (11.48)
dove t e da determinarsi. Applicando le sostituzioni di H si scambiano
semplicemente i fattori della (11.48), di modo che θ rimane inalterata.
Una sostituzione π ∈ H modifica θ in
θ ′ = (t− Vπ)(t− Vσπ)(t− Vτπ) · · ·38Cf. [Serret, 1879, pp. 654-657].39Cf. [Cauchy, 1845].
224
I valori Vπ, Vσπ, Vτπ, . . . sono diversi dai valori V1, Vσ, Vτ, . . . e di conseguen-
za ci sono infiniti valori di t per i quali θ ′ = θ. La stessa argomentazione
puo essere usata per una sostituzione ρ ∈ H. Posto
θ ′′ = (t− Vρ)(t− Vσρ)(t− Vτρ) · · ·
per una scelta opportuna di t, θ ′′ = θ e θ ′′ = θ ′ . Procedendo nello stesso
modo possiamo trovare un valore t tale che θ sia invariante solo per le
sostituzioni di H.
L’argomentazione di Galois procede ora nel modo seguente: sia θ una
funzione delle radici invariante per tutte e sole le permutazioni di H. Ope-
riamo ora su θ con le permutazioni di G per ottenere θ1, θ2, . . . , θp = θ (p
e il numero dei laterali di H). Ora, se 1, α, . . . , αp−1 sono le radici p-esime
dell’unita, la funzione
(θ+ αθ1 + α2θ2 + · · ·+ αp−1θp−1)p
e invariante per tutte le permutazioni del gruppo totale e dunque appartiene
al campo base. Se si estrae la radice p-esima di questa funzione si ha una
funzione delle radici invariante esattamente su H e quindi aggiungendola al
campo base il gruppo si riduce ad H.
E chiaro ora come si puo procedere se l’equazione e risolubile per radicali.
Basta iterare il procedimento di Galois fin tanto che non si giunga ad un
gruppo ridotto all’unita.
Il risultato di Galois abitualmente si formula quindi oggi in questo modo.
Teorema 11.8 Sia φ(x) = 0 un’equazione a coefficienti in un campo K e
sia G il suo gruppo di Galois. L’equazione e risolubile per radicali se e solo
se G contiene una sequenza di sottogruppi
G = G0 ⊃ G1 ⊃ G2 ⊃ · · · ⊃ Gt = id
tale che per i = 1, 2, . . . , t, Gi sia un sottogruppo normale di indice primo
in Gi−1. (E anche possibile che sia t = 0, ossia G = id.)
Prima di vedere l’esempio di Galois, e opportuno vedere un altro esempio
piu ‘concreto’ di carattere numerico.
225
Esempio 11.5 Consideriamo l’equazione x4 − 2 = 0, la quale ha le radici
x1 =4√2, x2 = i
4√2, x3 = − 4
√2, x4 = −i 4
√2. Il gruppo G di Galois si calcola
facilmente (in termini di automorfismi) ed e dato dalla seguente tabella:
x1 x2 x3 x4
x1 x4 x3 x2
x2 x1 x4 x3
x2 x3 x4 x1
x3 x2 x1 x4
x3 x4 x1 x2
x4 x1 x2 x3
x4 x3 x2 x1
(11.49)
Come si vede facilmente, se immaginiamo che i vertici consecutivi di un
quadrato siano etichettati con x1, x2, x3, x4, si tratta dei movimenti rigido
nello spazio che mutano un quadrato in se. Si tratta cioe del gruppo generato
da (x1 x2 x3 x4) e (x1 x3). Un suo sottogruppo H e dato da
x1 x2 x3 x4
x3 x2 x1 x4
x1 x4 x3 x2
x3 x2 x1 x4
(11.50)
Costruiamo ora una funzione delle radici invariante rispetto alle sostituzioni
di H. Occorre una risolvente, che in questo caso puo essere data da
V := (x1, x2, x3, x4)→ x1 − 2x2 + 4x3, (11.51)
la quale produce il polinomio F(V) = V8 + 476V4 + 114244 che individua il
gruppo di Galois. Dobbiamo ora considerare il polinomio
(V − x1 + 2 x2 − 4 x3) (V − x1 + 2 x4 − 4 x3) ·(V − x3 + 2 x2 − 4 x1) (V − x3 + 2 x4 − 4 x1)
(11.52)
Tenendo conto del fatto che le xi sono radici di x4−2 = 0 si vede facirlemnet
che questo polinomio diviene
V4 − 10√2V2 + 338 (11.53)
226
il che rende evidente che la possiamo scegliere la funzione sulle radici che
corrisponde al coeffieiente di V2. In effetti questo coefficiente e dato da
−18x21− 8x22 e dunque la funzione θ e data da θ : (x1, x2, x3, x4)→ −18x21−
8x22. Una radice primitiva dell’unita di ordine 2 e −1 e quindi l’elemento
cercato per ridurre il gruppo G e, come si verifica immediatamente 20√2. Si
tratta dunque di aggiungere semplicemente√2 per avere la decomposizione
V8+476V4+114244 = (V4−10√2V2+338)(V4+10
√2V2+338) (11.54)
il cui primo fattore da il nuovo gruppo di Galois, ossia H.
11.13 L’esempio dell’equazione di quarto
grado
Galois illustra il suo metodo con un esempio: quello dell’equazione di quar-
to grado. E da notare il fatto che Galois non si da neppure la pena di
scrivere l’equazione. Comincia con l’osservare che, aggiungendo al campo
base la radice quadrata del valore del discriminante dell’equazione, dato da
(indicando le radici con a, b, c, d)
(a− b)2(a− c)2(a− d)(b− c)2(b− d)2(c− d)2
il gruppo si riduce alle sostituzioni pari, ossia
abcd
badc
cdab
dcba
acdb
cabd
dbca
bdca
adbc
dacb
bcad
cbda
(11.55)
Questo gruppo contiene il sottogruppo (normale) dato da
abcd
badc
cdab
dcba
(11.56)
227
che ha indice tre nel gruppo (11.55) (il gruppo (11.55) si ripartisce in tre
gruppi nel linguaggio di Galois). Risolvendo un’equazione di terzo grado ci
si riduce al gruppo (11.56). Ma questo a sua volta contiene il sottogruppo
abcd
badc(11.57)
e quindi con la risoluzione di un’equazione di secondo grado il gruppo si
riduce a (11.57) e quindi basta un’ulteriore radicale quadratico per portare
a termine la soluzione.
Si noti la totale assenza di calcoli. Galois indica pero come il metodo di
Descartes e di Eulero seguano esattamente questo schema.
Un esempio numerico
Si consideri quanto esposto da Galois con l’analisi di Lagrange vista nella
sezione 4.4. Sivedra che le quantita necessarie per la soluzione sono proprio
quelle indicate da Galois. Sia, per esempio,
x4 − x+ 3 = 0. (11.58)
Il gruppo, che e originariamente S4 si riduce al gruppo alterno aggiungendo
la radice quadrata del discriminante:√6885. Indicate con a, b, c, d le radici
dell’equazione, il polinomio che ha le tre radici ab+ cd, ac+bd, ad+bc e
x3 − 12x− 1. (11.59)
Si vede facilmente che, disponendo dell’unita immaginaria, e di√6885,
occorre un solo radicale cubico per avere le soluzioni di x3− 12x− 1 = 0. E
ora semplice proseguire i calcoli secondo le indicazioni date da Lagrange.
11.14 Il Teorema di Abel
In questa sezione, utilizzando in parte strumenti piu moderni di quelli uti-
lizzati da Galois, viene dimostrato il teorema di Abel. Nel Teorema 11.8 che
caratterizza la risolubilita per radicali, viene evidenziata una proprieta del
228
gruppo G che in genere diviene oggetto (anche in altre forme, equivalenti o
piu generali) della definizione di gruppo risolubile.
Si noti che, essendo Gi un sottogruppo normale di indice primo di Gi−1,
il gruppo quoziente e un gruppo ciclico (perche di ordine primo) e quindi,
in particolare, abeliano. Nell’approccio originale di Galois G e un gruppo di
permutazioni ed i Gi sono sottogruppi, a loro volta gruppi di permutazioni.
Lemma 11.3 Sia G un gruppo di permutazioni formato su almeno 5 ele-
menti diversi (ad esempio permutazioni di 1, 2, 3, 4, 5). Supponiamo che G
contenga ogni tre-ciclo e sia N un sottogruppo normale di G con gruppo
quoziente abeliano. Allora anche N contiene ogni tre-ciclo.40
Dimostrazione. Sia f l’omomorfismo canonico f : G → G/N e sia (ab c)
un tre-ciclo aribitrario e siano d ed e due altri elementi arbitrari. Sia x =
(dba), y = (ae c). Costruiamo l’elemento
yxy−1x−1 = (ae c)(dba)(c e a)(abd) = (ab c).
Se f(x) = x ′, f(y) = y ′, si ha f(yxy−1x−1) = y ′x ′y ′−1x ′−1 = 1 perche G/N
e abeliano. Ma questo significa che l’elemento yxy−1x−1 = (ab c) sta nel
nucleo N, e quindi N contiene ogni tre-ciclo. 2
Corollario 11.2 Per n ≥ 5 il gruppo simmetrico Sn non e risolubile.
Dimostrazione. Infatti Sn contiene tutti i tre-cicli, e quindi non puo con-
tenere una catena di sottogruppi come quella descritta nel Teorema 11.8,
perche ognuno di questi sottogruppi dovrebbe contenere tutti i tre-cicli e
quindi la catena non puo terminare con l’unita. 2
Si ha ora.
Teorema 11.9 (Teorema di Abel) L’equazione generale di grado n ≥ 5non e risolubile per radicali.
Dimostrazione. Basta osservare che il gruppo di Galois dell’equazione ge-
nerale di grado n e il gruppo totale Sn. 2
40Cf. [Artin, 1988, pp. 72-73].
229
Osservazione 11.8 Come spesso accade, risultati fondamentali, che han-
no richiesto l’elaborazione di una complessa struttura dimostrativa41 risul-
tano quasi evidenti all’interno di un diverso contesto teorico. Questo non
deve indurre a pensare che questi risultati siano banali. Qui il ruolo della
memoria storica e fondamentale.
Esercizio 11.1 Si analizzino diverse definizioni di gruppo risolubile. In
particolare si esamini il ruolo dei commutatori.42
41Si veda ad esempio [Tignol, 2001, capitolo 13].42Si veda ad esempio [Herstein, 1982, pp. 263-274].
230
Capitolo 12
Da Galois a Artin
12.1 Introduzione
Il testo pubblicato da Emil Artin nel 1942, e poi in edizione rivista nel 1944,
rappresenta per molti aspetti un punto d’arrivo sulle ricerche della teoria
di Galois.1
La prima parte del testo2 espone dei risultati di algebra lineare che
ora sono divenuti familiari. Importante e pero l’idea di applicare l’algebra
lineare alla teoria di Galois. Se un campo E e un’estensione di un campo K
esso e anche in particolare uno spazio vettoriale su K e molti risultati della
teoria di Galois si ottengono come semplici risultati di algebra lineare.3 Se E
1In realta le vicende biografiche di Artin motivano un consistente ritardo nella pub-
blicazione dei suoi risultati. Il materiale era gia pronto negli anni trenta del Novecento.
In parte e confluito nella Moderne Algebra [1930], [1931] di van der Waerden (come lo
stesso van der Waerden ha avuto cura di precisare nell’Introduzione del suo libro). I testi
di Artin sono [Artin, 1942] e [Artin, 1944]. Ma io utilizzero l’edizione tedesca, [Artin,
1988], rielaborata e migliorata da Artin in occasione del suo ritorno in Germania.2Cf. [Artin, 1988, pp. 1-16].3Molti autori sottolineano anche l’importanza dell’idea di Artin di considerare come
punto di partenza i sottocampi di un dato campo anziche le estensioni di un campo. Si
tratta di un aspetto importante, ma va colto nel complesso delle sue articolazioni. Si
231
e un campo contente K indicheremo con (E/K) la dimensione (eventualmente
infinita) di E come spazio vettoriale su K e diremo che (E/K) e il grado di
E su K.
Un teorema ora familiare ad ogni studente che abbia seguito un corso
fondamentale di algebra e il seguente (del quale quindi ometto la dimostra-
zione).4
Teorema 12.1 (Teorema 6) Siano K, B, E tre campi tali che sia
K ⊂ B ⊂ E.
Allora
(E/K) = (E/B)(B/K).
Anche le considerazioni su polinomi ed elementi algebrici e d isomorfismi
tra campi sono ora parte del patrimonio comune di uno studente che abbia
seguito un corso fondamentale di algebra. Ma vale la pena di ricordare il
teorema seguente.
Teorema 12.2 (Teorema 7, Kronecker) Sia f(x) un polinomio non co-
stante a coefficienti in K. Allora esiste una estensione E di K nella quale
f(x) possiede una radice.
Si tratta semplicemente di considerare un fattore irriducibile f(x) di f(x)
e di quozientare l’anello K[x] con l’ideale generato da f(x). Se il grado di
f(x) e n, l’estensione E e data dai polinomi di grado n − 1, ove la somma
e definita in modo ovvio e il prodotto di due polinomi e valutato modulo
f(x). Si rammenti che l’inverso e dato utilizzzando l’identita di Bezout.
12.2 Estensione di morfismi
Il teorema seguente merita invece attenzione.
puo vedere comunque [Tignol, 2001, p. 306].4Aggiungo ad ogni teorema citato la numerazione originale di [Artin, 1988].
232
Teorema 12.3 (Teorema 8) Sia σ un isomorfismo tra il campo K e il
campo K ′. Sia f(x) un polinomio irriducibile in K[x] e f ′(x) l’immagine
(tramite σ) di f(x) in K ′[x]. Siano poi E = K(β), E ′ = K ′(β ′), dove
f(β) = 0 e f ′(β ′) = 0. Allora l’isomorfismo σ puo essere esteso ad un
isomorfismo σ tra K(β) e K ′(β ′) tale che l’immagine di β sia β ′.
Dim. Ogni elemento di E e della forma g(β), dove g(x) ∈ K[x] ed ha
grado minore del grado di f(x). Definiamo σ come σ(g(β)) = g ′(β ′).5
Chiaramente σ e un’applicazione di E su E ′. Che conservi la somma e
evidente. Il prodotto di g(β)h(β) in E e definito calcolando r(x) = g(x)h(x)
mod f(x) e valutando r(β). Dall’algoritmo della divisione abbiamo
g(x)h(x) = q(x)f(x) + r(x)
e quindi,
g ′(x)h ′(x) = q ′(x)f ′(x) + r ′(x)
dal che si ottiene g ′(β ′)h ′(β ′) = r ′(β ′). 2
Osservazione 12.1 Si noti che il Teorema 12.3 mostra che l’estensione
generata con l’aggiunta di una radice di un polinomio irriducibile dipende
solo dal polinomio e non dal carattere speciale della radice. Ad esempio
x3 − 2 e un polinomio che ha le tre radici 3√2, α
3√2, α2
3√2 (ove 3
√2 denota
la radice reale e α e una radice primitiva di x3 − 1 = 0). I campi Q( 3√2)
e Q(α 3√2) sono isomorfi (ponendo σ( 3
√2) = α
3√2). Ma il primo ha solo
elementi reali, mentre il secondo possiede anche elementi di C.
Come semplice conseguenza del Teorema di Kronecker (il Teorema 12.2)
si ha l’esistenza del campo di spezzamento di un polinomio p(x).
Teorema 12.4 (Teorema 9) Sia p(x) un polinomio in un campo K. Al-
lora esiste un campo di spezzamento E di p(x).
Vediamo ora la dimostrazione di un teorema gia usato in precedenza (cf.
p. 214)
5E chiaro cosa Artin intenda con g ′(β ′). Se si desidera la maggior precisione che si
usa oggi si veda [Rotman, 1998, p. 55].
233
Teorema 12.5 (Teorema 10) Sia σ un isomorfismo di un campo K su
un campo K ′. Sia p(x) un polinomio in K e p ′(x) l’immagine di p(x) in
K ′. Sia poi E il campo di spezzamento di p(x) e E ′ il campo di spezzamento
di p ′(x). Allora l’isomorfismo σ puo essere esteso ad un isomorfismo tra il
campo E ed il campo E ′.
Dim. Sia p(x) = (x − α1)(x − α2) · · · (x − αs) la decomposizione di p(x)
in E. Se tutte le radici αi sono in K, si ha E = K ed anche evidentemente
E ′ = K ′.
Artin procede per induzione sul numero n delle radici non in K. Possia-
mo supporre che sia n > 1 e assumere che il teorema sia stato dimostrato
nel caso che il numero delle radici al di fuori di K sia minore di n. Sia ora
α1 una radice non in K e sia f(x) il polinomio irriducibile avente la radi-
ce α1.6 Poiche si ha p(α1) = 0 si ha p(x) = f(x)g(x).7 Di conseguenza
p ′(x) = f ′(x)g ′(x). Sia ora p ′(x) = a(x − β1)(x − β2) · · · (x − βs) lo spez-
zamento di p ′(x) in E ′. In una estensione di E ′ il polinomio f ′(x) avra una
radice γ e sara quindi p ′(γ) = 0, ossia a(γ − β1)(γ − β2) · · · (γ − βs) = 0.
Allora γ coincidera con una delle radici βi.8 Possiamo supporre γ = β1. In
forza del Teorema 12.3 possiamo estendere l’isomorfismo σ ad un isomor-
fismo τ di K(α1) su K ′(β1). Ora il polinomio p(x) puo essere considerato
in K(α1) e il polinomio p ′(x) (considerato ora come l’immagine di p(x) per
τ) puo essere considerato in K ′(β1). E e il campo di spezzamento di p(x)
su K(α1), E′ e il campo di spezzamento di p ′(x) su K ′(β1). Il numero delle
radici di p(x) in K(α1) e aumentato di almeno una unita e quindi il numero
delle radici che non sono in K(α1) (ed a maggior ragione non sono in K) e
minore di n. Per l’ipotesi di induzione τ puo essere esteso ad un isomorfismo
tra E ed E ′ che, ovviamente, estende l’isomorfismo σ. 2
Corollario 12.1 Sia p(x) un polinomio in un campo K. Allora due campi
di spezzamento di p(x) sono isomorfi.
Dim. Basta applicare il Teorema 12.5 ponendo K = K ′ e con σ il morfismo
identico. 2
6Possiamo supporre f(x) monico.7Si osservi l’importanza di questo risultato utilizzato spesso da Galois.8E quindi si ha che γ ∈ E ′.
234
Un altro risultato importante del quale pero ometto la dimostrazione e
la unicita della decomposizione in fattori.
Teorema 12.6 Sia p(x) un polinomio in K e siano
p(x) = p1(x)p2(x) · · ·pr(x) = q1(x)q2(x) · · ·qs(x)
due fattorizzazioni di p(x) in fattori irriducibili in K ognuno dei quali di
grado almeno uno. Allora r = s e, con un opportuno riordino dei fattori, si
ha pi(x) = ciqi(x), dove i ci sono elementi di K.
12.3 L’uso dei caratteri
Utilizzando i caratteri, originariamente introdotti da Dedekind, Artin ot-
tiene ora risultati semplici, eleganti e molto significativi.
Definizione 12.1 Sia G un gruppo moltiplicativo, sia K un campo e sia
K∗ l’insieme degli elementi non nulli di K. Un carattere di G in K e una
applicazione σ : G→ K∗ tale che σ(αβ) = σ(α)σ(β).
Teorema 12.7 (Teorema 12. Teorema di Dedekind) Sia G un grup-
po e siano
σ1, σ2, . . . , σn
caratteri a due a due distinti di G in un campo K. Allora σ1, σ2, . . . , σnsono linearmente indipendenti, ossia, per ogni x in G si verifica
a1σ1(x) + a2σ2(x) + · · ·+ anσn(x) = 0
se e solo se
a1 = a2 = · · · = an = 0.
Dim. Procediamo per induzione. Per n = 1, si ha a1σ1(x) = 0 e poiche
σ1(x) = 0 deve essere a1 = 0. Supponiamo allora che il teorema sia stato
dimostrato per meno di n caratteri.
Supponiamo che sia
a1σ1(x) + a2σ2(x) + · · ·+ anσn(x) = 0 (12.1)
235
e sia α un elemento di G da determinarsi successivamente. Operiamo ora
in due modi: sostituiamo x con αx nella (12.1):
a1σ1(α)σ1(x) + a2σ2(α)σ2(x) + · · ·+ anσn(α)σn(x) = 0. (12.2)
Moltiplichiamo ora tutti i termini della (12.1) per σn(α):
a1σn(α)σ1(x) + a2σn(α)σ2(x) + · · ·+ anσn(α)σn(x) = 0. (12.3)
Sottraendo la (12.3) dalla (12.2) si ha
a1[σ1(α) − σn(α)]σ1(x) + · · ·+ an−1[σn−1(α) − σn(α)]σn−1(x). (12.4)
L’ipotesi di induzione da
a1[σ1(α) − σn(α)] = 0.
Poiche n > 1, σ1 e σn sono caratteri diversi. Quindi deve esistere un α
tale che σ1(α) = σn(α). Con questa scelta di α si ha a1 = 0. Ora si puo
applicare l’ipotesi di induzione alla (12.2) e ne segue che
a2 = a3 = · · · = an = 0. 2
Questo risultato ha una applicazione importante nel caso in cui G sia il
gruppo moltiplicativo di un campo E (l’insieme degli elementi non nulli) e
i caratteri sono isomorfismi di E in un campo E ′.
Corollario 12.2 Siano E ed E ′ due campi e σ1, σ2, . . . , σn siano isomorfi-
smi diversi di E in E ′. Allora σ1, σ2, . . . , σn sono indipendenti.
Artin da ora una definizione molto ‘moderna’, quella di campo fisso come
equalizzatore di morfismi. Intanto si ha questa definizione.
Definizione 12.2 Siano σ1, σ2, . . . , σn isomorfismi di un campo E in un
campo E ′. Un elemento a tale che σ1(a) = σ2(a) = · · · = σn(a) e detto un
punto fisso.
Un caso importante e quello in cui E = E ′ e σ1 = identita. Ecco ora il
campo fisso.
236
Lemma 12.1 L’insieme dei punti fissi di E e un sottocampo di E. Questo
sottocampo e detto il campo fisso di σ1, σ2, . . . , σn.
Ecco ora un teorema fondamentale
Teorema 12.8 (Teorema 13) Siano
σ1, σ2, . . . , σn
isomorfismi a due a due distinti di un campo E in un campo E ′ e sia K il
campo fisso di E. Allora
(E/K) ≥ n.
Dim. Mostriamo che l’ipotesi (E/K) = r < n conduce ad una contraddizio-
ne. Siano ω1,ω2, . . . ,ωr un sistema di generatori di E su K. Nel sistema
di equazioni
σ1(ω1)x1 + σ2(ω1)x2 + · · ·+ σn(ω1)xn = 0
σ1(ω2)x1 + σ2(ω2)x2 + · · ·+ σn(ω2)xn = 0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
σ1(ωr)x1 + σ2(ωr)x2 + · · ·+ σn(ωr)xn = 0
(12.5)
vi sono piu incognite che equazioni e quindi esiste una soluzione non banale
che si puo indicare ancora con x1, x2, . . . , xn. Per ogni elemento α di E
esistono degli elementi a1, a2, . . . , ar tali che α = a1ω1 + a2ω2 + · · ·arωr.
Moltiplichiamo ora la prima equazione per σ1(a1), la seconda per σ1(a2),
ecc. Poiche gli ai sono punti fissi, si ha σ1(ai) = σj(ai) e quindi si ha
σ1(a1ω1)x1 + σ2(a1ω1)x2 + · · ·+ σn(a1ω1)xn = 0
σ1(a2ω2)x1 + σ2(a2ω2)x2 + · · ·+ σn(a2ω2)xn = 0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
σ1(arωr)x1 + σ2(arωr)x2 + · · ·+ σn(arωr)xn = 0
(12.6)
Sommando queste equazioni, si ha
σ1(α)x1 + σ2(α)x2 + · · ·+ σn(α)xn = 0
e poiche gli xi non sono tutti nulli si ha una contraddizione: i σi non possono
essere indipendenti, in contraddizione con il Teorema 12.7. 2
237
Corollario 12.3 Siano σ1, σ2, . . . , σn automorfismi di un campo E e sia K
il campo fisso, formato dagli elementi di E che sono fissati dai σi. Allora
(E/K) ≥ n.9
Dim. Se tra i σi compare l’identita, basta applicare il teorema precedente.
Se l’dentita non compare, basta aggiungerla e si ha allora (E/K) ≥ n+1 2
Si osserva facilmente che l’insieme degli automorfismi di E che lasciano
invariato un sottocampo formano un gruppo.
12.4 Un’applicazione importante del
Teorema 13
Artin dedica l’intera Sezione G, Anwendugen und Beispiele zu Satz 13, a
due esempi. Uno di essi e esattamente il teorema sui polinomi simmetrici.
L’attenzione di Artin per questo esempio e anche testimoniata dal fatto che
l’edizione tedesca e assai diversa e ben piu articolata di quella inglese.10
Sia
E = k(x1, x2, . . . , xn)
il campo delle funzioni razionali nelle n indeterminate x1, x2, . . . , xn. Se
(ν1 ν2 . . . νn)
e una permutazione di
(1 2 . . . n)
possiamo sostituire in ogni funzione f(x1, x2, . . . , xn) di E la variabile x1 con
xν1 , x2 con xν2 ,. . . , xn con xνn .
L’applicazione di E in se stesso ottenuta in questo modo e un automorfi-
smo e ci sono n! automorfismi che possono essere ottenuti in questo modo.
Il campo fisso K e dato dalle funzioni simmetriche e il Corollario 12.3 mostra
che (E/K) ≥ n!.9Attenzione: qui non si tratta del campo fisso ma dell’insieme degli elementi che
rimangono invarianti.10Si confontino la Sezione G di Artin [1944] e di Artin [1988].
238
Artin ora considera il polinomio
f(x) = (x− x1)(x− x2) · · · (x− xn) = xn − σ1xn−1 + · · ·+ (−1)nσn, (12.7)
e osserva che il campo
S = k(σ1, σ2, . . . , σn)
di tutte le funzioni razionali di σ1, σ2, . . . , σn e contenuto in K. Si tratta di
dimostrare che S = K e che (E/K) = n!. Bastera per questo dimostrare che
(E/S) ≤ n!.11
Costruiamo la torre di campi
Sn ⊂ Sn−1 ⊂ Sn−2 ⊂ · · · ⊂ S2 ⊂ S1 = E
dove
Sn = S; Si−1 = Si(xi) = S(xi, xi+1, . . . , xn).
Possiamo ridurci a dimostrare che (Si−1/Si) ≤ i. Poiche Si−1 e ottenuto
da Si con l’aggiunta di xi a Si−1, dobbiamo trovare per ogni i un’equazione
per xi con coefficienti in Si di grado al piu i. I polinomi richiesti sono
semplicemente
Fi(x) =f(x)
(x− xi+1)(x− xi+2) · · · (x− xn)=
Fi+1(x)
(x− xi+1), (12.8)
dove Fn(x) = f(x).
Effettuando le divisioni, Fi(x) diviene un polinomio in x di grado i, il
cui coefficiente direttivo e 1 mentre gli altri coefficienti sono polinomi nelle
variabili
σ1, σ2, . . . , σn e xi+1, xi+2, . . . , xn.
Solamente degli interi compaiono come coefficienti in queste espressioni ed
e evidente che xi e una radice di Fi(x) = 0. Il teorema e cosı dimostrato.
Ma si noti che a questo punto non abbiamo ancora mostrato un algoritmo
con il quale una funzione simmetrica possa essere rappresentata come una
funzione delle σj.
11Essendo S ⊂ K si ha certamente (E/K) ≤ (E/S).
239
Artin procede per esibire questo algoritmo. Dall’uguaglianza (E/K) = n!
abbiamo anche che (Si−1/Si) = i, il che implica che lo spazio vettoriale Si−1su Si e generato da 1, xi, x
2i , . . . , x
i−1i . Di conseguenza, lo spazio vettoriale
E su S e generato dai seguenti n! elementi:
xν11 x
ν22 · · · xνnn dove νi ≤ i− 1.12 (12.9)
Un elemento arbitrario di E puo essere rappresentato in modo unico co-
me una combinazione lineare di questi n! elementi con coefficienti in S.
Supponiamo dunque che sia dato un polinomio arbitrario g(x1, x2, . . . , xn)
nelle variabili x1, x2, . . . , xn con coefficienti in E. Se g e simmetrico esso
appartiene al campo fisso
K = S = k(σ1, σ2, . . . , σn)
e d’altra parte puo essere scritto come una combinazione lineare degli ele-
menti (12.9), dove tutti i coefficienti sono zero con l’eccezione dei termini
ottenuti con ν1 = ν2 = · · · = νn = 0, che coincidono g. Dalla unicita della
rappresentazione segue che g e un polinomio nelle σ1, σ2, . . . , σn.
Sia ora g un polinomio arbitrario. Poiche F1(x1) = 0 e di primo grado in
x1, possiamo esprimere x1 come un polinomio nelle σi ed in x2, x3, . . . , xn.
Una volta che questo valore di x1 e sostituito in g(x1, x2, . . . , xn), poiche
F2(x2) = 0, possiamo esprimere x22 o le potenze piu elevate come polinomi
nelle variabili x3, . . . , xn e nelle σi, e x2 apparira al piu al primo grado. Si
puo proseguire con lo stesso pattern. F3(x3) = 0 e possiamo esprimere x33 o
le potenze di ordine piu elevato come polinomi nelle variabili x4, x5, . . . , xned in σi; e x3 apparira al piu al secondo grado.
Procedendo in questo modo, concludiamo che g(x1, x2, . . . , xn) puo es-
sere espresso come un polinomio nelle xi e nelle σj tale che il grado nella
variabile xi non ecceda i. Dunque g(x1, x2, . . . , xn) e una combinazione
lineare degli n! termini (12.9) e i coefficienti sono polinomi nelle σj.
Quindi Artin ha descritto un algoritmo generale che si applica ad ogni
polinomio simmetrico o non simmetrico. 2
12Se F, B, E sono tre campi tali che F ⊂ B ⊂ E e se gli elementi a1, a2, . . . , ar formano
una base di E su B mentre gli elementi b1, b2, . . . , bs formano una base di B su F, allora
gli elementi aibk, per i = 1, . . . r, k = 1 . . . s sono una base di E su F. E nella sostanza
il processo dimostrativo del Teorema 12.1.
240
Esempio 12.1 Si consideri il polinomio
g = x21 + x22 + a · x23.
Allora
F3(x) = f(x) = (x− x1)(x− x2)(x− x3) = x3 − σ1x
2 + σ2x− σ3
e
F2(x) =f(x)
x− x3= x2 − (σ1 + x3)x− σ1x3 + x
23 + σ2,
F1(x) =f(x)
(x− x3)(x− x2)= x+ x2 + x3 − σ1.
Ne segue che
x1 = σ1 − x2 − x3,
x22 = σ1(x2 + x3) − σ2 − x2x3 − x23,
x33 = σ1x23 − σ2x3 + σ3.
La eliminazione di x1 produce
2 x22 + σ1
2 − 2 σ1x3 − 2 σ1x2 + x32 + 2 x2x3 + ax3
2.
La successiva eliminazione di x22 da
σ21 − 2σ2 + (a− 1)x23,
e siamo giunti al termine, perche la piu alta potenza di x3 e 2.
Si noti che l’algoritmo di Artin consiste di un ‘data base’ dato dalle
expressioni delle potenze xii, che sono indipendenti dal polinomio g e da un
processo di successiva eliminazione di queste espressioni. Si noti anche che
il risultato puo dipendere dalla scelta della disposizione delle variabili. Per
esempio, con la scelta di x3, x1, x2, abbiamo
ax1x2 − aσ1x1 − x1x2 + σ1x1 − aσ1x2 − aσ2 + aσ12 − σ2 + σ1x2. 2
241
12.5 La sezione H della Galoissche Theorie
di Artin
Osservazione 12.2 Questa sezione del libro di Artin 13 e caratterizzata sia
da una grande eleganza espositiva sia da una grande chiarezza concettuale.
Per questa ragione, in quanto segue, in molti casi, ho semplicemente tradot-
to il testo di Artin. Ovviamente il lettore e pregato di utilizzare i contenuti
di questa sezione per puro uso personale.
Artin esamina il caso in cui i σi formino un gruppo finitoG = {σ1, σ2, . . . , σn}
di automorfismi di un campo E e K ne sia il campo fisso. Introduce la
funzione
S(α) = σ1(α) + σ2(α) + · · ·+ σn(α)
che gioca un ruolo importante.14
Applichiamo a S(α) un automorfismo σi: otteniamo la somma
σiσ1(α) + σiσ2(α) + · · ·+ σiσn(α).
Poiche G e un gruppo, gli automorfismi
σiσ1, σiσ2, . . . , σiσn
non sono altro che gli automorfismi
σ1, σ2, . . . , σn
scritti in un ordine diverso. Questo mostra che S(α) rimane invariata per
tutti i σi e dunque e un elemento di K.15 La funzione S(α), che viene anche
detta la traccia di α non e identicamente nulla, poiche questo sarebbe in
contraddizione con l’indipendenza lineare dei σ1, σ2, . . . , σn (in contrasto
con il Teorema di Dedekind, visto a p. 235).
Esercizio 12.1 Si considerino il gruppo G di automorfismi di C dato da
G = {id, σ}, dove σ(a + ib) = a − ib. Si calcoli la traccia di un elemento
α ∈ C.13E contenuta in [Artin, 1988, pp. 34-41].14Questa funzione non e utilizzata nella corrispondente Sezione di [Artin, 1944].15Si noti che questo risultato segue semplicemente dalla definizione di K.
242
Esercizio 12.2 Si considerino il gruppo G di Galois degli automorfismi di
Q(√2+
√3) che hanno per campo fisso Q (in base al Teorema Fondamen-
tale). Si calcoli la traccia di 1−√2
1+√3.
Teorema 12.9 (Teorema 14) Quando σ1, σ2, . . . , σn e un gruppo G di
automorfismi di un campo E e K e il campo fisso, si ha
(E/K) = n.
Dimostrazione. In conseguenza del Teorema 12.8 e sufficiente dimostrare
che n+1 elementi α1, α2, . . . , αn+1 di E sono sempre linearmente dipendenti.
Per questo scopo consideriamo il seguente sistema di equazioni lineari:
x1σ−11 (α1) + x2σ
−11 (α2) + · · ·+ xn+1σ−1
1 (αn+1) = 0
x1σ−12 (α1) + x2σ
−12 (α2) + · · ·+ xn+1σ−1
2 (αn+1) = 0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
x1σ−1n (α1) + x2σ
−1n (α2) + · · ·+ xn+1σ−1
n (αn+1) = 0
(12.10)
in E. Il sistema ha una soluzione non banale perche il numero delle incognite
supera il numero delle equazioni. Possiamo supporre x1 = 0.Poiche le equazioni (12.10) possono essere moltiplicate per un fattore
arbitrario, possiamo supporre che x1 sia un elemento di E che abbia traccia
non nulla.16 Applichiamo ora σi alla i-esima equazione. Il risultato e:
σi(x1)α1 + σi(x2)α2 + · · ·+ σi(xn+1)αn+1 = 0.
Se sommiamo rispetto all’indice i, otteniamo:
S(x1)α1 + S(x2)α2 + · · ·+ S(xn+1)αn+1 = 0.
Poiche S(xν) appartiene a K e S(x1) = 0 abbiamo ottenuto una combina-
zione lineare che mostra la dipendenza. 2
Questo teorema ha due importanti corollari.
16Poiche x1 = 0 gli elementi della forma x1 ·y esauriscono gli elementi di E e tra questi
c’e almeno un elemento con traccia non nulla. Possaimo allora addirittura suppore che
questo elemento sia x1 stesso.
243
Corollario 12.4 Sotto le stesse ipotesi del Teorema 12.9 si ha: un qualsiasi
automorfismo di E che lascia invariante il campo K appartiene a G.
Dimostrazione. Sia σ diverso da ogni σi; puo allora essere aggiunto a G.
Poiche questo automorfismo non modifica K, otteniamo dal Teorema 12.8
che (E/K) ≥ n+ 1, in contraddizione con il Teorema 12.9. 2
Ne segue anche immediatamente:
Corollario 12.5 Gruppi finiti diversi di automorfismi di E hanno campi
fissi diversi.
Siamo ora giunti al punto in cui si vede concretamente come Artin consideri
non le estensioni di un campo ma i sottocampi di un campo dato.
Definizione 12.3 Una estensione E di un campo K e detta una estensione
normale di K quando K e il campo fisso di un gruppo finito di automorfismi.
La definizione seguente e motivata dal fatto che Artin considera campi di
caratteristica qualsiasi. In un campo di caratteristica finita un polinomio
irriducibile puo avere radici multiple. Questo naturalmente non capita in
caratteristica zero.
Definizione 12.4 Sia f(x) un polinomio di K[x]. Diremo che f(x) e un
polinomio separabile quando nessun suo fattore irriducibile possiede radici
multiple. Sia ora E una estensione di K. Diremo che un elemento α di E e
separabile quando e radice di un polinomio separabile. Diremo poi che una
estensione E di K e separabile quando ogni suo elemento e separabile.
Teorema 12.10 (Teorema 15) Sia E una estensione normale di K aven-
te il gruppo G. Allora E e una estensione separabile di K. Inoltre si ha: sia
α un elemento di E e siano α1, α2, . . . , αr le immagini a due a due distinte
di α che si ottengono con gli n automorfismi di G. Allora il polinomio
p(x) = (x− α1)(x− α2) · · · (x− αr)
e un polinomio irriducibile in K con la radice α.
244
Dimostrazione. Si moltiplichino gli n elementi di G per σi, il che produce
di nuovo tutti gli elementi di G. Questo mostra che gli r elementi
σi(α1), σi(α2), . . . , σi(αr)
formano una permutazione degli elementi
α1, α2, . . . , αr.
Di conseguenza i coefficienti del polinomio p(x) rimangono invariati per la
applicazione di σi. Quindi p(x) e un polinomio in K, ed e evidente che
p(x) e separabile. Poiche α stesso compare tra le immagini di α, p(x) ha
la radice α.
Se f(x) e un polinomio arbitrario in K per il quale si ha f(α) = 0, si ha
anche
σi(f(α)) = f(σi(α)) = 0.
quindi f(x) ammette tutte le radici α1, α2, . . . , αr e quindi e divisibile per
p(x).
Questo mostra la irriducibilita di p(x) e la dimostrazione e completa. 2
Esercizio 12.3 Si confronti questo terorema con l’Osservazione 11.4.
Corollario 12.6 Sia E una estensione normale di K, p(x) un polinomio
irriducibile in K che ha una radice in E. Allora p(x) si spezza in fattori
lineari.
Dimostrazione. A causa della unicita del polinomio irriducibile di α, il
polinomio p(x) costruito sul modello del Teorema 12.10 si spezza in fattori
lineari in E. 2
Teorema 12.11 (Teorema 16) Sia E una estensione normale di K con
gruppo G e sia B un campo intermedio. Allora E e una estensione normale
di B, il cui gruppo U e dato dagli automorfismi di G che lasciano il campo
B invariato.
245
Dimostrazione. Sia U il sottogruppo di quegli automorfismi di G che lascia-
no B invariato. Sia r l’ordine del gruppo U, e sia B ′ il campo fisso di U.
Quindi si ha B ⊂ B ′ e dobbiamo dimostrare che B = B ′.
Abbiamo (E/B ′) = r, e (E/B) ≥ r, ed e sufficiente mostrare che
(E/B) = r.
Se si applicano gli automorfismi σi diG a B si ottengono rappresentazioni
isomorfe di B.
Ma puo succedere che automorfismi diversi diano la stessa rappresenta-
zione. Sia infatti σi(β) = σj(β) per tutti i β in B.
Questo e equivalente a
σ−1i σj(β) = β
il che equivale ancora a dire che σ−1i σj appartiene a U.
Gli elementi di uno stesso laterale sono allora esattamente quelli che
generano la stessa immagine isomorfa di B.
Poniamo ora n = rs, di modo che s e il numero dei laterali. Gli elementi
di G generano dunque esattamente s immagini isomorfe di B. Il campo fisso
di queste s rappresentazioni diverse e naturalmente K, e quindi per causa
del Teorema 12.8 abbiamo (B/K) ≥ s. Le due disuguaglianze
(E/B) ≥ r, (B/K) ≥ s
danno
(E/K) ≥ n.
Ma deve valere l’uguaglianza e quindi
(E/B) = r, (B/K) = s.
Il nostro teorema e dunque dimostrato. 2
Dalla dimostrazione segue che, per ogni campo intermedio B di grado s
su K si danno s isomorfismi diversi che fissano gli elementi di K e ognuno di
questi isomorfismi viene prodotto da un elemento di G. Si vede facilmente
che non esiste alcun altro isomorfismo di B che fissi gli elementi di K in una
246
estensione arbitraria di E. Altrimenti lo si aggiunga agli s isomorfismi dati.
K dovrebbe essere il campo fisso di questi s+ 1 isomorfismi, e quindi per il
Teorema 13 (cfr. pag. 237) deve essere (B/K) ≥ s+ 1.Ad ogni sottogruppo U di G corrisponde, come gia sappiamo, un sotto-
campo B, ossia il campo fisso di U (che contiene K). A sottogruppi diversi
corrispondono sottocampi diversi, per il Corollario 12.5 del Teorema 12.9.
Infine nel Teorema 12.11 abbiamo dimostrato che ogni campo intermedio
e il campo fisso di un sottogruppo di G.
Questa corrispondenza fra sottogruppi e sottocampi e anche chiaramente
una corrispondenza biunivoca.
Siano U1 e U2 con campi fissi B1 e B2 e sia U1 ⊂ U2, allora e eviden-
temente B1 ⊃ B2. Sia ora B1 ⊃ B2, di modo che ogni automorfismo che
lascia fisso B1 lascia anche fisso B2; ne segue dunque U1 ⊂ U2. La nostra
corrispondenza inverte dunque la relazione di contenenza. Infine per que-
sto ordinamento l’intero gruppo G e associato a K, mentre all’identita e
associato l’intero campo E.
Si possono dunque utilizzare i sottogruppi di G per descrivere i campi
intermedi. Vediamo ora anche un altro utilizzo.
Sia B un campo intermedio che appartenga al sottogruppo U e sia σ un
elemento di G. L’immagine σ(B) di B ottenuta dall’applicazione di σ e un
campo intermedio. Ci chiediamo quale sia il sottogruppo che corrisponde
a σ(B). Gli elementi di σ(B) hanno la forma σ(β), dove β appartiene a
B. Dobbiamo chiederci quali sono gli elementi τ di G che lasciano invariato
σ(β), per i quali dunque si ha
τσ(β) = σ(β).
Questa equazione e equivalente a
σ−1τσ(β) = β,
e questo significa che σ−1τσ sta in U e che dunque τ e un elemento di
σUσ−1. Quindi σUσ−1 e il gruppo che appartiene a σ(B).
Possiamo anche conoscere le condizioni per le quali B e un’estensione
normale di K. Quando (B/K) = s abbiamo visto che, in generale, ci pos-
sono essere solamente s isomorfismi di B (che lasciano K invariato) in una
247
estensione contenuta in E e che tutti questi isomorfismi sono generati da
elementi di G.
Quando B e normale su K, d’altra parte, debbono esserci s automorfismi
di B e dunque ogni isomorfismo deve essere un automorfismo. Dunque
σ(B) = B per ogni σ in G. Per quanto visto in precedenza, abbiamo
σUσ−1 = U
per ogni σ di G. Un sottogruppo con questa proprieta e detto, come tutti
sanno, un sottogruppo normale di G.17
Dunque B e una estensione normale di K esattamente quando U e un
sottogruppo normale di G.
Supponiamo ora che il campo intermedio B sia una estensione normale
di K e che quindi U sia un sottogruppo normale di G. Ogni automorfismo di
B che lascia K invariato e dunque generato dalla applicazione di un elemento
σ di G a B. Ma ogni automorfismo del laterale σU applicato a B genera
lo stesso automorfismo che genera σ, e quindi gli automorfismi di B che
ricerchiamo sono in corrispondenza biunivoca con i laterali σU.
Siano σU e τU due tali laterali, allora essi generano gli automorfismi
di B che si ottengono applicando σ e τ. La loro composizione genera
l’automorfismo στ che si trova nel laterale στU. Poiche U e un sottogruppo
normale, questo laterale e il prodotto dei laterali σU e τU. Vediamo allora
che gli automorfismi di B si compongono esattamente come i laterali. Il
gruppo formato dai laterali di un sottogruppo normale si chiama, come e
ben noto, il gruppo quoziente G/U. In questo senso l’estensione normale B
di K ha come gruppo di automorfismi G/U.
Riassumendo ecco quanto abbiamo dimostrato.18
17Si noti che Artin fino a questo punto ha utilizzato assai pochi strumenti della teoria
dei gruppi. La differenza tra la trattazione di Artin e quella di Jordan [1870] e notevole
(non solo per la dimensione dei libri). In un certo senso Artin e piu vicino a Galois di
quanto non lo siano gli autori che nell’Ottocento hanno cercato di interpretarlo.18Come si vede, nell’edizione tedesca, Artin preferisce enunciare il Teorema
Fondamentale al termine di una discussione che ha chiarito tutti gli aspetti dimostrativi.
In Artin [1944] si ha invece l’approccio piu tradizionale: l’enunciato seguito dalla
dimostrazione.
248
Teorema 12.12 (Teorema fondamentale) Sia E una estensione norma-
le di K avente il gruppo G. Si associ ad ogni sottogruppo U di G il campo
fisso B: abbiamo cosı una corrispondenza biunivoca tra sottogruppi e sotto-
campi. Questa corrispondenza inverte la relazione di contenenza. Per ogni
campo intermedio B il gruppo associato consiste di quegli elementi di G che
lasciano fisso B. Si ha
(E/B) = |U|,
(B/K) = Indice di U in G = Numero dei laterali.
Ogni isomorfismo di B in una estensione di E che fissa gli elementi di K puo
essere ottenuto attraverso l’uso di un elemento σ di G, e gli elementi del
laterale σU generano lo stesso isomorfismo. B e una estensione normale di
K quando U e un sottogruppo normale di G. In questo caso il gruppo degli
automorfismi di B e il gruppo quoziente G/U.
Osservazione 12.3 Un ottimo commento relativo alla versione di Artin
del Teorema Fondamentale si trova in [Bewersdorff, 2006, pp. 149-150].
Importante e anche l’articolo di Kiernan [1972], al quale va pero aggiunto
[van der Waerden, 73].
Ecco ora una semplice condizione per esprimere il fatto che E e una
estensione normale di K.
Teorema 12.13 (Teorema 18) E e una estensione normale di K se e solo
se e il campo di spezzamento di un polinomio separabile.
Dimostrazione. 1. Sia E una estensione normale di K e ω1,ω2, . . . ,ωn sia
una base dello spazio vettoriale E su K. Sia pi(x) il polinomio irriducibile di
K[x] con la radice ωi. Abbiamo gia dimostrato (con il Teorema 12.10 ed il
Corollario 12.6) che pi(x) e separabile e che si spezza totalmente in fattori
lineari in E. Si ponga
p(x) = p1(x)p2(x) · · ·pn(x).
Allora il polinomio p(x) e separabile e si spezza in E in fattori lineari.
Poiche tra le radici di p(x) ci sono tutti gli ωi, il campo di spezzamento e
esattamente E.
249
2. Sia p(x) un polinomio separabile di K e sia E il campo di spezzamento.
Sia G il gruppo degli automorfismi di E che fissano K. Poiche (E/K) <∞,
si ha, per il Corollario 12.3 del Teorema 12.8, che anche G e un gruppo
finito. E sufficiente dimostrare che un elemento θ di E che rimane invariato
per tutti gli elementi di G e un elemento di K, ossia che K e il campo fisso
di G.
Se tutte le radici di p(x) sono in K, abbiamo E = K e la nostra afferma-
zione vale banalmente.
Supponiamo dunque ora che delle radici di p(x) ve ne siano n non in
K, dove n ≥ 1. Supponiamo che la nostra proprieta sia stata dimostrata
in tutti i casi in cui meno di n radici di p(x) non sono in K. Sia α1 una
radice di p(x) che non sta in K e sia p1(x) il polinomio irriducibile in K
con p1(α1) = 0. Poiche p(x) e separabile, il polinomio p1(x) non ha radici
multiple. Noi sostituiamo ora il campo base K con K(α1). Allora p(x) e
ancora un polinomio separabile su questo campo ed E e ancora il campo
di spezzamento. Ma ci sono meno di n radici di p(x) fuori da K(α1). Per
l’ipotesi induttiva E e una estensione normale di K(α1). Il gruppo U degli
automorfismi di E che fissano K(α1) ha esattamente K(α1) come campo
fisso, ed e un sottogruppo di G. Sia ora θ un elemento che e fissato da tutti
gli elementi di G. Allora esso e anche fissato da tutti gli elementi di U e
quindi appartiene a K(α1). Sia ora s il grado di p1(x). Allora θ ha la forma:
θ = c0 + c1α1 + c2α21 + · · ·+ cs−1αs−11 (12.11)
dove i ci sono in K.
Il polinomio p1(x) non ha radici multiple. Indichiamo le sue radici con
α1, α2, . . . , αs. Per il Teorema 12.3 abbiamo un isomorfismo σi che mappa
K(α1) su K(αi), per il quale K rimane fisso puntualmente e α1 va in αi. Il
morfismo σi muta p(x) in se stesso. Il campo E e il campo di spezzamento
di p(x) su K(α1) ed e anche il campo di spezzamento di p(x) su K(αi). Per
effetto del Teorema 11.3, il morfismo σi si puo estendere ad un morfismo
τi che mappa E su E ed e quindi un elemento di G. Allora θ deve essere
fissato anche da τi. Applichiamo τi a (12.11) ed abbiamo
θ = c0 + c1αi + c2α2i + · · ·+ cs−1αs−1i .
250
Il polinomio
c0 − θ+ c1x+ c2x2 + · · ·+ cs−1xs−1.
ha le s radici distinte α1, α2, . . . , αs. Allora il loro numero e maggiore del
suo grado e quindi tutti i suoi coefficienti, ed in particolare il termine di
grado zero, debbono essere nulli. Allora abbiamo
θ = c0
e dunque θ e un elemento di K. 2
Aggiungiamo alcune osservazioni circa il calcolo con gli automorfismi.
Una estensione normale E di K sara descritta in pratica attraverso la scelta
di elementi generatori, ossia come
E = K(α1, α2, . . . , αr).
Questo significa che ogni elemento θ e una funzione razionale di
α1, α2, . . . , αr
con coefficienti in K.
Quando si conosce l’effetto di un automorfismo σ di G sui generato-
ri αi l’automorfismo e descritto esattamente. Dunque σ e determinato
dall’assegnazione dei valori σ(αi).
Quando si conosce un polinomio f(x) di K[x] tale che f(αi) = 0, ne segue,
per la applicazione di σ che deve essere f(σ(αi)) = 0 e quindi σ(αi) deve
essere ancora una radice di f(x).
Quando per esempio E e il campo di spezzamento di un polinomio senza
radici multiple e quando α1, α2, . . . , αr sono le radici, allora gli elementi αipossono essere scelti come i generatori di E, ed e allora chiaro che σ generera
una certa permutazione tra queste radici. Con questa descrizione, la quale
non e in tutti i casi praticabile, G puo anche essere identificato con un certo
gruppo di permutazioni.
251
12.6 La teoria di Artin e le estensioni
semplici.
Come si e visto, il percorso dimostrativo che ha condotto Artin al Teorema
Fondamentale non ha fatto ricorso al Teorema dell’Elemento Primitivo.
Ora si tratta pero di chiarirne il ruolo all’interno della teoria. E intanto
opportuno dare alcune definizioni:
Definizione 12.5 Una estensione E di un campo K e detta algebrica quan-
do ogni elemento di E e algebrico su K.
Sono di immediata verifica i fatti seguenti:
• Se (E/K) e finita, ogni elemento di E e algebrico su K;
• Se E e generata aggiungendo un numero finito di elementi algebrici E
e algebrica e di grado finito;
• Piu in generale, ogni estensione che si ottiene aggiungendo elementi
algebrici a K e un’estensione algebrica.
Abbiamo ora il risultato seguente:
Teorema 12.14 Sia K ⊂ E1 ⊂ E2, dove E1 e algebrica su K e E2 e algebrica
su E1. Allora E2 e un’estensione algebrica di K.
Dimostrazione. Sia α un elemento di E2. Per ipotesi α soddisfa un’equazione
algebrica in E1 i cui coefficienti siano α1, α2, . . . , αr. Allora α e algebrico
sul campo E ′ = K(α1, α2, . . . , αr). Il campo E ′(α) e di grado finito su E ′ ed
E ′ e di grado finito su K; di conseguenza (E ′(α)/K) e finito. Dunque α e
algebrico su K. 2
Ancora una volta Artin procede in modo discorsivo, affidando poi ad un
teorema (il Teorema 12.15) il risultato ottenuto con questo stile argomen-
tativo.
Sia allora E = K(α1, α2, . . . , αr) e sia ogni αi separabile su K. Quindi il
polinomio irriducibile pi(x) con la radice αi non ha radici multiple.
252
Sia f(x) = p1(x)p2(x) · · ·pr(x) ed indichiamo con E ′ il campo di spezza-
mento di di f(x) su E. Allora E ′ e anche il campo di spezzamento di f(x)
su K e contiene E come campo intermedio. Per il Teorema 12.13, E ′ e una
estensione normale di K. Per il Teorema 12.10, E ′ e anche una estensione
separabile di K, e quindi anche E, possiede questa proprieta. La estensione
normale E ′ di K ha solo un numero finito di campi intermedi, esattamente
tanti quanti i sottogruppi del gruppo degli automorfismi [che fissano K].19
Dunque vi sono solo un numero finito di campi tra K ed E. Quindi:
Teorema 12.15 (Teorema 22) Sia E = K(α1, α2, . . . , αr) e sia ogni αiseparabile su K. Allora E e una estensione separabile di K e ci sono solo
un numero finito di campi intermedi tra K ed E. E puo essere esteso ad un
campo E ′ che e normale su K.
Lemma 12.2 Sia σ un isomorfismo che mappa K su K ′, sia p(x) un poli-
nomio in K senza radici multiple e sia p ′(x) la sua immagine mediante σ.
Allora anche p ′(x) non ha radici multiple.
Dimostrazione. Sia E il campo di spezzamento di p(x) su K ed E ′ il campo
di spezzamento di p ′(x) su K ′. Per il Teorema 11.3 possiamo estendere σ ad
un isomorfismo τ fra E ed E ′ Si applichi ora τ alla decomposizione di p(x)
in fattori lineari in E e si ottiene lo spezzamento di p ′(x) in fattori lineari
distinti in E ′. 2
Teorema 12.16 (Teorema 23) Sia K ⊂ E1 ⊂ E2 dove E1 e una estensio-
ne separabile di grado finito su K ed E2 e una estensione separabile di grado
finito su E1. Allora E2 e separabile su K.
Dimostrazione. Sia α un elemento di E2 e p(x) il polinomio irriducibile
corrispondente su E1. Per ipotesi p(x) non ha radici multiple. Si estenda E1ad un’estensione normale E su K ed indichiamo con G il suo gruppo degli
automorfismi. I fattori irriducibili di p(x) in E siano p1(x), p2(x), . . . , pr(x).
Essi sono a due a due diversi e non hanno radici multiple.
Si applichino ora a questi polinomi tutti gli automorfismi di G ed in-
dichiamo con q1(x), q2(x), . . . , qs(x) i polinomi diversi che si ottengono.
19A causa del Teorema fondamentale, naturalmente.
253
Ogni qi(x) e l’immagine di un polinomio pj(x). A causa del Lemma 12.2
ogni qi(x) ha radici semplici. A causa dell’unicita dell’equazione irriducibile
corrispondente ad una data radice, due polinomi qi(x) non hanno radici co-
muni. Le immagini dei qi(x) per ogni automorfismo σ di G sono s polinomi
diversi l’uno dall’altro, ognuno dei quali, a causa della proprieta del gruppo
G e ancora l’immagine di un polinomio pj(x). Vediamo dunque che σ per-
muta solamente i polinomi qi(x). Si ponga ora f(x) = q1(x)q2(x) · · ·qs(x).Il polinomio f(x) e tale che i suoi coefficienti rimangono invariati per l’azione
di G e dunque e un polinomio in K. f(x) non ha radici multiple ed e divisibi-
le per p(x), poiche ogni pi(x) si trova tra i qj(x). Di conseguenza f(α) = 0
e dunque α e separabile su K. 2
Artin e ora in grado di mostrare quali estensioni possono essere gene-
rate mediante l’aggiunzione di un singolo elemento algebrico α. Diremo
una tale estensione semplice e l’elemento che la genera sara detto, come in
precedenza, elemento primitivo.
Teorema 12.17 (Teorema 24, Teorema di Steinitz) Una estensione E
di K, di grado finito, e semplice se e solo se possiede un numero finito di
campi intermedi.
Dimostrazione. 1. Sia E = K(α) una estensione semplice (generata da
un elelmento algebrico) e sia p(x) il polinomio irriducibile appartenente ad
α con coefficiente direttivo 1.20 Sia B un campo intermedio e sia p1(x) il
polinomio irriducibile di α in B con ancora coefficiente direttivo 1. Allora
p1(x) e un divisore di p(x), di modo che per tutti i campi intermedi B
abbiamo solo un numero finito di possibilita per il polinomio p1(x).
Sia B0 il campo intermedio che si ottiene aggiungendo a K tutti i coef-
ficienti di p1(x). Si ha B0 ⊂ B, e se riusciamo a dimostrare che B0 = B ne
segue che abbiamo solo un numero finito di possibilita per B.
A questo scopo basta dimostrare che
(E/B) ≥ (E/B0).
20p(x) e il polinomio minimo.
254
Ora p1(x) e anche un polinomio in B0 con la radice α. Poiche E = B0(α) =
B(α), si ha che (E/B0) e minore od uguale al grado di p1(x), il quale da
parte sua e uguale a (E/B).
2. Sia ora E una estensione di grado finito su K, per la quale si diano solo
solo un numero finito di campi intermedi. Facciamo l’ipotesi supplementare
che K possieda un numero infinito di elementi.21
Siano α e β due elementi di E. Per ogni c in K costruiamo l’elemento
γc = α+ cβ
e l’estensione semplice
Kc = K(γc).
Tutti i Kc sono campi intermedi. Poiche abbiamo solo un numeri finito
di campi intermedi, ma abbiamo infinite scelte possibili per l’elemento c,
esistono certamente due elementi distinti c e d in modo che sia
Kc = Kd.
Allora poche sia γc che γd sono in Kc, anche la loro differenza (c− d)β
e in Kc. Ne segue che β si trova in Kc, e poiche vi si trova di conseguenza
anche α, abbiamo
K(α,β) ⊂ Kc.
Poiche K(c) ⊂ K(α,β) si ha
K(α,β) = K(γc).
L’aggiunzione di due elementi di E a K puo dunque essere sostituita dall’aggiunzione
di un singolo elemento. Poiche E viene generato dalla aggiunzione di un nu-
mero finito di elementi (per esempio i generatori dello spazio vettoriale E
su K), ne segue che E e una estensione semplice di K. 2
21Il caso di un numero finito di elementi e considerato successivamente.
255
Capitolo 13
La Trasformata Rapida diFourier
Nel 1965 J. W. Cooley e J. W. Tukey decidono di rendere pubblico un
algoritmo che riduce drasticamente il numero di operazioni necessarie per
calcolare la Trasformata Discreta di Fourier: si tratta dell’algoritmo della
Trasformata Rapida di Fourier.1 In breve tempo l’algoritmo si rivela decisi-
vo per il progresso della matematica e della tecnologia che da essa dipende
e negli anni successivi si ha una vera e propria esplosione di lavori dedicati
alla FFT. L’algoritmo viene riproposto in innumerevoli varianti e altri al-
goritmi che riducono similmente il numero delle operazioni necessarie per il
calcolo della Trasformata Discreta vengono presentati.2
Tra questi algoritmi ve n’e uno molto semplice ed elegante, proposto
da C.M. Fiduccia,3 che, all’interno di un sistema di computer algebra, puo
1Cf. [Cooley e Tukey, 1965]. Questo fondamentale articolo e anche riprodotto in
[Tukey, 1984]. E di uso comune l’acronimo inglese: FFT (Fast Fourier Transform).2Si veda, per esempio, [Cooley, 1990], [Cipra, 1993]. In [Heideman e Burrus, 1984]
vi sono 2418 referenze. Non tutte sono relative alla FFT, ma il dato e comunque
impressionante.3Cf. [Fiduccia, 1972]. L’algoritmo e anche molto efficace. Si veda [Bernstein, 2007].
257
essere descritto ‘a vari livelli’: da un’implementazione ingenua, che operi di-
rettamente sui polinomi, ad una versione piu raffinata che utilizzi gli array.4
Mi soffermero brevemente su questo punto.
Inoltre la FFT ha costituito un interessante oggetto di indagine storica.
Pareva incredibile che un algoritmo cosı importante fosse sorto dal nul-
la. Ed in effetti questa indagine ha mostrato molti ‘precursori’, tra i quali
primeggia l’esempio illustre di Gauss.5 In effetti nelle opere di Gauss si
trova uno scritto (inedito) che contiene un risultato sull’interpolazione tri-
gonometrica che, interpretato in termini di variabile complessa, produce un
algoritmo equivalente alla FFT.6 Naturalmente questa ‘equivalenza’ produ-
ce molti interrogativi, tra i quali quello del rapporto (mutevole nel tempo)
tra il disporre ordinatamente una serie di calcoli o il ridurre, a prezzo di
una minor semplicita, il loro numero.
13.1 Qualche premessa sulla serie di Fourier
Pongo rapidamente alcune premesse sulla serie di Fourier necessarie per la
comprensione di cio che segue.7
Lo sviluppo in serie di Fourier
Sia g(x) una funzione (periodica di periodo 2π) ed integrabile su [0, 2π]. La
successione dei suoi coefficienti di Fourier {ck} e definita da
ck =1
2π
∫ 2π0
g(x) e−ikxdx, (13.1)
4Una discussione interessante (ma datata 1978) su una maniera ottimale di imple-
mentare l’agoritmo di Fiduccia si trova in [Kahaner, 1978]. Per quanto il riferimento
all’articolo di Fiduccia compaia nella bibliografia, mi sembra che l’autore ne sottova-
luti l’importanza, come se l’idea scaturisse ‘naturalmente’ dalla stessa definizione di
trasformata discreta.5Cf. [Heideman e altri, 1985], [Cooley, 1994].6Cf. [Goldstine, 1977], [Heideman e altri, 1985], [Galuzzi, 1994].7Un’introduzione rapida all’argomento si trova in [Walker, 1991].
258
per ogni intero k. La serie di Fourier e definita corrispondentemente da
g(x) ∼
∞∑−∞ cke
ikx. (13.2)
L’uso del segno ∼ indica che non necessariamente la serie a secondo membro
della (13.2) deve convergere puntualmente alla funzione.
La Trasformata Discreta di Fourier
Supponiamo di approssimare l’integrale (13.1) mediante le somme di Rie-
mann, utilizzando una suddivisione in N parti uguali di [0, 2π] e scegliendo
l’estremo sinistro in ogni intervallo della suddivisione. Abbiamo dunque i
punti
xj = j ·2π
N, j = 0, 1, . . .N− 1.
ed il calcolo approssimato conduce a
ck =1
2π
N−1∑j=0
g(xj)e−ikj 2π
N · 2πN
=1
N
N−1∑j=0
g(xj)e−ikj 2π
N . (13.3)
Poniamo
w = e−i·2πN .
Evidentemente
wN = 1
e dunque w e una radice di ordine N dell’unita. La (13.3), ponendo anche
g(xj) = aj (il che significa in pratica considerare solo un campionamento
della funzione) diviene:
ck =1
N
N−1∑j=0
aj ·wk·j =1
N
N−1∑j=0
aj · [wk]j. (13.4)
Dalla (13.4) e immediato dedurre alcune conseguenze: la linearita: se
ad {aj} associamo {ck} e ad {a ′j} associamo {c ′k}, alla combinazione lineare
{λaj + λ′a ′j} risulta associato {λck + λ
′c ′k}.
259
Altrettanto evidente e la periodicita:8 basta osservare chew e una radice
dell’unita di ordine N per avere
cN+k = ck. (13.5)
La scrittura (13.4), e l’osservazione sulla periodicita data da (13.5)
motivano la seguente definizione (per la quale trascuro il fattore N−1).
Definizione 13.1 Siano dati gli N numeri complessi
a0, a1, . . . , aN−1 (13.6)
e sia w = e−2πNi. I numeri complessi
Ak =
N−1∑j=0
aj[wk]j =
N−1∑j=0
ajwkj, k = 0, 1 . . . ,N− 1 (13.7)
costituiscono la Trasformata di Fourier Discreta (DFT) dei numeri (13.6).
Questa trasformata puo essere pensata come un’operazione che ad un vettore
[a0, a1, . . . , aN−1] associa il nuovo vettore [A0, A1, . . . , AN−1].9 ⋄
Consideriamo il polinomio
p(z) = a0 + a1z+ a2z2 + · · ·+ aN−1z
N−1. (13.8)
Evidentemente dalla Definizione 13.1 si ha
Ak = p(wk). (13.9)
In termini matriciali, la (13.9) diviene:1 1 1 . . . 1
1 w w2 . . . wN−1
1 w2 w4 . . . w2(N−1)
......
......
...
1 wN−1 . . . . . . w(N−1)(N−1)
a0
a1
a2...
aN−1
=
A0
A1
A2...
AN−1
. (13.10)
8Ovviamente la periodicita dei coefficienti ck dipende dalla tecnica di approssimazio-
ne usata. Per il calcolo concreto si assume spesso empiricamente |k| < 18N. Cfr. [Walker,
1991, pp. 39-40].9Talvolta si assume anche w = e
2πN
i.
260
La matrice che compare a sinistra del segno uguale e evidentemente la
matrice di Vandermonde
V(1,w,w2, . . . , wN−1). (13.11)
La sua inversa, come si verifica immediatamente, e data da
1
NV(1,w−1, w−2, . . . , w−(N−1)). (13.12)
Quindi la DFT inversa si ottiene con
ak =1
N
N−1∑j=0
Ajw−kj. (13.13)
Osservazione 13.1 Consideriamo il polinomio
q(z) = A0 +A1z+ · · ·+AN−1zN−1. (13.14)
Per quanto abbiamo osservato, si ha
q(w−k) = N · ak, (13.15)
e dunque il calcolo della DFT equivale al calcolo del polinomio interpolante
di grado N− 1 sugli N nodi
(w−k,N · ak), k = 0, 1, . . . ,N− 1. ⋄
13.2 La divisione fra polinomi
Supponiamo di voler valutare un polinomio p(z) in
z1, z2, . . . , zn .
Se poniamo
f(z) = (z− z1)(z− z2) · · · (z− zn),
261
dall’algoritmo della divisione abbiamo
p(z) = q(z)f(z) + r(z) (13.16)
e dunque evidentemente
p(zi) = r(zi), per i = 1, 2, . . . , n.10
Questa proprieta e importante se la natura dei polinomi p(z) e f(z) e tale
da rendere facile il calcolo di r(z). Questo succede in particolare se p(z) e
un polinomio di grado 2n− 1 e f(z) ha la forma zn − α.
Se infatti
p(z) = c0 + c1z+ · · ·+ cn−1zn−1 + cnzn + · · · c2n−2z2n−2 + c2n−1z2n−1
si ha, come si verifica immediatamente,
r(z) = (c0 + cnα) + (c1 + cn+1α)z+ · · · (cn−1 + c2n−1α)zn−1. (13.17)
Se il polinomio va diviso anche per zn + α, avremo semplicemente da
cambiare il segno di α nella (13.17).
Un caso ancor piu particolare, ma importante, e dato dal problema di
valutare un polinomio p(z) di grado 2n− 1 sulle radici di
z2n − α2 = (zn − α)(zn + α).
In questo caso dobbiamo valutare
rα(z) = (c0 + cnα) + (c1 + cn+1α)z+ · · · (cn−1 + c2n−1α)zn−1 (13.18)
10Un elogio dell’algoritmo della divisione puo sembrare fuori luogo. Mi piace pero
ricordare che la celebre Regola di Sturm che consente di conoscere il numero esatto di
radici di un’equazione polinomiale p(x) = 0 in un dato intervallo si fonda sul’algoritmo di
Euclide aplicato a p(x), p ′(x), opportunamente modificato, ossia cambiando di segno al
resto ad ogni passaggio. La Regola di Horner, per ottimizzare il calcolo di un polinomio
p(x) in x = α si ottiene semplicemente calcolandi il resto di p(x)/(x−α), ecc. L’algoritmo
di Fiduccia non e certo il solo che utilizza un’opportuna decomposizione del polinomio
zN − wN ed il calcolo di resti (si veda ad esempio [Bruun, 1978]). Mi pare pero il piu
semplice ed efficace.
262
sulle radici di zn − α e
r−α(z) = (c0 − cnα) + (c1 − cn+1α)z+ · · · (cn−1 − c2n−1α)zn−1. (13.19)
sulle radici di zn + α.
Se pensiamo in termini vettoriali, al vettore che rappresenta il polinomio
p(z)
[c0, c1, . . . , cn−1| cn, . . . , c2n−1]
viene associato il vettore ottenuto giustapponendo i due resti.
[c0+cnα, c1+cn+1α, . . . , cn−1+c2n−1α| c0−cnα, c1−cn+1α, . . . , cn−1−c2n−1α]
Questa osservazione e alla base dell’algoritmo della Trasformata Rapida
di Fourier nella versione di C. M. Fiduccia. Un esempio puo servire da
introduzione.
Esempio 13.1 Si supponga di voler valutare un polinomio p(z), di grado
7 sulle N = 8 radici dell’unita soluzioni dell’equazione z8 − 1 = 0. Sia
w = e−i2π8
Si osservi la decomposizione rappresentata dall’albero seguente
z8 −w8
z4 −w0
z2 −w0
z−w0 z−w4
z2 −w4
z−w2 z−w6
z4 −w4
z2 −w2
z−w1 z−w5
z2 −w6
z−w3 z−w7
Ad ogni ‘livello’ il prodotto dei polinomi ricostruisce il polinomio origina-
le (si noti che, in generale, se w = e−i2πN , con N pari, si ha wk+N/2 = −wk).
Si tratta dunque di dividere p(z) per z4−w0 e per z4−w4 per ottenere i due
263
primi resti. I resti cosı ottenuti vanno divisi rispettivamente per z2 − w0,
z2 −w4; z2 −w2, z2 −w6 e cosı via discendendo lungo i rami dell’albero.
Alla fine, poiche calcolare il resto della divisione di un polinomio per il
polinomio di primo grado z − wk significa semplicemente valutare il po-
linomio stesso in wk, il polinomio assegnato all’inizio si trova valutato
rispettivamente in
w0, w4, w2, w6, w1, w5, w3, w7.
Si tratta allora semplicemente di riordinare i dati ottenuti per completare il
calcolo. ⋄
Osservazione 13.2 Si noti che nella sequenza precedente quando un espo-
nente non e ‘al suo posto’, il suo valore indica dove si trova la radice ‘giusta’
e quindi quale scambio va effettuato.11 ⋄
Dalle osservazioni precedenti e facile ricavare una prima descrizione ‘qua-
litativa’ dell’algoritmo di Fiduccia. Supponiamo che siano assegnati N dati
{ak}, con k = 0, 1, . . . , N − 1, ove N = 2n, il numero di dati tipico per la
Trasformata Rapida di Fourier. Formiamo il polinomio, di grado N− 1,
N−1∑k=0
akzk (13.20)
e sia w = e−2πiN . Si tratta di organizzare progressivamente il calcolo dei
resti come suggerito dall’esempio precedente. Al primo passaggio dovremo
calcolare i resti della divisione del polinomio dato per due binomi di grado
N/2, ove w compare con gli esponenti [0,N/2], ossia per i binomi zN/2 −
w0, zN/2 −wN/2. Indichiamo questi resti con rs, rd. Al secondo passaggio i
gradi dei binomi divengono N/4 e gli esponenti sono dati da
[0,N/2, 0+N/4,N/2+N4].
Naturalmente i primi due binomi servono per calcolare due resti corrispon-
denti ad rs, che indichiamo con rss, rsd, mentre gli altri due servono per
11Questa osservazione si deduce facilmente dalle proprieta dell’algoritmo di Buneman.
Cf. [Walker, 1991, pp. 54-56]. Si veda anche [Drouiche, 2001].
264
calcolare i resti corrispondenti ad rd, ossia rds, rdd. Si procede con la stessa
logica: si dimezza il grado dei binomi e si calcola la lista di esponenti
[0,N/2,N/4,N/2+N4,N/8,N/2+N/8,N/4+N/8,N/2+N/4+N/8],
per formare i binomi e cosı via.
Un nuovo esempio che mostri il calcolo ‘concreto’ puo essere utile.
Esempio 13.2 Consideriamo il polinomio z7 + z e supponiamo di volerlo
calcolare per i valori dati da e−2πi8k, con k = 0, 1, . . . , 7. L’albero visto
nell’Esempio 1, sostituendo i valori, da:
z8 − 1
z4 − 1
z2 − 1
z− 1 z+ 1
z2 + 1
z+ i z− i
z4 + 1
z2 + i
z− 1−i√2
z+ 1−i√2
z2 − i
z+ 1+i√2
z− 1+i√2
Se utilizziamo questi polinomi per calcolare i resti successivi, abbiamo il
nuovo albero dato da
z7 + z
z3 + z
2z
2 −2
0
0 0
−z3 + z
(1+ i)z
√2 −
√2
(1− i)z
−√2
√2
Sull’ultima riga compaiono i valori richiesti, nell’ordine dato dalle radici
di esponenti [0, 4, 2, 6, 1, 5, 3, 7] ⋄
265
13.3 Verso la scrittura di un programma
Un vantaggio (didattico) dell’uso di un sistema di computer algebra12 e dato
dal fatto che ci si puo avvicinare alla scrittura efficiente di un programma
‘per gradi’. Nel caso in questione, la scrittura finale dovrebbe accettare
come input una lista di dati13 e utilizzare le manipolazioni polinomiali che
abbiamo visto, trasformandole in termini di manipolazioni successive sulla
lista originaria.
Tuttavia anche una prima implementazione in termini di polinomi, con
l’utilizzo delle procedure sui polinomi fornite dal sistema, produce un algo-
ritmo facilmente comprensibile e di discreta efficienza.
Questa prima versione dell’algoritmo e posta in appendice. Il resto del-
le divisioni non viene calcolato utilizzando una procedura che ne sfrutti la
particolarita, ma semplicemente usando la funzione rem. Ovviamente as-
segnando i polinomi come liste di coefficienti ed utilizzando una procedura
apposita per il calcolo del resto si ottiene un programma piu efficiente. An-
che questa seconda versione e posta in appendice. Ho anche aggiunto due
versioni ricorsive dell’agloritmo di Cooley e Tukey.
13.4 Conclusione
Per concludere questo capitolo, voglio indicare alcune direzioni di ricerca
che mi sembra possano condurre a risultati vallidi.
• In primo luogo mi pare interessante saggiare la effettiva corrispon-
denza tra l’algoritno di Gauss e la moderna FFT di Cooley e Tukey.
Certo, l’utilizzo della variabile complessa, unito ad un po’ di pazien-
za nel riscrivere i calcoli, puo condurre effettivamenre ad individuare
algoritmi molto simili. Ma questa somiglianza e un’effettiva identita
o si tratta di una ‘modernizzazione’ storicamente poco significativa?
Non mancano esempi (come l’uso acritico dell’algebra geometrica per
leggere i testi greci) ove queste letture modernizzanti portano anche
a risultati di valore discutibile.
12Il sistema che utilizzo e Maple nella versione 13.13O un array.
266
• Quando e come il puro conteggio del numero delle operazioni arit-
metiche fa aggio su una disposizione dei calcoli piu onerosa ma ben
ordinata e trasparente? Sarebbe assai interessante vedere le tecniche
utilizzate nei vari osservatori trigonometrici. Qual e poi il ruolo del
computer in questa vicenda?
• Quali usi ha avuto la FFT e quale rilevanza nello sviluppo della
moderna tecnologia legata all’elettronica?14
• Infine, credo che l’analisi, dal punto di vista storico, dell’evoluzione
degli algoritmi piu significativi legati alla FFT ed alla sempre maggiore
flessibilita dei linguaggi di programmazione possa fornire molti spunti
interessanti di ricerca.15
14Mi limito a citare [Prestini, 2004].15La Trasformata di Hartley (si veda [Bracewell, 1986], [Peyre, 2004, Cap. V]), che
opera come la FFT, utilizzando pero solo valori reali, e certamente di grande importanza
quando si ha a che fare con dei segnali reali. Ma da quando i principali linguaggi di
programmazione possono utilizzare liberamente i numeri complessi si puo immaginare
che tenda ad avere avere un rilievo minore in altri casi.
267
13.5 Appendice: alcuni programmi
L’algoritmo di Fiduccia utilizzando direttamente i polinomi e le operazioni
su di essi. Naturalmente non si puo avere una prestazione ottimale.
FFT_pol:=proc(p,z)
local N,e,R,w,j,n,k,e,Q,r1,r2,i,temp;
N:=degree(p,z); # p deve essere un polinomio di grado 2^n-1,
e:=array(0..N,fill=0]);
R:=Array(0..N,[p]);
w:=exp(-2*Pi*I/(N+1)); # La prima radice dell’unita di ordine 2^n,
# in senso anti-orario.
j:=1;
while j<N do
n:=(N+1)/(2*j);
for k from 0 to j-1 do # Calcolo degli esponenti necessari.
e[k+j]:=e[k]+n;
od;
Q:=map(t->z^n-w^t,P); # I polinomi necessari per le divisioni.
for i from j-1 to 0 by -1 do
r1:=rem(R[i],Q[2*i],z); r2:=rem(R[i],Q[2*i+1],z);
R[2*i]:=r1; R[2*i+1]:=r2;
od;
j:=2*j;
od;
# Riordino dei dati.
for i from 1 to N-1 do # Il primo e l’ultimo elemento
# sono gia al loro posto.
if e[i] > i then
temp:=R[i];
R[i]:=R[e[i]];
R[e[i]]:=temp;
fi; od;
convert(R,list);
end:
268
Un programma meno ingenuo: nell’Array x vengono progressivamente
sostituiti ai dati iniziali i valori calcolati della FFT.
FFT:=proc(x)
local N,n,w,i,j,k,l,temp,a;
N:=ArrayNumElems(x)-1;
l:=Array(0..N,fill=0);
w:=evalf(2*Pi/(N+1));
j:=1;
while j < N do
n:=1/2*(N+1)/j;
for k from 0 to j-1 do
l[k+j]:=l[k]+n;
a:=l[2*k]*w;
for i from 2*k*n to (2*k+1)*n-1 do
temp:=x[i+n]*(cos(a)-I*sin(a));
x[i+n]:=x[i]-temp; x[i]:=x[i]+temp
od
od;
j:=2*j
od;
for i to N-1 do
if i<l[i] then temp:=x[i];
x[i]:=x[l[i]]; x[l[i]]:= temp
fi
od;
end:
269
La versione ricorsiva di Cooley e Tukey si basa sulle osservazioni se-
guenti. Consideriamo il polinomio p(z) =∑2n−1
k=0 akzk. Possiamo riscriverlo
nella forma
p(z) =
n−1∑k=0
a2kz2k + z
n−1∑k=0
a2k+1z2k. (13.21)
Introduciamo i due polinomi ausiliari
p0(Z) =
n−1∑k=0
a2kZk, p1(Z) =
n−1∑k=0
a2k+1Zk (13.22)
e sia w = e−2πi2n , u = w2. Si ha allora
p(wj) = p0(ujk) +wjp1(u
jk). (13.23)
Inoltre wj+n = −wj. Il calcolo del polinomio p(z) sulle radici dell’unita di
ordine 2n si riconduce quindi al calcolo di due polinomi sulle radici di ordine
n e, dopo le opportune moltiplicazioni per wj, per j = 0, 1, . . . , n−1, ad una
somma e ad una differenza. Il programma seguente utilizza direttamente i
polinomi (di grado 2n − 1), e gia risulta discretamente efficiente.
CooleyTukey:=proc(p,z,d)
local d1,p0,p1,q0,q1,w;
if d<=0 then return p end if;
d1:=(1/2)*d-1/2;
p0:=add(coeff(p,z,2*k)*z^k,k=0..d1);
p1:=add(coeff(p,z,2*k+1)*z^k,k=0..d1);
q0:=CooleyTukey(p0,z,d1);
q1:= CooleyTukey(p1,z,d1);
w:=evalf(exp(-(2*I)*Pi/(d+1)));
q1:=subs(z=w*z,q1);
sort(collect(evalf(q0+q1+z^((1/2)*d+1/2)*(q0-q1)), z), z)
end:
270
Ovviamente questa versione, che utilizza le liste, e assai piu efficiente.
CooleyTukey:=proc(y)
local n,u,v,c,w,ypari,ydispari,omega;
n:=nops(y);
if n=1 then return y; fi; # fine ricorsione
omega:=exp(-2*Pi*sqrt(-1)/n); # radici dell’unita’
w:=[seq(evalf(omega^p),p=0..(n/2)-1)];
ypari:=[seq(y[2*j],j=1..n/2)];
ydispari:=[seq(y[2*j-1],j=1..n/2)];
u:=CooleyTukey(ydispari);
v:=zip((x,y)->x*y,w,CooleyTukey(ypari));
c:=[op(u)+op(v),op(u)-op(v)];
end:
271
Bibliografia
Al-Khwarizmı (2007). Le commencement de l’algebre. Blanchard, Paris.
Texte etabli, traduit et commente par R. Rashed.
Alesina A.; Galuzzi M. (1998). A new proof of Vincent’s theorem.
L’Enseignement mathematique, 44, 219–256.
Apollonius (1923). Les Coniques d’Apollonius de Perge, Livres I–IV. De-
sclee, de Brouwer et Cie, Bruges. Tradution, avec une introduction et des
notes par P. Ver Eecke.
Apollonius (1990). Conics. Books V to VII. Springer-Verlag, New York.
Edited with Translation and Commentary by G. J. Toomer.
Apollonius (2008a). Coniques, volume 1.1: Livre I. Walter de Gruyer,
Berlin-New York.
Apollonius (2008b). Coniques, volume 1.2: Livre I. Walter de Gruyer,
Berlin-New York.
Archimede (1974). Opere. Utet, Torino. A cura di A. Frajese.
Artin E. (1942). Galois Theory. Notre Dame Lectures, University of Notre
Dame Press.
Artin E. (1944). Galois Theory. Notre Dame Lectures, University of Notre
Dame Press. Second revised edition.
273
Artin E. (1988). Galoissche Theorie. Verlag Harri Deutsch, Thun. German
translation by V. Ziegler.
Auffray J.-P. (2004). Evariste. Aleas, Lyon.
Ballieu M. (1942). Sur le developpement des irrationnelles quadratiques en
fractions continues regulieres. Mathesis, 54, 304–314.
Barozzi F. (1586). Admirandum illud geometricum problema tredecim modis
demonstratum. Apud Gratiosum Perchacinum, sumptibus Io. Baptistae
Fantini Patavini, Venetiis. Edited by L. Maieru, Bologna, 1991.
Bernstein D. J. (2007). The tangent FFT. In Boztas e Hsiao-feng Lu [2007],
pp. 291–300.
Bewersdorff J. (2006). Galois Theory for Beginners. A Historical
Perspective. AMS Chelsea publishing, Providence, Rhode Island.
Bombelli R. (1966). Algebra. Feltrinelli, Milano. Prima edizione integrale
a cura di E. Bortolotti.
Bombieri E.; van der Poorten A. J. (1995). Continued fractions of algebraic
numbers. In Computational Algebra and Number Theory. Sydney, 1992,
Math. Appl. 325, pp. 137–152, Dordrecht. Kluwer Acad. Publ.
Borges J. L. (1978). Finzioni. Einaudi, Torino. Traduzione italiana di F.
Lucentini.
Bos H. J. M. (2001). Redefining Geometrical Exactness. Descartes’ Tran-
sformation of the Early Modern Concept of Construction. Springer, New
York etc.
Bourdon L. P. M. (1831). Elemens d’Algebre. Bachelier pere et fils, Paris.
Boztas S.; Hsiao-feng Lu, (A cura di) (2007). Applied Algebra, Algebraic
Algorithms and Error-Correcting Codes, 17th International Symposium,
AAECC-17, volume 4851 di Lecture Notes in Computer Science. Springer.
Bracewell R. (1986). The Hartley Transform. The Clarendon Press, Oxford
University Press, Oxford, New York.
274
Brigham E. O. (1974). The Fast Fourier Transform. Prentice-Hall, New
Jersey.
Brown J. D.; Chu M. T.; Ellison D. C.; Plemmons R. J., (A cura di)
(1994). Proceedings of the Cornelius Lanczos international Centenary
Conference, Philadelphia, PA. SIAM.
Bruun G. (1978). z-Transform DFT Filters and FFT’s. IEEE Transactions
on Acoustic, Speech and Signal Processing, 26(1), 56–63.
Camilleri A. (2000). Un filo di fumo. Sellerio, Palermo. Tredicesima
edizione.
Cauchy A. L. (1815a). Memoire sur la determination du nombre des racines
reelles dans les equations algebriques. Journal de le Ecole Polytechnique,
10, 1–28. Œuvres (2), 1, 170-257.
Cauchy A. L. (1815b). Memoire sur le nombre des valeurs qu’une fonction
peut acquerir lorsqu’on y permute de toutes les manieres possibles les
quantites qu’elle renferme. Journal de L’Ecole Polytechnique, 10, 1–28.
Œ uvres, (2), 1, pp. 64-90.
Cauchy A. L. (1821). Analyse Algebrique. Chez Debure freres, Paris.
Riproduzione anastatica (J. Gabay, 1989).
Cauchy A. L. (1829). Sur la resolution des equations numeriques et sur la
theorie de l’elimination. Exercises de Mathematiques. Œuvres, 2nd series,
9, 87–161.
Cauchy A. L. (1845). Sur le nombre des valeurs egales ou inegales que peut
acquerir une fonction de n variables independantes, quand on permute
ces variables entre elles d’une maniere quelconque. Compte Rendus, pp.
779–797. Œuvres, (1), 9, pp. 323-341.
Chemla K.; Shuchun G., (A cura di) (2004). Les Neuf Chapitres, Paris.
Dunod.
Christianidis J., (A cura di) (2004). Classics in the History of Greek
Mathematics, Dordrecht, Boston, London. Kluwer Academic Publishers.
275
Cipra B. A. (1993). The FFT: making Technology fly. Siam News, 26(3),
pp. 1, 23.
Conway J. H.; Guy R. (1999). Il libro dei numeri. Hoepli, Milano.
Traduzione italiana di A. Zaccagnini.
Cooley J. W. (1990). How the FFT gained Acceptance. In Nash [1996], pp.
133–140.
Cooley J. W. (1994). Lanczos and the FFT; a Discovery before its Time.
In Brown e altri [1994], pp. 3–9.
Cooley J. W.; Tukey J. W. (1965). An Algorithm for the Machine Calcu-
lation of Complex Fourier series. Mathematics of computations, 19(2),
297–301.
Cossali P. (1996). La storia del caso irriducubuke. Istituto veneto di scienze
lettere ed arti, Venezia. Trascrizione, introduzione e note a cura di R.
Gatto.
Croce B. (1909). Logica come scienza del concetto puro. Laterza, Bari.
Seconda edizione interamente rifatta.
Croce B. (1976). Teoria e storia della storiografia. Laterza, Bari.
Undicesima edizione.
De Nuccio S. (2001). Le frazioni continue aritmetiche e le radici di
un’equazione algebrica di 2o grado. Una memoria di E. Galois. Periodico
di matematiche, 1(2), 45–63.
De Pace A. (1993). Le matematiche e il mondo. Ricerche su un dibattito in
Italia nella seconda meta del Cinquecento. FrancoAngeli, Milano.
Descartes R. (1659–61). Geometria a Renato Descartes anno 1637 Gallice
edita; postea autem Una cum Notis Florimondi De Beaune [. . . ]. Opera
atque Studio Francisci a Schooten[. . . ]. Apud Ludovicum & Danielem
Elzevirios, Amstelædami.
276
Descartes R. (1954). The Geometry of Rene Descartes with a Facsimile
of the first Edition. Dover, New York. Translated from the French and
Latin by D. E. Smith and M. L. Latham.
Dieudonne J. (1986). Abrege d’histoire des mathematiques. Hermann, Paris.
Dirichlet P. G. L. (1881). Lezioni sulla teoria dei numeri. Tipografia Emi-
liana. Con le appendici di R. Dedekind. Tradotte dalla terza edizione da
A. Faifofer.
Dirichlet P. G. L. (1894). Vorlesungen uber Zahlentheorie. Druck und Verlag
von Friedrich Vieweg und Sohn, Braunschweig. Herausgegeben und mit
Zusatzen versehen von R. Dedekind. Vierte umgearbeitete und vermehrte
Auflage.
Drouiche K. (2001). A New Efficient Computational Algorithm for Bit
Reversal Mapping. IEEE Transactions on Signal Processing, 49(1), 251–
254.
Edwards H. M. (1984). Galois Theory. Springer-Verlag, New York, etc.
Euclid (1956). The thirteen Books of the Elements. Dover, New York.
Second edition, revised by Additions. Introduction and Commentary by
Sir Thomas Heath.
Euclide (1970). Elementi. Utet, Torino. Traduzione italiana a cura di A.
Frajese e L. Maccioni.
Euclide (1990-2001). Les Elements. Presses Universitaires de France, Pa-
ris. Introduction par Maurice Caveing. Traduction et commentaires par
Bernard Vitrac.
Euler L. (1770 (1771)). Observationes circa radices aequationum. Novi
commentarii academiae scientiarum Petropolitanae, 15, 51–74. Opera
omnia (1) ,6, 263-286.
Euler L. (1774 (1773)). Elemens d’algebre. J.-M. Bruset, Lyon. Traduction
francaise.
277
Euler L. (1988). Introduction to the Analysis of the infinite. Springer-Verlag,
New York. English translation by J.D. Blanton.
Fermat P. d. (1891-1922). Œuvres de Fermat. Gauthier-Villars, Paris.
Publiees par les soins de MM. Paul Tannery et Charles Henry sous les
auspices du Ministere de l’instruction publique.
Ferrara F.; Giacardi. L.; Mosca M., (A cura di) (2009). Conferenze e
Seminari dell’Associazione Subalpina Mathesis. 2008-2009, Torino. Kim
Williams Books.
Fiduccia C. M. (1972). Polynomial evaluation via the division algori-
thm. The Fast Fourier Transform revisited. In Proc. 4th Annual ACM
Symposium on the Theory of Computing, pp. 88–93.
Fowler D. H. (1987). The mathematics of Plato’s Academy. ClarendonPress,
Oxford.
Freguglia P. (1999). La geometria fra tradizione e innovazione. Bollati
Boringhieri, Torino.
Fried M. N.; Unguru S. (2001). Apollonius of Perga’s Conica. Text, Context,
Subtext. Brill, Leiden - Boston - Koln.
Friedlein G. (1873). Procli Diadochi in primum Euclidis elementorum
librum commentarii. Teubner, Leipzig.
Funkhouser H. G. (1930). A short account of the history of symmetric
functions of roots of equations. The American mathematical monthly,
37, 357–365.
Galois E. (1976). Ecrits et memoires mathematiques d’Evariste Galois.
Gauthier-Villars, Paris. Publies par R. Bourgne et J. P. Azra. Prefa-
ce de J. Dieudonne. Deuxieme edition revue et augmente. Reimpression
autorisee, Editions J. Gabay, 1997.
Galuzzi M. (1994). L’interpolazione trigonometrica in Gauss, Bessel e Cau-
chy In Scritti in onore di Giovanni Melzi. A cura di Manara C., Faliva
G., Marchi M., pp. 173–212. Vita e Pensiero, Milano.
278
Galuzzi M. (2001a). Galois’ note on the approximative solution of numerical
equations (1830). Archive for history of exact sciences, 56, 29–37.
Galuzzi M. (2001b). L’esattezza in Cartesio. Lettera matematica, 41, 58–60.
Galuzzi M. (2002). Descartes e la geometria analitica. Bollettino della
Sezione Mathesis di Milano, 9, 18–34.
Galuzzi M. (2009). La Memoria di Galois sulle frazioni continue. In Ferrara
e altri [2009], pp. 127–136.
Galuzzi M.; Rovelli D. (1997). Storia della geometria e didattica: qualche
osservazione. In Quaderno 19/2 del Ministero della Pubblica Istruzione.
L’insegnamento della geometria, pp. 70–110. Liceo scientifico statale A.
Vallisneri, Lucca.
Gauss C. F. (1801). Disquisitiones arithmeticae. In commissis apud
Gerh.Flesicher, Jun., Lipsiae.
Gauss C. F. (1807). Recherches Arithmetiques. Courcier, Paris. Traduites
par A.- C.- M. Poullet-Delisle. Editions Jacques Gabay, 1989.
Gauss C. F. (1816). Demonstratio nova altera theoremati omnem functio-
nem algebraicam rationalem integralem unius variabilis in factores reales
primi vel secundi gradus resolvi posse. Commentationes societatis regiae
scientiarum Gottingensis recensiores, 3. In Werke, 3, 32–56.
Goldman J. R. (2002). The Queen of Mathematics. A K Peters, Natick,
Massachusetts.
Goldstine G. H. (1977). A History of numerical Analysis from the 16th
through the 19th Century. Studies in the History of Mathematics and
Physical Sciences, vol. 2. Springer-Verlag, New York-Heidelberg.
Gould H. W. (1972). Combinatorial Identities. Morgantown, W. Va.
Guicciardini N. (2009). Isaac Newton on Mathematical Certainty and
Method. MIT Press, Cambridge, Mass.
279
Hardy G. H.; Wright E. M. (1971). An Introduction to the Theory of
Numbers. Oxford University Press, Oxford. Fourth edition.
Heath T. L. (1896). Apollonius of Perga. Treatise on Conic Sections. Edited
in modern notation with introductions including an essay on the earlier
history of the subject by T.L. Heath. Cambridge at the University Press,
Cambridge.
Heideman M. T.; Burrus C. S. (1984). A Bibliography of Fast Transform and
Convolution Algorithms ii. Relazione tecnica, Rice University. Technical
Report Number 8402.
Heideman M. T.; Johnson D. H.; Burrus C. S. (1985). Gauss and the History
of the Fast Fourier Transform. Archive for history of exact sciences, 34,
265–277.
Henrici P. (1964). An algebraic proof of the Lagrange-Burman formula.
Journal of mathematical analysis and applications, 8, 218–224.
Herstein I. N. (1982). Algebra. Editori Riuniti, Roma. Traduzione italiana
di A. Machı.
Hintikka J.; Remes U. (1974). The Method of Analysis. D. Reidel Publishing
Company, Dordrecht - Boston.
Hurwitz A. (1902). uber Abel’s Verallgemeinerung der binomischen Formel.
Acta Mathematica, 26, 199 – 203.
Jordan C. (1870). Traite des substitutions et des equations algebriques.
Gauthier-Villars, Paris. Editions Jacques Gabay, 1989.
Kahaner D. K. (1978). The fast Fourier transform by polynomial evaluation.
Zeitschrift fur angewandte Mathematik und Physik, 29, 387–394.
Kaplansky I. (1972). Fields and Rings. The University of Chicago Press,
Chicago and London. Second edition.
Kiernan B. M. (1971-1972). The development of Galois theory from
Lagrange to Artin. Archive for history of exact sciences, 8, 40–154.
280
Kline M. (1991). Storia del pensiero matematico. Edizione italiana a cura
di A. Conte, 2 volumi, Einaudi, Torino.
Knorr W. R. (1975). Evolution of the Euclidean Elements. Reidel,
Dordrecht.
Lagrange J.-L. (1768). Nouvelle methode pour resoudre les equations litte-
rales par le moyen des series. Histoire de l’Academie Royale des Sciences
et Belles-Lettres (de Berlin), 24, 251–326. Œuvres 3: 5-73.
Lagrange J.-L. (1769). Sur le probleme de Kepler. Histoire de l’Academie
royale des Sciences et des Belles–Lettres (Berlin), 25 (1771), 204–233.
Lagrange J.-L. (1770). Reflexions sur la resolution algebrique des equations.
Memoires de l’Academie royale des sciences et Belles-Lettres de Berlin,
pp. 205–421. Publie dans 1772. Œuvres, 3, 205-421.
Lagrange J.-L. (1808). Traite de la resolution des equations numeriques de
tous les degres. Courcier, Paris. Nouvelle edition revue et augmentee par
l’auteur.
Lagrange J.-L. (1826). Traite de la resolution des equations numeriques de
tous les degres. Bachelier, Paris.
Lagrange J.-L. (1847). Theorie des fonctions analytiques, troisieme edition.
Bachelier, imprimeur-libraire, Paris. Œuvres 9, pp. 11– 421.
Lagrange J.-L. (1867–1879). Œuvres. Gauthier-Villars, Paris.
Laplace P. S. (1777(1780)). Memoire sur l’usage du calcul aux differences
partielles dans la theorie des suites. Memoires de l’Academie Royale des
Sciences de Paris. Œuvres, 9, pp. 313-335.
Laplace P. S. (1779). Memoire sur l’usage du calcul aux differences partielles
dans la theorie des suites. Memoires de l’academie Royale des Sciences
de Paris. Œuvres 10, pp. 1-89.
Legendre A.-M. (1798). Essai sur la theorie des nombres. Chez Duprat
Libraire, Paris.
281
Livio M. (2003). La sezione aurea. Rizzoli, Milano. Traduzione italiana di
S. Galli.
Lorentzen L.; Waadeland H. (1992). Continued fractions with applications.
North-Holland, Amsterdam -London - New York - Tokio.
Loria G. (1923). Da Descartes e Fermat a Monge e Lagrange. Contributo
alla storia della geometria analitica. Reale Accademia dei Lincei. Atti.
Memorie della classe di scienze matematiche fisiche e naturali (5), 14,
777–485.
Loria G. (1938). Charles Sturm et son œuvre mathematique (1803-1855).
L’Enseignement mathematique, 37, 249–274.
Loria G. (1950). Storia Delle Matematiche. Hoepli, Milano. Ristampa
anastatica, Istituto Editoriale Cisalpino-Goliardica, Milano, 1982.
Maclaurin C. (1748). Treatise of algebra. A. Millar and J. Nourse, London.
Maieru L. (2007). John Wallis. Una vita per un progetto. Rubbettino,
Soveria Mannelli.
Mignosi G. (1925). Teorema di Sturm e sue estensioni. Rendiconti del
Circolo Matematico di Palermo, 49, 1–164. Un lungo articolo di carattere
parzialmente storico sugli sviluppi del teorema di Sturm.
Mignotte M.; Stefanescu D. (1999). Polynomials. An Algorithmic Approach.
Springer, Singapore, Berlin, ecc.
Mugler C. (1958). Dictionnaire historique de la terminologie geometrique
des grecs. Librairie C. Klincksieck, Paris.
Murnaghan F. D. (1931). A simple derivation of Waring’s formulae. The
American mathematical monthly, 38, 219–222.
Nash S. G. (1996). A History of scientific Computing. Addison – Wesley,
Reading, Massachusetts.
282
Newton I. (1964). The Mathematical Works of Isaac Newton, edited by D.
T. Whiteside, volume 1. Johnson Reprint Corporation, New York and
London.
Newton I. (1967-1981). The Mathematical Papers of Isaac Newton, edited
by D. T. Whiteside. Cambridge University Press, Cambridge.
Olds C. D. (1968). Frazioni continue. Zanichelli, Bologna. Traduzione
italiana a cura di F. Speranza.
Otte M.; Panza M., (A cura di) (1997). Analysis and Synthesis in
Mathematics. History and Philosophy, Dordrecht, Boston, London.
Kluwer.
Panza M. (1997). Classical Sources for the Concepts of Analysis and
Synthesis. In [Otte e Panza, 1997].
Panza M. (2005). Newton et les origines de l’analyse: 1664-1666.
Blanchard, Paris.
Pappus (1982). La Collection mathematique, avec une Introduction et
des notes par Paul Ver Eecke. Nouveau tirage, Librairie scientifique et
technique Albert Blanchard, Paris.
Petsinis T. (1997). The French mathematician. Walker and Company, New
York.
Peyre G. (2004). L’algebre discrete de la transformee de Fourier. Ellipses,
Paris.
Pirandello L. (1937–38). Novelle per un anno. Mondadori, Milano. In 2
volumi. Comprende tutti i volumi dell’edizione Bemporad-Mondadori.
Pirandello L. (1993). La mosca. Mondadori, Milano. A cura di Simona
Costa.
Prasolov V. V. (2004). Polynomials. Springer, Berlin, etc. Translated from
the Russian by Dimitry Leites.
283
Prestini E. (2004). Applied Harmonic Analysis. Birkhauser, Boston, Basel,
Berlin.
Proclo (1978). Commento al I libro degli Elementi di Euclide. Giardini
Editori e Stampatori, Pisa. A cura di M. Timpanaro Cardini.
Radloff I. (2002). Evariste Galois: principles and applications. Historia
Mathematica, 29, 114–137.
Riordan J. (1968). Combinatorial identities. New York.
Rockett A. M.; Szus P. (1992). Continued Fractions. World Scientific,
Singapore, ecc.
Rothman T. (1982). Genius and biographers: the fictionalization of Evariste
Galois. American Mathematical Monthly, 89, 84–106.
Rotman J. (1998). Galois Theory. Springer-Verlag, New York, ecc. Second
edition.
Scharlau W., (A cura di) (1981). Richard Dedekind 1831-1981. Eine
Wurdigung zu seinem 150. Geburtstag, Braunschweig. F. Vieweg und
Sohn.
Scimone A. (1997). La sezione aurea. Sigma edizioni, Palermo.
Serfati M. (2005). La revolution symbolique. La constitution de l’ecriture
symbolique mathematique. Petra, Paris.
Serret J.-A. (1877). Cours d’algebre superieure, volume 1. Gauthier-Villars,
Paris. Quatrieme edition. Editions Jacques Gabay, 1992.
Serret J.-A. (1879). Cours d’algebre superieure, volume 2. Gauthier-Villars,
Paris. Quatrieme edition. Editions Jacques Gabay, 1992.
Sinaceur H. (1991). Corps et modeles. Vrin, Paris.
Stillwell J. (2002). Mathematics and its History. Springer, New York, etc.
284
Sturm C. (1835). Memoire sur la resolution des equations numeriques.
Memoires presentes par divers savans a l’Academie royale des Sciences
de l’Institut de France, VI, 273–318.
Tignol J.-P. (2001). Galois’ Theory of algebraic Equations. World Scientific,
River Edge, NJ.
Toti Rigatelli L. (1996). Evariste Galois. Birkhauser Verlag, Basel.
Translated from the Italian by John Denton.
Tukey J. W. (1984). The Collected Works of John W. Tukey. Volume
II: Time Series, 1965-1984. Wadsworth Advanced books & Software,
Monterey, California.
Unguru S. (1975). On the Need to rewrite the History of Greek
Mathematics. Archive for history of exact sciences, 15, 67–114.
van der Waerden B. L. (1930). Moderne Algebra, volume 1. Springer, Berlin.
van der Waerden B. L. (1931). Moderne Algebra, volume 2. Springer, Berlin.
van der Waerden B. L. (1972–73). Die Galois-Theorie von Heinrich Weber
bis Emil Artin. Archive for history of exact sciences, 9, 240–248.
van der Waerden B. L. (1991). Algebra. Springer-Verlag, New York, ecc.
English translation by F. Blum and R. Schulenberger.
Walker J. S. (1991). Fast Fourier Transforms. CRC Press, Boca Raton etc.
Waring E. (1770). Meditationes algebraicae. J. Archdeacon, Cambridge.
Waring E. (1991). Meditationes algebricae. American Mathematical Society,
Providence, Rhode Island. English translation by D. Weeks.
Weber H. (1895). Lehrbuch der Algebra. F. Vieweg und Sohn, Braunschweig.
Erster Band.
Weil A. (2002). Storia della matematica: perche e come. Collana LI-
DIM del Dipartimento di Matematica dell’Universita di Milano, 4, 1–30.
Introduzione e traduzione italiana a cura di M. Galuzzi.
285
Whiteside D. T. (1961). Newton’s Discovery of the General Binomial
Theorem. The mathematical Gazette, 16, 175–180.
Wilf H. S. (1994). Generatingfunctionology. Academic Press, Inc., Boston,
ecc.
Zeuthen H. G. (1886). Die Lehre von den Kegelschnitten in Altertum. Andr.
Fred. Host & Sohn, Kopenhagen.
Zhmud L. (2006). The Origin of the History of Science in Classical Anti-
quity. Walter de Gruyter, Berlin/New York. Translated from the Russian
by A. Chernoglazov.
286