+ All Categories
Home > Documents > Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux...

Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux...

Date post: 08-Feb-2019
Category:
Upload: vuongkiet
View: 219 times
Download: 0 times
Share this document with a friend
259
Indice 1 Breve storia delle notazioni 3 1.1 ax 2 + bx + c =0 ........................... 3 2 Meno per meno fa pi` u 15 2.1 I numeri negativi ........................... 17 2.2 Compensazioni ............................ 27 2.3 Una singolarit` a: Gottfried Wilhelm Leibniz ............ 39 2.4 Il ruolo dello zero ........................... 41 2.5 Una proporzione “terribile” ..................... 48 2.6 Il carattere convenzionale della regola ............... 53 2.7 Abbasso il segno -! .......................... 56 2.8 Il principio di permanenza delle propriet` a formali ......... 61 2.9 Regola dei segni senza numeri negativi ............... 69 2.10 Analogie con la regola dei segni ................... 71 3 Problemi di secondo grado 79 3.1 Euclide e l’algebra che non c’` e .................... 79 3.2 Il Libro X degli Elementi ...................... 84 3.3 Le equazioni di secondo grado attraverso la storia ......... 86 4 Equazioni di terzo e quarto grado 103 4.1 Problemi di terzo grado nella matematica greca .......... 103 4.2 Problemi di terzo grado in Diofanto ................ 105 4.3 Problemi di terzo grado in Omar Khayyam ed in matematici arabi106 4.4 Problemi di terzo grado nel Medioevo ............... 110 4.5 La formula risolutiva delle equazioni di terzo grado ........ 113 4.6 Bombelli e la nascita dei numeri complessi ............. 119 4.7 Equazioni di quarto grado ...................... 124 4.8 Appendice I .............................. 127 4.9 Appendice II ............................. 130 4.10 Appendice III ............................. 131 1
Transcript
Page 1: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Indice

1 Breve storia delle notazioni 3

1.1 ax2 + bx+ c = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Meno per meno fa piu 15

2.1 I numeri negativi . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Compensazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3 Una singolarita: Gottfried Wilhelm Leibniz . . . . . . . . . . . . 39

2.4 Il ruolo dello zero . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.5 Una proporzione “terribile” . . . . . . . . . . . . . . . . . . . . . 48

2.6 Il carattere convenzionale della regola . . . . . . . . . . . . . . . 53

2.7 Abbasso il segno -! . . . . . . . . . . . . . . . . . . . . . . . . . . 56

2.8 Il principio di permanenza delle proprieta formali . . . . . . . . . 61

2.9 Regola dei segni senza numeri negativi . . . . . . . . . . . . . . . 69

2.10 Analogie con la regola dei segni . . . . . . . . . . . . . . . . . . . 71

3 Problemi di secondo grado 79

3.1 Euclide e l’algebra che non c’e . . . . . . . . . . . . . . . . . . . . 79

3.2 Il Libro X degli Elementi . . . . . . . . . . . . . . . . . . . . . . 84

3.3 Le equazioni di secondo grado attraverso la storia . . . . . . . . . 86

4 Equazioni di terzo e quarto grado 103

4.1 Problemi di terzo grado nella matematica greca . . . . . . . . . . 103

4.2 Problemi di terzo grado in Diofanto . . . . . . . . . . . . . . . . 105

4.3 Problemi di terzo grado in Omar Khayyam ed in matematici arabi106

4.4 Problemi di terzo grado nel Medioevo . . . . . . . . . . . . . . . 110

4.5 La formula risolutiva delle equazioni di terzo grado . . . . . . . . 113

4.6 Bombelli e la nascita dei numeri complessi . . . . . . . . . . . . . 119

4.7 Equazioni di quarto grado . . . . . . . . . . . . . . . . . . . . . . 124

4.8 Appendice I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.9 Appendice II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

4.10 Appendice III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

1

Page 2: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2 INDICE

5 Viete e Descartes 135

5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1355.2 Il metodo di Viete . . . . . . . . . . . . . . . . . . . . . . . . . . 1365.3 Soluzioni trigonometriche di equazioni algebriche . . . . . . . . . 1425.4 Risoluzione numerica delle equazioni algebriche in Viete . . . . . 1445.5 Le Formule di Viete-Girard . . . . . . . . . . . . . . . . . . . . . 1455.6 L’algebra in Cartesio . . . . . . . . . . . . . . . . . . . . . . . . . 1495.7 Storia della regola dei segni di Cartesio . . . . . . . . . . . . . . . 153

6 Il teorema fondamentale dell’algebra 165

6.1 Le prime formulazioni . . . . . . . . . . . . . . . . . . . . . . . . 1656.2 Un problema di analisi . . . . . . . . . . . . . . . . . . . . . . . . 1686.3 Eulero e il TFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1716.4 D’Alembert ed il TFA . . . . . . . . . . . . . . . . . . . . . . . . 1766.5 La prima dimostrazione di Gauss . . . . . . . . . . . . . . . . . . 1796.6 La terza dimostrazione di Gauss . . . . . . . . . . . . . . . . . . 185

7 Metodi generali di risoluzione: Lagrange e Vandermonde 191

7.1 Lagrange e la risoluzione algebrica delle equazioni . . . . . . . . . 1917.2 Il metodo di Tschirnhaus . . . . . . . . . . . . . . . . . . . . . . 1977.3 La risolvente di Lagrange . . . . . . . . . . . . . . . . . . . . . . 1997.4 Vandermonde e le equazioni ciclotomiche . . . . . . . . . . . . . . 2017.5 Appendice I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2067.6 Appendice II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

8 Il teorema di Ruffini-Abel 211

8.1 Paolo Ruffini e la risolubilita delle equazioni algebriche . . . . . . 2118.2 Cronaca delle dimostrazioni di Ruffini . . . . . . . . . . . . . . . 2138.3 Schema della dimostrazione del 1813 . . . . . . . . . . . . . . . . 215

9 L’opera di Evariste Galois 223

9.1 Galois tra realta e mito . . . . . . . . . . . . . . . . . . . . . . . 2239.2 Opere minori di Galois . . . . . . . . . . . . . . . . . . . . . . . . 2279.3 Struttura della Memoire di Galois . . . . . . . . . . . . . . . . . 232

10 La trasformazione di Bring e Jerrard 253

Page 3: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 1

Breve storia delle notazioni

1.1 ax2 + bx+ c = 0

Il titolo un po’ criptico di questa sezione serve a mettere in luce un aspettoforse sottovalutato: l’importanza di un’adeguata notazione nello sviluppo di unsettore della matematica. La storia delle equazioni algebriche e una palestraricca di spunti perche permette di studiare l’evoluzione di notazioni che oggisono divenute a tutti familiari. E forse questo il momento per richiamare unacelebre distinzione in tre fasi dello sviluppo dell’algebra, dovuta al matematicoed orientalista tedesco Georg Heinrich Ferdinand Nesselman (1811-1881) chedivideva l’algebra in retorica, sincopata e simbolica a seconda che le equazionifossero descritte verbalmente (algebra retorica), attraverso il ricorso ad opportu-ne abbreviazioni (algebra sincopata) o, infine, con l’impiego di simboli (algebrasimbolica). Queste tre tappe non descrivono un processo storico lineare: Nes-selmann colloca nell’alveo dell’algebra retorica gli arabi e gli algebristi italianioperanti dal XII al XVI secolo mentre colloca Diofanto a livello dell’algebrasincopata, benche vissuto molti secoli prima degli algebristi retorici menzionatisopra; inoltre gli indiani sono collocati come esponenti dell’algebra simbolica,affermazione contestata da Leon Rodet nel 1881 con l’opera Sur les NotationsNumeriques et Algebriques anterieurement au XVIe Siecle. Per Rodet, alla com-pletezza delle notazioni indiane mancano, per poter essere mes sa in parallelocon la nostra, due cose fondamentali: dei simboli speciali per le operazioni di-rette di somma e moltiplicazione, ed un modo di rappresentare i parametri chefigurano con le variabili propriamente dette nelle nostre espressioni algebriche,alternativo alluso di numeri particolari1 ([1], p.112). Egli a sua volta proposeuna classificazione dicotomica tra l’algebra delle abbreviazioni e dei numeri as-segnati e l’algebra simbolica, propriamente detta: Diofanto cadrebbe nel primocaso e la nascita dell’algebra moderna sarebbe avvenuta quando germino l’idea

1manque, pour etre mise en parallele avec la notre, deux choses essentielles: des signesspeciaux pour les deux operations directes de l’addition e de la multiplication, et le moyenne derepresenter autrement que par des nombres particuliers le parametres qui entre, simultanementaux variables proprement dites, dans nos expressions algebriques.

3

Page 4: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4 CAPITOLO 1. BREVE STORIA DELLE NOTAZIONI

di rappresentare i dati del problema in forma generale grazie ad un simbolo,di esprimere parimenti in forma simbolica ogni operazione con un segno specialee di giungere in questo modo non solo a risolvere con maggior o minore sempli-cita un problema particolare ma di trovare formule che forniscono la risoluzionedi tutti i problemi di un certo tipo e, permettendo di caratterizzare ogni tipo diproblema, consentono di esprimere proprieta generali di certe categorie di nu-meri, di certe famiglie di figure o a formulare le leggi di certe classi di fenomeninaturali.2 (cfr. [1], p.113)

Si tratta di una posizione un po’ drastica che ho riportato qui per mostrarel’opportunita di discutere l’evoluzione delle notazioni algebriche. Un’equazionecome ax2 + bx+ c = 0 pone diversi spunti di indagine storica per studiare

• l’origine e l’evoluzione dello 0;

• il segno di uguaglianza;

• i segni per le operazioni aritmetiche + e −;

• l’uso degli esponenti;

• il modo di indicare l’incognita dell’equazione;

• il modo in cui un’equazione viene scritta;

• la distinzione tra coefficienti letterali ed incognite e la possibilita di ab-bracciare in un solo caso infinite equazioni.

Senza pretesa di completezza, nel seguito daremo alcune informazioni perlo studio di questi temi, rimandando chi volesse ulteriori approfondimenti allaletteratura riportata in bibliografia. In particolare, molte delle osservazioniriportate in questo capitolo sono tratte dal I volume dell’importante A Historyof Mathematical Notations dello storico della matematica Florian Cajori [2] che,a piu di ottant’anni dalla pubblicazione, resta il riferimento indispensabile perchi e interessato allo studio delle notazioni matematiche.

Anzitutto lo zero. Carl Boyer [3] osservo che quando si parla delle originidello zero occorre precisare in quale senso tali origini siano ricercate. Si puochiedere quando sia stato usato per primo un simbolo od un segno specifico perindicare una posizione vuota all’interno di un sistema di numerazione posiziona-le. In alternativa, si puo indagare l’origine del concetto di zero come classe nullao assenza di una grandezza, ovvero studiare la distinzione tra l’idea filosofica dinulla e lo zero matematico. Infine si puo esaminare lo status dello zero comenumero, soggetto alle regole delle operazioni artimetiche ordinarie.

2de representer les donnees du probleme sous forme general par un symbole, de symboliseregalement les operations chacune par une signe special, et d’arriver ainsi non plus a resoudreavec plus ou moins de facilite un probleme particulier, mais a trouver des formules donnantla solution de tous les problemes d’une meme espece, et, parce qu’elle servait a caracteriserchaque espece de probleme, servant a exprimer les proprietes generales de certaines categoriesdes nombres, de certaines familles de figures, ou a formuler les lois de certaines classes dephenomenes naturels.

Page 5: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

1.1. AX2 +BX + C = 0 5

Affinche un simbolo per lo zero si renda necessario occorre che sia in uso unsistema di numerazione posizionale in una qualche base e tra le civilta antichela civilta babilonese, che succedette a quella sumera, utilizzava un sistema dinumerazione sessagesimale gia nel 2000 a.C [4]. Tuttavia, forse perche in un si-stema di questo tipo l’occorrenza di posti vuoti e molto meno frequente rispettoal sistema decimale, non si trova traccia per lungo tempo di un simbolo speci-fico per lo zero che comparira nel periodo persiano. I babilonesi influenzaronol’astronomia greca e ne e anche prova il fatto che questi adottarono uno sche-ma sessagesimale per la rappresentazione delle parti frazionarie di un numero.L’occorrenza di una posizione vuota veniva segnalata dalla lettera omicron o,presumibilmente dall’iniziale della parola oιδεν, vuoto. Un simbolo lentiformead indicare posizioni vuote compare in iscrizioni Maya risalenti all’inizio dell’e-ra cristiana. I Maya adoperavano un sistema di numerazione in base venti. Ilsimbolo zero in un sistema decimale fu introdotto dagli indiani il cui ruolo nellosviluppo del sistema di numerazione che, per il tramite degli arabi, giungera inEuropa, e forse stato sopravvalutato [3]. In tutti questi esempi pero il simboloe volto ad indicare una posizione vuota ma non vi e alcuna prova che testimo-ni l’uso dello zero come numero a se stante, disgiunto da altri numeri, su cuieseguire delle operazioni. Quanto al concetto di zero come vuoto o nulla, anchese vi sono stati tentativi di attribuirlo a Platone, il primo testo a recare tracciainequivoca del concetto di zero in questo senso e la Fisica di Aristotele nellaquale viene esposta la teoria secondo cui la velocita di un corpo e inversamenteproporzionale alla resistenza offerta dal mezzo in cui esso si muove. L’argomen-to per negare la plausibilita del vuoto e che se questo esistesse un corpo vi simuoverebbe ad una velocita che supererebbe ogni rapporto e per corroborarel’assurdita dell’esistenza del vuoto Aristotele paragona questo moto ipoteticoall’impossibilita di stabilire un rapporto tra zero ed un numero qualunque, allostesso modo in cui non si puo dire che un segmento superi un punto, se non losi vuole ammettere come formato da punti. Questo passo di Aristotele e impor-tante perche mostra come Aristotele avesse chiara l’impossibilita di rapporti deltipo a/0. Tuttavia, il concetto di numero utilizzato dai Greci come pluralita diunita ne soffocava il respiro impedendo allo zero di raggiungere la dignita di nu-mero. Questo passo fu compiuto, non senza incertezze, dagli indiani i quali peroavevano un concetto di numero non molto preciso, pur operando su quantita po-sitive, negative e sullo zero. In particolare, Varahamihira (505-587) affermo cheil valore di una quantita non cambia se le si aggiunge o sottrae lo zero; nel 628Brahmagupta (598-668) esprime correttamente le regole 0× (±a) = 0, 0× 0 = 0e√0 = 0 ma, mille anni dopo Aristotele, non e sicuro sul valore da attribuire a

a/0 ed erroneamente ritiene che 0/0 = 0. Cinque secoli piu tardi, nel XII secolo,Bhaskara (1114-1185) dira che la divisione di un numero per zero porta ad infi-nito come risultato, anche se non e preciso su questa nozione. La liberta degliindiani di operare su numeri positivi, negativi (la parola indiana per indicare unnumero positivo e la stessa usata per indicare un bene od una proprieta, mentrequella per indicare un numero negativo si puo rendere con perdita o debito)[5] o sullo zero non significo l’accettazione di radici negative di un’equazione etale atteggiamento passo in eredita agli arabi e di riflesso agli europei che per

Page 6: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6 CAPITOLO 1. BREVE STORIA DELLE NOTAZIONI

molto tempo non ritennero accettabili come radici di equazioni ne lo zero nenumeri negativi. Soluzioni negative compaiono in problemi risolti da LeonardoPisano (Fibonacci, 1170-1250) e presenti nel Liber Abaci (1202), nel Flos (1225)e nella Epistola ad Theodorum (1225 ca.): qui troviamo problemi di natura com-merciale di cui si afferma l’insolubilita a meno di non ammettere la possibilitadi debiti: pertanto il problema sarebbe insolubile, a meno di ammettere che ilprimo abbia un debito3 [6]; (si veda [5], p.129 per una affermazione simile conte-nuta nel Flos). Un autore che accettera soluzioni negative senza esitazioni saraAlbert Girard (1590-1633) [8] nella Invention Nouvelle en L’algebre pubblicatanel 1629 ma la distinzione tra radici vere e false di un’equazione restera ancoraper un po’ di tempo, come vedremo piu avanti.

Verso la fine del XV secolo, nella Triparty di Nicolas Chuquet (1445-1488)del 1484 ma rimasta inedita per quasi quattro secoli, si parla dello zero dicendoche non vale o significa nulla.... e per questo motivo viene detto cifra, nulla onumero di nessun valore.4 ([3], p. 329)

Chuquet fu anche il primo ad usare lo zero come esponente, inaugurando unuso che sara continuato nei testi di algebra del XVI secolo, come l’ArithmeticaIntegra di Michael Stifel (1486(7)-1567) pubblicata nel 1544 dove lo zero vieneutilizzato come coefficiente di un monomio che non figura in un polinomio, comein questo esempio: x3 + 1 = x3 + 0x2 + 0x+ 1. Per chiudere, diciamo qualcosasulla parola zero. Le origini qui sono meno controverse in quanto il terminesunya (vuoto) impiegato dagli indiani fu mutato nell’arabo sifr che giunse inEuropa tramite i maestri d’abaco italiani, primo fra tutti Fibonacci, che lo resecon zefira da cui cifra e zero discesero e si diffusero in Europa.

Quanto al segno di uguaglianza, si puo dire che fin dal papiro egizio di Ahmes(1550 a.C. circa) contenente un’equazione di primo grado si trovi un simboloper indicare la locuzione uguale a. Tra i greci Diofanto utilizzo il simbolo iσ,deformato in una h rovesciata da copisti successivi. In ambiente indiano, nelmanoscritto Bakhshali5 l’abbreviazione pha della parola phala assolve il ruolodi simbolo di uguaglianza mentre tra gli arabi, Al-Qalasadı si servı di un sim-bolo simile a quello di Diofanto. Venendo nell’Europa del XV secolo troviamoJohann Muller (Regiomontano, 1436-1476) e Luca Pacioli (1445-1517) utilizza-re una lineetta − come simbolo di uguaglianza. Quest’ultimo nella Summa dearithmetica geometria proportioni et proportionalita del 1494 utilizzo lo stessosimbolo con diversi altri significati ma l’uso della linea come simbolo di ugua-glianza e presente in altri testi di poco posteriori, come la Pratica d’Arithmeticadi Francesco Ghaligai, che ebbe varie edizioni tra il 1521 ed il 1552. Lo storicodella matematica italiano Ettore Bortolotti ritrovo un manoscritto contenutonella biblioteca dell’Universita di Bologna in cui il segno di uguaglianza avevala forma attuale: =. E plausibile che il cambiamento sia stato dettato dal de-siderio di rimuovere possibili fonti di ambiguita nell’uso di un simbolo, come−, che aveva gia molti significati (p. 111 di [2]). Restando in Italia, GerolamoCardano utilizzo a volte uno spazio vuoto al posto del segno di uguaglianza.

3tunc quaestio esse insolubilis, nisi concederetur, primus habere debitum;4ne vault ou signifie rien... et pour ce est appellee chiffre ou nulle ou figure ne nulle valeur.5Manoscritto rinvenuto nel 1881 presso l’omonimo villaggio indiano.

Page 7: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

1.1. AX2 +BX + C = 0 7

La prima occorrenza del segno = per indicare l’uguaglianza in un testo astampa si ha nel 1557 con la pubblicazione avvenuta a Londra del Whetstone ofWitte, primo testo di algebra in lingua inglese, del matematico gallese RobertRecorde (1510ca.-1558). In altri casi si ricorreva ad espressioni retoriche co-me, a seconda della lingua, aequales, aequantur, esgale, gleich, faciunt, gheljick,mentre talvolta compariva l’abbreviazione aeq. Questa abitudine permase benoltre l’edizione del testo di Recorde e si dovette attendere il 1618 per ritrovareil segno di = in un testo a stampa, con il significato di uguaglianza. Precisa-mente, l’occorrenza si ha nell’Appendice della traduzione inglese della MirificiLogarithmorum Canonis Descriptio di John Napier (Nepero, 1550-1617), curataverosimilmente da William Oughtred (1574-1660). In Inghilterra, l’accettazionedel simbolo = di Recorde avvenne verso il 1630 quando fu adottata in tre testiche ebbero buona diffusione: la Artis analyticae Praxis ad Aequationes Algebrai-cas Resolvendas di Thomas Harriot (1560-1621), pubblicata postuma nel 1631,la Clavis mathematicae di William Oughtred, e la Trigonometria di RichardNorwood (1590?-1675), anch’esse pubblicate nel 1631.

La situazione e molto piu complicata sul continente dove il segno = eraadoperato con significati diversi ed altri simboli erano utilizzati per indicarel’uguaglianza. Ad esempio, nella In Artem Analyticem Isagoge [54] del 1591,Francois Viete (1540-1603) indicava con = la differenza di due parametri A e Bdi cui non fosse noto il maggiore, sicche A = B significa |A − B| mentre ReneDescartes (Cartesio, 1596-1650) utilizzava = nella Geometrie (1637) come ±;infine, nella Mathesis biceps del 1670 Juan Caramuel y Lobkowitz (1606-1682)impiegava = come separatore tra la parte intera e quella decimale di un numero.

Tra i simboli alternativi ad = per indicare l’uguaglianza segnaliamo [, ado-perato nel 1559 nella Logistica del monaco francese J. Buteo e ‖, pubblicatonel 1571 nell’edizione dell’Arithmetica di Diofanto curata da Wilhelm Holtzman(Xylander, 1536-1572) ed adoperato saltuariamente da altri matematici comeMichelangelo Ricci (1619-1682), Rene Francois Walter De Sluze (1622-1685) ePhilippe De la Hire (1640-1718). Questi ed altri simboli (cfr. §263 di [2]) noncostituirono seri antagonisti del simbolo di Recorde che invece fu minacciato daquello usato da Cartesio nella Geometrie la cui forma (simile a ∝) si pensavaderivasse da æ, come iniziali della parola aequalis, benche l’analisi dei mano-scritti abbia permesso di concludere che si tratta piuttosto dell’avvicinamentodi o ed e, œ; secondo Cajori ([2], §264) il simbolo ∝ va ricondotto al simbo-lo della costellazione del Toro che, occorrendo regolarmente nelle pubblicazioniastronomiche, era a disposizione dei compositori dei testi a stampa. Lungo tut-to il resto del XVII secolo, il simbolo di Cartesio prevalse su quello di Recordenell’Europa continentale mentre la situazione opposta si incontrava nella peni-sola britannica. Tra i primi testi a stampa pubblicati sul continente a riportareil segno = nell’accezione di uguale, ricordiamo la Teutsche Algebra (1659) dellosvizzero Johann Heinrich Rahn. Un grande impulso alla diffusione di = nell’Eu-ropa continentale fu dovuto all’uso che ne fecero matematici come John Wallis(1616-1703), Isaac Barrow (1630-1677) ed Isaac Newton (1643-1727) anche se laspinta decisiva verso l’adozione di = a discapito di ∝ fu il fatto che esso venneimpiegato sistematicamente da Gottfried Wilhelm von Leibniz (1646-1716) la

Page 8: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

8 CAPITOLO 1. BREVE STORIA DELLE NOTAZIONI

cui influenza nell’Europa di fine ’600 sembra risolutiva per decidere da qualepiatto far pendere la bilancia.

Anche i segni di addizione e sottrazione hanno una lunga storia, svolta indettaglio in [2], §§200-216. Ideogrammi corrispondenti al segno di sottrazionesono stati individuati in tavolette babilonesi, cosı come nel papiro di Ahmes estato individuato un simbolo di addizione. Simboli per la sottrazione sono notiin Diofanto mentre nell’Aritmetica di Bakhshali il segno + indica la sottrazione.Un segno per la sottrazione compare anche nell’opera dell’arabo al-Qalasadi delXV secolo il quale invece indica l’addizione con la sola giustapposizione degliaddendi. In Europa, Chuquet prima, Pacioli dopo, utilizzarono p o p per ilsegno di addizione, dall’iniziale di plus e m o m per la sottrazione, dall’iniziale diminus. Quest’uso rimase ben radicato tra i matematici italiani del XVI secolo. Isegni + e− come segni di addizione e sottrazione entrarono in scena in Germanianell’ultimo ventennio del XV secolo. Il simbolo −, detto minnes, figura in untesto di algebra manoscritto conservato a Dresda risalente al 1481. In un altromanoscrittto della stessa collezione compare il segno + per l’addizione, altroveespressa dalla parola vnd. Il primo testo a stampa che rechi entrambi i segnie Behede und hubsche Rechenung auff allen Kauffmanschafft (1489) di JohannWidman (1462-1498), professore a Lipsia. L’origine del segno + pare vadaricercata tra le molte abbreviazioni della congiunzione latina et che si potevaanche indicare con un + in cui l’asta verticale non era ortogonale a quellaorizzontale. Meno certa appare invece l’origine del segno −. La competizionedei segni + e − con p e m duro fino all’inizio del XVII secolo quando questiultimi cedettero il passo ai simboli che impieghiamo ancora oggi.

Se, come osserva Tignol ([9], p. 26) l’uso di p ed m al posto di + e − nonera un ostacolo serio, ben diverso e l’effetto avuto dalla notazione per i polinomisulla speditezza dei calcoli e la trasparenza dei ragionamenti. Esaminiamo dueaspetti: l’evoluzione della notazione per l’incognita e per le sue potenze succes-sive. Nell’algebra araba non era sempre chiaro se x od x2 fossero da considerarel’incognita principale per cui, al esempio, in Al-Kwaritzmi ed in altri algebristiarabi antichi l’incognita principale da determinare e x2, detta mal, cioe sommadi denaro, era l’incognita principale mentre x, detta jidr in arabo (cioe radice,parte piu bassa o base) era un’incognita intermedia da ottenere tramite risolu-zione dell’equazione proposta e da elevare al quadrato per ottenere x2. SempreAl-Kwaritzmi indicava con la parola shai, cosa, un’incognita in genere, interpre-tabile come x o come x2. Nel passaggio in occidente traduttori come Gherardodi Cremona (1117-1184) resero jidr con radix e shai con res a sua volta passatonell’italiano cosa, nel tedesco coss e, in forma aggettivata, nell’inglese cossic che,per tutto il XVI e XVII furono dei veri e propri sinonimi della parola algebra:Coss e Cossic art, rispettivamente. L’abbreviazione co. entro diffusamente inuso al posto di cosa per indicare l’incognita. Piu complicato era scrivere unpolinomio. Non vi era alcuna notazione esponenziale e le potenze dell’incognitaerano indicate da un’abbreviazione. Se un’abbreviazione di x era ℓ per latus,il quadrato x2 era indicato con q (quadratus) oppure con ce, da census, x3 conc (cubus) ce.ce., bq o qq per x4. Con x5 sorgeva un’altra fonte di confusione.Questa e la prima potenza a non essere ne un quadrato ne un cubo e per que-

Page 9: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

1.1. AX2 +BX + C = 0 9

sto Pacioli, riprendendo una nomenclatura egizia lo abbreviava con p.r., primorelato; cosı dunque x7 diventa 2.r, secundo relato, ed x11 e 3.r, tertio rela-to, ecc. Con x5 ed x6 nasceva un’ulteriore confusione perche, se Pacioli indicax6 con ce.cu., cioe censo de cubo, vale a dire (x3)2, seguendo cosı il principiomoltiplicativo degli esponenti, altri autori, aderendo ad un principio additivo,indicavano x5 = x2 · x3 con ce.cu., facendo prevalere la regola del prodotto dipotenze con ugual base. Un polinomio come 3x− x3 veniva scritto da Bartolo-meo Pitisco (1561-1613) nella Trigonometriae editio tertia del 1612 come 3ℓ−1ced il suo quadrato come 9q− 6bq+ 1qc dove bq sta per biquadrato, cioe x4 e qcindica il quadrato-cubo, cioe x6, secondo il principio moltiplicativo. Nella ArsMagna del 1545 Girolamo Cardano (1501-1576) non impiega co. per l’incognitama pos.: rem incognitam, quam vocamus positionem e quad. per il suo quadratoper cui un’equazione come x2+2x = 48 diventa 1.quad.p2.pos.aeq.48 ([2] p.117,[9], p.26). Seguendo le linee del manoscritto di Chuquet del 1484 che indicavaun monomio come 12x2 come 122, omettendo la base, nel XVI secolo i germi diuna notazione esponenziale compaiono nell’Algebra (1572) di Rafael Bombelli(1526-1572) dove un’equazione come 2 = x2 + x veniva scritta come

2. Eguale a21

p11

dove manca ancora ogni indicazione della base e dunque e adatta a situazioniin cui una sola incognita entra in gioco. Nonostante notazioni infelici, le ideecirca l’algebra dei polinomi erano chiara come mostra questo passo estratto dalLibro de Algebra (1567) del matematico portoghese Pedro Nunez, riportato in[2], p. 163

...se desideriamo moltiplicare .4. co. per 5.ce. diremo che .4. per .5. da.20. e che siccome .1., l’esponente di co., sommato con .2. esponente del censoda .3. che e l’esponente del cubo, pertanto .4. co. per .5.ce. da .20.cu.6

Un miglioramento si ebbe con il belga Simon Stevin (1548-1620) che nel 1585pubblico La Disme (in fiammingo: Die Thiende) in cui estese la notazione deci-male ai polinomi cosicche un polinomio come x2−12 era indicato come 1(2)−12dove, nell’originale, l’esponente era messo all’interno di un cerchietto, anzichetra una coppia di parentesi. Stevin, quando doveva operare con piu incogniteintroduceva i simboli 1(1) ed 1.sec.(1) cosicche l’espresione 12y4+23xy2+10x2

diventa 12 sec.(4)+23(1)M sec.(2)+10(2) doveM indica la moltiplicazione trale diverse incognite. Un grosso passo in avanti fu quello introdotto da FrancoisViete che per primo adopero in modo sistematico le lettere per indicare i coeffi-cienti che comparivano nelle equazioni. Un uso saltuario di lettere per indicareparametri si trova gia in Fibonacci e in Giordano Nemorario (1225-1260). AncheBombelli aveva introdotto dei parametri per dare regole generali di soluzione diproblemi di secondo grado. La distinzione tra coefficienti ed incognite segui-va la regola che le vocali (A,E,I,O,V,Y) erano usate per le incognite mentre

6si queremos multiplicar .4. co. por .5. ce. diremos asi .4. por .5. hazen .20. y porque .1.denominacio de co. sumado con .2. denominacion de censo hazen .3. que es denominacio decubo. Diremos por tanto q. .4. co. por .5. ce. hazen .20. cu.

Page 10: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

10 CAPITOLO 1. BREVE STORIA DELLE NOTAZIONI

le consonanti indicavano i coefficienti. E stato sottolineato ([2], p.183) comequesta scelta possa indicare un rinato interesse per le lingue semitiche in cuile consonanti sono indicate mentre le vocali debbono essere ricostruite a par-tire dalle consonanti. Va pero osservato che, quando deve trattare equazionia coefficienti numerici, Viete non indica piu l’incognita con una vocale ma laindica con N (numerus) mentre il suo quadrato ed il cubo sono indicati con Q eC, rispettivamente. Osserviamo come l’avanzamento notazionale di Viete fu inparte oscurato dal desiderio di porre sempre in luce l’omogeneita dimensionaledi tutti i termini che comparivano in una equazione. Ad esempio, l’equazionedi terzo grado x3 + 3bx = 2z nell’incognita x era resa da Viete come

A cubus + b plano 3 in A aequari z solido 2

dove, a parte indicare l’incognita con la vocale A, si insiste sul fatto che b deveavere dimensione due (plano) mentre z deve avere dimensione 3 (solido). Un’al-tra limitazione di Viete, comune ad altri studiosi dell’epoca, fu di restringerele incognite ad assumere valori positivi. A parte questi difetti, Viete ebbe co-munque il merito di affiancare al calcolo numerico (logistica numerosa) quellosimbolico (logistica speciosa). Nell’avvicinamento alla moderna notazione espo-nenziale possiamo ricordare Adriaan van Roomen (Romanus, 1561-1615) chescrive

A(4) +B(4) + 4A(3) in B + 6A(2) in B(2) + 4A in B(3)

laddove scriveremmo

A4 +B4 + 4A3B + 6A2B2 +AB3

ed il francese Pierre Herigone (1580-1643) che scriveva a3, 2b4, 2ba2 dove oggiscriveremmo a3, 2b4 e 2ba2, rispettivamente e dunque pone sempre l’esponentedopo la lettera cui si riferisce, mentre il coefficiente viene posto prima dellalettera cui si riferisce.

Nel 1636 James Hume, uno scozzese residente a Parigi, pubblico L’Algebrede Viete, d’une methode nouvelle claire et facile in cui emendava la notazione diViete scrivendo Aiii per A3 e dunque, se si eccettua l’uso del numerale romanoper l’esponente, questa notazione coincide con quella moderna che fu introdottaun anno piu tardi, nel 1637, da Cartesio nella Geometrie, con l’eccezione di x2

per il quale sopravvisse la notazione xx, almeno fino a Gauss.Quanto al modo di presentare le equazioni, la forma utilizzata nel titolo, che

e quella a cui siamo abituati si impose a partire da Cartesio che la adotto nelIII Libro della Geometrie, dedicato allo studio delle equazioni algebriche ma chesi trova in altri autori precedenti, ad esempio in Peter Roth (1583-1663) e neiMiracula Arithmetica di Johann Faulhaber (1580-1635), precedenti a Cartesioe in un paio di esempi contenuti nell’Algebra di Rafael Bombelli. In Cardano leequazioni figurano con coefficienti positivi, come x4 +106x = 4x3 +19x2 +120,ovviamente con una diversa notazione; Cartesio attorno al 1620 e, prima dilui Stifel e e Christopher Clavius, pongono le equazioni nella forma: termine di

Page 11: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

1.1. AX2 +BX + C = 0 11

grado massimo uguale a tutti gli altri termini come x4 = 4x3+19x2−106x+120;ancora, Harriot e Faulhaber le scrivono nella forma: termini variabili uguagliatial termine costante x4 − 4x3 − 19x2 + 106x = 120 [10]. Tutti questi modi discrivere, con i termini che vengono correttamente spostati a sinistra od a destradell’uguale testimoniano la concezione additiva dei polinomi, intesi come sommeod aggregati di termini. La concezione moltiplicativa di polinomio inteso comeil risultato del prodotto di altri polinomi piu semplici compare talvolta nell’ArsMagna di Cardano e sara utilizzata ed apprezzata appieno a partire dal XVIIsecolo, gia in Harriot e Roth ma soprattutto con Cartesio.

Page 12: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

12 CAPITOLO 1. BREVE STORIA DELLE NOTAZIONI

Page 13: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] S. Unguru: On the need to rewrite the history of Greek mathematics.Archive for History of Exact Sciences, 15, (1975), 67-114.

[2] F. Cajori: History of Mathematical Notations I. Notations in ElementaryMathematics. Open Court, La Salle, Illinois (U.S.A.), (1974); ristampadell’originale pubblicato nel 1928 dalla stessa casa editrice.

[3] C.B. Boyer: Zero: the symbol, the concept, the number. Nat. Math. Mag.18, 323–330, (1944).

[4] F. Cajori: Sexagesimal fractions among the Babilonians. AmericanMathematical Monthly, 29, 8–10, (1922).

[5] J. Sesiano: The appearance of negative solutions in MediaevalMathematics. Archive for History of Exact Sciences, 32, 105–149, (1984).

[6] A.F. Horadam: Fibonacci’s mathematical letter to Master Theodorus. TheFibonacci Quarterly, 29, 103–107, (1991).

[7] F. Viete: In Artem Analyticem Isagoge, Mettayer, Turonis, (1591).

[8] A. Girard: Invention Nouvelle en l’Algebre, Blaeuw, Amsterdam, (1629).Ristampata a cura di D. Bierens de Haan, Leida, (1884).

[9] J.-P. Tignol: Galois’ Theory of Algebraic Equations. World Scientific,Singapore, (2001).

[10] K. Manders: Algebra in Roth, Faulhaber, and Descartes. HistoriaMathematica 33, (2006), 184-209.

13

Page 14: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

14 BIBLIOGRAFIA

Page 15: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 2

Meno per meno fa piu

In qualcuno la regola dei segni:

piu per piu fa piupiu per meno fa menomeno per piu fa menomeno per meno fa piu

puo forse scatenare la stessa reazione che generava in S. Agostino la sempliceregola di calcolo 2× 2 = 4:

Due e due quattro era per me un’odiosa cantilena...1 (Confessiones, Liber I)

Per altri, invece, questa regola e qualcosa da accettare e la giustificazione mi-gliore e data dalla coerenza a posteriori dell’edificio dell’algebra. Affinche talegiustificazione sia credibile occorre pero avere presente quale sia il motivo allabase della regola: la volonta di estendere ai numeri interi, positivi e negativi, laproprieta distributiva del prodotto rispetto alla somma. A ben vedere vi sonodue strade che si possono percorrere e che sono state in effetti percorse da variautori per introdurre questa regola. O si accetta la regola dei segni e se nededuce la proprieta distributiva anche quando sono coinvolti numeri negativi,oppure si estende a priori la proprieta distributiva e si dimostra, come conse-guenza, la regola dei segni. Quale delle due strade si voglia seguire, il passaggiodall’aritmetica—dove i numeri negativi non hanno cittadinanza—all’algebra none scontato. La parola chiave che consente questo passaggio e estensione: l’esten-sione delle proprieta per le operazioni, dedotte in campo aritmetico. Quando sipassa all’algebra, la loro validita e da stabilire convenzionalmente. La naturaconvenzionale di questo processo non deve spaventare: l’algebra non e un’opi-nione. La scelta della regola dei segni non e ineluttabile: un’altra scelta fornitoun’algebra diversa che, tuttavia, non avrebbe portato lontano in quanto la rinun-cia alla proprieta distributiva e un prezzo troppo alto da pagare e la strutturaindotta operando questa scelta non e soddisfacente.

1Duo et duo quattuor odiosa cantio mihi erat...

15

Page 16: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

16 CAPITOLO 2. MENO PER MENO FA PIU

Questo capitolo vuole ripercorrere le tappe principali nella storia della regoladei segni per mostrare come, quando si tenti di dar conto di tale regola, si vadaincontro a difficolta non dissimili da quelle che, ironicamente, ancora S. Agostinotrovava nel dover spiegare ai lettori il tempo:

Che cosa e il tempo? Se nessuno me lo chiede, lo so. Se voglio spiegarlo a qualcuno,

non lo so2 (Confessiones, Liber XI)

La storia che seguiremo mostra diversi tentativi, alcuni dei quali molto inge-gnosi, di giustificare, di dimostrare la regola dei segni, appoggiandosi a risultatidi aritmetica oppure ricorrendo ad argomenti geometrici. Questi tentativi dava-no per scontata la proprieta distributiva non ritenendo necessario precisare che,uscendo dai confini dell’aritmetica, occorre ridiscuterne la validita. Seguiremoun buon numero di questi tentativi che possono essere raggruppati in diversecategorie, a seconda della prospettiva da cui la regola viene visualizzata:attraverso le regole dell’aritmetica tradizionale estese tacitamente al camponumerico dei numeri relativi;attraverso il ruolo dello zero come elemento neutro dell’addizione;la regola dei segni non e una regola per il prodotto tra numeri quanto una regoladi combinazione tra i segni.

A monte delle giustificazioni della regola dei segni vi sono i modelli utilizzatiper introdurre i numeri negativi; storicamente se ne sono utilizzati quattro:modello cinematico: i numeri positivi corrispondono a spostamenti su una rettain un verso, a partire da un’origine fissata una volta per tutte, mentre i numerinegativi corrispondono a spostamenti in verso opposto;modello contabile: i numeri positivi corrispondono a crediti mentri i numerinegativi corrispondono a debiti;modello cronologico: i numeri positivi rappresentano eventi accaduti dopo unistante convenzionalmente fissato mentre i numeri negativi corrispondono aglieventi accaduti prima di questo istante;modello termologico: i numeri positivi rappresentano temperature superiori aduna temperatura di riferimento (lo 0 della scala termometrica) mentre i numerinegativi corrispondono a temperature inferiori allo zero.

Se questi modelli hanno un’indubbia efficacia per giustificare la necessitadi impiegare i numeri negativi, essi sono del tutto inadeguati a render contodella regola dei segni ed, anzi, possono dar luogo a conseguenze paradossalicome quella descritta efficacemente da Marie-Henri Beyle (Stendhal, 1783-1842)nell’autobiografica Vie de Henry Brulard

Come e possibile che moltiplicando 1000 franchi di debito per 500 franchi di debito,

uno arrivi a possedere una fortuna di 5000000, cinque milioni?

I modelli che meglio si adattano ad una giustificazione della regola dei segnisono quelli geometrici, nei quali si instaura una corrispondenza tra operazioniaritmetiche e particolari trasformazioni geometriche: le rotazioni attorno adun asse fisso. In questo modo si manifesta una analogia tra i numeri negativi

2Quid est tempus? Si nemo ex me quaerat, scio. Si quaerenti explicare velim, nescio.

Page 17: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.1. I NUMERI NEGATIVI 17

ed i numeri complessi e non e un caso se questi modelli geometrici sono statipresentati in opere finalizzate a discutere la natura e le proprieta delle quantitaimmaginarie.

Infine seguiremo lo sviluppo della presentazione assiomatica dei numeri ne-gativi entro la quale la regola dei segni trova la sua definitiva sistemazione. Nondeve sorprendere che una questione di principio trovi la sua veste soddisfacentesolo nel XIX secolo, dopo almeno 150 in cui i numeri negativi erano stati usatitranquillamente da tutti i matematici. Come osservava Emile Borel, parlandodella formulazione assiomatica della geometria:

On sait comment l’on procede pour exposer une science, telle que la geometrie, sous

une forme axiomatique; de meme que dans le bons romans policiers, on commence

par la fin, c’est-a-dire que l’on pose comme definitions les proprietes essentielles que

l’experience a conduit a attribuer aux etres geometriques points, droites, plans. ([10],p. 80)

La sistemazione assiomatica dei numeri negativi e, di riflesso, la regola deisegni, si collocano al termine di un lungo percorso, nel quadro della revisionedei fondamenti dell’analisi matematica, grazie all’opera di George Peacock edHermann Hankel. Vi e pero ancora spazio per ulteriori riflessioni che mostranocome introdurre i numeri negativi non sia affatto necessario ma che questi,con le loro operazioni, possono essere surrogati da coppie ordinate di numeripositivi, a patto di definire opportunamente le operazioni con cui agire su talicoppie. Questo approccio, le cui origini si possono rintracciare in alcuni cicli dilezioni renuti da Weierstrass a Berlino, fu sviluppato e divulgato, tra gli altri,Jules Tannery ed Louis Couturat. Benche esso sia di grande eleganza formalee soddisfi il gusto estetico, d’altro canto mortifica l’intuizione, le lotte secolariper comprendere e far comprendere i numeri negativi.

2.1 I numeri negativi

Una delle distinzioni che balzano all’occhio tra aritmetica e algebra e l’impiegolibero di quantita negative che si ha in algebra, a differenza delle restrizioni pre-senti in aritmetica. Ad esempio, la sottrazione di un numero da uno minore nonviene contemplata nell’aritmetica delle scuole elementari mentre e un’operazio-ne lecita in algebra. Cosı si esprimeva, alla fine dell’Ottocento un matematicofrancese, Maurice Fouche [23]:

La maggior parte dei matematici di oggi concorda nel riconoscere che la differenza

essenziale tra l’algebra e l’aritmetica consista nell’introduzione dei numeri negativi.3

L’impiego delle quantita negative non deve pero essere inteso come un fattoscontato: al contrario, la loro introduzione ha rappresentato un ostacolo con-cettuale rilevante, come testimoniato dai dibattiti di cui ancora si trova traccia

3La plupart des mathematiciens sont aujourd’hui d’accord pour reconnaitre que ladifference essentielle entre l’Algebre et l’Arithmetique consiste dans l’introduction des nombresnegatifs.

Page 18: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

18 CAPITOLO 2. MENO PER MENO FA PIU

su alcune riviste scientifiche del XIX secolo. La lentezza ad introdurre ed as-similare i numeri negativi e in parte dovuta al significato rivestito dalle radicinegative di equazioni algebriche: se l’incognita da determinare e la lunghezza diun segmento, l’estensione di una superficie od il volume occupato da un solido,soluzioni negative non hanno alcun senso. Diverso e il caso in cui il significato siauna quantita di denaro perche appare chiaro che ad una quantita—l’ammontaredi una somma di denaro—possono affiancarsi due qualita distinte: la sommaconsiderata puo essere un credito oppure un debito. E proprio questo significa-to economico a far capolino in alcuni problemi discussi da Cardano nell’ArtisMagnae sive de Regulis algebraicis Liber unus o, piu semplicemente, nell’ArsMagna, pubblicata nel 1545. Per attribuire un significato geometrico a quantitanegative come soluzioni di equazioni occorre attendere Albert Girard che, nellasua Nouvelle invention en l’algebre, pubblicata nel 1629, otto anni prima dellaGeometrie di Cartesio, considero il seguente Probleme d’Inclinaison:

OC

H

A

BK

F

N

D

G

L

Figura 2.1: Il problema di inclinazione che conduce ad un’equazione di quar-to grado con radici negative che Girard interpreta geometricamente ricorrendoall’idea di segmento orientato.

Dato un punto A posto sulla bisettrice del primo e terzo quadrante in modoche AF = AB = 4, Girard chiede di tracciare la retta passante per A e tale chela sua intercetta (cioe il segmento CN compreso tra gli assi ortogonali DH eCL) abbia lunghezza

√153. Posto FN = x, Girard nota laconicamente che si

Page 19: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.1. I NUMERI NEGATIVI 19

avra

x4 = 8x3 + 121x2 + 128x− 256. (2.1)

Infatti, dal triangolo rettangolo AFN abbiamo AN2 = 16+ x2 ed inoltre, dallasimilitudine tra i triangoli ANF ed ONC abbiamo

AN√153

=|x|

|4− x| ,

per cui elevando al quadrato e semplificando, si risale all’equazione (5.12) di cuiGirard elenca le quattro soluzioni affiancando il significato geometrico: x = 1

corrisponde ad FN , x = 16 corrisponde ad FD, x = − 9

2+

17

4che indica il

punto G dal punto F ed x = − 9

2−√

17

4che indica il punto H dal punto F . Ecco

la chiara esposizione di Girard:

Queste soluzioni mostano i punti G ed H , come se le distanze FG , FH fossero menodi nulla, presi FN ed FD che crescono mentre FG, FH retrocedono finche le intercetteCN, DP, GL, HK, tendono ad inclinarsi a partire da A, facendo ciascuna

√153, secondo

le regole qui stabilite. E per interpretarle ancora meglio, le due soluzioni che sonominori di 0 si debbono scambiare, a seconda dei segni.

si otterra

4 12−√4 1

4per FG

4 12+√4 14

per FH

che vanno contate in verso opposto a quello di FN, FD, come mostra la figura pre-

cedente: & dunque si dovranno intendere cosıtutte le soluzioni negative, che e un

osservazione con conseguenze in geometria, sconosciute sinora.4 ([8])

E l’idea di verso di percorrenza di un segmento che conferisce ai numerinegativi quella cittadinanza nella geometria, a lungo negata:

Finora non abbiamo ancora spiegato a cosa servano le soluzioni negative, quando ve

ne siano. La soluzione negativa si spiega in Geometria procedendo all’indietro, ed il

segno meno indietreggia, laddove il segno + avanza.5 ([8])

4Assavoir monstrant lesdits points G & H, comme si les distances FG, FH estoyent moinsque rien, en retrogradant, prenant que FN, FD avancent, & FG, FH reculent en arriere,tellement donc que les interceptes CN, DP, GL, HK, tendent & s’enclinent au point A faisantchacune

√153, selon le requis.

Et pour l’interpreter encor mieux, les deux solutions qui sont moins que 0, se doiventchanger, assavoir les signes.

viendra

4 12−√

4 14

pour FG

4 12+

√4 14

pour FH

Lesquels il faut poser au contraire de FN, FD, comme il est exprime en la figure precedente:& ainsi le faudra-il entendre de toutes solutions par moins, qui est une chose de consequenceen Geometrie, incogneue auparavant.

5Iusques icy nous n’avons encor explique a quoy servent les solutions par moins, quand ily en a. La solution par moins s’explique en Geometrie en retrogradant, & le moins recule, laou le + avance.

Page 20: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

20 CAPITOLO 2. MENO PER MENO FA PIU

Il probleme d’inclinaision e un’interessante variante di un problema cheera stato risolto per via sintetica da Pappo nelle Synagoge (Proposizione LX-XII, Libro VII). Nella versione latina (Mathematicae Collectiones) di FedericoCommandino il problema e reso, nel 15586, in questi termini:

Dato un quadrato AD, prolungare AC fino ad E e tracciare da esso un segmento con

EG di lunghezza assegnata che raggiunga il punto B.7 ([37], p. 287)

Vediamo l’evoluzione subita da questo problema nel passaggio da Pappo aDescartes ed alla sintesi tra il problema di Pappo e la variante di Girard, adopera di due commentatori di Descartes: Claude Rabuel e Frans van Schooten.

La dimostrazione della proposizione in esame presenta, nella versione di Pap-po un ostacolo tecnico nella dimostrazione del seguente lemma (ProposizioneLXXI, Libro VII)

Sia dato un quadrato AD, si conduca BGE e perpendicolarmente ad esso si tracci

EF . Dico che i quadrati costruiti su CD e GE sono equivalenti al quadrato su DF .8

Si tratta di dimostrare (Fig. 2.2) che

C

D

A

B

G

E

F

Figura 2.2: Illustrazione del Lemma costituente la Proposizione LXXI del LibroVII delle Mathematicae Collectiones di Pappo alessandrino, nella versione diFederico Commandino.

CD2 +GE2 = DF 2. (2.2)

Si conduca da E la parallela al lato CD del quadrato A[BC]D, che taglia BFin H . Poiche gli angoli ˆCEH e ˆFEG ed hanno l’angolo GEH in comune, deveessere

ˆCEG = ˆFEH (2.3)

da cui segue che i triangoli rettangoli FEH e BDG sono congruenti per cui, inparticolare

EF = BG. (2.4)

Inoltre, visto che anche il triangolo FEB e rettangolo in E, si ha

BF 2 = EF 2 +BE2. (2.5)

6L’opera apparve postuma, essendo Commandino morto nel 1575.7Quadrato existente AD, producere AC in E et facere EG datam quae ad punctum

B pertingat. Ho modificato EF in EG per rendere la notazione conforme a quelladella Proposizione LXXI.

8Sit quadratum AD, & ducatur BGE, atque ipsi ad rectos angulos EF . Dico quadrata exCD, GE quadrato ex DF aequalia esse.

Page 21: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.1. I NUMERI NEGATIVI 21

La similitudine dei triangoli BGD e BEF fa sı che

BG

BF=BD

BE

da cui segueBF ×BD = BE ×BG (2.6)

che Pappo esprime in questo modo: Il rettangolo di BF e BD e uguale, cioeequivalente, al rettangolo di BE e BG. Pappo osserva anche che i punti G,E, F , D debbono stare su una stessa circonferenza in quanto il quadrilateroGEFD e ciclico, avendo angoli opposti supplementari. Se dal quadrato di latoBF si asporta il rettangolo di lati BF e BD resta il rettangolo di lati BF edFD. D’altronde per la (2.5) e la (2.6) si ha anche

BF 2 −BF ×BD = EF 2 +BE2 −BE ×BG

e siccome, asportando il rettangolo di lati BE e BG dal quadrato di lato BE siha il rettangolo di lati BE ed EG, si puo concludere, grazie a (2.4), che

BF × FD = BG2 +BE × EG = GE2 +BE ×BG

dove l’ultimo passaggio si ottiene riflettendo sulla scomposizione della figura ....Usando (2.6) si ha poi

BF × FD = BG2 +BE × EG = GE2 +BF ×BD :

Se si rimuove il rettangolo di lati BD e FD, a sinistra resta il quadrato di latoFD mentre a destra resta il quadrato di lato EG e quello di lato BD, che eappunto la tesi.

Forte di questo lemma, Pappo passa a dimostrare il teorema che ci interessa,con il metodo zetetico: lo si consideri risolto (Factum iam illud sit). Si supponga

C

D

A

B

G

E

F

Figura 2.3: Illustrazione della Proposizione LXXII del Libro VII delleMathematicae Collectiones.

cioe di aver trovato un punto E sul prolungamento di AC tale che, condotta daE la congiungente con B, essa intersechi il lato CD del quadrato in un puntoG tale che EG abbia lunghezza prefissata. Condotto da E il segmento EFortogonale a BE (Fig. 2.3), per il lemma appena dimostrato vale la (2.2) percui DF si puo considerare noto, visto che lo sono CD ed GE. Di conseguenza, ilsegmento BF e esso stesso noto e per questo si puo considerare nota la posizione

Page 22: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

22 CAPITOLO 2. MENO PER MENO FA PIU

della semicirconferenza di diametro BF che deve passare per E visto che, percostruzione, l’angolo ˆBEF e retto. Il punto E, soluzione del problema si trovaintersecando questa circonferenza con il prolungamento di AC.

Descartes considera il problema di Pappo nel III Libro della Geometrie comeapplicazione della regola di soluzione delle equazioni algebriche di quarto gradoe della loro possibile riduzione ad equazioni di grado inferiore con la ricercadei divisori del termine noto. La figura non differisce sostanzialmente da quel-la di Pappo e Cartesio riformula il problema in questi termini, trattaggiandosommariamente anche la descrizione originale:

Dati il quadrato BD ed il segmento BN , occorre prolungare il lato AC sino ad E, in

modo che EF , tracciato da E verso B, sia uguale ad NB. Si sa da Pappo che, se si

e prolungato dapprima BD fino a G, di modo che DG sia uguale a DN , ed avendo

descritto un cerchio di diametro BG, se si prolunga la retta AC, essa interseca la

circonferenza del cerchio nel punto E richiesto.9 ([15], p. 189)

C

D

A

N

B

F

E

G

Figura 2.4: Il problema di Pappo nella versione della Geometrie di Descartes.

Osserviamo due punti. Cartesio tiene a specificare che EF e tracciato da Everso B, una implicita constatazione che, partendo da E vi sono in effetti duepunti sulla retta BE che hanno distanza da E assegnata. Inoltre vediamo comel’aver rappresentato il segmento BN di lunghezza assegnata come in Figura,permette a Cartesio di tradurre immediatamente in forma geometrica il vincolo(??).

Posto BD = a e BN = EF = c, Descartes utilizza la similitudine dei trian-goli BFD e CFE per scrivere l’equazione risolutiva in termini dell’incognitax = DF nella forma generale

x4 − 2ax3 + (2a2 − c2)x2 + 2a3x+ a4 = 0

da cui ottiene il valore di DF che risolve il problema di Pappo come la radice

x =a

2+

a2

4+c2

4−√

c2

4− a2

2

a

2

a2 + c2

9Si le quarre BD & la ligne BN etant donnes, il faut prologer la coste AC jusque aE, en sorte qu’EF , tiree d’E vers B, soit esgale a NB. On apprent de Pappus, qu’ayantpremierement prolonge BD jusques a G, en sorte que DG soit esgale a DN , & ayant descritun cercle dont le diametre soit BG, si on prolonge la ligne droite AC, elle rencontrera lacirconference de ce cercle au point E, qu’on demandoit.

Page 23: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.1. I NUMERI NEGATIVI 23

dell’equazione proposta. Nulla dice Cartesio a riguardo delle radici restanti, co-me invece aveva fatto Girard: la soluzione incontrata, che non e la sola positiva,e quella che risolve effettivamente il problema di Pappo, se si conviene che ilprolungamento del lato AC possa essere effettuato solo da A verso C; piuttostoegli richiama l’attenzione sul fatto che la scelta di un’incognita alternativa possacondurre ad equazioni risolutive piu o meno semplici:

Se si fosse preso BF , o CE, o BE come incognita, si verrebbe ricondotti ad una

equazione la quale sara di quarto grado, ma esse sono piu facili da risolvere e si

otterranno le incognite molto facilmente; se invece si fosse preso DG come incognita, si

otterrebbe molto piu difficilmente un’equazione che pero sara anch’essa molto semplice.

Affermo cio per avvertire chem quando il problema non e affatto di terzo grado, se si

perviene ad un’equazione molto difficile, se ne puo di solito ottenere una piu semplice,

cercando un’altra [incognita].10 ([15], 190)

Cartesio non approfondisce le varianti che si presentano quando venga scel-ta un’incognita diversa da DF . Tale compito si trova nel commentario allaGeometrie, scritto nel 1730 dal gesuita Claude Rabuel. Il testo di Rabuel e mol-to meticoloso nella discussione dei vari casi che si possono presentare al variaredell’incognita. In particolare, egli osserva come anche una soluzione positivapossa non risolvere perfettamente il problema proposto perche non corrispondeal prolungamento di AC, effettuato dalla parte di C. Riferendoci alla Fig. 2.4riportiamo questo passaggio di Rabuel:

In ogni casi visti, solo il punto F ed il segmento FE risolvono perfettamente il pro-

blema; gli altri segmenti, benche uguali a quello assegnato BN o bN ne forniscono

la soluzione solo introducendo qualche cambiamento; infatti il problema richiede un

segmento che sia uguale a BN e che tagli il lato AC prolungato dalla parte di E ed il

lato CD tra i punti C e D.11 ([42], p. 485)

La modifica necessaria al testo e riportata da Rabuel subito dopo:

Affiche tutti i segmenti tracciati, uguali a quello assegnato BN risolvano il Problema,

lo si dovrebbe proporre cosı. Assegnato il quadrato ABCD e prolungandone i lati AC,

CD, trovare tutti i segmenti che: 1 siano tracciati a partire dal punto B, 2 tagliano

i lati AC, CD e 3 la cui parte compresa tra questi lati sia uguale ad un segmento

assegnato BN .12 ([42], p. 485)

10Que si on posoit BF , ou CE, ou BE pour la quantite inconnue, on viendroit derechesa une Equation, en laquelle il y auroit 4 dimensions, mais qui seront plus aysee a demesler,& on y viendront asses aysement; au lieu que si c’estoit DG au’on supposast, on viendrontbeaucoup plus difficilement a l’Equation, mais aussy elle seroit tres simple. Ce que ie metsicy pour vous avertir, que lorsque le Problesme propose n’est point solide, si en le cherchantpar un chemin ou vient a une Equation fort composee, on peut ordinairement venir a une plussimple, en le cherchant par un autre.

11Dans tous les cas, qu’on vient d’examiner le seul point F & la seule ligne FE resolventparfaitement le Probleme; les autres lignes, quoique egales a la donnee BN ou bN n’en donnentla solution qu’en y mettant quelque changement; puisque le Probleme demande une ligne quisoit egale ’‘a BN & qui coupe la cote AC prolonge du cote de E, & le cote CD entre les pointsC & D.

12Afin que toutes les lignes qu’on a tirees egales a la donnee BN satisfissent au Probleme, ilfaudroit le proposer ainsi. Etant donne le quarre ABCD, & les cotez AC, CD etant prolongez,trouver toutes les lignes, qui 1 soient tirees par le point B, qui 2 coupent les cotez AC, CD,

Page 24: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

24 CAPITOLO 2. MENO PER MENO FA PIU

Si e osservato piu volte come la presenza di radici negative in un risultatoportasse a ritenere come il problema non fosse stato formulato correttamente inorigine e quindi a provvedere ad una adeguata riformulazione. In questo casol’atteggiamento e simile e coinvolge non solo le radici negative ma anche quellepositive. Due metodi a confronto, dunque: quello sintetico, tradizionale cheporta a trovare nulla piu di quanto cercato; il metodo della geometria analiticache, grazie all’abbinamento della geometria con l’algebra permette di ottenerepiu soluzioni di quelle attese ed obbliga ad una interpretazione del risultato.

Anche Frans van Schooten, nei Commentarii allegati alla versione latina dellaGeometrie pubblicata nel 1695, tratta diffusamente del problema di Pappo ma,determinate le quattro soluzioni, osserva

e possibile mostrare qui elegantemente l’impiego delle radici, tanto le false quanto

quelle vere, di alcune equazioni hanno in geometria e a quali condizioni possiamo

essere da loro condotte alla piena intelligenza di alcuni problemi; affiche non vi siano

casi che non scopriamo e di cui non giungiamo alla determinazione. Occorre sapere

infatti che, benche (come detto in precedenza) in aritmetica le radici vere indicano una

quantita maggiore di nulla e quelle false la mancanza di una certa quantita, ovvero di

quanto sono minori di nulla, similmente le radici vere in geometria indicano segmenti

[percorsi] nel verso come si propone di trovare mentre le radici false sono da assumere

in verso contrario, a partire dallo stesso punto13 ([9], p. 310)

Van Schooten aveva probabilmente presente il testo di Girard, anche perchele figure illustrative a pp. 311-312 di [9] coincidono con quella riportata daGirard; tuttavia si coglie una accettazione delle quantita negative meno ampiache in Girard: le soluzioni negative di qualche equazione hanno effettiva utilita apresentare il problema nella sua generalita. Anche per van Schooten, le soluzionitrovate, positive o negative, oltre a DF sorgono post aequationis resolutionem.([9], p. 313)

Non vi e prova migliore della difficolta che il modello economico dei numerinegativi pone prendendolo come base per dimostrare la regola dei segni, deltentativo effettuato in tal senso da Eulero che, nel 1770, scrisse un manualedi introduzione all’algebra che ebbe una certa fortuna, visto anche il prestigiodell’autore. Eulero, che aderisce ad una visione newtoniana di numero spiega lagenesi dei numeri naturali e degli interi relativi in questo modo:

I numeri positivi si ottengono aggiungendo 1 a 0, cioe a niente e continuando adaumentare in questo modo, sempre di una unita. Ecco l’origine dei numeri che vengono

et dont 3 la partie comprise entre ces deux cotez soit egale a une donnee BN .13Potest autem hic eleganter ostendi usus, quem radices tam falsae quam verae alicujus

aequationis in Geometria habent, ac quo pacto earum ope ad plenam alicujus Problematiscognitionem perducamur; sic ut nullus casus existat, quem non detegamus, atque ejusdemdeterminationem non inveniamus. Sciendum enim est, quod, quemadmodum verae radices inArithmetica (ut supra indicavimus) quantitatem aliquam designant majorem quanm nihilo,& falsae defectum alicujus quantitatis, seu quanto nihilo sunt minores, sic in Geometria veraeradices eas communiter lines designent, sensu illo, quales inveniendae proponuntur, at verofalsae, sensu contrario. Adeo ut si vera accipiantur in data recta indefinita, a dato punctoversus aliquod in ea punctum designatum, falsae in ipsa ab eodem puncto sume debeant versuscontrarium punctum.

Page 25: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.1. I NUMERI NEGATIVI 25

detti numeri naturali; di seguito, ecco i primi termini

0,+1,+2,+3,+4,+5,+6,+7,+8,+9,+10,

e via di seguito, all’infinito.Se pero, invece di continuare questa successione con addizioni ripetute, la si conti-

nuasse in senso opposto, sottraendo sempre una unita, si otterrebbe la serie seguente,dei numeri negativi

0,−1,−2,−3,−4,−5,−6,−7,−8,−9,−10,

e cosı via all’infinito. ([5], pp. 12-13)

Definite poi le operazioni di somma, sottrazione e prodotto, si sofferma sullaregola dei segni in questo modo:

§31 Sinora abbiamo considerato solo numeri positivi e non vi e alcun dubbio che i

prodotti che abbiamo formato non possano essere che positivi: cioe +a per +b de-

ve necessariamente dare +ab. Occorrera pero esaminare a parte il risultato della

moltiplicazione di +a per −b, e di −a per −b.§32 Iniziamo a moltiplicare −a per 3 o +3; siccome −a puo considerarsi come debito, e

chiaro che se si prende tre volte questo debito, esso dovra diventare tre volte piu grande

e, di conseguenza, il prodotto cercato e −3a. Similmente se si tratta di moltiplicare −aper b, si otterra −ba o, cio che e lo stesso, −ab. Concludiamo da cio, che, moltiplicando

una quantita positiva per una quantita negativa, il prodotto sara negativo; prendiamo

percio come regola che + per + fa + o piu e che, al contrario, + per −, o − per +

faccia − o meno.

§33 Resta ancora da risolvere il caso in cui − sia moltiplicato per − o, per esempio,

−a per −b. E anzitutto evidente che, quanto alla parte letterale, il prodotto sara ab;

e pero ancora incerto se davanti a questo prodotto occorra mettere il segno + o il

segno −; sappiamo solo che ci vorra uno o l’altro di questi segni. Ora, io dico che non

puo essere il segno −: perche −a per +b da −ab, e −a per −b non puo produrre lo

stesso risultato di −a per b; deve pero risultarne l’opposto, cioe +ab; come conseguenza

abbiamo questa regola: − moltiplicato per − fa piu, come + moltiplicato per +. ([5].pp. 20-22)

Dal punto di vista pedagogico l’esposizione e lacunosa: senza invocare laproprieta distributiva del prodotto rispetto alla somma ed il ruolo dello zero,non si capisce perche −a × −b debba essere opposto a −ab. Ossserviamo poiche, se il modello economico e perfetto per sdoganare le quantita negative, essolascia a desiderare quando lo si voglia usare per dedurre le operazioni: nelcaso −a × 3 esso funziona, mentre nel caso 3 × −a non funziona affatto, ameno di dar per scontata la proprieta commutativa del prodotto, come Eulerosembra lasciar intendere al §31 dove, in effetti, egli afferma che occorre esaminaresolo due casi: +a × −b e −a × −b. Vi sono altri due modelli che portano aduna introduzione naturale dei numeri negativi: il modello cronologico e quellotermologico. E abbastanza sorprendente, a parere mio, che il primo di questimodelli non abbia avuto una sufficiente fortuna, almeno nei manuali elementari,perche il riferimento al tempo e tanto radicato quanto quello dello spazio e,quindi del movimento. E ben vero che il tempo fluisce in un solo verso; e pero

Page 26: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

26 CAPITOLO 2. MENO PER MENO FA PIU

altrettanto vero che il tempo viene contato a partire da un’origine, un puntozero, che fa da spartiacque tra il prima ed il dopo. Cosı, la nascita di Cristo vieneassunta come anno 0, gli anni successivi vengono fatti corrispondere a numeripositivi, quelli precedenti a numeri negativi. Questo modello cronologico venneadoperato da diversi scrittori nel XIX secolo. Tra questi ricordiamo Adrien-Quentin Buee (1748-1826) sacerdote cattolico emigrato in Inghilterra nel 1792in quanto rifiuto di giurare fedelta alla Costituzione (pretre refractaire). Nel1806 egli pubblico il suo unico lavoro in matematica [11] che pero lo colloca trai primi ad aver proposto una teoria geometrica per chiarire il significato dellequantita immaginarie. Nella prima sezione di [11] Buee aveva esposto alcuneconsiderazioni sui segni + e − che eserciteranno un certo influsso su AugustinCauchy e George Peacock. Buee, che considerava l’algebra come un linguaggiomatematico (langue mathematique), criticando la visione newtoniana di algebracome aritmetica universale, considerava i segni + e − in due accezioni: comesegni delle operazioni aritmetiche di addizione e sottrazione e come segni dioperazioni geometriche, nel qual caso essi indicano direzioni opposte:

Se uno [di questi segni] significa che un segmento deve essere tracciato da sinistra verso

destra, l’altro significa che esso deve essere tracciato da destra a sinistra ([11], p. 23)

L’analisi del significato dei segni + e − diviene interessante procedendo nellalettura del lavoro di Buee:

per conoscere che cosa significhi il segno − davanti ad una lettera, occorre conoscereche cosa significherebbe il segno + davanti alla medesima lettera e prendere per − ilsignificato opposto.

Se, per esempio, +t significa un tempo passato, −t significa un tempo uguale ma

futuro. Se +p indica una proprieta, −p indica un debito dello stesso valore, ecc. ([11],p.24)

Infine, il modello termologico venne utilizzato da Joseph Diaz Gergonne perchiarire un equivoco sulla natura dello zero che, a piu riprese, aveva reso difficilel’accettazione delle quantita negative: se lo zero indica il nulla, le quantitanegative sono minori di nulla e dunque non possono esistere:

Mi si chiedera ora se considero le quantita negative isolate come maggiori o minori

di zero. (...) Distinguero dapprima due tipi di zero, cioe lo zero assoluto, simbolo di

un puro nulla, al di sotto del quale non puo conseguentemente trovarsi alcunche, ed

uno zero limite o punto di partenza, puramente convenzionale ed a cui si riferiscono

sempre le quantita considerate come positive e negative. Tale e, ad esempio lo zero del

termometro; il livello di riferimento da cui si parte per valutare rilievi ed avvallamenti;

l’epoca da cui partono le cronologie per fissare la data degli eventi, sia anteriori che

posteriori; ed e ancora l’origine delle coordinate in geometria analitica.14 ([25], pp.10-11)

14On me demandera maintenant si je considere les quantites negatives isolees comme plusgrandes ou comme moindres que zero? Avant de repondre a cette question, je distingueraid’abord deux sortes de zeros le zero absolu, symbole d’un pur neant, et au-dessous dequelconsequemment rien ne saurait se trouver, et un zero limite ou point de depart, qui est depure convention, et auquel se rapportent costamment les quantites considerees comme pouvantetre positives et negatives. C’est, par example, le zero du thermometre; c’est le plan de niveau

Page 27: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 27

Si tratta di una risposta importante anche perche fa emergere con chiarezzail carattere convenzionale del concetto di zero come punto di separazione tradue classi numeriche.

2.2 Compensazioni

Iniziamo la storia della regola dei segni dall’Aritmetica di Diofanto giuntaciincompleta. Diofanto parte da una definizione euclidea di numero:

Numero e una pluralita composta di unita.15 ([19], p. 3)

e dunque taglia fuori dal concetto di numero anche l’unita. Nonostante questarestrizione, proprio nell’Aritmetica si trova la prima formulazione corretta dellaregola dei segni:

Meno moltiplicato per meno fa meno e meno per piu fa meno.16 ([19], p. 13)

dove pero i termini minus e plus (λειψσ e υπαξισ) non indicano numerirelativi ma esprimono i concetti di cio che manca o non esiste e di cio che esiste.Oltre ad enunciare la regola, Diofanto ne fa delle applicazioni come, ad esempio,nel Problema 36 del libro quarto

Trovare tre numeri tali che il prodotto di due qualsiasi abbia un rapporto assegnato

con la loro somma.17 ([19], p. 287)

Detti x1, x2, x3 i tre numeri, Diofanto considera il caso numerico in cui

x1x2 = 3(x1 + x2) x2x3 = 4(x2 + x3) x3x1 = 5(x1 + x3) :

posto x2 = x ed espressi gli altri due numeri in funzione di x, il problema richiededi esprimere il prodotto (x − 3)(x − 4) che viene correttamente calcolato comex2 − 7x + 12, risultato che si ottiene solo applicando la regola dei segni cheDiofanto non giustifica. In epoca moderna, i matematici si sforzeranno spessodi giustificare la regola.

Nel 1494 Pacioli pubblico la Summa de aritmetica geometria proportioni etproportionalita in cui la regola dei segni viene enunciata in questi termini (cfr.[22], p. 321)

Piu via piu sempre fa piuMeno via meno sempre fa piuPiu via meno sempre fa meno

Meno via piu sempre fa meno.

duquel on part pour estimer les elevations et les abaissemens; c’est l’epoque de laquelle partentles chronologistes pour fixer les evenements, soit anterieurs soit posterieurs; et c’est encorel’origine des coordonnees dans la geometrie analitique.

15Omnes numeros compositos esse ex aliqua unitatum quantitate.16Minus multiplicatum in minus facit plus et minus in plus facit minus.17Invenire numeros tres tales ut binorum quorumvis productum ad summam rationem

habeat datam.

Page 28: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

28 CAPITOLO 2. MENO PER MENO FA PIU

Essa viene spiegata ricorrendo ad un esempio numerico, svolgendo il prodotto(10 − 2) × (10 − 2) = 64 e ricorrendo alla proprieta distributiva del prodottorispetto alla somma: dapprima Pacioli calcola i prodotti parziali 10× 10− 2 ×10 − 10 × 2 = 60 per cui −2 × (−2) = +4, se vogliamo ottenere il risultatocorretto.

Quanto a Rafael Bombelli, troviamo la regola dei segni nel Libro I della suaAlgebra ([8], p. 70):

per piu chiarezza di questo atto del moltiplicare se ne daranno piu essempij.

Piu via piu fa piu.Meno via meno fa piu.Piu via meno fa meno.

Meno via piu fa piu.

Questa regola viene illustrata su esempi di moltiplicazioni in cui i fattorisono scritti some se fossero binomij ([8], p. 70):

(6 + 4)× (5 + 2) (6 + 4)× (5− 2) (6− 4)× (5 − 2)

i cui risultati sono ovviamente noti e dove, applicando la proprieta distribu-tiva, si vede che la regola dei segni consente di riottenere i risultati corretti.Osserviamo come Bombelli non si allontani sostanzialmente in questi esempidall’impianto di Diofanto, di cui fra l’altro era profondo conoscitore. Piu avantiin [7] Bombelli propone una dimostrazione come meno via meno faccia piu, dinatura geometrica, posta subito dopo che e stata discussa la moltiplicazione didue binomi del tipo a+

√b. La figura a supporto dell’argomento di Bombelli e

sostanzialmente la Fig. qui riportata. Egli considera un segmento (una linea)gi di lunghezza

√18 da cui si vuole sottrarre un segmento m di lunghezza

√2

che viene riportato sul lato gi tramite il punto h tale che hg =√2. Occorre

trovare il valore del segmento hi. Per questo si costruisca il quadrato acgi, dilato gi e si tracci la parallela hb ad ag; riportato anche su ag un segmento gd dilunghezza

√2, si tracci per d la parallela a gi che intersechera in e il segmento

hb, determinando un quadrato abef il cui lato ha lunghezza pari al segmento hirichiesto. Ora, il quadrato abef e equivalente al quadrato acgi, di area pari a18 da cui viene sottratto lo gnomone bagifeb. Poiche sia il rettangolo bagh cheil rettangolo dgif hanno area

√36 = 6. A questo punto l’area del rettangolo

feih si ottiene sottraendo a questo valore, l’area del quadrato edgh che vale 2,e dunque ha valore 4. Da cio segue che l’area dello gnomone bagifeb vale 10 edunque quella del quadrato abef vale 8, cosicche hi =

√8. Quella di Bombelli

e la traduzione geometrica dell’operazione algebrica

8 = (√18−

√2)× (

√18−

√2)

eseguita in modo diverso perche dapprima egli calcola√18 ×

√18, l’area del

quadrato acgi, per sottarre quella del rettangolo bagh e (√18)× (−

√2) e quella

del rettangolo feih pari a quattro. Volendo ripercorrere fedelmente i passaggi

Page 29: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 29

abc

def

ghi

m

Figura 2.5: Argomento geometrico utilizzato da Bombelli per dimostrare laregola dei segni.

algebrici si sarebbero dovuti sottrarre l’area di bagh e quella, corrispondentea (−

√2) ×

√18 di dgif . Cosı facendo si sarebbe sottratta due volte l’area

del quadrato edgh che va ripristinata una volta, aggiungendo il valore positivoottenuto da (−

√2) × (−

√2), per ottenere il risultato corretto. La regola dei

segni ha ricevuto il suggello della dimostrazione geometrica che affianca, con paridignita in Bombelli, la regola enunciata in precedenza. Osserviamo che nel LibroIII dell’Algebra, Bombelli risolve alcuni problemi che hanno una formulazionesimile a quello di Diofanto discusso in precedenza.

Se Bombelli parte ancora da una concezione euclidea di numero, il belgaSimon Stevin (Stevino) espone nella Arithmetique del 1585 un concetto piuestensivo di numero, in quanto comprende l’unita:

Nombre est cela, par lequel s’explique la quantite de chascune chose. ([51], p. 495)

Stevino aggiunge una spiegazione (explication)

Come l’unita e il numero col quale la quantita di una cosa spiegata si dice uno: e due

[il numero] col quale la si definisce due: e meta [il numero] col quale la si chiama meta:

e radice di tre [il numero] col quale la si chiama radice di tre.18 ([51], p.495)

18Comme l’unite est nombre par lequel la quantite d’une chose expliquee se dict un: Etdeux par lequel on la nomme deux: Et demi par lequel on l’appelle demi: Et racine de troispar lequel on la nomme racine de trois.

Page 30: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

30 CAPITOLO 2. MENO PER MENO FA PIU

Per quanto vaga la spiegazione data da Stevino, essa evidenzia un punto impor-tante: tutti i numeri positivi sono posti sullo stesso piano: naturali, razionali edirrazionali. Inoltre, il numero e legato al concetto di quantita. Certamente e ildistacco dall’impianto euclideo cio che piu colpisce e Stevino ne e consapevoleal punto da aggiungere una riflessione sul fatto che l’unita sia un numero ([51],p. 496):

E nota l’opinione comune, che l’unita non sia affatto un numero ma solo il suo principio

o inizio e che essa sta al numero come il punto al segmento, cio che noi neghiamo

argomentando in questo modo:

La parte e della stessa materia del tutto,L’unita e parte della moltitudine di unita,

Ergo l’unita e della stessa materia della moltitudine di unita;ma la materia della moltitudine di unita e il numero,

Dunque la materia dell’unita e numero.

E chi lo nega, fa come chi neghi che un pezzo di pane sia fatto di pane.

Ora che l’unita e numero e che si e insistito sulla differenza tra punto edunita, chi prende il posto del punto in campo numerico?

L’unita e parte del numero, il punto non e parte della linea e cosı ancora: l’unita nonrappresenta come numero cio che il punto e per la linea. Chi dunque gli corrisponde?Io dico che e lo 0 (che viene detto comunemente Nulla, e che noi chiamiamo principionella successiva definizione 3a) cio che non solo testimonia le loro somiglianze ma anchegli innegabili effetti. Le somiglianze sono queste:

Come il punto viene aggiunto ad un segmento senza esserlo, cosı 0 si aggiunge adun numero, senza che lo sia.

Come il punto non si divide in parti, cosı lo zero non si divide in parti.

Come molti punti, fossero pure infiniti non sono un segmento, cosı tanti 0, ancheuna moltitudine infinita, non sono un numero.

Come il segmento AB ne si puo accrescere aggiungendogli il punto C, cosı non e

possibile aumentare il numero D[=]6 aggiungendogli E[=]0 perche aggiungendo 0 a 6

non si ha che 6.

Stevino supera la concezione euclidea di numero ma non l’idea euclidea disegmento, in virtu della quale un segmento non e composto da (infiniti) punti.La corrispondenza non e tra numeri e punti di una semiretta ma tra numeri esegmenti e lo 0 vede sacrificata la propria identita di numero perche nell’analogiagioca il ruolo del punto. Stevino va oltre e, per conservare la corrispondenza trasegmenti e numeri compie un’analogia un po’ ardita.

Tuttavia, se si ammette che [il segmento] AB sia prolungabile fino al punto C in

modo che AC sia un segmento continuo, allora AB e accresciuta grazie al punto C; e

similmente si si ammette che D[=]6 sia prolungato fino ad E[=]0 cosicche DE[=]60

dia un numero continuo che fa 60 allora D=6 si aumenta grazie allo zero.

Il valore [posizionale] delle cifre viene visto in corrispondenza dell’operazionegeometrica di prolungare un segmento fino a raggiungere un punto.

Page 31: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 31

Nel libro II della Arithmetique, Stevino considera le operazioni tra i numeriinteri, razionali ed irrazionali (un nome, quello di irrazionale, che Stevino rifiu-ta categoricamente) per poi passare alle regole per il prodotto dei multinomiradicali interi cioe di espressioni quali a − b o c − d. Egli enuncia il teoremaseguente

Piu moltiplicato per piu da piu per prodotto, e meno moltiplicato per meno, da piu

per prodotto, e piu moltiplicato per meno da meno o meno moltiplicato per piu da

meno come prodotto. ([51], p. 560)

La dimostrazione di Stevino segue uno schema ternario, i cui primi due puntisono di natura pedagogica dal momento che costituiscono la spiegazione del dato(explication du donne) e della tesi (explication du requis). Per spiegare i dati,Stevino considera i binomi interi 8 − 5 e 9 − 7 da moltiplicare tra loro. ComePacioli, utilizza la proprieta distributiva per calcolare il risultato del prodotto.La spiegazione della tesi si riduce ad una riproposizione dell’enuciato utilizzandoi simboli + e −, invece delle parole. La dimostrazione si articola in due parti:anzitutto Stevino osserva che, essendo 8 − 5 = 3 e 9 − 7 = 2, il prodottovero (vrai produict) deve essere 6, che e compatibile solo con la regola dei segnienunciata nel teorema. Egli propone poi una dimostrazione geometrica (Figura

G

E

F

A

D

C

B

3 3

5 5

2

2

6

7

7

10 35

21

Figura 2.6: Argomento geometrico utilizzato da Stevino a supporto della validitadella regola dei segni ([51], p. 561).

2.6) in cui si costruisce il rettangolo DE sui segmenti AD = 8 e AE = 9per poi staccare su questi i segmenti AB = 8 − 5 = AD(= 8) − DB(= 5) eAD = AE(= 9)− CE(= 7). Il prodotto richiesto e l’area del rettangolo di latiAB e BC, il cui valore 6 e cio che serve da aggiungere alle aree dei rettangoliCG e BF per ottenere l’area del rettangolo ED.

Page 32: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

32 CAPITOLO 2. MENO PER MENO FA PIU

Come Bombelli, anche Stevino applica la regola per ricomporre il risultatodi un prodotto tra quantita positive che vengono viste come differenze tra altrequantita positive.

Come Stevino, anche Newton si distacchera dalla concezione euclidea dinumero ma, a differenza di Stevino, la sua definizione e precisa:

Intendiamo con numero non tanto una moltitudine di unita, quanto il rapportoastratto di una quantita qualsiasi con un’altra dello stesso genere che viene presaper unita.19 ([36], p. 4)

Viete parla della regola dei segni nella In Artem analyticem Isagoge [54]dove stabilisce le regole da rispettare nel fare algebra. Nel capitolo IV di questolibretto su cui torneremo in seguito, Viete opera la distinzione fondamentaletra logistica numerosa e logistica speciosa, cioe tra il calcolo numerico e quelloletterale, segnando un confine netto tra artimetica ed algebra in senso stretto:il calcolo numerico e quello che si esegue operando tramite numeri, il calcolodelle specie e quello che opera ricorrendo alle specie o alle forme delle grandezze,grazie al ricorso di lettere dell’alfabeto, ad esempio.20 ([54], p. 4)

Entrambe le logistiche ubbidiscono alle regole (praecepta canonica), dellequattro operazioni fondamentali di addizione, sottrazione, moltiplicazione edivisione: in questa sede e dato rilievo alla regola dei segni.

Parlando della sottrazione, Viete enuncia correttamente che A− (B +D) =A−B −D e, quando deve considerare A− (B −D) afferma, come e giusto chesia, A− (B −D) = A−B +D fornendo questa giustificazione:

Se ora si toglie D da B e B−D viene sottratto ad A, il residuo sara A meno B piu D

perche sottraendo B si sottrarra una grandezza maggiore del dovuto che deve essere

compensata dall’addizione della grandezza D.21 ([54], p.5)

Passando alla regola dei segni, Viete dapprima enuncia la proprieta distri-butiva del prodotto rispetto alla somma e poi osserva che il prodotto di unaquantita positiva per un’altra quantita di segno indeterminato assume il segnodi quest’ultima. Come conseguenza di questa regola (praeceptum) Viete deducela regola dei segni. Considerando il prodotto (A − B)(D − G) egli richiamache A(−G) =−AG perche altrimenti il prodotto di A con (D−G) non sarebbesvolto in modo accurato in quanto bisogna diminuire A×D; similmente quandosi svolge il prodotto −B(D−G), fermandosi a −BD si commetterebbe un erroreche occorre compensare aggiungendo BG.

Poiche il tutto e uguale alle sue parti, cosı i prodotti con i segmenti di una certa

grandezza sono uguali al prodotto con l’intera grandezza. E quando una grandezza

positiva viene moltiplicata per un’altra grandezza positiva, il risultato sara positivo,

per una grandezza negativa, negativo. Conseguenza di questa regola e che il prodotto

19Per numerum non tam multitudinem unitatum quam abstractam quantitatis cujusvis adaliam ejusdem generis quantitatem que pro unitate habetur rationem intelligimus.

20Logistice numerosa est quae per numeros, speciosa quae per species seu rerum formasexhibetur, utpote per Alphabetica elementa.

21At si iam negetur D de ipsa B, & B minus D ab A subtrahenda sit, Residua erit A minusB plus D, quoniam subtrahendo B magnitudine subtrahitur plus æquo per magnitudinem D

ideo additione illius compensandum.

Page 33: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 33

di due grandezze negative e positivo in quanto se si moltiplica A − B per D − G, il

risultato del prodotto tra A che e positiva e l’opposto di G, rimane negativo perche

altrimenti si sottrarrebbe troppo ed il prodotto con A non sarebbe accurato cosicche

per compensare l’errore occorre che il prodotto tra grandezze B e G entrambe negative

sia positivo.22 ([54], pp.5-6)

L’argomento di Viete incontro una certa fortuna, tanto che lo si trova so-stanzialmente immutato in testi di molto posteriori: ad esempio nel Cours deMathematiques di Etienne Bezout [7] che si esprime in questi termini, illustrandola regola nel caso del prodotto (a− b)× (c− d):

In effetti, siccome il moltiplicatore e piu piccolo di c di una quantita pari a d, occorre

che non si prenda il moltiplicando se non un numero di volte quante unita sono in c di-

minuito di d; siccome non e possibile fare questa riduzione prima della moltiplicazione,

si puo prendere dapprima a− b tante volte quante sono le unita in c, cioe moltiplicare

a − b per c e poi sottrarre a − b preso tante volte quante unita sono contenute in d,

cioe a dire, togliere il prodotto di a− b per d. ([7], p.18)Si trova ripetuto l’argomento di Viete anche nelle Lecons elementaires des

mathematiques [28] dell’abate e celebre astronomo Nicolas Louis de La Caille(1713-1762). Le Lecons furono pubblicate per la prima volta nel 1741 e furonoriviste dall’abate Joseph-Francois Marie (1738-1801). Dopo aver enunciato laregola dei segni, all’articolo 127 Lacaille osserva:

Occorre ora dimostrare la regola dei segni23

E procede con l’argomento di Viete, corroborato dall’argomento adoperatoda Mac Laurin che fa leva sull’introduzione dello zero (si veda Sez. ...). Eppure,dopo tanto sforzo, Marie24 deve riscontrare che gli argomenti e le dimostrazioni(preuves) addotte non sono sufficienti a diradare i dubbi di alcuni, poco avvezzial linguaggio algebrico. Marie abbozza, al §128, anche una possibile causa diquesta ostinata resistenza:

Malgrado questi ragionamenti e dinostrazioni, bisogna tuttavia convenire che adun orecchio poco aduso al linguaggio algebrico risulti piuttosto strano sentireche −a moltiplicato per −a dia +a2.

Quella sorta di imbarazzo e di dubbio che questo risultato caso provocadi prim’acchito, sembra provenire principalmente dall’espressione stessa dellaparola “moltiplicato” che, non essendo entrata in uso in aritmetica che per

22Quoniam totum est suis partibus æquale, ideoque facta sub segmentis alicuius magnitu-dinis æquantur facto sub tota. Et cum adfirmatum unius magnitudinis nomen ducetur inalterius quoque magnitudinis nomen adfirmatum, quod fiet erit adfirmatum, & in negatum,negatum. Cui præcepto etiam consequens est ut ductione negatorum nominum alterius inalterum, factum sit adfirmatum, ut cum A − B ducetur in D − G, quoniam id quod fit exadfirmata A in G negatam, manet negatum, quod est nimium negare minuereve, quando-quidem A est ducenda magnitudo producta non accurata. Et similiter quod fit ex negataB in D adfirmatam, manet negatum, quod est rursum nimium negare quandoquidem D estducenda magnitudo producta non accurata, ideo in compensationem dum B negata duciturin G negatam factum est adfirmandum.

23Maintenant il faut demontrer la regle des signes.24Credo si tratti di un’aggiunta di Marie all’edizione del 1784 perche nell’edizione del 1770,

che Marie aveva gia notevolmente ampliato, le considerazioni che seguono non sono presenti.

Page 34: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

34 CAPITOLO 2. MENO PER MENO FA PIU

indicare l’addizione ripetuta di una stessa quantita positiva, deve naturalmenteoffrire un significato ambiguo, quando se ne faccia uso per indicare una verasottrazione di quantita negative.25

Mi soffermo ancora un poco sull’opera di Lacaille per notare una circostanzacuriosa, legata alla traduzione italiana delle Lecons a cura degli scolopii StanislaoCanovai e Gaetano Del-Ricco: in particolare mi riferisco alla traduzione apparsaa Firenze nel 1791. Si tratta di un’edizione con nuove illustrazioni e aggiunte,come recita lo stesso frontespizio. Per la regola dei segni, si direbbe pero che itraduttori abbiano tolto qualcosa, anziche aggiunto. Parlando della sottrazionealgebrica essi riconoscono, come Lacaille, che

Non si riconosce egualmente bene che per indicare la sottrazione di una quantita −a,bisogni scriver +a:

ciononostante, quando si passa alla moltiplicazione, non solo omettono la dimo-strazione di Lacaille ma osservano

E pero assurdo il dire che +×+ da +, che +× − da − ec. perche si moltiplicano le

quantita, non i segni: ma l’uso autorizza queste espressioni. ([29], p. 50)

Si tratta di un passo indietro rispetto anche a Bombelli che, con la sua forma-lizzazione, aveva isolato i segni dai numeri. Qui invece i segni sono totalmenteassorbiti dai numeri e non hanno, se non per omaggio alla tradizione, la pos-sibilita di ricombinarsi tra loro. Non si tratta di un caso isolato: A. Amiot,nella seconda edizione delle sue lezioni di algebra del 1860 (!), commenta cosı laformulazione diffusa della regola dei segni:

Nelle applicazioni questa regola dei segni si scompone in quattro parti, enunciate inquesto modo:

+ moltiplicato per + da ++ moltiplicato per − da −+ moltiplicato per − da −− moltiplicato per − da +

26 ([2], p. 28)

25Malgre ces raisonnements et ces preuves, il faut pourtant convenir qu’il est assez etrangepour des oreilles peu faites au langage algebrique, d’entendre dire que −a multiplie par −a

donne +a2.L’espece d’embarras et de doute que ce resultat occasionne au premier abord, semble ve-

nir principlement de l’expression meme du mot multiplie, lequel n’ayant ete mis en usagedans l’Arithmetique, que pour signifier des additions repetees d’une meme quantite positive,doit naturellement offrir un sens louche, quand on le fait servir pour marquer une veritablesoutraction des quanties negatives.

26Dans les applications cette regle des signes se decompose en quatre parties q’on enoncede la maniere suivante:

+ multiplie par + donne ++ multiplie par − donne −+ multiplie par − donne −− multiplie par − donne +

bien qu’on ne puisse faire aucun operation de calcul sur les signes + et − qui ne sont pas desquantites.

Page 35: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 35

Affermazione che non figura piu nella quinta edizione del 1878 anche se l’au-tore non rinuncia a riformulare la frase che anticipa la regola come: Dans lesapplications, on se sert souvent des locutions vicieuses ([3], p. 29). Sia pureche si tratti di criticare una espressione semplicistica della regola, ciononostantela frase sull’impossibilita di moltiplicare i segni sorprende un poco, se si pensaalla formulazione che ne aveva data Augustin-Louis Cauchy in un testo tantoinfluente e diffuso come il Cours d’Analyse Mathematique, pubblicato nel 1821.Nella prima parte, dedicata all’analisi algebrica, Cauchy introdusse la distinzio-ne tra numero e quantita: per numero, Cauchy intende la definizione aritmeticadi stampo newtoniano come misura assoluta di grandezze. La nozione di quan-tita viene collegata ai numeri preceduti dai segni + o −. Le quantita servonoad esprimere un accrescimento od un decremento ed il segno + o − posto da-vanti ad un numero ne modifichera il significato, come fa un aggettivo con unsostantivo ([16], p.2): di questa analogia linguistica Cauchy e debitore a Buee.Cauchy afferma che

In algebra non solo i numeri, ma anche le quantita sono rappresentate da lettere.

Poiche si e convenuto di porre i numeri assoluti nella classe delle quantita positive,

possiamo indicare la quantita positiva che ha A come valore numerico, sia attraverso

+A che A soltanto, mentre la quantita negativa opposta viene rappresentata da −A.Similmente, nel caso in cui la lettera a rappresenti una quantita si conviene di ritenere

sinonimi le due espressioni a e +a e di rappresentare con −a la quantita opposta a

+a. Queste osservazioni sono sufficienti per stabilire quanto e noto col nome di regola

dei segni ([16], pp. 3-4)

Cauchy rimanda alla Nota I al termine del I volume del Cours per una discus-sione della regola. Qui, richiamati i concetti esposti all’inizio del corso, Cauchysi esprime in questi termini:

Se con A rappresentiamo sia un numero sia una quantita qualsiasi, e si pone

a = +A , b = −A,

si avra+a = +A +b = −A−a = −A −b = +A.

Se nelle ultime quattro equazioni vengono reinseriti, al posto di a e b i loro valori traparentesi, si otterranno le formule

+(+A) = +A , +(−A) = −A,−(+A) = −A , −(−A) = A,

(1)

In ciascuna di queste formule il segno del secondo membro e quello che si chiama ilprodotto dei due segni del primo membro. Moltiplicare due segni tra loro, significaformarne il prodotto. Un solo sguardo alle equazioni (1) basta a stabilire la regola deisegni, compresa nel teorema che ora enuncio:

I Teorema. Il prodotto di due segni simili e sempre + ed il prodotto di due segni

opposti e sempre −. ([16], pp.404-405)Osserviamo alcuni fatti relativi a questa formulazione. Anzitutto, aumenta il

grado di astrazione: Cauchy non sente il bisogno di modelli od esempi numerici

Page 36: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

36 CAPITOLO 2. MENO PER MENO FA PIU

concreti a supporto della regola. Cauchy enuncia ancora la regola all’internodi un teorema, non di una definizione. Egli poi insiste sul fatto che vengonomoltiplicati i segni, slegando la validita della regola alla natura delle quantitacui essa viene applicata:

Una conseguenza immediata delle definizioni precedenti e che la moltiplicazione dei se-

gni non ha alcun rapporto con la moltiplicazione dei numeri. Cio non deve sorprendere

se si osserva che la nozione di prodotto di due segni si presenta fin dai primi passi che

si muovono in analisi, visto che nell’addizione o sottrazione di un monomio, il segno

di questo monomio viene veramente moltiplicato per il segno + o −. ([16], p. 406)Credo che questa asserzione evidenzi la distinzione tra gli elementi di un insiemee la struttura che viene indotta in esso grazie alle proprieta delle operazioni chemettono in relazione elementi dell’insieme stesso.

L’argomento di Viete fu utilizzato anche in un testo particolare: gli Elemensd’algebre di Alexis Claude Clairaut (1713-1768) che ora esaminiamo basandocisulla quarta edizione, apparsa nel 1768. Anzitutto si segnala la difficolta per iprincipianti e l’imbarazzo dei loro maestri:

Tra tutte queste operazioni [aritmetiche], la moltiplicazione e quella alla quale si arre-

stano i principianti e la cui spiegazione imbarazza maggiormente i maestri: il principio

che essa comprende, che due quantita negative abbiano per prodotto una quantita

positiva, e pressoche sempre lo scoglio degli uni e degli altri.27 ([15], p. vj)

Individuato il malanno, il rimedio proposto da Clairaut e quello di postici-pare il momento in cui la regola (ce principe) viene stabilita, dopo aver fattosvolgere delle operazioni in cui la sua necessita viene avvertita, precisamente:

Inizio con l’insegnare come moltiplicare una quantita composta do piu termini positivi

e negativi per un solo termine che suppongo sempre positivo, perche e di solito difficile

abituarsi a considerare una quantita negativa come esistente da sola.28 ([15], p. vj)

Fatto questo, Clairaut passa al caso in cui anche il moltiplicatore e diffe-renza di quantita positive e negative. A questo punto della trattazione non edifficile notare che Clairaut non sta facendo altro che ripetere la strada battutada Viete e da molti altri prima di lui. Cio che e interessante e che egli metta inluce le motivazioni pedagogiche che rendono questo modo di procedere adattoa superare lo scoglio della regola dei segni: al termine della lettura di questepagine di Clairaut si ha l’impressione di un esercizio di maieutica perche il pro-cedimento che egli illustra tende proprio a far gustaree gradualmente al discenteun contenuto sulle prime indigesto. Clairaut ritiene che

In questo modo, abituo i principianti alla moltiplicazione, senza avere necessita di

enunciare quelle regole ordinarie, che meno per piu, moins per moins fa piu, ecc. le

27La multiplication est de toutes ves operations celle qui arrete le plus les Commencans,& dont l’explication embarasse le plus les maıtres: ce principe qu’elle renferme, que deuxquantites negatives donnent pour leur produit une quantite positive, est presque toujoursl’ecueil des uns & des autres.

28Je commence par enseigner a multiplier une quantite composee de plusieurs termes positifs& negatifs par un seul terme que je suppose toujours positif, parce que l’on ne s’accoutumepas ordinairement a considerer une quantite negative, comme existant seule.

Page 37: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.2. COMPENSAZIONI 37

quali, presentandosi contradittorie all’orecchio, lasciano quasi sempre credere che ci

sia contraddizione effettiva.29 ([15], p. vij)

Insomma, la regola dei segni “suona male” e lascia intendere a chi non eesperto che si stia giocando con le parole, gettando un velo sinistro sul fonda-mento razionale dell’algebra tutta: porre ogni cura nell’evitare fraintendimentie importante perche ne va dell’onore di chi insegna i principi dell’algebra!

Eppure vi e un’obiezione che potrebbe essere sollevata:

Si puo ritenere senz’altro che non avvia fatto altro che eludere la difficolta e l’avrei

certamente elusa se non parlassi di moltiplicazione tra quantita puramente negative

per altre pure tutalmente negative, operazione nella quale non si potrebbe evitare la

contraddizione apparente di cui ho fatto cenno.30 ([15], p. viij)

Vi e piena consapevolezza del fatto che l’argomento classico a la Viete ri-chieda un supplemento per potere essere accettato pienamente in algebra, cosıcome la regola dei segni appariva pienamente legittima in aritmetica. Anchequi l’approccio di Clairaut e, per cosı dire “dal basso”: egli conduce il lettoread esaminare un problema in cui egli e obbligato a considerare

quantita negative indipendentemente dalla presenza di quantita positive da cui esse

vengano sottratte.31 ([15], viij)

A questo punto vi e una nuova virata perche, nel momento in cui presentaun problema che conduce al prodotto tra quantita negative

prendo la decisione che senza dubbio presero i primi analisti che dovettero svolgere

queste operazioni, e che vollero seguire una strada completamente sicura: cerco una

soluzione del problema grazie alla quale sia possibile evitare ogni tipo di moltiplicazione

o divisione tra quantita negative. In questo modo ottengo il risultato senza adoperare

ragionamenti se non quelli su cui non ci puo essere dubbio alcuno; trovo cosı cio che

dovevano essere quei prodotti o quozienti di quantita negative ottenuti nella prima

soluzione. Non e allora difficile di trarne quei principi tanto noti che meno per meno

fa piu, etc.32 ([15], pp. viij-ix)

Vediamo all’opera questo procedimento nel problema riportato all’articoloLVI:

29Par ce moyen, je familiarise les Commencans avec la multiplication, sans que j’aie seule-ment besoin d’enoncer ces principes ordinaires, que moins par plus, moins par moins donneplus, &c. qui, en presentant a l’oreille une contradiction dans les mots, laissent presquetoujours croire qu’il y a dans les choses.

30On pourroit croire d’abord que je n’ai fait qu’eluder la difficulte, & je n’aurois faitreellemente que l’eluder si je ne parlois pas de la multiplication des quantites purementnegatives, par d’autres quantites aussi entierement negatives, operation dans laquelle on nescauroit eviter la contradiction apparente dont je viens de parler.

31quantites negatives independamment d’aucunes quantites positives dont elles soientretrachees.

32je prends le parti qu’ont sans doute prise les premiers Analystes qui ont eu de cesoperations a faire, & qui ont voulu suivre une route entierement sure, je cherche une so-lution au Probleme par laquelle je puisse eviter toute espece de multiplication ou de divisionde quantites negatives, par ce moyen j’arrive au resultat, sans employer d’autre raisonnemens,que ceus sur lesquels on ne peut former aucun doute; & je vois ce que doivent etre ces produitou quotiens des quantites negatives que m’avoit donnes la premiere solution. Il n’est pasdifficile ensuite d’en tirer ces principes si fameux que moins par moins donne plus, &c.

Page 38: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

38 CAPITOLO 2. MENO PER MENO FA PIU

Due sorgenti che sgorgano ciascuna in modo uniforme, hanno riempito insieme un

contenitore a, la prima sgorgando durante un intervallo di tempo b, l’altra durante

un intervallo c; le medesime sorgenti hanno riempito un altro recipiente d; la prima

sgorgando per un tempo e, la seconda per un tempo f : si domanda la portata di

ciascuna sorgente.33 ([15], p. 68)Dette x ed y le quantita d’acqua erogate dalle due sorgenti al giorno, il

problema equivale a risolvere il sistema lineare

bx+ cy = aex+ fy = d

(2.7)

che ammette la soluzione

x =dc− af

ce− bfy =

ae− bd

ce− bf.

Per vederne delle applicazioni, Clairaut tratta dei casi particolari e, quandopone a = 120, b = 4, c = 6, d = 190, e = 3, f = 7, la formula risolutiva (2.7)fornisce x = 300

−10e y = −400

−10, soluzione che Clairaut commenta in questi termini

La prima volta in cui si sono trovati valori simili, cioe delle quantita negative divise per

quantita negative e delle quantita positive, divise per delle negative, si sara provato

imbarazzo nel capire che cosa sovessero significare e coloro che avessero temuto di

compiere dei viziosi argomenti metafisici, avranno tentato di riprendere la questione

un po’ prima, per evitare questo tipo di divisioni.34 ([15], pp. 71-72)

Nell’esempio considerato, inserendo i valori scelti per i parametri in (2.7), losi trasforma in

4x+ 6y = 1203x+ 7y = 190

e si ricava x da entrambe le equazioni come x = 30 − 3

2y ed x = 190

3− 7

3y.

Uguagliando questi valori si ottiene y = 40 che, inserito a sua volta nella primaespressione di x, fornisce x = −30, che coincide con il risultato precedente, senzascomodare la regola dei segni. Al contrario, questo argomento serve a Clairautper corroborare la plausibilita della regola dei segni. Certo, un esempio da solonon e un teorema

Mais s’il est facile qu’on se doute, pour ainsi dire, de ces principes, on sent bien aussi

qu’on ne sauroit les affirmer qu’apres y avoir fait beaucoup de reflexions, & il y a

apparence que les premiers Analistes n’en auront ete surs qu’apres les avoir verifies

dans beaucoup d’exemples. ([15], p. 73)

33Deux sources qui coulent chacune uniformement, ont rempli ensemble un reservoir a, l’uneen coulant pendant un temps b, l’autre pendant un temps c; les deux memes sources ont rempliun autre reservoir d; la premiere coulant pendant le temps e, la seconde pendant le temps f :on demande la depense de chacune de ces sources.

34La premiere fois qu’on aura trouve de semblables valeurs, c’est a dire, des quantitesnegatives divisees par des quantites negatives, & des positives, divisees par des positives, onaura du etre embarasse a savoir ce qu’elles devoient signifier, & ceux qui auront craint defaire de mauvais argumens metaphysiques, auront cherche a reprendre la question un peu plushaut, afin d’eviter ces sortes des divisions.

Page 39: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.3. UNA SINGOLARITA: GOTTFRIED WILHELM LEIBNIZ 39

Ed ecco che Clairaut finalmente dimostra alla Viete la regola dei segni arricchitoda questa considerazione

Con questo metodo, si vede molto chiaramente che il prodotto di una quantita come

a − b per un’altra c − d deve essere ac − bc − ad + bd; (...) Non resta dunque altro

da sapere se, allorquando due quantita negative come −b e −d non sono precedute da

alcuna quantita positiva, il loro prodotto sia ancora +bd. Ora, e facile riconoscere che

e cosı, in quanto il metodo grazie al quale si e scoperto che il prodotto di a − b per

c − d e ac − bc − ad + bd, non specifica alcun valore particolare ne per a ne per c e

dunque deve essere ancora valido quando queste quantita sono uguali a zero.35 ([15],pp. 73-74)

Non ci puo essere confessione piu piena di questa che dichiari come la validitadella proprieta distributiva venisse considerata come ovvia nel passaggio dainumeri naturali ai numeri relativi. Questo passaggio di Clairaut si pone insintonia con il modo tenuto da Rolle ottant’anni prima nel dedurre la regola deisegni tra quantita negative che esamineremo piu avanti.

2.3 Una singolarita: Gottfried Wilhelm Leibniz

La posizione di Leibniz (1646-1716) sulla regola dei segni merita attenzioneperche si distacca dalle presentazioni degli altri contemporanei in diversi pun-ti. Nella Mathesis Universalis, egli introduce le quantita negative sul modellodei debiti e crediti e ne mette in luce una particolare virtu: la loro comparsanella risposta di un problema indica in quale modo la domanda contenuta nelproblema dovesse essere formulata e in quale modo si debba rispondere ad essa.

Spesso si presentano nel calcolo delle quantita negative, quando da un numero minore

se ne debba sottrarre uno maggiore, e anche se non sembrano rispondere alla questione,

in realta vi rispondono nel modo piu adeguato, non soltanto infatti indicano che la

domanda era stata mal formulata (benche si debba perdonare, perche non fu possibile

prevederlo), ma anche [indicano] in qual modo la si doveva formulare e che cosa occorre

rispondere per comprenderla correttamente. ([31], p. 70)

Il problema che Leibniz usa per illustrare quanto appena asserito e quellodel solito Tizio che ha piu debiti che crediti e quindi alla fine dei conti:

E evidente [...] che perda tutta quella somma quale e provvista del segno −.

Quindi qui il segno negativo e aderente alla somma (positiva) di denaro e latrasforma in un debito. Se la differenza tra crediti e debiti, a− b viene indicatacon x, nel caso in esame si ha x = −c dove c > 0 e la grandezza (molem), comunesia a +c che a −c. Leibniz osserva:

35Suivant cette methode, on voit tres clairement que le produit d’une quantite telle que a−b

par une autre c− d doit etre ac− bc− ad + bd; (...) Il ne rest donc plus q’a savoir si lorsquedeux quantites negatives telles que −b & −d ne seront precedees d’aucune quantite positive,leur produit sera encore +bd. Or, c’est ce donc il est facile de reconnoıtre la verite, puisque lamethode par laquelle on a decouvert que le produit de a− b par c− d etoit ac− bc− ad+ bd,ne specifiant aucune grandeur particuliere ni a a ni a c, doit avoir encore lieu lorsque cesquantites sont egales a zero.

Page 40: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

40 CAPITOLO 2. MENO PER MENO FA PIU

Viceversa, appare evidente che, se egli perde x ovvero −c, egli guadagna ed un giudice

che all’erede tolga tale eredita x, attribuira allo stesso la somma c; pertanto la sottra-

zione di una quantita negativa e l’addizione di una quantita affermativa della stessa

grandezza. (...) E cio e quello che comunemente si dice, [che] − per − fa +. ([31], p.70)

Mi sembra degno di nota che Leibniz distingua i due significati coesistentinel segno −: quello di attributo di una quantita che ne cambia la natura, dapositiva a negativa; quello di operazione aritmetica tra due numeri. Inoltre,Leibniz enuncia (parte) della regola dei segni parlando di sottrazione e nondi moltiplicazione: e il condono di un debito—vista come sottrazione di unaquantita negativa—che richiede la combinazione di due segni negativi. Leibnizritorna sulla regola in un altro passo, contenente le dimostrazioni degli elementidell’addizione e della sottrazione, come dell’uso dei segni + e − e dove, un po’a sorpresa per il lettore moderno, partendo dall’assioma a = a, egli deducedue teoremi: se a = b, allora anche b = a; se a = b e b = c, allora a = c. Inaltre parole, egli ritiene che le proprieta simmetrica e transitiva dell’uguaglianzasiano filiazioni della proprieta riflessiva che viene assunta come nozione evidente.Procede a dimostrare come evidente (Theorema (8)) che +a + b = +b + a edintroduce (Explicatio (10)) il segno di 0 (signum 0) per indicare l’elementoneutro dell’addizione: +0 + a = +a per mostrare la proprieta invariantiva: sea = ℓ e b = m, allora a ± b = ℓ ± m. Grazie ad essa, ed alla definizione di0 = b − b, Leibniz dimostra che, da a + b = e deve seguire che a = b − e, cosıcome, se a = −b, allora si deve avere anche b = −a. Infatti, per la proprietainvariantiva, da a = −b segue anche a+ b = b− b = 0 e dunque, per il risultatoappena mostrato, b = −a. Da qui Leibniz dimostra anche che

−a− (−a) = 0

in questo modo: se si pone −a = f , si ha anche f = −a e siccome f − f = 0,ne segue la tesi. Da qui egli ottiene che

−− a = a :

infatti, gia sappiamo che −a − (−a) = 0 = a − a per cui il risultato segueaggiungendo a ad ambo i membri, grazie alla proprieta invariantiva. Anche lerestanti porzioni della regola dei segni − + a = −a e + − a = −a seguono dairisultati ottenuti da Leibniz in questa sezione.

Introdotta la moltiplicazione come addizione ripetuta, Leibniz da delle giu-stificazioni economico-giuridiche alle quattro articolazioni della regola dei segni.

a) ++ = + (ponere ponens est ponere): chi ti dona il diritto di 100 denari,che puoi esigere quando vuoi, egli ti dona 100 denari ovvero +(+100) = +100.Leibniz dimostra poi, servendosi della proprieta dell’unita di essere elementoneutro per il prodotto, che:

b) +− = − (ponere tollens est tollere). Qui la spiegazione e piuttosto originalee curiosa:

Page 41: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.4. IL RUOLO DELLO ZERO 41

come se ti donassi un animale assolutamente di nessun valore alla condizione che tu lo

mantenga e nutra, il mio dono sara piuttosto una pena tanto piu grande quanto piu

vorace e l’animale.

c) −+ = − (tollere ponens est tollere). Leibniz e consapevole che questo casosegue dal precedente invocando la commutativita del prodotto, posta come ovviaproprieta in precedenza ma aggiunge ancora una spiegazione: se ti nego il dirittoa cento denari da esigersi tranquillamente, saranno negati cento denari o -1×(+100) = −100.

d) −− = + (tollere tollens est ponere). Viene spiegata con questo esempio: se titogliessi quell’animale inutile e vorace che ti eri preso a condizione di nutrirlo,e ti liberassi da quell’onere, sembrera che ti doni tanto quanto il danno chequell’animale fino a quel momento fosse in grado di arrecare ad un altro.

2.4 Il ruolo dello zero

Attorno al 1690, Michel Rolle (1652-1719) pubblico un Traite d’Algebre dove,dopo aver spiegato con i consueti modelli finanziari o cinematici il senso del-l’essere una quantita minore di nulla, egli offre tre argomenti per illustrare laregola dei segni:

I principianti fanno fatica a capire perche il segno − si cambi in + nella sottra-zione dei numeri negativi e perche il numero che resta superi quello dal quale sie partiti per la sottrazione. Ecco diversi modi per spiegarlo. ([45], pp. 16-17)

Rolle utilizza la regola sull’esempio numerico 14 − (−2) = 16 con questi treargomenti

1) Si suppone dapprima di dover sottrarre da 14 il numero 5-2: 14− (5− 2).Rolle osserva, come Viete, che se si sottrae 5 da 14 si sottraggono due unita ditroppo che vanno ripristinate per cui 14− (5− 2) = 14− 5 + 2.

Se si sopprime il 5, ovvero se si suppone che al posto del 5 non vi sia niente,allora il 5-2 da sottrarre si cambia in -2 e la sottrazione passa da 14 − 5 + 2 a14 + 2, cioe 16. ([45] p. 16)

2) Il secondo argomento si basa sull’introduzione dello 0: la differenza tra14 e 0 e 14; quella tra 0 e −2 e 2 e dunque la differenza tra 14 e −2 e 16.

3) L’ultimo argomento e il piu interessante perche costruito sulla base di treprincipi che Rolle chiama indubitabili:

a): Il significato di sottrazione: sottrarre una quantita da un’altra significatrovare una terza grandezza che, aggiunta alla seconda, ridia la prima;

b) se si suppone che il tutto sia l’unione di due parti e che dal tutto si sottraeuna parte, allora l’altra parte e cio che rimane dalla sottrazione;

c) 2-2=0.

Dal principio c) Rolle deduce che 14+2−2 = 14; per b) si ha che, tolta da 14 laprima parte (-2) cio che rimane e l’altra parte, 14+2. D’altro canto, sottraendo-2 a 14 si ottiene un risultato che, addizionato a -2 da 14, per a). Ora, dac) segue che aggiungendo -2 a 14+2 si ha pure 14 e quindi 14+2 e il risultatodell’operazione.

Page 42: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

42 CAPITOLO 2. MENO PER MENO FA PIU

Rolle enuncia la regola dei segni senza commenti all’inizio del trattato [45] mavi torna successivamente per chiarirla. La spiegazione che −3× 4 = −12 poggiasul significato di moltiplicazione come addizione del moltiplicando ripetuta conse stesso un numero di volte pari al moltiplicatore: in questo caso

−3× 4 = −3 + (−3) + (−3) + (−3) = −12

Quando occorre mostrare che anche 4 × (−3) = −12 Rolle invoca la proprietacommutativa del prodotto che, giova ricordarlo, vale in aritmetica e va postulatain algebra, quando entrano in scena quantita negative. Il caso (−4)×(−3) vienetrattato dicendo

si ha il solo scopo di sottrarre −4 tante volte quante sono le unita nel numero3. Ora -4, sottratto una volta, da − − 4 per la definizione dei segni. Dunquetre volte −− 4 daranno −− 12 ricorrendo alla moltiplicazione ordinaria ovveroall’addizione (...). Ma abbiamo visto che due − di seguito valgono un +. Dacui segue che −4 moltiplicato per −3 da 12. ([45], p. 19)

Inutile dire che questa spiegazione e poco convincente perche il segno − difronte al moltiplicatore scompare quando a Rolle conviene invocare le proprietadella moltiplicazione ordinaria come addizione ripetuta ma cosı facendo la regolaresta misteriosa. Piu convincenti rimangono gli esempi numerici prodotti asupporto della regola che, come in Bombelli e Stevino, consistono nello scrivere ifattori di un prodotto tra numeri positivi come differenza di due numeri positivi emostrare, invocando la proprieta distributiva, come la regola dei segni permettadi riottenere il risultato corretto.

Colin MacLaurin (1698-1746) scrisse un trattato di Algebra che venne pub-blicato postumo nel 1748. Nel capitolo iniziale egli traccia un parallelo trageometria ed algebra osservando che

Nella geometria, linee vengono rappresentate da una linea, triangoli da un trian-golo ed altre figure da una figura dello stesso tipo; in algebra, pero, le quantitasono rappresentate dalle lettere dell’alfabeto; segni diversi sono stati pensatiper rappresentare cio che li colpisce, le relazioni e dipendenze. In geometria lerappresentazioni sono piu naturali, in algebra piu arbitrarie.36 ([32], p. 2)

A fronte di questa maggior arbitrarieta che puo rendere il linguaggio algebricomeno evidente di quello geometrico, corrisponde pero una maggiore applicabi-lita:

Dunque, l’evidenza e piu semplice ed ovvia in geometria; l’uso dell’algebra e pero piu

esteso e spesso piu pratico: specialmente da quando le scienze matematiche hanno

acquisito una tale estensione e sono state applicate a cosı tante ricerche.37 ([32], p.2)Dopo aver spiegato che

36In Geometry, lines are represented by a Line, Triangles by a triangle, and other Figures bya Figure of the same kind; but, in Algebra, quantities are represented by the same letters of thealphabet; and various signs have been imagined for representing their affections, relations anddependencies. In geometry the representations are more natural, in algebra more arbitrary.

37Thus, the evidence of Geometry is sometimes more simple and obvious; but the use ofAlgebra more extensive, and often more ready: especially since the mathematical scienceshave acquired so vast an extent, and have been applied to so many enquires.

Page 43: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.4. IL RUOLO DELLO ZERO 43

E una quantita cio che consta di parti o che e capace di essere maggiore o minore.38

([32], p. 3)

MacLaurin passa ad introdurre le operazioni, dicendo che una quantita

e aumentata dall’addizione, diminuita dalla sottrazione che sono dunque le due ope-

razioni primarie che collegano delle quantita. Si ha cosı la possibilita di supporre che

una quantita entri nei calcoli algebrici in due modi diversi che hanno effetti contrari,

o come incremento o come decremento. (...) Il segno + (piu) e il segno di addizione,

ed il segno − (meno) quello di sottrazione.39 ([32], pp. 3-4)

A questo livello, appare che una quantita a numerica si possa presentare in duemodalita differenti, come incremento o decremento, e quindi che vi sia un prima-to dell’operazione che determina come considerare una quantita. Procedendo,troviamo ancora che

Quando a e maggiore di b, allora a − b e esso stesso un incremento; quando a = b,

allora a − b = 0; quando a e minore di b, allora a − b e esso stesso un decremento.40

([32], p. 4)

Ed ora MacLaurin (Fig. 2.7) puo distinguere tra l’intensita (magnitude) di unagrandezza ed il tipo (kind):

Come addizione e sottrazione si oppongono o un incremento e opposto ad un decre-

mento, esiste una analoga opposizione tra le affezioni delle quantita che si considerano

nelle scienze matematiche. Come tra eccesso e difetto; tra il valore di un bene o del

denaro dovuti ad una persona ed il denaro che quella persona deve; tra una linea

tracciata verso destra e una linea tracciata verso sinistra; (...). Quando due quantita,

uguali quanto a grandezza ma di tipo opposto sono unite tra loro e le si pensa avvenire

a riguardo dello stesso soggetto, esse distruggono l’una gli effetti dell’altra ed il loro

risultato e nulla (...). E quando una quantita piu grande e tolta da una minore dello

stesso tipo, cio che resta diviene di tipo opposto. Se sommiamo i segmenti AB e BD,

la loro somma e AD; se pero dobbiamo sottrarre BD da AB, allora occorre prendere

BC = BD dalla parte opposta verso A e cio che resta e AC il quale, quando BD o

BC supera AB, diventa un segmento dall’altra parte di A.41 ([32], p. 5)

38Quantity is what is made up of parts, or is capable of being greater or less.39is increased by Addition, and diminished by Subtraction, which are therefore the two

primary operations that relate to quantity. Hence it is, that any quantity may be supposedto enter into algebraic computations two different ways which have contrary effects; either asan Increment or as a Decrement. (...) The sign + (plus) is the Mark of Addition, and thesign − (minus) of Subtraction.

40When a is greater than b, then a − b is itself an Increment; when a = b, then a − b = 0;when a is less than b, then a− b is itself a decrement.

41As Addition and Subtraction are opposite, or an Increment is opposite to a Decrement,there is an analogous Opposition between the Affections of Quantities that are considered inthe mathematical Sciences. As between Excess and Defect; between the Value of Effects orMoney due To a Man and Money due By him; a Line drawn towards the Right and a Linedrawn to the Left; (...). When two Quantities equal in respect to Magnitude, but of thoseopposite Kinds, are joined together, and conceived to take place in the same Subject, theydestroy each others Effect, and their amount is Nothing (...) And when a greater Quantity istaken from a lesser of the same kind, the Remainder becomes of the opposite kind. Thus ifwe add the Lines AB and BD together, their sum is AD; but if we are to subtract BD from

Page 44: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

44 CAPITOLO 2. MENO PER MENO FA PIU

A C B D

C B DA

Figura 2.7: Significato delle quantita negative in MacLaurin.

Debiti e crediti, moti su una retta che avvengono in versi opposti: sono modelliper giustificare la natura reale e non fittizia o convenzionale delle quantita dasottrarre. Notiamo pero che adesso si e dato senso ad una sottrazione in cuiil sottraendo abbia grandezza superiore al minuendo ma quest’ultimo e intesocome quantita positiva:

Una quantita da addizionare e similmente detta quantita positiva ed una da sottrarre

e detta negativa: esse sono ugualmente reali ma l’una opposta all’altra, in modo da

togliere una l’effetto dell’altra in ogin operazione, quando sono uguali come quantita.

Cosı 3−3 = 0, ed a−a = 0. Benche perpo +a e −a siano uguali in quantita, in algebra

non supponiamo che +a = −a siano uguali; per dedurre l’uguaglianza in questa scienza

non e sufficiente l’uguaglianza come quantita ma che esse siano della stessa qualita.

Un decremento puo essere uguale ad un incremento ma in tutte le operazioni ha un

effetto contrario; (...) e sulla base di tale opposizione che una quantita negativa e detta

essere minore di nulla, perche e opposta a quella positiva e la riduce quando vi e unita,

mentre l’aggiunta di 0 non ha effetto. Una quantita negativa deve essere considerata

non meno reale di una positiva42 ([32], pp. 6-7).

Negli esempi addotti da MacLaurin, ci sono somme tra quantita di segniopposti e cosı pure sottrazioni tra quantita di segno opposto, indice a mio pareredi una certa consapevolezza della distinzione tra quantita negative e operazionedi sottrazione. D’altronde, nel giustificare la regola in base alla quale sottrarreuna quantita negativa e la stessa cosa che aggiungere il suo opposto, MacLaurinsi esprime in questo modo:

Sottrarre una quantita qualsiasi, positiva o negativa, e lo stesso che sommarne una di

tipo opposto. (...) E evidente che sottrarre o portar via un decremento e lo stesso che

AB, then BC = BD is to be taken the contrary Way towards A, and the Remainder is AC;which, when BD, or BC exceeds AB, becomes a Line on the other side of A.

42A Quantity that is to be added is likewise called a Positive Quantity; and a Quantity tobe subtracted is said to be Negative: They are equally real, but opposite to each other, soas to take away each other’s Effect, in any Operation, when they are equal as to Quantity.Thus 3 − 3 = 0, and a − a = 0. But tho’ +a and −a are equal as to Quantity, we do notsuppose in Algebra that +a = −a are equal; because to infer Equality in this Science, theymust not only be equal as to Quantity, but of the same Quality. A Decrement may be equalto an Increment, but it has in all Operations a contrary Effect; (...) it is on account of thisContrariety that a Negative Quantity is said to be less than Nothing, because it is oppositeto the Positive, and diminishes it when joined to it, whereas Addition of 0 has no Effect. Buta Negative is to be considered no less as a Real Quantity than the Positive.

Page 45: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.4. IL RUOLO DELLO ZERO 45

aggiungere un uguale incremento. Se noi portiamo via −b da a − b, rimane a; e se

aggiungiamo +b ad a− b, la somma e pure a.43 ([32], p. 11)

Il punto saliente, a mio parere, e che MacLaurin distingua l’azione di sottrarresubtract or take away dalla quantita −b che viene sottratta, nella quale il segnonegativo fa parte integrante della quantita. Poco dopo, Mc Laurin e pronto perenunciare la regola dei segni che viene illustrata separatamente nei quattro casiche si possono presentare:

Caso I. Quando una quantita positiva, +a, e moltiplicata per un numero positivo +n,

cio significa che +a va preso tante volte quante sono le unita in n; ed il prodotto

e evidentemente na.44 ([32], p. 12) Qui non vi sono problemi particolari: il

prodotto di numeri positivi viene introdotto con l’addizione ripetuta dove n elimitato ad essere intero.

Caso II. Quando −a viene moltiplicato per n, allora −a deve esser preso tante volte

quante sono le unita in n ed il prodotto deve essere −na.45 ([32], p. 12)

Caso III. La moltiplicazione per un numero positivo comporta un’addizione ripetuta

ma la moltiplicazione per un numero negativo comporta una sottrazione ripetuta. E

quando +a deve essere moltiplicato per −n, il significato e che +a deve essere sottratto

tante volte quante sono le unita in n: quindi il prodotto e negativo e vale −na.46

MacLaurin non si riferisce come altri, implicitamente, alla proprieta com-mutativa del prodotto ma interpreta la moltiplicazione per −n come sottrazioneripetuta, anziche come addizione ripetuta. Infine, il caso IV, il piu spinoso:

Caso IV. Quando −a deve essere moltiplicato per −n, allora occorre sottrarre −a tante

volte quante sono le unita in n; ma (§10) sottrarre −a equivale ad aggiungere +a per

cui il prodotto e +na.47 ([32], p. 13)

Al termine dell’elenco dei quattro casi possibili, MacLaurin sente la necessita diillustrare (illustrate) il Caso II.

Dalle definizioni, +a− a = 0; quindi, se moltiplichiamo +a− a per n, il prodotto deve

annullarsi od essere 0, perche il fattore a− a e 0. Il primo termine del prodotto e +na

(per il Caso I.) Quindi il secondo termine del prodotto deve essere −na che distrugge

43To subtract any Quantity, either Positive or Negative, is the same as to add the oppositeKind. (...) It is evident that to subtract or take away a Decrement is the same as adding anequal Increment. If we take away −b from a− b, there remains a; and if we add +b to a− b,the Sum is likewise a.

44Case I. When any positive Quantity, +a, is multiplied by any positive Number, +n, theMeaning is, That +a is to be taken as many times as there are Units in n; and the Productis evidently na.

45Case II. When −a is multiplied by n, then −a is to be taken as often as there are Unitsin n, and the Product must be −na.

46Case III. Multiplication by a positive Number implies a repeated Addition: But Multi-plication by a Negative implies a repeated Subtraction. And when +a is to be multiplied by−n, the Meaning is that +a is to be subtracted as often as there are Units in n: Thereforethe Product is negative, being −na.

47Case IV. When −a is to be multiplied by −n, then −a is to be subtracted as often asthere are Units in n; but (by §10) to subtract −a is equivalent to adding +a, consequentlythe Product is +na.

Page 46: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

46 CAPITOLO 2. MENO PER MENO FA PIU

+na; in questo modo l’intero prodotto sara +na − na = 0. Quindi, −a moltiplicato

per +n da −na.48 ([32], p. 13)

MacLaurin da per scontata la proprieta distributiva e pone in evidenza il ruoloprivilegiato dello 0 rispetto all’addizione. L’illustrazione del Caso IV e simile

Se moltiplichiamo +a − a per −n, il primo termine del prodotto essendo −na, l’ul-timo termine deve essere +na, perche i due insieme debbono distruggere l’un l’altro,

ovvero il loro totale essere 0, dal momento cheuno dei fattori (a− a) e 0. Dunque −amoltiplicato per −n deve dare +na.49 ([32], p. 13).

Il ruolo dello privilegiato dello 0 emerge in altri due approcci: quello conte-nuto nelle Institutiones Analyticae di Vincenzo Riccati (1707-1775) e GerolamoSaladini (1731-1816) [44], pubblicato nel 1765 e quello presente nei The elemen-ts of Algebra in Ten Books di Nicholas Saunderson (1682-1739), pubblicato nel1790.

Vincenzo Riccati e l’allievo Gerolamo Saladini, dopo aver utilizzato l’analo-gia cinematica del verso di percorrenza per distinguere tra quantita positive enegative, illustrano la regola dei segni in questi termini:

Siccome il moltiplicatore altro non mostra che il numero di volte in cui bisogna prendere

la quantita da moltiplicare, se entrambi sono positivi, lo sara evidentemente anche il

prodotto e lo sara tanto di piu quanto piu grande e il moltiplicatore, e tanto meno

quanto minore e il moltiplicatore; pertanto, se il moltiplicatore e zero, lo sara anche il

prodotto. Quindi se il moltiplicatore decresce di piu, al punto da diventare negativo,

cioe minore di zero, occorre che anche il prodotto decresca di piu e diventi dunque

minore di zero, cioe negativo. Ecco dunque in che modo e evidente che il prodotto

di una quantita positiva per una negativa sia negativo. Supponiamo ora che occorra

moltiplicare una quantita negativa per una positiva. Da quanto dimostrato, il prodotto

sara negativo e lo sara tanto di meno in quest’ordine, cioe tanto piu minore di 0

quanto piu cresce il moltiplicatore, o diventa maggiore, e quanto piu piccolo sara il

moltiplicatore, tanto piu il prodotto sara minore nell’ordine delle quantita negative,

cioe piu vicino allo zero; cosicche il prodotto cresce sempre se il moltiplicatore de-

cresce: pertanto, quando quest’ultimo e zero, il prodotto sara zero: pertanto se il

moltiplicatore diminuisce ancora, cioe se diventa negativo, il prodotto crescera di piu

e quindi diverra maggiore di zero, e di conseguenza positivo; pertanto una quantita

negativa, moltiplicata per una quantita negativa dara un prodotto positivo. ([44], p.3)

L’argomento e piuttosto persuasivo ma in se non puo considerarsi risolutivoperche offre il fianco a critiche come quella di Lazare Carnot (1753-1823) ilquale, pur non occupandosi direttamente dell’argomento di Riccati e Saladini,

48By the definitions, +a − a = 0; therefore, if we multiply +a − a by n, the Product mustvanish or be 0, because the Factor a− a is 0. The first term of the Product is +na (by CaseI.) Therefore the second Term of the Product must be −na which destroys +na; so that thewhole Product must be +na− na = 0. Therefore, −a multiplied by +n gives −na.

49If we multiply +a−a by −n, the first Term of the Product being −na, the latter Term ofthe product must be +na, because the two together must destroy each other, or their Amountbe 0, since one of the factors (viz. a−a) is 0. Therefore −a multiplied by −n must give +na.

Page 47: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.4. IL RUOLO DELLO ZERO 47

considera una situazione simile, allo scopo di mostrare come le quantita negativenon possono essere concepite in termini assoluti, come quantita minori di 0:

Sia, si dice A una quantita; sottraiamo da essa una quantita minore a: la differenzaA − a sara minore di A. Se supponiamo ora che a aumenti, A − a diminuira semprepiu, diverra 0 quando a diventa uguale ad A; poi, aggiungono, se a continua a crescere,A− a diverra minore di 0.

Per dimostrare che questo ragionamento e vizioso, basta far vedere che lo si potreb-

be applicare allo stesso modo ad√A− a. In effetti, assegnato A,

√A− a diminuisce

gradualmente al crescere di a; dunque dovrebbe diventare minore di 0, cioe a dire,

semplicemente negativo e non immaginario, allorquando a diventi maggiore di A. Cio

che e falso. ([12], pp. xi-xii)

Il ragionamento di Carnot mette in luce come un argomento quale quello addottoda Riccati e Saladini non sia evidente come sembra a prima vista.

Passando a Saunderson, egli rende plausibile il fatto che le quantita negativesiano minori di nulla seguendo un modello continuo di passaggio dal positivoallo zero per giungere alle quantita negative. Dopo aver distinto tra quantitapositive e negative avanza una possibile spiegazione per le difficolta che rendnole quantita negative difficili da assimilare:

Gli ingegni piu deboli sono perplessi di fronte a questo modo di pensare perche, nella

vita ordinaria, la maggior parte delle quantita perde il proprio significato quando que-

ste cessano di essere affermative e ne acquisiscono un altro non appena cominciano ad

essere negative: cosı chiamiamo beni negativi, debiti; un guadagno negativo, una per-

dita; un caldo negativo, freddo; una discesa negativa, salita, &c. (...) Le difficolta che

sorgono dall’imporre nomi scarsi e limitati a quantita di per se illimitate, andrebbero

imputate a questi nomi, non alle cose stesse. (...) quantita affermative e negative si

distinguono unicamente dal segno, come notato prima, non per il loro nome; la stessa

lettera le rappresenta entrambe: questi segni dunque comportano la stessa distinzio-

ne operata talora da particelle ed aggettivi nel linguaggio ordinario, come nelle parole

conveniente e sconvenienete, felice ed infelice, in buona salute e in cattiva salute, &c.50

([47], pp. 50-51)

La dimostrazione della regola dei segni data da Saunderson fa ricorso alleprogressioni artimetiche. Egli richiama il fatto che una progressione aritmeti-ca e completamente individuata noti due suoi termini consecutivi e, in secondoluogo, che moltiplicando i termini di una progressione aritmetica per una stessa

50That what most perplexes narrow minds in this way of thinking, is, that in common life,most quantities lose their lose their names when they cease to be affirmative, and acquirenew ones so soon as they begin to be negative: thus we call negative goods, debts; negativegain, loss; negative heat, cold; negative descent, ascent, &c. (...) Difficulties that arise fromthe imposition of scanty and limited names, upon quantities which in themselves are actuallyunlimited, ought to be charged upon those names, and not upon the things themselves. (...)affirmative and negative quantities are only distinguished by their signs, as was observedbefore, and not by their names; the same letter representing both: these signs therefore inAlgebra carry the same distinction along with them as do particles and adjectives sometimesin common language, as in the words convenient and inconvenient, happy and unhappy, goodhealth and bad health, &c.

Page 48: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

48 CAPITOLO 2. MENO PER MENO FA PIU

quantita si ottiene un’altra progressione aritmetica. Ammessi questi due prin-cipı—che Saunderson ritiene auto-evidenti—egli illustra i quattro casi. Saun-derson non usa le progressioni per dimostrare il caso +×+ = + ma fa appelloal significato di moltiplicazione come addizione ripetuta. Nel caso − × + = −Saunderson considera un caso numerico specifico, quello di −4× 3 ed afferma:

Se moltiplichiamo i termini della progressione aritmetica 4, 0, −4 per +3, i prodottisaranno in progressione aritmetica; i primi due prodotti sono 12 e 0; dunque il terzosara −12; pertanto −4 moltiplicato per +3 da −12.51 ([47], p. 57)

Osserviamo in dettaglio la costruzione: la regola autoevidente (almeno per Saun-derson) che, moltiplicando i termini di una progressione aritmetica per un numero siottiene un’altra progressione aritmetica e accettabile se i termini della progressione edil fattore comune sono tutti positivi o, al piu, se un termine e nullo, altrimenti si ca-drebbe in una petitio principii. Per il caso −×+ = −, egli si ferma quando raggiungelo 0 e poi genera la parte negativa della progressione cosı ottenuta dalla conoscenzadei termini +12 e 0. Quando identifica −12 con −4×3 egli in qualche modo estende ilprincipio da cui e partito al caso di progressioni con termini negativi, senza dichiararlo.

Nel caso + × − = −, Saunderson considera l’esempio +4 × −3 partendo dallaprogressione 3, 0,−3: i primi due termini, moltiplicati per 4 danno la progressione 12,0, che ha come termine successivo −12, identificabile con −3× 4. Infine, utilizzando irisultati appena dimostrati, Saunderson moltiplica 3, 0 per −4, ottenendo la progres-sione −12, 0, il cui termine successivo e +12, identificabile con −3×−4. A conclusionedel capitolo Saunderson offre un’altra spiegazione:

Questi 4 casi si dimostrano piu brevemente cosı: +4 moltiplicato per +3 da +12;quindi −4 per −3 deve produrre quanlcosa contrario a +12, cioe −12; se pero −4 per3 da −12, allora −4 moltiplicato per −3 deve produrre qualcosa di contrario a −12,cio’‘e +12; in questo modo l’ultimo caso, quanto mai difficile per i giovani principianti,appare in fin dei conti come nulla piu di un principio della grammatica, cioe, che duenegazioni sono un’affermazione; cio e indubbiamente vero in grammatica, benche nonsempre osservato nelle lingue.52 ([47], p. 58)

Una simile suggestione linguistica era gia stata menzionata, oltre che da Leibniz,anche dall’olandese Wilhelm ’s Gravesande ([49], pp. 12-13) e lo stesso fara, tra glialtri, Paolo Ruffini nel Corso di Matematiche: [46], pp. 24-26.

2.5 Una proporzione “terribile”

Le proporzioni cui siamo avvezzi coinvolgono sempre grandezze rappresentati da nu-meri positivi ma per la nostra storia occorre soffermarsi alquanto su proporzioni checoinvolgono anche grandezze negative. Il motivo di questo interesse risiede nel fatto

51multiply the terms of this arithmetical progression 4, 0, −4 into +3, and the productswill be in arithmetical progression; but the two first products are 12 e 0; therefore the thirdwill be −12; therefore −4 multiplied into +3, produces −12

52These 4 cases may also be more briefly demonstrated thus: +4 multiplied into +3, pro-duces +12; therefore −4 into +3, or 4 into −3 ought to produce something contrary to +12,that is, −12: but if −4 into +3 produces −12, then −4 multiplied into −3 ought to producesomething contrary to −12, that is, +12; so that this last case, so very formidable to youngbeginners, appears at last to amount to no more than a common principle in Grammar, towit, that two negatives make an affirmative; which is undoubtedly true in Grammar, thoughperhaps it may not always be observed in languages.

Page 49: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.5. UNA PROPORZIONE “TERRIBILE” 49

che, con la Geometrie di Descartes, la moltiplicazione viene definita per il tramitedelle proporzioni. Precisamente, il prodotto di a e b e il quarto proporzionale x dellaproporzione

1 : a = b : x (2.8)

Questa definizione permette anche una interpretazione geometrica del prodotto grazieal teorema di Talete ([15], p. 4).

b

b

O U A

B

P

s

r

Figura 2.8: Argomento geometrico, basato sul teorema di Talete ed introdottoda Cartesio, per definire il prodotto di due numeri positivi a e b. Il segmento OUha lunghezza unitaria, OA = a, OB = b. Congiungendo U con B e tracciandola parallela ad UB passante per A si ottiene sulla retta r un segmento OP dilunghezza ab, in virtu del teorema di Talete OU : OB = OA : OP .

Essa si incontra nella Geometria Speciosa di Pietro Mengoli, pubblicata nel 1659[33], precisamente nella definizione 28 che dell’Elementum Quintum, dedicato allateoria dei logaritmi:

Se quattro grandezze sono proporzionali e l’unita e la prima: la quarta si dira prodottotra la seconda e la terza.53, ([33], p. 207)

Si trova poi nella seconda edizione (1683) dei Nouveaux Elemens de geometriepubblicati da Antoine Arnauld (1612-1694) per la prima volta nel 1667.

Il punto critico e quando si cerca di applicare questa proporzione al caso in cui unadelle due quantita a o b sia espressa da un numero negativo. Qui Arnauld confessadi avere avuto dei problemi a ritenere valida la regola dei segni, soprattutto nel caso−×− = +:

Non sono riuscito ad adattare a questo tipo di moltiplicazione la nozione di moltipli-cazione in generale, quella piu naturale secondo cui l’unita (o determinata come tra i

53Si quatuor proportionalium, rationalis fuerit prima: quarta, dicetur, productus secundaeet tertiae

Page 50: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

50 CAPITOLO 2. MENO PER MENO FA PIU

numeri o arbitraria nell’estensione) debba stare al moltiplicatore come il moltiplican-do sta al prodotto, in quanto cio e visibilmente falso per la moltiplicazione tra duenumeri.54 ([4], p. 19)

La riluttanza di Arnauld deriva dal fatto che, applicando la proporzione al caso−5×−3 si otterrebbe che l’unita sta ad un numero minore come -3 sta ad un numeromaggiore, se il prodotto deve essere +15. Per uscire dallo stallo, Arnauld ritiene chela via giusta sia quella di distinguere tra moltiplicazioni operate par voie d’addition opar voie de soustraction: il primo caso e adatto alle situazioni in cui il moltiplicatoree positivo ed il risultato si ottiene addizionando il moltiplicando (multiplie) tantevolte quanto indicato dal moltiplicatore (multipliant), il secondo e indicato quando ilmoltiplicatore e negativo e consiste nel sottrarre il moltiplicando tante volte quantoindicato dal moltiplicatore: poiche sottrarre un numero negativo equivale a considerareil numero come positivo, ecco che agli occhi di Arnauld anche il caso problematico− ×− = + risulta giustificato. Va osservato che, dopo aver reso conto faticosamentedella regola dei segni, Arnauld se ne serva per giustificare, a guisa di corollario, unaregola di calcolo rapido da applicarsi quando i fattori sono compresi tra 5 e 10. Sechiamiamo m ed n tali fattori, allora Arnauld li riscrive come 10−m′ e 10−n′ e svolgei prodotti parziali appellandosi alla regola dei segni: anche se in un caso particolare,Arnauld utilizza il classico esempio del prodotto (a − b)(c− d) non per dimostrare laregola dei segni ma come una sua conseguenza.

Oltre al libro di Arnauld, un altro testo molto influente furono i Nouveaux Elemensde mathematique [38] del prete oratoriano Jean Prestet (1648-1691), allievo di Male-branche che finı per contrapporsi proprio ad Arnauld. Nella premessa alla secondaedizione degli Elemens, Prestet dichiara di volere cercare il giusto bilanciamento trala concisione e la chiarezza, evitanto gli estremi di un’eccessiva stringatezza, che se-leziona a priori l’uditorio ad una ristretta cerchia di addetti ai lavori, ed un’inutileverbosita che stanca il lettore. Tra gli argomenti che intende trattare vi sono alcuniritenuti elementari ma che al contrario non lo sono affatto e renderne ragione puoessere problematico

Nulla dovrebbe essere piu chiaro di questa proposizione: 2 per 4 e lo stesso che 4 per 2.Ma ci potrebbe essere dell’imbarazzo nel momento in cui si voglia spiegarne la ragioneautentica.55 ([38], Preface)

Prestet dichiara l’algebra superiore alla geometria, non solo perche ha una maggioreestensione ma anche perche la geometria, ad esempio, abbisogna del concetto di numeroper trarre profitto dalla teoria delle proporzioni che ha un ruolo centrale in quantotratta dei rapporti e per Prestet una scienza puo dirsi esatta quando sa assegnarevalori precisi ai rapporti tra grandezze. Comunque sia, la matematica e

la scienza esatta delle grandezze. E si dira grandezza in generale tutto cio che epassibile di piu e di meno, ovvero che puo essere aumentato o diminuito.56 ([38],Preface)

54C’est que je ne pouvois ajuster a cette sorte de multiplication, la notion la plus naturelle dela multiplication en general; qui est que l’unite (ou determinee dans les nombres, ou arbitrairecomme dans l’etendue) doit etre au multipliant, comme le multiplie est au produit. Car celaest visiblement faux dans la multiplication de moins en moins.

55On jugera d’abord qu’il n’y a rien de plus clair que cette proportion : 2 fois 4 est la memechose que 4 fois 2. Mais on feroit peut-etre assez embarrasse, si l’on en vouloir apporter laveritable raison.

56la science exacte des grandeurs. Et on dira que la grandeur en general est tout ce qui estCapable du plus & du moins, ou ce qui peut recevoir quelque augmentation ou diminution.

Page 51: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.5. UNA PROPORZIONE “TERRIBILE” 51

Si tratta di grandezze percepite non in modo assoluto ma una relativamente ad un’altraed il modo per confrontarle e cercandone la differenza oppure il rapporto. L’accetta-zione di proporzioni fornate con termini di segni opposti non fu universale. Dubbi sullaloro validita incondizionata furono avanzati da Pierre de Varignon, altro esponente,come Prestet del circolo sorto attorno alla figura di Malebranche. Secondo la testimo-nianza di Charles Reyneau (1656-1728) ([50], pp. 80-81) Varignon distingueva in unaproporzione il concetto quantitativo di rapporto e quello qualitativo di direzione, chenon doveva entrare in contatto con il primo. Nella proporzione

2 : −4 :: −4 : 8

i rapporti che sono eguali sono quello di 2 a 4 = | − 4| e di | − 4| = 4 : 8, entrambi pariad 1

2. In questo modo si evitano gli assurdi legati alla pretesa di applicare le regole

delle proporzioni ordinarie, tra quantita positive.Nel XVIII secolo si ritrova la definizione cartesiana di prodotto in diversi testi.

Ad esempio, Reyneau stesso la propose nella Science du Calcul de grandeurs [43],sottolineandone la generalita, tanto da premettere queste parole al §72

Definizione generale della moltiplicazione relativa ad ogni tipo di grandezza. Occorrerendersela assai familiare57 ([43], p. 51)

Osserviamo che, dalla possibilita di permutare i medi senza alterare una propor-zione, Reyneau deduce la proprieta commutativa del prodotto:

il prodotto di b per a e la stessa grandezza del prodotto di a per b; infatti, nel primo casovale la proporzione 1 : a = b : c e nel secondo caso si ha la sua alternata 1 : b = a : c;ed essendo nell’uno e nell’altro caso determinati i primi tre termini, il quarto e semprela stessa grandezza. Dunque a× b = b× a. ([43], p. 51)

Reyneau, fornı due dimostrazioni della regola, a seconda che i termini del prodottofossero interi o frazionari. E possibile che questo testo di Reyneau abbia influenzatoMaria Gaetana Agnesi (1718-1799) che nel 1748 pubblico le Instituzioni analitiche aduso della gioventu italiana dove, nel capitolo iniziale, introduce le quantita negative ediscute la regola dei segni ancora a partire da (2.8):

La moltiplicazione altro non e, che una proporzione geometrica, di cui il primo terminesia l’unita; il secondo, e il terzo termine le due quantita, che devonsi moltiplicare; edil quarto il prodotto. ([1], p. 6)

Che Maria Gaetana Agnesi potesse aver presente il testo di Reyneau non mi sembraimprobabile visto che aveva studiato sulla sua Analyse demontree sotto la guida delmonaco olivetano Ramiro Rampinelli. La spiegazione della regola dei segni data dallaAgnesi e la seguente:

poiche il quarto [termine], per la natura della proporzione geometrica, deve esseremoltiplo del terzo, come il secondo e moltiplo del primo; se il secondo, e terzo terminesono positivi, cioe se, per esempio, e 1, a :: b, al quarto, essendo l’unita, cioe il primopositivo, dovra pure essere positivo il quarto. Sia negativo il secondo, e positivo ilterzo, cioe sia 1,−a :: b, al quarto; dovendo il quarto essere moltiplo del terzo, comeil secondo e moltiplo del primo, ed essendo negativo il secondo, dovra pure il quartoessere negativo. Sia positivo il secondo, negativo il terzo, cioe sia 1, a :: −b, al quarto;dovendo il quarto essere moltiplo del terzo, come il secondo e moltiplo del primo, ed

57Definition generale de la Multiplication par raport a toutes sortes de grandeurs. Il fautse la rendre tres familiere.

Page 52: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

52 CAPITOLO 2. MENO PER MENO FA PIU

essendo il secondo, ed il primo positivi, ed il terzo negativo, non potra il quarto esserese non negativo. Sieno finalmente il secondo, ed il terzo negativi, cioe sia 1,−a :: −b,al quarto; essendo il secondo moltiplo negativo del primo, bisognera che il quarto siamoltiplo negativo del terzo; ma il terzo e negativo, e dunque dovra il quarto esserepositivo. ([1], pp. 6-7).

Il tentativo di dimostrazione della Agnesi, per quanto originale, lascia un po’ a de-siderare dal punto di vista logico in quanto dire che, poiche a e multiplo positivodell’unita, allora il prodotto di a×−b, essendo −b negativo, dovra esso pure risultarenegativo, sembra presupporre cio che si vuole dimostrare. Osserviamo come sarebbepiu convincente un argomento geometrico basato sul teorema di Talete che estenda ladefinizione di prodotto data da Cartesio ed illustrata nella Figura 2.8. Se orientiamor ed s in modo da riportare segmenti come OA di lunghezza a ed accettiamo cherappresenti il numero −a e prendendo OB = b ma nel verso negativo. in modo darappresentare −b, il punto P giacera dalla parte opposta rispetto a B o meno, fornendoun ausilio intuitivo alla validita della regola dei segni.

b

b

O UA

B

P

s

r

Figura 2.9: Argomento geometrico, basato sul teorema di Talete, per “giusti-ficare” la regola dei segni. Il segmento OU ha lunghezza unitaria, OA = a,OB = b. Siccome sia A che B giacciono dalla parte negativa delle rette r ed s,congiungendo U con B e tracciando la parallela ad UB passante per A si ot-tiene sulla retta r un segmento OP di lunghezza ab che, trovandosi dalla partepositiva di r, giustifica la regola dei segni.

La proporzione, introdotta da Arnauld,

1 : −1 :: −1 : 1 (2.9)

fu utilizzata da Jean Le Ronde D’Alembert per negare che i numeri negativi fosserominori di 0. Commentando la controversia tra Gottfried Wilhelm Leibniz e JohannBernoulli I sui logaritmi dei numeri negativi, d’Alembert ad un certo punto scrive

Page 53: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.6. IL CARATTERE CONVENZIONALE DELLA REGOLA 53

Mi sia dunque permesso di sottolineare come sia falsa l’idea che talvolta viene presen-tata a proposito delle quantita negative, dicendo che esse sono sotto lo 0. Prescindendodall’oscurita di questa idea intesa metafisicamente, coloro i quali la vorranno refutaregrazie al calcolo, potranno accontentarsi di questa proporzione 1 : −1 :: −1 : 1; pro-porzione reale perche il prodotto degli estremi e uguale a quello dei medi e che dunque1−1

= −1 e −11

= −1. Tuttavia se si pensasse alle quantita negative come al di sottodello zero, 1 sarebbe > −1, & −1 < 1; cosı non potrebbe sussistere la proporzione.([17], p. 201)

2.6 Il carattere convenzionale della regola

La matematica non e un’opinione ma si appoggia a delle convenzioni e cio si evidenziaquando occorre operare una estensione di un campo della matematica, come succedenel passaggio dall’aritmetica all’algebra. Abbiamo sinora visto come molti matematicisi siano sforzati di dimostrare la regola dei segni come conseguenza necessaria di ovvieproprieta geometriche o di evidenti regole commerciali ma vi e stata accanto a questatendenza anche un atteggiamento diametralmente opposto, quello di fornire la regoladei segni senza la ricerca di una sua deduzione. Questo silenzio puo essere visto comeil primo passo verso quella che sara la linea vincente: la regola dei segni va accettatacome una convenzione, una regola del gioco da accettare all’inizio, motivandone lascelta.

Il primo esponente di spicco di questa corrente del silenzio fu Isaac Newton che,come come gia avevano fatto i matematici indiani, non giustifico affatto la regola deisegni. Egli nella Arithmetica Universalis pubblicata, a sua insaputa, nel 1707, scrisse58 :

I termini semplici algebrici59 si moltiplicano facendo il prodotto tra i coefficienti nume-rici e fra le parti letterali e stabilendo che il prodotto sia positivo se entrambi i fattorisono positivi o entrambi negativi, e negativo in caso opposto.60 ([36], p. 18)

Osserviamo come Newton separi i tre tempi nella moltiplicazione di due monomi:dapprima il prodotto dei coefficienti numerici, quindi quello delle parti letterali e,infine, la combinazione dei segni introdotta con un secco stabilendo (statuendo).

Colin Mac Laurin, che si sforzo di chiarire i principi del calcolo infinitesimale newtonia-no, volle anche chiarire la regola dei segni, ricollocandosi sulla scia di altri matematiciper i quali una qualche forma di giustificazione era necessaria.

Non credo di forzare troppo il testo di Newton dicendo che, dato il suo tenore nor-mativo, Newton possa aver intravisto il fatto che la regola dei segni andasse stabilitain base ad una convenzione il cui valore emerge dai risultati ottenuti. Nella spiega-zione della regola, all’inizio del XIX secolo, Robert Woodhouse opera una distinzioneimportante

Poiche questa regola per il prodotto crea problemi ai principianti ed e spesso sta-ta oggetto di discussione, ho indagato a lungo su di essa, desideroso di distinguerenella regola cio che si puo dire essere dimostrato da principi evidenti e ragionamenti

58Seguo qui il testo latino dell’edizione del 1732.59cioe i monomi60Simplices temini Algebraici multiplicantur ducendo numeros in numeros & species in

species ac statuendo factum Affrimativum si ambo factores sint affirmativi aut ambo negativi,& Negativum si secus.

Page 54: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

54 CAPITOLO 2. MENO PER MENO FA PIU

stringenti, da quanto e arbitrario o frutto di convenzione, e di dimostrare perche siadesiderabile rendere generale tale regola generale per nostro agio.61 ([55], pp. 5-6)

Il ruolo delle convenzioni nell’introduzione delle quantita negative e importantenell’impostazione di Woodhouse. Egli, introdotto il principio di trasposizione, grazieal quale da a− b = c si passa a a = b+ c, aggiungendo la stessa quantita b ad ambo imembri, osserva

Se su queste due operazioni si dovesse stabilire una regola per trasportare quantitaalgebriche, essa non dovrebbe, in senso strettamente logico, annunciare piu di quantosia stato dimostrato: ma annuncerebbe di piu, se stabilisse il cambio dei segni +− allequantita da trasferirsi da un membro dell’equazione all’altro, perche in questo modosi dedurrebbe per il suo tramite che −c− b = −a, proposizione incomprensibile e chenon si sarebbe potuto ottenere da principi evidenti e stretta inferenza: se allora, peragio dei calcoli, si scrive questa regola, cio e arbitrario in parte e presuppone delleconvenzioni prestabilite.62 ([55], pp. 1-2)

Woodhouse e piuttosto severo con le tradizionali dimostrazioni delle proprieta delleoperazioni condotte su quantita negative, come a− (−b) = a+ b:

Si richiede di sottrarre −b da a; a = a + b − b, si sottrae −b e resta a + b; questasottrazione pero e di fatto una cancellazione, una soppressione e non un’operazioneche segua necessariamente dal significato della parola sottrazione e dalla nostra nozionedi −b; cancellare una quantita negativa puo essere usato come locuzione che indichil’addizione di una quantita positiva, ma non ha necessariamente questo significato: inaltre parole, questa equivalenza tra le due espressioni non e una conseguenza necessariae sicura a partire dalle nostre nozioni di quantita negativa.63 ([55], p. 2)

Come dimostrare allora la proprieta cercata? Woodhouse fa leva sul principio ditrasposizione applicato all’equazione y = b+ d per ottenere −y = −b− d che viene poisottratto dall’equazione x = a giungendo cosı a x − (−y) = a − (−b) − (−d). Se, alposto di −− sostituiamo +, ricaviamo x+ y = a+ b+ d

che e vera, come si vede sommando le due equazioni originali: dunque, in tutti i casix− (−a) e espresso appropriatamente da x+ a.64 ([55], p. 3)

61As this rule for multiplication of signs embarasses beginners, and has been frequentlymade the subject of discussion, I have dwelt rather long upon it, desiderous to distinguish inthe rule, what may be said to be proved from evident principles and strict reasoning, fromwhat is arbitrary or results from convention, and to shew why it is desirable on the groundsof commodiousness to make such a rule general.

62If on these two operations, a rule be founded for the transposition of Algebraical quantities,it ought not in logical strictness, to announce more than has been proved: but it wouldannounce more, if it ordered quantities to be transferred, from one side of the equation to theother, changing the signs +−, for then by this rule there might be deduced −c− b = −a, anunintelligible proposition, and which from evident principles and strict inference, could neverhave been obtained: If then, for the sake of commodiousness in calculation, such a rule belaid down, it is partly arbitrary, and supposes some previous convention.

63It is required to subtract −b from a; a = a+b−b subtract −b, and there remains a+b; butthis subtraction is in fact an effacing, or blotting out, and is not an operation that necessarilyfollows from the meaning of the word subtraction and from the notion we have of −b; tosubtract a negative quantity, may be used as a phrase to signify the addition of a positivequantity, but it does not necessarily signify it: that is, this equivalence of the two expressionsis not a sure and necessary consequence, from the notions we have of subtraction and of anegative quantity.

64which is true, as appears by adding the two original equations: Hence in all cases x−(−a)is properly expressed by x+ a.

Page 55: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.6. IL CARATTERE CONVENZIONALE DELLA REGOLA 55

Non vi e alcun tentativo di giustificare la regola dei segni che viene assunta e lasua validita sottoposta al controllo della coerenza con un risultato su cui non possonoesservi dubbi. Woodhouse e anche esplicito nel dichiarare che l’unico caso in cui sipuo dimostrare da principı evidenti la regola dei segni si ha nella deduzione di

(a− b)(x− y) = ax− bx− ay + by

quando a > b ed x > y. Se cio non e vero, occorre postulare la regola ed applicare ilprincipio di trasposizione alle uguaglianze

x− y = v −w a = b (2.10)

ottenendo

y − x = w − v − a = −bche, moltiplicate tra loro supponendo valida la regola dei segni forniscono

xa− ya = vb− wb

che e un’ovvia conseguenza delle equazioni (2.10). Dunque il principio di trasposizione,accettato come fondamento della teoria diventa il banco di prova della coerenza deirisultati ottenuti supponendo valida la regola dei segni.

Woodhouse critica anche la dimostrazione alla MacLaurin, basata sullo sviluppo(a− a)b perche non e possibile assumerlo uguale a 0, dal momento che la sottrazionerichiede che il sottraendo sia strettamente minore del minuendo. Infine, le analogieutilizzate solitamente per introdurre quantita negative sono passate al vaglio dellacritica e per Woodhouse l’analogia commerciale con i debiti e semplicemente assurdamentre quella basata sulla nozione di segmento orientato e meramente illustrativa enulla dimostra, bensı elude il problema in quanto

non e per nulla evidente che, se una quantita positiva rappresenta un segmento trac-ciato in una direzione, una quantita negativa debba essere utilizzata per indicare unsegmento nella direzione opposta.65 ([55], p. 8)

Piuttosto, si tratta di una conseguenza della definizione convenzionale, grazie allaquale l’applicazione dell’algebra alla geometria e resa possibile.

La parola convenzione ritorna piu volte in un’opera di indole didattica, il Traited’Algebre di Joseph Bertrand, nel momento in cui occorre introdurre le operazioni sullequantita negative, queste ultime intese semplicemente come quelle precedute dal segno-, inteso come segno della sottrazione. L’intento di Bertrand e di servirsi di un certonumero di convenzioni per semplificare, unificandoli, alcuni enunciati appena riportati:

Questa convenizione consiste nel pensare la differenza a−b come risultato dell’addizionedi a con (−b)

a− b = a+ (−b).L’espressione isolata (−b) che e detta numero negativo non acquista per questo alcunsignificato; si dice solamente: aggiungere (−b) invece di dire: sottrarre b. Si convieneugualmente che sottrarre (−b), significhi aggiungere +b

a− (−b) = a+ b

65that, a positive quantity representing a line drawn in one direction, a negative quantitymust be used to denote a line in the opposite direction, is by no means a self-evident truth.

Page 56: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

56 CAPITOLO 2. MENO PER MENO FA PIU

66

Tacitamente, anche Bertrand gioca sull’ambivalenza del segno − che da simbolo disottrazione, denota un tipo di quantita, quelle negative. Le due uguaglianze precedentinon vanno dimostrate, sono definizioni ma la seconda e conseguenza della prima nelsenso che, se non la si assumesse, sarebbe possibile aggiungere (−b) ad a e poi sottrarre(−b) al risultato, e non riottenere piu a. A questo punto serve un’altra convenzioneper dar senso ad a− b nel caso in cui b > a:

Si conviene allora di concepire l’espressione (a − b) come rappresentante un numeronegativo uguale all’eccesso di b su di a.67 ([6], p. 22)

E pero bene che la convenzione sia giustificabile ed infatti Bertand sottolinea subitoche

Questa convenzione e del tutto naturale; se non la si ponesse, si distruggerebbe l’ana-logia completa che esiste tra le operazioni relative si numeri positivi e negativi.68 ([6],p, 22)

Cio che si dimostra e la naturalezza, la convenienza della convenzione adottata,non la validita della convenzione stessa, che rimane arbitraria. Non dovrebbe allorasorprendere che Bertrand adotti la regola dei segni come una definizione ([6], pp.32-33).

2.7 Abbasso il segno -!

Abbiamo visto come gia Leibniz avvertisse l’ambiguita presente nel duplice uso delsegno - come segno di sottrazione e come prefisso che, anteposto ad un numero, lotrasforma in una quantita negativa e ritenuta responsabile delle difficolta pedagogichenell’introduzione all’algebra degli allievi alle prime armi con questa disciplina e fu sot-tolineata da diversi matematici nella seconda meta del XIX secolo. Per esempio, anchesenza occuparsi direttamente della regola dei segni, George Boole chiarı l’importanzadell’univocita dei segni in generale:

un segno e un tratto arbitrario, avente un’interpretazione fissa, suscettibile di com-binazione con altri segni ubbidendo a leggi fisse che dipendono dalla loro mutuainterpretazione.69 ([9], p. 25).

Di fronte all’ambiguita vi furono reazioni diverse che esaminiamo di seguito par-tendo da Lazare Carnot (1753-1823) che fu un fiero oppositore delle quantita negative

66Cette convention consiste a regarder la difference a− b comme resultat de l’addition de a

avec (−b)a − b = a + (−b).

L’epression isolee (−b), que l’on nomme nombre negatif n’acquiert pour cela aucunesignification; seulement on dit: ajouter (−b), au lieu de dire: retracher b.

On convient de meme que retrancher (−b), signifie adjouter +b

a− (−b) = a+ b

67On convient alors de regarder l’expression (a− b) comme representant un nombre negatifegal a l’exces de b sur a.

68Cette convention est toute naturelle; et, en ne la faisant pas, on detruirait l’analogiecomplete qui existe entre les operations relatives aux nombres negatifs et positifs.

69A sign is an arbitrary mark, having a fixed interpretation, and susceptible of combination

with other signs in subjection to fixed laws dependent upon their mutual interpretation.

Page 57: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.7. ABBASSO IL SEGNO -! 57

contro cui scrisse molte pagine contenute nelle Reflexions sur la metaphysique du cal-cul infinitesimale e soprattutto nella Geometrie de position le cui tesi saranno ribaditein una Digression sur la nature des quantites dites negatives. La posizione di Carnote quella ereditata da D’Alembert:

la natura delle quantita dette negative e sempre stata fonte di una delle maggioridifficolta concettuali dell’analisi.70 [Carnot, 1806, 96]

La difficolta di Carnot e quella consueta, conseguenza della concezione dello 0 comenulla, al di sotto del quale nulla esiste, per cui non ci puo essere alcun posto per dellequantita minori di nulla:

Il principio cardine della mia teoria e che la nozione di quantita negativa isolata einammissibile; ad esempio, per fissare le idee in modo piu preciso, diro che la geometriadi posizione e quella in cui la nozione di quantita positiva e negativa e sostituita daquella di quantita diretta od inversa.71 [Carnot, 1803, xxxv]

Nell’idea di Carnot la geometria di posizione e un modo per attribuire una maggioreestensione alle applicazioni dell’algebra alla geometria ordinaria, una teoria

il cui scopo precipuo e di esprimere in effetti, grazie a tabelle di confronto, le diversitanelle posizioni delle parti corrispondenti di figure dello stesso genere, dopo aver pre-ventivamente formato la tabella generale delle loro proprieta comuni.72 [Carnot, 1803,xxxvii-xxxviii]

Se in alcuni punti la critica di Carnot alle quantita negative puo lasciare sorpresi,in altri passaggi le sue obiezioni ad alcuni argomenti impiegati per giustificare la regoladei segni possono essere, almeno in part, condivise.

L’ambiguita insita nel segno − fu il punto da cui prese le mosse un Carneade dellamatematica francese: C.V. Mourey, di cui non si dispone di sostanziali dati biograficicerti ed e stato solo possibile congetturare un candidato: Claude-Victor Mourey (1791-1830), un mecanicien a Paris che avrebbe potuto pubblicare La vraie Theorie desquantites negatives et des quantites pretendue imaginaires nel 1828. Questo volume,di cui ci occupiamo ora, fu ripubblicato nel 1861 ed e su questa edizione che mi sonobasato.

Introduzione ha un sottotitolo che e gia un programma: Source des difficultesde l’Algebre e la fonte responsabile dei problemi nello studio dell’algebra e propriol’assurdita della sottrazione quando il sottraendo supera il minuendo. Per questo

Ne segue l’impossibilita di esprimere la differenza tramite il segno −, quando uno deitermini e incognito od arbitrario.73 ([35], p. 1)

Se a e un numero assegnato ed x e incognito, quale senso dare ad a − x? Essocambia da a− x a x− a, a seconda che a > x oppure a < x. La conseguenza tratta daMourey e drastica

70La nature des quantites dites negatives a toujours ete le sujet d’une des principalesdifficultes metaphysiques de l’analyse.

71Le principe fondamentale de ma theorie est que la notion des quantites negatives isoleeest inadmissible; ainsi pour fixer les idees d’une maniere precise, je dirai que la geometrie de

position est celle ou la notion des quantites positives et negatives est supplee par celle des

quantites directes et inverses.72dont l’object speciale est d’exprimer en effet, par des tableaux comparatifs, dans des

figures de meme genre la diversite des positions de leurs parties correspondantes, apres avoirprealablement forme le tableau general de leurs proprietes communes.

73Il suit de la qu’il est impossible d’exprimer la difference par le moyen du signe −, lorsquel’un des termes est inconnu ou arbitraire.

Page 58: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

58 CAPITOLO 2. MENO PER MENO FA PIU

Ne consegue che il segno −, considerato come simbolo della sottrazione, non puo essereammesso in algebra. L’algebra dovendosi occupare di nient’altro che quantita incogniteo arbitrarie, non puo ammettere la sottrazione.74 ([35], pp. 1-2)

Il rimedio proposto da Mourey e quello di ricorrere all’idea di segmento orientato ede dunque la geometria a costituire l’habitat delle quantita negative. La specificazionedel verso di un cammino puo surrogare il segno negativo. Se, muovendomi su unaretta, passo dal punto A al punto B e da questo al punto C potremo sempre dire cheil percorso effettuato da A a B, addizionato a quello svolto da B a C e equivalente aquello fatto per andare direttamente da A a C, quale che sia la posizione relativa deitre punti A, B, C sulla retta:

AB +BC = AC.

Lo spostamento di 6 leghe verso sud seguito da quello di 4 leghe verso nord si puoesprimere benissimo con

6 leghe verso sud + 4 leghe verso nord = 2 leghe verso sud

anziche il consueto

6 leghe verso sud− 4 leghe verso sud = 2 leghe verso sud :

In generale, invece di sottrarre un cammino, si aggiungera l’inverso75 .

Il segno −, smarrita la propria identita come simbolo della sottrazione, ne riac-quista dunque un’altra: quella di inverso. L’inverso di un cammino AB (che conducecioe da A a B) e un altro cammino BA, che conduce da B ad A e che va consideratodistinto dal precedente: in questo si mostra con evidenza la natura vettoriale dei cam-mini introdotti da Mourey. Il cammino nullo e rappresentato dal punto A o, meglio,da un segmento come AA, per cui si puo scrivere

AB +BA = AA = 0

che si puo anche riscrivere come

AB + inverso di AB = AB − AB = 0

dove ora il segno − significa l’inverso e riscrivere la relazione precedente come

AB +−AB = 0,

bandendo ancora una volta la sottrazione. Procedendo, Mourey osserva

E evidente che l’inverso dell’inverso di AB, essendo l’inverso di BA, e AB stesso;dunque

−− AB = −BA = AB.

Cosı, la combinazione di due segni − e nulla e deve essere eliminata.76 ([35], p.11)

74Il suit de la que le signe −, considere comme exprimant la soustraction, ne peut pasetre admis en Algebre. L’Algebre, etant censee ne s’occuper que de quantites inconnues ouarbitraires, ne peut point admettre de soustraction.

75En general, au lieu de retrancher un voyage, on en ajoutera l’inverse76Il est evident que l’inverse de l’inverse de AB, etant l’inverse de BA, est AB lui-meme;

donc−−AB = −BA = AB.

Ainsi, le runion de deux signes − est nulle, et doit etre supprimee.

Page 59: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.7. ABBASSO IL SEGNO -! 59

Il modello cinematico utilizzato da Mourey come base delle sue considerazioniviene utilizzato anche per compendiare altri modelli utilizzati per introdurre quantitanegative, da quello commerciale a quello cronologico, tutto viene tradotto in terminidi cammini ([35], p. 16-19).

Un’idea sviluppata da Mourey e quella di numero diretto (nombre directif), graziealla quale i segmenti orientati escono da un contesto unidimensionale per svilupparsinel piano. Consideriamo due segmenti orientati di ugual lunghezza AB ed AC e siar > 0 l’angolo compreso tra di essi, dove r = 1 corrisponde ad un angolo retto.Per portare AB a sovrapporsi su AC occorre effettuare una rotazione nel piano, perconvenzione antioraria, di ampiezza r. La relazione indotta tra AB ed AC vieneindicata da Mourey in questi termini:

AC = ABr

ed una rotazione oraria corrisponderebbe ad un valore negativo di r. Si puo scrivereallora

AD = AB1, AF = AB2 AH = AB3 AB4 = AB.

dove l’ultima uguaglianza esprime l’equivalenza modulo 2π = 4π2

delle ampiezzeangolari. In particolare, siccome AF = −AB possiamo dire che

−AB = AB2.

Indicate per semplicita con a e b le lunghezze di due segmenti, ed r s le ampiezze didue angoli, si vengono a creare dei numeri orientati (nombres directifs) che e possibilemoltiplicare secondo la regola seguente:

ar × bs = (ar × b)s = [(ab)r]s = abr+s (2.11)

Grazie a questa definizione, nel caso particolare in cui r = s = 2 si ha

a2 × b2 = ab4 = ab0

mentre se r = 0 e s = 2 o, r = 2 e s = 0 si ottiene

a0 × b2 = ab2 a2 × b0 = ab2

che, nel loro complesso, traducono in linguaggio geometrico la regola dei segni. OsservaMourey:

Rispetto a questa definizione di moltiplicazione, faro la stessa osservazione gia fattarelativamente a quella di addizione; non occorre pensarla come verita da dimostrarema solo come convenzione da ammettere. La si deve ammettere se e utile77 ([35], p.31)

Puo sembrare paradossale che si dedichi un paio di righe ad avvertire il lettoreche una definizione non va dimostrata ma se Mourey come Bertrand si sofferma suquesto punto e perche avverte una cesura tra due modi di concepire la matematica:uno (more antiquo) ancora le definizioni a dei dati di fatto verificabili o quantomenoplausibili; l’altro (more moderno) sconnette la validita delle definizioni da una imme-diata rispondenza con una qualche forma di evidenza sensibile, rivendicando per la

77Par rapport a cette definition de la multiplication, je ferai la meme observation que j’aifaite relativement a celle de l’addition; il ne faut pas la regarder comme une verite a demontrer,mais seulement comme une convention a admettre. On doit admettre cette convention si elleest utile.

Page 60: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

60 CAPITOLO 2. MENO PER MENO FA PIU

matematica la liberta di darsi le proprie regole, il cui metro di giudizio sara l’utilita e,soprattutto, la coerenza interna.

Comunque sia, Mourey ha tutta l’intenzione di eliminare la regola dei segni conle sue difficolta, sostituendola con il calcolo geometrico. Per questo, commentando ilprodotto tra due binomi, egli scrive

Osserviamo come non sia in discussione la regola dei segni perche, per esempio a− bsignifica a+−b che si puo ancora mutare in a+ b2.

78 ([35], p. 34)

Il processo di normalizzazione delle quantia negative che vengono private della loroambiguita con il ricorso alla geometria prosegue con la definizione di proporzione chefa seguito, ovviamente, a quella di divisione:

dzar

:=

(d

a

)

z−r

la cui coerenza va ora discussa, dimostrando che inverte la moltiplicazione definita piuin alto. La proporzione (o equi-quoziente, equi-quotient) tra quattro numeri orientati a,b, c, d e l’uguaglianza dei rapporti a/b e c/d, a : b :: c : d. L’inciso, ovvio all’apparenza:

Dunque nella proporzione–o uguaglianza di quozienti—tra quantita orientate, il terzotermine si deve dedurre dal quarto, a seguito di moltiplicazione, divisione e cambio diverso, nello stesso modo in cui il primo e dedotto dal secondo.79 ([35], p. 36) permette

di far passare inosservata la pericolosa proporzione −1 : 1 = 1 : −1, riscritta nellaforma

12 : 1 = 14 = 12 :

per andare da AF = 12 ad AB = 14 si effettua una rotazione di due retti in versoantiorario come si fa per sovrapporre AB = 1 = 10 ad AF = 12: l’algebra torna, circatre secoli dopo Bombelli, sotto la tutela della geometria.

In un lavoro di poco posteriore, Ambroise Faure [21] vede nella regola dei segniun caso particolare della moltiplicazione tra numeri complessi: all’unita positiva siassocia l’inclinazione nulla, a quella negativa l’inclinazione di due retti e quindi, nondiversamente da Mourey, la regola dei segni emerge come conseguenza delle proprietadelle rotazioni del piano.

Il problema dell’ambiguita del segno − era molto sentito anche da Charles Meray(1835-1911), noto per i suoi lavori sui fondamenti dell’analisi, nelle prime pagine delsuo ciclo di lezioni in analisi matematica in quattro volumi, la cui parte relativa allaspiegazione delle quantita negative era gia apparsa nel 1890 [34]. Qui leggiamo:

Una confusione precoce e troppo assoluta tra i segni operatori di addizione e sottrazionee quelli costitutivi di quantita positive e negative, fatta ancora tra le quantita positiveed i loro valori numerici, rende i principii di questa teoria pressoche incomprensibiliai principianti. Le applicazioni alla specificazione matematica di grandezze opportuneprese in versi opposti e la pratica del calcolo algebrico, finiscono certamente per inse-

78Remarques qu’il n’est pas question ici de la regle des signes; car a−b, par exemple, signifiea+−b; ce qui peut encore se changer dans a+ b2.

79Ainsi dans la proportion ou l’equi-quotient, entre quantites directives, le 3e terme doit sededuire du 4e, par multiplication, division et version, de la meme maniere que le 1er se deduitdu 2e.

Page 61: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.8. IL PRINCIPIO DI PERMANENZA DELLE PROPRIETA FORMALI61

gnare a maneggiare queste quantita; tuttavia si giunge assai di rado a rendersi contoperfettamente dei motivi di tutto cio.80 ([34], p. 50)

La via perseguita da Meray presuppone la distinzione tra quantita assolute (i nu-meri naturali ed i razionali positivi) e quantita qualificate (quantites qualifiees) chesono quantita assolute cui vengono aggiunte delle qualita artificiali (factices) che lerendono idonee a subire delle operazioni, anch’esse dette artificiali ([34], p. 51). Aduna quantita assoluta a > 0 corrispondono due quantita qualificate, una detta positi-va e l’altra negativa che hanno entrambe a come valore assoluto e, questo e il punto,vengono indicate con i simboli ←−a e −→a , rispettivamente e sono dette tra loro opposte:allo 0 corrisponde la quantita qualificata

←→0 , detta neutra. Ora si puo introdurre

l’addizione tra quantita qualificate come l’operazione attraverso cui si sommano (co-me nell’aritmetica ordinaria) i valori assoluti delle quantita positive e, separatamente,tutti i moduli delle quantita negative. Si sottragga il minore dal maggiore dei risul-tati cosı ottenuti. Esso costituisce il modulo del risultato della somma che avra lastessa natura della quantita qualificata di modulo maggiore, cioe esattamente comela somma algebrica tradizionale, salvo il fatto della nuova notazione: una definizionetradizionale che ricalca quella di Meray si trova, ad esempio, nel trattato ([14], p.13) diCharles Choquet (1798-?). Se i valori assoluti sono uguali, il risultato dell’operazionee la quantita neutra. Dunque, per calcolare il valore di

−→3 +←−7 +←−2 +←→0 +

−→10 +

←→0

si considerano separatamente−→3 +−→10 =

−→13 e

←−7 +←−2 =

←−9 e si sottrae aritmeticamente

9 da 13, ottenendo come risultato−→4 . Con la notazione di Meray, vi e il pregio di una

immediata rintracciabilita dell’effetto del segno sulla quantita qualificata. Definitainfatti la sottrazione come l’operazione che permette di trovare una terza quantita che,aggiunta alla seconda, riproduce la prima, se ne ha anche una definizione operativaperche il risultato della sottrazione si ottiene aggiungendo alla prima quantita l’oppostodella seconda: −→

5 −←−6 =−→5 +−→6 =

−→11

ed e possibile trasformare addizioni e sottrazioni ad una certa quantita qualificata insottrazioni ed addizioni delle quantita opposte:

←−5 −←−11 +−→6 −←−3 =

←−5 +−→11 +

−→6 +−→3 =

−→15.

2.8 Il principio di permanenza delle proprieta

formali: Peacock, Hankel

Abbiamo gia visto con Buee come la visione newtoniana di algebra come aritmeticauniversale non fosse ritenuta pienamente soddisfacente all’inizio dell’Ottocento. Lacritica si fa piu serrata nelle opere di George Peacock: nel Treatise on Algebra del

80Une confusion trop prematuree et trop absolue faite entre les signes operatoires de l’ad-dition et de la soustraction et les signes constitutionnels des quantites positives et negatives,faite encore entre les quantites positives et leurs valeurs numeriques, rend les principes decette theorie a peu pres inintelligibles pour les commencants. Ses applications a la specifi-cation mathematique des grandeurs convenables dans deux sens contraires, et la pratique ducalcul algebrique, finissent sans doute par leur apprendre le maniement de ces quantites; maisil parviennent bien rarement a se rendre un compte parfaitement raisonne de ce qu’ils fontainsi.

Page 62: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

62 CAPITOLO 2. MENO PER MENO FA PIU

1830 e poi nella riedizione in due volumi della stessa opera, pubblicati nel 1842 e 1845:il primo dedicato all’algebra aritmetica, l’altro all’algebra simbolica. Ecco come iniziavail Treatise del 1830:

Si e sempre considerata l’algebra come una modifica dell’aritmetica sorta per l’uso di unlinguaggio simbolico e le operazioni di una scienza sono state trasferite all’altra senzamenzionare il loro significato ed applicazione: in questo modo i simboli si assumonocome rappresentanti generali ed illimitati di ogni specie di quantita: le operazioni diaddizione e sottrazione intese nel loro semplice significato aritmetico si suppongonoindicate dai segni + e − utilizzati per collegare tali simboli tra loro: moltiplicazione edivisione, due operazioni inverse in aritmetica, si suppongono applicabili ugualmente atutte le quantita che questi simboli possono indicare, senza alcuna necessaria modificadel loro significato; se pero l’impiego originario di questi segni ed operazioni e cosılimitato attentamente nell’estensione del loro significato, non vi e una limitazionesimile imposta all’estensione della loro applicazione: cosı, non si ritiene necessarioconfinare le operazioni di addizione e sottrazione a quantita dello stesso tipo, o chele quantita sottratte debbano essere minori di quelle da cui esse sono sottratte; (...)E questa immediata deduzione dell’algebra dall’aritmetica e lo stretto legame che sie tentato di stabilire tra tali scienze, che ha condotto a credere che una sia davverofondata sull’altra. (...) Credo appropriato mostrare in dettaglio le tappe successive chehanno portato dai principi e dalle operazioni dell’aritmetica a quelle dell’algebra perdimostrare che il loro legame non e necessario ma convenzionale e che l’aritmetica euna Scienza del Suggerimento, a cui i princıpi e le operazioni dell’algebra sono adattatema da cui essi non sono ne limitati ne determinati.81 ([39], p. vi-viii)

Questa analisi mette in luce la necessita di non subordinare le regole dell’algebraa modelli validi solo in aritmetica (che Peacock chiama Arithmetic Algebra, quando inumeri sono rappresentati da lettere). Occorre certo richiedere che, quando le quantitaalgebriche si riducono ai numeri trattati in aritmetica, vi sia coincidenza delle regoledell’algebra (Symbolic Algebra) con l’aritmetica ma quest’ultima non puo avere unruolo fondazionale per l’algebra:

81Algebra has always been considered as merely such a modification of Arithmetic as arosefrom the use of symbolical language, and the operation of one science have been transferred tothe other without any statement of an extension of their meaning and application: thus sym-bols are assumed to be the general and unlimited representatives of every species of quantity:the operations of Addition and Subtraction in their simple arithmetical sense, are assumedto be denoted by the signs + and −, and to be used in connecting such symbols with eachother: Multiplication and Division, two inverse operations in Arithmetic, are supposed to beequally applicable to all quantities which symbols may denote, without any necessary modi-fication of their meaning: but at the same time that the primitive assumption of such signsand operations is thus carefully limited in the extent of their signification, there is no suchlimitation imposed upon the extent of their application: thus it is not considered necessarythat the operations of Addition and Subtraction should be confined to quantities of the samekind, or that the quantities subtracted should be less than the quantities from which they aresubtracted: (...)

It is this immediate derivation of Algebra from Arithmetic, and the close connection whichit has been attempted to preserve between those sciences, which has led to the formation ofthe opinion, that one is really founded upon the other. (...) It may be proper to exhibit atsome length the successive transitions which are made from the principles and operations ofArithmetic to those of Algebra, in order to shew that their connection is not necessary butconventional, and that Arithmetic can only be considered as a Science of Suggestion, to whichthe principles and operations of Algebra are adapted, but by which they are neither limitednor determined.

Page 63: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.8. IL PRINCIPIO DI PERMANENZA DELLE PROPRIETA FORMALI63

Dunque a − (a + b) esprimerebbe ovviamente un’operazione impossibile in un talesistema di algebra; ma, se (a+ b) fosse sostituito da un unico simbolo c, l’espressionea − c, benche impossibile come a − (a + b), non la rappresenterebbe piu. Tuttavia,l’ipotesi di un’esistenza indipendente dei segni + e − rimuove una tale limitazione erende possibile eseguire l’operazione indicata da − in tutti i casi: e questo assunto chesepara l’aritmetica dall’algebra simbolica e che rende necessario stabilirne i princıpi subase propria.82 ([39], p. ix)

Dopo questa preparazione, Peacock enuncia il pricipio di permanenza delle formeequivalenti:

Il principio di equivalenza delle forme equivalenti, che mi sembra di grande importan-za nella generalizzazione dei risultati delle operazioni algebriche, deve ricevere la suaautorita dal punto di vista che ho assunto circa i princıpi dell’algebra e il loro legamecon l’aritmetica, considerata come scienza del suggerimento: infatti, in primo luogo ilprincipio suppone l’indipendenza delle operazioni algebriche e dei risultati ottenuti daivalori particolari dei simboli e presuppone le forme equivalenti come valide indipen-dentemente dai valori che tali simboli possono avere, fintantoche essi hanno una formagenerale: in secondo luogo, ci permette di considerare le forme equivalenti ottenutenell’algebra aritmetica, dove i simboli hanno forma generale ma valori particolari, co-me necessariamente gli stessi dell’algebra simbolica, se alcuna di tali forme si presentacome risultato di operazioni algebriche.83 ([39], pp. xvii-xviii)

Peacock trae le conseguenze immediate di questo cambio di prospettiva:

Una delle conseguenze piu importanti di questo modo di vedere i princıpi e le opera-zioni dell’algebra e la completa separazione che si ottiene tra le leggi di combinazionedei simboli ed i princıpi della loro interpretazione: nelle consuete impostazioni dell’al-gebra, l’interpretazione originaria delle operazioni algebriche determina o si supponedeterminare, esplicitamente o implicitamente, i risultati che si ottengono e le leggidi combinazione dei simboli: nell’impostazione che mi sono spinto a proporre la si-tuazione e ribaltata, perche le leggi di combinazione dei simboli sono assunte non adarbitrio ma con riferimento generale all’interpretazione che avevano originariamentenella scienza subordinata dell’aritmetica mentre le interpretazioni dei risultati ottenuti

82Thus a − (a + b) would obviously express an impossible operation in such a system ofAlgebra; but if (a+ b) was replaced by a single symbol c, the expression a− c, though equallyimpossible with a − (a + b), would cease to express it. The assumption however of the inde-pendent existence of the signs + and − removes this limitation, and renders the performanceof the operation denoted by − equally possible in all cases: and it is this assumption whicheffects the separation of arithmetical and symbolical Algebra, and which renders it necessaryto establish the principles of this science upon a basis their own.

83The principle of the permanence of equivalent forms, which appears to me so important ingeneralizing the results of algebraical operations, must derive its authority from the view whichI have taken of the principles of Algebra and of their connections with Arithmetic, consideredas a science of suggestion: for in the first place, this principle assumes the operations of Algebraand their results altogether independent of the specific values of the symbols, and equivalentforms as existing therefore whatever values such symbols may be supposed to possess, so longas they are general in form: and in the second place, it enables us to consider the equivalentforms obtained in arithmetical Algebra, where the symbols are general in form, though specificin value, as necessarily the same likewise in symbolical Algebra, if any such forms exist as theresult of algebraical operations.

Page 64: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

64 CAPITOLO 2. MENO PER MENO FA PIU

sono determinate completamente in accordo a quelle leggi grazie ad un riferimento aspecifici valori dei simboli.84 ([39], pp. xx-xxi)

Peacock concepisce l’algebra come la scienza del ragionamento generale medianteun linguaggio simbolico85 ([39], p. 1). La regola dei segni non e piu un teorema dadedurre ma una regola posta a fondamento dell’edificio algebrico:

I simboli possono essere accorporati tra loro in modo da rappresentare una nuovaquantita dello stesso o di un altro tipo, come nelle operazioni di moltiplicazione edivisione: in questo caso, la quantita che e risultato dell’operazione deve avere un segnodeterminato, dipendente dai segni dei simboli incorporati. Similmente, combinando traloro simboli come nelle operazioni di addizione e sottrazione, indicate dagli stessi segni+ o −, da cui i simboli stessi sono affetti, segni simili o dissimili si presentano insiemeed e dunque utile, per evitare confusione, incorporarli in un unico simbolo. In entrambii casi, essi sono soggetti a questa regola, che deve essere assunta e non dimostrata, eche puo considerarsi essere uno dei piu importanti princıpi primi di questa scienza.

Ogni volta in cui, per l’accorpamento di due simboli, due segni simili sono vicini traloro, siano essi + e + o − e −, essi sono sostituiti dal solo segno +: se pero i duesegni sono dissimili, siano essi + e − o − e +, occorre sostituirli con il solo segno −.86 ([39], p. 3)

Vediamo all’opera il principio di permanenza formulato da Peacock nel caso dellaregola dei segni.

Art. 566 1. Simboli generali in forma sono parimenti generali nella rappresentazionee nel valore.

2. Le regole delle operazioni di moltiplicazione e divisione nell’algebra aritmetica,quando vengono applicate a simboli generali in forma ma ristrette quanto a valore, losono senza alterazioni alle operazioni che portano lo stesso nome nell’algebra simbolica,quando i simboli sono generali tanto in valore che in forma.

84One of the most important consequences of this view of the principles and operations ofAlgebra, is the complete separation which it effects of the laws for the combination of symbolsfrom the principles of their interpretation: in common systems of Algebra, the previous inter-pretation, assumed or understood, of the operations of Algebra, determines, or is supposed todetermine, the results which are obtained, and the laws of symbolical combinations: but thecase is reversed in the system which I have ventured to propose, where the laws of symbolicalcombinations are assumed, not arbitrarily, but with a general reference to their anticipatedinterpretation in the subordinate science of arithmetic, whilst the interpretations of the resultsobtained are entirely determined in accordance with those laws by a reference to the specificvalues of the symbols.

85the science of general reasoning by symbolical language.86Symbols may be incorporated into each other, so as to represent a new quantity of the

same or a different kind, as in the operations of Multiplication and Division: in this case, thequantity which is the result of the operation, must have some determinate sign, dependentupon the signs of the symbols incorporated. In like manner, in combining symbols togetherby the operations of Addition and Substraction, which are denoted by the same signs + or −,by which the symbols themselves are affected, similar or dissimilar signs must come together,which it is expedient, in order to prevent confusion, to incorporate them into one. In bothcases, they are subject to the following rule, which is assumed and not proved, and which maybe considered as constituting one of the most important first principles of this science.

Whenever by the incorporation or combination of two symbols, two similar signs cometogether, whether + and + or − and −, they are replaced by the single sign +: but if the twosigns are dissimilar, whether + and − or − and +, they are replaced by the single sign −.

Page 65: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.8. IL PRINCIPIO DI PERMANENZA DELLE PROPRIETA FORMALI65

Segue dalla seconda ipotesi che tutti i risultati delle operazioni di moltiplicazione edivisione in algebra aritmetica saranno anche risultati di algebra simbolica, ma non ilviceversa.

Art. 567. Nell’algebra simbolica ed in quella aritmetica si presentano gli stessi trecasi dell’operazione di moltiplicazione: essi sono i seguenti:1. Quando il moltiplicando ed il moltiplicatore sono monomi.2 Quando il moltiplicando e un polinomio ed il moltiplicatore un monomio.3 Quando sia il moltiplicando che il moltiplicatore sono polinomi.

Nell’algebra aritmetica, la regola di occorrenza dei segni simili o dissimili e richiestasolo nel secondo e nel terzo caso: in algebra simbolica, pero, la presenza di simboli odi termini singoli affetti dai segni + e − utilizzati indipendentemente rende necessarioapplicare la regola in tutti e tre i casi in esame.

Art. 568. Per dimostrare che la regola dei segni e conseguenza necessaria del-le ipotesi fatte all’Art. 566, considereremo il prodotto di a − b e c − d come vienedeterminato in base ai principii dell’algebra aritmetica, cioe

(a− b)(c− d) = ac− ad− bc+ bd. (1)

Assumendo pertanto la permanenza di questo risultato o, in altre parole, l’equivalenzadei due membri che lo compongono per tutti i valori dei simboli, possiamo supporre chedue dei numeri si annullino successivamente: dunque, se supponiamo b = 0 e d = 0,il prodotto (1) in oggetto diventa

1. (a − 0)(c− 0) = ac− a× 0 − 0 × c + 0× 0, o a × c = ac, dimenticandosi deitermini che coinvolgono lo zero.Se supponiamo b = 0 e c = 0, otteniamo

2. (a− 0)(0− d) = a× 0− ad− 0× 0 + 0× d, o a×−d = −ad.Se supponiamo b = 0 e c = 0, otteniamo

3. (0− b)(c− 0) = 0× c− 0× 0− bc+ b× 0, o −b× c = −bc.Se supponiamo a = 0 e c = 0, otteniamo4. (0− b)(0− d) = 0× 0− 0× d− b× 0 + bd, o −b×−d = bd.Segue dunque in generale come conseguenza necessaria delle ipotesi (Art. 566),

che formano il fondamento dei risultati della moltiplicazione nell’algebra simbolica, che“quando due segni, siano essi + e + o − e −, sono presenti in una moltiplicazione,occorre rimpiazzarli nel prodotto dal solo segno +: e che quando due segni dissimilisono presenti, siano essi + e − o − and +, essi vanno sostituiti nel prodotto con ilsolo segno −.87 ([41], pp. 17-18)

87Art. 566 1st. Symbols which are general in form, are equally general in representationand value.

2nd. The rules of the operations of multiplication and division in Arithmetical Algebra,when applied to symbols which are general in form though restricted in value, are appliedwithout alteration to the operations bearing the same names in Symbolical Algebra, when thesymbols are general in their value as well as in their form.

It will follow from the second assumption that all the results of the operations of multipli-cation and division in Arithmetical Algebra, will be results likewise of Symbolical Algebra,but not conversely.

Art. 567. The same three Cases of the operation of multiplication present themselves inSymbolical and in Arithmetical Algebra: they are as follows:

1st. When the multiplicand and the multiplier are mononomials88.2nd. When the multiplicand is a polynomial and the multiplier is a mononomial.

Page 66: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

66 CAPITOLO 2. MENO PER MENO FA PIU

Quindi, l’idea dietro al principio di permanenza usato da Peacock e quella diservirsi di risultati ottenuti nell’ambito dell’algebra aritmetica, supporre di estendernela validita quando i simboli sono slegati dalle limitazioni proprie dell’aritmetica eporli a fondamento dell’algebra simbolica. Tutte le pretese dimostrazioni della regolaavanzate nei secoli precedenti lasciavano inespressa quest estensione e pretendevano didimostrare in generale un risultato ottenuto nello spazio ristretto dell’aritmetica, fossepure simbolica. Per concludere questa lunga esposizione dell’approccio di Peacock,osservo che nella Arithmetic Algebra egli aveva dedotto in campo aritmetico la regola(a− b)c = ac− bc con un argomento alla Viete:

E evidente che il prodotto di a− b per c sara inferiore rispetto al prodotto di a per c,per l’ammontare del prodotto di b per c.89 ([40], Art.26, p. 25)

Quanto al prodotto (a−b)(c−d), Peacock e piu formale e procede ponendo x = a−b,in modo da eseguire il prodotto richiesto in base a quanto stabilito all’Art. 26:

(a− b)(c− d) = x(c− d) = cx− dx = c(a− b)− d(a− b)

ed iterare il procedimento per giungere a

(a− b)(c− d) = c(a− b)− d(a− b) = ca− bc− (da− db)

ed infine arrivare al risultato cambiando i segni ai termini tra parentesi, secondo laregola che aveva spiegato all’Art. 21 (cfr. [40], p. 29).

3rd. When both the multiplicand and multiplier are polynomials.

In Arithmetical Algebra, the rule for the concurrence of like and unlike signs is required inthe 2nd and the 3rd Cases only: but in Symbolical Algebra, the occurrence of symbols or singleterms affected by the signs + and − used independently renders its application necessary inall the three Cases under consideration.

Art. 568. In order to shew that the Rule of signs is a necessary consequence of theassumptions made in Art. 566, we shall consider the product of a− b and c− d as determinedby the principles of Arithmetical Algebra, which is

(a− b)(c− d) = ac− ad − bc+ bd. (1)

Assuming, therefore, the permanence of this result, or in other words, the equivalence of thetwo members of which is composed, for all values of the symbols, we may suppose two oftheir number to become successively equal to zero: thus, if we suppose b = 0 and d = 0, theproduct (1) in question becomes

1st. (a− 0)(c− 0) = ac− a× 0− 0× c+ 0× 0, or a× c = ac, obliterating the terms whichinvolve zero.

If we suppose b = 0 and c = 0, we get,2nd. (a − 0)(0 − d) = a× 0− ad − 0× 0 + 0× d, or a×−d = −ad.

If we suppose b = 0 and c = 0, we get,3rd. (0 − b)(c − 0) = 0× c− 0× 0− bc+ b× 0, or −b× c = −bc.If we suppose a = 0 and c = 0, we get,4th. (0 − b)(0 − d) = 0× 0− 0× d− b× 0 + bd, or −b×−d = bd.It follows therefore generally, as a necessary consequence of the assumptions (Art. 566),

which form the foundation of the results of multiplication in Symbolical Algebra, that whentwo like signs, whether + and + or − and −, concur in multiplication, they are replaced inthe product by the single sign +: and that when two unlike signs similarly concur, whether+ and −, or − and +, they are replaced in the product by the single sign −.

89It is obvious that the product of a− b by c, will be less than the product of a by c, by theproduct of b by c.

Page 67: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.8. IL PRINCIPIO DI PERMANENZA DELLE PROPRIETA FORMALI67

Piu che a Peacock, il principio di permanenza delle proprieta formali (Princip derPermanenz formaler Gesetze) e legato al nome di Hermann Hankel che lo formulo nel1867:

Quando due simboli algebrici espressi in forma generale sono uguali tra loro, debbonorestare anche uguali quando i simboli cessano di denotare semplici grandezze, e dunquele operazioni acquistano un contenuto di qualche altra natura.90. ([27], p. 11)

Hankel definisce in astratto delle operazioni come legami, diretti od inversi, tra og-getti astratti che godono di certe proprieta dichiarate esplicitamente: per l’addizionee la moltiplicazione la proprieta associativa e la proprieta distributiva della molti-plicazione rispetto alla somma, da cui la regola dei segni viene dedotta. Definita lasottrazione (a−b), tra due oggetti a e b come quell’oggetto che, sommato a b restituiscea, cioe

(a− b) + b = a

e lo zero come modulo (Modul) della somma, cioe tale che a + 0 = a, qualunque sial’oggetto a, Hankel definisce −a come risultato b dell’operazione 0 − a. Introdotta lamoltiplicazione nei termini accennati sopra, Hankel ne deduce la regola dei segni:

(a+ b)c = ac+ bc

pone b = −a cosicche (a+ (−a))c = 0, cioe ac+ (−a)c = 0 e dunque

(−a)c = −ac.

Scritta l’altra forma della proprieta distributiva

a(c+ d) = ac+ ad

e posto in essa d = −c si ricavaa(−c) = −ac

e, infine, sostituito c con −c in (−a)c = −ac ricava

(−a)(−c) = ac

concludendo

Possiamo dunque far discendere la nota regola di moltiplicazione tra numeri negatividal principio distributivo.91 ([27], p. 32)

Invocando il principio di permanenza per definire la regola dei segni, Hankelcommenta:

Non si sottolineera mai abbastanza, a fronte di una visione generale alquanto diffusa,che queste equazioni [quelle che esprimono la regola dei segni] in una matematicaformale non possono piu essere dimostrate; sono convenzioni arbitrarie per permettere

90Wenn zwei in allgemeinen Zeichen der arithmetica universalis ausgedruckte Formen einan-der gleich sind, so sollen sie einander auch gleich bleiben, wenn die Zeichen aufhoren, einfacheGrossen zu bezeichnen, und daher auch die Operationen einen irgend welchen anderen Inhaltbekommen.

91Konnen so die bekannten Regeln der Multiplication negativer Zahlen aus demdistributiven Princip abgeleitet werden.

Page 68: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

68 CAPITOLO 2. MENO PER MENO FA PIU

la conservazione del formalismo nel calcolo. (...) Una volta decisa questa convenzione,seguiranno necessariamente tutte le altre regole della moltiplicazione.92 ([27], p. 41).

Una esposizione molto chiara, in qualche senso operativa, del principio di perma-nenza si trova nell’articolo sui fondamenti dell’aritmetica scritto da Hermann Schubertnel 1898 e che inaugura la monumentale Encyklopadie der mathematischen Wissen-schaften. Qui Schubert elenca i quattro passi in cui si articola il principio nel casodell’estensione di un campo numerico:

in primo luogo, ad ogni complesso di simboli che non rappresenti numeri gia noti si con-ferisca un senso tale da poterlo trattare secondo le stesse regole, come se rappresentasseuno dei numeri definiti sino a quel punto;

in secondo luogo, si definisca un tale complesso di simboli come numero, in sensolato e di conseguenza si estenda il concetto di numero;

in terzo luogo, si dimostri che per i numeri intesi in senso lato valgono gli stessiteoremi validi per i numeri in senso non ancora esteso;

in quarto luogo, si definisca il significato di uguale, maggiore e minore nel nuovocampo numerico.93 ([48], p. 11)

Il terzo passo della proposta descritta da Schubert offre il fianco alla critica di Peano,che esso non puo riguardare tutte le regole vigenti nell’insieme numerico piu ristretto,dal momento che, ad esempio, il teorema: se ab = 1 allora a = b = 1 e vero neinaturali ma falso gia negli interi relativi. In conclusione, mi sembra di poter direche, nel passare da teorema a norma posta a fondamento dell’algebra, la regola deisegni abbia seguito un cammino simile alla definizione di insieme infinito propostada Dedekind, come insieme che puo essere messo in corrispondenza biunivoca con unsuo sottoinsieme proprio: questa proprieta che apparve per secoli un paradosso chedoveva mettere in guardia dalla natura contraddittoria del concetto di infinito diventaun punto di partenza, una definizione da cui trarre le conseguenze logiche. Qui, itentativi di dimostrare la regola dei segni a partire dalla proprieta distributiva, validain campo aritmetico, invocavano piu o meno implicitamente la necessita di estenderela validita delle proprieta fondamentali delle operazioni elementari: se da una parte,il non aver messo in luce questo aspetto, ha causato una infinita di fraintendimenti,l’approccio pragmatico, concreto, alla matematica non ha permesso che tali indecisionirallentassero lo sviluppo dell’algebra, come vedremo nei capitoli che seguono.

92Es kann gegenuber einer sehr allgemein verbreiteten Ansicht nicht scharf genug hervor-gehoben, dass diese Gleichungen [(−A)Γ = −AΓ, A(−Γ) = −AΓ, (−A)(−Γ) = AΓ] in derformaler Mathematik nimmermehr beweisen werden konnen; es sind arbitrare Conventionen

zu Gunsten der Erhaltung des Formalismus im Calcul. (...) Sind aber diese Convention einmalgeschlossen, so folgen daraus alle anderen Gesetze der Multiplication mit Nothwendigkeit.

93erstens darin, jeder Zeichen-Verknupfung, die keine der bis dahin definierten Zahlen dar-stellt, einen solchen Sinn zu erteilen, dass die Verknupfung nach desselben Regeln behandeltwerden darf, als stellte sie eine der bis dahin definierten Zahlen dar;

zweitens darin, eine solche Verknupfung als Zahl in erweiterten Sinne des Wortes zudefinieren und dadurch den Begriff der Zahl zu erweitern;

drittens darin, zu beweisen, dass fur die Zahlen im erweiterten Sinne dieselbe Satze gelten,wie fur die Zahlen im noch nicht erweiterten Sinne;

viertens darin, zu definieren, was im erweiterten Zahlengebiet gleich, grosser und kleinerheisst.

Page 69: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.9. REGOLA DEI SEGNI SENZA NUMERI NEGATIVI 69

2.9 Regola dei segni senza numeri negativi

Come accennato all’inizio di questo capitolo, sul finire del XIX secolo venne elaboratoun approccio ai numeri negativi–e non solo– in modo da ricondurre tutte le operazionidell’aritmetica elementare ad opportune operazioni definite su coppie ordinate di interi.Le prime formulazioni di tale metodo sono rintracciabili, anche se non pienamentesviluppate, in alcuni corsi di lezioni che Carl Weierstrass teneva a Berlino ma sonostati sviluppati dettagliatamente da altri matematici, quali Jules Tannery. Seguiamola chiara esposizione che si trova nel Cap. II della monografia di Louis Couturat (1868-1914) L’infini mathematique che e dedicato all’estensione aritmetica del concetto dinumero, precisamente all’idea di nombre qualifie che surroghera i tradizionali interirelativi. La definizione cardinale del metodo e quella di coppia (couple): un elemento(a, b) del prodotto cartesiano Q×Q. Due coppie sono uguali

(a, b) = (a′, b′)

sea+ b′ = b+ a′. (2.12)

Con questa definizione si puo affermare che

(n, n) = (1, 1) = (0, 0) ∀n ∈ Q.

La prima operazione definita su queste coppie e l’addizione algebrica

(a, b) + (a′, b′) = (a+ a′, b+ b′) (2.13)

che gode delle proprieta associativa e commutativa e permette di assegnare alla coppia(0, 0) il ruolo di zero algebrico in quanto

(a, b) + (0, 0) = (a, b)

qualunque sia la scelta della coppia (a, b). Due coppie come (a, b) e (b, a) sono poidette coppie simmetriche e la loro somma e nulla in quanto

(a, b) + (b, a) = (a+ b, a+ b) = (0, 0).

E anche possibile definire la differenza di due coppie distinte (a, b) ed (a′, b′) comequella che, sommata ad una delle precedenti, fornisce la coppia restante. Precisamente,posto

(a, b)− (a′, b′) := (a+ b′, b+ a′)

si osserva che

(a+ b′, b+ a′) + (a′, b′) = (a, b) + (b′, a′) + (a′, b′) = (a, b) + (0, 0) = (a, b)

in virtu della definizione di coppie simmetriche. D’altra parte, siccome (a+b′, b+a′) =(a, b) + (b′, a′), possiamo concludere che

(a, b)− (a′, b′) = (a, b) + (b′, a′)

Retrancher d’un couple un autre couple, c’est ajouter au premier le symetrique dusecond. ([16], p. 25)

E possibile anche introdurre una relazione di ordine tra coppie (a, b) > (a′, b′)((a, b) < (a′, b′)) se

a+ b′ > b+ a′ (a+ b′ < b+ a′).

Page 70: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

70 CAPITOLO 2. MENO PER MENO FA PIU

Il prodotto algebrico di due coppie e infine definito come

(a, b)× (a′, b′) = (aa′ + bb′, ab′ + ba′) (2.14)

che gode delle stesse proprieta del prodotto ordinario e per il quale la coppia (0, 0) etale che

(a, b)× (0, 0) = (0, 0).

Come visto, vi sono piu coppie equivalenti tutte allo (0, 0) e cio suggerisce di indivi-duare altri tipi di coppie equivalenti. Il risultato viene ottenuto ricorrendo al teoremaseguente

E possibile aggiunere o sottrarre un numero ai due termini di una coppia senzamodificarne il valore.94 ([16], p. 27)

Si tratta di una rapida verifica perche (a, b) = (a+ n, b+ n) equivale a

a+ b+ n = b+ a+ n

che e un’ovvia identita. Ora, dalla definizione di uguaglianza di due coppie si vede chese a − b = a′ − b′ allora le coppie (a, b) ed (a′, b′) sono uguali. Viceversa, se questecoppie sono uguali e dunque si ha

a+ b′ = b+ a′

vediamo che, se a = a′ allora anche b = b′ e quindi a− b = a′ − b′. Se invece a 6= a′ e,per esempio, supponiamo a < a′, allora posto a′ = a+ d la condizione di uguaglianzadiviene

a+ b′ = b+ a+ d

da cui segue che b′ = b+d per cui e ancora vero che a− b = a′− b′. Come conseguenzadi quanto detto sinora, se da ambo i termini di una coppia (a, b) si sottrae il termineminore si ottiene una coppia uguale ad (a, b) che rappresenta la riduzione alla suaespressione piu semplice. Si possono presentare due casi:

1. Se a > b allora(a, b) = (a− b, 0)

e coppie di questo tipo vengono definite come numeri positivi.

2. Se a < b allora(a, b) = (0, b− a)

e coppie di questo tipo vengono definite come numeri negativi.

3. Se a = b allora(a, b) = (0, 0)

e la coppia definisce il numero zero.

L’insieme numerico cosı ottenuto e detto insieme dei numeri qualificati (nombres qua-lifies, [16], p. 29) E chiaro che solo due numeri positivi o due numeri negativi possonoessere uguali tra loro, mai un numero positivo puo uguagliare un numero negativo.Inoltre, dalla definizione di addizione, abbiamo che

(a, 0) + (a′, 0) = (a+ a′, 0)(0, b) + (0, b′) = (0, b+ b′)(a, 0) + (0, b′) = (a, b′)

94On peut ajouter ou rentracher un meme nombre aux deux termes d’un couple sans changersa valeur.

Page 71: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.10. ANALOGIE CON LA REGOLA DEI SEGNI 71

da cui si vede che la somma di due numeri positivi e positiva, la somma di due numerinegativi e ancora negativa mentre la somma di un numero positivo e di uno negativoe

(a, 0) + (0, b′) = (a, b′) = (a− b′, 0) se a > b′

(a, 0) + (0, b′) = (a, b′) = (0, b′ − a) se a < b′

che confermano note proprieta numeriche. Venendo al prodotto, avremo, grazie alla(2.14),

(a, 0)× (a′, 0) = (aa′, 0)(a, 0)× (0, b′) = (0, ab′)(0, b)× (a′, 0) = (0, a′b)(0, b)× (0, b′) = (bb′, 0)

che riproducono la regola dei segni, senza introdurre i numeri negativi. Dal punto divista formale il metodo delle coppie, che fu utilizzato anche per introdurre i razionali ele operazioni su di essi, e piuttosto soddisfacente. Ricordiamo pero di aver visto tantimatematici preoccuparsi nel corso degli anni alle difficolta che la regola dei segni, nellasua accezione tradizionale, causava ai principianti. Nasce una domanda: e possibiletrarre degli spunti pedagogici da questo metodo? In diversi, tra i quali Cesare Burali-Forti, all’inizio del XX secolo criticarono il meotdo delle coppie anche per l’eccessivaprolissita e complicazione delle operazioni che costituivano un prezzo forse troppo altoda pagare per il beneficio ottenuto. Vi fu, restando in Italia, almeno un tentativocompiuto di introdurre il metodo delle coppie nella scuola, leggermente modificato inmodo da rendere piu intuitiva la notazione. Fu quello di Ettore Baroni (1866-1918)—assistente di Ulisse Dini a Pisa e poi docente presso il Liceo Visconti di Roma—cheintodusse l’algebra in un manuale ad uso dei Licei [5] con questo metodo.

2.10 Analogie con la regola dei segni

La difficolta ad accettare la regola dei segni non e dovuta alla regola in se ma alledifficolta ad accettare i numeri negativi. Per suffragare questa ipotesi, in questa sezioneconclusiva mostro due regole del tutto analoghe, accettate senza problemi. La primarisale alle Disquisitiones Arithmeticae [17] di Gauss (1777-1855), pubblicate nel 1801.Per comprendere di cosa si tratti, richiamiamo alcune nozioni di teoria elementaredei numeri [52]. Sia p > 2 un numero primo e sia Zp l’insieme delle classi di restomodulo p, identificabile con l’insieme Zp = 0, 1, 2, ..., p−1. Accanto a questo insiemeconsidereremo Z∗

p := Zp \ 0. La teoria dei residui quadratici si occupa della piusemplice congruenza di secondo grado

x2 = a mod p (2.15)

ed il primo problema da stabilire e se, scelto a ∈ Z∗p, l’equazione (2.15) abbia o meno

soluzione. Per rispondere a questa domanda, osserviamo anzitutto che, essendo

k2 = (p− k)2 mod p

possiamo limitarci a prendere a nell’insieme1, 2, · · · , p−1

2

. Ora, osserviamo che due

qualsiasi tra i p−12

interi

12, 22, 32, · · ·(p− 1

2

)2

(2.16)

Page 72: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

72 CAPITOLO 2. MENO PER MENO FA PIU

non possono essere congrui modulo p. Se cosı fosse, si dovrebbe avere

x2 = y2 mod p

per qualche intero x, y 6= x nell’insieme1, 2, · · · , p−1

2

. Poiche da

x2 = y2 mod p

discende chex2 − y2 = (x− y)(x+ y) = 0 mod p

si dovra avere o x = y oppure x = −y, modulo p. Quest’ultima uguaglianza e impos-sibile perche la somma x+ y e strettamente minore di p. Dunque i p−1

2numeri (2.16),

ridotti eventualmente ad essere minori di p, rappresentano i soli valori di a per i qualiesso e un residuo quadratico. Gli elementi di Z∗

p si ripartiscono in due classi, ciascunaformata da p−1

2elementi. In una classe figurano gli a per i quali (2.15) ha soluzione

e che sono detti residui quadratici di p; nell’altra figurano gli a per i quali (2.15) nonammette alcuna soluzione e che sono detti non residui quadratici di p. Seguendo unanotazione introdotta da Gauss diremo, rispettivemente

aRp aNp

a seconda che a sia o meno un residuo quadratico di p.

Esempio. Prendiamo p = 7; abbiamo

12 = 1 22 = 4 32 = 9 = 2 mod p

per cui i residui quadratici di 7 sono 1, 2, 4 mentre 3, 5, 6 sono non residui quadraticidi 7.

Una domanda naturale e sapere se la proprieta di essere o meno un residuoquadratico venga conservata dal prodotto.

1. Siano R1 ed R2 due residui quadratici del numero primo p > 2. Allora R1R2 eancora un residuo quadratico. Infatti, debbono esistere x1 ed x2 in Z∗

p tali che

x21 = R1 mod p x2

2 = R2 mod p

sicche(x1x2)

2 = R1R2 mod p

che mostra come R1R2 sia pure residuo quadratico di p.

2. Sia R1 un residuo quadratico ed N2 un non residuo quadratico del numero primop > 2. Allora R1N2 non e un residuo quadratico. Supponiamo che lo sia: esisteraz ∈ Z∗

p tale chez2 = R1N2 mod p. (2.17)

Ora, siccome R1 e residuo quadratico di p sappiamo che esiste x ∈ Z∗p tale che

x2 = R1 mod p.

Ora, essendo p primo, sappiamo che ciascun x ∈ Z∗p ammette un inverso molti-

plicativo, cioe esiste sempre un y ∈ Z∗p tale che

xy = 1 mod p.

Page 73: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

2.10. ANALOGIE CON LA REGOLA DEI SEGNI 73

La dimostrazione di questo fatto e un caso particolare di questa proposizione.Si prenda b ∈ Z∗

p e si formi l’insieme

b, 2b, 3b, · · · , (p− 1)b :

esso coincide ancora con Z∗p. Infatti, se esistesso j, k ∈ Z∗

p tali che

jb = kb mod p

allora dovrebbe essere (j − k)b multiplo di b, che e impossibile. Detto questo,moltiplichiamo (2.17) per y2 ottenendo

(yz)2 = y2R1N2 = (yx)2N2 = N2 mod p

che affermerebbe che N2 e un residuo quadratico di p, contrariamente all’ipotesifatta.

3. Siano N1 ed N2 due non residui quadratici del numero primo p > 2. AlloraN1N2 e un residuo quadratico di p. Infatti, se prendiamo l’insieme dei p−1

2

residui quadratici R1, R2, · · ·R p−1

2

e li moltiplichiamo per uno stesso non re-

siduo quadratico N , otterremo l’insieme di tutti i p−12

non residui quadratici chepotranno dunque porsi nella forma NR1, NR2, · · ·NR p−1

2

. Possiamo allora

scrivere N1 = NR1 ed N2 = NR2 da cui, esistendo x1 ed x2 tali che x21 = R1

ed x22 = R2, avremo

N1N2 = N2R1R2 = (Nx1x2)2 mod p

che mostra come N1N2 sia un residuo quadratico di p.

Mettendo insieme i risultati visti ne ricaviamo il quadro

R1 ×R2 = R3 R1 ×N2 = N3 N1 ×R2 = N3 N1 ×N2 = R3

che e chiaramente isomorfo alla regola dei segni. Nell’originale di Gauss, all’art. 98 di[17] lo troviamo enunciato in questo modo:

Il prodotto di due residui quadratici di un numero primo p e un residuo; il prodottotra un residuo ed un non residuo e un non residuo; infine il prodotto di due non residuie un residuo.95 ([17], p. 96)

Un altro esempio e fornito da un insieme di rotazioni nel piano, utilizzate dalmatematico scozzese Duncan Farquharson Gregory (1813-1844) per mostrare come vipossano essere operazioni apparentemente lontane, perche nascono in discipline di-stanti, che pero seguono le stesse regole di combinazione. In verita, Gregory era piuinteressato all’analogia tra la moltiplicazione di potenze con ugual base e la derivazio-ne di una funzione, tra calcolo delle differenze finite e calcolo differenziale, tuttavia laregola dei segni fornisce una materia preziosa per chiarire con un semplice esempio ilcaso piu interessante per le applicazioni che egli aveva in mente. Gregory pubblico illavoro [30] nel 1839 tra la prima e la seconda edizione del libro di Peacock e per lui

95Productum e duobus residuis quadraticis numeri primi p, est residuum; productume residuo in non residuum, est non residuum; denique productum e duobus non-residuis,residuum.

Page 74: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

74 CAPITOLO 2. MENO PER MENO FA PIU

l’algebra simbolica studia le operazioni definendole attraverso le loro regole di combi-nazione che fungono da modello per i casi particolari che si trovano sia nell’algebraaritmetica che in quella simbolica ([30], p. 3)96:

Indichiamo, come d’abitudine, con F ed f due operazioni qualsiasi, la cui naturaci e sconosciuta e premettiamole ad altri simboli su cui intendiamo indicare che leoperazioni rappresentate da F o da f debbano agire.

I. Supponiamo, dunque, l’esistenza di due classi di operazioni F ed f , collegate traloro dalle seguenti leggi:

(1) FF (a) = F (a). (2) ff(a) = F (a).(3) Ff(a) = f(a). (2) fF (a) = f(a).

Gregory trova due operazioni in aritmetica e due in geometria che godono di queste

proprieta: l’addizione (F ) e la sottrazione (f); lo spostamento di un punto lungo tuttauna circonferenza (F ) e lo spostamento di un punto lungo una semicirconferenza (f).Gregory sottolinea che le operazioni aritmetiche e geometriche qui menzionate hannoalcuna analogia non dovuta alla loro natura ma al fatto che si combinano con le stesseleggi: La relazione esistente non deriva dall’identita della loro natura, ma dal fatto di

O AO AF (OA) f(OA)b b

Figura 2.10: Illustrazione del significato delle operazioni F ed f introdotte daDuncan Gregory.

combinarsi con le stesse leggi.97 ([30], p. 4)

Notiamo la somiglianza con la costruzione di Mourey.

96Let us take as usual F and f to represent any operations whatever, the natures of whichare unknown, and let us prefix these symbols to any other symbols, on which we wish toindicate that the operation represented by F or by f is to be performed.

I. We assume, then, the existence of two classes of operations F and f , connected togetherby the following laws:

(1) FF (a) = F (a). (2) ff(a) = F (a).(3) Ff(a) = f(a). (2) fF (a) = f(a).

97The relation which does exist is due not to an identity of their nature, but to the fact oftheir being combined by the same laws.

Page 75: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] M.G. Agnesi: Instituzioni analitiche ad uso della gioventu italiana. Vol. I, Milano,nella Regia Ducal Corte, (1748).

[2] A. Amiot: Lecons nouvelles d’algebre elementaire. 2eme Edition. Dezobry & Cie,Paris, (1860).

[3] A. Amiot: Lecons nouvelles d’algebre elementaire. 5eme Edition. Delagrave, Paris,(1878).

[4] N. Arnauld: Nouveaux Elemens de Geometrie. II Edition. Van Bulderen, La Haye,(1690).

[5] E. Baroni: Algebra e Trigonometria. Ad uso dei Licei secondo gli ultimiprogrammi. Vol. I (Primo anno di Liceo). Bemporad, Firenze, (1906).

[6] J. Bertrand: Traite d’Algebre. Premiere Partie. III Edition. Gauthier-Villars,Paris, (1863).

[7] E. Bezout: Cours de Mathematiques a l’usage des gardes du pavillon et de lamarine. III partie. Parigi, Musler, (1773).

[8] R. Bombelli: L’Algebra parte maggiore dell’Aritmetica. Rossi, Bologna, (1572).

[9] G. Boole: An investigation of the laws of thought. Walton and Marbely, London,(1854).

[10] E. Borel: Valeur pratique et philosophie des probabilites 2e edition, augmenteed’une Note: probabilite, certitude et application aux nombres premiers. Gauthier-Villars, Paris, (1952).

[11] A.-Q. Buee: Memoire sur les quantites imaginaires, Philosophical Transactions ofthe Royal Society of London, 96, 23–88, (1806).

[12] L. Carnot: Geometrie de position. Duprat, Parigi, (1803).

[13] A.-L. Cauchy: Cours d’analyse de l’Ecole royale Polytechnique, Debure, (1821).

[14] C. Choquet: Traite d’algebre. Mallet-Bachelier, Paris, 1856.

[15] A.C. Clairaut: Elemens d’algebre. Paris, (1768).

[16] L. Couturat:L’infini mathematique. Alcan, Paris, (1896).

[17] J. Le Ronde D’Alembert: Sur les Logatihmes des quantites negatives. InOpuscules Mathematiques Vol. I, Parigi, David, 180-209 (1761).

[18] R. Descartes: The Geometry of Rene Descartes with a fac-simile of the firstedition, translated from the French and Latin by D.E. Smith and M.L. Latham,Dover, New York, (1954). Riproduzione dell’edizione del 1925 pubblicata da OpenCourt Publishers.

75

Page 76: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

76 BIBLIOGRAFIA

[19] Diofanto: Diophani Alexandrini Opera omnia cum graecis commentariis. Vol. I.ed. P. Tannery. Teubner, Leipzig, (1893).

[20] L. Euler: Elemens d’algebre. Vol. I: De l’Analyse determinee. Traduit del’allemand. Lione, Bruyset, (1795-96), Anno III dell’era repubblicana.

[21] A. Faure. Essai sur la Theorie et l’Intepretation des quantites dites imaginaires.I Memoire. Bachelier, Paris, (1845).

[22] M. Ferrari: La regola dei segni e la sua storia. L’insegnamento della matematicae delle scienze integrate, 25B, 313-345, (2002).

[23] M. Fouche: Sur l’introduction des nombres negatifs. Nouvelles annales demathematiques, 12 (S. III), (1893), 164–179.

[24] C.F. Gauss: Disquisitiones Arithmeticae. Fleischer, Leipzig, (1801).

[25] J.-D. Gergonne: Reflexions sur le meme sujet. Annales de Mathematiques pureeset appliquees, 4, (1813-14), 6–20.

[26] A. Girard: L’Invention Nouvelle en l’Algebre, Blaeuw, Amsterdam, (1629).Ristampata a cura di D. Bierens de Haan, Leida, (1884).

[27] H. Hankel: Vorlesungen uber die complexen Zahlen und ihre Functionen. I Theil.Theorie der complexen Zahlensysteme. Voss, Leipzig, (1867).

[28] N. L. de La Caille: Lecons elementaires des mathematiques. Parigi, Desaint,(1784).

[29] N. L. de La Caille: Lezioni elementari di matematiche del sig. Abate Marie. Tra-dotte dal francese da Stanislao Canovai e Gaetano del-Ricco. Firenze, Allegretti,(1791).

[30] D.F. Gregory: On the real nature of symbolical algebra. Transactions of theRoyal Society of Edinburgh, 14, (1839), 208-216. In The Mathematical writings ofDuncan Farquharson Gregory. Edited by William Walton. Deighton, Bell and co.Cambridge (U.K.), 1865, pp. 1-13.

[31] G.W. Leibniz: Leibnizens gesammelte Werke aus den Handschriften der Koni-glichen Bibliotek zu Hannover. Herausgegeben von G.H. Pertz. III Folge:Mathematik. VII Band. Schmidt, Halle, (1863).

[32] C. MacLaurin: A Treatise of Algebra. Millar and Nourse, London, (1748).

[33] P. Mengoli: Geometriae Speciosae Elementa. Bologna, Ferroni, (1659).

[34] C. Meray: Sur quelques perfectionnements dont serait susceptible l’exposition dela theorie des quantites negatives. Nouvelles annales de mathematiques, 9 (S. III),50-59, (1890).

[35] C.V. Mourey: la vraie Theorie des Quantites negatives et des Quantitespretendues imaginaires. Mallet-Bachelier, Paris, (1861).

[36] I. Newton: Arithmetica Universalis sive de compositione et resolutionearithmetica Liber. Lugduni Batavorum (Leida), Veerbeck, (1732).

[37] Pappo di Alessandria: Mathematicae Collectiones. A Federico Commandino Ur-binate in Latinum conversae et Commentariis illustratae. De Duccis, Bologna,(1660).

[38] J. Prestet: Nouveaux Elemens de Geometrie. Pralard, Paris, (1689).

[39] G. Peacock: A treatise on Algebra. Smith, Cambridge, (1830).

Page 77: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

BIBLIOGRAFIA 77

[40] G. Peacock: A treatise on Algebra. Vol. I Arithmetical Algebra. Cambridge, atthe University Press, (1842).

[41] G. Peacock: A treatise on Algebra. Vol. I Symbolical Algebra and its applicationsto the geometry of position. Cambridge, at the University Press, (1845).

[42] C. Rabuel: Commentaires sur la Geometrie de M. Descartes. Lion, Duplain,(1730).

[43] C. Reyneau: Science du Calcul de grandeurs en general, ou les elemens desmathematiques. Parigi, Quillau, (1714).

[44] V. Riccati, G. Saladini: Institutiones Analyticae Tomus I. Bologna, Tip. S.Tommaso, (1765).

[45] M. Rolle: Traite d’Algebre; ou principes generaux pour resoudre les questions demathematique. Parigi, Michallet, (1690).

[46] P. Ruffini: Corso di Matematiche ad uso degli aspiranti Alla Scuola d’Artiglieria,e Genio di Modena, Tomo III. Modena, Soc. tipografica, (1807).

[47] N. Saunderson: The Elements of Algebra in Ten Books. Cambridge, at theUniversity Press (1790).

[48] H. Schubert: Grundlagen der Arithmetik. In Encyklopadie der mathematischenWissenschaften mit Einschluss ihrer Anwendungen. Erster Band: Arithmetik undAlgebra. Redigiert von W.F. Mayer. Erster Teil. Leipzig, Teubner, (1898).

[49] G. I. ’s Gravesande: Matheseos universalis elementa, Luchtmans, Leida, (1727).

[50] G. Schubring: Conflicts between Generalization, Rigor, and Intuition. Numberconcepts underlying the development of analysis in 17-19th century France andGermany, Springer, New York, (2005).

[51] S. Stevin: L’Arithmetique. In The principal works of Simon Stevin. Mathematicsvol. IIB. Ed.: J. Struik. Amsterdam (1958).

[52] J.V. Uspensky, M.A. Heaslet: Elementary number theory. McGraw-Hill, NewYork & London, (1939).

[53] F. van Schooten: Renati des Cartes Geometria, una cum notis Florimondi deBeaune. Knoch, Frankfurt an Mein, (1695).

[54] F. Viete: In artem analyticem isagoge (1591). In Francisci Vietae OperaMathematica, curatore F. van Schooten, 1–12, (1646).

[55] R. Woodhouse: The Principles of analytic calculation. Cambridge (U.K.), at theUniversity Press, (1803).

Page 78: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

78 BIBLIOGRAFIA

Page 79: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 3

Problemi di secondo grado

3.1 Euclide e l’algebra che non c’e

Nel pensare a risultati o concetti importanti presenti negli Elementi di Euclide sia-mo ricondotti alla teoria delle proporzioni, all’algoritmo della divisione, all’infinita deinumeri primi o, ancora, al postulato delle parallele. Il pensiero non corre invece al-l’algebra, anche perche non si trovano formalizzazioni simili alla nostra. A parlaredi un’algebra dei greci fu Nesselmann nel 1842 che scorse in alcuni loro procedimentigeometrici le tracce di algoritmi algebrici. Verso la fine del XIX secolo, Hieronyi-mous Georg Zeuthen (1839-1920) e Paul Tannery (1843-1904) diffusero l’opinione diNesselmann e coniarono il nome di algebra geometrica per questo calcolo geometrico.Curiosamente, come notato dallo storico della matematica italiano Ettore Bortolotti(1866-1947) [4], in alcuni manoscritti risalenti al XVI secolo il termine algebra geome-trica era gia stato usato con la stessa connotazione: precisamente, Algebra Geometricae il titolo di un opuscolo manoscrittto di Paolo Bonasoni che fu lettore di aritmeticae geometria presso lo studio di Bologna dal 1587 al 1593 [3]. Prima ancora pero, uncontemporaneo di al-Khuwaritzmi, Thabit ibn Qurra (836-901) aveva osservato comela soluzione delle equazioni di secondo grado fosse equivalente alla applicazione di areecon eccesso o difetto presentata da Euclide nel libro VI degli Elementi. ([8], p.205).

Senza alcuna pretesa di fornire una ricostruzione storica, Roger Herz-Fischler [2],interessandosi alla storia della sezione aurea, parla ancora di algebra geometrica comeveste moderna dei risultati di Euclide. Herz-Fischler distinse tre livelli ai algebrageometrica. Come esempio di algebra geometrica di I livello od elementare si puoconsiderare la Proposizione II.11 del Libro II degli Elementi [5]

Qualora si diano due rette, e l’una o l’altra di esse sia secata in quanti mai sivoglia segmenti, il rettangolo compreso dalle due rette e uguale ai rettangoli compresisia dalla retta non secata che da ciascuno dei segmenti ([5], p. 849)

Su un segmento assegnato BC (3.1) si considerino due punti D ed E arbitrari.La proposizione afferma che il rettangolo di lati BG e BC e equivalente alla sommadei rettangoli aventi tutti altezza BG e basi BD, DE, EC. Un attimo di riflessionepermette di dare una veste algebrica a questa proposizione: posto BG = a, BD = b,

1Qui e nel seguito indichero le proposizioni tratte dagli Elementi con due numeri: unoromano per il libro ed uno ordinario per la numerazione all’interno del capitolo

79

Page 80: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

80 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

DE = c, EC = d si ha

a(b+ c+ d+ · · · ) = ab+ ac+ ad+ · · ·

che traduce la proprieta distributiva del prodotto rispetto alla somma. Questa propo-sizione non viene mai utilizzata negli Elementi.

B CD E

G

Figura 3.1: Schema della dimostrazione della Proposizione II.1 degli Elementidi Euclide.

Ecco le ragioni addotte da Bartel L. van der Waerden (1903-1996), uno dei maggiorisostenitori della tesi dell’algebra geometrica, a favore di un’interpretazione algebricadi questo teorema:

Dal punto di vista geometrico, questo teorema afferma soltanto che ogni rettangolo esuddivisibile in piu rettangoli grazie a rette parallele ad uno dei lati. Questo e evidente:ognuno lo riesce a vedere guardando solo la figura. Nell’ambito della geometria nonc’e bisogno di questo teorema: Euclide non lo utilizza mai nei primi quattri libri.

Se pero uno inizia dalle operazioni algebriche di addizione e moltiplicazione e sidomanda: come si deve moltiplicare una somma per una quantita a? La risposta e:moltiplica i termini della somma per a e somma i risultati. Se questa regola di calcolosi traduce in linguaggio geometrico, si ottiene la Prop. II.1. Altrimenti detto, la Prop.II.1 fornisce una dimostrazione geometrica di una regola di calcolo algebrico. ([8].p.204)

Per Herz-Fischler, negli Elementi si incontra dell’algebra geometrica di II livelloquando vengono dimostrate geometricamente identita algebriche che possono essereutilizzate nella risoluzione di equazioni. A questo livello egli colloca, ad esempio, laProposizione II.4.

Sia C un punto arbitrario sul segmento AB. Allora il quadrato costruito su ABequivale alla somma del quadrato costruito su AC, del quadrato costruito su CB e aldoppio del rettangolo di lati AC e CB.

Uno sguardo alla Figura 3.2 consente di dare una veste algebrica a questa propo-sizione: posti AC = a e CB = b, essa afferma che

(a+ b)2 = a2 + b2 + 2ab,

cioe la formula dello sviluppo del quadrato di un binomio. Un discorso analogo si puoeffettuare per le Propoposizioni II.5 e II.6. Ecco il testo di quest’ultima proposizione.Seguendo [2] indichero con R(a, b) il rettangolo di lati a e b e con Q(a) il quadrato dilato a:

Page 81: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.1. EUCLIDE E L’ALGEBRA CHE NON C’E 81

A C B

a2

b2

ab

ab

Figura 3.2: Schema della dimostrazione della Proposizione II.4 degli Elementidi Euclide.

Sia AB una retta data e C il suo punto medio. Si prolunghi AB con la retta BD.Allora

R(AD,DB) +Q(CB) ≡ Q(CD) .

A BC D

M

EF

K H

Figura 3.3: Schema della dimostrazione della Proposizione II.6 degli Elementidi Euclide.

Dim. Si consideri (3.3) il quadrato CDFE e si tracci il segmento DE che determinai punti K, H ed M indicati in figura. Ora

R(AD,DB) = R(AD,DM) ≡ Q(BD) +R(AC,AK) +R(CB,BH)

Page 82: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

82 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

dove R(AC,AK) = R(CB,BH) poiche C e il punto medio di AB. D’altra parte perla Prop. I.432 si ha l’equivalenza di R(HM,MF ) e R(CB,BH) per cui abbiamo

R(AD,DB) = R(AD,DM) ≡ Q(BD) +R(HM,MF ) +R(CB,BH).

Poiche l’area del membro di destra e la differenza Q(CD) − Q(CB), il teorema edimostrato.

Algebricamente, se si pone AD = y, BD = x cosicche CB = y−x

2, il teorema

equivale a dimostrare che

xy +(y − x

2

)2

=(y + x

2

)2

,

di verifica immediata.Infine al terzo livello, quello superiore, si collocano problemi di applicazione di

area, tra cui e interessante per noi quello contenuto nella Prop. VI.28.Applicare ad un assegnato segmento AB un parallelogramma eguale ad una da-

ta figura rettilinea e mancante di una figura a forma di parallelogramma, simile aquello assegnato: quindi la figura rettilinea assegnata non deve essere piu grande delparallelogramma descritto su meta del segmento e simile al difetto. ([6], p.96)

A

C

U

V

W

D

B K

L M

FHG

N

O

QT R

SE

P

Figura 3.4: Schema della dimostrazione della Proposizione VI.28 degli Elementidi Euclide.

La dimostrazione di Euclide, nella versione di Unguru [6], e questa. Si bisechiAB in E (Fig. 3.4) e su EB si costruisca il parallelogramma EF 3 simile a D esimilmente collocato. Si completi il parallelogramma AG. Ora, se quest’ultimo pa-rallelogramma e equivalente alla figura C assegnata, il problema e risolto. In casocontrario l’unica possibilita che rimane, visto il diorisma (διoρισµoς, delimitazione), eche area(AG) = area(GB) > area(C). Si costruisca un parallelogramma KLMN simi-le a D ed equivalente al tempo stesso alla differenza tra GB e C: la possibilita di una

2Prop. I.43: I completamenti dei parallelogrammi intorno alla diagonale di ogniparallelogrammi sono uguali tra loro. ([5], p.837)

3Nel seguito indichero un parallelogramma anche ricorrendo ad una coppia di verticiopposti.

Page 83: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.1. EUCLIDE E L’ALGEBRA CHE NON C’E 83

tale costruzione era stata mostrata nella Proposizione VI.25.4 I parallelogrammi KMe GB sono entrambi simili a D e dunque simili tra loro e siano GE e KL, GF ed LMcoppie di lati corrispondenti. Poiche per costruzione area(GB) = area(C)+area(KM),si conclude che

GE > KL e GF > LM.

Considerati i segmenti GO = KL e GP = LM e costruito il parallelogramma GOPQche, essendo congruente a KM e simile a GB, ha il vertice Q sulla diagonale GB(Prop. VI.26), si tracci questa diagonale. Poiche area(GB) = C) + area(KM) earea(GQ) = area(KM), lo gnomone UVW e equivalente a C. Poiche infine, perla Prop. I.43, i parallelogrammi PR ed OS sono equivalenti, tali debbono essere iparallelogrammi PB ed OB. Quest’ultimo e pero equivalente a TE (Prop. I.36),visto che E e il punto medio di AB. In conclusione i parallelogrammi TE ed OBsono equivalenti ed il parallelogramma TS e equivalente allo gnomone UWV ≡ C ede quello cercato.

Se ora vestiamo i panni dell’algebrista moderno ([9], pp. 150-155; [10]), questoprocedimento equivale alla soluzione di un’equazione di secondo grado ed il diorismaenunciato equivale alla condizione di realta delle radici. Osserviamo che i dati delproblema sono AB = a, l’angolo acuto α interno al parallelogramma D ed il rapportob/c tra KN e KL: infatti del parallelogramma KLMN sappiamo solo che e simile aD. Posto QS = x ed indicato per semplicita m := sinα e l’area di C con mC, dallasimilitudine tra i parallelogrammi KLMN e QSBR segue QS : BS = KL : KN dacui si ottiene BS = b

cx e dunque l’area del parallelogramma TS e mx

(a− b

cx)per cui

x risolve l’equazioneb

cx2 − ax+ C = 0

e la condizione di realta delle radici e proprio quella formulate verbalmente nell’enun-ciato del teorema.

Ma... e algebra veramente o no? A partire dalla diffusione di questa opinione, pochisono stati gli studiosi che l’hanno contraddetta: tra questi Jacob Klein, negli anni ’30ed il filologo ungherese Arpad Szabo. Un attacco frontale violento alla ricostruzionedominante a partire da Nesselmann fu portato nel 1975 da Sabetai Unguru [6] il cuilavoro accese una rovente polemica sull’esistenza di un’algebra dei greci pre-euclidei edi Euclide: la querelle non riguarda Diofanto. Unguru afferma:

La geometria greca non e algebra (geometrica o d’altro tipo) ma semplicementegeometria. Chiaramente, poiche vi e (e cio e ovvio per noi) un completo isomorfismotra geometria e algebra (che cosa se non questo e il messaggio della geometria anali-tica?) e sempre possibile usare tecniche algebriche per trasferire le forme e strutturegeometriche nelle loro controparti algebriche, analitiche. Su questo non c’e disaccordo.Tuttavia non e questo il punto storiograficamente cruciale! Il punto storiograficamentecruciale e che in questo processo di traslazione si commette una irreparabile violenza esi infligge un danno incorreggibile ai tratti specifici, peculiari, sui generis, della geome-tria greca che non sono, mi si passi l’enfasi, riconducibili a qualcosa di piu semplice,meno arzigogolato, ecc. Non vi e nulla di arzigogolato, intricato, pesante e via discor-rendo circa la matematica greca quando questa non viene strappata dal suo contesto.(cfr. [7], p. 113)5

4Prop. VI.25: Costruire una figura rettilinea che sia simile ad una figura rettilinea data eche abbia la stessa area di un’altra figura rettilinea data.

5Greek geometry is not algebra (geometric or otherwise) but simply geometry. Clearly,since there is (and this is obvious for us) a complete isomorphism between geometry and

Page 84: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

84 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

Per i sostenitori dell’algebra geometrica, il sostrato algebrico nascosto dietro risul-tati come la Prop. VI.28, piu che essere l’obiettivo finale cui tendono i ragionamentigeometrici, sembra rappresentare un retaggio della tradizione babilonese da cui i mate-matici greci avevano potuto trarre informazioni sulla risoluzione di problemi di primoe secondo grado che, in epoca aurea, sono stati tradotti in piu o meno sofisticate co-struzioni geometriche. A fare da spartiacque tra questi due momenti vi e la teoria delleproporzioni di Eudosso che, resa indipendente dal concetto di grandezze incommensu-rabili, permise di portare avanti una trattazione logicamente rigorosa dei problemi disecondo grado [4]. Al contrario, proprio l’estrema facilita nell’ottenere alcuni risultatidegli Elementi quando rivestiti del linguaggio algebrico o addirittura la banalita di al-cuni dei risultati presentati, una volta formulati in tale linguaggio fa dubitare Ungurudel fatto che il fondo al loro cuore, Euclide ed i Greci fossero algebristi: se vi era questaconsapevolezza, perche tenerla nascosta, occultandola dietro a ragionamenti geome-trici certo eleganti ma che rendono il procedimento piu pesante? Questa pesantezza epercepita tale, prosegue Unguru, solamente se ci si accosta con occhi moderni al testoeuclideo e gli si impongono categorie interpretative valide 2000 anni dopo Euclide.

Bisogna dire che al centro della polemica innescata da Unguru vi e una concezionepiuttosto ristretta di algebra o, meglio, di pensiero algebrico. Appoggiandosi su unostudio di Michael S. Mahoney del 1971, Unguru enuclea tre caratteristiche salienti delmodo di pensare algebrico:

1. Simbolismo operazionale;

2. l’attenzione piu alle relazioni matematiche che agli oggetti matematici perche lestrutture degli insiemi sono il frutto di tali relazioni;

3. liberta da ogni restrizione e problema ontologico e, collegato a questo punto, laprevalenza dell’astrazione sull’intuizione. (cfr. [6], p.77)

Aderendo strettamente a questa visione, la storia dell’algebra potrebbe tranquilla-mente iniziare nel XVIII secolo con Lagrange nei cui lavori si nascondono i germidel concetto di gruppo poi ripreso da Ruffini e sfruttato da Galois (cui si deve il no-me di gruppo) e Cauchy. A questa posizione van der Waerden contrappone un’altradefinizione di algebra nella sua difesa dall’attacco di Unguru [8]:

l’arte di manipolare espressioni algebriche come (a + b)2 e di risolvere equazionicome x2 + ax = b nello spirito di Al-Khuwaritzmi ( 790- 850) e Cardano ed argo-menta come, allargata la definizione in questo modo non vi sia nulla di inconsistentenell’attribuire un’interpretazione algebrica a risultati degli Elementi.

3.2 Il Libro X degli Elementi

Se l’algebra geometrica in Euclide e una costruzione ipotesi formulata secoli dopo,vi e un libro degli Elementi, il X, che ha giocato un ruolo non trascurabile nellastoria delle equazioni algebriche, almeno come fonte di ispirazione per suggerire il

algebra–what else if not this is the message of analytic geometry?–, one can practically alwaysuse algebraic techniques for transferring the geometrical form and structure to their algebraic,analytical counterparts. There is no quarrel about this. However this is not the crucialhistoriographical point! The crucial historiographical point is that in this transfer-processone does irreparable violence and inflicts unrectifiable damage to the unique, peculiar and suigeneris traits of Greek geometry which are not, let me state this emphatically, reducible tosomething ‘simpler’, less ‘clumsy’, etc. There is nothing ‘clumsy’, ‘awkward’, ‘cumbersome’,and so forth about Greek mathematics when it is not taken out of its own context. ([6], p.88)

Page 85: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.2. IL LIBRO X DEGLI ELEMENTI 85

modo con cui ottenere la soluzione delle equazioni di terzo grado. Il libro inizia con ladistinzione tra grandezze commensurabili (συµµǫτρα) ed incommensurabili, grandezzecommensurabili in potenza (δυναµει συµµετρα) o incommensurabili in potenza. Duegrandezze a e b sono commensurabili se hanno il rapporto che un numero m ha conun altro n, a : b = m : n; a e b sono commensurabili in potenza se

b =

√m

na

dove m/n non e un quadrato perfetto. Dunque due segmenti sono commensurabili inpotenza se i quadrati costruiti su di essi sono misurati dalla stessa superficie (X.2) esi applica l’algoritmo della divisione ai segmenti per ottenerne un criterio di commen-surabilita o meno e nel primo caso, per determinarne la comune misura, sulla scortadi quanto operato tra numeri nella proposizione VII.2: secondo alcuni, ad avere intro-dotto per primo questo procedimento sarebbe stato Teeteto, ricordato nell’omonimodialogo platonico. Dopo aver affrontato una serie di problemi che, per i fautori dell’al-gebra geometrica, sono condizioni per avere radici razionali di un’equazione di secondogrado, Euclide propone una classificazione degli irrazionali quadratici e biquadratici,l’argomento che piu ci interessa. Tradotto in linguaggio moderno, Euclide catalogairrazionali della forma ([9], pp. 9-11)

√√p±√q

in cui p e q < p sono commensurabili. Esprimendo

√√p+√q =√a+√b

si ha √p+√q = a+ b+ 2

√ab

e, posto

a+ b =√p 2

√ab =

√q

si ottiene (a− b)2 = p− q e dunque a− b = √p− q da cui e possibile ricavare

a =1

2

√p+

1

2

√p− q b =

1

2

√p− 1

2

√p− q

cosicche√√

p±√q =√

1

2

√p+

1

2

√p− q +

1

2

√p− 1

2

√p− q (3.1)

e si possono distinguere vari casi, a seconda delle proprieta degli interi p e q:

• 1a) p = r2 e√p− q commensurabile con r

• 1b) p = r2 e√p− q incommensurabile con r

• 2a) q = s2 e√p− q commensurabile con

√p

• 2b) q = s2 e√p− q incommensurabile con

√p

• 3a) ne p ne q sono quadrati perfetti e√p− q commensurabile con

√p

• 3b)ne p ne q sono quadrati perfetti e√p− q incommensurabile con

√p.

Page 86: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

86 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

Oltre a questi, si ha una classificazione parallela per irrazionali del tipo√√

p−√q egli irrazionali ottenuti hanno nomi distinti. A titolo di esempio, ecco la definizione dimediale.

Prop. X. 21 Il rettangolo contenuto da rette razionali commensurabili soltanto inpotenza e irrazionale e il lato del quadrato ad esso equivalente e irrazionale. Si chiamiquesto linea mediale. ([9], pp. 71-72)

I lati del rettangolo stanno tra loro come√a :√b, con a : b razionale ma non un

quadrato perfetto; siccome allora

a :√a ·√b =√a :√b

anche a :√a ·√b e irrazionale e dunque, se a e razionale,

√a ·√b e irrazionale. La

mediale e la quantita

√√a ·√b =

4√ab.

Il significato del libro X e stato reso nei modi piu diversi: se nel secolo X Anariziolo illustra riportando solo esempi numerici; dal XIII secolo, con Fibonacci, il libroX viene utilizzato per mostrare che una particolare equazione cubica non puo essererisolta da alcuno degli irrazionali descritti in esso (cfr. Cap. 4); nella ArithmeticaIntegra del 1544 Stifel lo considera come teoria per il calcolo delle radici di quantitairrazionali e fornisce per queste le regole di calcolo; con gli algebristi italiani del XVIsecolo, il libro X diverra la fonte di ispirazione per risolvere le equazioni di terzo grado,attraverso una sua estensione al caso dei radicali cubici (Del Ferro, Bombelli); Cardanoinvece studiera nel dettaglio le equazioni di secondo, terzo e quarto grado che hannoper radici alcuni degli irrazionali euclidei. Idealmente, l’indagine iniziata da Euclideraggiungera il culmine all’inizio del XIX secolo quando Ruffini ed Abel, per dimostrarel’impossibilita di risolvere in generale per radicali le equazioni di grado superiore alquarto, otterranno una forma per cosı dire canonica delle quantita irrazionali costruibilicon estrazioni di radice.

3.3 Le equazioni di secondo grado attraverso la

storia

a): civilta babiloneseProblemi di secondo grado si trovano risolti da tempo remoto, almeno a partire

dalla civilta babilonese (ca. 1800-1600 a.C.), secondo la ricostruzione operata nel 1935da Otto Neugebauer. Vediamo un esempio, tratto da [7], che illustri i tratti salientidell’approccio al problema.

La superficie (e il lato) del quadrato ho sommato e fa 3/4. Prendi il coefficiente1 [numero dei lati]. Prendi la meta di 1. Tu hai 1/2. Moltiplica 1/2 per 1/2 (fa1/4). Congiungi 1/4 con 3/4 e (fa) 1 che ha 1 come radice quadrata. 1/2, che tu haimoltiplicato per se stesso, sottrai da 1 e (fa) 1/2 (che) e il (lato del) quadrato. (cfr.[7], p.74)

Si tratta dunque di risolvere l’equazione che oggi scriveremmo come x2 + x = 34in

cui x e il lato del quadrato. Seguendo passo dopo passo le indicazioni del testo, ci siaccorge che si sta scrivendo

x =

√(1

2

)2

+3

4− 1

2,

che e quanto si otterrebe applicando la formula risolutiva generale al caso specificoin esame. Il testo enuncia l’equazione in chiave geometrica (si parla di superficie e di

Page 87: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA87

E

F B C

DA

x

x2

1

a)

1 · x

b)

E

F B C

DA

H

G1

2

c)

E F

B C

DA

H

G

d)

H

G

IE F

B C

DA

Figura 3.5: Costruzione geometrica fedele ai passaggi della soluzione di x2+x =3

4come riportata in tavolette babilonesi.

lati) un po’ ardua da accettare: come e possibile sommare la superficie ed il lato diun quadrato? Se vi fosse stata presso i babilonesi un’adeguata mentalita algebrica cheavesse permesso di passare dalle figure ai numeri, formare x2 + x non avrebbe creatoeccessivi problemi. Come osservo Ettore Bortolotti nel 1936 sarebbe anacronistico at-tribuire tale livello di astrazione ad una civilta che iniziava a fare matematica e dunqueappariva plausibile pensare a linee con spessore e superficie con altezza permettendonon solo di formulare ma anche di risolvere geometricamente il problema. Nel casodell’equazione proposta sopra, una possibile risoluzione geometrica potrebbe essere laseguente ([7], p.75): indicato con x il lato incognito di un quadrato ABCD (Fig. 3.5)che dunque ha area x2 si giustappone un rettangolo ABFE di lati AB = x e BF = 1:il rettangolo e il segmento spesso cui si alludeva poc’anzi. Si ottiene cosı il rettangoloEDCF di superficie x2+x che deve essere pero uguale a 3/4, per il testo del problema.

Se G e il punto medio di AE, cosicche EG = AG = 1/2 si puo asportare ilrettangolo EGFH–di lati 1/2 ed x–e ricollocarlo con GH sovrapposto a BC. Lafigura a sei lati ora ottenuta si puo completare aggiungendo un quadrato di lato 1/2 inmodo da formare il quadrato GIFD che ha lato unitario perche la sua area e ugualead 1 = 3/4 + 1/4. Il lato di GIFD e pero anche uguale ad x+1/2, per costruzione, edunque si ricava x = 1

2. Questo procedimento geometrico, qui solo ipotizzabile e che

peraltro e affiancato da metodi piu algebrici di risoluzione, verra seguito esplicitamentedagli indiani.

Alla base di questa ricostruzione sta dunque la considerazione di segmenti unitari,uno strumento che si riaffaccera molti secoli dopo nella storia delle equazioni algebriche.In ambito occidentale, il primo matematico a servirsene fu Fibonacci che, nel LiberAbaci (1202), considero questo problema:

Sulla determinazione che un certo numero, tale che 16+ 1

5+ 1

4+ 1

3dello stesso, sia

Page 88: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

88 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

C

DB

A

x

1

a)

C

DB

A

b)

EI K

Z

Figura 3.6: L’uso del segmento unitario nel Liber Abaci di Leonardo Pisano, del1202.

uguale alla radice [quadrata] di tale numero. (cfr. [7], p. 92)

L’equazione e facile da scrivere: il numero incognito x deve soddisfare

19

20x =√x

ovvero(19

20

)2

x2 = x (3.2)

e la soluzione non nulla e x = (20/19)2. Fibonacci propone una soluzione geometrica,considerando un rettangolo ABCD di altezza AB = x e base AC = 1: x rappresentaallora anche l’area del rettangolo. Staccato da AB il segmento AE = (19/20)AB =(19/20)x si costruisce il quadrato AEKZ di lato AE che, interpretando geometrica-mente (3.2), deve essere equivalente al rettangolo ABCD. L’incognita x si puo inter-pretare come l’area di AEKZ. Ora, dall’equivalenza di ABCD con AEKZ si deducequella dei rettangoli EBDI ed ICZK che si puo scrivere in forma di proporzione

CI : ID = EI : IK

ovvero, applicando la proprieta del comporre,

CI : CD = EI : EK.

Poiche pero CI : CD = 19/20 per costruzione ed EI = 1 deve essere EK = AE =

20/19 e quindi x =(2019

)2e la soluzione di (3.2). L’uso sistematico del segmento

unitario sara ripreso oltre piu di tre secoli dopo Fibonacci da Bombelli e da Cartesioe diverra un modo per smarcare l’algebra dalla geometria.

b) Diofanto

In Grecia, troviamo soluzioni di problemi di secondo grado in Erone (I sec. d.C.)ed in Diofanto che, con Pappo, e il matematico piu importante del cosiddetto periodoargenteo della matematica Greca, che si estende dal 250 al 350 circa. L’opera piu notadi Diofanto e l’Aritmetica, originariamente articolata in tredici libri, di cui solo seipervenuti sino a noi. Diofanto e noto per i risultati di analisi indeterminata che peronon possiamo esaminare in questa sede dove dobbiamo limitarci a qualche cenno sullarisoluzione di problemi di secondo grado e, nel prossimo capitolo, di un problema di

Page 89: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA89

terzo grado. I piu semplici esempi di problemi di secondo grado si incontrano nel libroI e sono riconducibili alla forma somma-prodotto:

x+ y = sxy = p

x− y = dxy = p

x+ y = sx2 + y2 = q :

(3.3)

dove s, d e q sono quantita assegnate. l’enunciato del primo problema e

Trovare due numeri tali che la loro somma ed il loro prodotto siano uguali a duenumeri dati. E necessario tuttavia che il quadrato della semisomma dei numeri, superiil loro prodotto di un numero quadrato cosa che d’altronde e figurativa.

Anche qui vi e un diorisma che non solo elimina dalla considerazione un’even-tuale radice immaginaria (assurda, ατoπoς) ma anche un’eventuale radice irrazionale(impossibile, αδυνατoς).

Il metodo di risoluzione, illustrato su casi numerici consiste nel porre, per il sistema(3.3)1,

x =s

2+ t y =

s

2− t

che rende automaticamente soddisfatta la x+ y = s. Imponendo invece xy = p si ha

(s

2+ t)(

s

2− t) = p

da cui si ottiene

t =

√( s

2

)2

− p.

c) Matematici Indiani

Benche le equazioni siano risolte correttamente da Diofanto, non vi e traccia espli-cita dell’enunciato della regola generale di risoluzione che si trova invece nella Sez. IVdella Brahme-Sphuta-Siddhanta, il Sommario del verbo di Brahma. Qui ([7], p.131)l’autore, Brahmagupta, enuncia la formula risolutiva per l’equazione ax2 − bx = −c,con b, c > 0 nella forma

Prendi il numero assoluto dalla parte opposta a quella dalla quale il quadrato el’incognita semplice sono state sottratte. Al numero assoluto moltiplicato per quattrovolte il quadrato, aggiungi il quadrato del termine medio; [dal]la radice quadrata dellostesso togli il termine medio diviso per due volte il quadrato, e il [valore del] terminemedio.

Per interpretare il testo, il numero assoluto e il coefficiente, −c del termine di gradozero in x; moltiplicare il numero assoluto per il quadrato, significa formare il prodotto−ac, mentre il quadrato del termine medio e b2. Ripercorrendo allora le istruzioni diBrahmagupta perveniamo alla formula risolutiva

x =

√4a(−c) + (−b)2 − (−b)

2a.

Un modo differente di giungere alla stessa conclusione si trova in Bhaskara, nel Viya-Ganita, dove si esprime in questi termini ([7], p.137)

Moltiplica entrambi i membri di un’equazione per un numero uguale a quattro volteil [coefficiente] del quadrato e aggiungi a questo un numero uguale al quadrato delnumero originale dell’incognita.

Se consideriamo l’equazione ax2+ bx+ c = 0 il procedimento di Bhaskara si riducenei seguenti passaggi: moltiplicazione per 4a dell’equazione che ci porta a 4a2x2 +

Page 90: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

90 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

4abx + 4ac = 0; aggiunta del coefficiente b2 ad ambo i membri dell’equazione: siottiene 4a2x2 + 4abx+ b2 + 4ac = b2 da cui segue

(2ax+ b)2 = b2 − 4ac,

e quindi la formula risolutiva.d) matematici arabi (persiani)La conquista araba dell’Europa (cfr. [12], Cap. 13) fu repentina ed in questo

periodo, che si snoda dal 650 al 750 d.C. circa, non vi fu uno sviluppo della matema-tica. Terminata la fase di espansione si assiste ad un risveglio culturale dell’Islam chepermise il recupero e la trasmissione del partimonio della scienza precedente, graziead un’ampia opera di traduzione di manoscritti di autori quali Aristotele, Tolomeo edEuclide. Il centro culturalmente piu vivace era Bagdad dove vennero fatti confluiremolti studiosi di varia provenienza: dalla Siria alla Persia ed alla Mesopotamia. Que-sto periodo di mecenatismo raggiunse il culmine con i califfati di al-Mansur, Harunar-Rashid e, sprattutto, al-Mamun cui si deve la fondazione della Casa del Sapere(Bait al-hikma) che permetteva di accostare Bagdad a quello che era stata Alessandriad’Egitto. Alla Casa del Sapere apparteneva il matematico ed astronomo persiano Mo-hammed ibn-Musa al-Khuwaritzmi, morto attorno all’850. La coesistenza a Bagdaddi esponenti di culture differenti e di aiuto per comprendere la difficile questione dellefonti cui al-Khuwaritzmi avesse attinto. Sembra certo che al-Khuwaritzmi abbia, al-meno in parte, sintetizzato ed esposto in modo sistematico materiale precedente in cuisono riscontrabili influenze sia indiane che della antica civilta babilonese. In particola-re, la giustificazione geometrica dei procedimenti atti a risolvere equazioni di secondogrado, si adatta perfettamente allo schema di ricostruzione di certi problemi presentinelle tavolette cuneiformi. Per certi versi, l’opera di al-Khuwaritmi segue il destinodi quella di Euclide i cui Elementi sono una rappresentazione organica di materialegia noto. Essa non e peraltro l’unica opera di questo genere. Le Necessita logiche inequazioni miste, composto all’incirca nello stesso periodo da abd-al-Hamid ibn-Turkerano parte di un libro dai caratteri molto simili al trattato di al-Khuwaritzmi.

Il termine algebra deriva dal titolo del testo di al-Khuwaritzmi: Al-Kitah al muh-tasar fi isab al-jabr w-al-muqabale, pubblicato attrono all’anno 830. Nell’edizione diRosen (1831) dell’Algebra di al-Khuwaritzmi [11], i termini algebra ed al-muqabale sonoresi con completamento e riduzione; in alcune note egli afferma come al-jabr indichiil recupero di un osso fratturato che diventa, nel traslato matematico, la rimozione diquantita negative, come quando dall’equazione x2 = 40x − 4x2 si passa a 5x2 = 40x,cioe quando si rimuove un termine negativo trasportandolo dall’altra parte del segnodi uguaglianza; il termine al-muqabala, significherebbe mettere due cose faccia a faccia,confrontare o compararare che, reso in linguaggio matematico, indica la semplificazio-ne di due quantita positive uguali presenti nei due membri dell’equazione, come nelpassaggio da 50 + x2 = 29 + 10x a 21 + x2 = 10x in cui 29 viene rimosso da amboi membri [1]. Gandz osservava alcune anomalie in questi termini dal momento che laparola jabara non ha una chiara etimologia in arabo ed il significato di “osso frattu-rato” e un significato derivato6. Non e chiaro come mai si usasse un termine comemuqalabah, “mettere faccia a faccia, confrontare” per l’operazione di rimozione di unaquantita positiva. Con un’indagine nelle altre lingue semitiche, Gandz fu ricondotto afar discendere jabara dall’assiro Gabara che indicava un uomo maturo, appena lascia-ta la fanciullezza ed uguale in rango e valore agli altri uomini dell’esercito. Inoltre,

6A questo proposito, riportiamo una osservazione di Boyer che afferma come nel Don

Chisciotte di Miguel Cervantes compaia la parola algebrista nel senso di un guaritore in gradodi mettere a posto o “restaurare” le dislocazioni delle ossa ([12], p. 280).

Page 91: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA91

l’assiro Gibbor indicava l’eroe in grado di combattere e vincere i rivali di uguale livel-lo appartententi ad un esercito ostile. La parola qabala rappresenterebbe la versionearaba dell’assiro Jabara e quindi i due termini sarebbero l’originale assiro e la sua tra-duzione araba, parole scelte per indicare un’equazione, in generale. In questo senso,secondo Gandz, il titolo dell’opera di al-Khuwaritzmi si puo rendere con Scienza delleequazioni. Nell’introduzione, al-Khuwaritzmi afferma che la trattazione viene limitata

a quegli aspetti piu facili e utili della matematica di cui ci si serve costantementenei casi di eredita, donazioni, distruzioni, sentenze e commerci e in tutti gli altri affariumani, o quando si vogliono effettuare misurazioni di terreni, scavi di canali, calcoligeometrici e altre cose del genere. ([12], p. 268)

E possibile ([12], p. 272) che le leggi complesse inerenti le eredita in vigore nellalegislazione araba abbiano agito da stimolo per lo sviluppo dell’algebra.

Cardano, all’inizio della Arsa Magna (1545) dichiara al-Khuwaritzmi fondatoredell’algebra mentre nell’Algebra di Bombelli (1572), il testo di al-Khuwaritzmi vieneridotto al rango di libro di picciol valore.

Tra le fonti possibili di al-Khuwaritzmi erano stati posti gli Elementi euclidei ma,analizzando gli argomenti geometrici presentati da al-Khuwaritzmi con quelli di Eucli-de, si fu poi portati [7] ad escludere influenze euclidee su al-Kuwaritzmi, mentre parepiu plausibile l’influenza dello pseudo-Erone anche per la presenza nell’Algebra di unesercizio riportato nella Geometria pseudo-eroniana, con gli stessi dati numerici e lastessa tecnica risolutiva. Al-Khuwaritzmi suddivide i problemi di secondo grado in seicategorie secondo uno schema che si manterra inalterato per molti secoli. Precisamenteegli considera

1. Quadrati uguali a radici, cioe equazioni del tipo ax2 = bx;

2. Quadrati uguali a numeri, equivalenti a ax2 = c;

3. Radici uguali a numeri, caso degenere: ax = c;

4. Radici e quadrati uguali a numeri: bx+ ax2 = c;

5. Quadrati e numeri uguali a radici: ax2 + c = bx;

6. Radici e numeri uguali a quadrati: bx+ c = ax2.

Poiche i coefficienti sono positivi, questi casi si distinguono per il diverso comportamen-to delle radici. La risoluzione di un’equazione come ([7], pp.150-152) x2 + 10x = 39veniva esposta verbalmente in modo non dissimile da quanto visto nei matematiciindiani e giustificata da ragionamenti geometrici.

Nel caso specifico, al-Khuwaritzmi costruisce (Fig. 3.7) un quadrato di lato x edunque di area x2 contornato da quattro rettangoli aventi ciascuno un lato in comunecon il quadrato ed il lato restante di lunghezza 10/4: la figura cosı ottenuta ha areapari ad x2 + 10x che deve uguagliare 39, per risolvere l’equazione. La figura vienemodificata in un quadrato grazie all’aggiunta di quattro quadratini, ciascuno di lato10/4. Il quadrato complessivo ha area 64 = 39 + 4(10/4)2 e, per costruzione, ha latopari ad x+ 5 per cui deve essere x =

√64− 5 = 3.

Per valutare la diversa qualita degli argomenti geometrici, confrontiamo la soluzio-ne ora esposta di al-Khuwaritzmi con quella presente nell’Algebra di Omar Khayyam(1044-1123(4)) che attinge direttamente dagli Elementi di Euclide. Infatti, servendosidella Prop. II.6 degli Elementi, Khayyam giustappose (Fig. 3.8) al quadrato di latoAD = x un rettangolo di lati DC = x ed ED = 10, cosı da avere area 10x, mentrequella del rettangolo AG e pari a x2 + 10x = 39, per via dell’equazione da risolvere.Ora, se F e il punto medio di ED, grazie alla Prop. II.6 si ha

R(AD,AE) +Q(DF ) = Q(AF )

Page 92: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

92 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

x

x2

10/4

a) b)

Figura 3.7: Costruzione geometrica che mostra la soluzione dell’equazione x2 +10x = 39 ad opera di al Khuwaritzmi.

E F

BC

D A

G

Figura 3.8: Costruzione geometrica che mostra la soluzione dell’equazione x2 +10x = 39 ad opera di al Khayyam.

ed essendo DF = 5 si ottiene39 + 25 = AF 2

da cui si ricava AF = 8 ed infine AD = x = 3.Vi e un aspetto importante dell’opera di al-Khuwaritzmi da considerare, cioe l’ac-

cettazione della esistenza di due soluzioni (positive) per certe equazioni di secondogrado, della forma x2 + a = bx. Considerando l’equazione x2 + 21 = 10x ([7], pp.154-156) e dopo avere riportato in forma retorica i passi per ottenere la soluzione x = 3,al-Khuwaritzmi osserva

oppure, puoi sommare la radice alla meta delle radici; la somma e 7; questa e laradice del quadrato che hai cercato e il quadrato stesso e 49. Quando ti imbatti neltipo che porta a questo caso verifica la sua soluzione con la somma, e se questa nonserve, allora sara certamente la sottrazione.

Occorre addizionare dunque la radice (√25− 21) alla meta delle radici che vale 5,

ottenendo 7, radice ulteriore oltre a 3. In altre parole, al-Khuwaritzmi sta illustrandoil segno ± che figura nella formula risolutiva per far passare da una all’altra radice.Tuttavia al-Khuwaritzmi considera una sola delle radici essere la vera soluzione delproblema, atteggiamento che sara ancora presente molto piu tardi in Fibonacci. Lagiustificazione geometrica (Fig. 3.9) consiste nel costruire il quadrato AD di lato x egiustapporre un rettangolo AN di area 21, in modo che l’intero rettangolo CN abbiaarea x2 + 21 = 10x, a motivo dell’equazione da risolvere. Dunque, poiche CN ha

Page 93: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA93

N

M L K

T

R

B

C

D

AH G

Figura 3.9: Costruzione geometrica che mostra la soluzione dell’equazione x2 +21 = 10x ad opera di al Khuwaritzmi.

altezza x, si conclude che CH = 10; preso ora il punto medio G di CH , si tracciGT parallelo a CD e lo si prolunghi fino in K, in modo che AG = GK: il quadratoKN ha lato di lunghezza 5 unita e dunque area 25. Su KM si riporta il segmentoKL = KG e si completa il quadrato GL. I rettangoli HL e BG sono congruenti edunque il quadrato GL ha area 4, pari alla differenza tra 25, area di KN , e 21, areadi HL ed HT . Dunque GK = GA = 2 ed x = AC = CG − AG = 5− 2 = 3 risolve ilproblema. Per trovare l’altra soluzione, al-Khuwaritzmi sfrutta quella appena ottenutae costruisce il quadrato su RC (Fig. 3.10), aggiungendovi il rettangolo HP di areapari a 21 in modo da ottenere il rettangolo HO, di area 10RC. In definitiva si ha

RC2 + 21 = 10RC,

che dimostra come RC = 7 risolva l’equazione di partenza.A proposito di questa equazione, al-Khuwaritzmi avverte cheDevi sapere che, quando prendi la meta delle radici in questa equazione e poi

moltiplichi tale meta per se stessa, se cio che risulta dalla moltiplicazione e inferiorealle succitate unita che accompagnano il quadrato, non avrai un’equazione ([12], p.269)che ripropone il diorisma gia osservato in Euclide a proposito dei problemi di applica-zione di aree.

La consapevolezza della possibile molteplicita di soluzioni non e un tratto originaledi al-Khuwaritzmi: ad esempio, nella matematica babilonese sono testimoniate diversecircostanze in cui questo fenomeno era stato riconosciuto.

e) il Rinascimento italianoL’opera di Leonardo Pisano venne divulgata da una schiera di matematici, noti

come maestri d’abaco, tra cui ricordiamo Paolo dell’Abaco (?-1367) che nel Trattatodelle quantita continue sostenne che l’uso delle proporzioni fosse fondamentale per l’al-gebra, anticipando una posizione che sara al centro del programma di Viete. Un altromaestro d’abaco di un certo rilievo fu Antonio de’ Mazzinghi (1353-1383), allievo didell’Abaco e che si segnala per la legittimazione dell’uso di radici negative di equazioniausiliarie, allo scopo di ottenere le radici positive di un’altra equazione. Un problema,ripreso da [7], pp.164-165, serve a chiarire il procedimento seguito da de’ Mazzinghi:

Page 94: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

94 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

N

POQ

R

B

C

D

AH G

Figura 3.10: Costruzione geometrica che mostra la seconda soluzionedell’equazione x2 + 21 = 10x.

Fa di 10, 2 parti che moltiplichata la prima per se et quel che fa tratto di 97 e di quelche rimane preso la radice et serbata, e di poi la seconda parte per se moltiplicata etquello che fanno tratto di 100 e del rimanente preso la sua radice et aghunto choll’altraradice, faccia 17. Adimandasi quanto e ciascuna parte per se.

Formalizzando, occorre risolvere il sistema

x+ y = 10√97− x2 +

100− y2 = 17

compito che Mazzinghi assolve ponendo x = 5 + u ed y = 5 − u, trasformando laseconda equazione in

72− 10u− u2 +√

75 + 10u− u2 = 17

che, dopo aver eliminato tutti i radicali con un doppio elevamento al quadrato, diventa

389u2 + 30u = 359

che viene risolta da u = −1 ed u = 359389

: Mazzinghi utilizza solo la soluzione negativaed ottiene la soluzione del problema in interi positivi, x = 4 ed y = 6.

Dai maestri d’abaco si passa a Luca Pacioli, autore della Summa de ArithmeticaGeometria Proportioni et Proporzionalita che, pubblicata nel 1494, costituisce il pri-mo testo completo matematico a stampa. Qui Pacioli, riprendendo un’idea abbozzatada Fibonacci, applica l’algebra alla risoluzione di problemi geometrici, un passaggioconcettualmente importante nel lungo e faticoso cammino di affrancamento dell’alge-bra dalla tutela della geometria. In particolare, Pacioli ritiene l’algebra in grado diaffrontare, come la geometria, le grandezze continue e quindi i numeri sordi od irrazio-nali, parola che proprio con Pacioli entra nel glossario dei termini matematici. Pacioli,quando incontra due soluzioni positive di uno stesso problema vede in questo un di-fetto della costruzione, mostrando di non riuscire appieno a valutare opportunamentela molteplicita di soluzioni ad uno stesso problema.

Page 95: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA95

Operando una scelta tra le presentazioni delle equazioni di secondo grado nei testialgebrici del XVI secolo, presento l’esposizione di Girolamo Cardano contenuta nelCapitolo V dell’Ars Magna, di Simon Stevin proposta nell’Arithmetique e di FrancoisViete, riportata nel De aequationum recognitione et emendatione (pubblicato postumonel 1615).

Cardano aderisce alla suddivisione in casi adottata da al-Khuwaritzmi per cui leequazioni di secondo grado complete a coefficienti a, b, c positivi sono ripartite in treclassi distinte

ax2 = bx+ c, ax2 + bx = c, ax2 + c = bx

mentre il caso ax2 + bx + c = 0 non viene contemplato perche non puo fornire ra-dici positive. Questa distinzione comporta che Cardano presenti tre formule risolu-tive diverse che differiscono tra loro per alcuni cambiamenti di segno. Per facilitar-ne l’apprendimento Cardano, che si limita a considerare a = 1, propone una regolamnemonica:

Querna, da bis

Nuquer, admi

Requan, minue dami. ([13], p. 36)

Querna e l’abbreviazione di quadratus aequatur rebus et numero, per cui la regolariguarda x2 = bx+c e da bis significa “aggiungi due volte” in quanto occorre aggiungere

c a b2

4sotto radice e la radice va aggiunta a b

2: x =

√b2

4+ c+ b

2. Nuquer si riferisce

a numerus aequatur quadrato et radicibus, cioe a c = bx + x2 ed admi si riferisce

al fatto che prima si aggiunge c a b2

4sotto radice e poi si sottrae dalla radice b

2:

x =√

b2

4+ c − b

2. Infine Requan sta per Res aequantur quadrato et numero, cioe a

bx = x2+c per cui la regola minue dami richiede di sottrarre c da b2

4per poi aggiungere

b2: x =

√b2

4− c+ b

2.

La formula risolutiva nella forma che sostanzialmente conosciamo noi, cioe indi-pendente dalla considerazione dei diversi casi che si possono presentare a seconda deisegni dei coefficienti, si trova nella Arithmetique (1585) di Simon Stevin. Ad onor delvero Michael Stifel (1487-1567) aveva gia tentato nel 1544 di ottenere lo stesso risul-tato nella Arithmetica Integra era approdato ad un’altra regola mnemonica indicatacon l’acronimo Amasias:

numero radicum incipe, eumque dimidiatum, loco ejus pone dimidium illius, quodin loco suo stet donec consumata sit tota operatio;

M¯ultiplica, dimidium illum positum, quadrate.

A¯dde vel S

¯ubtrahe iuxta signi additorum, aut signi subtractorum, exigentiam.

I¯nvenienda est radix quadrata, ex summa additionis tuae, vel ex subtractionis tuaerelicto.

A¯dde aut S

¯ubtrahe iuxta signi aut exempli tui exigentiam7 ([14], p. 241)

Come si vede, Stifel considera l’espressione x =√

(b2

)2 ± c ± b2

lasciando alleesigenze del solutore la scelta dei segni, a seconda della tipologia di equazione trattata.

7Inizia dal numero delle radici e, dopo averlo dimezzato, poni tale meta al suo posto doverimarra finche non sia completata l’intera operazione; Moltiplica la meta precedente per sestessa. Aggiungi o sottrai, a seconda del bisogno. Occorre trovare la radice quadrata dellatua somma ovvero del residuo della tua sottrazione. Aggiungi o sottrai a seconda del segnorichiesto dal tuo esempio.

Page 96: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

96 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

Stevin che pure distingue vari tipi di equazione di secondo grado riesce a racchiude-re in una sola equazione risolutiva tutti i casi che si possono presentare. Nella secondaparte dell’Arithmetique Stevin affronta il seguente problema (Problema LXVIII):

Siano dati tre termini, il primo dei quali e (2), il secondo e (1)(0), il terzo unnumero algebrico qualunque: trovare il quarto proporzionale.8 ([15], p. 595)

Notiamo il modo particolare adottato da Stevin per formulare un’equazione disecondo grado x2 = bx+ c. Essa viene vista come proporzione

x2

bx+ c=x

p

dove p e il quarto proporzionale, il valore da attribuire all’incognita per verificare laproporzione. A noi sembra un’inutile complicazione ma, agli occhi di Stevin e dei suoicontemporanei, questa posizione permetteva di ricondurre la soluzione di un’equazionead un problema del tre semplice, con cui si era molto piu abituati a lavorare. Formulatoil problema, Stevin inserisce una nota che e la chiave per raggruppare le tre formulerisolutive di Cardano e Stifel

Il binomio del secondo termine assegnato nel problema si puo presentare in treforme diverse, cioe: (1) + (0), −(1) + (0), (1)− (0) (....) noi troveremo un solo modo[di risolvere l’equazione], con il quale si potra eseguire l’operazione in tutti i tre casisenza variare una sillaba. 9([15], p. 595).

Quando Stevin parla di binomio del tipo (1)+(0) intende riferirsi al binomio ax+b,con a e b positivi ma, soprattutto, nel caso−(1)+(0) intende−ax+b ed e proprio questomettere in evidenza il segno negativo che permette di superare la casistica incontratain Stifel e Cardano. Stevin fornisce la regola, che poi dimostra geometricamente, perequazioni a coefficienti numerici. Ad esempio, per il caso −(1) + (0) egli considerax2 = −6x+ 16 ed esprime la formula risolutiva in questi termini:

La meta di −6 (dal termine −6(1)) e −3; il suo quadrato (siccome −3 per −3 fa+9) e 9; A questo stesso si aggiunga lo (0) assegnato, cioe 16; la somma e 25; la suaradice quadrata e 5; a questa si aggiunga il −3 ottenuto in precedenza, il risultato e2.10 ([15], p. 599)Invece di dire aggiugi o sottrai come Stifel, Stevin osserva che sottrarre un numeroequivale ad addizionare il suo opposto e dunque riesce nell’intento.

Viete, pur adottando un simbolismo piu avanzato, e piu conservatore in quantoritorna alla classica distinzione dei tre casi in cui vi e almeno una radice vera, cioepositiva. Per questo, egli considera l’equazione

A2 + 2BA = Z

nell’incognita A ed introduce una nuova incognita E := A +B allo scopo di liminareil termine lineare (le formule si trovano nella sezione De reductione quadratorum ad-fectorum ad pura del De Æquationum Recognitione ac Emendatione Tractatus duo).Infatti, sostituendo nell’equazione A = E −B si ricava

E2 = Z +B2

8Estant donnez trois termes, des quels le premier (2), le second (1)(0), le troisiesme nombrealgebraique quelconque: Trouver leur quatriesme proportionel.

9Le binomie du second terme donnee de ce probleme se peut rencontrer en trois differencesa scavoir: (1) + (0), −(1) + (0), (1) − (0) (....) nous demonstrerons une seule maniere, parlaquelle sans varier d’une syllabe, l’operation sera en toutes trois la mesme.

10La moitie de −6 (des −6(1)) est −3; Son quarre (car −3 par −3 faict +9) est 9; Au mesmeadjoute le (0) donne, qui est 16; donne somme 25; sa racine quarre 5; a la mesme aioute −3premier en l’ordre, faict 2.

Page 97: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA97

Come conseguenza, Viete ricava la regola

A =√

Z +B2 −B :

notiamo come il valore negativo della radice non sia considerato affatto perche porte-rebbe ad una soluzione negativa, considerata ancora non ammissibile. Viete concludequesta parte con un esempio numerico che illustri il metodo prendendo B = 1 e Z = 20che fornisce la radice

√21− 1. Di seguito, ecco l’originale di Viete

Se A quad +B2 per A, e uguale a Z piano. A+B sia E. Dunque E quad, e ugualea Z piano +B quad.

Conseguenza: Cosı√Zpiano+Bquad. − B e A, di cui si cercava dapprima il

valore.Sia B uguale ad 1, Zpiano uguale a 20 ed A uguale ad 1. 1Q + 2N , sia uguale a

20 sara risolta da N.√21− 1.11 ([16], p. 129)

Come osservato nel Cap. I, Viete cambia notazione quando considera equazioni nu-meriche: N sta per numerus e Q sta per quadratus e dunque 1Q + 2N si leggex2 + 2x.

Ora Viete considera l’equazione

A2 − 2BA = Z

nell’incognita A. Posto nell’equazione A = E +B si ricava

E2 = Z +B2

da cui Viete ottieneA =

Z +B2 +B :

l’esempio numerico ha gli stessi coefficienti di prima.Se A quad -B per 2A, uguale a Z piano. A-B sia E. Dunque E quad e uguale a Z

piano +B quad.Conseguenza: Cosı

√Zpiano+Bquad. +B e A, di cui prima si cercava il valore.

Sia B uguale ad 1, Z piano uguale a 20 ed A uguale ad 1 N1Q− 2N uguale a 20e risolta da N.

√21 + 1.12 ([16], p. 130)

Anche in questo caso, le soluzioni negative non sono prese in considerazione. Infine,come ultimo esempio, Viete considera l’equazione

−A2 + 2DA = Z

e pone alternativamente A = D ± E che in ogni caso fornisce

E2 = D2 − Z

per ricavarne la regola

A = D ∓√

D2 − Zdove ora compaiono le due radici perche entrambe positive.

11Si A quad +B2 in A, aequetur Z plano. A+B esto E. Igitur E quad, aequabitur Z plano+B quad. Consectarium: Itaque

√Zplani + Bquad.− B sit A, de qua primum quaerebatur.

Sit B1 Z planum 20. A 1N1Q + 2N , aequatur 20 et fit N.√21− 1.

12Si A quad -B in A2, aequetur Z plano. A-B esto E. Igitur E quad, aequabitur Z plano+B quad.

Consectarium: Itaque√Zplani + Bquad. +B sit A, de qua primum quaerebatur.

Sit B1 Z planum 20. A 1N1Q − 2N , aequabitur 20 et fit N.√21 + 1.

Page 98: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

98 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

Sia D per 2 A -A quad uguale a Z piano. D-E, o D+E sia A. E quad e uguale aD quad -Z piano.

Conseguenza: Cosı, D meno o piu√Dquad. − Zpiano e uguale ad A, di cui prima

si cercava il valore.Sia D = 5 Z piano uguale a 20 ed A = 1 10N − 1Q uguale a 20 e risolta da

N.5−√5, oppure da N.5 +

√5.13 ([16], p. 130)

In questo stesso trattato, Viete aveva gia presentato le equazioni appena vistecome la traduzione di tre proporzioni, secondo uno schema a lui caratteristico e chediscuteremo piu a lungo nel Cap. 5.

L’equazione A2+BA = Z2, riscritta nella forma A(A+B) = Z2, si riformula comeA : Z = Z : (A + B) e la sua soluzione si traduce in quella del problema di trovareil termine minore di questa proporzione, noto il termine medio e la differenza tra iltermine maggiore ed il minore:

Vi sono tre grandezze in proporzione continua e Z e il medio proporzionale, ladifferenza degli estremi e B; ed A e l’estremo minore.14 ([16], p. 85)

Similmente, A2−AB = Z2 viene riscritta come A(A−B) = Z2, cioe (A−B) : Z =Z : A ed il problema e, dato il termine medio e la differenza tra gli estremi, trovare iltermine piu grande dei tre che formano la proporzione continua:

Vi sono tre grandezze in proporzione continua e Z e il medio proporzionale, B ela differenza degli estremi ed A l’estremo maggiore.15 ([16], p. 85)

Infine AB − A2 = Z2 si pone nella forma A(B − A) = Z2, che ammette dueinterpretazioni: (B − A) : Z = Z : A oppure A : Z = Z : (B − A): in ambo i casie noto il termine medio Z e la somma degli estremi e si richiede il termine minore omaggiore della proporzione:

Vi sono tre grandezze in proporzione continua e Z e il medio proporzionale, B ela somma degli estremi; ed A l’estremo minore o maggiore.16 ([16], p. 86).

Concludiamo questa esposizione dei principali metodi di soluzione delle equazionidi secondo grado con il metodo geometrico esposto da Descartes nella Geometrie eche testimonia un modo nuovo di risolvere le equazioni per via geometrica, non piucon il completamento del quadrato ma ricorrendo all’intersezione di opportune curvealgebriche. Sia data l’equazione ([17], pp.12–13)

z2 = az + b2

dove i coefficienti a e b sono considerati positivi. Si consideri il triangolo rettangoloLMN avente i cateti MN = b ed LN = 1

2a. Si consideri la circonferenza di centro

N e raggio 12a e dunque tangente in L ad LM . Prolungata l’ipotenusa MN fino

al punto O dove interseca la circonferenza appena tracciata, OM e la soluzione zdell’equazione proposta. Infatti, per il teorema della tangente e della secante, LM emedio proporzionale tra l’intera secante OM = z e la sua parte esterna PM = z − a:in effetti b2 = z(z − a) equivale all’equazione proposta (Fig. 3.11).

13Si D2 in A -A quad, aequetur Z plano. D-E, vel D+E esto A. E quad, aequabitur D quad

-Z plano.

Consectarium: Itaque, D minus, plusve√Dquad. − Zplani sit A, de qua primum

quaerebatur.

Sit D5 Z planum 20. A 1N10N − 1Q, aequatur 20 et fit N.5−√5, vel N.5 +

√5.

14Sunt tres proportionales radices quarum media est Z differentia vero extremarum B; etsit A minor extrema.

15Sunt tres proportionales, quarum media est Z, differentia vero extremarum B; et sit A

major extrema.16Sunt tres proportionales, quarum media est Z, aggregatum vero extremarum B; et sit A

Page 99: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

3.3. LE EQUAZIONI DI SECONDO GRADO ATTRAVERSO LA STORIA99

N M

L

O

P

Figura 3.11: Risoluzione dell’equazione di secondo grado z2 = ax+b2 presentatada Cartesio nel I Libro della Geometrie.

minor majorve extrema.

Page 100: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

100 CAPITOLO 3. PROBLEMI DI SECONDO GRADO

Page 101: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] J.-P. Tignol: Galois’ Theory of Algebraic Equations. World Scientific, Singapore,(2001).

[2] R. Herz-Fischler: A Mathematical History of the Golden Number. Dover, Mineola(NY), (1998).

[3] E. Bortolotti: Primordi della geometria analitica: l’algebra geometrica di PaoloBonasoni nel Mss. 314 della Biblioteca Universitaria di Bologna. In Studi e Ri-cerche sulla Storia della Matematica in Italia nei secoli XVI e XVII. Zanichelli,Bologna, (1928).

[4] E. Bortolotti: L’algebra nella scuola matematica bolognese del secolo XVI.Periodico di Matematiche 5 (S. IV), 147-192, (1925).

[5] Euclide: Tutte le Opere. A cura di F. Acerbi, con testo greco a fronte. Bompiani,Milano, (2007).

[6] S. Unguru: On the need to rewrite the history of Greek mathematics. Archive forHistory of exact Sciences, 15, (1975), 67-114.

[7] S. Maracchia: Storia dell’Algebra. Liguori, Napoli, (2005).

[8] B.L. van der Waerden: Defence of a “Shocking” point of view. Archive for Historyof exact Sciences, 16, (1976), 199-210.

[9] Gli Elementi d’Euclide e la critica antica e moderna Editi da F. Enriques colconcorso di diversi collaboratori. Libro X, Zanichelli, Bologna, (1932).

[10] E. Artom: Le equazioni di secondo grado presso i greci. Periodico di Matematiche2 (S. IV), 326–342, (1922).

[11] S. Gandz: The origin of the term “Algebra”. American Mathematical Monthly,33, 437–440, (1926).

[12] C.B. Boyer: Storia della Matematica., Mondadori, Milano, (1990).

[13] G. Cardano: Ars Magna. Traduzione inglese a cura di T.R. Witmer, Dover,Mineola (NY), (1993).

[14] M. Stifel: Arithmetica Integra. Petreium, Norimberga, (1544).

[15] S. Stevin: L’arithmetique. In The Principal Works of Simon Stevin. IIB:Mathematics a cura di D.J. Struik, Amsterdam, (1958).

[16] F. Viete: De Æquationum Recognitione ac Emendatione Tractatus duo. In Franci-sci Vietæ Opera Mathematica, a cura di F. van Schooten. Bonaventura e AbrahamElzeviri, (1646).

101

Page 102: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

102 BIBLIOGRAFIA

[17] The Geometry of Rene Descartes with a fac-simile of the first edition, translatedfrom the French and Latin by D.E. Smith and M.L. Latham, Dover, New York,(1954). Riproduzione dell’edizione del 1925 pubblicata da Open Court Publishers.

Page 103: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 4

Equazioni di terzo e quarto

grado

4.1 Problemi di terzo grado nella matematica

greca

I matematici greci affrontatono alcuni problemi di terzo grado: il problema della dupli-cazione del cubo, la trisezione di un angolo ed il cosiddetto problema complementaredi Archimede, cioe la suddivisione di una sfera con un piano in due parti i cui volu-mi hanno un rapporto assegnato, per il quale rimando al testo di Maracchia [1] (pp.193-200).

Il problema della duplicazione del cubo consiste nel determinare, assegnato unsegmento di lunghezza a un segmento tale che il cubo costruito su di esso abbia volumedoppio del cubo costruito sul primo. In altre parole, occorre determinare la risoluzionedell’equazione

x3 = 2a3 .

La difficolta del problema risiede nel fatto che esso andava risolto con riga e compassosoltanto e l’impossibilita di raggiungere questo risultato venne dimostrata solo nel 1837da Pierre Laurent Wantzel. Rinunciando a questo vincolo, il problema fu affrontato erisolto da Menecmo di Proconneso (∼380 a.C.-∼320 a.C.) grazie alle proprieta delleconiche, nel caso specifico, delle parabole. Il metodo seguito da Menecmo verra dettoda Pappo zeetetico, cioe a dire, “supposto fatto” con un termine che verra riutilizzatomolto piu tardi da Viete. L’osservazione iniziale e quella di Ippocrate di Chio, vissutotra il 470 ed il 410 a.C. che trasformo il problema della duplicazione del cubo in quellodell’inserzione di due medi proporzionali tra due segmenti AB e BC assegnati e taliche AB = 2BC. Infatti, se i segmenti BE e BD sono questi medi proporzionali, percui si ha

AB : BE = BE : BD = BD : BC, (4.1)

e dunque

BE =BD ×BD

BCche, sostituito nella proporzione AB : BE = BE : BD permette di dimostrare cheBD3 = 2BC3, servendosi del fatto che AB = 2BC. La soluzione di Menecmo poggia

103

Page 104: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

104 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

BA

C

D

E Z

Figura 4.1: Procedimento zetetico seguıto da Menecmo per la risoluzionegeometrica del problema della duplicazione del cubo.

sulla proprieta della parabola di vertice V di essere il luogo dei punti M tali che

MN2 = 2pV N

dove N e la proiezione di M sull’asse della parabola mentre 2p e una costante dettaparametro della parabola e rappresenta la distanza del fuoco dalla direttrice dellaparabola: per una discussione sul modo in cui questa proprieta poteva essere dedottaanticamente, si puo vedere p. 189 di [1]. Il procedimento di Menecmo consiste nelsupporre di avere trovato i medi proporzionali tra AB e BC che figurano in (4.1) e didisporre i segmenti AB, BC, BE, BD come in Fig. 4.1. Da (4.1) segue che

BE2 = AB ×BD

che si puo interpretare dicendo che, condotta la parallela a BE passante per D, ilpunto Z su di essa tale che ZD = BE appartiene alla parabola di vertice B, asse BDe parametro AB. Se ora da Z si conduce la parallela a BD e si osserva che, ancoragrazie a (4.1),

BD2 = ZE2 = BC ×BE

si conclude che Z appartiene anche alla parabola di vertice B, asse BE e parametroBC. Il procedimento viene ora invertito: si dispongono i segmenti noti AB e BCortogonalmente e si considerano le due parabole, entrambe di vertice B, di assi AB eBC e parametri pari alle lunghezze di questi segmenti. Il punto Z comune ad esse edistinto dal vertice B risolve il problema in quanto le sue proiezioni sui prolungamentidi AB e BC soddisfano (4.1), per la proprieta discussa sopra delle parabole.

Page 105: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.2. PROBLEMI DI TERZO GRADO IN DIOFANTO 105

4.2 Problemi di terzo grado in Diofanto

Il matematico greco che giunse piu vicino di tutti ad ottenere la formula risolutiva perle equazioni di terzo grado fu Diofanto di Alessandria nella cui Arithmetica si trovanoformulati problemi come i seguenti:IV.1 Dividere un numero dato in due cubi di cui e data la somma delle radici.IV.2 Trovare due numeri tali che la loro differenza formi un numero dato e sia dataanche la differenza dei loro cubi.

Detti x ed y i numeri richiesti, questi problemi si formulano rispettivamente comex3 + y3 = ax+ y = b

e x− y = ax3 − y3 = b

Anche se Diofanto considera casi numerici e non inserisce i parametri a e b, il suometodo e del tutto generale e si puo riassumere in questi termini: facendo riferimentoal Problema IV.1 egli utilizza il vincolo x + y = b per ridursi a trattare una solavariabile ponendo

x = t+b

2e y =

b

2− t

che, sostituite nella prima equazione, la trasformano in un’equazione di secondo gradoper t:

3bt2 + 2

(b

2

)3

= a

da cui si ottiene subito

t =

a

3b− b2

12

che permette di ricavare i valori di x ed y come

x =b

2+

a

3b− b2

12, y =

b

2−

a

3b− b2

12.

In capitolo precedenti dell’Arithmetica Diofanto aveva presentato problemi di secondogrado riconducibili al sistema

x2 ± y2 = ax± y = b

cui facevano seguito altri problemi in cui occorreva determinare due numeri cono-scendone la somma ed il prodotto. Bachet de Mezierac, editore dell’edizione del1621 dell’Arithmetica diofantea congetturo che fossero andate perdute le soluzioni diproblemi del tipo

x3 + y3 = qxy = p

che possono risolversi con tecniche del tutto analoghe a quella impiegata da Diofantoper problemi di secondo grado. Infatti, posto

x3 =q

2+ t y3 =

q

2− t

si otterrebbe

p3 = (xy)3 =q2

4− t2

Page 106: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

106 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

e dunque

t =

q2

4− p3

da cui si puo ottenere

x =3

q

2+

q2

4− p3 y =

3

q

2−

q2

4− p3.

D’altra parte, utilizzando l’identita

x3 + y3 = (x+ y)3 − 3xy(x+ y),

la variabileu := x+ y

soddisfa l’equazioneu3 − 3pu = q

che, inserendo i valori per x ed y trovati prima, e risolta da

u = x+ y =3

q

2+

q2

4− p3 + 3

q

2−

q2

4− p3

che rappresenta un esempio di formula risolutiva di equazioni di terzo grado.Tutto questo rimane una interessante congettura ma resta il fatto che Rafael

Bombelli, che divulgo per primo in Occidente l’opera di Diofanto, ebbe una analogasensazione anche a proposito delle equazioni di quarto grado al punto da affermare

Capitolo di potenza di potenza e tanti eguale a numero. Dopo ch’io viddi l’opera diDiofante sempre sono stato di opinione che tutto il suo intento sino a quei giorni fossedi venire a questa agguagliazione, perche si vede che camina a una strada di trovaresempre numeri quadrati e che aggiontoli qualche numero siano quadrati et credo che lisei libri che mancano fussero di questo agguagliamento, nel fine; e ben vero che me nefa stare alquanto in dubbio che giamai [Diofanto] opera R. q. [radici quadrate] ne so cheme ne dire, se non che noi restiamo privi, per la malvagita del tempo distruggitor deltutto, il quale ha fatto perdere suddetti sei libri, di una bella e maggior parte di questadisciplina. Ma Ludovico Ferrari nostro Cittadino anco egli camino per questa via ettrovo l’uso d’agguagliare simili capitoli, la quale fu invenzione bellissima. (Algebra; in[1], pp. 206-208)

4.3 Problemi di terzo grado in Omar Khayyam

ed in matematici arabi

Il matematico, astronomo e poeta persiano Omar Khayyam affronta diversi problemidi terzo grado nella sua Algebra ottenendone soluzioni geometriche che pero non per-mettono di approdare ad un procedimento generale. In questo senso, possono esserevisti come sofisticati esercizi di algebra geometrica e si riallacciano al filone geometricodi sviluppo dell’algebra che, priva di un efficace formalismo cioe di un sufficiente gradodi aritmetizzazione, si appoggia alla geometria per dimostrare gli enunciati dei suoiteoremi. Per questo egli si colloca in controtendenza rispetto ai matematici arabi suoicontemporanei. I manoscritti di Khayyam furono tradotti in Occidente da Franz Woe-pcke (1826-1864) solo nel 1851 quando l’algebra in Europa aveva ormai raggiunto livelli

Page 107: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.3. PROBLEMI DI TERZOGRADO INOMARKHAYYAMED INMATEMATICI ARABI107

B

A

C

K

D

E

Z

L

T

Figura 4.2: Risoluzione geometrica dell’equazione di terzo grado x3+ax2+bx = cin al-Khayyam. Solo la soluzione positiva e ottenuta con questo procedimento.

decisamente superiori a quello peraltro notevole del matematico persiano. Khayyamconsidera diciannove casi di equazioni di terzo grado, trinomie e quadrinomie ed e an-corato alla positivita delle soluzioni per cui in qualcuno dei casi esaminati afferma chemanca la soluzione. Consideriamo due esempi seguendo la presentazione di Maracchia([1], p.218–225)

Per ridurre di grado l’equazione

x3 + ax2 = bx (4.2)

al-Khayyam costruisce un cubo di lato x e ne prolunga uno spigolo di un segmentolungo a, giustapponendo al cubo un parallelepipedo di altezza a e base quadrata di latox: il parallelepipedo complessivo ha volume x3 + ax2, cioe pari al membro di sinistradell’equazione da risolvere. Al-Khayyam considera separatamente un rettangolo diarea b e che fa da base ad un parallelepipedo di altezza x che ha dunque per volumebx, il membro di destra di (4.2). I due solidi cosı ottenuti hanno dunque lo stessovolume ed avendo la stessa altezza x anche le basi b e x2 + ax debbono coincidere percui la soluzione di (4.2) si riduce a quella di

x2 + ax = b.

Piu articolata e invece la discussione di equazioni non riducibili immediatamente aquelle di secondo grado, riportate nel capitolo VI dell’Algebra. Consideriamo l’equa-zione completa

x3 + ax2 + bx = c, (4.3)

con a, b e c positivi e indichiamo (Fig. 4.2) con BE un segmento tale che il quadratocostruito su di esso abbia area b: BE2 = b; si costruisca un parallelepipedo a basequadrata, di area BE2 ed altezza BC tale che il suo volume sia c: BE2BC = c.Infine, sul prolungamento di CB si riporti il segmento BD = a. Con riferimento allaFigura 4.2 si consideri la semicirconferenza di diametro CD e si completi il rettangolo

Page 108: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

108 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

BCKE. Si tracci l’iperbole equilatera passante per C ed avente per asintoti le rettesu cui giacciono EK ed il segmento AB, ortogonale a CD. Detto Z l’ulteriore puntodi intersezione tra la semicirconferenza e l’iperbole, per una proprieta di quest’ultimai rettangoli EZ e EC sono equivalenti e dunque lo sono anche i rettangoli BZ ed KL,ottenuti dai precedenti eliminando il rettangolo EL comune. L’equivalenza tra BZ eKL si puo tradurre nella proporzione

LZ : CL = BE : BL

e, passando ai quadrati,

LZ2 : CL2 = BE2 : BL2.

Dal secondo teorema di Euclide applicato al triangolo rettangolo CZD si ha CL :LZ = LZ : DL che, inserita nella proporzione precedente permette di ottenere

DL : CL = BE2 : BL2

che, scritta nella forma BE2 × CL = BL2 × DL, si puo interpretare come un’egua-glianza tra volumi. Siccome CL = BC −BL e DL = BD+BL questa uguaglianza siriscrive come

BE2 ×BC −BE2 ×BL = BL3 +BL2 ×BDche, sostituendo le posizioni iniziali BE2 = b, BE2 ×BC = c e BD = a, diventa

BL3 + aBL2 + bBL = c

che dimostra come il segmento BL risolva l’equazione (4.3).

Un altro risultato degno di nota fu ottenuto dal matematico Sharaf al-Tusi (∼1135-∼1213) che determino una condizione perche le radici di un’equazione cubica fosseropositive e che troveremo piu volte discussa a partire dal XVI secolo. Presa l’equazione

x3 + a = bx

con a e b entrambi positivi, si suppone che x1 sia una radice positiva per cui

x31 + a = bx1

e si osserva che x31 < bx1, ovvero che per eventuali radici positive vale la limitazione

x1 <√b .

D’altra parte, al-Tusi osserva che il valore massimo di bx−x3 si ottiene per x =√b/3

per cui conclude che

a ≤ b√

b/3 +(√

b/3)3

=2b

3

b/3

e dunque a/2 ≤ b/3√b/3 o

a2

4≤ b3

27,

e condizione necessaria affinche le radici dell’equazione proposta siano reali e positive.Questo processo di al-Tusi si inquadra nel filone di sviluppo dell’algebra legato allasua aritmetizzazione. Ad al-Tusi e attribuita l’osservazione che, nota una radice diun’equazione, se ne puo abbassare il grado.

Page 109: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.3. PROBLEMI DI TERZOGRADO INOMARKHAYYAMED INMATEMATICI ARABI109

G

R

T

U

H

A

D

C

B

M

Figura 4.3: Il legame tra la trisezione di un angolo e le equazioni di terzo grado.

Il legame tra la trisezione di un angolo e certe equazioni cubiche si trova nel ma-tematico, probabilmente persiano, al-Biruni (973-1048) che risolse in forma retorica leequazioni

x3 = 3x+ 1 e x3 + 3x = 1

fornendo, senza spiegazioni, il valore numerico delle radici reali con notevole precisio-ne. Per la soluzione della prima equazione trattata da al-Biruni seguiamo l’esposizionedi Maracchia ([1], pp. 212-213) che riprende la ricostruzione proposta da JohannesTroepfke. Si consideri un ennagono regolare di lato unitario, inscritto in una circonfe-renza (Figura 4.3) e si considerino le diagonali DB, HA e DG tali che gli angoli allacirconferenza BDG, GDH , HAB e DHA sono uguali tra loro perche sottendono unarco di ampiezza tripla rispetto a quelli sottesi dai lati uguali dell’ennagono.

Poiche un angolo interno di un ennagono regolare ha ampiezza 7π/9 e dunquegli angoli alla base del triangolo isoscele CBD hanno ampiezza π/9 si conclude chel’ampiezza comune di BDG, GDH , HAB e DHA e di π

3. In particolare, il triangolo

DHM e equilatero e le coppie di rette BD ed AH , AB e GD sono parallele a duea due: in particolare ABDM e un parallelogramma e DM = AB = 1. Occorre orarichiamare un teorema di geometria euclidea, il teorema di Tolomeo (cfr. Appendice4.10), in base al quale in un quadrilatero inscritto in una circonferenza la somma dellearee dei rettangoli formati da coppie di lati opposti coincide con l’area del rettangoloche ha per lati le diagonali del quadrilatero stesso. Considerando allora i quadrilateriABDH e ABCD si ottiene

AH ×BD +AB ×DH = AD ×BH

Page 110: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

110 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

e

AD × CB +CD × AB = AC ×DBche, se si pone BD = x = AM = AC, equivalgono a

(1 + x)x+ 1 = AD2 e AD + 1 = x2

da cui segue, eliminando AD,

x3 = 3x+ 1.

Ritroveremo uno studio del legame tra equazioni cubiche e trisezione di un angolo conBombelli.

4.4 Problemi di terzo grado nel Medioevo

Leonardo Pisano (1180 ca-1250), piu noto come Fibonacci, figlio di Bonaccio, fu unadelle figure di primo piano della matematica occidentale medievale e svolse un ruoloessenziale nella divulgazione dei progressi ottenuti dagli arabi in algebra in un momentoin cui il dominio arabo mostrava segni di cedimento. In questa sezione ci occupiamo diun risultato presente in un opuscolo di Fibonacci, il Flos, ritrovato insieme ad altre sueopere nella Biblioteca Ambrosiana di Milano dal principe Baldassarre Boncompagni,cultore di storia della matematica, e pubblicato nel 1862 nel volume II degli scritti diFibonacci. In quest’opera viene descritta un’equazione di terzo grado la cui soluzioneera stata proposta a Fibonacci da Giovanni da Palermo, filosofo alla corte di FedericoII di Svevia, attorno l’anno 1225. L’equazione, nella formulazione retorica impiegata,viene espressa in questi termini

Si trovi un certo numero cubo che, insieme a due suoi quadrati e a dieci radici euguale a 20.1 (cfr. [2], p. 47)

In formule, l’equazione proposta a Leonardo Pisano e

x3 + 2x2 + 10x = 20 (4.4)

e il Flos e interessante per almeno due motivi. Anzitutto per il modo con cui l’autoreesamina la natura delle radici anche se si limita a considerare tali solo numeri positivi,contrariamente a quanto aveva fatto in altri problemi presenti nel Liber Abaci del 1202.Inoltre, Fibonacci fornisce il valore numerico dell’unica radice positiva con una preci-sione ragguardevole in quanto l’errore e sull’undicesima cifra decimale. Purtroppo eglinon ha fornito indicazioni sul metodo di approssimazione seguito, lasciando spazio aglistorici per varie ricostruzioni. Appare plausibile [4] che egli si sia servito della regoladi doppia falsa posizione (regula duorum falsorum positionum) cui aveva dedicato ilcapitolo XIII del Liber abaci, riferendosi ad essa con il termine arabo corrispondenteelchatayn che deriva da alkhat’ayni: letteralmente, due errori. Fibonacci parte conl’escludere che la soluzione possa essere un numero naturale. Infatti, x = 1 non risolvel’equazione, come si verifica direttamente e per escludere gli altri interi adduce unargomento geometrico che dimostra come la soluzione reale dell’equazione non possaessere maggiore di 2. Egli allora considera (Fig. 4.4) un rettangolo di area 10x, base xed altezza 10 e vi applica altri due rettangoli che, a parita di altezza, hanno aree x3 e2x2. Ottiene dunque un rettangolo che ha area complessiva x3 +2x2 + 10x ed altezza

1Ut inveniretur quidam cubus numerus, qui cum suis duobus quadratis et decem radicibus

in unum collectis essent viginti.

Page 111: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.4. PROBLEMI DI TERZO GRADO NEL MEDIOEVO 111

2x2 10xx3

Figura 4.4: Argomento geometrico usato da Fibonacci per mostrare che la radicepositiva dell’equazione x3 + 2x2 + 10x = 20 deve essere minore di 2.

10. Se x e radice di (4.4), l’area ottenuta deve essere anche uguale a 20 per cui la basedel rettangolo costruito per passi deve essere pari a 2 che quindi e maggiore di x.

Fibonacci riesce a mostrare che la radice non puo essere razionale per poi escludereche essa rientri in una delle categorie di radicali quadratici che Euclide aveva esaminatoesaurientemente nel libro X degli Elementi. Ad esempio, non puo essere della forma√n con n intero non quadrato perche, riscritta l’equazione nella forma

2x2

10= 2−

(

x+x3

10

)

si avrebbe a sinistra la quantita razionale 2n/10 e a destra la quantita irrazionale 2−√n(1 + n

10

)che Euclide aveva chiamato apotome. Neppure x = 4

√n puo rappresentare

una radice perche ricombinando i termini di (4.4) in modo da scrivere

x+x3

10= 2− 2x2

10

si otterrebbe a sinistra la quantita 4√n+

4√

n√

n

10che Euclide aveva chiamato (Elementi,

X.38) prima mediale mentre a destra si ottiene l’apotome 2− 2√

n

10che e impossibile in

quanto Euclide aveva dimostrato l’incommensurabilita di tali quantita. In successio-ne, e con argomenti geometrici —quelli riportati sono ripresi dalla versione modernadi Woepcke [3]—Fibonacci puo concludere che la soluzione reale di (4.4) e un nu-mero irrazionale ma di natura diversa da quelli classificati da Euclide, il che portanaturalmente a cercare espressioni in termini di radici cubiche. Osserviamo un’altracaratteristica degli argomenti geometrici di Leonardo Pisano. Egli considera x3, 2x2

e 10x come aree, liberandosi del principio di omogeneita dimensionale che invece vor-rebbe trattare x come lunghezza ed attribuire al coefficiente 10 il significato di area.Come gia visto nel Capitolo 1, oltre tre secoli dopo Fibonacci, Francois Viete aderiraancora fermamente al principio di omogeneita.

Per concludere questo breve cenno al periodo medievale, voglio ricordare un alge-brista italiano del XIV secolo, Maestro Dardi da Pisa nel cui volume Aliabraa argibra(1344) si trova, senza dimostrazione, la soluzione di una classe di equazioni cubiche

Page 112: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

112 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

x L

x

L

Figura 4.5: Scomposizione di un cubo di lato x+L (a tratto sottile). Il cubo atratto spesso ha lato x.

completex3 + bx2 + cx = n (4.5)

nella forma

x =3

√( c

b

)3

+ n− c

b.

Una ipotesi sul modo in cui Maestro Dardi possa aver ottenuto questa formula riso-lutiva e stata avanzata da van der Waerden ([5], pp. 48-49). L’idea e l’estensione atre dimensioni della tecnica di completamento del quadrato, gia incontrata sotto piuangolazioni nella risoluzione delle equazioni di secondo grado. Alla formula algebricadi sviluppo del cubo di un binomio

(x+ L)3 = x3 + 3x2L+ 3xL2 + L3

e possibile dare una veste geometrica (Fig. 4.5) interpretando x3 ed L3 come volumidi due cubi di lato x ed L, rispettivamente, x2L come volume di un parallelepipedo dibase quadrata di lato x ed altezza L e xL2 come volume di un parallelepipedo di basequadrata di lato L ed altezza x. Allora, la formula precedente asserisce che un cubo dilato x+L e scomponibile in un cubo di lato L, uno di lato x, in tre parallelepipedi di latix, x ed L ed altri tre di lati x, L ed L. A differenza del completamento del quadrato,il completamento del cubo pone piu vincoli. Infatti, e sempre possibile aggiungerein ambo i membri di (4.5) il termine L3 ma i coefficienti b e c debbono soddisfare lerelazioni c = 3L2 e b = 3L e dunque deve essere c/b = L perche il membro di sinistrasia un cubo. Tutti i casi presentati da Maestro Dardi ricadono precisamente in questaclasse.

Page 113: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.5. LA FORMULARISOLUTIVA DELLE EQUAZIONI DI TERZOGRADO113

4.5 La formula risolutiva delle equazioni di terzo

grado

Affrontare la storia delle equazioni di terzo grado e delle vicende legate alla formularisolutiva ci porta nell’Italia del XVI secolo. Infatti, la formula risolutiva per questeequazioni e ancora presentata come formula cardanica in omaggio allo scienziato paveseGerolamo Cardano (1501-1576) che per primo la pubblico nella Ars Magna che videla luce nel 1545. Qui tuttavia Cardano riconosce subito (Cap. I) di non essere stato ilprimo a raggiungere questo risultato ma che la primazia va riconosciuta al bologneseScipione dal Ferro (1465-1526), almeno per quanto riguarda il capitolo di cubo e coseuguali a numero, cioe a dire delle equazioni del tipo x3 + px = q, dove p e q sononumeri positivi. Vedremo in quale modo e plausibile che dal Ferro sia giunto alla suasoluzione, cosı come tratteremo della velenosa polemica che vide contrapposti NicoloFontana (detto il Tartaglia, ca. 1500-1557) e Ludovico Ferrari (1522-1567), allievo diCardano, polemica nata dalle accuse di Tartaglia secondo cui Cardano, dopo essersifatta svelare la regola per risolvere le equazioni di terzo grado dietro solenne giuramentodi non pubblicarla, avrebbe violato il giuramento con la pubblicazione dell’Ars Magna,obbligando Tartaglia a pubblicare l’anno successivo le Questioni et inventioni diverse(1546) dove, tra l’altro, il matematico bresciano presenta una dettagliata ma parzialestoria delle sue scoperte, delle dispute e dove appunto riferisce del presunto tradimentodi Cardano.

Scipione del Ferro, che per un certo periodo ebbe Albrecht Durer come studente diprospettiva, fu un rappresentante della ricca scuola matematica di Bologna, una dellesedi universitarie piu prestigiose dove, nel XVI secolo, passarono personaggi come LucaPacioli, Niccolo Copernico, lo stesso Cardano, Ludovico Ferrari, fino a Rafael Bombellila cui Algebra ebbe molta influenza anche su studiosi stranieri come Wallis e Leibniz.La scoperta di Dal Ferro ebbe un forte impatto emotivo agli occhi dei matematicicontemporanei: Cardano si esprime in questi termini

Il bolognese Scipione del Ferro risolse il capitolo di cubo e cose uguali a numero ecio fu senza dubbio qualcosa di bello e degno di ammirazione; quest’arte, dono davveroceleste, supera di tanto ogni sottigliezza umana, ogni risultato dell’ingegno umano,prova sublime di virtu degli animi e tanto illustre al punto che chi sara giunto ad essapotra credere di comprendere tutto.2 (Ars Magna, Cap. I)

La scoperta di Dal Ferro abbatteva un confine che pochi anni prima Pacioli ritenevainvalicabile e rappresentava il primo caso in cui la nuova civilta riusciva a superare irisultati della scienza classica antica, guadagnando una coscienza dei propri mezzi che,non a caso, avrebbe originato l’intenso sviluppo della matematica nel XVI e XVIIsecolo. Cosı si esprimeva piu di un secolo fa, nel 1894, Zeuthen nel suo Tartalea contraCardanum:

Per conseguire quella confidenza nelle proprie forze tanto necessaria per servirseneal meglio, mancava l’incoraggiamento che viene dal sapersi capaci di trovare qualcosache era sconosciuto ai maestri venerati. Ecco perche la scoperta della risoluzionedelle equazioni di terzo grado, nella prima meta del XVI secolo, fornisce il segnaledi partenza di uno sviluppo nuovo e rapido di tutti i settori della matematica pura

2Scipio Ferreus bononiensis capitulum cubi et rerum numero aequalium invenit rem sane,

pulchram et admirabilem; cum omnem humanam subtilitatem, omnis ingenij mortalis cla-

ritatem ars haec superet, donum profecto celeste, experimentum antem virtutis animorum,

atque adeo illustre, ut, qui haec attigerit, nihil non intelligere posse se credat.

Page 114: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

114 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

ed applicata. Basta citare Viete, Galileo, Keplero, Nepero, Fermat e Descartes, perricordare la molteplicita di direzioni e la grande importanza di questo nuovo sviluppo.

La storia della scoperta della risoluzione delle equazioni cubiche ha dunque un gran-de interesse. Distinguendo il diritto di priorita dei diversi autori si ha l’opportunita digiudicare allo stesso tempo il valore dei diversi contributi indiretti a questa soluzioneche sono stati anche contributi essenziali ai progressi successivi. 3 (cfr. [6], p. 152)

Abbiamo visto nel capitolo precedente alcuni problemi di terzo grado risolti conmetodo geometrico da vari matematici dell’antichita. E lecito domandarsi se alcuno diquei procedimenti abbia potuto esercitare un qualche influsso sugli algebristi italianidel XVI secolo. La questione fu al centro del lavoro di Ettore Bortolotti [6] che,dall’analisi di manoscritti in possesso dell’Universita di Bologna, concludeva comeil momento cruciale della invenzione della formula risolutiva da parte di dal Ferrofosse l’estensione dell’analisi dei radicali quadratici effettuata da Euclide nel libro Xdegli Elementi ai radicali cubici, seguendo la via battuta parzialmente da Fibonacci.Un’altra possibile interpretazione, avanzata da Giorgio Vacca vede come possibile vial’estensione a radicali cubici della formula dei radicali doppi

a+√b+

a−√b =

2a+ 2√

a2 − b

Una terza via, presentata da Maracchia (pp. 240-241 [1]), parte dalla constatazioneche puo essere naturale cercare soluzioni dell’equazione

x3 + px = q (4.6)

in termini di radicali cubici, e pertanto si puo immaginare che Dal Ferro abbia tentatodapprima ponendo x = 3

√a senza ottenere risultati significativi; x = a ± 3

√b, che

genera equazioni piu complicate di quella di partenza e, infine, x = 3√a ± 3√b. Posto

infatti x = 3√a− 3√b in (4.6) si ricava

a− (33√ab− p)( 3

√a− 3√b)− b = q

che, scelti a e b in modo che3

3√ab = p,

rende l’equazione equivalente al sistema

ab = p3

27

a− b = q

che si puo formulare come problema di trovare due numeri, a e −b di cui sia assegnatala somma q ed il prodotto −p3/27 e pertanto ricondotto alla soluzione di un’equazione

3Pour gagner la confiance en ses propres forces, confiance si necessaire pour les rendre

bien disponibles, il fallait l’encouragement de se voir capable de trouver quelque chose qui fut

inconnu aux maitres veneres. Voila ce qui explique comment la decouverte de la resolution

des equations du troisieme degre, dans la premiere moitie du XVI siecle, donna le signal

d’un developpement nouveau et rapide de toutes les branches des mathematiques pures et

appliquees. Il suffit de citer les Vietes, les Galiles, les Keppler, les Neper, les Fermats, et les

Descartes, pour rappeler la diversite des directions de ce nouveau developpement et sa grande

importance.

L’histoire de la decouverte de la resolution des equations cubiques a donc un grand interet.

En y desentant le droit de priorite des divers auteurs, on a lieu de juger en meme temps

de la valeur des differentes contributions indirectes a cette resolution, qui etaient aussi des

contributions essentielles aux progres ulterieurs.

Page 115: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.5. LA FORMULARISOLUTIVA DELLE EQUAZIONI DI TERZOGRADO115

di secondo grado, come osservo Tartaglia nei Quesiti et Invenzioni diverse, Quesito34. Il risultato e

a =q

2+

q2

4+p3

27b =

q

2−

q2

4+p3

27

da cui si deduce

x =3

q

2+

q2

4+p3

27− 3

q

2−

q2

4+p3

27. (4.7)

In alcune note di Pompeo Bolognetti († 1568), studente a Bologna, esaminate daBortolotti si trova proprio questa soluzione descritta verbalmente ([6], pp. 157-158)

Dil cavaliero Bolognetti lui l’hebbe da messer Sipion dal Ferro vecchio bolognese.Il Capitolo di cose e cubo eguale a numero. (i.e. ax+ bx3 = c) Quando le cose e li cubisi agugliano al numero ridurai la equazione a 1 cubo: (x3 + px = q) partendo per laquantita delli cubi, (dividendo per b) poi cuba la terza parte delle cose, (forma p3/27)poi quadra la meta dil numero, (forma q2/4) e questo suma con il detto cubato, (formaq2

4+ p3

27) et la radice quadra di deta summa piu la meta del numero fa un binomio, et

la radice cuba di tal binomio men la radice cuba dil suo residuo val la cosa.

Sembra acclarato che Dal Ferro risolse anche le equazioni del tipo x3 = px + qed x3 + q = px che, fedelmente alla classificazione delle equazioni quadratiche di al-Khuwaritzmi, vengono intese come distinte in quanto i coefficienti p e q sono semprepresi positivi.

La formula di Dal Ferro non venne pubblicata ma la sua scoperta si colloca ap-prossimativamente nel decennio tra il 1505 ed il 1515. E plausibile che la formula siacircolata tra gli allievi di Dal Ferro come prova il fatto che nel 1530 Antonio MariaFlor venne in possesso delle regole e se ne avvalse per sfidare un certo Zuannin deTonini de Coi da Brescia che a sua volta sfido il concittadino Tartaglia ponendoglila soluzione di due problemi di terzo grado. Tartaglia che in un primo momento siadiro con il Tonini per avergli posto questioni insolubili, cambio parere quando seppeche Flor si faceva forte di una regola avuta da un grande maestro [4] e si mise a cer-care indipendentemente la soluzione ai problemi proposti, riuscendo nell’intento il 12febbraio 1535. Nel frattempo Cardano, che stava preparando con l’allievo LudovicoFerrari il materiale destinato a formare un’opera matematica di ampio respro, ven-ne a conoscenza e dell’esistenza della formula di Dal Ferro e del fatto che Tartagliaasseriva di aver riottenuto gli stessi risultati. Piu volte allora chiese a Tartaglia disvelargli la soluzione e quest’ultimo acconsentı il 25 marzo del 1539, obbligando Car-dano con giuramento a non divulgare la scoperta. Qualche mese dopo, il 4 agosto del1539, Cardano chiese a Tartaglia chiarimenti sul casus irreducibilis, cioe il caso in cuiq2

4+ p3

27< 0 e dunque si presentano nella formula risolutiva radici quadrate di nume-

ri negativi, senza ottenere una risposta soddisfacente. Nel 1545 Cardano pubblico aNorimberga l’Ars Magna dove compaiono, per la prima volta a stampa, le risoluzionidelle equazioni di terzo grado (dette impropriamente formule cardaniche) e di quartogrado, quest’ultima ottenuta da Ferrari. La pubblicazione dell’Ars Magna scateno leire di Tartaglia che, nel 1546, pubblico a sue spese a Venezia i Quesiti et Invenzionidiverse dove intendeva mettere in chiaro il suo ruolo nella scoperta e dove anche ac-cusava Cardano di spergiuro. E l’inizio della disfida tra Tartaglia e Ludovico Ferrari(Cardano non scese mai in prima linea) costituita dai Cartelli di sfida matematica:tra il 10 febbraio 1547 ed il 24 luglio 1548 comparvero dodici cartelli, sei di Ferrari esei di Tartaglia e la disfida pubblica si svolse il 10 agosto 1548 a Milano. La polemicatra Tartaglia e Ferrari fu molto violenta e, come succede in questi casi, gli elementi di

Page 116: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

116 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

verita sostenuti da ciascuno dei contendenti si disperdono nella veemenza dello scon-tro dialettico. Ad esempio fu ingiusto sminuire la scoperta delle formule risolutive diTartaglia che Ferrari nel secondo Cartello bollo come invenzioncella (inventiculam) epianticella lagnuente e mezza morta4, rivitalizzata dall’innesto nell’orto fertile dell’ArsMagna dove Cardano peraltro aveva riconosciuto fin dal Capitolo I di aver ricevuto laformula risolutiva da Tartaglia, nonche la primazia di Dal Ferro. Tartaglia comunicocon questi versi la regola a Cardano

Quando che ’l cubo con le cose appressoSe agguaglia a qualche numero discretoTrovan dui altri differenti in esso.Da poi terrai questo per consuetoChe ’l lor produtto sempre sia egualeAl terzo cubo delle cose netoEl residuo poi suo generaleDelli lor lati cubi ben sottrattiVarra la tua cosa principale ([1], p.253)I versi di Tartaglia si riferiscono al caso x3 + px = q (altri due gruppi di versi

riguardano le equazioni x3 = px + q e x3 + q = px) e la loro trascrizione formaleconsiste nel trovare due numeri (dui altri), u e v che abbiano per differenza q

u− v = q (4.8)

il cui prodotto sia pari a (p/3)3,

uv =p3

27. (4.9)

Troavati questi numeri, con il ricorso ad un’equazione di secondo grado, l’incognita(la cosa) x ha valore x = 3

√u− 3√v, cioe

x =3

q

2+

q2

4+p3

27− 3

− q2+

q2

4+p3

27.

Ripercorrendo i versi di Tartaglia a ritroso sarebbe stato possibile mostrare che x =3√u− 3√v e radice dell’equazione, patto che p e q soddisfino i vincoli (4.8)-(4.9). Fatto

sta che ne Cardano ne Tartaglia si accorsero della possibilita di ottenere la dimostra-zione per questa via puramente algebrica, operando cioe come suggerito da Maracchianella ricostruzione riportata poco sopra, mostrando ancora una volta che il supportogeometrico era considerato il solo in grado di fornire una dimostrazione solida. Car-dano procede con la suddivisione di un cubo in altri due cubi e sei parallelepipediper poter costruire un segmento soluzione di una assegnata equazione numerica diterzo grado. Nei capitoli XI-XXIII dell’Ars Magna Cardano passa in rassegna tuttii casi ammissibili di equazione cubica ed ogni capitolo ha una struttura ben precisa:dimostrazione, enunciato della regola da seguire, esempi.

L’Ars Magna contiene, oltre alle formule risolutive per equazioni di terzo e quartogrado, altri risultati notevoli che furono approfonditi o riscoperti da altri matematici.

Anzitutto egli inaugura la teoria delle trasformazioni, ovvero di quei cambiamentidi variabile che permettono di semplificare un’equazione. Ad esempio, nel CapitoloXIV Cardano affronta la risoluzione di x3 = px2+q e dimostra come, posto x = (y+ p

3),

si riesca ad eliminare il coefficiente del termine in y2, ricadendo nel caso y3 = p′y+ q′.

4languentem et semimortua arbusculam

Page 117: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.5. LA FORMULARISOLUTIVA DELLE EQUAZIONI DI TERZOGRADO117

Anche se Cardano considera equazioni numeriche, egli e consapevole della potenzialitadel metodo che sara generalizzato da Tschirnhaus, attorno alla fine del ’600.

Un altro aspetto degno di nota in Cardano e l’uso di numeri negativi per giungeretalora alle soluzioni positive di altre equazioni. Nel Capitolo XVIII, dedicato alleequazioni del tipo x3 + px = qx2 + r, all’esempio 6 considera l’equazione x3 + 21x =9x2 + 5 che viene trasformata nell’equazione y3 + 4 = 6y grazie alla sostituzione x =y+3; l’equazione trasformata ammette tre radici: y = 2, y =

√3−1 ed y = −(

√3+1):

quest’ultima e detta radice falsa o fittizia (ficta nell’originale) e serve per giungere alletre soluzioni positive dell’equazione in x: x = 5, x =

√3 + 2, x = 2 −

√3. Un altro

impiego dei numeri negativi si trova al Capitolo XXXVII, dedicato alla regola di porreil falso, cioe nell’assumere un valore negativo per l’incognita. Ad esempio, il primoproblema del Capitolo XXXVII e formulato in questi termini:

La dote della moglie di Francesco supera di 100 aurei la proprieta di Francesco ed ilquadrato della dote supera di 400 il quadrato della proprieta di Francesco. Determinarela dote e la proprieta5 . ([7], p. 286)

Cardano suppone che −x sia il valore della proprieta di Francesco, cosicche la dotee 100−x. Imponendo la seconda condizione, (100−x)2−x2 = 400 Cardano deteminala soluzione x = 48 dell’equazione di primo grado risultante e conclude che

questo e quanto egli possiede, in negativo, cioe quanto gli manca, mentre la dotesara il residuo di 100, cioe 526. ([7], p. 287)

Tornando al Capitolo XVIII, Cardano approfondisce un altro punto importantegia sollevato nel Capitolo I, in una nota al §7. Egli afferma che in tre esempi da luiconsiderati la somma delle radici e sempre uguale al coefficiente del termine di secondogrado (non al suo opposto perche il termine qx2 e a destra del segno di uguaglianza)e con questo apre la via al legame tra radici e coefficienti di un’equazione che verrasviluppato in seguito da Viete e Girard.

Nel Capitolo XXV, dedicato alle regole imperfette e particolari, Cardano consideral’equazione x3 = 16x+ 21 e osserva che x = −3 ne e radicePoiche la somma di 27, un cubo, con 21 fa 48 che e il prodotto di 3, la radice cubica di27, e 16, il coefficiente di x, dico dunque che x+ 3 e divisore comune, se si aggiunge27 ad ambo i membri, a x3 e 16x+ 21. Svolta la divisione avrete

x2 − 3x+ 9 = 16.

Dunquex2 = 3x+ 7

ed x =√

9 14+ 1 1

2.7 ([7], p.267)

Dunque Cardano anticipa quello che sara il teorema di Cartesio-Ruffini: un poli-nomio p(x) ammette la radice x = a se e solo se p(x) e divisibile per x− a.

Cardano va infine ricordato per aver introdotto al Capitolo XXXVII dell’ArsMagna i numeri immaginari che rappresentano l’altro esempio di porre il falso.

Se si dicesse: dividi 10 in due parti il prodotto delle quali sia 30 o 40, e chiaro chesi tratterebbe di un caso impossibile. Tuttavia procediamo in questo modo. Dividiamo

5Dos uxoris Francisci, est aurei 100 plusquam Francisci peculium, et dos uxoris eius in seducta est aurei 400 plus peculio Francisci in se ducto, quaeritur dos et peculium.

6Igitur res est 48 et tantum habuit m. id est debiti, et dos erit residuum ad 100 scilicet 527Tunc, quia addito 27 numero cubo, ad 21 fit 48 qui producitur ex 3 r. cubica 27 in 16

numerum rerum, ideo circo, quod res p. 3 erit communis divisor, addito 27 utrique parti,scilicet cubo et 16 rebus p. 21 inde facta divisione, habebis quadratum m. 3 rebus p. 9aequalia 16 quare quadratum aequabitur 3 rebus p. 7 et res erit r. 9 1

4p. 1 1

2.

Page 118: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

118 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

10 in due parti uguali, ciascuna pari a 5. Elevate queste al quadrato si ottiene 25.Sottraete 40, se volete dal 25 cosı ottenuto (...) lasciando un resto di -15, la cui radicequadrata, aggiunta o sottratta da 5 da i fattori il cui prodotto e 40. Queste partisaranno 5 +

√−15 e 5−

√−15.8 ([7], p. 287)

La soluzione di Cardano consiste nel porre le due parti come 5+u e 5−u ed imporreche il loro prodotto sia 40, che porta alla soluzione u =

√−15. A questo momento

Cardano non ha colto l’utilita di queste bizzarre quantita al punto da affermare fino aquesto punto e giunta la sottigliezza aritmetica, un punto estremo che, come ho detto,e tanto sottile quanto inutile9 ([7], p. 287) Ben piu profondo sara il trattamento deinumeri immaginari portato avanti da Bombelli qualche anno dopo la pubblicazionedell’Ars Magna.

Nella dimostrazione che segue il problema Cardano giunge al punto in cui occorremoltiplicare (5+

√−15)×(5−

√−15) ed ottiene 40, dismissis incruciationibus che puo

essere reso con dopo aver cancellato i termini in croce cosı come lasciando da partele torture mentali. Cardano ritiene vere sophistica la natura di questi numeri perchenon e lecito operare per suo tramite come nel caso del puro meno ne come per altri[numeri].10: poiche a differenza dei numeri negativi puri o degli altri numeri non elecito svolgere per loro tramite le operazioni. Altrove, nella Ars Magna ArithmeticaeCardano osserva che

√−9 non e ne +3 ne -3 ma e di una terza natura misteriosa:

quaedam tertia natura abscondita.La formula risolutiva di del Ferro lasciava aperte alcune questioni che sarebbero

state affrontate in seguito. Se la si applica all’equazione

x3 + 16 = 12x

essa fornisce la radice ficta x = −4 mentre non riesce a riprodurre la soluzione positivax = 2. Un secondo problema e il modo in cui quantita semplici vengono espressericorrendo alla formula di del Ferro. Ad esempio l’equazione x3 + x = 2 ammettex = 1 come unica radice reale eppure la formula di del Ferro fornisce per risultato

3

1 +2

3

7

3+

3

1− 2

3

7

3

che dunque deve essere un modo molto complicato di riscrivere 1. Proprio la sempli-ficazione di radicali di questo tipo e alla base delle ricerche di Tartaglia sul modo di

esprimere3√

a+√b nella forma u+

√v.

Infine, il problema piu serio riguarda il casus irreducibilis che si presenta ognivolta in cui l’equazione cubica ha tre radici reali distinte. Se ad esempio consideriamol’equazione x3 = 15x + 4 che ha x = 4 come soluzione ed applichiamo la formula didel Ferro, otteniamo

x =3

2 +√−121 + 3

2−√−121

che sembra porre dei dubbi ulteriori sulla validita generale della formula stessa e, quelche e peggio, fa comparire le quantita sofistiche

√−121, ovvero i numeri immaginari

8Si quis dicat, divide 10 in duas partes, ex quarum unius in reliquam ductu, producatur30 aut 40 manifestum est quod casus seu quaestio est impossibilis, sic tamen operabimur,dividemus 10 per aequalia et fiet eius medietas 5 duc in se fit 25. auferes ex 25 ipsumproducendum, utpote 40 (....) fiet residuum m. 15 cuius r. addita et detracta a 5 ostenditpartes, quae invicem ductae producunt 40. erunt igitur hae 5 p. r. m. 15 et 5 m. r. m 15.

9hucusque progreditur Arithmetica subtilitas, cujus hoc extremum ut dixi, adeo est subtile,ut fit inutile.

10quoniam per eam, non ut in puro m: nec in aliis, operationes exercere licet

Page 119: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.6. BOMBELLI E LA NASCITA DEI NUMERI COMPLESSI 119

che Cardano cerco di evitare per quanto possibile come conferma il fatto che eglitratto equazioni con tre radici reali ma non menziono il problema, riuscendo a ridurredi grado l’equazione trovandone un fattore lineare.

4.6 Bombelli e la nascita dei numeri complessi

Rafael Bombelli (?-1572?) e l’ultimo rappresentante in ordine cronologico della riccascuola matematica bolognese del XVI secolo ed ha legato il suo nome all’opera L’al-gebra, parte maggiore dell’aritmetica [8] data alle stampe nel 1572 ma alla quale egliaveva lavorato per venti anni. Fu un’opera che ebbe notevole fortuna tanto che piu diun secolo dopo Leibniz si esprimeva in questi termini (cfr. [6] p. 168):

Rafael Bombelli, di cui vidi l’Algebra pubblicata gia nel secolo scorso a Bologna inelegantissima lingua italiana, fu il primo a trovare che esse [le quantita immaginarie]possono servire ad esprimere le radici vere razionali od esprimibili in numeri, quandol’equazione ne ammette11

che dimostra l’importanza attribuita al contributo principale di Bombelli: l’utilizzo deinumeri immaginari per rendere applicabile in ogni caso la formula cardanica. L’Algebradi Bombelli e una sorta di summa di quanto era noto sulla teoria delle equazionialgebriche nel XVI secolo. Cerchiamo di enucleare alcuni suoi contributi, rimandandoal Capitolo 1 per informazioni sulle innovazioni che egli apporto nelle notazioni. Essafu stampata nel 1572, limitatamente ai primi tre libri mentre i manoscritti del IV ed Vlibro, contenenti la parte geometrica dell’opera, furono ritrovati da Ettore Bortolottinel secolo scorso e pubblicati nel 1929 [9].

Bombelli nel I libro ([8], pp. 149-156) espone in modo aritmetico la teoria degliirrazionali quadratici sviluppata nel libro X degli Elementi di Euclide e si serve del-l’esame delle irrazionalita cubiche per risalire alle equazioni cubiche che tali quantitasoddisfano. Cosı egli dimostra che la ricerca di due quantita v ed u tali che

3

√√n±m =

√v ± u (4.10)

equivale alla risoluzione di un’equazione cubica. Infatti, elevando al cubo si ottienel’equazione √

n±m = (3u2 + v)√v ± (u3 + 3uv)

che viene scissa in due equazioni, uguagliando a zero i termini contenenti√v da quelli

privi di irrazionalita:

m = u3 + 3uv e√n = (3u2 + v)

√v.

Se queste equazioni vengono elevate al quadrato e si suppone n > m2 si ottiene

n−m2 = (v − u2)3

per cui la determinazione di u e v porta a risolvere il sistema

v − u2 = 3

√n−m2

u3 + 3uv = m :

11Primus omnium Raphael Bombelli, cuius Algebram perelegantem italico sermone jamsuperiore seculo Bononiae editam vidi, invenit, eas servire posse ad eruendas radices verasrationales sive numeris exprimibiles quando tales habet aequatio.

Page 120: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

120 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

d

e

r

M

L

AB

F

IH

C

G

Figura 4.6: Dimostrazione geometrica della formula risolutiva dell’equazionex3 = 6x+ 4 in superficie piana.

eliminando v dalla seconda equazione si ricava

4u3 = m− 3u3√

n−m2

ovvero, moltiplicando ambo i membri per 2,

8u3 + 6u3√

n−m2 = 2m

che dimostra come x = 2u sia radice dell’equazione

x3 + 33√

n−m2x = 2m.

D’altra parte, da (4.10) si ottiene

2u =3

√√n+m− 3

√√n−m

che, posti

p := 33√

n−m2 e q := 2m,

si trasforma nella formula di Scipione del Ferro

x =3

√√

q2

4+p3

27+q

2− 3

√√

q2

4+p3

27− q

2.

Interessante e anche una costruzione geometrica che, a differenza di quella di Car-dano, non poggia sulla geometria solida ma e data in superficie piana. Con riferimentoalla Figura 4.6 Bombelli introduce un segmento unitario, detto q, che fa coincidere conil segmento LM della retta e. Egli effettua ([8], pp. 298-299) la costruzione per l’equa-zione x3 = 6x + 4 ma e chiaro dallo svolgimento della dimostrazione che la scelta deicoefficienti positivi e del tutto arbitraria. A partire da L egli stacca su e un segmentoFL di lunghezza 6, cioe quanto e il numero delli tanti ovvero pari al coefficiente deltermine di primo grado. Su FL costruisce il rettangolo (parallelogramma) FLAB diarea 4, cioe pari al coefficiente del termine noto nell’equazione. Tracciata la semiretta

Page 121: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.6. BOMBELLI E LA NASCITA DEI NUMERI COMPLESSI 121

d su cui si trova AB e la semiretta r che prolunga AL, Bombelli introduce gli squadri:squadre formate ciascuna da due semirette ortogonali saldate nella comune origine.Presa una di queste squadre la si dispone in modo che il vertice I sia vincolato ascorrere su r mentre un lato deve sempre passare per il puntoM . Disposta la squadrain una certa posizione, si traccia il segmento FI e lo si prolunga fino al punto C doveinterseca la retta d. Si dispone ora la seconda squadra in modo che abbia il vertice Ced un lato sempre lungo d. L’altro lato dovra intersecare il lato della prima squadranon passante per M in un punto G: quando G sta sulla retta e, il segmento IL risolvel’equazione proposta. Infatti, posto IL = x, dal secondo teorema di Euclide applicatoal triangolo rettangolo GIM si ha GL × LM = IL2 per cui GL = x2 e l’area delrettangolo GI e pari a x3. D’altronde lo stesso rettangolo si puo vedere come l’unionedel rettangolo IF che ha area 6x e del rettangolo GH che ha area 4, essendo equiva-lente al rettangolo AF (Elementi, Prop. I.43). Dunque, uguagliando le due espressioniper l’area di GI si vede che x3 = 6x + 4. Questa dimostrazione e fedele all’originaledi Bombelli: Bortolotti in [6] ne da una versione piu moderna che evidenzia l’unicitadella soluzione positiva.

COme gia accennato, Il contributo maggiore di Bombelli fu l’introduzione deinumeri complessi necessari a trattare il casus irreducibilis e rendere applicabile anchein quel caso la formula di del Ferro. Ecco come Bombelli si esprime al riguardo deinumeri complessi:

Ho trovato un’altra sorta di R.c. legate12, molto differenti dall’altre, la qual nascedal Capitolo di cubo eguale a tanti, e numero, quando il cubato del terzo delli tantie maggiore del quadrato della meta del numero, come in esso Capitolo si dimostrara,la qual sorta di R.q. ha nel suo Algorismo diversa operatione dell’altre e diversonome; perche quando il cubato del terzo delli tanti e maggiore del quadrato della metadel numero lo eccesso loro non si puo chiamare ne piu ne meno, pero lo chiameropiu di meno quando lo si dovera aggiongere, e quando si dovera cavare lo chiameromen di meno, e questa operazione e necessarijssima piu che l’altre R.c.L. per rispettodelli Capitoli di potenze di potenze, accompagnati con li cubi, o tanti, o con tutti dueinsieme, che molto piu sono li casi dell’agguagliare dove ne nasce questa sorte di R.che quelli dove nasce l’altra, la quale parera a molti piu tosto sofistica che reale, e taleopinione ho tenuto anch’io, sin che ho trovato la sua dimostrazione in linee (come sidimostrara nella dimostrazione del detto capitolo in superficie piana) e prima trattarodel moltiplicare, ponendo la regola del piu e meno. ([8], Libro I, p.169)

Dunque Bombelli chiama piu di meno l’espressione√−1 e men di meno l’espres-

sione −√−1.

Le regole del piu e del meno sono le regole di calcolo di operazioni su numericomplessi

piu via piu di meno fa piu di meno +(+i) = +imeno via piu di meno fa meno di meno −(+i) = −ipiu via meno di meno fa meno di meno +(−i) = −imeno via meno di meno fa piu di meno −(−i) = +ipiu di meno via piu di meno fa meno (+i)(+i) = −piu di meno via meno di meno fa piu (+i)(−i) = +meno di meno via piu di meno fa piu (−i)(+i) = +meno di meno via meno di meno fa meno (−i)(−i) = −

12Bombelli ha definito radice quadrata legata un’espressione del tipo√

a±√b, dove b non

e un numero quadrato ([8], pp.98-99)

Page 122: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

122 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

([8], Libro I, p.169)e costituiscono una vera e propria assiomatizzazione dell’algebra dei numeri comples-si. Bombelli ha altresı osservato che, quando compare un numero complesso tra lesoluzioni di un’equazione, vi compare anche il suo complesso coniugato

Si deve avvertire che tal sorte di R. legate non possono intravenire se non accom-pagnato il Binomio col suo residuo come sarebbe R.c. ⌊2 + di−R.q.2⌋, il suo residuosara R.c.⌊2− di−R.q.2⌋ e tal sorta di R. c. per sino a hora mai mi e occorso havereoperata l’una senza l’altra.

Osserviamo che i numeri complessi R.c.⌊2+di−R.q.2⌋ e R.c.⌊2−di−R.q.2⌋ equi-valgono rispettivamente a

3√

2 + i√2 e

3√

2− i√2. Facciamo poi notare come Bombelli

enunci il teorema sulla presenza di coppie di radici complesse coniugate in un’equazionealgebrica senza dimostrazione ma come frutto dell’esperienza accumulata.

La risoluzione del casus irreducibilis viene ottenuta da Bombelli determinando perprattica, cioe per tentativi, i numeri (interi negli esempi illustrativi) x ed y tali che

3

b+ i√a = y + ix : (4.11)

moltiplicando questa equazione per la complessa coniugata si ottiene

3√

b2 + a = y2 + x2,

mentre elevando (4.11) al cubo ed uguagliando tra loro le parti reali si ottiene

b = y3 − 3x2y

per cui Bombelli e condotto a cercare le soluzioni intere del sistema

y2 + x2 = 3

√b2 + a

y3 − 3x2y = b.

Bombelli utilizza come esempio il radicale3√

2 + i√121 ed e condotto a risolvere il

sistema y2 + x2 = 5y3 − 3x2y = 2.

da cui si ricava che y2 < 5 e y3 > 2 che e compatibile solo con la scelta y = 2, ottenutaa tentone, cioe per tentativi. Da y = 2 segue x = 1 cosicche si ha l’identita

3

2 + i√121 = 2 + i.

Grazie a questo tipo di risultati, Bombelli e in grado di trattare con successo il casusirreducibilis come per l’equazione

x3 = 15x+ 4

di cui la formula di del Ferro fornisce la soluzione

x = 3√2 + 11i+ 3

√2− 11i

che, grazie al procedimento visto ora, viene ridotta a

x = 2 + i+ (2− i) = 4.

Page 123: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.6. BOMBELLI E LA NASCITA DEI NUMERI COMPLESSI 123

C

B

D

A

F

E

Figura 4.7: Il legame tra la trisezione di un arco e le equazioni di terzo gradovisto da Bombelli nel Libro IV della sua Algebra.

Un altro merito di Bombelli circa il casus irreducibilis sta nell’averne evidenziato illegame con la possibilita di trisecare un angolo, mostrando che quest’ultimo problemaconduce ad un’equazione di terzo grado del tipo x3+q = px per la quale puo presentarsiil casus irreducibilis. Bombelli considera (Fig. 4.7) una circonferenza di diametroBE =

√192 e vi inscrive il triangolo equilatero ADF il cui lato deve avere misura pari

a 12. Costruire un ennagono regolare inscritto nella circonferenza equivale a sapertrisecare l’arco AD pari a 2π

3. Siano B e C i punti che operano tale trisezione e si

ponga AB = BC = CD = 2x, lato dell’ennagono regolare inscritto. Si consideriora il trapezio isoscele ABCD inscritto nella circonferenza e si applichi il teorema diTolomeo (si veda l’Appendice III) ottenendo

AC ×BD = AC2 = AB × CD + AD ×BCovvero, numericamente

AC =√

4x2 + 24x. (4.12)

Similmente, si riapplichi il teorema di Tolomeo al quadrilatero ABCE, con Ediametralmente opposto a B ricavando

AC ×BE = BC × AE + AB × CE (4.13)

Poiche i triangoli rettangoli ABE e BCE sono congruenti si ha BC×AE = AB×CEe, applicando il teorema di Pitagora, si ha

AE = CE =√

192 − 4x2

che, sostituita in (4.13), fornisce

AC =4x√192 − 4x2

√192

. (4.14)

Page 124: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

124 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

Confrontando le espressioni (4.12) ed (4.14) di AC ed elevando al quadrato si ottiene,dopo semplificazioni dirette

x4 + 72x = 36x2

ovvero, eliminata la radice x = 0, l’equazione cubica

x3 + 72 = 36x,

compatibile con il casus irreducibilis. Dunque Bombelli ha mostrato che saper trisecareun angolo di π/3 e equivalente alla soluzione di un’equazione cubica con certe proprieta.La scelta dell’esempio numerico non lede la generalita del metodo.

4.7 Equazioni di quarto grado

La risoluzione delle equazioni di quarto grado venne pubblicata al Capitolo XXXIXdell’Ars Magna dove Cardano la attribuisce al suo discepolo Ludovico Ferrari, avocan-do a se il merito della dimostrazione geometrica della formula risolutiva. La risoluzionedelle equazioni di quarto grado segna un tornante fondamentale nel processo di affran-camento dell’algebra dalla geometria. Infatti, come scrisse Cardano stesso nell’ArsMagna Arithmeticae

Non appena l’uomo sara giunto a conoscere i Capitoli sino a quelli relativi al cubo,e sono 19, allora ne ha quanto basta per ogni caso algebrico, poiche sino al cubo si trovagradazione in natura: infatti vi sono linee, superficie e corpi: le linee corrispondonoalle incognite lineari; le superficie ai quadrati; i corpi ai cubi. Se pertanto avremofornito su queste notizie sufficienti, sara noto cio che e necessario: in verita cio cheaggiungeremo al di la e per diletto e non per compimento di cio che puo trarsi da [tale]studio. Tali Capitoli successivi non esistono veramente in se ma solo per accidente, seanche ve ne siano [formule] generali.

Similmente, al cap. I dell’Ars Magna troviamoTrattando le altre cose, anche se in generale, tuttavia quasi per estensione, e infatti

avendo associato la posizione [i.e. l’incognita] alla linea, il quadrato alla superficie,il cubo al corpo solido, affinche non fosse assolutamente stolto l’aver noi proseguitooltre, in cio che non e lecito in natura.13 ([7], p. 222)

Cardano nel Capitolo XXXIX dell’Ars Magna antepone la dimostrazione geome-trica ad un esempio numerico, coniato sulla falsariga di un problema che Tonini daiCoi aveva proposto a Tartaglia:

Fai tre parti di 10 posti in proporzione continua tali che il prodotto della prima conla seconda sia 614. ([7], p. 295)

Tradotto in forma algebrica, il problema equivale al sistema

x+ y + z = 10x : y = y : zxy = 6

che, eliminate le variabili x e z, porta all’equazione biquadratica

y4 + 6y2 + 36 = 60y .

13Caeter, etiam si generaliter, quasi tamen per transennam, namque cum positio lineam,quadratum superficiem, cubus corpum solidum referat, nae utinum stultum fuerit, nos ultraprogredi, quo natuare non licet.

14Fac ex 10 tres partes in continua proportione x quarum ductu primae in secundam,producantur 6.

Page 125: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.7. EQUAZIONI DI QUARTO GRADO 125

Per seguire la dimostrazione geometrica di Cardano, consideriamo il caso generale

x4 + 2ax2 + q2 = cx

e, se il primo membro non e un quadrato perfetto, aggiungiamo ad ambo i membri2(q − a)x2 cosicche si ha

(x2 + q)2 = cx+ 2(q − a)x2

che e del tipox4 + 2qx2 + q2 = cx+ px2

ed a cui occorre aggiungere un’opportuna quantita che, senza far perdere al membrodi sinistra il carattere di essere un quadrato, faccia diventare un quadrato anche ilmembro di destra. La scelta di Cardano e il trinomio 2yx2 + y2 + 2yq, che rende ilmembro di sinistra il quadrato del trinomio (x2+q+y)2 e permette di usare l’incognitay per rendere un quadrato anche il membro di destra che ora diventa

(p+ 2y)x2 + cx+ (y2 + 2yq) :

chiedendo l’annullamento del discriminante di questo trinomio di secondo grado, Car-dano giunge all’equazione di terzo grado per y

(p+ 2y)(y2 + 2yq) =c2

4:

ottenuto un valore per y, lo si puo sostituire nell’equazione di quarto grado che, essendoun’uguaglianza tra quadrati, si spezza in una coppia di equazioni di secondo grado.Per dare una veste geometrica al metodo, Cardano considera (Fig. 4.8) un quadratoABDO di area x4 e dunque di lato x2 cui giustappone i due rettangoli uguali ODMEe BCDP che hanno lati x2 e BC = EO = q. Infine, si completa il primo quadratocon l’aggiunta del quadrato DPFM di lato q e dunque di area q2 cosicche il quadratoACFE ha area (x2+q)2. Questa costruzione non e una novita, visto che era usata comedimostrazione della formula risolutiva di equazioni di secondo grado. Ora pero occorrefare un passo ulteriore giustapponendo due rettangoli congruenti CGLP e EMRKcon un lato CG = EK = a incognito, e l’altro sempre pari ad x2. Si aggiungonoaltri due rettangoli congruenti PLTF e MFRN di area pari ad aq e si completail quadrato AGHK co n il quadrato di area a2 FTHN . Pertanto la dimostrazionegeometrica si arresta alla formazione del quadrato (x2+a+q)2 ma non prosegue con ladeterminazione di a. Si vede dunque come il tradizionale approccio geometrico segni ilpasso di fronte ad un’equazione che non ammette un significato geometrico immediatoper questioni dimensionali: l’algebra si affranca dalla geometria e non e un caso se,gia a partire da Bombelli e poi, nel volgere di un secolo, con la geometria analitica diCartesio, si assistera al ribaltamento del rapporto, con l’algebra che diventa strumentoper risolvere problemi geometrici, completando un processo abbozzato da Fibonacci ePacioli.

Bombelli tratta le equazioni di quarto grado nel secondo libro dell’Algebra conun tal dettaglio da essere per qualche tempo considerato il primo risolutore di taliequazioni, offuscando involontariamente Ferrari. Bombelli, in omaggio alla tradizione,distingue 42 casi di equazioni biquadratiche per poter avere coefficienti solo positivi edil suo metodo di risoluzione algebrica non differisce sostanzialmente da quello di Ferrari.Interessante e osservare come Bombelli non attribuisca ad una maggiore esigenza dirigore il ricorso a dimostrazioni geometriche, quanto alla completezza:

Page 126: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

126 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

x4

A B C

D P

FM

R N

E

O

K

G

L

T

H

qx2

qx2 yx2

q2

yq

yq

yx2 y2

Figura 4.8: Dimostrazione geometrica della formula risolutiva delle equazioni diquarto grado nell’Ars Magna di Cardano.

E benche questa scienza sia Aritmetica (come la chiama Diofante Autore Grecoe li Indiani) pero non resta che il tutto non si possi provare per figure Geometriche(come fa Euclide nel secondo, sesto, decimo). Pero volendo che il lettore resti intutto soddisfatto, mi sono risoluto porre tutte le dimostrazioni dello agguagliare, cioeCapitolo per Capitolo, tanto in linea senza numero quanto in linea composto di numeroe questa parte non e men bella che dilettevole. ([8], Libro II, p.241)

Per ribadire e rafforzare il concetto, alla conclusione del Libro III Bombelli affermache l’algebra e la geometria

hanno intra di loro tanta convenientia che l’una e la prova dell’altra e l’altra e ladimostrazion dell’una. ([8], p.648)

La dimostrazione geometrica del caso x4 = ax+ b utilizza il completamento di duediversi quadrati, uno per ogni membro dell’equazione (Fig. 4.9). A sinistra si partedal quadrato ICEB di area x4 cui vengono giustapposti i rettangoli congruenti di latoAB = CD = y ed area x2y ciascuno; il quadrato IDFA viene ottenuto aggiungendoil quadrato EF si area y2. Con queste aggiunte il secondo membro si e mutato inax + b + 2yx2 + y2 che ha la struttura di un quadrato a patto che i quadrati GO edOM siano di area, rispettivamente, 2yx2 e y2 + b mentre i due rettangoli OS ed OKabbiano area 1

2ax ciascuno. Questa richiesta comporta il soddisfacimento del vincolo

area(OK) = RO ×OP che a sua volta si traduce in

ax

2=

2yx2(b+ y2)

che, elevando al quadrato e semplificando, diventa la risolvente cubica in y

2y(y2 + b) =a2

4.

Page 127: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.8. APPENDICE I 127

x4

I C D

E

S

F M

P

R

N

A

B

K

G

O

yx2

yx2

2x2y

y2

y2 + b

1

2ax

1

2ax

Figura 4.9: Dimostrazione geometrica della formula risolutiva delle equazioni diquarto grado nell’Algebra di Bombelli.

4.8 Appendice I

In questa Appendice mostriamo la risoluzione tradizionale dell’equazione di terzogrado con le formule di del Ferro, dette impropriamente cardaniche. Consideriamol’equazione

x3 + ax2 + bx+ c = 0 (4.15)

ed operiamo la sostituzione

x = y − a

3

pervenendo cosı all’equazione

y3 + py + q = 0 (4.16)

dove

p := b− a3

3q := c− ab

3+

2a3

27(4.17)

ed in cui dunque non compare piu il termine di secondo grado. Poniamo ora

y := u+ v

e sostituiamo in (4.16). Riordinando i termini abbiamo

u3 + v3 + (p+ 3uv)(u+ v) + q = 0

che e un’equazione in due incognite indeterminata finche non si stabilisca un legameulteriore tra u e v. Seguendo il matematico olandese Johann Hudde (1628-1704),poniamo allora

uv = −p3

cosı da ridurre l’equazione precedente alla forma

u3 + v3 = −q :

in definitiva, abbiamo ridotto il problema di risolvere (4.16) alla soluzione del sistema

u3 + v3 = −q

uv = − p

3

Page 128: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

128 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

ovvero, elevando al cubo la seconda equazione,

u3 + v3 = −q

u3v3 = − p3

27.

(4.18)

Dunque dobbiamo trovare due numeri, u3 e v3 di cui e nota la somma −q ed il prodotto

− p3

27e, come e noto, cio si riduce alla soluzione di una equazione di secondo grado

t2 + qt− p3

27= 0 (4.19)

le cui radici A e B sono

A = − q2+

q2

4+p3

27e B = − q

2−

q2

4+p3

27(4.20)

Ora, se indichiamo con ω = −1+i√

32

una radice cubica dell’unita diversa da 1, i valoridi u e v sono, rispettivamente

u1 =3√A u2 = ω

3√A u3 = ω2 3

√A

ev1 =

3√B v2 = ω

3√B v3 = ω2 3

√B

dove 3√A e 3√B sono le determinazioni principali delle radici cubiche che sono reali se

l’argomento lo e. Sorge ora il problema di come combinare questi sei valori in mododa selezionare le sole tre radici dell’equazione (4.16). Occorre combinarle in modo chesi abbia uivj = p

3e, ricordando che si ha ω3 = 1, le tre radici sono

y1 = u1+v1 =3√A+

3√B y2 = u2+v3 = ω

3√A+ω2 3

√B y3 = u3+v2 = ω2 3

√A+ω

3√B .

La natura delle radici dipende dal segno del discriminante

∆ := 4p3 + 27q2. (4.21)

Quando ∆ > 0, sia A che B sono numeri reali per cui y1 e reale e siccome 3√A 6= 3

√B

le altre radici y2 ed y3 sono complesse coniugate.Se ∆ = 0, A e B sono reali e coincidenti. Poiche 1 + ω + ω2 = 0 si vede che

y2 = y3 = − 3√A mentre y1 = 2 3

√A. Le tre radici possono coincidere in 0 quando q, e

quindi p, si annulla.Il caso ∆ < 0 ha una sua rilevanza storica particolare in quanto costituisce il

casus irreducibilis ed e strettamente legato alla storia dei numeri complessi. Infattiora abbiamo √

q2

4+p3

27= i

− ∆

108

e si ha

3√A =

3

− q2+ i

− ∆

108= a+ ib

3√B =

3√A = a− ib,

dove (x) indica il complesso coniugato di x. Dunque

y1 = 2a

Page 129: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.8. APPENDICE I 129

y2 = ω(a+ ib) + ω2(a− ib) = −a− b√3

ey3 = ω2(a+ ib) + ω(a− ib) = −a+ b

√3 :

le tre radici sono reali e distinte.Il metodo di risoluzione proposto ha, a ben guardare, un elemento spurio: la

necessita di eliminare dai nove valori per u+ v, sei valori che non soddisfano il vincolouv = − p

3. Per ovviare a questo problema il matematico inglese Arthur Cayley (1821-

1895) propose [10] un’acuta variante alla procedura tradizionale di Hudde partendoda un’equazione nella forma

x3 + px+ q = 0, (4.22)

con q 6= 0, egli cerco soluzioni nella forma x = uv(u+ v) che trasforma (4.22) in

u3v3(u3 + v3) + q + 3u4v4(u+ v) + puv(u+ v) = 0

da cui si ricava il sistemau3v3(u3 + v3) + q = 0uv(u+ v)(3u3v3 + p) = 0.

Ora, poiche si e supposto q 6= 0, x = uv(u + v) 6= 0 per cui possiamo riscrivere ilsistema come

u3v3 = − p

3

u3 + v3 = 3qp

(4.23)

per cui siamo ancora una volta ricondotti a ricercare due numeri, u3 e v3, noti la lorosomma ed il loro prodotto. Questi numeri risolvono l’equazione di secondo grado

t2 − 3q

pt− p

3= 0

e dunque otteniamo

u1 =3

√√√√3q

2p+

9q2

4p2+p

3v1 =

3

√√√√ 3q

2p−

9q2

4p2+p

3.

A differenza che nel metodo di Hudde, ora il prodotto uv non e piu vincolato e, sesi sceglie qualunque altra determinazione della radice cubica, tra u2 = ωu1, u3 =ω2u1 cosı come tra v2 = ωv1 e v3 = ω2v1 non si ottengono altre radici del sistema(4.23). D’altra parte, la funzione uv(u+ v) puo assumere solo tre valori che risolvonol’equazione (4.22) di partenza. Infatti, siccome [11]

3uv(u+ v) = (u+ v)3 − (u3 + v3)

ed (u3 + v3) assume un sol valore, qualunque determinazione si prenda per u e v, ivalori di x sono tanti quanti quelli di (u+ v)3, cioe tre, perche

(u1 + v1)3 = (u2 + v2)

3 = (u3 + v3)3 = A1

(u1 + v2)3 = (u2 + v3)

3 = (u3 + v1)3 = A2

e(u2 + v1)

3 = (u3 + v2)3 = (u1 + v3)

3 = A3.

Page 130: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

130 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

4.9 Appendice II

Vediamo ora nel linguaggio moderno la risoluzione dell’equazione di quarto grado

x4 + ax3 + bx2 + cx+ d = 0 (4.24)

che vien posta nella forma

x4 + ax3 = −(bx2 + cx+ d)

in modo da poter completare il quadrato a sinistra aggiungendo ad ambo i membria2

4x2 per poter scrivere

(

x2 +a

2x)2

=

(a2

4− b

)

x2 − cx− d .

Se il membro di destra e anch’esso un quadrato perfetto, il problema e ricondottoalla soluzione di due equazioni di secondo grado. In caso contrario si introduce unavariabile ausiliaria y e si completa ulteriormente il quadrato a sinistra aggiungendo ad

ambo i membri (x2 + a2x)y + y2

4cosı da ottenere

(

x2 +a

2x+

y

2

)2

=

(a2

4− b+ y

)

x2 −(

c− 1

2ay

)

x− d+ 1

4y2.

Occorre ora servirsi della variabile libera y per far in modo che anche il membro didestra sia un quadrato. Trattandosi di un trinomio di secondo grado in x, la condizioneperche cio succeda e che si annulli il suo discriminante, ovvero che sia

(

c− 1

2ay

)2

= 4

(a2

4− b+ y

)(1

4y2 − d

)

cioe, operate opportune semplificazioni,

y3 − by2 + (ac− 4d)y + 4bd− a2d− c2 = 0 :

Dunque y viene ottenuto grazie alla risoluzione di questa equazione di terzo grado.Una qualsiasi sua soluzione y1 permette di scrivere

(

x2 +a

2x+

y12

)2

= (ex+ f)2

dove e ed f sono funzioni di y1. Otteniamo allora la separazione dell’equazione diquarto grado in due equazioni di secondo grado,

x2 +a

2x+

1

2y1 = ex+ f x2 +

a

2x+

1

2y1 = −(ex+ f)

da cui si ricavano le quattro soluzioni di (4.24).

Page 131: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

4.10. APPENDICE III 131

b

b

b

b

C

BA

D

E

Figura 4.10: Dimostrazione del teorema di Tolomeo.

4.10 Appendice III

Dimostriamo per completezza in questa appendice il teorema di Tolomeo, ripetuta-mente utilizzato nel problema della trisezione di un angolo.Teorema Dato un quadrilatero convesso ABCD inscrivibile in una circonferenza ilrettangolo costruito sulle diagonali e equivalente alla somma delle aree dei rettangolicostruiti su coppie di lati opposti del quadrilatero.

Dim. Con riferimento alla Figura 4.10, il teorema equivale a dimostrare che

AC ×DB = AB × CD +BC ×AD.

Per questo si tracci l’angolo ∠(ABE) di ampiezza pari a ∠(DBC) e sia E sulladiagonale AC. I triangoli (ABE) e (DBC) sono simili perche hanno ∠(ABE) =∠(DBC), per costruzione, ed ∠(BAC) = ∠(BDC) perche entrambi insistono sullacorda BC. Dunque si ha

AB : AE = BD : CD

che si puo riscrivere comeAE ×BD = AB × CD. (4.25)

Si considerino ora i triangoli(ABD) e(EBC); essi sono simili perche ∠(ABD) =∠(EBC) (si ottengono aggiungendo l’angolo comune ∠(EBD) ad ∠(ABE) e ∠(DBC))e ∠(ADB) = ∠(ECB) perche insistono entrambi sull’arco AB. Si ha allora

EC : AD = BC : BD

ovveroEC ×BD = AD ×BC

che, sommata a (4.25), dimostra l’enunciato.

Page 132: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

132 CAPITOLO 4. EQUAZIONI DI TERZO E QUARTO GRADO

Page 133: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] S. Maracchia: Storia dell’Algebra. Liguori, Napoli, (2005).

[2] U. Cassina: Sull’equazione cubica di Leonardo Pisano. In Dalla GeometriaEgiziana alla Matematica Moderna, Cremonese, Roma (1961).

[3] F. Woepcke: Sur un essai de determiner la nature de la racine d’une equationdu troisieme degre, contenu dans un ouvrage de Leonard de Pise decopuvert parM. le prince Balthasar Boncompagni. J. Math. Pures et Appl. 19 (S. 1), 401-406,(1854).

[4] S. Glushkov: On approximation methods of Leonardo Fibonacci. HistoriaMathematica 3, 291–296, (1976).

[5] B.L. van der Waerden: A History of Algebra. Springer, Berlin-Heidelberg, (1985).

[6] E. Bortolotti: L’algebra nella scuola matematica bolognese del secolo XVI.Periodico di Matematiche 5 (S. IV), 147-192, (1925).

[7] G. Cardano: Artis Magnae, sive de regulis algebraicis, liber unus In HieronimiCardani Opera Omnia, vol. IV, pp. 221-302.

[8] R. Bombelli: L’Algebra parte maggiore dell’Aritmetica. Rossi, Bologna, (1572).

[9] L’Algebra. Opera di Rafael Bombelli da Bologna. Libri IV e V contenenti la “ParteGeometrica” inedita tratta dal manoscritto B. 1569 della biblioteca dell’Archi-ginnasio di Bologna. Pubblicata a cura di Ettore Bortolotti. Zanichelli, Bologna,(1929)

[10] A. Cayley: Note on Mr. Jerrard’s researches on the equation of the fifth order.Philosophical Magazine 21, 210–214, (1861). In: The Collected Mathematical Pa-pers of Arthur Cayley, editori: F.H. Collins ed A.R. Forsyth. vol V, pp.50-54,Cambridge University Press, Cambridge (U.K.), (1892).

[11] U. Scarpis: Sulla formula di risoluzione dell’equazione cubica. Boll. Mathesis189–190 (1919).

133

Page 134: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

134 BIBLIOGRAFIA

Page 135: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 5

Viete, Descartes e la

riforma del linguaggio

algebrico

5.1 Introduzione

Francois Viete (1540-1603), giurista francese nativo di Fontanay, consulente di re, ap-partiene alla schiera dei matematici dilettanti: Io, che non mi professo matematicoma che, se ho del tempo libero, mi diletto con lo studio della matematica1 disse di seintroducendo la celebre soluzione trigonometrica al problema proposto da Adriaan vanRoomen (Romanus) ([2], p. 305) che studieremo nel §5.3. Il ruolo di Viete e molto im-portante nell’evoluzione del linguaggio e del metodo di indagine proprio dell’algebra.Come accennato nel capitolo 1, Viete fu il primo matematico a servirsi sistematica-mente delle lettere per indicare i coefficienti e l’incognita di un’equazione: consonantinel primo caso, vocali nel secondo. La sua notazione e pero ancora appesantita dalpostulato fondamentale seguıto: garantire l’omogeneita dimensionale dei termini diun’equazione. Esamineremo alcuni aspetti del metodo di Viete: il rinnovato rapportotra algebra e geometria, mediato dal ricorso alle proporzioni; l’utilizzo della trigono-metria per risolvere equazioni algebriche; il riconoscimento delle relazioni esistenti tracoefficienti e radici di un’equazione algebrica; i metodi proposti per la soluzione diequazioni di terzo e quarto grado. Il processo di riforma del linguaggio algebrico ela pari dignita di algebra e geometria vengono ulteriormente sviluppati da Rene De-scartes (1596-1650) (Cartesio) che, come Viete, non puo considerarsi un matematico diprofessione. A Cartesio dedicheremo la seconda parte di questo capitolo analizzandoneil metodo di costruzione delle equazioni algebriche e studiando la storia della regoladei segni, un risultato che consente di avere informazioni, non sempre conclusive, sulnumero di radici positive di un’equazione algebrica.

1Ego qui me Mathematicum non profiteor, sed quem, si quando vacat, delectantMathematices studia

135

Page 136: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

136 CAPITOLO 5. VIETE E DESCARTES

5.2 Il metodo di Viete

Viete, che ben conosceva la matematica greca, pone il rapporto tra algebra e geometriasu nuove basi e si sforza di dare un fondamento assiomatico all’algebra, nello stile degliElementi euclidei, fissando le regole del gioco. Ci accorgiamo di questa impostazione gianell’opuscolo In Artem Analyticem Isagoge, Introduzione all’arte analitica, articolatain 8 brevi capitoli ed apparsa nel 1591[3].

Il capitolo I contiene la distinzione classica in analisi e sintesi dei processi logiciseguiti per determinare la verita di un’affermazione in matematica. Nell’analisi si con-cede la validita di quanto richiesto dal problema e, attraverso una catena di deduzioni,si giunge ad una verita che non puo essere contestata [4]. Al contrario, nella sintesisi parte da quanto e assegnato per approdare alla comprensione e risoluzione del pro-blema. Viete si rifa a categorie presenti nelle Collezioni di Pappo che aveva distintol’analisi in teoretica e problematica. Nella prima, per dimostrare la proposizione A siesaminano le proprieta B che la possono implicare; si risale alle proprieta C da cuipuo seguire la validita delle B e cosı via a ritroso. La sintesi, al contrario, verifica lacorrettezza della proposizione A partendo da alcune proprieta D dedotte nel processoanalitico e che possono essere assunte come verita incontestabili. La ricerca delle re-lazioni tra le proprieta da conoscere A e quelle note D era detta zetetica da Pappo ede questo un termine centrale nell’opera di Viete:

Per mezzo della zetetica si trova un’uguaglianza od una proporzione che contienela grandezza cercata con i dati assegnati. ([3], p.1)

Ottenuta l’uguaglianza o proporzione entra in gioco la poristica

con la quale si esamina la verita di un teorema a partire dall’uguaglianza ottenutaprima ([3], p.1).

Infine interviene la retica esegetica

grazie alla quale si mostra la grandezza dell’incognita ([3], p.1).

Esaminate le regole generali della zetetica, nel capitolo II Viete assume le proprietadei simboli di uguaglianza e proporzione (symbola aequalitatum et proportionum) cheemergono dagli Elementi: ad esempio, si trovano precetti come se si aggiungono quan-tita uguali a quantita uguali, i risultati sono uguali; se quantita proporzionali vengonomoltiplicate per altre quantita proporzionali, anche i prodotti sono in proporzione2 ([3],p. 2). Importante e l’ultima (n. 16) delle proprieta elencate:

date tre o quattro grandezze, sia la prima alla seconda come la seconda, od una terzaquantita sta ad un’altra; il prodotto degli estremi e uguale al prodotto dei medi. Per-tanto la proporzione si puo definire come costituzione di un’uguaglianza e l’uguaglianzala risoluzione di una proporzione. 3 ([3], p.2).

Il legame tra equazioni e proporzioni e centrale nell’algebra di Viete in quanto ilricorso alle proporzioni rappresenta il tramite tra algebra e geometria [6]: le proporzioniservono a formare le equazioni che, a loro volta risolvono le proporzioni. Il capitoloIII riguarda il principio di omogeneita cui Viete attribuisce somma importanza, comeabbiamo visto nel capitolo 1.

2Si proportionalia per proportionalia multiplicentur, facta esse proportionalia3Si fuerint tres quatorve magnitudines, & sit ut prima ad secundam, ita secunda illa, vel

tertia quaepiam ad aliam, erit quod sit sub extremis terminis aequale ei quod sit sub mediis.Itaque proportio potest dici costitutio aequalitatis. Aequalitas, resolutio proportionis.

Page 137: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.2. IL METODO DI VIETE 137

La prima e perpetua legge delle uguaglianze o delle proporzioni che e detta leggedelle grandezze omogenee, perche le riguarda, e la seguente: bisogna confrontare traloro solo grandezze omogenee.4 ([3], p. 2)

Abbiamo gia esaminato (Cap. 2) il contenuto del capitolo IV della In artem analy-ticem isagoge dove si trova formulata la regola dei segni. Passiamo dunque al capitoloV dove Viete esamina le leggi algebriche fondamentali e le proprieta delle elementaritrasformazioni di equazioni.1) la regola del trasporto: antithesi aequalitatem non immutari ([3], p. 9). In altreparole, se x2 − d = g − bx allora x2 + bx = g + d.2) semplificazione dividendo per l’incognita: hypobibasmo aequalitatem non immutari([3], p. 9). Se x3 + bx2 = zx, per ipobibasmo si ha anche

x2 + bx = z :

Viete non dice nulla a proposito dell’eventualita che, con questa semplificazione, sipossa perdere la radice x = 0 valore che, dopo tutto, non viene percepito comeaccettabile.3) divisione per un coefficiente numerico: parabolismo aequalitatem non immutari ([3],p. 9). Se dx2 + bx = z allora e anche x2 + b

dx = z

d.

Il capitolo VI contiene una breve descrizione della poristica, mentre il capitolo VIIespone il ruolo della retica esegetica. Infine, nel capitolo VIII Viete ricapitola i concettie le notazioni alla base dell’arte analitica.

Viete fa uso abbbondante delle trasformazioni di equazioni, descritte ampiamentenel De aequationum recognitione et emendatione tractatus duo, pubblicato postumonel 1615. La expurgatio per uncias ([7], pp. 130-132) consente l’eliminazione di qual-che termine aggiungendo o sottraendo all’incognita una quantita che e una parte delcoefficiente del termine da eliminare: si tratta della trasformazione gia adoperata daCardano. Ad esempio, nel caso di A3 +3BA2 = Z, la trasformazione A+B = E con-sente di ottenere un’equazione da cui viene eliminato il termine di secondo grado, avantaggio di un termine lineare: E3− 3BE = Z. Viete fornisce le regole su come deveessere effettuata la sostituzione per l’eliminazione (expurgatione) di un termine specifi-co, basate sui coefficienti dello sviluppo di (a+ b)n. Un secondo tipo di trasformazionee detta da Viete Πρωτoν − ǫχατoν ([7], pp. 132-134) a causa dell’analogismo cui sisottopone l’equazione data5 ([7], p.136). Questa trasformazione viene posta a rimediodel vizio della negazione, in quanto si utilizza per trasformare coefficienti negativi inpositivi.

Ad esempio, l’equazione A3−BA = Z, grazie alla trasformazione Πρωτoν−εχατoνA = Z/E, diventa

E3 +BE2 = Z

da cui e scomparso il segno negativo. L’anastrofe (inversione, [7], pp.134-138) consistenell’abbassare di grado un’equazione, nota che ne sia una radice: quando una radice,necessariamente positiva, non emerge dall’analisi dell’equazione, l’anastrofe richiede lasostituzione di x in −x per ricercare una radice positiva dell’equazione trasformata.

L’isomeria (parti uguali, [7], pp. 138-139) libera invece dal vizio delle frazionie serve ad eliminare i coefficienti frazionari, conservando il polinomio monico. Adesempio, nell’equazione A3 + B

DA = Z si pone AD = E e si ottiene l’equazione in

4Prima & perpetua lex aequalitatum seu proportionum, quae, quoniam de homogeneisconcepta est, dicitur lex homogeneorum, haec est: Homogenea homogeneis comparari.

5Letteralmente: primo-cento o primo-ultimo in quanto, dopo la trasformazione, il primotermine di un’equazione si trova all’ultimo posto.

Page 138: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

138 CAPITOLO 5. VIETE E DESCARTES

E E3 + BDE = ZD3. Infine la Climactica Paraplerosis ([7], pp. 140-148) serve adeliminare il vizio dell’asimmetria che consiste nella presenza di coefficienti irrazionali.

Tutte queste trasformazioni intendono liberare le equazioni da imperfezioni (vitia)ma Viete, sempre in [7], presenta tre generi di trasformazioni dal significato piu pro-fondo [5] da lui chiamate Zetesi, Plasma e Synchresi. La zetesi consiste nella riduzionedi un’equazione (di grado non superiore al terzo) ad uno zetetico, cioe ad un problemaespresso con il ricorso a proporzioni continue. Riscritta l’equazione di terzo grado inA

A3 +B2A = B2Z (5.1)

nella forma B2(Z − A) = A3, la si puo porre sotto forma di proporzione

B : A =A2

B: (Z − A)

che, combinata con l’altra, ovvia, proporzione B : A = A : A2/B, fornisce la propor-zione continua cercata

B : A = A :A2

B=A2

B: (Z − A)

che a sua volta permette di associare (zetesi) all’equazione il problemaTrovare il secondo termine di una proporzione continua di quattro elementi, asse-

gnato il primo termine e la somma del secondo con il quarto.6 ([7], p.86)La trasformazione plasmatica all’apparenza sembra essere volta a trasformare un’e-

quazione di grado minore in un’altra di grado superiore ma, a ben vedere, il suo obiet-tivo finale e esattamente l’opposto ed e finalizzata ad ottenere formule risolutive delleequazioni. Vediamo un esempio (Teorema IV, Cap. XIII): L’equazione in A

A2 +BA = S +D (5.2)

si puo ricondurre ad A2 −D = S −BA che, elevata al quadrato, permette di ottenere

A4 − (2D +B2)A2 + 2SBA = S2 −D2. (5.3)

Viete in qualche modo inverte i passaggi e, assegnata l’equazione di quarto grado nellaforma

A4 + γA2 + δA = ϕ, (5.4)

che, confrontata con (5.3) fornisce il sistema

γ = −(2D +B2)δ = 2BSϕ = S2 −D2 :

(5.5)

ricavando D da (5.5)1 ed S da (5.5)2 e si inseriscono questi valori in (5.5)3 si ottienel’equazione

B6 + 2γB4 + (4ϕ+ γ2)B2 − δ2 = 0

di terzo grado in B2. Una volta determinato B, si puo trovare A grazie all’equazionedi secondo grado (5.3) dove ora S e D sono funzioni note dei coefficienti di (5.4). Laparte del De emendatione dedicata alla Synchresi i teoremi sono solo enunciati ma maidimostrati. Secondo David Hume, che pubblico nel 1636 l’opera Algebre de Viete, la

6Data prima & aggregato secundæ et quartæ in serie quatuor continue proportionalium,invenire secundam.

Page 139: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.2. IL METODO DI VIETE 139

concisione potrebbe essere dovuta al fatto che l’opera ci e giunta in una fase embriona-le che non pote essere sviluppata perche Viete morı. Nella sincresi si considerano dueequazioni e si trova il modo di stabilire una proporzione continua contenente i coeffi-cienti e le soluzioni delle equazioni. Viete considera tre tipi di equazioni: le ancipiti,le contradittorie e le inverse. Alle equazioni ancipiti appartengono le equazioni come

BA2 − A5 = Z o BE2 +E5 = Z

di cui vengono considerate solo le soluzioni positive. Viete intende ottenere relazioniche esprimano i coefficienti in termini delle radici di un’equazione: qui A ed E. Leequazioni contradittorie sono del tipo

An +BAm = Z En −BEm = Z

ovvero xn + Bxm = Z con n pari ed m < n dispari, in modo che, mandando x in−x si passa dalla prima alla seconda equazione proposta di cui E e soluzione positiva.Uguagliando le due equazioni si ricava il coefficiente

B =En −An

Em +Am

da cui si ottiene poi

Z =AnEm + EnAm

Em + Am.

Le equazioni inverse sono del tipo Bxn − xm = Z con m ed n entrambi dispari come

BA− A3 = Z E3 −BE = Z

su cui si opera come nel caso precedente. Rimando a [5] per uno studio dettagliato dialcuni dei teoremi di Viete al riguardo.

Sempre in [7], Viete propose un metodo per la soluzione delle equazioni di terzogrado che qui riproduciamo, affiancandolo al commento di Ludwig Matthiessen, autoredi un corposo trattato sulla risoluzione delle equazioni algebriche letterali [10].

Viete considera due problemi di terzo grado

x3 + 3bx = 2cx3 = 3bx+ 2c

(5.6)

ed affronta il problema della loro riduzione ad equazioni di secondo grado. L’equazione(5.6)1 viene formulata in questi termini

Proponatur A cubus + B plano 3 in A, aequari Z solido 2

cioe A3 + 3B2A = 2Z3 e viene dapprima ridotta introducendo una variabile ausiliariaE tale che

E2 +EA = B2 : (5.7)

Oportet facere quod propositum est. E quad +A in E, aequetur B plano.

Osserviamo la diversa nomenclatura per le potenze delle incognite e le dimen-sioni dei coefficienti: le potenze superiori alla prima sono indicate con quadratus ecubus, mentre il coefficiente B, che ha dimensioni di una superficie, e detto plano eZ, dimensionalmente un volume, e detto solido. L’incognita E viene ora interpretatageometricamente: Dalla formazione dell’equazione si comprende che B piano e il ret-tangolo compreso tra due lati, il minore dei quali e E e la differenza dal maggiore e

Page 140: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

140 CAPITOLO 5. VIETE E DESCARTES

A:7 B2 rappresenta l’area di un rettangolo il cui lato minore e E, mentre A + E e illato maggiore. Si esprime ora A in funzione di E

A =B2 −E2

E

e si sostituisce in (5.6)1 ricavando l’equazione

E6 + 2Z3E3 = B6 (5.8)

che e di sesto grado ma, come dira Lagrange, risolubile alla maniera di quelle di secondogrado: l’equazione (5.8) e nota come risolvente di Viete. Viete considera solo la radicepositiva di (5.8):

E31 =

Z6 +B6 − Z3 =: D3

ed ottiene come prima espressione di A

A =B2 −D2

D

E cosı se A cubo e B piano moltiplicato per 3 sono uguali a 2 per Z solido e√Bplano-plano-plani + Zsolido-solido

solido uguaglia D cubo, alloraBplanum−Dquad

De l’incognita A cercata.8

Ora Viete considera un nuovo cambio di variabile

E2 − EA = B2 (5.9)

da cui segue che A = E2−B2

Ee quindi E obbedisce all’equazione

E6 − 2Z3E3 = B6

la cui radice positiva

E32 =

Z6 +B6 + Z3 =: D2

permette di scrivere

A =D2 −B2

D.

Usando (5.7) e (5.9) si ha

B2 = −E1A− E21 = E2A+ E2

2

da cui si ottiene A = E2 −E1, cioe

A =3

√√

B6 + Z6 + Z3 − 3

√√

B6 + Z6 − Z3

formula che viene cosı espressa da Viete Pertanto

C·√B.pl.pl.pl + Zsol.sol.+ Zsolido−

C·√B.pl.pl.pl + Zsol.sol.− Zsolido

7Unde B planum ex hujusmodi aequationis constitutione, intellegitur rectangulum subduobus lateribus quorum minus est E, differentia a majore A.

8Itaque si A cubus et B plano 3, aequatur Z solido 2, et√Bplano-plano-plani + Zsolido-solido-Z solido, aequetur D cubo, ergo

Bplanum−DquadD

, sitA de qua quaeritur.

Page 141: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.2. IL METODO DI VIETE 141

e l’incognita A cercata.9

Viete opera similmente sull’equazione (5.6)2 per ottenere la soluzione

x =3

√√

c2 − b3 + c+3

c−√

c2 − b3.

In termini moderni, la trasformazione di Viete si puo formulare in questi termini. Siparta dall’equazione

x3 + px+ q = 0

e si sostituisca x = y − p

3yottenendo

y6 + qy3 − p3

27= 0

che si riduce all’equazione di secondo grado in t := y2

t2 + qt− p3

27= 0

risolta da

t = − q2±

q2

4+p3

27.

Sempre nel De emendatione aequationibus Viete presenta anche un metodo dirisoluzione per equazioni di quarto grado che richiede di completare un quadrato. Ecco,in estrema sintesi, i dettagli del metodo seguendo, con piccole varianti, la ricostruzionedi Matthiessen [10].

Viete considera l’equazione

x4 + 2gx2 + bx = c

ed introduce una variabile ausiliaria y formando il quadrato del trinomio x2 + g+ 12y2

(

x2 + g +1

2y2

)2

= x4 + 2gx2 +1

4y4 + y2x2 + gy2

per cui l’equazione di partenza puo essere posta nella forma(

x2 + g +1

2y2

)2

= c+ g2 +1

4y4 + gy2 − bx+ y2x2

e si determina y in modo che il membro di destra si possa riscrivere esso pure comeun quadrato

c+ g2 +1

4y2 + gy2 − bx+ y2x2 =

(b

2y− xy

)2

che si traduce nell’equazione

y6 + 4gy4 + 4(c+ g2)y2 = b2

che e cubica in z = y2. Presa una soluzione y = y1 di questa equazione, risolvere quelladi partenza si riduce alla soluzione dell’equazione di secondo grado

x2 + y1x =b

2y1− g − 1

2y21 .

9Itaque√

C·√B.pl.pl.pl+ Zsol.sol.+ Zsolido−

C·√B.pl.pl.pl+ Zsol.sol.− Zsolido

est A quaesita.

Page 142: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

142 CAPITOLO 5. VIETE E DESCARTES

5.3 Soluzioni trigonometriche di equazioni alge-

briche

Con Viete la trigonometria viene adoperata per risolvere equazioni algebriche, unatecnica che, combinata alla rappresentazione trigonometrica dei numeri complessi, daraaltri frutti. Nel De Recognitione Æquationum (Cap. VI, pp. 90-91) [1]) Viete consideral’equazione ([11], p.94)

x3 + ax+ b = 0

che, posto x = ky e scelto k =√

− 4a3

10 e riducibile all’equazione

4y3 − 3y = c

e siccome la formula di triplicazione fornisce

4 cos3 ϑ− 3 cos ϑ = cos 3ϑ,

se si pone y = cosϑ si vede che l’equazione di terzo grado equivale a

cos 3ϑ = c :

ancora una volta dunque, costruito un triangolo con un angolo pari a 3ϑ = arccos c, latrisezione di quest’angolo e soluzione dell’equazione proposta e, viceversa, risolvendol’equazione si ottiene la trisezione di un angolo. Curiosamente, non si incontranoquantita immaginarie nel caso irriducibile ma nel caso c > 1.

Un altro celebre esempio di uso della trigonometria nella risoluzione di equazionialgebriche in Viete si trova nella soluzione di un problema proposto dal matematicobelga Adriaan van Roomen, (latinizzato in Romanus), professore di matematica aLovanio. Nelle Ideae Mathematicae del 1593, van Roomen propose ai matematici ditutto il mondo la soluzione di un problema all’apparenza formidabile. Egli chiedeva lasoluzione della seguente equazione numerica di 45 grado, scritta qui nella notazionemoderna:

45x− 3795x3 + 95634x5 − 1138500x7 + 7811375x9 − 34512075x11

+105306075x13 − 232676280x15 + 384942375x17 − 488494125x19

+483841800x21 − 378658800x23 + 236030652x25 − 117679100x27

+46955700x29 − 14945040x31 + 3764565x33 − 740259x35 + 111150x37

−12300x39 + 945x41 − 45x43 + x45 = A.

(5.10)

Van Roomen, anche per mostrare di essere in grado di risolvere il problema,proponeva tre esempi in cui assegnava un valore ad A e dichiarava quale fosse lacorrispondente soluzione x

A =

2 +

2 +

2 +√2 x =

√√√√

2−

2 +

2 +

2 +√3,

A =

√√√√√

2 +

√√√√

2−

2−√

2−√

2−√2 x =

√√√√√

2−

√√√√

2 +

2 +

2 +

2 +√2

10Siamo nel casus irreducibilis e dunque a < 0 e k ∈ R.

Page 143: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.3. SOLUZIONI TRIGONOMETRICHE DI EQUAZIONI ALGEBRICHE143

A =

2 +√2 x =

√√√√√2−

√√√√

2 +

3

16+

15

16+

5

8−

5

64:

in quest’ultimo esempio, van Roomen fornisce le approssimazioni di x ed A con unnumero altissimo di cifre decimali. La sfida lanciata da van Roomen era di trovare lasoluzione di (5.10) quando

A =

√√√√7

4−

5

16−

15

8−

45

64. (5.11)

Viete, tra le altre cose, dimostrera che il secondo esempio di van Roomen e errato eva sostituito con

A =

√√√√

2−

2−√

2 +

2 +√2 x =

√√√√√

2−

√√√√

2 +

2 +

2 +

2 +√3.

L’equazione dovette suonare artificiosa a Viete che la ridusse elegantemente ad unproblema di geometria di cui fornı l’equivalente algebrico. La chiave di Viete perrisolvere il problema di van Roomen e: Che cosa dunque chiede ai geometri AndrianoRomano?

Dato un angolo dividerlo in tre parti.

Dato un angolo dividerlo in cinque parti uguali.Che cosa agli analisti?

Data una figura solida ottenuta dal prodotto di un lato e di un coefficiente pianoassegnato, trovare il valore del cubo. Dato un quadrato-cubo combinato aggiungendoun certo piano-solido per un lato ed un assegnato coefficiente piano-piano; trovare ilvalore del piano-solido combinato ad un solido per un coefficiente piano.11 ([2], pp.312-313)

Viete ha riconosciuto [14] che il membro di sinistra dell’equazione di van Roomensi puo leggere come lo sviluppo di 2 sin 45α in termini di 2 sinα e la sua tecnica disoluzione e la seguente: si risolve dapprima l’equazione di terzo grado

3x− x3 = A

dove A e la costante proposta da van Roomen: nel formalismo di Viete questa equa-zione e scritta come 3N − 1C aequatur A. Se x = B e una soluzione Viete procede arisolvere l’equazione

3y − y3 = B

e, detta y = D una sua soluzione egli risolve l’equazione di quinto grado

5z − 5z3 + z5 = D

11Quid igitur quaerit a Geometris Adrianus Romanus?Datum angulum trifariam secare.Datum angulum quintufariam secare.Quid ab analystis?Datum solidum sub latere & dato coefficiente plano adfectum, multa cubi, resolvere. Datum

quadrato-cubum adfectum; adjunctione quidem plano-solidi sub latere & dato coefficienteplano-plano; multa vero plano-solidi sub cubo & coefficiente plano, resolvere.

Page 144: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

144 CAPITOLO 5. VIETE E DESCARTES

ed afferma che le soluzioni z = G di questa equazione sono quelle richieste da vanRoomen. Qual e dunque la ratio dietro il metodo di Viete? Siccome egli ha compresoche A = 2 sin 45α = 2 sin 3(15α) utilizza la formula di triplicazione

3 sin β − sin3 β = sin 3β

e se ne serve per ottenere i valori di B = 2 sin 15α = 2 sin 3(5α). Ora itera la procedurae per ottenere D = 2 sin 5α si serve delle formule di quintuplicazione

5 sin β − 5 sin3 β + sin5 β = 2 sin 5β

per ricavare il valore di sinα, da cui si ottiene la soluzione del problema di van Roomen.Viete inoltre rilancia e, scelto A =

√2 = 2 sin 45 ottiene non solo la soluzione x =

2 sin 1 ma le ventitre soluzioni positive della forma x = 2 sinα, con α = 1 + 8k eα = 3 + 8k. La soluzione con il valore (5.11) proposto da van Roomen corrispondeall’arco di 032′, quarantacinquesima parte di 24 = 60 − 36 che viene a sua voltacostruito per differenza dell’arco sotteso da un esagono regolare con quello sotteso daun decagono regolare.

Le idee che Viete espone risolvendo questo problema per la verita un po’ artifi-ciale sono profonde e daranno frutti nei secoli successivi. Anzitutto Viete ribadisceindirettamente il legame tra equazioni di terzo grado e trisezione dell’angolo; la trigo-nometria viene utilizzata per risolvere un’equazione algebrica; l’equazione di grado 45viene risolta per gradi riducendola alla soluzione di due equazioni di terzo grado e diuna di quinto grado, procedimento che ritroveremo in Lagrange e Gauss.

5.4 Risoluzione numerica delle equazioni alge-

briche in Viete

Viete propose un metodo per la risoluzione numerica delle equazioni algebriche che fuadoperato fin quando venne soppiantato dal metodo di Newton-Raphson. In effettiNewton era a conoscenza del metodo di Viete e lo studio accuratamente come dimo-stra il fatto che in alcuni suoi appunti databili non oltre il 1664 vi sono trascrizionied annotazioni di esempi tratti dal De numerosa potestatum ad exegesin resolutione[12] pubblicato nel 1600 a Parigi e ristampato nelle opere matematiche curate da vanSchooten. Il metodo di Viete era stato esposto sommariamente anche da WilliamOughtred nelle edizioni della Clavis Mathematicarum successive al 1647. Ancora La-grange ne fa un cenno nel Traite sur la resolution des equations numeriques ma soloper ricordarne la complessita. Esponiamo il metodo di Viete seguendo [13] uno deiprimi problemi numerici, il secondo dei venti che compaiono in [12]. Consideriamodunque l’equazione

x3 + 30x = 14356197;

Per seguire il procedimento di Viete, riscriviamo l’equazione proposta nella formap(x) = N . Il primo passo consiste nella scelta della prima approssimazione dellaradice che, ricordiamolo, deve essere positiva. Il numero N non e un cubo di un intero(N 6= x3) ma N e ottenuto aggiungendo 30x ad un cubo. Dunque Viete parte daun intero x0 di cui sia semplice calcolare il cubo e tale che x3

0 < N . La scelta ex0 = 200, cosı x3

0 = 8000000. Ora Viete calcola p(x0) termine a termine ottenendop(x0) = 8006000 e quindi calcola la differenza N − p(x0) = 6350197. Questi passaggisono riportati in un primo schema. Per trovare la seconda approssimazione Viete

Page 145: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.5. LE FORMULE DI VIETE-GIRARD 145

calcola dapprima 3x20 × 10 = 1200000 e 3x0 × 102 = 60000. Lo scopo di questi calcoli

e di trovare rapidamente la correzione x1 da apportare ad x0. Infatti Viete calcolaseparatamente 3x2

0x1, 3x0x21, x

31 e 30x1 con x1 = 10 e la somma di questi risultati

viene sottratta ad N − p(x0). In altre parole, Viete considera l’equazione

p(x0 + x1) = N

che si riduce ap(x1) + 3x2

0x1 + 3x0x21 = N − p(x0).

Nella prima tabella egli calcola solo i termini 3x20x1 e 3x0x

21 che sono i termini do-

minanti e in seguito calcola la summa divisorum, cioe p(x1) + 3x20x1 + 3x0x

21. A mio

parere questo viene fatto per guidare la scelta della cifra successiva perche p(10) +3x2

0 · 10 + 3x0 · 102 = 1261300 e 1261300× 4 < N − p(x0) < 1261300× 5, giustificandocosı la scelta successiva x1 = 40. Ora Viete puo agilmente calcolare per questa sceltadi x1 3x2

0 × 40 = 4800000 e 3x0 × 40 = 24000, 403 = 64000 e 30 × 40 = 1200 otte-nendo p(x1) + 3x2

0x1 + 3x0x21 = 5825200 che, sottratto a N − p(x0) lascia il residuo

524997 = N1. Viete riapplica la procedura prendendo x0 = 240 e calcolando ancora3x2

0 = 3x20 × 1 = 172800 e 3x0 = 720 la cui somma 173550 lascia intravedere 3 come

cifra della correzione successiva: in effetti l’esempio e costruito ad hoc perche 243 ela radice esatta dell’equazione di partenza. Osserviamo che in questo come in altriesempi i coefficienti sono molto asimmetrici: alcuni sono molto piu grandi rispetto adaltri. Si tratta di una scelta dettata a mio parere da ragioni pedagogiche perche Vietevuole trovare rapidamente la prima approssimazione. Qualora non vi sia una prepon-deranza di qualche termine rispetto ad altri, occorre anteporre uno studio preliminaredi separazione delle radici. Come accennato, il metodo di Viete sara soppiantato dalmetodo di Newton, piu rapido e non limitato alle funzioni algebriche. Come osservatoin [14, 13], le somiglianze tra i due metodi ci sono ma mi sembra che la ricostruzionedel metodo di Viete che si effettua in queste opere sia troppo influenzata dal metododi Newton-Raphson che puo appoggiarsi sul calcolo differenziale.

5.5 Le Formule di Viete-Girard

Al Capitolo XIV del De Emendatione compaiono, per le equazioni dal secondo al quintogrado le famose relazioni di Viete-Girard che legano i coefficienti di un’equazione alleradici. Vediamo come vengono enunciati i teoremi relativi alle equazioni di terzo equarto grado, con un formalismo piu vicino al nostro.

Data l’equazione

A3 − (B +D +G)A2 + (BD +BG+DG)A = BDG

l’incognita si ottiene da una delle quantita B, D, G.Data l’equazione

(BDG +BDH +BGH +DGH)A− (BG+BD +BH +DG+DH +GH)A2++(B +D +G+H)A3 − A4 = BDGH,

Allora la radice A si ottiene da una qualsiasi tra le quattro quantita B, D, G, H.12

([7], p. 158)

12SiA3 − (B +D +G)A2 + (BD + BG+DG)A = BDG

Page 146: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

146 CAPITOLO 5. VIETE E DESCARTES

Viete e fiero di questo elegante risultato che corona la stesura del volume:

E questa elegante e silloge di un bellissimo ragionamento, viene posta a suggello efine di un trattato d’altra parte esteso.13 ([7], p. 158)

Alle formule che legano i coefficienti di un’equazione alle radici della stessa vieneassociato il nome di un altro matematico francese, Albert Girard (1595-1632) di confes-sione protestante e per questo costretto a riparare in Olanda dove studio matematicaa Leida. Egli fu il curatore dell’edizione delle opere di Stevino e dall’Arithmetique diquest’ultimo trasse spunto per scrivere nel 1629 la Invention Nouvelle en algebre [8],un agile opuscolo che e molto interessante per la storia dell’algebra. Infatti, vi trovia-mo enunciato senza dimostrazione quello che diverra noto come teorema fondamentaledell’algebra, insieme al teorema che lega radici e coefficienti di un’equazione:

Ogni equazione algebrica ha tante soluzioni quanto mostrato dalla denominazionedella piu alta quantita presente, salvo le equazioni incomplete: e la prima factiondelle soluzioni coincide al valore del termine che segue immediatamente il massimo, laseconda faction, il coefficiente successivo, la terza il successivo e cosı via fino all’ultimafaction che e uguale all’ultimo coefficiente, con segni che si possono evidenziare inordine alterno.14 ([8])

Rimando al capitolo 6 per il commento circa il teorema fondamentale dell’algebrae mi limito ad osservare che possiamo rendere il termine faction con con combinazionedi prodotti. La prima faction di un insieme di n numeri e per Girard la loro somma;la seconda e la somma dei prodotti a due a due; la terza e la somma di tutti i prodottia tre a tre e cosı via fino all’ultima che e il prodotto di tutti gli n numeri. NellaDefinizione XII, Girard introduce il triangolo di estrazione (triangle d’extraction), cioeil triangolo di Pascal, grazie al quale enuncia il Teorema I

Assegnata una moltitudine di numeri, la moltitudine dei prodotti di ogni faction sipuo esprimere grazie al triangolo di estrazione: e tramite il suo rango, a seconda dellamoltitudine di numeri15 [8]

La successiva spiegazione (Explication) chiarisce il senso del teorema:

Vi siano quattro numeri, occorrera prendere il rango dei (4) nel triangolo di estra-zione, che e 1, 4, 6, 4, 1: il primo 1 significa l’unita della massima; il 4 la prima factionche e somma di quattro numeri; il 6 significa che la seconda faction e composta da 6prodotti a due a due; e cosı di seguito.16. [8])

A explicabilis est de qualibet illarum trium B, D, G.Si

(BDG +BDH + BGH +DGH)A− (BG +BD + BH +DG+DH +GH)A2++(B +D +G+H)A3 − A4 = BDGH,

A explicabilis est de qualibet illarum quatuor B, D, G, H.13Atque haec elegans et perpulchrae speculationis sylloge, tractatui alioquin effuso, finem

aliquem et coronida tamen imponito.14Toutes les equations d’algebre recoivent autant de solutions, que la denomination de la

plus haute quantite le demonstre, excepte les incomplettes: & la premiere faction des solutionsest esgale au nombre du premier mesle, la seconde faction de mesmes, est esgale au nombredu deuxiesme mesle; la troisieme, au troisieme, & tousjours ainsi, tellement que la dernierefaction est esgale a la fermeteure, & ce selon les signes qui se peuvent remarquer en l’ordrealternatif.

15Si une multitude de nombres sont proposez, la multitude des produits de chacune factionse peut exprimer par le triangle d’extraction: & par le rang d’iceluy selon la multitude desnombres.

16Soyent 4 nombres, il faudra prendre le rang des (4) au triangle d’extraction, qui est 1, 4,6, 4, 1: le premier 1 signifie l’unite de la maxime; le 4 la premiere faction qui est la somme

Page 147: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.5. LE FORMULE DI VIETE-GIRARD 147

Dunque, i coefficienti del triangolo di Pascal esprimono il numero di addendi cheformano le varie factions.

Osserviamo che, per essere certi di leggere le somme dei prodotti delle radici presea k a k dai coefficienti dell’equazione, Girard la dispone en ordre alterne per cuiun’equazione come x4 = 4x3 − 6x2 + 4x− 1 viene riscritta come

x4 + 6x2 + 1 = 4x3 + 4x

per cui le factions sono, nell’ordine, 4, 6, 4, 1 che si ottengono dall’unica radice x = 1dell’equazione, di molteplicita 4.

Girard poi giunge in modo abbastanza curioso ad enunciare prima di Newton icosiddetti teoremi newtoniani che esprimono la somma delle potenze delle radici diun’equazione:

Potrebbe sembrare a qualcuno che le factions possano essere espresse altrimentirispetto a quanto fatto sopra come se, al posto di dire: la somma, i prodotti a due adue; i prodotti a tre a tre, &. si potese dire: la somma: la somma dei quadrati: lasomma dei cubi, &c., cosa che non sussiste perche, quando vi sono piu soluzioni, lasomma stara per il termine successivo a quello di grado massimo, a somma dei prodottia due a due per quello successivo, &c. come e gia stato spiegato a sufficienza; ma none cosı delle potenze, come si potrebbe obiettare. 17 ([8])

Girard non dimostra il teorema ma osserva che, dette xk, (k = 1, ..., n) le radicidell’equazione

xn +Bxn−2 + .... = Axn−1 + Cxn−3 + ....,

si ha∑xk = A

∑x2k = A2 −B ∑

x3k = A3 − 3AB + 3C

∑x4k = A4 − 4A2B + 4AC +B2 − 4D.

Girard opera un passo in avanti rispetto a Viete quando considera liberamente radicipositive (plus que rien), negative (moins que rien) od immaginarie (envelopees). Misembra interessante la giustificazione geometrica dei numeri negativi che viene effettua-ta in un problema (Probleme d’Inclinaison) che e un esempio di geometria analitica(ricordiamo che la Geometrie di Cartesio sara pubblicata nel 1637, mentre Girardpubblico nel 1629).

Finora non abbiamo ancora spiegato a cosa servano le soluzioni negative, quandove ne siano. La soluzione negativa si spiega in Geometria procedendo all’indietro, edil segno meno indietreggia, laddove il segno + avanza.18 ([8])

E l’idea di verso di percorrenza di un segmento che conferisce ai numeri negativiquella cittadinanza nella geometria, a lungo negata. Il problema formulato e risoltoda Girard si riassume nella Figura 5.1: Dato un punto A posto sulla bisettrice delprimo e terzo quadrante in modo che AF = AB = 4. Il problema posto da Girard e di

des 4 nombres; le 6 signifie que la deuxiesme faction est composee de 6 produits deux a deux;& ainsi du reste

17Il pourroit sembler a quelqu’un que les factions seroyent encor expliquables autrement deque dessus, comme au lieu de dire, la somme: le produits a deux a deux; les produits de trois atrois, &c. qu’on pourroit dire & plus simplement: La somme: la somme des quarez: la sommedes Cubes, &c. ce qui n’est pas ainsi, car soyent plusieurs solutions, la somme sera pour lepremier mesle, la somme des produits deux a deux pour le second mesle, &c. comme il a estesuffisamment explique; mais il n’en est pas ainsi des puissances comme on pourroit objecter.

18Iusques icy nous n’avons encor explique a quoy servent les solutions par moins, quand ily en a. La solution par moins s’explique en Geometrie en retrogradant, & le moins recule, laou le + avance.

Page 148: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

148 CAPITOLO 5. VIETE E DESCARTES

OC

H

A

BK

F

N

D

G

L

Figura 5.1: Il problema di inclinazione che conduce ad un’equazione di quar-to grado con radici negative che Girard interpreta geometricamente ricorrendoall’idea di segmento orientato.

tracciare la retta per A in modo che la sua intercetta (cioe il segmento CN compresotra gli assi ortogonali DH e CL) abbia lunghezza

√153. Posto FN = x, Girard nota

laconicamente che si avra

x4 = 8x3 + 121x2 + 128x− 256. (5.12)

Infatti, dal triangolo rettangolo AFN abbiamo AN2 = 16 + x2 ed inoltre, dallasimilitudine tra i triangoli ANF ed ONC abbiamo

AN√153

=|x||4− x| ,

per cui elevando al quadrato e semplificando, si risale all’equazione (5.12) di cui eglielenca le quattro soluzioni affiancando il significato geometrico: x = 1 corrisponde ad

FN , x = 16 corrisponde ad FD, x = − 92+

√174

che indica il punto G dal punto F

ed x = − 92−

√174

che indica il punto H dal punto F . Ecco la chiara esposizione di

Girard: Queste soluzioni mostano i punti G ed H, come se le distanze FG , FH fosseromeno di nulla, presi FN ed FD che crescono mentre FG, FH retrocedono finche leintercette CN, DP, GL, HK, tendono ad inclinarsi a partire da A, facendo ciascuna√153, secondo le regole qui stabilite. E per interpretarle ancora meglio, le due soluzioni

Page 149: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.6. L’ALGEBRA IN CARTESIO 149

che sono minori di 0 si debbono scambiare, a seconda dei segni.

si otterra

4 12−√4 1

4per FG

4 12+√4 14

per FH

che vanno contate in verso opposto a quello di FN, FD, come mostra la figura pre-cedente: & dunque si dovranno intendere cosı tutte le soluzioni negative, che e unosservazione con conseguenze in geometria, sconosciute sinora. 19 ([6])

Questo esempio non compare nella Geometrie di Cartesio ma e invece ben presentea Frans van Schooten che lo riporta nei suoi Commentarii alla Geometrie cambiandosolo i dati numerici e disponendo le lettere in modo differente. L’interpretazione dellequantita geometriche offerta da van Schooten [9] non si discosta da quella proposta daGirard.

5.6 L’algebra in Cartesio

La modifica del linguaggio algebrico iniziata da Viete venne proseguita da Rene De-scartes (Cartesio) nella Geometrie il cui III libro e dedicato ai problemi solidi o piuche solidi, cioe esprimibili tramite equazioni di grado superiore al terzo.

Abbiamo gia visto nel capitolo 2 un esempio di problema piano per la soluzionedelle equazioni di secondo grado. In questa sezione ci concentriamo sulla risoluzionecartesiana dei problemi di terzo e quarto grado per passare nella sezione seguentea considerare lo sviluppo storico della regola dei segni che consente di ottenere unlimite superiore al numero di soluzioni positive di un’equazione algebrica. Quantoall’equazione di terzo grado, Cartesio anzitutto ne consiglia la preparazione eliminando,tramite opportune trasformazioni, i coefficienti da razionali in interi e, laddove fosserichiesto, di eliminare il piu possibile i coefficienti irrazionali. Il passo successivo e ilcontrollo della eventuale presenza di radici razionali a partire dall’esame dei divisoridel termine noto, secondo la regola che era stata enunciata per la prima volta dalmatematico e poeta francese Jacques Peletier (1517-1582). Quando questo fosse ilcaso, nota Cartesio, il problema si abbassa immediatamente di grado e dunque nonoffre alcuna difficolta. Osserviamo che Cartesio aveva enunciato il teorema

E evidente da quanto precede che la somma di un’equazione avente piu radici esempre divisibile per un binomio formato dall’incognita diminuita del valore di unaradice vera od aumentata del valore di una delle radici false. In questo modo, il gradodi un’equazione puo essere abbassato. ([15], p. 159)

Soffermiamoci su alcuni punti di questo passo, utili ad interpretare alcune ideedi Cartesio. Anzitutto, quando Cartesio parla di somma di un’equazione intende il

19Assavoir monstrant lesdits points G & H, comme si les distances FG, FH estoyent moinsque rien, en retrogradant, prenant que FN, FD avancent, & FG, FH reculent en arriere,tellement donc que les interceptes CN, DP, GL, HK, tendent & s’enclinent au point A faisantchacune

√153, selon le requis.

Et pour l’interpreter encor mieux, les deux solutions qui sont moins que 0, se doiventchanger, assavoir les signes.

viendra

4 12−

√4 14

pour FG

4 12+

√4 14

pour FH

Lesquels il faut poser au contraire de FN, FD, comme il est exprime en la figure precedente:& ainsi le faudra-il entendre de toutes solutions par moins, qui est une chose de consequenceen Geometrie, incogneue auparavant.

Page 150: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

150 CAPITOLO 5. VIETE E DESCARTES

polinomio p(x) le cui radici sono soluzioni di p(x) = 0. Il binomio divisore di p(x)viene presentato in due modi differenti a seconda che si consideri una radice vera ofalsa. Per Cartesio le radici vere sono le positive metre le false sono le negative. Oggiil teorema (detto talora di Cartesio-Ruffini) si enuncia dicendo che x = x0 e unaradice di p(x) = 0 se e solo se x − x0 divide p(x). Poiche in Cartesio le difficoltadi fronte a quantita negative non sono del tutto scomparse, egli enuncia il teoremausando il binomio x − x0, se x0 > 0, ed il binomio x + x0, quando x0 < 0. NelCapitolo 6 vedremo come Cartesio enunci il teorema fondamentale dell’algebra conuna formulazione cautelativa.

La costruzione geometrica dell’equazione di quarto grado proposta da Cartesio,oltre all’impiego di coniche diverse dalla circonferenza, si caratterizza per essere unarisoluzione grafica dell’equazione, a differenza delle costruzioni in superficie piana pro-poste da Bombelli che, salvo in alcuni casi [5], non consentono di costruire graficamentela soluzione. Cartesio tratta l’equazione

x4 = px2 − qx+ r (5.13)

e gli ingredienti della sua costruzione geometrica si possono riassumere schematica-mente come segue (Fig. 5.2):

AS

RE

M GKV

D

C

LF

H

b

Figura 5.2: Costruzione geometrica dell’equazione di quarto grado x4 = px2 −qx+ r tramite l’intersezione di una circonferenza ed una parabola.

Page 151: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.6. L’ALGEBRA IN CARTESIO 151

1. Tracciare una parabola di latus rectum20 pari ad 1; Questo equivale a dire cheil segmento AC = 1

2se A e C sono vertice e fuoco della parabola. Si riporti

sull’asse della parabola CD = p

2e, ortogonalmente all’asse, il segmento DE = q

2.

Sul segmento AE si riporti il punto R tale che AR = r e, sul prolungamento diAR dalla parte opposta ad A si consideri il punto S tale che AS = 1, cioe lungoquanto il latus rectum della parabola.

2. Con centro nel punto medio V di RS, si tracci la semicirconferenza di diametroRS.

3. Si tracci la perpendicolare in A ad RS e sia H il punto di intersezione con lasemicirconferenza appena tracciata: si ha

AH2 = AS × AR = AR. (5.14)

4. Con centro in E, si tracci la circonferenza di raggio EH che interseca la parabolanei punti F e G.

5. Ora, la circonferenza FG puo tagliare, o essere tangente alla parabola in 1, 2,3, o 4 punti tracciando dai quali le perpendicolari all’asse, si ottengono tuttele radici dell’equazione, tanto le vere che le false. Se la quantita q e positivale radici vere saranno quelle perpendicolari che, come FL, stanno dalla stessaparte della parabola in cui si trova E, centro del cerchio; mentre le altre, comeKG, saranno le radici false. D’altra parte, se q e negativa, le radici vere sonoquelle che si trovano dalla parte opposta [rispetto ad E] e quelle false o negativesaranno quelle dalla stessa parte di E, centro del cerchio. Se il cerchio non toccala parabola in alcun punto, e segno che l’equazione non ha ne una radice verane una falsa ma che tutte le radici sono immaginarie. ([15], p.200)

Vediamo in questo passo la stessa interpretazione delle soluzioni negative data daGirard nel problema di inclinazione.

Posto GK = x si ha AK = x2, visto che la parabola ha latus rectum unitario. Peril punto 1 della costruzione si ha

DK = EM = AC + CD − AK =1

2+p

2− x2

e dunque

EM2 = DK2 =

(

x2 − 1

2− p

2

)2

= x4 − px2 − x2 +1

4p2 +

p

2+

1

4. (5.15)

D’altra parte DE = MK = q

2per costruzione e dunque GM = x+ 1

2q, da cui segue

GM2 = x2 + qx+1

4q2 (5.16)

che, sommata a (5.15), fornisce

EG2 = GM2 + EM2 = x4 − px2 + qx+1

4q2 +

1

4p2 +

1

2p+

1

4. (5.17)

20il latus rectum rappresenta la distanza del fuoco dalla direttrice della parabola e coincidecon il parametro introdotto nel capitolo ??

Page 152: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

152 CAPITOLO 5. VIETE E DESCARTES

D’altra parte si puo esprimere EH = GE in un altro modo. Infatti sappiamo cheED = 1

2q ed AD = 1

2p+ 1

2per cui nel triangolo rettangolo ADE si ha

AE =

1

4q2 +

1

4p2 +

1

2p+

1

4;

inoltre, per (5.14) si ha AH =√r ed essendo anche il triangolo EAH rettangolo si ha

EH2 = EG2 = AH2 + AE2 =1

4q2 +

1

4p2 +

1

2p+

1

4+ r

che, uguagliata a (5.17) riproduce esattamente (5.13). A patto di saper tracciare laparabola usata da Cartesio, il metodo esposto consente di determinare graficamentele radici reali di (5.13).

Quando r = 0, la circonferenza di centro E e raggio EH passa per il vertice dellaparabola ed infatti l’equazione di quarto grado ammette la radice x = 0 e si puoimmediatamente ridurre al terzo.

Cartesio e anche ricordato per avere proposto un metodo alternativo di soluzionedelle equazioni di quarto grado che consente di ottenere una risolvente di sesto gradomancante dei termini di grado dispari e dunque in tutto equivalente ad un’equazionedi terzo grado. L’idea del metodo e presentata nella Geometrie ([15], pp. 180-188) ela risolvente di Cartesio si ottiene dalla condizione di scomponibilita del polinomio dipartenza nel prodotto di due equazioni di secondo grado. Cartesio si limita a dare laregola in questi termini

Invece di

x4 ± px2 ± qx± r = 0

si scriva

y6 ± 2py4 + (p2 ± 4r)y2 − q2 = 0

(· · · ) Trovato il valore di y2, possiamo servircene per separare l’equazione preceden-te in due altre, ciascuna di secondo grado, le cui radici saranno le stesse di quelledell’equazione originale. Invece di x4 ± px2 ± qx± r = 0, si scrivano le due equazioni

x2 − yx+1

2y2 ± 1

2p± q

2y= 0

e

x2 + yx+1

2y2 ± 1

2p∓ q

2y= 0.

Una prima dimostrazione del metodo di Cartesio si trova nelle note di Florimonde deBeaune alla prima edizione latina della Geometrie, curata da Frans van Schooten. DeBeaune, prendendo l’equazione di quarto grado nella forma

x4 + px2 + qx+ r = 0 (5.18)

considera la seconda equazione proposta da Cartesio

x2 + yx+1

2y2 +

1

2p− q

2y= 0.

e, riscrittala nella forma

x2 +1

2y2 +

1

2p =

q

2y− yx,

Page 153: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.7. STORIA DELLA REGOLA DEI SEGNI DI CARTESIO 153

eleva al quadrato ambo i membri ottenendo

x4 +1

4y4 + px2 +

1

2py2 +

1

4p2 + qx− q2

4y2= 0

da cui sottrae la (5.18) ricavando

1

4y4 +

1

2py2 +

1

4p2 − q2

4y2− r = 0

che, moltiplicata per 4y2, riproduce la risolvente di Cartesio

y6 + 2py4 + (p2 − 4r)y2 − q2 = 0 . (5.19)

Dal canto suo, van Schooten nel commento ricostruisce il metodo di Cartesio nelmodo che sara riprodotto nei testi successivi. van Schooten confronta (5.18) con ilprodotto di due equazioni di secondo grado

x2 + yx+ z = 0 x2 − yx+ v = 0

in cui y, z e v sono incogniti. Eseguendo il prodotto ed uguagliando i singoli coefficientia quelli di (5.18) si ottiene il sistema

z − y2 + v = p(v − z)y = qvz = r :

(5.20)

dalle prime due equazioni si ottiene

z =1

2y2 +

p

2− q

2ye v =

1

2y2 +

p

2+

q

2y

che, poste in (5.20)3, ridanno la risolvente di Cartesio (5.19).

5.7 Storia della regola dei segni di Cartesio

La regola dei segni enunciata da Cartesio nel III libro della Geometrie rappresentail primo tentativo sistematico di localizzare il numero di radici appartenenti ad unintervallo (a, b), precisamente all’intervallo (0,∞)—radici positive—ed all’intervallo(−∞, 0)—radici negative. In questa sezione, sulla scorta di [16], esamineremo le tap-pe principali della storia di questa regola dall’enunciato, nel 1637, per giungere alladimostrazione rigorosa data da Carl Friedrich Gauss nel 1828.

Nelle prime pagine del Libro III, Cartesio enuncia la regola dei segni in questitermini: ricordiamo che per Cartesio le radici positive sono dette vere, quelle negativefalse.

Possiamo anche stabilire il numero di radici vere e false di ogni equazione in questomodo: Un’equazione puo avere tante radici vere quanti cambiamenti di segno essacontiene da + a − o da − a +; e tante radici false quante sono le volte in cui sitrovano due segni + o due segni −. ([15], p. 160)

Come esempio, Cartesio considera l’equazione completa

x4 − 4x3 − 19x2 + 106x − 120 = 0

Page 154: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

154 CAPITOLO 5. VIETE E DESCARTES

per concludere che, essendoci tre cambiamenti di segno, sappiamo che ci sono tre radicivere mentre vi e un’unica radice falsa, dal momento che vi e una sola permanenzadi segno. Cartesio ha ben presente come sia possibile trasformare un’equazione inun’altra che ha radici di segno opposto rispetto a quello delle radici di partenza:occorre cambiare di segno a tutti i termini di esponente dispari, lasciando inalterati itermini di esponente pari ovvero, diremmo oggi, trasformare 7→ −x.

Cartesio non fornisce alcuna dimostrazione della regola dei segni ed un primo pro-blema che sorse tra i matematici nel verificarne la correttezza fu quello di circoscriverela portata della regola. Per prima cosa Cartesio formula la regola in modo che il nu-mero di variazioni o di permanenze indichino un limite superiore al numero di radicipositive o negative, rispettivamente: un’equazione puo avere tante radici quante sonole variazioni, ha appena detto Cartesio. Questi limiti superiori sono raggiunti a pattoche tutte le radici dell’equazione proposta siano reali. Inoltre, nel caso delle radicinegative, la regola e corretta solo se l’equazione proposta e completa.

L’ambiguita nascosta nella presentazione della regola fu ben presto notata e fornıl’occasione per una serie di attacchi rivolti a Cartesio da parte di qualche avversario.Il primo a confutarne la generalita fu Gilles Personne de Roberval (1602-1675) chefece conoscere il suo parere a Cartesio attraverso una lettera spedita per il tramite diPierre de Carcavi (1600-1684) il 9 luglio 1649: A pag. 373 voi (Cartesio) dite che visono tante radici vere quante volte i segni + e − si trovano cambiati in un’equazione,&c. Vi e dimostrazione del contrario in una infinita di casi. ([16], p.338)

Un mese piu tardi, il 17 agosto 1649, Cartesio risponde a Carcavi in termini fermi

La sua (di Roberval) seconda obiezione e manifestamente falsa perche io non homai detto a p. 373 quello che egli vuole che io abbia detto, che vi sono altrettanteradici vere quanti sono i cambiamenti di segno + e − che si trovano, ne ho alcunaintenzione di sostenerlo, ed ho espressamente dimostrato a pagina 380 quando succedeche non ve ne sono in questo numero, cioe quando vi sono delle radici vere positive.([16], p.338)

Cartesio si riferisce all’esempio dell’equazione x3−6x2+13x−10 = 0 che ha una solaradice positiva a fronte delle tre variazioni presenti. In questo punto, Cartesio avevaosservato: Ne le radici vere ne quelle false sono sempre reali; talora sono immaginarie([15], p.175), il che indica come egli considerasse escluse dal conteggio delle radicipositive quelle immaginarie di cui pero opera la distinzione tra vere e false, mostrandoquanto poco chiare fossero le idee sui numeri immaginari. Nonostante questo, Robervalinsistette ancora a presentare i suoi controesempi da cui emerge con chiarezza che egli,al contrario, distingueva tra radici immaginarie positive e negative. Resta il fatto chela mancanza di chiarezza sui numeri immaginari contribuı a creare della confusione.

Un primo sforzo chiarificatore fu operato da van Schooten che dedico ampio spazioalla regola dei segni nei suoi Commentarii alla Geometrie. Qui egli osservo che l’ugua-glianza tra numero di variazioni e radici positive un lato e numero di permanenze eradici negative dall’altro si ha solo quando tutte le radici sono reali (aequationes quaeproducuntur ex suis radicibus) ed afferma che cio non accade quando l’equazione ha ra-dici immaginarie. van Schooten si occupa anche del problema delle equazioni difettive,in cui mancano alcuni termini, attraverso alcuni esempi. Riferendosi all’equazione

x3 + px− q = 0 p, q > 0

van Schooten la riscrive in due modi diversi

x3 + 0x2 + px− q = 0 e x3 − 0x2 + px− q = 0

Page 155: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.7. STORIA DELLA REGOLA DEI SEGNI DI CARTESIO 155

Nel primo caso, l’equazione cosı completata ha due permanenze ed una variazione percui si potrebbe concludere per l’esistenza di due radici negative (false) ed una positiva(vera); nel secondo caso invece vi sono solo variazioni e dunque tre radici positive.Poiche solo una variazione e stabile nel passaggio da un’equazione all’altra, van Schoo-ten conclude che vi e una sola radice positiva mentre le altre sono immaginarie dalmomento che assumerle positive o negative porta ad un diverso conteggio a secondache si consideri +0x2 o −0x2. Al contrario, quando si considera l’equazione

x3 − px+ q = 0 p, q > 0

e si riscrive, come prima,

x3 + 0x2 − px+ q = 0 e x3 − 0x2 − px+ q = 0

siccome si hanno sempre due variazioni ed una permanenza, si conclude che l’equazioneproposta ha tre radici reali, due positive ed una negativa [9]. Implicitamente vanSchooten invoca una continuita delle radici dell’equazione contando le variazioni dix3 + εx2 − px+ q = 0 quando |ε| ≪ 1 ed ε assume segni opposti.

Gli sforzi di van Schooten non furono sufficienti a fermare le obiezioni anche perchei suoi esempi erano lungi dal fornire una solida dimostrazione. Ed ecco che nel 1684Michel Rolle avanza dubbi sulla generalita della regola proponendo esempi in cui essasembra cadere in difetto: sembra, perche ancora una volta gli esempi addotti hannoradici immaginarie per i quali era da attendersi che la regola non fosse conclusiva.Dietro le quinte, a generare l’equivoco sembra ancora esserci il malinteso sulle radiciimmaginarie vere o false, cioe presunte positive o negative.

Non fu pero solo la validita o la generalita della regola dei segni ad essere messain discussione ma anche l’attribuzione a Cartesio che si trovo ad affrontare l’accusadi aver copiato la regola dalla Artis analyticae praxis di Thomas Harriot (1560-1621),pubblicata postuma a Londra nel 1631 e dunque prima della Geometrie. A sollevarequesto dubbio fu William Cavendish (1603-1683) che espresse la sua opinione a Rober-val durante un viaggio a Parigi, presumibilmente attorno al 1648. Roberval, nemicodi Cartesio, sposo subito la causa e fece circolare l’accusa di plagio in un trattatellodi algebra anonimo. Carcavi ne informo Cartesio che, forse risentito, tronco ogni cor-rispondenza con quest’ultimo. Va peraltro aggiunto [16] che Cartesio aveva scritto adHuygens nel 1638, quindi dieci anni prima delle accuse di Roberval, di avere ricevutosolo da alcuni mesi il volume di Harriot. Le accuse di plagio vennero ripresentate daJohn Wallis, nel Treatise of Algebra both historical and practical del 1685. Tuttavia inalcune lettere Wallis sembra contraddirsi, affermando ora con nettezza la paternita diHarriot sulla regola dei segni, ora riconoscendo di non averla trovata negli scritti diHarriot. Chi contribuı molto a sottolineare i meriti di Harriot fu Leibniz che giunsead affermare come gran parte della Geometria di Rene Descartes....fosse desunta dal-l’Analisi di Thomas Harriot21 generando un equivoco che si sarebbe protratto ancorafino al XIX secolo. Va detto che l’analisi dei testi pubblicati e manoscritti di Harriotha escluso che egli abbia formulato la regola dei segni in generale ma che, piuttosto,egli avesse elaborato dei criteri per riconoscere la natura delle soluzioni di equazionidi terzo grado e di alcune equazioni di quarto grado.

Wallis ebbe pero il merito di richiamare il fatto che la regola dei segni, anchese formulata per le equazioni prive di radici immaginarie, mancava di una adeguatadimostrazione: sed demonstratione indiget. Leibniz poi, in una lettera indirizzata a

21magnam partem Geometriae Renati Cartesii ex Thomae Harioti Analysi ...fuisse desuntam

Page 156: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

156 CAPITOLO 5. VIETE E DESCARTES

Jacob Hermann (1678-1733) il 18 gennaio 1707 fa una osservazione cruciale che e allabase delle dimostrazioni della regola affermando che questa dimostrazione si otterrebbecol dimostrare la seguente proposizione: se un’equazione viene moltiplicata per unaradice vera (falsa), il numero di permutazioni (permanenze) si accresce di una unita.

Trovata la chiave della dimostrazione occorreva superare gli inevitabili ostacoli tec-nici. Vi sono state due strategie dimostrative, una algebrica, l’altra analitica. Inoltre,alcune dimostrazioni vogliono ottenere la regola dei segni nel caso in cui l’equazionealgebrica ha tutte le radici reali e dunque il numero di variazioni fornisce esattamenteil numero di radici positive; altre si pongono nel contesto piu generale, in cui non siesclude la presenza di radici immaginarie e dove il numero di variazioni rappresentaun limite superiore al numero di radici positive. La prima dimostrazione corretta nel-l’impianto ma lacunosa nella giustificazione di alcuni risultati cruciali fu proposta nel1728 nella tesi di laurea di Joannes Andreas Segner (1704-1779) e fu seguita l’annosuccessivo da quella del matematico britannico George Campbell (1705-1766) in unopuscolo dal titolo A Demonstration of the Cartesian Rule for Determining the numberof Positive and Negative Roots in any adfected Equation che si segnala anzitutto perun uso difforme dal consueto del concetto di variazione e permanenza. Per Campbelluna variazione di segni e costituita da

tutti i termini contigui positivi insieme al primo termine negativo immediata-mente seguente; o tutti i termini contigui negativi insieme al primo termine positivoimmediatamente seguente.22 .

Per esprimere questi concetti Campbell rappresenta una variazione in una di questeforme

−∆xm+Axm−1 +Bxm−2 + Cxm−3 + · · ·+ Lxn −Mxn−1 (5.21)

oppure

+∆xm−Axm−1 −Bxm−2 − Cxm−3 − · · · − Lxn +Mxn−1

dove la parentesi indica che ∓∆xm non contribuisce alla variazione. A questa defi-nizione segue l’enunciato del seguente Lemma che poggia su un risultato mostrato daCampbell l’anno precedente:

In ogni equazione non pura, priva di radici immaginarie, il quadrato di ogni coef-ficiente e sempre maggiore del rettangolo compreso tra i coefficienti adiacenti.23.

In altri termini, a2i > ai−1ai+1 se tutte le soluzioni di xn + a1xn−1 + · · ·+ an = 0

sono reali. Questo risultato e al centro del Teorema principale nel lavoro di CampbellSe si moltiplica una certa equazione avente tutte le radici reali, per un’equazione

semplice dotata di una radice reale e positiva ottenendo in questo modo un’altra equa-zione; allora ogni variazione di segno nell’equazione assegnata (a parte l’ultima) neprodurra solo una nell’equazione prodotto; ma l’ultima variazione di segni (nell’equa-zione proposta) unitamente ai termini che la seguono (se ve ne sono) produrra duevariazioni di segno nell’equazione prodotto.24

22all the contiguous positive terms together with the immediately following negative term;or, all the contiguous negative terms together with the immediately following positive term

23In every adfected equation, none of whose roots are imaginary, the square of any coefficientis always greater than the rectangle under the adjacient coefficients

24If any proposed equation, all whose roots are real, be multiply’d by a simple equation thathath a real and positive root, and by these means another equation be produced; then eachvariation of signs in the proposed equation (except the last one) will by this multiplicationproduce only one in the product equation; but the last variation of signs (in the proposedequation) together with the terms following it (if there be any) will by this multiplicationproduce two variations of signs in the product equation.

Page 157: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.7. STORIA DELLA REGOLA DEI SEGNI DI CARTESIO 157

Si parta allora dalla (5.21) e la si moltiplichi per x− a, con a > 0 ottenendo

−∆xm+1 + (A+∆a)xm + (B − Aa)xm−1 + (C −Ba)xm−2 + · · · − (M + La)xn :

ora, o tutti i coefficienti successivi a (A+∆a)xm sono positivi, oppure sia, ad esempio,(C − Ba) il primo coefficiente negativo, per cui Ba > C. Grazie al lemma, si haC2 > BD e dunque aBC2 > BCD, da cui segue Ca > D cosicche anche D − Cae negativo. Iterando la procedura sui singoli coefficienti, Campbell puo concludereche nei termini considerati dell’equazione prodotto vi e un’unica variazione. Graziea questo Campbell dimostra alcuni risultati che si riferiscono ad equazioni completea radici reali: 1) Se un’equazione a termini positivi viene moltiplicata per x − a, ilprodotto presenta un’unica variazione; 2) Nel prodotto di un’equazione con terminidi segno qualsiasi per x − a si ottiene un’equazione con una variazione in piu; 3) seun’equazione viene moltiplicata per un’altra, il prodotto ha tante variazioni in piudella prima equazione quante sono le radici positive della seconda. In conclusione,Campbell mostra che

In ogni equazione non pura avente solo radici reali vi sono tante variazioni di segnoquante sono le radici positive. Quindi, viceversa,... vi sono tante radici positive quantesono le variazioni di segno.25

Alla dimostrazione di Campbell si rifece l’abate Jean Paul De Gua De Malves(1712 ca.-1783) che propose due distinte dimostrazioni della regola dei segni in unamemoria apparsa nel 1741. Senza entrare nei dettagli osserviamo, sulla scorta di [16],alcuni aspetti importanti del lavoro di De Gua: egli fu il primo a proporre i significatidi permanenza e variazione come sono usati ancor oggi; fu il primo a proporre unadimostrazione analitica della regola con la quale affronto, anche qui per primo, il casogenerale in cui possono esservi radici immaginarie. Il punto cruciale nelle dimostrazionianalitiche (dopo quella di De Gua, ne seguirono altre, dovute ad Abraham GotthelfKastner (1710-1800) nel 1745 ed a Franz Ulrich T. Aepinus (1724-1802) nel 1758e chiarire il legame tra i segni delle radici di un’equazione e quelli della derivatadell’equazione, rapporto che e vitale anche per il metodo di risoluzione numerica diRolle. Daremo un esempio dettagliato di dimostrazione analitica tra poco, parlandodi Paolo Ruffini (1765-1822). Nel 1756, Segner propose una nuova dimostrazionealgebrica della regola di Cartesio piuttosto elementare. Quando si considera il prodottodi

xm + a1xm−1 + a2x

m−2 − a3xm−3 · · · − am−1x+ am

con una radice negativa, cioe con il binomio x + a, l’operazione puo essere riportatanello schema seguente

xm +a1xm−1 +a2x

m−2 −a3xm−3 · · · −am−1x +amx +a

− − − − − − − − −A xm+1 +a1x

m +a2xm−1 −a3xm−2 · · · −am−1x

2 +amxB axm +aa1x

m−1 +aa2xm−2 − · · · · · · −aam−1x +aam

Ora, i termini che formano la serie A hanno tutti lo stesso segno di quelli dell’equazionedata mentre ogni termine appartenente alla serie B ha lo stesso segno di quello chelo precede (che ha esponente maggiore di un’unita) nella serie A. Volendo analizzare

25In every adfected equation, all whose roots are real, there are just as many variationsof signs, as there are positive roots. Therefore, viceversa,... there are just as many positiveroots, as there are variations of signs.

Page 158: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

158 CAPITOLO 5. VIETE E DESCARTES

l’andamento dei segni dell’equazione prodotto si osserva allora che si parte con lasuccessione di segni di A finche, da un certo punto, la serie B e in grado di imporreil proprio segno su cui si continua fino eventualmente a tornare ai segni di A e cosıvia fino comunque a concludere con il segno dell’ultimo termine della serie B, datoche la serie A non possiede termine di grado zero. In definitiva, il numero di voltein cui si passa dalla serie dei segni di A a quella di B supera di una unita il numerodi volte in cui si torna da B ad A. Esaminando la natura dei casi per i quali si hapassaggio da una serie all’altra di segni, Segner puo mostrare che: 1) il prodotto di unaqualunque equazione a coefficienti reali per x + a (per una radice negativa) presentaalmeno una permanenza in piu rispetto all’equazione di partenza; 2) il prodotto di unaqualunque equazione a coefficienti reali per x − a (per una radice positiva) presentaalmeno una variazione in piu rispetto all’equazione di partenza. Poiche dunque lamoltiplicazione di un’equazione per x + a introduce una radice reale negativa nelprodotto ed almeno una permanenza, ne consegue che il numero di permanenze inun’equazione algebrica non puo essere minore delle sue radici reali negative; similmenteil numero delle radici positive non puo essere inferiore al numero di variazioni introdottenell’equazione prodotto.

Osserviamo che, a differenza della dimostrazione giovanile, in questo caso Segnersi e cimentato con il caso generale della regola dei segni.

Leonhard Euler (1707-1783) dedico spazio alla regola dei segni nel Cap. XII del-le Institutiones Calculi Differentialis del 1755 premettendo alla loro trattazione dueproposizioni ausiliarie: 1) Se una equazione algebrica p(x) = 0 ha solo radici positive(negative), l’equazione derivata p′(x) = 0 gode della stessa proprieta e le sue radiciseparano quelle di p(x) = 0; 2) Se in un’equazione p(x) = 0 si opera la trasformazionex = 1/y, considerando l’equazione a radici reciproche, il numero di radici reali odimmaginarie non cambia.

Ora Eulero considera un’equazione del tipo

xn + a1xn−1 + · · ·+ an = 0

e suppone che essa possegga solo radici positive. Derivando n − 1 volte approdoall’equazione x+(1/n)a1 = 0 che, per la Prop. 1) deve avere la radice positiva, per cuia1 < 0. Operando ora la trasformazione a radici reciproche ed invocando entrambe leProp. 1) e 2), Eulero puo concludere che le equazioni

1 + a1y + a2y2 + · · ·+ any

n = 0 e a1 + 2a2y + · · ·+ nanyn−1 = 0

possiedono solo radici reali e positive. Operando nell’ultima equazione la sostituzioney = 1/x e sempre per Prop. 2), la stessa proprieta deve valere anche per l’equazione

a1xn−1 + 2a2x

n−2 + · · ·+ nan = 0

che, derivata n− 2 volte, fornisce l’equazione a1x+ ( 2n−1

)a2 che, ancora per la Prop.1) deve avere la radice positiva, da cui segue che a2 e di segno opposto ad a1. Da cioEulero dedusse che, se in un’equazione i primi tre termini hanno lo stesso segno, l’e-quazione deve avere due radici negative e che, operando analogamente, se due terminiconsecutivi hanno segno concorde, allora l’equazione ha almeno una radice negativa.Eulero afferma poi che, sempre nell’ipotesi che l’equazione di partenza possegga soloradici positive, due termini consecutivi debbono avere segno opposto per cui concludeche il numero di variazioni coincide con quello delle radici positive. La dimostrazionedi Eulero e pero incompleta in quanto egli ha in effetti mostrato che in presenza di

Page 159: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.7. STORIA DELLA REGOLA DEI SEGNI DI CARTESIO 159

variazioni vi e almeno una radice positiva e in presenza di permanenze vi e almenouna radice negativa.

Nelle Meditationes Algebraicae (1782, III Ed.) Edward Waring (1736 ca.-1798)fece un’osservazione da cui Gauss sapra trarre frutto. Precisamente, se an−mx

n−m −an−m−1x

n−m−1 sono i termini nei quali si manifesta la prima variazione dell’equazionedi partenza, allora quando si moltiplica l’equazione per x− a il coefficiente di xn−m ecertamente negativo ed ha valore −(aan−m + an−m−1).

Vediamo ora un’ultima dimostrazione pre-gaussiana, esposta da Paolo Ruffini alcapitolo III del suo trattato La Teoria Generale delle Equazioni, apparso nel 1799 [17].Egli dapprima osserva che, se in corrispondenza di x = a ed x = b, f(a) ed f(b) hannosegni opposti, allora deve esistere una radice reale di Y = f(x) = 0 nell’intervallo(a, b). Se

Y = xm + Axm−1 +Bxm−2 + · · ·+ Tx+ V = 0

rappresenta l’equazione assegnata e

Z = mxm−1 + A(m− 1)xm−2 + · · ·+ T = 0

e la sua equazione derivata e se x1 > x2 > x3 · · · sono le radici reali di Y disposte inordine decrescente, allora

Z(x1) > 0 Z(x2) < 0 Z(x3) > 0....

continuando i segni ad alternarsi. Ruffini ora considera l’equazione ottenuta moltipli-cando ordinatamente ciascun termine di Y per un termine della progressione aritmeticadi termine iniziale a e ragione −b (b > 0)

R = axm + (a− b)Axm−1 + (a− 2b)Bxm−2 + · · ·+ (a− (m− 1)b)Tx+ (a−mb)V = 0

e dimostra cheR = (a−mb)Y + bxZ

Se tra le radici xi di Y = 0 p sono positive e q negative e se le xi vengono sostituite inR, quest’ultima si riduce a R(xi) = bxiZ(xi) e, per quanto visto prima, R passera dapositiva a negativa tutte le volte che si considerano due radici reali successive di Y = 0,finche non si giunge alla piu piccola radice positiva; sostituendo le radici negative, lapresenza del fattore x in R altera la regolarita nello scambio dei segni perche ora Rha il segno di −Z. Ruffini conclude allora che tra le p radici positive di Y ve nesono intercalate almeno (p − 1) di Z mentre tra le q radici negative di Y ve ne sonointercalate almeno q − 1 di Z, mentre nulla si puo dire circa eventuali radici di Z = 0presenti nell’intervallo tra la piu piccola radice positiva e la piu grande radice negativadi Y . In questo modo Ruffini conclude che Y = 0 non puo avere al massimo che unaradice reale positiva ed una radice reale negativa in piu di quante ne abbia R = 0.Infatti, se e il numero di radici positive di R = 0 e se Y = 0 ne avesse + 1 + t cont > 0, ripercorrendo il cammino appena tracciato, concluderemmo che R = 0 ammettealmeno + t radici positive, contrariamente all’ipotesi. Ora si itera la procedurapartendo da R e formandone il prodotto con un’altra progressione aritmetica similealla precedente e giungendo ad una nuova equazione R′ = 0 tale che Y = 0 ha al piu dueradice positive in eccesso rispetto a quelle di r′ = 0; si puo procedere ancora a generarein questo modo una famiglia (finita) di equazioni R(m) = 0, ciascuna delle quali perdeal piu una radice positiva ed una negativa rispetto ad R(m−1). A questo punto Ruffinifa entrare in gioco le permanenze e variazioni di segno ed osserva che, se tutti i terminia, a − b,....a − mb sono positivi, Y ed R hanno lo stesso numero di permanenze e

Page 160: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

160 CAPITOLO 5. VIETE E DESCARTES

variazioni mentre, se ad un certo punto si ha a − kb < 0, R perde una variazione oduna permanenza rispetto ad Y , a seconda dei valori di a e b. Operando dapprima inmodo da eliminare una variazione alla volta, Ruffini puo ottenere un’equazione in cuinon vi siano affatto variazioni e da questo puo concludere che un’equazione non puoavere radici positive in numero superiore alle variazioni presenti in essa. Similmente siopera per togliere le permanenze una alla volta ed approdare ad un’equazione che nesia priva e che pertanto non puo possedere alcuna radice negativa da cui si concludeche il numero di radici negative di un’equazione algebrica non puo superare quellodelle permanenze.

Siamo cosı arrivati alla dimostrazione di Gauss del 1828 [10] in una nota che si puosuddividere in due parti. Nella prima egli mostra che, se a > 0, il prodotto f(x)(x−a)ha almeno una variazione in piu di f(x). Infatti, considerato il polinomio

X = xm + Axm−1 + · · · −Nxn − · · ·+ Pxp + · · · −Qxq · · · ± V

dove sono indicati solo i termini, a parte quello iniziale, in cui avvengono le variazioni,il prodotto

X(x− a) = xm+1 + A′xm · · · −N ′xn+1 · · ·+ P ′xp+1 · · · −Q′xq+1 − · · · ∓ aV

i coefficienti N ′, P ′, Q′ sono certamente positivi, come aveva osservato Waring. Itermini omessi hanno segno ambiguo ma si puo certamente concludere che fino altermine di grado n+1 vi e almeno una variazione; fino a quello di grado p+1 ve ne sonoalmeno due, e cosı via fino al termine noto che ha segno opposto rispetto a quello deltermine noto diX. Questo basta a concludere cheX(x−a) ha almeno una variazione inpiu rispetto ad X. Se ora si prende un generico polinomio Y = X(x−a)(x−b)(x−c) · · ·dove a, b, c, · · · sono le radici positive di Y mentreX e un polinomio contenente le radicinegative ed immaginarie di Y , allora Y conterra variazioni in numero non inferiore alnumero delle sue radici positive. Osservato infine che le radici negative di Y sonole radici positive del polinomio Y ′ che si ottiene sostituendo x 7→ −x in Y , Gaussconclude con la seguente formulazione della regola di Cartesio

L’equazione Y = 0 non puo avere piu radici reali positive delle variazioni di segniche si presentano in Y e non puo avere piu radici reali negative delle variazioni disegno che si presentano in Y ′.

Per concludere, osservo che la eventuale discrepanza tra il numero di radici positivedi un’equazione algebrica ed il numero di variazioni presenti deve essere un numeropari. Questo risultato puo essere ottenuto combinando la regola dei segni, nella formadovuta a Descartes con il teorema di Budan-Fourier. Questo teorema fu enunciatoda Ferdinand Francois Desire Budan de Boislaurent (1761-1840), matematico di ori-gini haitiane ma educato in Francia, nel 1807 nell’opuscolo Nouvelle Methode pourla resolution des equations numeriques d’une degre quelconque. La dimostrazione fupubblicata solo in un suo lavoro del 1822, comunicato all’Adademie des Sciences un-dici anni prima, nel 1811. Dal canto suo Jean-Baptiste Joseph Fourier (1768-1830)aveva gia lavorato al problema della separazione delle radici di un’equazione algebricanell’ultima decade del XVIII secolo, esponendo i risultati delle sue ricerche in cicli dilezioni tenute presso l’Ecole Polytechnique nel periodo tra il 1795 ed il 1798 ma nonpubblico la dimostrazione del teorema che nel 1820, quando venne a conoscenza dellavoro di Budan. Il teorema di Budan-Fourier si enuncia in questi termini:

Siano α e β > α due numeri reali qualunque, che non siano pero radici ne del-l’equazione [algebrica] f(x) = 0 di grado n, ne delle sue derivate successive. Se si

Page 161: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

5.7. STORIA DELLA REGOLA DEI SEGNI DI CARTESIO 161

considerano allora le due successioni

f(α), f ′(α), f ′′(α), . . . , f (n)(α)

ef(β), f ′(β), f ′′(β), . . . , f (n)(β)

si ha che il numero di variazioni contenute nella prima successione e maggiore oduguale al numero delle variazioni contenute nella seconda e che il numero delle radicireali dell’equazione f(x) = 0 comprese fra α e β non puo mai superare la differenzafra il numero di variazioni della prima e della seconda successione, ma puo esserleinferiore per un numero pari. ([19], pp. 570-571)

Se si pone α = 0 e β = +∞ nel teorema di Budan-Fourier si ottiene la generaliz-zazione della regola di Cartesio perche f(0), f ′(0), f ′′(0), . . . , f (n)(0) non sono altroche i coefficienti del polinomio f(x).

Page 162: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

162 CAPITOLO 5. VIETE E DESCARTES

Page 163: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] F. Viete: In artem analyticem isagoge (1591). In Francisci Vietae OperaMathematica, curatore F. van Schooten, 1–12, (1646).

[2] F. Viete: Francisci Vietae ad problema, quod omnibus mathematicis totius or-bis construendum proposuit Adrianus Romanus, Responsum. In Francisci VietaeOpera Mathematica, curatore F. van Schooten, 305-324, (1646).

[3] F. Viete: In artem analyticem isagoge. In Francisci Vietae Opera Mathematica,curatore F. van Schooten, 1–12, (1646).

[4] P. Freguglia: Algebra e geometria in Viete. Bollettino di Storia delle ScienzeMatematiche 9, 49-90, (1989).

[5] P. Freguglia: Sur la theorie des equations algebriques entre le XVI et le XVIIsiecle. Bollettino di Storia delle Scienze Matematiche 14, 259-298, (1994).

[6] E. Giusti: Algebra and Geometry in Bombelli and Viete. Bollettino di Storia delleScienze Matematiche 12, 303–328, (1992).

[7] F. Viete: De Emendatione ac Recognitione Æquationum Tractatus duo. InFrancisci Vietae Opera Mathematica, curatore F. van Schooten, 83–161, (1646).

[8] A. Girard: Invention Nouvelle en l’Algebre, Blaeuw, Amsterdam, (1629).Ristampata a cura di D. Bierens de Haan, Leida, (1884).

[9] F. van Schooten: In Geometriam Renati Des Cartes Commentarii. In R. DesCartes Geometria, Knoch (Frankfurt an Mein) (1695).

[10] L. Matthiessen: Grundzuge der antiken und modernen Algebra der litteralenGleichungen, Teubner, Leipzig, (1896).

[11] J. Stillwell: Mathematics and its History. Springer, New York, (2004).

[12] F. Viete: De Numerosa Potestatum ad Exegesin Resolutione. In Francisci VietaeOpera Mathematica, curatore F. van Schooten, 163–228, (1646).

[13] T.J. Ypma: Historical development of the Newton-Raphson method. SIAMReviews 37, 531-551, (1995).

[14] H.H. Goldstine: A History of Numerical Analysis From the 16th Through the 19thCentury. Springer, New-York, (1977).

[15] The Geometry of Rene Descartes with a fac-simile of the first edition, translatedfrom the French and Latin by D.E. Smith and M.L. Latham, Dover, New York,(1954). Riproduzione dell’edizione del 1925 pubblicata da Open Court Publishers.

[16] M. Bartolozzi, R. Franci: La regola dei segni dall’enunciato di R. Descartes (1637)alla dimostrazione di C.F. Gauss. Archives for the History of Exact Sciences, 45,335-374, (1993).

163

Page 164: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

164 BIBLIOGRAFIA

[17] P. Ruffini, Teoria generale delle Equazioni, in cui si dimostra impossibile la so-luzione algebraica delle equazioni generali di grado superiore al quarto. Bologna,Stamperia di S. Tommaso d’Aquino, (1799).

[18] C.F. Gauss: Beweis eines algebraischen Lehrsatzes, Journal fur die reine undangewandte Mathematik, 3, 1–4, (1828).

[19] A. Capelli: Istituzioni di Analisi Algebrica. Pellerano, Napoli, (1909).

Page 165: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 6

Il teorema fondamentale

dell’algebra

6.1 Le prime formulazioni

La storia del teorema fondamentale dell’algebra si potrebbe sommariamente suddivi-dere in queste fasi:

1. formulazione del teorema senza alcuna dimostrazione (inizio del XVII secolo);

2. primi tentativi di dimostrazione ad opera di Eulero, D’Alembert (1717-1783),Lagrange (1736-1813), de Foncenex (seconda meta del XVIII secolo);

3. prima dimostrazione del teorema sostanzialmente rigorosa dovuta a Gauss (1777-1855) del 1799;

4. dimostrazioni successive (dal 1811 in poi).

Questo schema, peraltro comodo didatticamente, e stato criticato da Gilain [1] cheha osservato come esso mescoli due storie distinte, quella relativa al teorema fonda-mentale dell’algebra (TFA, usando l’abbreviazione di Gilain) ed il teorema di fatto-rizzazione lineare (TFL). In termini moderni il TFA si puo formulare in uno di questimodi:

1. ogni polinomio di grado n ≥ 1 a coefficienti complessi possiede almeno unaradice complessa;

2. ogni polinomio di grado n ≥ 1 a coefficienti complessi si scompone nel prodot-to di n fattori lineari a coefficienti complessi ed ammette n radici complesse,eventualmente coincidenti;

3. formulazioni analoghe alle precedenti che limitano l’attenzione a polinomi concoefficienti reali;

4. ogni polinomio di grado n ≥ 1 a coefficienti reali si puo scomporre nel prodottodi fattori reali di primo o secondo grado.

Il TFL si enuncia dicendo che, per ogni polinomio p(x) in un’incognita di grado na coefficienti in un campo K, esiste un campo L ⊇ K, detto campo di spezzamentodel polinomio, nel quale p(x) ha n radici. Benche quando K = R o K = C gli

165

Page 166: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

166 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

enunciati del TFA e del TFL si confondano, i due teoremi non hanno bisogno l’unodell’altro per essere dimostrati: le dimostrazioni del TFA basate sull’analisi complessanon utilizzano il TFL che, d’altra parte, si puo presentare indipendentemente dal TFAe non fa alcun riferimento alla forma delle radici che invece viene precisata nel TFAquando si considerino coefficienti nel campo reale o complesso.

Fatta questa precisazione, seguiro ancora lo schema sopra riportato cercando diprecisare, sulla scorta del lavoro di Gilain, in quale storia vadano inseriti i vari contri-buti. In questa sezione ci occupiamo della prima fase, cercando di comprendere comesi sia potuto arrivare alla formulazione del teorema. Successivamente ci occuperemodello stretto legame tra l’analisi ed il teorema fondamentale che si delineo a partiredall’inizio del XVIII secolo e di cui resta traccia in una delle tecniche dimostrative,quella analitica.

Il teorema fondamentale dell’algebra si affaccio sulla scena della storia delle equa-zioni algebriche in epoca relativamente tarda: una prima formulazione debole si trovanella Arithmetica Philosophica di Peter Roth, un testo pubblicato a Norimberga nel1608 la cui influenza su Cartesio e stata recentemente studiata in [2]. Afferma Roth:

un’equazione ha al piu tante radici quanto e il suo grado; alcune equazioni hannoesattemente tante radici quanto e il loro grado.

La forma debole dell’enunciato e dovuta al fatto che Roth non considerava ne le ra-dici immaginarie ne contava nel modo opportuno le eventuali radici multiple. Un’altraformulazione piu netta ma ancora con qualche riserva si trova nella Invention Nouvelleen l’Algebre pubblicata da Albert Girard nel 1629. Qui il teorema fondamentale vieneenunciato ma non vi e alcun tentativo di dimostrarlo:

Ogni equazione algebrica ammette tante soluzioni quanto mostrato dalla denomi-nazione della piu alta quantita, eccettuate le equazioni incomplete.1 [3]

Girard, che pure considera radici immaginarie di equazioni, sembra riferire adun’eccezione nel teorema quando parla delle equazioni incomplete, quelle cioe per lequali uno o piu coefficienti sono nulli. Tra l’altro, Girard giustifica l’utilita delle radiciimmaginarie in questi termini:

E opportuno sempre ricordarsi di questo: a chi domandasse a cosa servono questesoluzioni che sono impossibili, rispondo che sono utili per tre cose: per l’esattezza dellaregola generale, per la sua utilita e perche non esistono altre soluzioni.2

Dunque tra i motivi che richiedono l’introduzione dei numeri complessi vi e propriola salvaguardia del teorema fondamentale (la reigle generale). La riserva sulle equazioniincomplete—che in effetti non viene mai richiamata durante la explication del teoremache tiene il posto della dimostrazione [1]—puo forse spiegarsi col fatto che Girardutilizzava in modo sistematico le relazioni tra radici e coefficienti di un’equazione comemetodo risolutivo delle equazioni algebriche. Ora, se i coefficienti di un’equazione sonotutti presenti, non vi e dubbio che vi siano n di queste relazioni, mentre l’assenzadi un coefficiente potrebbe suggerire la mancanza di una relazione e quindi portaread un numero ridotto di radici. Tuttavia, quando Girard affronta la soluzione dix4 = 4x − 3 egli correttamente trova che le quattro factions sono 0, 0, 4 e 3 e daquesto fatto ricava tutte le soluzioni dell’equazione. Secondo Gilain tuttavia, quellodi Girard e un enunciato che si puo vedere come una forma molto imperfetta del TFAperche non viene precisata la natura delle radici immaginarie, anche se negli esempi

1Toutes les equations d’algebre recoivent autant de solutions, que la denomination de laplus haute quantite le demonstre, excepte les incomplettes.

2Deon il se faut resouvenir d’observer tousjours cela: on pourroit dire a quoy sert cessolution qui sont impossibles, je respond pur trois choses, pour la certitude de la reigle generale,& qu’il ny a point d’autre solutions, & pour son utilite.

Page 167: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.1. LE PRIME FORMULAZIONI 167

considerati queste sono sempre nella forma a + b√−1. Prova convincente che non ci

si sente di escludere quantita immaginarie di forma differente da questa e un testodi Jean Prestet, Nouveaux Elements d’Algebre del 1689 in cui egli considera diversitipi di quantita immaginarie (absurdite) che dipendono dal grado dell’equazione chele genera. Le assurdita lineari erano per Prestet i numeri negativi, prodotti dalleequazioni di primo grado; le assurdita di secondo grado fanno intervenire le radici deinumeri negativi mentre non vi sono assurdita di terzo grado, perche ogni equazionedi terzo grado si puo sempre scomporre in un fattore lineare reale ed uno di secondogrado. Al contrario, un’equazione di quarto grado come x4 + a4 = 0 genera assurdita

ancora piu complicate di quelle di secondo grado, del tipo√√−a4: piu in generale,

per Prestet esistono una infinita di radici immaginarie di tipo differente, legate alleequazioni di grado 2n.

Un atteggiamento ancora dubbioso sul contenuto del TFA si trova nella Geometriedi Cartesio che dapprima lo enuncia nella forma

Ogni equazione puo avere tante radici distinte quanto e la dimensione dell’incognitanell’equazione ([4], p. 159)

La cautela puo avere (peut il avoir) e forse dovuta al fatto che Cartesio consideravavere solo le radici positive. Peraltro, discutendo le equazioni cubiche piu avanti ([4],p. 175) Cartesio sembra sbilanciarsi maggiormente quando dichiara

Ne le radici vere ne quelle false di un’equazione sono sempre reali; talora esse sonoimmaginarie cioe, mentre posso sempre concepire tante radici di ogni equazione quanteho gia assegnate, tuttavia non sempre esiste una quantita definita corrispondente aduna radice cosı immaginata. Per esempio, mentre possiamo sempre immaginare cheun’equazione come x3−6x2+13x−10 = 0 abbia tre radici, tuttavia vi e una sola radicereale, 2, mentre le altre due, comunque possiamo aumentarle, diminuirle o moltiplicarleseguendo le regole appena stabilite, restano sempre immaginarie.

Osserviamo l’attribuzione di un segno alle radici immaginarie che mostra quantovaghe fossero le idee all’epoca sui numeri complessi: abbiamo visto i problemi causatinella corretta interpretazione della regola dei segni di Cartesio nel Cap. 5. In effettinon stupisce che il teorema fondamentale dell’algebra abbia tardato ad essere formulatonella sua completezza perche, trattandosi di un teorema sul numero di radici, finchenon e chiaro quali sono le radici da considerare, si puo al piu formulare una limitazionesuperiore di tale numero, proprio come hanno fatto Roth e Cartesio. Questo statodi cose si mantiene ancora un secolo dopo con Isaac Newton (1643-1727) che nellaArithmetica Universalis, la cui prima edizione risale al 1707, afferma che un’equazionedi grado n ha al piu n soluzioni:

In verita, un equazione puo avere tante radici quanto e la sua dimensione e nondi piu.3 ([5], p.181)

Che n rappresenti una limitazione superiore al numero di radici segue facilmenteuna volta che si sia realizzato che x = x1 risolve l’equazione algebrica p(x) = 0 se esolo se p(x) e diviso da x − x1, proprieta asserita da Cartesio in generale, presenteanche in Roth e Faulhaber ma gia osservata da tempo per le equazioni cubiche daCardano e, prima ancora, per quelle quadratiche. Si vede allora che, se vi fossero piudi n radici, p(x), prodotto dei vari fattori x− xi dovrebbe avere grado superiore ad n,al contrario di quanto asserito: in questo senso [1] si tratta di una formulazione piuvicina al TFL che non al TFA.

3Potest vero aequatio tot radices quot sunt dimensiones ejus, & non plures.

Page 168: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

168 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

6.2 Un problema di analisi

Un tornante di grande importanza nella storia del TFA e rappresentato da un problemadi analisi oggetto di studio approfondito fin dagli albori del XVIII secolo: l’integrazionedei differenziali razionali, cui si occuparono in prima battuta Gottfried Wilhelm Leibniz(1646-1716) e Johann Bernoulli I (1667-1748) pubblicando i primi risultati a partiredal 1702. Con formalismo vicino ai giorni nostri, il problema di Leibniz e Bernoulli siesprime nella ricerca di

∫r(x)

q(x)dx

dove r e q sono due polinomi, con deg r < deg q. Entrambi utilizzarono la stessatecnica: la scomposizione della funzione razionale in una somma di elementi sempliciche a sua volta poggia sulla fattorizzazione di q(x) in termini di fattori lineari cheviene presa come un dato di fatto, un postulato evidente:

Per prima cosa suppongo dall’algebra che i divisori semplici di qualunque espres-sione razionale intera siano in qualche modo noti; [...] E dunque, dalle ipotizzaterisoluzioni algebriche delle equazioni si otterranno i divisori delle espressioni e questanostra analisi infinitesimale presuppone l’analisi algebrica, come quanto e superiorepresuppone cio che e inferiore.4 ([6] in [1], p. 98)

Le scomposizioni effettuate consentono di ricondurre l’integrazione a quella diun’iperbole–adx/(x+f), che conduce a logaritmi reali, ovvero a settori circolari, comenel caso di adx/(a2+x2). In quest’ultimo caso Bernoulli osserva la possibilita di utiliz-zare logaritmi di quantita immaginarie, argomento su cui Leibniz e Bernoulli avrannouna lunga controversia. Leibniz, dal canto suo, dopo essere riuscito ad effettuare lascomposizione

1

x4 − 1=

1

4(x− 1)− 1

4(x+ 1)− 1

2(x2 + 1)

riducendo cosı il calcolo di∫1/(x4 − 1)dx alla quadratura dell’iperbole e del cerchio,

osserva che lo stesso accadra tutte le volte in cui il denominatore di una frazionerazionale non possiede che divisori reali di primo ovvero di secondo grado ed e cosıcondotto a formulare questo problema:

Questo stato di cose ci conduce pertanto ad una questione di estrema importanza,se cioe tutte le quadrature razionali siano riducibili alla quadratura dell’iperbole e delcerchio, questione che da qui ci riporta a questa nostra analisi: se cioe ogni equazionealgebrica o espressione reale intera razionale possa fattorizzarsi in divisori razionalisemplici o di secondo grado.5 ([6], in [1], p.99)

Ecco dunque come il problema della quadratura di funzioni razionali dipende dalTFA nella quarta accezione, secondo lo schema di Gilain riportato sopra. Il puntoimportante e che Leibniz da una risposta negativa al problema, ritenendo impossibiletale fattorizzazione in generale, per tutti i polinomi. Per questo egli propone uncontroesempio considerando il polinomio x4 + a4 che fattorizza dapprima in (x2 +

4Primo ex Algebra suppono divisores simplices cujusque formulae rationalis integrae utcun-que cognitos; [...] Itaque ex suppositis resolutionibus aequationum Algebraicis habentur divi-sores formularum, et nostra haec Analysis infinitesimalis Analysin Algebraicam, ut superiorinferiorem, supponit.

5Hic jam ordo nos ducit ad maximi momenti Quaestionem, utrum omnes quadraturaerationales ad quadraturam hyperbolae et circuli reduci possint, quae huc redit in nostra hacAnalysis: utrum omnis aequatio algebraica seu formula realis integra quad indeterminatamrationalis possit resolvi in divisores rationales simplices aut planos.

Page 169: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.2. UN PROBLEMA DI ANALISI 169

a2√−1)(x2 − a2

√−1) e poi in

(x+ a

√√−1)(x− a

√√−1)(x+ a

−√−1)(x− a

−√−1)

per concludere circa l’impossibilita di ridurre il polinomio proposto, combinando questifattori, ad un trinomio reale. I lavori di Leibniz e Bernoulli, al di la del loro indubbiovalore nel consentire l’estensione della classe di funzioni integrabili esplicitamente,forniscono un enunciato chiaro del TFA svincolato dal TFL: il secondo viene assuntocome principio indiscutibile mentre il primo viene addirittura respinto da Leibniz:mentre il TFL e alla base della scomposizione di una frazione razionale in elementisemplici i cui denominatori sono di primo grado, il TFA cerca di stabilire la possibilitadi una scomposizione in fattori reali di primo o secondo grado. Il fatto che Leibniz neghila validita del TFA ribadisce una volta ancora quanta incertezza regnasse attorno allanatura dei numeri immaginari. L’errore di Leibniz tuttavia desto l’interesse intornoal problema della scomposizione in fattori reali lineari o quadratici di un polinomioqualsiasi che porteranno, mezzo secolo piu tardi a coagulare il consenso dei matematiciattorno alla possibilita di rispondere in modo affermativo al problema di Leibniz, grazieal lavoro di Eulero e D’Alembert: per Gilain, il punto di partenza della storia del TFAva collocato proprio con la memoria di Leibniz del 1702.

Ora, scomposizioni di polinomi come x4+a4 in fattori reali erano gia state ottenuteda Newton almeno dal 1676. Nel 1702 egli aveva forse gia minor interesse per lamatematica e quindi non si prese cura di segnalare l’errore di Leibniz che fu evidenziatonel 1719 da Nicholas Bernoulli I (1687-1759), figlio di Johann, in una nota apparsasugli Acta Eruditorum di Lipsia dove egli osservo semplicemente che si poteva scrivere[7]

x4 + a4 = (x2 + a2)2 − 2a2x2 = (x2 + a2 +√2ax)(x2 + a2 −

√2ax).

Una risposta sistematica che smontava definitivamente l’argomento di Leibniz vennedal matematico inglese Roger Cotes (1682-1716) che il 5 maggio 1716, un mese primadi morire precocemente, indirizzo al matematico gallese William Jones (1675-1749)una lettera in cui dichiarava di avere ricondotto a misure di rapporti e di angoli,cioe a funzioni logaritmiche e circolari, le fluenti (cioe le primitive) delle flussioni(

dxxθη+ δλη−1

)

/(e + fxη) dove d, e ed f sono costanti, θ ∈ Z e δ/λ < 1, con δ e λ

entrambi naturali. Oltre a sottolineare l’avanzamento rispetto a quanto ottenuto daNewton che aveva considerato i casi δ/λ = 0 e δ/λ = 1/2, Cotes allude al lavoro diLeibniz del 1702 osservando che i suoi risultati permettevano di rispondere al problemadi Leibniz in senso opposto a quanto asserito dallo studioso tedesco. Cotes, che affermanella stessa lettera di aver ottenuto la fluente della flussione di

(

dxxθη+ δλη−1

)

/(e+ fxη + gx2η)

dove ora λ e una potenza di 2, concludeIn verita sono portato a credere che la grande questione del Sig. Leibniz andrebbe

risolta in senso opposto e che alla fine sara possibile trovare che la fluente di qualsiasiflussione razionale dipende davvero da misure di rapporti ed angoli, con l’eccezione diquelle ottenibili in termini finiti anche senza il ricorso a misure.6 ([8], in [1], p.102)

6In truth I am inclined to believe, that Mr. Leibniz’s grand question ought to be determinedthe contrary way, and that it will be found at last, that the fluent of any rational fluxionwhatever does depend upon the measures of ratios and angles, excepting those which may behad in finite terms even without introducing measures.

Page 170: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

170 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

I risultati di Cotes apparvero postumi nella Harmonia Mensurarum pubblicata nel1722 e poggiano su eleganti argomenti geometrici la cui dimostrazione fu fornita daAbraham De Moivre (1667-1754).

Il contenuto della lettera di Cotes servı nel 1719 ad un altro matematico inglese,Brook Taylor, per lanciare una sfida ai matematici continentali in cui veniva chiestal’integrazione di

xrdx

x2m + axm + b,

che coincide con l’espressione trinomia analizzata da Cotes. La risoluzione fu piuttostorapida e gia nel 1719 Johann Bernoulli e Jacob Hermann fornirono la scomposizioneadeguata del denominatore, cosı come poco piu tardi fece il matematico italiano GiulioCarlo Fagnano (1682-1766) [9]. In particolare, Hermann introdusse i divisori primitivicome i polinomi che non si possono scomporre nel prodotto di altri di grado minore,cioe i polinomi irriducibili, benche non affermi che tali polinomi debbono in ognicaso avere grado minore od uguale al secondo. In questo contesto si colloca anche laMiscellanea Analyica de seriebus et quadraturis di Abraham De Moivre, pubblicata nel1730. Qui, oltre a migliorare alcuni risultati di Cotes operando ipotesi meno restrittive,De Moivre offre uno studio dettagliato della scomposizione del polinomio reciproco diquarto grado

x4 + px3 + qx2 + px+ 1 = 0

nel prodotto di due trinomi reali, estendendo il risultato ai polinomi reciproci di sestogrado. Nel 1738 De Moivre scrisse una lettera a William Jones in cui mostro cometrovare le radici n-esime di un numero immaginario a+

√−1b nella forma x+

√−1y gra-

zie all’ausilio della trigonometria. Ad ogni buon conto, nella matematica pre-euleriananon vi e riscontro del TFA mentre il TFL viene assunto valido a priori. Come esem-pio di questo atteggiamento possiamo considerare due passaggi tratti da due opere diColin MacLaurin che, nel Treatise of fluxions del 1742, afferma

Appare dunque che la fluente di

xrx

x2n − Ax2n−1 +Bx2n−2 − etc

si puo ottenere tramite archi circolari e logaritmi nei casi in cui il denominatore sia ilprodotto di divisori quadratici qualsiasi.7 ([10], in [1], p. 105) denotando una estremaprudenza nell’enunciato da cui emerge come Mc Laurin non si pronunci sulla proprietadei polinomi asserita dal TFA. Al contrario, nel A Treatise of Algebra, postumo, del1748, egli afferma

Ed un’equazione di dimensione qualsiasi puo considerarsi come il prodotto di tanteequazioni semplici quanto e la sua dimensione.8 ([11], in [1], p. 105) da cui emergeinvece il suo utilizzo del TFL.

7And thus it appears how the fluent of

xrx

x2n −Ax2n−1 + Bx2n−2 − etc

is assignable by circular arcs and logarithms when the denominator is the product of anyquadratic divisors.

8And an equation of any dimension may be considered as produced by the multiplicationof as many simple equations as it has dimensions.

Page 171: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.3. EULERO E IL TFA 171

6.3 Eulero e il TFA

Il TFA entrava in un altro problema analitico, la risoluzione delle equazioni differenzialiomogenee, lineari, di ordine n ed a coefficienti costanti, problema affrontato da Euleronel 1743 nella memoria De integratione aequationum differentialium altiorum graduum[12]. E noto che Eulero, ponendo y = epx, ridusse il problema dell’integrazione di

0 = Ay +Bdy

dx+C

d2y

dx2+ · · ·+N

dny

dxn

alla risoluzione dell’equazione algebrica in p

A+Bp+ Cp2 + · · ·+Npn = 0.

Qui, supponendo sempre valida la scomposizione di un polinomio in fattori reali lineario quadratici, Eulero fornı una completa classificazione dei casi possibili, mostrandon integrali indipendenti dell’equazione differenziale. Dunque questo lavoro dipendeconcettualmente dalla validita del TFA e d’altra parte Eulero aveva gia manifestato inuna lettera del 15 settembre 1739 indirizzata a Johann Bernoulli la propria convinzionedella validita di tale scomposizione.

Si risolva, se possibile, questa espressione [1−ap+bp2−cp3+dp4−ep5+· · · = 0] infattori reali semplici di questa forma: 1− αp; se pero cio non e possibile, la si risolvain fattori di dimensione due di questa forma: 1 − αp + βpp. Una tale risoluzionepuo veramente essere sempre ottenuta ed in questo modo, l’espressione di prima sipotra ottenere come prodotto o di fattori semplici 1 − αp o di dimensione due, come1− αp+ βpp, tutti reali.9 ([13], pp.37-38, in [1], p. 106)

In una lettera del 1 settembre 1742 indirizzata a Nicholas Bernoulli (1687-1759),Eulero enuncia ancora in termini simili il TFA oltre a precisare che le radici immagi-narie di un’equazione algebrica sono sempre in numero pari e sono abbinabili in coppieil cui prodotto e reale.

Ogni espressione algebrica α+ βx+ γx2 + δx3+ etc. di grado qualsiasi, e semprerisolubile in fattori trinomiali reali p + qx + rxx, quando non e risolubile in fattorireali semplici p+ qx.10 ([1], p.107)

Nicholas Bernoulli si mostra pero scettico circa la generalita della fattorizzazioneproposta da Eulero e nella risposta del 24 ottobre seguente propone un controesempionel polinomio

x4 − 4x3 + 2x2 + 4x+ 4 = 0 (6.1)

le cui quattro radici immaginarie 1 ±√

2 +√−3, 1 ±

2−√−3 non possono per

lui essere abbinate in modo da formare dei fattori quadratici reali del polinomio dipartenza: si tratta di un esempio piu fine ma dello stesso tenore di quello proposto daLeibniz nel 1702. Eulero riconosce in una lettera a Christian Goldbach (15 dicembre1742) di essere stato colpito dal controesempio di Bernoulli, al punto da avere per unmomento nutrito dei dubbi sulla validita della scomposizione in fattori reali lineari o

9Haec expressio [1−ap+ bp2− cp3+dp4− ep5+ · · · = 0] si fieri potest in factores simplicesreales hujus formae 1−αp resolvatur: si autem hoc fieri nequeat, resolvatur in factores duarumdimensionum hujus formae 1−αp+βpp, quae resolutio realiter sempre institui potest, hocquemodo prodibit superior expressio sub forma producti ex factoribus vel simplicibus 1− αp velduarum dimensionum 1− αp+ βpp, omnibus realibus.

10Ut omnis expressio algebraica α+ βx+ γx2 + δx3+ etc. quotcunque fuerit dimensionum,si non in factores simplices p+ qx omnes reales resolvi queat, ea saltem in factores trinomialesp+ qx+ rxx, qui omnes sint reales, semper resolubilis existat.

Page 172: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

172 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

quadratici: qui egli parla del TFA come di una sorta di teorema di Fermat, una speciedi teorema di Fermat (ungefahr wie einige theoremata Fermatiana). Tuttavia, il 10novembre 1742, Eulero aveva gia risposto a Bernoulli ribadendo la validita del TFA dicui asseriva possedere una dimostrazione rigorosa per i polinomi di grado non supe-riore a quattro, fornendo in particolare la scomposizione del polinomio (6.1). Eulero econvinto dell’importanza fondamentale del TFA per i problemi dell’integrazione delleequazioni differenziali lineari a coefficienti costanti e per l’integrazione delle funzionirazionali e invita Bernoulli a contribuire alla risoluzione del problema, in un senso onell’altro. Anche Goldbach dal canto suo era dubbioso circa la validita del TFA epropose egli pure un controesempio con un polinomio della forma x4 + px + q com-mettendo pero un errore di calcolo che Eulero noto in una lettera diretta a Goldbach,datata 26 febbraio 1743, dove anche forniva la scomposizione in fattori quadratici realiin un caso sufficientemente generale da abbracciare l’esempio numerico di Goldbach.Nella stessa lettera, Eulero affermava anche di avere dimostrato il TFA per polinomidi grado non superiore a 6 e per le equazioni della forma

αx5n + βx4n + γx3n + δx2n + εxn + ζ = 0.

Un’idea del metodo di Eulero si puo avere dalla lettera del 6 aprile 1743 in cui NicholasBernoulli, riconscendo il proprio errore ed essendo ormai convinto della validita delTFA, afferma

Il tuo metodo per trovare i fattori trinomiali di equazioni algebriche per mezzo diangoli funziona correttamente.11 (cfr. [9], p. 310) suggerendo trattarsi di un metodobasato sul ricorso alle funzioni trigonometriche. In questa lettera, Bernoulli fa un’os-servazione che giochera un ruolo centrale negli sviluppi successivi: egli asserisce che ilTFA sara dimostrato quando si potra dimostrare che ogni quantita immaginaria puosempre ridursi alla forma a+ b

√−1, con a, b ∈ R. Eulero (lettera del 14 maggio 1743)

condivide l’idea di Bernoulli che ogni quantita immaginaria sia della forma a+ b√−1,

benche dichiari di non avere idea sul modo di dimostrare tale affermazione. Inoltre Eu-lero, che vuole ottenere direttamente la scomposizione reale di un polinomio, osserva,facendo ricorso al TFL, che i coefficienti dei fattori quadratici nella scomposizione diun polinomio di grado 2n risolvono un’equazione di grado n i cui coefficienti possonoessere assunti reali perche radici di equazioni algebriche di cui e noto a priori che ilgrado e dispari. La successiva risposta di Bernoulli e molto importante e giunge il 29novembre 1743. Qui egli mostra che il metodo proposto da Eulero e fragile in quantonon permette di determinare la realta o meno dei coefficienti dei fattori quadratici epropone un’altra strada, ispirandosi alla scomposizione dell’equazione di quarto gradoin fattori quadratici reali suggerita da Cartesio. La possibilita di effettuare tale scom-posizione utilizzando i polinomi x2 +αx+β e x2−αx+ δ poggia sull’osservazione cheα2 e soluzione di un’equazione di terzo grado il cui termine costante e negativo. Ber-noulli procede suggerendo lo schema della dimostrazione nel caso generale osservandodapprima che la scomposizione in fattori quadratici reali di un’equazione generale siriduce ad operarla su equazioni di grado 2n, per le quali si ipotizza una scomposizionei cui fattori sono di grado dimezzato

x2n−1

+αx2n−1−1+ax2n−1−2+· · · = 0 e x2n−1−αx2n−1−1+a1x2n−1−2+· · · = 0

(6.2)dove α2 si potra determinare per mezzo di una equazione di grado dispari. Quinditutta la difficolta della dimostrazione, che ogni equazione algebrica si puo risolvere in

11Recte se habet methodus tua inveniendi factores trinomiales algebraicae ope angulorum.

Page 173: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.3. EULERO E IL TFA 173

equazioni quadratiche reali, si riduce a poter dimostrare che la quantita α2 e semprepositiva. (cfr. [9], p.311).

Bernoulli non dice nulla sul metodo seguito per approdare ad un’equazione di gra-do dispari per α2. Eulero risponde il 4 febbraio 1744 sottolineando il fatto che bastatrovare un valore reale per α, anche se non e importante conoscerlo a priori. Eulerodimostra allora che α deve obbedire ad un’equazione di grado pari ma con terminenoto negativo. Dunque si puo dire che nel 1744 possedesse gli elementi essenziali perottenere la dimostrazione del TFA che pero comparira solo nel 1751 anche se conse-gnata all’accademia delle scienze di Berlino per l’anno 1749. Inoltre, quando nel 1748viene pubblicata a Losanna la Introductio in analysin infinitorum [14], opera fonda-mentale tesa a conferire un fondamento algebrico all’analisi, i riferimenti al problemadel teorema fondamentale si riducono ai seguenti:

1. Cap. II, De transformatione functionum: viene enunciato il TFL in questo modo([14])

E evidente che un fattore di secondo grado si compone di due fattori semplici, unodi terzo grado in tre fattori semplici e cosı via. Da cio segue che una funzioneintera della stessa z nella quale l’esponente della potenza piu alta della z e n,conterra n fattori semplici.12 Ancora una volta questo teorema viene presentatocome qualcosa di evidente per il quale non vi e bisogno di dimostrazione.

2. Cap. II: compare un enunciato del TFA per equazioni di quarto grado: Se vifosse un fattore Q reale ottenuto dal prodotto di quattro fattori semplici imma-ginari, allora lo stesso Q si potra risolvere nel prodotto di due fattori semplicireali.13 [14] Di tale enunciato Eulero fornisce una dimostrazione incompleta dalmomento che presuppone la possibilita di scrivere in ogni caso Q come prodottodi due fattori quadratici a coefficienti immaginari della forma a+b

√−1. In ogni

caso egli si spinge a suggerire una generalizzazione affermando

Benche non sia possibile estendere a potenze superiori la stessa tecnica di di-mostrazione, tuttavia appare fuor di dubbio che la stessa proprieta compete aqualunque fattore immaginario, cioe che e sempre possibile sostituire n fattoridi secondo grado reali a 2n fattori immaginari semplici. Da cio segue che ognifunzione intera della stessa z si potra risolvere nel prodotto di fattori reali osemplici o di secondo grado.14 [14].

Poco dopo rinvia il lettore al Cap. IX dicendo

Anche se cio non e stato dimostrato con sommo rigore, la verita di quantoaffermato si rafforzera ancor piu nel seguito.15 [14]

3. Cap. IX, De investigatione factorum trinomialium: Eulero si serve delle cosid-dette formule di De Moivre—(cos φ±

√−1 sin φ)n = cos nφ ±

√−1 sin nφ, con

12Perspicuum autem est factorem duplicem duos complecti factores simplices, factoremtriplicem tres simplices et ita porro. Hinc functio ipsius z integra, in qua exponens summaepotestatis ipsius z est n, continebit n factores simplices.

13Si fuerit Q productum reale ex quator factoribus simplicibus imaginariis, tum idem hocproductum Q resolvi poterit in duos factores duplices reales.

14Quanquam autem eundem demonstrandi modum ad altiores potestates extendere nonlicet, tamen extra dubium videtur esse positum eandem proprietatem in quotcunque facto-res imaginarios competere, ita ut semper loco 2n factorum simplicium imaginariorum induciquaent n factores duplices reales. Hinc omnis functio integra ipsius z resolvi poterit in factoresreales vel simplices vel duplices

15Quod quamvis non summo rigore sit demonstrandum, tamen ejus veritas in sequentibusmagis corroboratur.

Page 174: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

174 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

n ∈ N—scompone in fattori reali i polinomi della forma an±zn e α+βzn+γz2n

aggiungendo:

Anche questi esempi confermano che ogni funzione intera e risolubile in fattorireali semplici o di secondo grado16 [14].

Eulero estende la classe per cui la scomposizione vale servendosi dei risultati suipolinomi di quarto grado illustrati al capitolo II e del fatto che ogni equazionedi grado dispari ammette una radice reale. I polinomi studiati da Eulero sono

α+ βzn + γz2n + δz3n, α+ βzn + γz2n + δz3n + εz4n,

e

α+ βzn + γz2n + δz3n + εz4n + ζz5n.

Eulero, concludendo, afferma che:

E dunque, se fosse ancora rimasto qualche dubbio su questo modo di risolveretutte le funzioni intere, ora dovrebbe essere scomparso quasi del tutto17 [14].

Come sottolineato da Gilain, i passi citati suggeriscono la convinzione di Eulero dellavalidita del TFA che egli cerca di trasmettere al lettore, pur nella mancanza di unadimostrazione rigorosa completa. Quest’ultimo fatto puo destare sorpresa, consideratoil fatto che gia nel 1744 Eulero era piu avanti nella dimostrazione del teorema. PerGilain, questo scarto e dovuto al lasso di tempo intercorso tra la stesura e la stampadella Introductio. A conferma di questa ipotesi egli cita un passo di una rispostainviata da Eulero a D’Alembert che faceva seguito ad alcune critiche di quest’ultimosulla Introductio ed in cui Eulero ammette cheLe vostre osservazioni sulla mia Introduzione non sono che troppo ben fondate; manon sarete piu sorpreso degli errori che vi si trovano a proposito dei fattori trinomiali[...], quando vi avro detto che quest’opera e stata tre anni circa a Losanna e che iol’avevo completata qualche tempo prima. In quel momento, lo ammetto francamente,non avevo ancora una dimostrazione solida del fatto che ogni espressione algebrica erisolubile in fattori trinomiali reali.18 [1]

In questa risposta vi e una coerenza interna perche se l’Introductio cristallizzalo stato dell’arte nel 1743, siamo al momento in cui Eulero vede ancora lontana ladimostrazione del teorema, come aveva scritto a Goldbach il 26 febbraio di quell’anno.

Ed eccoci alla memoria di Eulero sul TFA [15], Recherches sur les racines imagi-naires des equations, apparsa nel 1751 tra le memorie dell’accademia di Berlino perl’anno 1749, dove Eulero propone due dimostrazioni del TFA, entrambe scorrette. Laseconda, piu breve, si basa sul tentativo di dimostrare che ogni radice di un’equazionealgebrica deve essere della forma M +N

√−1, con M,N ∈ R. Per questo egli evoca i

risultati del 1746 di D’Alembert che aveva mostrato la stabilita della formaM+N√−1

sotto l’azione delle operazioni algebriche fondamentali. Grazie a questo ed alle formuledi Viete-Girard, Eulero ritiene di aver concluso, poiche queste formule

16Confirmatur ergo etiam his exemplis omnem functionem integram in factores reales sivesimplices sive duplices resolvi posse.

17Quare si ullum dubium mansisset circa huiusmodi resolutionem omnium functionumintegrarum, hoc nunc fere penitus tolletur.

18Vos remarques sur mon Introduction ne sont que trop bien fondees; mais vous ne serezplus surpris des fautes qui s’y trouvent par rapport aux facteurs trinomes [...], quand je vousdirai que cet ouvrage a ete presque trois ans a Lausanne et que je l’avais acheve deja quelquestemps auparavant. Alors, j’avoue franchement que je n’avais pas encore une demonstrationsolide, que toute expression algebrique est resoluble en facteurs trinomes reels.

Page 175: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.3. EULERO E IL TFA 175

non contengono altre operazioni oltre le quattro comuni che non siano se nonestrazioni di radice senza che vi si mescoli alcuna operazione trascendente.19 [15]

Proprio quest’ultima affermazione inficia la validita del ragionamento di Eulero inquanto, come dimostreranno Ruffini ed Abel oltre mezzo secolo piu tardi, per le equa-zioni di grado superiore al quarto questa affermazione e falsa. L’altro punto debolenella dimostrazione di Eulero e il ricorso alle formule di Viete-Girard che presuppongo-no l’esistenza delle radici e dunque non possono essere utilizzate in una dimostrazionedel TFA. Si tratta di un abbaglio in cui altri matematici dopo Eulero cadranno, pri-mo fra tutti Lagrange, e che verra messo in evidenza da Gauss nella prima delle suedimostrazioni del TFA, quella del 1799 [16]. Ancora una volta puo avere giocato unruolo fuorviante il fatto di considerare il TFL come un dato a priori.

La prima dimostrazione proposta da Eulero in [15] segue i suggerimenti di NicholasBernoulli e inaugura la tradizione delle dimostrazioni algebriche del TFA. A patto dimoltiplicarla per un opportuno fattore xk, un’equazione algebrica si puo scrivere nellaforma

x2n + px2n−1 + qx2n−2 + · · · = 0

ovvero, eliminando il coefficiente p con la consueta trasformazione x 7→ x− p

2n,

x2n +mx2n−2 + rx2n−3 + · · · = 0 (6.3)

che viene identificata con il prodotto dei fattori (6.2), ottenendo un sistema di 2n − 1equazioni. Se da tale sistema si eliminano i vari coefficienti incogniti a, a1, ecc., fuorche

α, quest’ultimo risolvera un’equazione di grado

(2n

2n−1

)

dove pero compaiono solo

le potenze pari di α e dunque riducibile ad un’equazione di grado dispari 12

(2n

2n−1

)

.

Tale equazione ha termine noto negativo perche α e la somma di 2n−1 radici scelte tra

le 2n radici della (6.3) e pertanto puo assumere 12

(2n

2n−1

)

valori, esprimibili come

funzioni razionali dei coefficienti della (6.3) che, mancando del secondo termine, ha lasomma delle radici pari a zero. Dunque i valori di α si annullano a coppie. L’equazioneper α ammette cosı una radice positiva almeno, in termini della quale si possonoesprimere razionalmente i coefficienti delle (6.2). Procedendo nella scissione di ciascunadelle (6.2) in una coppia di equazioni di grado 2n−2 ed iterando il procedimento, sigiungeva a scindere l’equazione (6.3) nel prodotto di equazioni di secondo grado acoefficienti reali ([9], pp. 312-313). Tuttavia, oltre all’utilizzo delle formule di Viete-Girard, Eulero non aveva sufficientemente motivato il fatto che l’equazione soddisfattada α fosse di grado 2(2k + 1), ne era solidamente fondata l’asserzione che il terminenoto di tale equazione fosse negativo.

Questi difetti furono notati da Daviet de Foncenex [17] (secondo Delambre, susuggerimento di Lagrange) e da Lagrange stesso [18]: entrambi pero non eliminaronoil tacito riferimento alle formule di Viete-Girard e dunque non sono valide. Si puoaggiungere che anche Pierre-Simon de Laplace [19] presento nel 1795 agli studentidell’Ecole Normale una dimostrazione algebrica del TFA che cade nella stessa trappola[20].

19ne contiennent point d’autres operations que l’extraction des racines, outre le qua-tre operations vulgaires, et l’on ne saurait soutenir que des operations transcendentes s’ymelassent.

Page 176: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

176 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

6.4 D’Alembert ed il TFA

Negli stessi anni in cui Eulero proponeva il primo tentativo di dimostrazione algebri-ca del TFA, Jean Le Ronde D’Alembert inaugurava la stagione delle dimostrazionianalitiche del TFA con una dimostrazione che a molti sembro inattaccabile sotto ilprofilo del rigore ma che fu ugualmente criticata da Gauss. In realta [1] D’Alembertaveva presentato nel 1745 all’Accademia delle Scienze di Parigi una memoria dal titoloRecherches sur le calcul integral che concludeva un trittico di lavori circa l’integra-zione in termini finiti dei differenziali di funzioni razionali fratte che inaugurarono unbreve periodo di intensa ed originale produzione matematica [21] e dove D’Alembertpropose una dimostrazione del TFA in cui mostrava la chiusura del campo complessosotto l’azione delle operazioni algebriche per mostrare che una funzione qualsiasi (quel-conque) di x + y

√−1 si esprimeva nella forma p+ q

√−1 deducendo che, se la radice

di un’equazione algebrica assume tale forma, l’equazione deve anche essere risolta dap− q

√−1 e percio

Un’equazione le cui radici sono immaginarie si puo fattorizzare in trinomi i cui coef-ficienti sono reali.20 ([22], in [1], p. 113)

Questa dimostrazione e errata come quella di Eulero in quanto presupponte dipoter esprimere le radici di un’equazione algebrica solo tramite il ricorso ad operazionialgebriche elementari.

D’Alembert, come altri matematici dell’epoca, opera una netta distinzione traquantita immaginarie e radici immaginarie di un’equazione. Le quantita immaginariesono funzioni esplicite di variabile complessa mentre le radici immaginarie di un’equa-zione sono le sue soluzioni non reali. La distinzione permise a D’Alembert di ottenere,nel 1746, una dimostrazione del TFA priva dei paralogismi che si riscontravano nelleopere dei matematici a lui precedenti o contemporanei. In alcune Observations datate15 giugno 1752 D’Alembert si esprime in questi termini:

ho dimostrato

1 che ogni quantita immaginaria di forma qualsiasi si puo ridurre a A+B√−1,

con A e B quantita reali.

2 che tutte le radici immaginarie di un’equazione qualsiasi si possono esprimerecome A+ B

√−1, e che in questo caso ve ne e un’altra rappresentata da A− B

√−1,

da cui ho concluso che ogni quantita algebrica razionale o, se si vuole, ogni equazionee riducibile nel prodotto di trinomi reali [...]

Per quanto riguarda la seconda proposizione, all’inizio si direbbe che si tratta diuna conseguenza necessaria della prima ma perche sia cosı bisognerebbe dimostrare [...]che e sempre possibile supporre una forma immaginaria qualsiasi per una radice nonreale; questa ipotesi puo essere certo molto plausibile ma essa e allo stesso tempo moltodifficile (e forse impossibile) da dimostrare con rigore. Ho dunque cercato un metododiretto ed indipendente dalla forma che si puo assegnare alle radici immaginarie delleequazioni. 21 (cfr. [1], p. 114).

20Une equation dont les racines sont imaginaires, peut se diviser en trinomes, dont lescoefficients soient reels.

21j’ai demontre1 que toute quantite imaginaire d’une forme quelconque peut se reduire a A+ B

√−1, A

et B etant des quantites reelles.2 que toutes racine imaginaire d’une equation quelconque pouvait s’exprimer par A +

B√−1, et qu’en ce cas il y en avait une autre representes par A − B

√−1,d’ou j’ai conclu

que toute quantite algebrique rationnelle, ou si l’on veut toute equation etait reductible enfacteurs trinomes reelles [...]

Page 177: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.4. D’ALEMBERT ED IL TFA 177

Come piu volte e accaduto nella storia della matematica, un approccio che taglii ponti con metodi che si sono rivelati infruttuosi conduce a nuovi risultati. Questoavvenne con la seconda dimostrazione del TFA, pubblicata nel 1748 tra le Memoriedell’accademia di Berlino per l’anno 1746 intitolata anch’essa Recherches sur le calculintegral. Qui il TFA viene enunciato in questi termini

Sia xm + Axm−1 + Bbxm−2 + ... + Fx+ G un multinomio qualsiasi tale che nonvi e alcuna quantita reale che, sostituita al posto di x, annulli tutti i termini. Affermoche vi sara sempre una una quantita p + q

√−1 da sostituire al posto di x e tale da

rendere questo multinomio uguale a zero.22 ([23] in [1], p. 114)D’Alembert si riconduce a dimostrare che l’equazione

F (x,U) = xm +Axm−1 +Bxm−2 + · · ·+Gx− U = 0 (6.4)

a coefficienti reali ammette soluzione x(U) ∈ C, qualunque sia la scelta di U ∈ R,supponendo reali i coefficienti del polinomio. Le osservazioni iniziali di D’Alembertsono che per U = 0 si ha x = 0 e che x(U) dipende con continuita con U . Lasua dimostrazione si articola in due punti cruciali, il primo e un argomento locale, ilsecondo globale.

Il teorema di natura locale afferma che, se x ed U sono legati dall’equazioneF (x,U) = 0 ed F (0, 0) = 0, allora vi e una soluzione x(U) complessa per ogni sceltadi U ∈ R, sufficientemente piccolo. D’Alembert considera il caso di U ∈ R+, U ≪ 1ed assume lo sviluppo di x(U) in serie di potenze frazionarie di U :

x = αUmn + βU

pq + γU

rs + · · · (6.5)

dove gli esponenti sono tutti positivi e mn< p

q< r

s< · · · . Inserito lo sviluppo (6.5) in

(6.4) ed uguagliando i termini con lo stesso esponente, D’Alembert riesce a determinareun valore approssimato reale per x(U), l’approssimazione diventando migliore quantipiu termini si conservano nello sviluppo (6.5). Quando U < 0, |U | ≪ 1, se non vi sonotermini in (6.5) con esponenti a denominatore pari, x(U) resta reale mentre se vi e unesponente a denominatore pari, allora x(U) e della forma a+ b

√−1.

Questa parte della dimostrazione di D’Alembert fu criticata da Eulero, De Fonce-nex e Lagrange perche le affermazioni sulla sviluppabilita in serie della soluzione nonsembravano sufficientemente motivate e per l’utilizzo di un metodo di approssimazionisuccessive. Eulero, scrivendo a D’Alembert il 29 dicembre 1746, e molto diplomatico:

Ho letto con tanto frutto quanto piacere il vostro ultimo lavoro con cui avete onoratola nostra Accademia. Il modo in cui voi dimostrate che ogni espressione xn+Axn−1+etc. = 0 che non abbia radici reali deve averle della forma p+ q

√−1, e di conseguenza

che essa deve avere un fattore della forma xx+αx+β mi soddisfa appieno; poiche peroprocede a partire da uno sviluppo in serie infinita, non so se tutti saranno convinti.

Nella memoria [15], Eulero appare un po’ piu ruvido quando, a proposito dellascomposizione in fattori lineari e quadratici reali dichiara

A l’egard de la seconde proposition, il semble d’abord qu’elle soit une suite necessaire dela premiere, mais il faudrait pour cela avoir demontre [...] que l’on peut toujours supposerune forme imaginaire quelconque a une racine non reelle; cette supposition peut etre fortvraisemblable, mais elle est, en meme temps fort difficile (et impossible peut-etre) a demontrerrigouresement. J’ai donc cherche une methode directe, et independante de la forme qu’on peutdonner aux racines imaginaires des equations.

22Soit un multinome quelconque xm + Axm−1 + Bbxm−2 + ... + Fx + G tel qu’il n’y aitaucune quantite reelle qui etant substituee a la place de x y fasse evanouir tout les terms, jedis qu’il y aura toujours une quantite p+ q

√−1 a substituer a la place de x, et qui rendra ce

multinome egal a zero.

Page 178: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

178 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

Finora, per quanto ne so io, nessuno ha ancora dimostrato rigorosamente la verita diquest’idea. ([15], §7) 23

Sulla stessa linea si porra Gauss nel 1799 [16]. De Foncenex osservo che

Poiche il valore immaginario trovato con questo metodo non e che un’approssimazione,si potra supporre che la quantita che si trascura, piccola quanto si vuole, non sia proprioquella che impedisce di esprimere l’incognita in termini di un espressione finita: [...]si arriva spesso ad una situazione in cui un termine trascurato nello sviluppo in serie,sia in realta proprio quello che le fa cambiare natura.24 ([17], in [21], p. 421).

L’atteggiamento di Lagrange non fu univoco. Se nel 1772, allorche si accinse atentare una dimostrazione del TFA, dichiarava, a proposito della dimostrazione diD’Alembert:

Questa dimostrazione e molto ingegnosa e mi sembra non lasci nulla a desidera-re per quanto riguarda la correttezza: tuttavia essa e indiretta, essendo dedotta daconsiderazioni su curve e serie infinite, ed inoltre essa fa naturalmente credere chesi possa ottenere lo stesso obiettivo grazie ad un’analisi semplice, fondata unicamentesulla teoria delle equazioni.25 ([18], p.489)

Nel Traite del 1798, nella Nota relativa al TFA, Lagrange e piu critico quandoafferma, riferendosi alla dimostrazione di D’Alembert

Questa dimostrazione e incompleta perche, benche in un’equazione a due incognitesia sempre possibile esprimere una delle incognite ricorrendo ad una serie di potenzeascendenti nell’altra incognita, puo succedere che i coefficienti dei termini della seriedipendano essi stessi da equazioni che non hanno alcuna radice reale, cio che introdurranella serie altri immaginari di natura diversa da quelli ottenuti sviluppando le potenzedell’incognita26 ([24], pp. 216-217)

L’argomento di D’Alembert di natura globale mira ad eliminare l’ipotesi |U | ≪ 1:se F (x,U) = 0 e l’equazione di una curva algebrica x(U) nel piano complesso, quandoU descrive un segmento dell’asse reale, x(U) puo essere continuata assumendo solovalori reali o della forma p+ q

√−1.

Supponiamo, seguendo l’esposizione di Gigli [25], che U varı nell’intervallo [r, s]quando x assume valori reali. Questo intervallo puo sempre essere allargato, attri-buendo eventualmente ad x valori complessi. Infatti, se esistesse U∗ > r o U∗ < s nonraggiungibile da U(x), allora nell’intervallo (s,U∗) dovrebbe esistere un massimo T diU(x) e, tra U∗ ed r, dovrebbe esistere un minimo che corrisponde al valore p+ q

√−1

di x. Se pero si pone x = p + q√−1 in (6.4), si sviluppano i calcoli e si separano

parte reale da parte immaginaria si ottengono due equazioni in U , p e q che, previa

23Cependant personne, a ce que je sache, n’a encore demontre asses rigoureusement la veritede ce sentiment.

24Puisque la valeur qu’il trouve par cette methode n’etant qu’approchee, on pourraitsoupconner que la quantite que l’on neglige, quelque petite qu’elle soit, ne fut precisementcelle qui empecheroit qu’on ne put exprimer l’inconnue par une expression finie: [...] il arri-ve souvent qu’un terme qu’on croyoit negliger dans une serie, est cependant celui qui la faitchanger de nature.

25Cette demonstration est tres ingegneuse et ne laisse, ce me semble, rien a desirer du cotede l’exactitude: mais elle est indirecte, etant tiree de la consideration des courbes et des suitesinfinies, et elle porte naturellement a croire qu’on peut arriver au meme but par une analyseplus simple, fondee uniquement sur la theorie des equations.

26Cette demonstration est incomplete, car, quoique dans une equation a deux indetermineeson puisse toujours exprimer l’une des indeterminees par une serie de puissances ascendantesde l’autre indeterminee, il peut arriver que les coefficients des termes de la serie dependenteux memes dequations qui n’aient point de racines reelles, ce qui introduirait dans la seried’autres imaginaires que celles qui viennent des puisances de l’indeterminee.

Page 179: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.5. LA PRIMA DIMOSTRAZIONE DI GAUSS 179

eliminazione, si possono riscrivere come due equazioni, una in U e p, l’altra in U e q.Ora, U(x) assume valori nell’intervallo (s, T ) o in (T, r) per valori reali di p e q e potraassumere valori superiori a T (rispettivamente, inferiori) quando p e q sono numericomplessi. Si conclude dunque che, a patto di attribuire ad x valori complessi, U puoassumere qualsiasi valore reale per cui esistono valori reali o complessi di x per i qualiU = 0 e che dunque risolvono l’equazione algebrica.

Gauss critico l’uso fatto di quantita infinitesime come anche il repentino passaggioal finito ma l’ obiezione piu seria, che egli pero non evidenzio molto, e che il valorelimite α delle ascisse che danno luogo a valori complessi dell’ordinata non e detto cheproduca esso stesso un’ordinata di questo tipo, benche Gauss conceda che sia cosıalmeno per le funzioni algebriche. In mancanza della dimostrazione di questo fattopero Gauss afferma

Per questi motivi non posso ritenere soddisfacente la dimostrazione di D’Alembert.Ciononostante mi sembra che il vero punto nevralgico della dimostrazione possa esseremesso al riparo da ogni obiezione.27 [16]

6.5 La prima dimostrazione di Gauss

Nel corso della sua carriera Gauss propose quattro dimostrazioni del TFA benchel’ultima [26], pubblicata nel 1849, abbia molti tratti in comune con la prima, pubblicatanel 1799 quando Gauss era poco piu che ventenne. In mezzo, nel 1816, si trovano duealtre dimostrazioni: una—[27]—di natura algebrica, l’altra—[28]—analitica. In questasezione esaminiamo la prima dimostrazione che poggia su argomenti geometrici ed econtenuta nei §§13-24 di [16]. Considerata l’equazione

X(x) := xm +Axm−1 +Bxm−2 + · · ·+Kx2 + Lx+M = 0 (6.6)

in cui i coefficienti sono reali, oggi possiamo dire che l’idea e quella di sostituire x con

x = r(cosϕ+ i sinϕ), (6.7)

in (6.6), separare parte reale e parte immaginaria ed ottenere due funzioni T (r,ϕ)ed U(r, ϕ) che debbono avere almeno uno zero in comune: il teorema si ottiene ab-bassando ripetutamente il grado dell’equazione grazie alla radice cosı trovata. Comevedremo pero Gauss evita di introdurre quantita immaginarie nella dimostrazione. Neldettaglio, ecco come si snoda il suo ragionamento:• [16], §13: si dimostra questo

Lemma I. Dato un numero naturale m qualsiasi, la funzione

xm sinϕ− rm−1x sinmϕ+ rm sin(m− 1)ϕ (6.8)

e sempre divisibile per x2 − 2rx cosϕ+ r2.Dim. Infatti, per m = 1 (6.8) si annulla e dunque e divisibile per qualsiasi fattore;per m = 2 si verifica che il quoziente e sinϕ, mentre nel caso generale il quoziente e

xm−2 sinϕ+ rxm−3 sin 2ϕ+ r2xm−4 sin 3ϕ+ · · ·+ rm−2 sin(m− 1)ϕ,

come si verifica eseguendone il prodotto con x2 − 2rx cosϕ+ r2.

27Propter has rationes demonstrationem D’Alembertianam pro satisfaciente habere nequeo.Attamen hoc non obstante verus demonstrationis nervus probandi per omnes obiectionesinfringi mihi videtur.

Page 180: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

180 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

• [16], §14: si dimostra il seguenteLemma II. Se la quantita r e l’angolo ϕ sono determinati in modo che valgano leequazioni

rm cosmϕ+Arm−1 cos(m−1)ϕ+Brm−2 cos(m−2)ϕ+· · ·+Kr2 cos 2ϕ+Lr cosϕ+M = 0(6.9)

e

rm sinmϕ+Arm−1 sin(m−1)ϕ+Brm−2 sin(m−2)ϕ+ · · ·+Kr2 sin 2ϕ+Lr sinϕ = 0(6.10)

allora la funzione X(x) in (6.6) sara divisibile per il fattore di secondo grado x2 −2rx cosϕ + r2, quando r sinϕ 6= 0, mentre se r sinϕ = 0 X(x) sara divisibile per ilfattore di primo grado x− r cosϕ.Dim. Supponendo dapprima r sinϕ 6= 0, Gauss considera ciascun termine di (6.6),lo moltiplica per r sinϕ ed aggiunge due quantita opportune in modo da ottenereespressioni di tipo (6.8). Per il lemma I tutte le seguenti quantita e quindi anche laloro somma, sono allora divisibili per x2 − 2rx cosϕ+ r2:

rxm sinϕ −rmx sinmϕ rm+1 sin(m− 1)ϕArxm−1 sinϕ −Arm−1x sin(m− 1)ϕ +Arm sin(m− 2)ϕBrxm−2 sinϕ −Brm−2x sin(m− 2)ϕ +Brm−1 sin(m− 3)ϕ

etc. etc.Krx2 sinϕ −Kr2x sin 2ϕ +Kr2 sinϕLrx sinϕ −Lrx sinϕ ∗Mr sinϕ ∗ +Mr sin(−ϕ)

Sommando ordinatamente colonna per colonna, si osserva che la somma della primacolonna equivale ad r sinϕX(x), la somma della seconda colonna si annulla in virtudi (6.10) mentre l’uguaglianza a zero della somma della terza colonna si ottiene mol-tiplicando (6.9) per sinϕ, (6.10) per cosϕ e sottraendo il primo prodotto dal secondo.Resta dimostrato il lemma nel caso r sinϕ 6= 0. Se r = 0, da (6.9) segue M = 0ed X e divisibile per x = x − r cosϕ. Se sinϕ = 0 allora cosϕ = ±1 e dunquecosnϕ = (cosϕ)n per cui la (6.9) si riduce a X(r cosϕ) = 0 e dunque X e divisibileper x− r cosϕ, completando la dimostrazione del lemma.• [16], §15: Gauss osserva che il lemma II e stato gia dimostrato da Eulero nella

Introductio in Analysin Infinitorum (Tomo I, p.110) con il ricorso alle quantita im-maginarie. Gauss ritiene un pregio della sua dimostrazione proprio l’aver evitato ilricorso agli immaginari. Ricordiamo ancora una volta che non era chiaro a tutti comele quantita immaginarie (cioe non reali) ottenibili come radici di equazioni algebrichevenissero esaurite da quelli che oggi chiamiamo numeri complessi. Con i lemmi I e IIGauss riduce la dimostrazione del TFA a far vedere che, assegnata una funzione X(x)data da (6.6), e sempre possibile determinare r e ϕ in modo che valgano (6.9) e (6.10).• [16], §16: entra in scena l’argomentazione geometrica. Tracciata (6.1) la retta CG

passante per un punto fisso C e fissata un’unita di misura, siano r e ϕ rispettivamente ladistanza di un punto P da C e l’ampiezza dell’angolo ∠GCP 28. Si tracci il segmentoperpendicolare al piano contenente C e P , passante per P ed avente distanza (consegno) dal piano di riferimento

T (r,ϕ) = rm sinmϕ+ Arm−1 sin(m− 1)ϕ+ · · ·+ Lr sinϕ : (6.11)

28Osserviamo come l’origine degli angoli sia il semiasse orizzontale a sinistra dell’origine,con gli angoli contati positivamente in verso orario.

Page 181: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.5. LA PRIMA DIMOSTRAZIONE DI GAUSS 181

G G′C

P

Figura 6.1: La posizione di un punto P del piano e individuata dalla sua distan-za rispetto ad un’origine C e dall’angolo PCG contato positivamente in versoorario, con convenzione pertanto opposta a quella adottata oggi.

al variare di P nel piano, T (r,ϕ) descrive una superficie che Gauss chiama superficieprima per distinguerla dalla superficie seconda

U(r, ϕ) = rm cosmϕ+ Arm−1 cos(m− 1)ϕ+ · · ·+ Lr cosϕ+M : (6.12)

entrambe le superficie sono continue e, da qualche parte (quaquaversum), diventanoinfinite.• [16], §17: si studiano le proprieta delle superficie prima e seconda. Si suppone di

prendere r tanto grande da rendere trascurabili rispetto al primo tutti i termini di T edU : per scelte opportune di ϕ e sempre possibile dare segni opposti al termini dominantiin T ed U che dunque taglieranno il piano (r, ϕ) lungo due curve di equazione T = 0ed U = 0, rispettivamente. Queste curve vengono chiamate da Gauss la prima e laseconda curva e possono essere formate da piu rami: ad esempio, la curva T = 0 hacome rami le semirette ϕ = 0 ∪ ϕ = π. Occorre ora dimostrare che queste curvehanno almeno un punto in comune.• [16], §18: entrambe le curve T = 0 ed U = 0, una volta espresse in coordiante

cartesiane ortogonali ponendo x = r sinϕ ed y = r cosϕ, sono algebriche di ordine min quanto, qualunque sia l’intero n, valgono gli sviluppi

rn sinnϕ = nxn−1y − n(n− 1)(n− 2)

1 · 2 · 3 xn−3y3 +n · · · (n− 4)

1 · · · 5 xn−5y5 − · · ·

e

rn cosnϕ = xn − n(n− 1)

1 · 2 xn−2y2 +n · · · (n− 3)

1 · · · 4 xn−4y4 − · · ·

da cui si deduce che nello sviluppo di T ed U compaiono termini della forma αxayb

dove gli interi positivi a e b hanno somma al piu n e che T ammette y come fattore.Il momento saliente dell’analisi (maioris momenti investigatio) e lo studio del com-portamento asintotico delle due curve per grandi valori di r. Quando r e infinito,fattorizzato rm, la curva T (r,ϕ) = 0 si riduce a

sinmϕ+A

rsin(m− 1)ϕ+

B

r2sin(m− 2)ϕ+ · · · = 0

e dunque si confonde (confondetur) per r ≫ 1 con la curva di equazione sinmϕ = 0formata da 2m semirette che si intersecano nell’origine C, individuate da

ϕ =kπ

m, con k = 0, 1, · · · 2m − 1

e tagliano in 2m parti uguali la circonferenza di raggio infinitamente grande. Un’analisisimile condotta sulla curva U = 0 rivela che, per r infinito, essa si confonde con lacurva cosmϕ = 0 che e ancora formata da 2m semirette di equazioni

ϕ =(2k + 1)π

2m, con k = 0, · · · 2m− 1

Page 182: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

182 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

T = 0

T = 0T = 0

U = 0

U = 0

U = 0

Figura 6.2: Le curve U = 0 e T = 0 costruite per l’equazione x3 + 1 = 0 sonoqui riportate: T = 3x2y−y3 si spezza in tre rette mentre U = x3−3xy2+1 = 0ha per asintoti le rette tratteggiate. In [16] la figura tracciata corrisponde adun’equazione di quarto grado.

che bisecano le semirette limite per la curva T = 0 (si veda la Fig. 6.2 costruitasull’esempio x3 + 1 = 0, come in [29]).Gauss conclude il paragrafo annunciando una dimostrazione dello stesso risultato chenon coinvolga grandezze infinitamente grandi che possono urtare la sensibilita del letto-re: Siccome pero le conclusioni sono di capitale importanza e le quantita infinitamentegrandi possono urtare qualche lettore, mostrero nell’articolo successivo come eliminarlecosı come togliere ogni aiuto derivante dagli infiniti.29 ([16], p.24).

• [16], §19: Gauss dimostra lo stesso risultato di prima senza il ricorso a quantitainfinite:Teorema: Fermo restando tutto come sopra, e possibile tracciare un cerchio di centroC sulla cui periferia vi siano 2m punti dove T = 0 insieme ad altrettanti punti neiquali U = 0 e disposti in modo che ciascun punto della seconda famiglia sia compresotra due punti della prima famiglia.

Dim. Si ponga S = |A|+ |B|+ · · ·+ |K|+ |L|+ |M | e si scelga

R > maxS√2, 1. (6.13)

Il cerchio di centro C e raggio R soddisfa le condizioni del teorema. Infatti, affermaGauss, segnati sulla circonferenza i punti (1), (3),..., (8m− 1) tali che

ϕ =45

mϕ = 3

45

mϕ = 5

45

m· · · ϕ = (8m− 1)

45

m,

29Quum vero conclusiones maximi momenti sint, quantitatesque infinite magnae quosdamlectores offendere possint: illas etiam absque infinitorum subsidio in art. sequ. eruere docebo

Page 183: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.5. LA PRIMA DIMOSTRAZIONE DI GAUSS 183

cioe della forma ϕ = π4m

(2k − 1), con k = 1, . . . , 4m, si dimostra che tra i punti (1) e(3) esiste un unico punto dove T = 0 e similmente ne esiste uno solo compreso tra (3)e (5), e cosı via per un totale di 2m punti in cui T = 0. Gauss osserva, grazie a (6.11),che

T

(

R,45

m

)

= Rm−1

(R√2+ A sin(m− 1)ϕ+

B

Rsin(m− 2)ϕ+ · · ·+ L

Rm−2sinϕ

)

e, per le limitazioni su R e la definizione di S

T

(

R,45

m

)

≥ Rm−1

(R√2− |A| − |B| − · · · − |L|

)

> 0

sicche nel punto (1) T e positiva. L’argomento si puo in effetti ripetere fino al punto(3) perche nel muoversi da (1) a (3) mϕ ∈ (45, 135) dove sinmϕ > 1√

2. Allo stesso

modo si conclude che T > 0 in tutti gli intervalli che conducono dal punto (8k + 1)al punto (8k + 3). Al contrario, poiche sinmϕ < − 1√

2negli intervalli che portano

dal punto (8k + 5) al punto (8k + 7) si conclude che lungo quest’arco T deve esserenegativo. Poiche nel punto (3) T > 0 mentre in (5) si ha T < 0 occorre che T si annullida qualche parte nell’intervallo tra (3) e (5): similmente deve esserci almeno uno zerotra (7) e (9), tra (11) e (13) e cosı via fino all’ultimo zero nell’intervallo tra (8m−1) ed(1) per cui vi sono almeno 2m punti della circonferenza descritta dove T = 0. Occorreora provare che i punti in cui T si annulla sono esattamente 2m. Poiche gia si e vistoche vi sono intervalli nei quali certamente non possono cadere soluzioni di T = 0, nonresta che far vedere come in intervalli quali quello tra (3) e (5) non possa cadere piudi una soluzione di T = 0. Se cosı non fosse ma vi fossero in tale intervallo almenodue soluzioni, dovrebbe esistere un punto nello stesso intervallo in cui T e massimo ominimo e dove dunque si avrebbe

dT

dϕ= mRm−2

(

R cosmϕ+m− 1

mA cos(m− 1)ϕ+ · · ·

)

= 0

ma dal momento che nell’intervallo tra (3) e (5) cosmϕ e sempre negativo e >√

12

(sic!), ovvero e < −√

12si conclude, con un argomento simile a quello gia usato sopra,

che dTdϕ

< 0 in tutto l’intervallo considerato, rendendo impossibile l’esistenza di due opiu zeri. Ripetendo le stesse considerazioni per U(R,ϕ) si conclude che U e positivain quelli compresi tra (8k + 3) ed (8k + 5) e negativa negli intervalli compresi tra ipunti (8k+7) e (8k+9), da cui si ottengono esattamente 2m punti della circonferenzaconsiderata nei quali U si annulla. A conclusione della dimostrazione Gauss osservache il risultato secondo cui le radici di T = 0 od U = 0 sulla circonferenza r = 0sono 2m si potrebbe dimostrare con il ricorso a considerazioni di geometria superiore(geometria sublimiori) osservando (teorema di Bezout) che una curva algebrica diordine m non puo essere intersecata da una curva algebrica di secondo ordine (comeuna circonferenza) in piu che 2m punti. Gauss sembra dunque voler privilegiare unargomento di natura elementare.• [16], §20: Gauss affronta il problema della dipendenza delle soluzioni di T =

ed U = 0 dal valore di R iniziando ad osservare che gli argomenti precedenti valgonoper circonferenze di raggio r maggiore del valore di R dato dalla (6.13) ed ancheper circonferenze di raggio minore, purche valga la limitazione r > maxS

√2, 1 ed

asserisce, senza dimostrazione (perspicietur facile), che queste soluzioni si spostano con

Page 184: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

184 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

b

(0)(2p)

(1)(n)

(2)(n′)

(h)(h+ 2)

(h+ 1)

Figura 6.3: L’argomento per assurdo utilizzato da Gauss per mostrare che laprima e la seconda curva T = 0 ed U = 0 possiedono un’intersezione in comune.

continuita al variare di r. Da questa osservazione Gauss conclude che le circonferenzecon raggio r > maxS

√2, 1 sono tagliate trasversalmente (secari) da rami delle curve

T = 0 ed U = 0 in modo che due rami successivi della curva T = 0 sono separati daun ramo della curva U = 0 e viceversa.

• [16], §21: Occorre ora dimostrare l’esistenza di almeno una radice comune aT = 0 ed U = 0. I punti di intersezione tra la circonferenza di raggio R ed i varirami di T = 0 sono indicati con numeri pari: (0), (2),....,(2m) mentre le intersezionicon U = 0 sono indicati con numeri dispari: (1), ....(2m − 1). Gauss ricorre ancoraalle proprieta delle curve algebriche per asserire che un ramo di tali curve che non siachiuso deve necessariamente estendersi all’infinito, visto che non puo avere singolaritacome la spirale logaritmica o la curva y = 1/ log x. Dunque i rami che entrano inuna regione finita dovranno necessariamente uscirne. Questa conclusione, applicata airami di T = 0 ed U = 0 che si separano tra loro, permettera di dedurre l’esistenza diun punto comune tra due rami di queste curve e dunque di dimostrare il TFA.

• [16], §22: Gauss suppone per assurdo che un ramo di T = 0 che congiungedunque due punti pari non intersechi un ramo della curva U = 0 che connette duepunti dispari. Poiche l’asse ϕ = 0 e un ramo della curva che unisce i punti (0) e (2p),i punti di intersezione delle due curve T (r,ϕ) = 0 e U(r′ϕ) = 0 con la circonferenzar = R che non giacciono al di sotto dell’asse x sono in numero dispari. Ora, il punto(1) dovra connettersi con un altro punto dispari di indice n < 2m e, in particolare,non potra attraversare l’asse ϕ = 0 (Figura 6.3). Similmente (2) sara unito ad unaltro punto pari di indice n′ < n e cosı via finche si arriva ad un punto con indice hche dovra collegare il punto di indice (h+ 2): questo ramo pero dovra essere tagliatonecessariamente da quello che parte dall’ultimo punto rimasto, (h+1), contro l’ipotesidi partenza.

• [16], §23: Conclusa la dimostrazione geometrica del TFA, Gauss afferma cheper brevita non dimostra come effettivamente i rami delle curve T = 0 ed U = 0 siintersechino. Egli osserva che si potrebbe anche condurre una dimostrazione analitica

Page 185: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.6. LA TERZA DIMOSTRAZIONE DI GAUSS 185

del teorema che pero risulterebbe troppo astratta.• [16], §24: in questo paragrafo conclusivo, Gauss stabilisce un parallelismo con

la dimostrazione di D’Alembert per mostrare come l’essenza delle dimostrazioni siala stessa. Non effettua una dimostrazione dell’equivalenza ma propone argomentieuristici stringenti a favore di quanto asserito.

Questa dunque la prima dimostrazione di Gauss che, per essere completamenterigorosa secondo le richieste attuali, dovrebbe giustificare alcuni punti circa il compor-tamento delle curve algebriche: questi dettagli tecnici sono stati forniti da AlexandreOstrowski nel 1920: Gauss non sembra esserne preoccupato forse perche ha gia intra-visto modi diversi di dimostrare il teorema come asserisce in una nota a pie’ di paginadi [16].

6.6 La terza dimostrazione di Gauss

Questa dimostrazione, contenuta in una breve nota trasmessa alla Societa delle Scien-ze di Gottingen il 30 gennaio 1816, e la piu breve ed apparve in coda alla secondadimostrazione, di natura algebrica. La brevita di questa dimostrazione e tale cheGauss stesso dichiara di preferirla di gran lunga alla precedente quanto a semplicita:e riguardo a semplicita sembra di gran lunga da preferire a quella.30 ([28], p. 59)

Si parte ancora da (6.6) con coefficienti reali, dunque e si costruiscono le funzioni

t(r,ϕ) := rm cosmϕ+ Arm−1 cos(m− 1)ϕ+ · · ·+ Lr cosϕ+M,

u(r, ϕ) := rm sinmϕ+Arm−1 sin(m− 1)ϕ+ · · ·+ Lr sinϕ,

t′(r, ϕ) := mrm cosmϕ+ (m− 1)Arm−1 cos(m− 1)ϕ+ · · ·+ Lr cosϕ

u′(r,ϕ) := mrm sinmϕ+ (m− 1)Arm−1 sin(m− 1)ϕ+ · · ·+ Lr sinϕ,

t′′(r,ϕ) := m2rm cosmϕ+ (m− 1)2Arm−1 cos(m− 1)ϕ+ · · ·+ Lr cosϕ

u′′(r,ϕ) := m2rm sinmϕ+ (m− 1)2Arm−1 sin(m− 1)ϕ+ · · ·+ Lr sinϕ :

chiaramente si ha

t′ = r∂t

∂r, t′′ = r

∂t′

∂ru′ = r

∂u

∂r, u′′ = r

∂u′

∂r.

Gauss definisce la funzione

y(r,ϕ) :=(t2 + u2)(tt′′ + uu′′) + (tu′ − ut′)2 − (tt′ + uu′)2

r(t2 + u2)2(6.14)

le cui singolarita possono derivare solo dall’annullamento simultaneo di t ed u dalmomento che r e fattorizzabile al numeratore. Ora Gauss considera un valore R taleche

R > maxm|A|√2,

m|B|√2,

3

m|C|√2,

4

m|D|√2, · · · > 0 (6.15)

e dimostra che(tt′ + uu′)(R,ϕ) > 0 ∀ϕ ∈ [0, 2π)

Infatti, introdotte le funzioni

T (R,ϕ) := Rm cos 45 + ARm−1 cos(45 + ϕ) +BRm−2 cos(45 + 2ϕ)+· · ·+ LR cos(45 + (m− 1)ϕ) +M cos(45 +mϕ),

30et respectu simplicitatis illi longissime praeferenda videtur.

Page 186: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

186 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

U(R,ϕ) := Rm sin 45 + ARm−1 sin(45 + ϕ) +BRm−2 sin(45 + 2ϕ)+· · ·+ LR sin(45 + (m− 1)ϕ) +M sin(45 +mϕ),

T ′(R,ϕ) := mRm cos 45 + (m− 1)ARm−1 cos(45 + ϕ) + (m− 2)BRm−2 cos(45 + 2ϕ)+· · ·+ LR cos(45 + (m− 1)ϕ) +M cos(45 +mϕ),

U ′(R,ϕ) := mRm sin 45 + (m− 1)ARm−1 sin(45 + ϕ) + (m− 2)BRm−2 sin(45 + 2ϕ)+· · ·+ LR sin(45 + (m− 1)ϕ) +M sin(45 +mϕ),

si osserva che, ad esempio, T si puo riscrivere come

T (R,ϕ) = Rm−1

m√

2[R +mA

√2 cos(45 + ϕ)]

+Rm−2

m√

2[R2 +mB

√2 cos(45 + 2ϕ)]

+Rm−3

m√

2[R3 +mC

√2 cos(45 + 3ϕ)]

+Rm−4

m√

2[R4 +mD

√2 cos(45 + 4ϕ)]

+etc.

dove si e osservato che

Rm =Rm−1

m√2[

m volte︷ ︸︸ ︷

R + · · ·+R].

I termini di ciascuna riga sono tutti positivi in virtu della restrizione (6.15): similmentee possibile concludere che T ′(R,ϕ), U(R,ϕ) ed U ′(R,ϕ) sono positive per cui lo e anchela funzione TT ′ + UU ′. Ora, posto r = R nelle funzioni t, t′, u ed u′ si vede che

t(R,ϕ) = T cos(45 +mϕ) + U sin(45 +mϕ)u(R,ϕ) = T sin(45 +mϕ)− U cos(45 +mϕ)t′(R,ϕ) = T ′ cos(45 +mϕ) + U ′ sin(45 +mϕ)u′(R,ϕ) = T ′ sin(45 +mϕ)− U ′ cos(45 +mϕ)

da cui si conclude che (tt′ + uu′)(R,ϕ) = TT ′ + UU ′ > 0. In modo analogo si puomostrare che (t2+u2)(R,ϕ) = T 2+U2 > 0 e quindi per nessun valore di R che verifichila (6.15) si puo avere t = 0 ed u = 0 simultaneamente.

Dopo queste considerazioni generali, Gauss dimostra il teorema che equivale alTFA.Teorema: esistono valori di r ∈ [0, R] e ϕ ∈ [0, 360) per i quali si ha allo stesso tempot = 0 ed u = 0.Supponiamo falso il teorema per cui t2 + u2 > 0 nel disco di raggio R considerato edunque la funzione y definita in (6.14) e finita ovunque nel disco. Consideriamo alloral’integrale doppio

∫ R

0

∫ 360

0

ydrdϕ

che deve avere un valore Ω finito. Per determinare Ω integriamo dapprima in ϕ e poiin r. Una derivazione rispetto a ϕ consente di verificare che

∫ 360

0

ydϕ =tu′ − ut′r(t2 + u2)

∣∣∣∣

360

0

= 0 = Ω.

D’altro canto una derivazione rispetto ad r conduce a

∫ R

0

ydr =tt′ + uu′

(t2 + u2)

∣∣∣∣

R

0

=TT ′ + UU ′

T 2 + U2> 0

Page 187: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

6.6. LA TERZA DIMOSTRAZIONE DI GAUSS 187

sicche, integrando in ϕ si otterra un valore strettamente positivo di Ω, in contrasto aquanto ottenuto sopra. Dunque la funzione y non puo essere finita dappertutto neldisco di raggio R e la divergenza puo essere solo dovuta all’annullamento simultaneodi t ed u. Detti g e G i valori di r e ϕ che annullano sia t che u si osserva che, postox = r(cosϕ+

√−1 sinϕ) la funzioneX definita in (6.6) si trasforma in t+

√−1u, mentre

sostituendo x = r(cosϕ−√−1 sinϕ) in X questa si riduce a t−

√−1u. In particolare

X si annulla sia in x = g(cos G+√−1 sin G) sia in x = g(cos G−

√−1 sin G) e dunque

risultera divisibile sia per x−g(cos G+√−1 sin G) che per x = g(cos G−

√−1 sin G),

cioe per il trinomio x2−2g cos Gx+g2 che si riduce al binomio x∓g qualora sia sinG =0 e cosG = ±1 o g = 0. Notiamo come ora Gauss, a differenza della dimostrazionedel 1799, utilizza liberamente la rappresentazione dei numeri complessi.

Page 188: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

188 CAPITOLO 6. IL TEOREMA FONDAMENTALE DELL’ALGEBRA

Page 189: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] C. Gilain: Sur l’histoire du theoreme fondamental de l’algebre: theorie desequations et calcul integral. Archives for the History of Exact Sciences 42, (1991),91-137.

[2] K. Manders: Algebra in Roth, Faulhaber, and Descartes. Historia Mathematica33, (2006), 184-209.

[3] A. Girard: Invention Nouvelle en l’Algebre, Blaeuw, Amsterdam, (1629).Ristampata a cura di D. Bierens de Haan, Leida, (1884).

[4] The Geometry of Rene Descartes with a fac-simile of the first edition, translatedfrom the French and Latin by D.E. Smith and M.L. Latham, Dover, New York,(1954). Riproduzione dell’edizione del 1925 pubblicata da Open Court Publishers.

[5] I. Newton: Arithmetica Universalis; sive de compositione et resolutionemarithmetica liber. Lione, Verbeek, (1732).

[6] G.W. Leibniz: Specimen novum analyseo pro scientia infiniti circa summas etquadraturas. Acta Eruditorum, 210-219, (1702).

[7] J.-P. Tignol: Galois’ Theory of Algebraic Equations. World Scientific, Singapore,(2001).

[8] R. Cotes: An account of the book intituled Harmonia Mensurarum. Phil. Trans.R. Soc. London 32, (1722), 139-150.

[9] A. Agostini: Il teorema fondamentale dell’algebra. Periodico di matematiche 24,(1922), 307-327.

[10] C. MacLaurin: A Treatise of Fluxions. II Vols., Edinburgh, (1742).

[11] C. MacLaurin: A Treatise of Algebra. London, (1748).

[12] L. Euler: De integratione aequationum differentialium altiorum graduum, (1743).

[13] G. Enestrom: Der briefwechsel zwischen Leonhardt Euler und Johann I Bernoulli.Bibliotheca Mathematica 6, (1905), 16-87.

[14] L. Euler: Introductio in Analysin Infinitorum. 2 voll. Lausanne: Bousquet (1748).

[15] L. Euler: Recherches sur les racines imaginaires des equations. Mem. Acad.Sciences Berlin, (1751), 222–288.

[16] C.F. Gauss: Demonstratio nova theorematis omnem functionem algebraicam ra-tionalem integram unius variabilis in factores reales primi vel secundi gradusresolvi posse. Helmstadt, (1799). In Carl Friedrich Gauss Werke, vol. III, 1-30,(1866).

189

Page 190: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

190 BIBLIOGRAFIA

[17] Daviet de Foncenex: Reflexions sur les quantites imaginaires. Miscellaneaphilosophica-mathematica Societatis privatae Taurinensis, 1, (1759) 113–146.

[18] J.-L. Lagrange: Sur la forme des racines imaginaires des equations. NouveauxMemoires de l’Academe de Berlin, (1772), 222-258. In Œuvres, vol. III, 479-516.

[19] P.-S. de Laplace: Lecons de mathematiques donnees a l’Ecole normale en 1795.In Œuvres, vol. XIV, 10-177.

[20] G. Loria: Il teorema fondamentale della teoria delle equazioni algebriche. RivistaMatematica, 1, (1891), 185-248.

[21] C. Balthus: D’Alembert’s proof of the fundamental theorem of algebra. HistoriaMathematica, 31, (2004), 414-428.

[22] J. le Rond d’Alembert: Recherches sur le calcul integral. Proces-verbaux del’Academie royale des sciences de Paris, (1745), 102–123.

[23] J. le Rond d’Alembert: Recherches sur le calcul integral. Memoires l’Academiede Berlin, (1746), 182–224.

[24] J.L. Lagrange: Traite de la resolution des equations numeriques de tous les degres,avec des notes sur pluiseurs points de la Theorie des equations algebriques, Cour-cier, Paris, (1808). InŒuvers Completes, vol. 3, J.A. Serret, Ed., Gauthier-Villars,Paris, (1869), 11-370.

[25] D. Gigli: Numeri complessi a due e a piu unita. In Questioni riguardanti lematematiche elementari (curatore: F. Enriques). Parte I: Critica dei Principii,Vol. II. Zanichelli, Bologna, 133–270, (1925).

[26] C.F. Gauss: Beitrage zur Theorie der algebraischen Gleichungen. GottingerAbhandlungen 4 (1850). In Carl Friedrich Gauss Werke, vol. III, 71–102, (1866).

[27] C.F. Gauss: Demonstratio nova altera theorematis omnem functionem algebrai-cam rationalem integram unius variabilis in factores reales primi vel secundigradus resolvi posse. Commentationes recentiores 3, Gottingen, (1816). In CarlFriedrich Gauss Werke, vol. III, 31–56, (1866).

[28] C.F. Gauss: Theorematis de resolubilitatem functionum algebraicarum inte-grarum in factores reales demonstratio tertia. Commentationes recentiores 3,Gottingen, (1816). In Carl Friedrich Gauss Werke, vol. III, 57-64, (1866).

[29] S. Maracchia: Storia dell’Algebra. Liguori, Napoli, (2005).

Page 191: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 7

Metodi generali di

risoluzione: Lagrange e

Vandermonde

7.1 Lagrange e la risoluzione algebrica delle equa-

zioni

Lagrange dedico diverse memorie alle equazioni algebriche ed i suoi contributi princi-pali riguardano: 1) l’aver messo in luce i tratti comuni a tutti i metodi di soluzionealgebrica delle equazioni fino allora escogitati riuscendo a mostrare l’importanza del-le permutazioni effettuate sulle radici di un’equazione come linea guida per decideredella risolubilita di un’equazione e come base di un metodo unificante di risoluzione;2) lo studio di metodi per la risoluzione numerica delle equazioni algebriche. Il lavorofondamentale di Lagrange per il primo aspetto e la corposa memoria Reflexions sur laResolution Algebrique des equations [1] pubblicata in due parti tra il 1770 ed il 1771mentre per la risoluzione numerica, il testo piu importante e il Traite de la Resolutionnumerique des equations [2] in cui Lagrange amplia il contenuto di memorie apparsesull’argomento a partire dal 1769 e che pure dedica una Nota (la XIII) all’esposizionedei risultati piu originali delle Reflexions. L’importanza del lavoro di Lagrange nelproporre un punto di vista nuovo ed unificante da cui sapra trarre profitto Galois estata sottolineata in diversi lavori storici come [3], dedicato ad un’ampia panoramicadei contributi di Lagrange, [4] che esamina, tra le altre cose, l’influenza dell’operadi Lagrange nello sviluppo della teoria di Galois e [5] dove si evidenzio il contributopionieristico di Lagrange alla teoria delle permutazioni. Ci soffermeremo alquanto inquesto capitolo sul contenuto delle Reflexions che in effetti ha esercitato un influssonotevole sui matematici delle generazioni successive ed e stato fonte di ispirazione permolti.

Le Reflexions si articolano in quattro grandi sezioni: la prima e la seconda trattanoi metodi noti per la risoluzione di equazioni di terzo e quarto grado esaminati alla lucedi un nuovo principio guida: il comportamento delle radici di un’equazione ausiliariasotto l’azione di permutazioni tra le radici dell’equazione proposta. La terza sezio-

191

Page 192: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

192CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

ne esamina il comportamento dei metodi piu generali per la risoluzione di equazionialgebriche—metodi di Tschirnhaus, Eulero e Bezout—di fronte alla risoluzione delleequazioni di quinto grado cercando di comprendere i motivi dei loro fallimenti. Infinela quarta sezione, la piu innovativa, considera il problema generale delle trasforma-zioni di equazioni di grado qualunque che portano ad abbassarne il grado e quindi apermetterne la risolubilita algebrica.

Lagrange dichiara sin dall’introduzione delle Reflexions l’obiettivo che il suo lavorosi prefigge: In questa Memoria mi propongo di esaminare i metodi differenti trovati sinoal momento presente per la risoluzione algebrica delle equazioni, di ridurli a principıgenerali e di far vedere a priori perche questi metodi hanno successo per il terzo ed ilquarto grado e sono in difetto per i gradi maggiori.

Questo esame presenta un doppio vantaggio: da un lato servira a gettare piu lucepossibile sulle soluzioni note di terzo e quarto grado; d’altra parte esso sara di aiuto aquanti vorranno occuparsi della soluzione dei gradi piu alti, fornendo loro diversi puntidi vista sull’argomento e soprattutto risparmiando loro un gran numero di passi falsie tentativi inutili.1 ([1], pp. 206-207)

In questo passo si trova la parola chiave per comprendere l’approccio di Lagrange alproblema della risoluzione algebrica delle equazioni: a priori. Occorre comprendere apriori perche i metodi proposti funzionano e non limitarsi, come si era sempre fatto sinoa quel momento, ad un’analisi a posteriori, cioe a risultato ottenuto, della validita delmetodo proposto. Solo ponendosi seriamente la domanda del perche un certo metodofunzioni e possibile guidare i passi successivi della ricerca, volti alla risoluzione diequazioni di grado maggiore.

Vediamo l’esame che Lagrange opera di due metodi di soluzione per equazioni diterzo grado: il metodo di Viete e quello di Tschirnhaus. Mentre il primo e per suanatura limitato alla soluzione di equazioni di grado n = 3, il secondo ricorre invecead una trasformazione generalizzabile a valori piu grandi di n e dunque promettenteper ottenere una soluzione algebrica in generale. Se torniamo ai metodi esposti nelCapitolo 4 di queste dispense abbiamo visto come le radici dell’equazione da risolverevengano espresse in termini delle radici di un’equazione ausiliaria (che Lagrange chiamaridotta, reduit, perche e l’equazione alla cui soluzione si riduce quella dell’equazionedi partenza.2 ([1], p. 213), la cui soluzione e nota. Lagrange ha l’idea vincente diaffrontare la strada in senso inverso, esprimendo le radici della ridotta in termini diquelle dell’equazione proposta per ricavare le proprieta della ridotta che permettonola soluzione dell’equazione proposta.

Per le equazioni di terzo grado Lagrange considera la forma completa

x3 +mx2 + nx+ p = 0 (7.1)

1Je me propose dans ce Memoire d’examiner les differentes methodes que l’on a trouveesjusqu’a present pour la resolution algebrique des equations, de les reduire a des principesgeneraux, et de faire voir a priori pourquoi ces methodes reussissent pour le troisieme et lequatrieme degre, et sont en defeaut pour les degres ulterieurs Cet examen aura un doubleavantage: d’un cote il servira a repandre une plus grande lumiere sur les resolutions connuesdu troisieme et du quatrieme degre; de l’autre il sera utile a ceux qui voudront s’occuper de laresolution des degres superieurs, on leur furnissant differentes vues pour cet objet et en leurepargnant surtout un grand nombre de pas et de tentatives inutiles.

2s’appelle la reduite (...) parce que c’est a sa resolution que se reduit celle de la proposee.

Page 193: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.1. LAGRANGE E LARISOLUZIONE ALGEBRICADELLE EQUAZIONI193

e chiama x1, x2 ed x3 le sue radici3. Effettuata la trasformazione x = x′ − m3, (7.1) si

trasforma, come e noto, inx′3 + n′x′ + p′ = 0

dove i coefficienti n′ e p′ si esprimono in funzione di quelli dati attraverso le relazioni

n′ = n− m2

3p′ = p− mn

3+

2m3

27.

A questo punto si effettua la trasformazione di Viete x′ = y− n′

3ye si ottiene la ridotta

y6 + p′y3 − n′3

27= 0 (7.2)

che, detta

r :=3

−p′

2+

p′2

4+n′3

27, (7.3)

e risolta day1 = r y2 = αr y3 = α2r = βr (7.4)

dove α e β = α2 sono le radici cubiche complesse dell’unita, distinte da 1. Grazie a(7.4) ed effettuando a ritroso le trasformazioni che hanno condotto alle yi, Lagrange ein grado di ricavare

x1 = −m3+ r − s

x2 = −m3+ αr − s

α

x3 = −m3+ βr − s

β

(7.5)

dove si e posto s := n′

3r. Lagrange mette in atto la sua idea di esprimere r come

funzione delle xi e per questo inizia ad osservare che, da (7.5), si ha

x1 − x2 = (1− α)(r + s

α

)

x1 − x3 = (1− β)(

r + sβ

)

da cui si ottiene dapprima

αr + s =α(x1 − x2)

1− α e βr + s =β(x1 − x3)

1− β

e poi, sottraendo tra loro queste equazioni con alcuni passaggi diretti

r =x1

(1− α)(1− β) +αx2

(α− 1)(α− β) +βx3

(β − α)(β − 1).

Per semplificare ulteriormente quest’equazione Lagrange osserva che, dal momento che1, α e β sono radici di x3 − 1 = 0 si puo scrivere

x3 − 1 = (x− 1)(x− α)(x− β)

che, dopo una derivazione, fornisce

3x2 = (x− α)(x− β) + (x− 1)(x− β) + (x− 1)(x− α) :3Nell’originale Lagrange indica le radici di (7.1) con a, b, c. Ho proferito adottare una

notazione piu vicina a quella attuale ed anche a quella impiegata da Lagrange nella Nota XIIIdel Traite.

Page 194: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

194CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

calcolando questa derivata in x = 1, x = α ed x = β si ottengono le relazioni

3 = (1− α)(1− β) 3α2 = (α− 1)(α− β) 3β2 = (β − 1)(β − α)

da cui e possibile infine ottenere

r =x1 + αx3 + βx2

3=: y1, (7.6)

che rappresenta la relazione tra la radice y della ridotta e le radici dell’equazione dipartenza. Lagrange e ora in grado di rispondere alla domanda che serve a svelare laratio nascosta dietro questo metodo di soluzione delle equazioni di terzo grado. Perche,in primo luogo, la ridotta e un’equazione di sesto grado? E in questo momento cheentrano in scena le permutazioni

Si vede allora da questa espressione perche la ridotta e necessariamente di sestogrado; infatti, siccome tale ridotta non dipende immediatamente dalle radici x1, x2, x3

dell’equazione proposta ma solo dai coefficienti m, n e p nei quali le tre radici entranoin modo equivalente, e chiaro che nell’espressione di y deve essere possibile scambiaretra loro a piacere le quantita x1, x2, x3; di conseguenza la quantita y dovra averetanti valori distinti quanti se ne possono formare con tutte le permutazioni possibilitra le tre radici x1, x2 e x3; e noto dalla teoria delle combinazioni che il numero dipermutazioni, cioe degli arrangiamenti differenti di tre cose e 3 · 2 · 1; dunque anche laridotta in y deve essere di grado 3 · 2 · 1, cioe del sesto4 ([1], pp. 215-216). Dunuqe,permutando tra loro x1, x2 ed x3 in (7.6), sono ugualmente radici della ridotta

y2 = x1+αx3+βx2

3, y3 = x2+αx1+βx3

3y4 = x2+αx3+βx1

3

y5 = x3+αx2+βx1

3, y6 = x3+αx1+βx2

3

D’altra parte, che debba essere cosı e conseguenza della arbitrarieta con cui sono stateassociate le xi alle radici della ridotta.

Chiarito dunque il motivo per cui la ridotta e di sesto grado, Lagrange risponde allaseconda domanda cruciale: perche la ridotta si puo risolvere al modo di un’equazionedi secondo grado o, meglio, perche si spezza nella soluzione di un’equazione di secondogrado ed in una di terzo pura? Per rispondere, Lagrange richiama alcune proprietafondamentali delle radici dell’unita α e β. Si ha infatti α = β2 e, dal momento cheα3 = β3 = 1, si hanno sia αβ = 1 che α2 = β. Grazie a queste relazioni si verificache, moltiplicando y1 per α prima e poi per β si ottengono y6 ed y4 mentre la stessaoperazione eseguita a partire da y2 porta ad y3 ed y5 per cui

y6 = αy2 y4 = βy2 y3 = αy1 y5 = βy1

che dimostra come, note due radici della ridotta, tutte le altre siano ottenibili moltipli-cando queste per α e β. Lagrange puo ora proporre un metodo generale di risoluzione

4On voit d’abord par cette expression de y pourquoi la reduite est necessairement dusixieme degre; car comme cette reduite ne depend pas immediatement des racines x1, x2,x3, mais seulement des coefficients m, n, p, ou les trois rscines entrent egalement, il est clairque dans l’expression de y on doit pouvoir echanger a volonte les quantites x1, x2, x3 entreelles; par consequent la quantite y devra avoir autant de valeurs differentes que l’on pourraformer par toutes les permutations possibles dont les trois racines x1, x2, x3 sont susceptibles;or on sait par la theorie des combinaisons que le nombre des permutations, c’est-a-dire desarrangements differents des trois choses, est 3 · 2 · 1; donc la reduite doit etre aussi du degre ,c’est-a-dire du sixieme.

Page 195: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.1. LAGRANGE E LARISOLUZIONE ALGEBRICADELLE EQUAZIONI195

per le equazioni di terzo grado che non dipende dalla particolare trasformazione ado-perata. Partendo da (7.1) si suppone di poter esprimere le radici della ridotta comefunzioni lineari delle radici di (7.1),

r1 := Ax1 +Bx2 + Cx3

dove le quantita A, B, C sono al momento incognite ma indipendenti dalle xi. Ese-guendo tutte le permutazioni possibili sulle xi si ottengono gli altri cinque valori

r2 = Ax1 +Bx3 + Cx2 r3 = Ax2 +Bx1 + Cx3 r4 = Ax2 +Bx3 + Cx1

edr5 = Ax3 +Bx2 +Cx1 r6 = Ax3 +Bx1 +Cx2.

Si impone che la ridotta contenga solo potenze multiple di 3 dell’incognita per cui, ser risolve la ridotta, anche αr e βr la risolvono. Ora, chiedendo che r2 = αr1 sia veraper tutti i possibili valori di xi equivale a chiedere αA = A e dunque α = 1, mentresappiamo che α 6= 1. Similmente, la richiesta αr1 = r3 fornisce αC = C che ancoraimporrebbe α = 1. Al contrario, se si impone αr1 = r4 si ottiene αA = C, αB = A edαC = B per cui

C = αA = α2B = α3C,

consistente con α3 = 1. Per semplicita e sempre possibile porre A = 1 e ricavare ledue radici fondamentali della ridotta nella forma

r =: r1 = x1 + αx2 + βx3 s := r2 = x1 + αx3 + βx2. (7.7)

La ridotta, dovendo avere r, αr, βr = α2r, s, αs e βs = α2r come radici si fattorizzacome

(y − r)(y − αr)(y − α2r)(y − s)(y − αs)(y − α2s) = (y3 − r3)(y3 − s3) = 0

che si riscrive comey6 − (r3 + s3)y3 + r3s3 = 0. (7.8)

Tutto questo non sarebbe molto utile se non fosse possibile trovare espressioni di r3

ed s3 in funzione dei coefficienti di (7.1) e per questo entrano in gioco le formule diViete-Girard ed i teoremi newtoniani (per una dimostrazione di questi teoremi, si vedala sezione 7.5). Da (7.7) Lagrange ottiene

r3 = x31 + x3

2 + x33 + 6x1x2x3 + 3α(x2x

21 + x3x

22 + x1x

23) + 3β(x1x

22 + x2x

23 + x3x

21)

e, scambiando tra loro α e β,

s3 = x31 + x3

2 + x33 + 6x1x2x3 + 3α(x3x

21 + x2x

23 + x1x

22) + 3β(x1x

23 + x3x

22 + x2x

21).

Seguendo alla lettera Lagrange, poniamo

L := x31+x

32+x

33+6x1x2x3 M := (x2x

21+x3x

22+x1x

23) N := x1x

22+x2x

23+x3x

21

si ottiener3 + s3 = 2L+ 3(α+ β)(M +N)

e siccome la somma delle tre radici di x3 − 1 = 0 e nulla, deve essere

1 + α+ β = 1 + α+ α2 = 0 (7.9)

Page 196: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

196CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

sicche in definitivar3 + s3 = 2L− 3(M +N).

D’altro canto, sempre utilizzando (7.9), si verifica che

r3s3 = L[L− 3(M +N)] + 9[(M +N)2 − 3MN ].

Ora, i coefficienti L, M +N ed MN sono funzioni simmetriche delle radici di (7.1) edunque sono esprimibili in funzione dei soli coefficienti dell’equazione (7.1) grazie alteorema fondamentale delle funzioni simmetriche (per una dimostrazione, si veda lasezione 7.6). Infatti, dalle formule di Viete-Girard sappiamo che

m = −(x1 + x2 + x3) n = x1x2 + x1x3 + x2x3 p = −x1x2x3

da cui si deduce

x21 + x2

2 + x23 = (x1 + x2 + x3)

2 − 2(x1x2 + x1x3 + x2x3) = m2 − 2n

e

x31 + x3

2 + x33 =

= (x1 + x2 + x3)3 − 3(x1 + x2 + x3)(x1x2 + x1x3 + x2x3)− 3x1x2x3 = −m3 + 3mn− 3p

da cui anche segue

x31x

32 + x3

1x33 + x3

2x33 = n3 − 3mnp+ 3p2

e quindi, in definitiva,

L = −m3 + 3mn− 9p, M +N = 3p−mn MN = n3 + p(m2 − 6mn) + 9p2

che permettono di dedurre le espressioni di r3 + s3 ed r3s3 in funzione dei coefficientidella (7.1):

y6 + (2m3 − 9mn+ 27p)y3 + (m2 − 3n)3 = 0. (7.10)

Dunque, ponendo z := y3 occorre risolvere l’equazione di secondo grado

z2 + (2m3 − 9mn+ 27p)z + (m2 − 3n)3 = 0 : (7.11)

dette z1 e z2 le sue radici, poiche da (7.8) si ha che r ed s sono valori che risolvonol’equazione in y si potra sempre scrivere

r = x1 + αx2 + βx3 = 3√z1

s = x1 + αx3 + βx2 = 3√z2

con−m = x1 + x2 + x3

(7.12)

che, sommate tra loro con il ricorso a (7.9), danno

x1 =−m+ 3

√z1 + 3

√z2

3;

similmente, se prima di sommare si moltiplica la prima delle (7.12) per β e la secondaper α o, viceversa, la prima per α e la seconda per β, si ottiene

x2 =−m+ β 3

√z1 + α 3

√z2

3x3 =

−m+ α 3√z1 + β 3

√z2

3:

siccome z1 e z2 sono funzioni dei coefficienti di (7.1), la risoluzione dell’equazionedi terzo grado con il metodo di Lagrange e completata. Osserviamo che il metodo diLagrange non ha come scopo principale quello di semplificare altri metodi quanto quellodi trovare un principio comune a tutti i metodi escogitati per la soluzione algebricadelle equazioni di terzo grado.

Page 197: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.2. IL METODO DI TSCHIRNHAUS 197

7.2 Il metodo di Tschirnhaus

Dopo essersi occupato di un metodo di soluzione per equazioni di terzo grado modellatosu di esse e dunque difficilmente esportabile ad equazioni di grado superiore, Lagrangededica ampio spazio all’esposizione di altri metodi che, al contrario, sufficientementegenerali da essere applicati anche alle equazioni di grado superiore. Nel dettaglio,Lagrange esamina i metodi di Tschirnhaus, di Eulero e di Bezout. Mi occupero dell’e-sposizione del metodo di Tschirnhaus applicato alla soluzione delle equazioni di terzogrado che viene analizzato da Lagrange nei §§10-16 di [1]. Sugli Acta Eruditorumdel 1683 era apparsa una breve nota [7] dello scienziato tedesco Ehrenfried Waltervon Tschirnhaus (1651-1708) che proponeva un metodo generale per la risoluzionedi equazioni di grado qualunuqe. L’essenza del metodo e quella di generalizzare latrasformazione che permette di eliminare da un’equazione il termine che segue imme-diatamente quello di grado massimo. In questa trasformazione si effettuava un cambiodi variabile x 7→ y = x+ a in cui l’unico parametro libero presente a era determinatoimponendo l’annullamento del termine di grado minore successivo a quello di gradomassimo. Ora, Tschirnhaus ebbe l’idea di estendere la classe di trasformazioni inmodo da poter eliminare quanti piu termini possibili in un’equazione di grado n. Inestrema sintesi, se con una trasformazione del tipo x = y + a dipendente da un soloparametro libero a e possibile eliminare un termine da un’equazione grazie ad unascelta opportuna di a, trasformazioni del tipo

x2 = bx+ y + a x3 = cx2 + bx+ y + a ecc.

possono essere impiegate per eliminare due, tre, ecc. termini da un’equazione e con-sentirne una semplificazione notevole. E chiaro che l’obiettivo del metodo e quello ditrasformare un’equazione completa di grado n in un’equazione binomia del tipo yn = Cle cui soluzioni, come dira Lagrange, sono note immediatamente (sur le champ). Ora,questo metodo condurra alla risoluzione di un sistema ausiliario di equazioni algebricheil cui grado, pero, e destinato a salire oltre a quello dell’equazione proposta come notoper primo Leibniz, poco dopo la pubblicazione del lavoro di Tschirnhaus. Tuttavia,nel caso di equazioni di terzo grado la ridotta era di secondo grado e non di sestogrado e per Lagrange occorre considerare i motivi nascosti dietro questa riduzione perstudiarne l’effettiva applicabilita ad equazioni di grado superiore al quarto. Lagrangeespone dapprima il metodo seguendo le linee indicate sommariamente da Tschirnhausper poi effettuarne l’analisi a priori. Si riparta dunque da (7.1) e si ponga

x2 = bx+ a+ y (7.13)

dove b ed a sono da determinare. Per questo, Lagrange moltiplica ambo i membri di(10.1) per x ottenendo

x3 = bx2 + ax+ xy

e sostituisce il valore di x2 dato da (10.1) ricavando infine

x3 = (b2 + a+ y)x+ b(a+ y) : (7.14)

sostituendo (10.1) e (10.2) in (7.1) si ottiene

(b2 +mb+ n+ a+ y)x+ (b+m)(a+ y) + p = 0

da cui si ricava x come funzione razionale di y, dei parametri della trasformazione edei coefficienti dell’equazione proposta:

x = − (b+m)(a+ y) + p

b2 +mb+ n+ a+ y.

Page 198: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

198CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

Inserito in (7.1) questo valore di x si ottiene un’altra equazione di terzo grado in y

y3 + Ay2 +By +C = 0

in cui i coefficienti A, B e C sono legati ai parametri della trasformazione ed aicoefficienti dell’equazione proposta. In particolare,

A = 3a−mb−m2 + 2n

eB = 3a2 − 2a(mb+m2 − 2n) + nb2 + (mn− 3p)b+ n2 − 2mp

sono i coefficienti da annullare in modo da ottenere un’equazione trasformata del tipo

y3 +C = 0, (7.15)

di soluzione immediata. Ora, da A = 0 si ottiene

a =mb+m2 − 2n

3

che, sostituito in B = 0, fornisce l’equazione

(m2 − 3n)b2 + (2m3 − 7mn+ 9p)b+m4 − 4m2n+ 6mp+ n2 = 0

per cui la determinazione dei parametri che individuano la trasformazione di Tschirn-haus e ricondotta alla soluzione di un sistema di secondo grado. Sin qui Lagrange nonha fatto altro che sviluppare, utilizzando il metodo di eliminazione, i calcoli necessaria portare a termine la trasformazione. Per quale motivo la ridotta e ora di secondoanziche di sesto grado? Lagrange affronta la questione a partire dal §15 di [1] ed os-serva che (7.15) ha le soluzioni − 3

√C, −α 3

√C e −α2 3

√C dove, al solito α 6= 1 e una

radice cubica dell’unita. Ora, queste radici debbono corrispondere alle radici x1, x2

ed x3 di (7.1) ed il legame e proprio stabilito dalla trasformazione (10.1)

x21 = bx1 + a− 3

√C

x22 = bx2 + a− α 3

√C

x23 = bx3 + a− α2 3

√C

(7.16)

da cui si ricavano i valori di a e b, eliminando C. Moltiplicando la seconda delleequazioni (7.16) per α, la terza per α2, sommando i risultati ed osservando che α4 = αe α2 + α+ 1 = 0 si otterra

b = b1 =x21 + αx2

2 + α2x23

x1 + αx2 + α2x3.

Ora, permutando tra loro le radici xi, questa quantita assume i valori

b2 =x21 + αx2

3 + α2x22

x1 + αx3 + α2x2b3 =

x22 + αx2

3 + α2x21

x2 + αx3 + α2x1b4 =

x22 + αx2

1 + α2x23

x2 + αx1 + α2x3

e

b5 =x23 + αx2

1 + α2x22

x3 + αx1 + α2x2b6 =

x23 + αx2

2 + α2x21

x3 + αx2 + α2x1

ma ora, moltiplicando numeratore e denominatore di b1 per α prima e per α2 poi eservendosi ancora delle proprieta delle radici dell’unita si verifica che

b1 = b3 = b5 e b2 = b4 = b6

Page 199: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.3. LA RISOLVENTE DI LAGRANGE 199

per cui l’equazione in b e ancora di sesto grado ma, precisamente, e il cubo di un’equa-zione di secondo grado: ancora una volta, l’analisi del comportamento di certe funzionidelle radici di (7.1) ha permesso di conoscere a priori cosa aspettarsi da un metodo dirisoluzione.

Per concludere, ricordo che il risultato forse piu importante ottenuto con il metododi Tschirnhaus e la riduzione della piu generale equazione di quinto grado alla forma

x5 + ax+ b = 0 (7.17)

che sara effettuata indipendentemente da Bring [1] e Jerrard [5]5: piu in generale, conlo stesso metodo si possono eliminare da un’equazione di grado m i coefficienti chemoltiplicano xm−1, xm−2, xm−3.

7.3 La risolvente di Lagrange

Lagrange, dopo aver trovato gli ingredienti comuni a tutti i metodi noti di soluzionedelle equazioni algebriche fino al quarto grado, e in grado di proporre un approcciogenerale ed uniforme alla soluzione algebrica di tutte le equazioni che sara destinatoa funzionare per le equazioni fino al quarto grado e per le equazioni binomie. Perillustrare gli aspetti salienti del metodo di Lagrange mi serviro della Nota XIII, Sur laresolution des equations algebriques dell’edizione del 1808 del Traite [2] che appuntotratta dei principi generali del metodo. Il punto di partenza per la risoluzione algebricadi un’equazione generale del tipo

xm − Axm−1 +Bxm−2 −Cxm−3 + · · · = 0 (7.18)

le cui radici indicheremo con x1, x2, · · ·xm−1, xm e l’osservazione che in tutti i metodidi soluzione noti si effettuava il ricorso ad un’equazione ausiliaria (ridotta o risolvente,nel Traite) le cui radici sono

t0 = x1 + αx2 + · · ·+ αm−2xm−1 + αm−1xm =m∑

k=1

αk−1xk (7.19)

e tutte quelle che si ottengono da t0 permutando in un modo arbitrario le radici di(7.18): dunque, a questo livello, la risolvente appare essere un’equazione di gradom! = m · (m − 1) · · · 3 · 2 · 1. In (7.19) α e una radice m-esima dell’unita, α 6= 1.Vi e una differenza tecnica tra il caso in cui m e un numero primo oppure composto.Per brevita, ci soffermeremo nel seguito solo sul caso in cui m e primo. In questocaso, valgono una serie di proprieta di α che e bene rammentare visto il ruolo chegiocheranno tra poco. Anzitutto, tutte le potenze αk con k intero compreso tra 1 edm sono diverse tra loro quando lo sono gli esponenti. Come conseguenza di deduceche tutte le potenze αk, con k = 1, · · ·m risolvono l’equazione binomia ym − 1 = 0.Lagrange si serve di queste proprieta per ricavare un metodo potenzialmente in gradodi risolvere equazioni di ogni grado. Infatti, tornando alla (7.19), Lagrange osservache, se si effettua la permutazione ciclica x1 7→ x2 7→ x3 · · · 7→ xm−1 7→ xm 7→ x1,ecc.per la quale Lagrange non ha una specifica notazione, si ottiene

t1 = xm + αx1 + · · ·+ αm−3xm−3 + αm−2xm−2 + αm−1xm−1.

5Erland Bring (1736-1798), matematico svedese e George Birch Jerrard (1804-1863), ma-

tematico britannico. E curioso osservare che Jerrard si occupo di questo problema perchenutriva dei dubbi sulla validita della dimostrazione di Abel circa l’impossibilita di risolvereequazioni algebriche di grado superiore al quarto.

Page 200: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

200CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

Allo stesso risultato tuttavia si perviene moltiplicando t0 per α, grazie ad αm = 1.Similmente, la moltiplicazione di t0 per αk (k = 1, · · ·m) non fa uscire dall’insiemeottenuto da t0 permutando le radici della (7.18). Si deduce in questo modo che larisolvente, oltre ad avere il fattore (t−t0) dovra avere anche i fattori t−αt0,...,t−αkt0,t− αm−1t0 e dunque, in definitiva, potra contenere solo il fattore tm − tm0 . Un attimodi riflessione porta a concludere che le m permutazioni equivalenti alla moltiplicazionedi t0 per una potenza di α sono del tipo xh 7→ xh+k modm e che tutte le permutazioniche lasciano invariato x1 ma agiscono solo sulle rimanenti m − 1 radici non possonoessere tra loro equivalenti. Dunque, le m! permutazioni tra le radici si fattorizzanoin (m− 1)! gruppi di m permutazioni ciascuno, ed ogni gruppo porta in evidenza untermine tm: la risolvente conterra solo potenze di tm per cui, posto θ := tm, l’equazioneper θ sara di grado (m− 1)! ed avra come radici i diversi valori di θ che si ottengonopermutando tra loro le radici x2, x3, · · · , xm. Siccome αm = 1, a conti fatti θ siesprimera come

θ = ξ0 + αξ1 + α2ξ2 + · · ·αm−1ξm−1 (7.20)

dove ora le ξk sono funzioni razionali delle x1, x2, · · · , xm−1, xm invarianti rispettoalle permutazioni del tipo xh 7→ xh+k modm. Lagrange compie l’osservazione crucialeche, note le ξk, le radici dell’equazione proposta (7.18) saranno note anch’esse. Infatti,considerando t0 in (7.19) come funzione di α e delle x1, x2, · · ·xm−1, xm ed indicandot0 = t(α, xk) =: m

√θ1, si potra scrivere

t(1, xk) = x1 + x2 + · · · + xm = m√θ0

t(α, xk) = x1 + αx2 + · · · + αm−1xm = m√θ1

t(β, xk) = x1 + βx2 + · · · + βm−1xm = m√θ2

· · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·t(λ, xk) = x1 + λx2 + · · · + λm−1xm = m

√θm−1

(7.21)dove 1, α, β, · · ·λ sono tutte le m radici m-esime dell’unita e dunque sono soluzionidell’equazione xm − 1 = 0 che avendo tutti i termini intermedi nulli gode, grazie aiteoremi newtoniani, delle seguenti proprieta:

1 + α+ β + · · ·+ λ = 0,

1 + α2 + β2 + · · ·+ λ2 = 0

e cosı via fino a1 + αm−1 + βm−1 + · · ·+ λm−1 = 0.

Se allora sommiamo tra loro le (7.21) ed utilizziamo queste proprieta otteniamo

x1 =m√θ0 +

m√θ1 +

m√θ2 + · · ·+ m

√θm−1

m.

Similmente, se si moltiplica la seconda delle (7.21) per αm−1, la terza per βm−1 e cosıvia fino all’ultima che viene moltiplicata per λm−1 e poi si sommano le equazioni cosıottenute si ha

x2 =m√θ0 + αm−1 m

√θ1 + βm−1 m

√θ2 + · · ·+ λm−1 m

√θm−1

m:

in generale,

xk =m√θ0 + αm−k+1 m

√θ1 + βm−k+1 m

√θ2 + · · ·+ λm−k+1 m

√θm−1

m.

Page 201: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.4. VANDERMONDE E LE EQUAZIONI CICLOTOMICHE 201

Il problema e ora ricondotto alla determinazione delle ξk, precisamente a stabilire ilgrado dell’equazione soddisfatta da queste quantita ed alla determinazione dei coeffi-cienti di queste equazioni. Per questo Lagrange osserva che, sostituire α ad un’altraradice m-esima dell’unita distinta da 1 in t(α, xk) equivale a rimpiazzare x2 con unadelle altre m − 2 radici x3, x4, ...., xm. Dunque le (m − 1)! permutazioni che dannoluogo a fattori distinti nella ridotta si possono raggruppare ad (m − 1) ad (m − 1)ottenendo cosı un numero di (m − 2)! permutazioni non equivalenti tra le radici di(7.18). Si puo allora concludere che i coefficienti ξk sono radici di equazioni di gradom − 1 i cui coefficienti pero dipendono da equazioni di grado (m − 2)!. Purtroppo,non appena m = 5, (m − 2)! = 3! = 6 > 5 e dunque non si puo sperare in una ri-solvente che sia piu facile da risolvere rispetto alla (7.18). Lagrange in effetti, trovadirettamente i coefficienti dell’equazione in θ che ha come radici le θ1, ....,θm−1 ([2],pp. 305-307) ed uno di questi dipende da un’equazione di grado (m− 2)! mentre tuttigli altri sono determinabili grazie ai teoremi newtoniani. Il metodo permette pero diottenere l’espressione in radicali delle equazioni ciclotomiche xm − 1 = 0 in modo di-retto, indipendente dalla tecnica proposta da Gauss nelle Disquisitiones Arithmeticaedel 1801. Lagrange illustra l’applicazione del metodo alle equazioni ciclotomiche digrado m primo nella Nota XIV del Traite [2].

Questo e, in estrema sintesi, il cuore del lavoro di Lagrange sulla risoluzione al-gebrica delle equazioni, un lavoro che influenzera molti studiosi come Paolo Ruffini[10] che mutuera le tecniche di Lagrange per dimostrare, pur con qualche mancanza,l’impossibilita di risolvere algebricamente in generale un’equazione di grado superioreal quarto o come Louis-Augustin Cauchy che sviluppera a piu riprese nella sua carrierai risultati di Lagrange e Ruffini sul gruppo delle permutazioni o, ancora, come EvaristeGalois che dalla lettura di Lagrange trarra spunto per gettare le basi della teoria cheoggi porta il suo nome.

7.4 Vandermonde e le equazioni ciclotomiche

Il francese Alexandre-Theophile Vandermonde (1735-1796) fu un personaggio eclet-tico: matematico, musicista, studioso di economia politica [11]. Nella storia delleequazioni algebriche egli entra a pieno titolo per una importante memoria, Memoiresur la resolution des equations [12], coeva alle Reflexions di Lagrange ma apparsaqualche tempo dopo queste a causa di un notevole ritardo nella pubblicazione tra leMemorie dell’Accademia delle Scienze di Parigi. La memoria di Vandermonde si puoin effetti suddividere in due parti e contiene molte idee vicine a quelle contenute nel-le Reflexions, come Lagrange stesso riconobbe nella Nota XIII del Traite [2] appenaesaminata. Nella prima parte di [12], molto estesa, Vandermonde mira ad ottenereun’espressione di ciascuna radice di un’equazione assegnata in funzione di tutte le ra-dici dell’equazione stessa. Nella seconda parte, su cui concentriamo l’attenzione inquesta sezione seguendo l’esposizione di Tignol [13], egli trova l’espressione in radicalidelle soluzioni dell’equazione ciclotomica x11 − 1 = 0 servendosi di un metodo checontiene in forma embrionale alcune delle idee che saranno sviluppate cinquant’annipiu tardi ed in modo del tutto indipendente da Galois.

Vandermonde osserva come sia inevitabile la presenza di una certa ambiguita inogni formula risolutiva che si voglia considerare in quanto, attraverso un’unica formula,si vogliono ottenere tutte le radici di un’equazione assegnata. La via battuta daVandermonde per ottenere una formula risolutiva si snoda in tre parti:

Page 202: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

202CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

1) Trovare una funzione Fn(x1, x2, · · · , xn) delle radici xi ≡ x1, x2, · · ·xn−1, xn diun’equazione di grado n che permetta di esprimere tutte le radici.

2) Porre la funzione appena determinata in una forma invariante rispetto allo scambiodelle radici.

3) Servirsi delle formule di Viete-Girard per esprimere la funzione trovata ai pas-si precedenti in termini dei coefficienti dell’equazione proposta. A questo proposi-to, ricordiamo che Vandermonde dimostro in generale che ogni funzione simmetri-ca di x1, x2, · · ·xn−1, xn si puo esprimere in funzione dei coefficienti dell’equazioneproposta.

Vandermonde propose di considerare la funzione

Vi(x1, x2, · · · , xn) = i1x1 + i2x2 + · · ·+ in−1xn−1 + inxn (7.22)

che gioca un ruolo del tutto analogo rispetto alla risolvente di Lagrange. In (7.22)i = 1, 2, · · · , n − 1, le k sono le radici n-esime dell’unita e la formula risolutivaproposta da Vandermonde e

Fn(x1, x2, · · ·xn) =1

n

[n∑

i=1

xi +

n−1∑

i=1

n

V ni (x1, x2, · · · , xn)

]

(7.23)

dove tutte le singole radici vengono ottenute a patto di scegliere un’opportuna deter-minazione delle radici n-esime delle funzioni V n

i . Ad esempio, se si vuole ottenere xk

si sceglie n√V ni (x1, x2, · · · , xn) = −i

k Vi(x1, x2, · · · , xn) in quanto da (7.22) si ricava

n

V ni (x1, x2, · · · , xn) = xk +

j 6=k

(j

−1k

)ixj

e dunque da (7.23) si ha

Fn(x1, x2, · · ·xn) = xk +∑

j 6=k

[n−1∑

i=0

[(j

−1k

)i]

xj

]

(7.24)

dove l’indice nella sommatoria su i parte da 0 dal momento che si e riscritto

j 6=k

xj =∑

j 6=k

(j

−1k

)0xj .

Si osserva ora che, quando j 6= k, j−1k e anch’essa una radice n-esima dell’unita

distinta da 1 e dunque risolve l’equazione

xn−1 + xn−2 + xn−3 + · · ·+ x2 + x+ 1 =

n−1∑

i=0

xi = 0

che dimostra come la somma doppia in (7.24) sia nulla per cui, con questa determina-zione di n

√V ni (x1, x2, · · · , xn) si ha F (x1, x2, · · ·xn) = xk. Osserviamo che, nonostan-

te l’apparente diversita, la risolvente impiegata da Vandermonde coincide con quellaintrodotta da Lagrange.

Veniamo ora allo studio dell’equazione ciclotomica

x11 − 1 = 0 (7.25)

Page 203: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.4. VANDERMONDE E LE EQUAZIONI CICLOTOMICHE 203

di cui Vandermonde mostra la risolubilita in termini di radicali algebrici. Quest’ultimaspecificazione e essenziale dal momento che era noto da tempo come ottenere la rap-presentazione trigonometrica complessa per le radici di equazioni del tipo xn − 1 = 0.Al contrario, la risolubilita in termini di radicali era dimostrata solo fino ad n = 10ed il grande merito di Vandermonde fu quello di risolvere il caso n = 11 che, comevedremo tra poco, conduce ad un’equazione di quinto grado per la quale non esistein generale una formula risolutiva. Anzitutto ricordiamo che, liberata la (7.25) dallaradice evidente x = 1, l’equazione da risolvere e

x10 + x9 + · · ·+ x2 + x+ 1 = 0. (7.26)

Ora, quando n e un numero primo maggiore di 2, de Moivre aveva escogitato unartificio che consentiva di ridurre il grado dell’equazione xn − 1 = 0 che, eliminata laradice x = 1 e posto n = 2p+ 1, diviene

x2p + x2p−1 + · · ·+ x+ 1 = 0. (7.27)

Dividendo tutti i termini per xp e raggruppando i termini a due a due procedendosimetricamente a partire dagli estremi, (7.27) si riscrive come

(

xp +1

xp

)

+

(

xp−1 +1

xp−1

)

+ · · ·+(

x2 +1

x2

)

+

(

x+1

x

)

+ 1 = 0. (7.28)

Posto

y := x+1

x(7.29)

non e difficile verificare che, definito

sp := xp +1

xp,

vale la relazione ricorsiva

sp+1 = ysp − sp−1. (7.30)

avendo cura di porre s0 = 2 ed s1 = y. Nel caso che ci interessa si ha p = 5 ed usoripetuto di (7.30) consente di ricavare

x2+1

x2= y2−2 x3+

1

x3= y3−3y x4+

1

x4= y4−4y2+2 x5+

1

x5= y5−5y3+5y

che permette di trasformare (7.26) in

y5 + y4 − 4y3 − 3y2 + 3y + 1 = 0.

Vandermonde, nell’applicare il metodo di de Moivre esprime (7.26) in termini di X =−y per cui l’equazione ciclotomica da risolvere e

X5 −X4 − 4X3 + 3X2 + 3X − 1 = 0. (7.31)

Ora, e noto che le radici xk 6= 1 11-esime dell’unita, soluzioni di (7.26), si esprimono

come xk = e2kπi11 , con k = 1, · · · , 10 e dunque le soluzioni di (7.31) si possono scrivere

come

X1 = −2 cos 2π11

X2 = −2 cos 4π11

X3 = −2 cos 6π11

X4 = −2 cos 8π11

X5 = −2 cos 10π11

,

Page 204: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

204CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

come e facile verificare in quanto

xk +1

xk

= yk = −Xk = e2kπi11 + e−

2kπi11 = 2 cos

2kπ

11.

Vandermonde, applicando la formula di prostaferesi

2 cosα cos β = cos(α+ β) + cos(α− β) (7.32)

al caso α = β = 2π11

ottiene

2 cos2(2π

11

)

= cos

(4π

11

)

+ 1

che si puo esprimere in termini delle radici di (7.31)

X21 = 2−X2 : (7.33)

similmente, se si riapplica (7.32) prendendo α = β coincidente con uno degli argomentidei coseni che figurano nelle Xk si possono ottenere le relazioni

X22 = 2−X4 X2

3 = 2−X5 X24 = 2−X3 X2

5 = 2−X1. (7.34)

Quando invece si applica (7.32) prendendo valori distinti di α e β, entrambi argomentidi coseni che compaiono nelle Xk, si ottengono altre relazioni tra le radici

X1X2 = −(X1+X3) X2X3 = −(X1+X5) X3X4 = −(X1+X4) X4X5 = −(X1+X2).(7.35)

Vandermonde osserva ora che, se su queste relazioni si opera la permutazione

σ :=

(X1 X2 X3 X4 X5

X2 X4 X5 X3 X1

)

,

le relazioni (7.34) vengono scambiate tra di loro mentre le (7.35) vengono mutate inaltre ancora valide. E importante osservare che, a differenza delle formule di Viete-Girard che sono invarianti sotto l’azione di qualsiasi permutazione, le relazioni appenatrovate lo sono solo per un sottogruppo del gruppo di permutazioni di n elementi.La differenza e cruciale perche, come fara vedere piu tardi Galois, la riduzione delgruppo che lascia invariate certe relazioni tra le radici e la chiave per decidere seun’equazione algebrica sia o meno risolubile in termini di radicali. In altri termini,mentre la simmetria insita nelle formule di Viete-Girard impedisce di discriminare traloro le radici, la presenza di relazioni tra le radici di un’equazione che siano invariantisotto l’azione di sottogruppi sempre piu piccoli del gruppo delle permutazioni, permettedi distinguere tra loro le radici e dunque di condurre alla risolubilita per radicali diquest’ultima.

Per vedere come Vandermonde proceda nella risoluzione per radicali di (7.26) no-tiamo come relazioni del tipo (7.34) ed (7.35) permettono di abbassare il grado diun polinomio nelle Xk. Supponiamo infatti che in un polinomio figuri il termine X5

1 .Applicando (7.33), (7.34) ed (7.35) si puo scrivere

X51 = X2

1 ·X21 ·X1 = (2−X2)

2X1 = (4− 4X2 +X22 )X1 =

4X1 + 4(X1 +X3)−X2(X1 +X3) = 10X1 + 5X3 +X5 :

seguendo un procedimento analogo e possibile sempre ridurre un polinomio nelle Xk

ad un altro polinomio di primo grado. Grazie a questa osservazione, Vandermonde

Page 205: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.4. VANDERMONDE E LE EQUAZIONI CICLOTOMICHE 205

riesce a semplificare notevolmente l’espressione delle funzioni V 5i che compaiono in

(7.23). Infatti, per quanto appena esemplificato

Vi(X1, X2, X3, X4, X5)5 = (i1X1 + i2X2 + i3X3 + i4X4 + i5X5)

5

= A1(k)X1 +A2(k)X2 + A3(k)X3 + A4(k)X4 + A5(k)X5 +A6(k)(7.36)

dove i coefficienti Ai dipendono dalle radici quinte dell’unita k ≡ 1, 2, 3, 4, 5.Se ora eseguiamo ripetutamente su V 5

i la permutazione σ otterremo

Vi(X2, X4, X5, X3, X1)5 = A1(k)X2 +A2(k)X4 + A3(k)X5

+A4(k)X3 + A5(k)X1 +A6(k) (7.37)

Vi(X4, X3, X1, X5, X2)5 = A1(k)X4 +A2(k)X3 + A3(k)X1

+A4(k)X5 + A5(k)X2 +A6(k) (7.38)

Vi(X3, X5, X2, X1, X4)5 = A1(k)X3 +A2(k)X5 + A3(k)X2

+A4(k)X1 + A5(k)X4 +A6(k) (7.39)

e

Vi(X5, X1, X4, X2, X3)5 = A1(k)X5 +A2(k)X1 + A3(k)X4

+A4(k)X2 + A5(k)X3 +A6(k). (7.40)

Ora, le proprieta generali delle radici n-esime dell’unita con n numero primo implicanoche sia sempre possibile esprimere tutte le k come potenze di un’unica radice n-esimaω 6= 1. Nulla impedisce di numerare le radici in modo che sia

1 = 1 2 = ω 4 = ω2 3 = ω3 5 = ω4

e dunque

Vi(X1, X2, X3, X4, X5) = X1 + ωiX2 + ω2iX4 + ω3iX3 + ω4iX5.

Se ora applichiamo la permutazione σ otteniamo

Vi(X2, X4, X5, X3, X1) = X2 + ωiX4 + ω2iX3 + ω3iX5 + ω4iX1 =ω−i[X1 + ωiX2 + ω2iX4 + ω3iX3 + ω4iX5] = ω−iVi(X1, X2, X3, X4, X5)

e quindi, siccome ω5i = ω−5i = 1 si ottiene, iterando la permutazione σ

Vi(X1, X2, X3, X4, X5)5 = Vi(X2, X4, X5, X3, X1)

5 = Vi(X4, X3, X1, X5, X2)5 =

= Vi(X3, X5, X2, X1, X4)5 = Vi(X5, X1, X4, X2, X3)

5

per cui, sommando tra loro (7.36)-(7.40), si ottiene

Vi(X1, X2, X3, X4, X5)5 =

1

5(A1+A2+A3+A4+A5)(X1+X2 +X3+X4+X5)+A6

ovvero, ricordando che per (7.31) X1 +X2 +X3 +X4 +X5 = 1

Vi(X1, X2, X3, X4, X5)5 =

1

5(A1 + A2 + A3 + A4 + A5) + A6

che risolve il problema della soluzione per radicali dell’equazione (7.25) visto chele quantita A1 · · · , A6 sono funzioni note delle radici quinte dell’unita k che sono

Page 206: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

206CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

esprimibili per radicali (cfr. e.g. [1], p. 253):

1 = 1

2 =√

5−14

+

√10+2

√5

4i

3 =√

5−14−√

10+2√

5

4i

4 = −√

5+14

+

√10−2

√5

4i

5 = −√

5+14−√

10−2√

5

4i

Vandermonde, senza dare alcuna idea della dimostrazione, asserisce che quant mostratoin dettaglio per n = 11 vale anche per tutti i numeri primi maggiori di 11. Questorisultato sara ritrovato da Gauss, trent’anni piu tardi, nelle Disquisitiones Arithmeticaecon tecniche di teoria dei numeri. Vandermonde non sembra essersi occupato piudell’argomento ed il suo lavoro non sembra avere influito su Gauss, che pure ne era aconoscenza [11]. Quanto a Lagrange, nella Nota XIII del Traite [2] egli attribuisce aVandermonde la giusta lode. L’aspetto piu significativo che si puo cogliere dal lavorodi Vandermonde e l’osservazione che, grazie all’esistenza di certe relazioni tra le radiciinvarianti rispetto ad un sottogruppo (terminologia sconosciuta a Vandermonde) delgruppo delle permutazioni, e non gia rispetto all’intero gruppo delle permutazioni,e possibile risolvere per radicali l’equazione ciclotomica (7.25). Questa idea verrasviluppata in modo organico da Galois, anche se questi non citera mai Vandermondeed appare dunque possibile che non conoscesse il suo lavoro se non forse per l’accennoche ne fa Lagrange nel Traite.

7.5 Appendice I

In questa sezione di complemento, dimostriamo i teoremi o formule newtoniane checonsentono di trovare la somma delle potenze k-esime delle radici di un’equazionealgebrica. La dimostrazione e condotta sulla falsariga di [14], Cap. VII. Consideriamol’equazione a coefficienti reali

p(x) = xn + a1xn−1 + a2x

n−2 + · · · an−1x+ an = 0 (7.41)

e siano x1, x2,...,xn le sue radici, eventualmente complesse. Introduciamo le sommedelle potenze k-esime delle radici di p(x) = 0

sk =n∑

i=1

xki . (7.42)

Per definizione di radice di un’equazione algebrica possiamo scrivere

p(x) = (x− x1)(x− x2) · · · (x− xn−1)(x− xn)

ed osservare che

p′(x) =p(x)

x− x1+

p(x)

x− x2+ · · ·+ p(x)

x− xn

.

Ora i quozienti che compaiono a destra di questa equazione possono essere determinatiesattamente grazie al principio di identita dei polinomi per cui, ad esempio,

p(x)

x− x1= xn−1+(x1+a1)x

n−2+(x21+x1a1+a2)x

n−3+· · ·+(xk1+a1x

k−11 +a2x

k−21 +· · ·+ak)xn−k−1+· · · .

Page 207: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

7.6. APPENDICE II 207

Trovati similmente tutti gli altri quozienti e dopo aver sommato i risultati si ottiene,grazie anche a (7.42),

p′(x) = nxn−1+(s1+na1)xn−2+(s2+s1a1+na2)x

n−3+· · ·+(sk+a1sk−1+a2sk−2+· · ·+nak)xn−k−1+· · · .

D’altra parte, se deriviamo partendo da (7.41), otteniamo

p′(x) = nxn−1 + (n− 1)a1xn−2 + (n− 2)a2x

n−3 + · · ·+ an−1

ed ugualiando le potenze ad ugual esponente di x nelle due espressioni di p′(x) otte-niamo

s1 = −a1, s2 = −a1s1 − 2a2 = a21 − 2a2

e, per k < n

sk + a1sk−1 + a2sk−2 + · · ·+ ansn−k + · · ·+ kak = 0

che, ricorsivamente, si puo risolvere esprimendo sk in funzione dei coefficienti di (7.41).I casi k ≥ n o k < 0 possono essere trattati con opportuni artifici per i quali rimando a[14], pp. 85–86. E importante osservare che le sk sono funzioni razionali dei coefficientidi (7.41).

7.6 Appendice II

Mostriamo, ancora seguendo [14], §70, il teorema fondamentale sulle funzioni simme-triche delle radici di un’equazione algebrica come (7.41)

Teorema Ogni funzione razionale simmetrica delle radici di un’equazione algebrica ein realta esprimibile in funzione dei coefficienti dell’equazione stessa.

Dim. Consideriamo il prodotto smsp nel caso m 6= p: da (7.42) abbiamo

smsp = xm+p1 + xm+p

2 + · · ·+ xm+pn + xm

1 xp2 + xm

1 xp3 + · · ·+ xm

2 xp3 + · · ·

e dunque

smsp − sm+p =∑

xmj x

pk

dove la somma e intesa su tutti i valori di j e k, con j 6= k ed e dunque una funzionesimmetrica delle radici di (7.41). Dunque, nel caso m 6= p, somme del tipo

∑xmj x

pk

sono esprimibili solo in termini di sk che sappiamo essere funzioni solo dei coefficientidi (7.41). Se m = p allora e facile verificare che

xmj x

pk = 2

(xjxk)m = s2m − s2m

ed il teorema e ancora valido. Consideriamo ora somme del tipo

xmj x

pkx

qℓ

dove la somma e intesa su tutte le terne j 6= k 6= ℓ. Ora, ricordando (7.42), abbiamo

sq∑xmj x

pk = xm+q

1 xp2 + xm+q

2 xp3 + · · ·+ xm+q

3 xp1 + · · ·

+xm1 x

p+q2 ++xm

2 xp+q3 ++xm

3 xp+q1 + · · ·

++ xm1 x

p2x

q3 + · · ·

Page 208: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

208CAPITOLO 7. METODI GENERALI DI RISOLUZIONE: LAGRANGE E VANDERMONDE

ed i termini su ogni riga a destra del segno di uguaglianza corrispondono, rispetti-vamente a

∑xm+qj xp

k,∑xmj x

p+qk e

∑xmj x

pkx

qℓ . Usando i risultati ottenuti al passo

precedente possiamo concludere

xmj x

pkx

qℓ = smspsq − sm+psq − sm+qsp − smsp+q + 2sm+p+q

che ancora mostra il teorema, almeno nel caso j 6= k 6= ℓ. Se almeno due di questi indicicoincidono, il risultato permane. Dovrebbe essere chiaro che, iterando il processo econsiderando funzioni simmetriche che coinvolgono ad ogni passo una radice in piu diquelle del passo precedente, il teorema e dimostrabile per tutte le funzioni simmetrichedelle radici di (7.41) omogenee. Se la funzione non e omogenea, basta applicare ilteorema ad ogni termine omogeneo presente in essa. Infine, se si ha un quoziente trafunzioni simmetriche, sia il numeratore che il denominatore debbono separatamenteessere funzioni simmetriche e dunque il teorema e dimostrato per tutte le funzionirazionali simmetriche delle radici di (7.41).

Page 209: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] J.L. Lagrange: Reflexions sur la resolution algebrique des equations, NouveauxMem. de l’Acad. des Sciences et Belles-Lettres de Berlin, 1, 134–215, (1770); 2,138-253, (1771). In Œuvers Completes, vol. 3, J.A. Serret, Ed., Gauthier-Villars,Paris, (1869), 205-421.

[2] J.L. Lagrange: Traite de la resolution des equations numeriques de tous les degres,avec des notes sur pluiseurs points de la Theorie des equations algebriques, Cour-cier, Paris, (1808). InŒuvers Completes, vol. 8, J.A. Serret, Ed., Gauthier-Villars,Paris, (1879), 11-370.

[3] R.R. Hamburg: The theory of equations in the 18th century: the work of JosephLagrange. Archive for History of Exact Sciences, 13, (1976), 17–36.

[4] B.M. Kiernan: The development of Galois theory from Lagrange to Artin. Archivefor History of Exact Sciences, 13, (1971), 40–154.

[5] J. Pierpont: Lagrange’s place in the theory of substitutions. Bull. Amer. Math.Soc., 1, 196–204, (1894).

[6] L. Euler: De fractionibus continuis dissertatio. Commentarii AcademiaeScientiarum Petropolitanae 9 (1744), 98-137.

[7] E.W. Graf von Tschirnhaus: Methodus auferendi omnes terminos intermedios exdata aequatione. Acta Eruditorum, 2, 204–207, (1683).

[8] E. Bring: Melemata quaedam mathematica circa transformationem aequationumalgebraicarum, Lund, (1786).

[9] G.B. Jerrard: An Essay on the Resolution of Equations, Taylor & Francis,London, (1858).

[10] P. Ruffini, Teoria generale delle Equazioni, in cui si dimostra impossibile la solu-zione algebraica delle equazioni generali di grado superiore al quarto. Bologna,Stamperia di S. Tommaso d’Aquino, (1799). In Opere Matematiche di PaoloRuffini a cura di E. Bortolotti, vol. 1, Cremonese, Roma, (1953).

[11] H. Lebesgue: L’œuvre mathematique de Vandermonde. L’EinsegnementMathematique, 1 (S. 2), 201–223, (1955)

[12] A.T. Vandermonde: Memoire sur la resolution des equations. Histoire de l’Acad.des Sciences, 365–416, (1771)

[13] J.-P. Tignol: Galois’ Theory of Algebraic Equations. World Scientific, Singapore,(2001).

[14] F. Cajori: An Introduction to the Modern Theory of Equations. MacMillan,London, (1919).

209

Page 210: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

210 BIBLIOGRAFIA

Page 211: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 8

Il teorema di Ruffini-Abel

8.1 Paolo Ruffini e la risolubilita delle equazioni

algebriche

L’ultima parte delle Reflexions si apre con l’esposizione degli esiti dell’analisi dei me-todi di risoluzione per equazioni di grado superiore al quarto, per le quali il problemadella risolubilita algebrica era ancora aperto.

Si e potuto constatare, grazie all’analisi dei principali metodi noti di risoluzionedelle equazioni che abbiamo appena esposto, che tutti questi metodi si riducono ad unostesso principio generale, quello di trovare delle funzioni delle radici dell’equazioneproposta tali: 1 che l’equazione o le equazioni da cui saranno ottenute, cioe a diredi cui saranno le radici (equazioni che vengono comunemente dette ridotte) abbianoun grado minore di quello dell’equazione proposta o siano almeno scomponibili in altreequazioni di un grado inferiore della proposta; 2 che dalle ridotte si possano dedurrefacilmente i valori delle radici cercate.

L’arte di risolvere le equazioni consiste dunque nello scoprire delle funzioni del-le radici che abbiano le proprieta appena enunciate; ma e sempre possibile trovaretali funzioni per le equazioni di grado qualsiasi, cioe per un numero di radici arbitra-rio? Questo e un punto su cui sembra essere molto difficile di potersi pronunciare ingenerale.1 ([1], §86, p.355)

Sul finire delle Reflexions Lagrange esprime la ferma convinzione di aver svelato iprincipi autentici che si celano dietro i metodi di risoluzione delle equazioni algebriche

1On a du voir par l’analyse que nous venons de donner des principales methodes connuespour la resolution des equations, que ces methodes se reduisent otutes a un meme principegeneral, savoir a trouver des fonctions des racines de l’equation proposee, lesquelles soienttelles: 1 que l’equation ou les equations par lesquelles elles seront donnees, c’est-a-dire dontelles sont racines (equations qu’on nomme communement les reduites), se trouvent d’un degremoindre que celui de la proposee, ou soient au moins decomposables en d’autres equations’un degre moindre que celui-la; 2 que l’on puisse en deduire aisement les valeurs des racinescherchees.

L’art de resoudre les equations consiste donc a decouvrir des fonctions des racines, qui aientles proprietes que nous venons d’enoncer; mais est-il toujours possible de trouver de tellesfonctions, pour les equations d’un degre quelconque, c’est-a-dire pour tel nombre de racinesqu’on voudra? C’est sur qoui il parait tres-difficile de pouvoir prononcer en general.

211

Page 212: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

212 CAPITOLO 8. IL TEOREMA DI RUFFINI-ABEL

e che sono alla base del loro successo per equazioni di grado non superiore al quarto maegualmente e consapevole che la risolubilita algebrica di equazioni di grado superioreper questa via e ancora lontana dall’essere ottenuta:

Ecco, se non mi sbaglio, gli autentici principi della risoluzione delle equazioni el’analisi piu appropriata a svelarli; il tutto si riduce, come si e visto, ad una sortadi calcolo di combinazioni, tramite il quale si trovano a priori i risultati che uno puoaspettarsi. Sarebbe opportuno farne l’applicazione ad equazioni di quinto grado e digradi superiori la cui soluzione e ad oggi sconosciuta; tuttavia questa applicazionerichiede un numero troppo grande di ricerche e di combinazioni, la cui riuscita e ancoramolto dubbia perche possa dedicarmi attualmente a questo lavoro; mi auguro tuttaviadi potervi ritornare in altri tempi e mi accontentero per ora di aver qui gettato le basidi una teoria che mi sembra nuova e generale.2 ([1], §109, p. 403).

Con Lagrange, Vandermonde e Waring, le cui Meditationes Algebraicae contengonoalcuni dei risultati ottenuti dagli altri due matematici, si chiude un periodo nella storiadelle equazioni algebriche e si gettano le premesse di una nuova stagione di sviluppi.Non e un caso se i lavori di questi tre matematici, apparsi o comunque inviati per lapubblicazione all’incirca nello stesso periodo, gli anni attorno al 1770, siano seguitida quasi trent’anni di stasi sul problema della risolubilita algebrica delle equazioni.Alla fine del XVIII secolo nasce una nuova fase che condurra ad un esito per certiaspetti sorprendente: l’impossibilita di ottenere in generale una soluzione algebrica perequazioni di grado superiore al quarto. In verita, nel 1799 Gauss, nella Dissertazione[2] studiata al Cap. 6, si esprimeva in termini piuttosto scettici circa la possibilita diottenere una formula risolutiva per equazioni di grado qualunque:

Dopo tante fatiche di molti geometri rimane solo una minima speranza di poterpervenire un giorno alla risoluzione generale delle equazioni algebriche ed appare sem-pre piu verosimile che una tale risoluzione sia impossibile e contraddittoria. Cio nondeve sembrare paradossale in quanto cio che abitualmente viene detta soluzione di un’e-quazione altro non e che la riduzione dell’equazione ad equazioni pure. Ora in tuttoquesto non si insegna a risolvere le equazioni pure, ma se ne presuppone la soluzionee, se si esprime con m

√H la radice dell’equazione xm = H, non la si risolve affatto e

non si fa altro di quanto si farebbe escogitando un qualche segno per indicare la radicedell’equazione xn + Axn−1 + .... = 0 e si ponesse questo segno uguale alla radice. Evero che le equazioni pure sono di gran lunga superiori alle altre sia per la facilita concui si trovano le loro radici per approssimazione, sia per il legame elegante che esistetra le radici stesse e pertanto non si deve in alcun modo disprezzare che gli analistiabbiano loro attribuito un simbolo specifico; tuttavia dal fatto di aver raggruppato talesimbolo con quelli delle operazioni aritmetiche di somma, sottrazione, moltiplicazione,divisione ed elevamento a potenza sotto il nome di espressioni analitiche, non segueaffatto che per mezzo di questi simboli si possa esprimere la radice di una equazionequalsiasi. Ovvero, per farla breve, si presuppone senza una motivazione sufficiente chela soluzione di un’equazione arbitraria si possa ridurre alla soluzione di equazioni pure.

2Voila, si je ne me trompe, les vrais principes de la resolution des equations et l’analysela plus propre a y conduire; tout se reduit, comme on voit, a une espece de calcul des com-binaisons, par lequel on trouve a priori les resultats auxquels on doit s’attendre. Il serait apropos d’en faire l’application aux equations du cinquieme degre et des degres superieur, dontla resolution est jusqu’a present inconnue; mais cette application demande un trop grand nom-bre de recherches et de combinaisons, dont le succes est encore d’ailleurs fort douteux, pourque nous puissions quant a present nous livrer a ce travail; nous esperons cependant pouvoir yrevenir dans un autre temps, et nous nous contenterons ici d’avoir pose les fondaments d’unetheorie qui nous parait nouvelle et generale.

Page 213: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

8.2. CRONACA DELLE DIMOSTRAZIONI DI RUFFINI 213

Non sara forse difficile dimostrare rigorosamente tale impossibilita gia per le equazionidi quinto grado, sulla qual cosa proporro con piu particolari le mie argomentazioni inun altro luogo3([2], p.17)

Nel medesimo anno in cui il giovane Gauss esprimeva con queste parole il proprioscetticismo, Paolo Ruffini, medico e matematico italiano attivo a Modena, pubblicavauna monografia che, fin dal titolo, prendeva posizione netta sulla questione afferman-do di aver dimostrato l’impossibilita di risolvere in generale un’equazione di gradosuperiore al quarto: Teoria generale delle Equazioni, in cui si dimostra impossibile lasoluzione algebraica delle equazioni generali di grado superiore al quarto [3]. Ruffinidichiara apertamente l’importanza che l’opera di Lagrange sulle equazioni algebricheha avuto sui risultati contenuti nella Teoria generale al punto da indicare come ti-tolo di merito della propria opera quello di avere radunato ed organizzato molto diquanto Lagrange aveva scritto sull’argomento in diverse memorie. La dimostrazionedel teorema fu, e facile immaginarlo, bersagliata da critiche, alcune benevole altremeno, cui Ruffini rispose con nuove versioni della dimostrazione tese a chiarirne esemplificarne l’impianto, fino alla versione finale, licenziata nel 1813. Come vedremo,la dimostrazione finale di Ruffini contiene un’affermazione che occorreva giustificare equesta lacuna venne colmata nel 1826 dal grande matematico norvegese Niels-HenrikAbel (1802-1829) con un lavoro [4] che parte da premesse diverse rispetto a quelle diRuffini e che pure, su un punto non vitale per la validita della dimostrazione, contieneun errore messo in evidenza da William Rowan Hamilton (1805-1865).

Vedremo in questo capitolo lo schema generale dell’ultima dimostrazione del teo-rema di impossibilita data da Ruffini dopo un breve cenno alle diverse versioni che nelgiro di quindici anni egli pubblico. Metteremo in evidenza il punto debole dell’argo-mento di Ruffini ed enunceremo il lemma grazie a cui Abel ottenne una dimostrazionecompleta del teorema.

8.2 Cronaca delle dimostrazioni di Ruffini

Come accennato in precedenza, la prima dimostrazione del teorema di impossibilitasi trova nella Teoria Generale delle Equazioni, a partire dal Capitolo XIII. DapprimaRuffini classifica le permutazioni, sviluppando e sistematizzando quel calcul des com-binaisons che Lagrange aveva abbozzato nelle Reflexions. Con Lagrange e Cauchy,

3Post tot tantorum geometrarum labores perexiguam spem superesse, ad resolutionem ge-neralem aequationum algebraicarum unquam perveniendi, ita ut magis magisque verisimilefiat, talem resolutionem omnino esse impossibilem et contradictoriam. Hoc eo minus para-doxum videri debet, quum id quod vulgo resolutio aequationis dicitur, proprie nihil aliud sitquam ipsius reductio ad aequationes puras. Nam aequationum purarum solution hinc non do-cetur sed supponitur, et si radicem aequationis xm = H per m

√H exprimis, illam neutiquam

solvisti neque plus fecisti, quam si ad denotandam radicem aequationis xn +Axn−1 + .... = 0signum aliquod excogitares, radicemque hinc aequalem poneres. Verum est aequationes pu-ras propter facilitarum ipsarum radices per approximationem inveniendi, et propter nexumelegantem, quem omnes radices inter se habent, prae omnibus reliquis multum praestare,adeoque neutiquam vituperandum esse, quod analystae harum radicis per signum peculiaredenotaverunt; attamen, ex eo, quod hoc signum perinde ut signa arithmetica additionis, sub-tractionis, multiplicationis, divisionis et evectionis ad dignitatem sub nomine expressionumanalyticarum complexi sunt, minime sequitur, cuiusvis aequationis radicem per illas exhiberiposse. Seu, missis verbis, sine ratione sufficienti supponitur, cuiusvis aequationis solutionemad solutionem aequationum purarum reduci posse. Forsan non ita difficile foret, impossibili-tatem iam pro quinto gradu omni rigore demonstrare, de qua re alio loco disquisitiones measfusius proponam.

Page 214: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

214 CAPITOLO 8. IL TEOREMA DI RUFFINI-ABEL

Ruffini puo essere considerato uno dei pionieri della teoria dei gruppi o, meglio, delgruppo delle permutazioni che veniva e sarebbe stato per molto tempo chiamato grup-po delle sostituzioni, riservando invece il termine di permutazione a cio che oggi vienedetto arrangiamento di un insieme di n oggetti. La prima dimostrazione di Ruffini none sempre chiara, come egli stesso ebbe a notare poco dopo, anche per la mancanza diuna apposita notazione per le permutazioni che rende necessaria una descrizione casoper caso che appesantisce la lettura del lavoro. Heinrich Burkhardt, che fu uno deiprimi a sottolineare l’importanza dell’opera di Ruffini nello sviluppo del concetto digruppo [5], sollevo una serie di obiezioni che potevano essere mosse alla dimostrazionedel 1799, come l’aver tacitamente assunti come validi diversi teoremi di Lagrange che,al contrario, erano ancora privi di una solida dimostrazione o l’aver dato per validala dimostrazione del teorema fondamentale dell’algebra proposta da Lagrange. Lamancanza di un’adeguata notazione obbligo Ruffini ad una lunga descrizione di casipossibili che non sempre e completa; manca inoltre una solida dimostrazione di alcunipunti tecnici importanti per l’impianto del teorema. Mentre nelle versioni successivetutte queste imperfezioni poterono essere superate o almeno ritenute errori veniali,una mancanza sostanziale presente ancora nell’ultima dimostrazione di Ruffini e l’averconsiderato come punto di paertenza solo funzioni razionali delle radici e non ancheirrazionali, funzioni queste ultime che Leopold Kronecker (1823-1891) chiamera irra-zionalita accessorie. Questo fatto, che Ruffini pone come ipotesi, e invece il cuore delLemma di Abel la cui dimostrazione e necessaria per rendere completo l’argomento diRuffini.

Nel 1801 Ruffini presento alla Societa Italiana delle Scienze una memoria [6], pub-blicata l’anno successivo, in cui si poneva la domanda di individuare in quali casi larisoluzione di un’equazione di grado qualsiasi fosse ottenibile grazie alla sua riduzionead un’altra equazione di grado inferiore. Nel 1803, sulla stessa rivista, venne publicatauna lettera di Pietro Abbati, conte Marescotti (1768-1842), a Ruffini nella quale egliintendeva semplificare alcuni punti della dimostrazione di Ruffini del 1799. In partico-lare, in quest’opera Abbati mostra il teorema gia enunciato da Lagrange e ripreso daRuffini ma, in entrambi i casi senza dimostrazione, che il numero di valori formalmentedistinti che una funzione di n elementi puo assumere e un divisore di n!. Le osserva-zioni di Abbati saranno incorporate da Ruffini in una memoria [7] pubblicata nel 1803che, sostanzialmente, ha come unico difetto il mancato riferimento alle irrazionalitaaccessorie. Nel 1804 Gian-Francesco Malfatti (1731-1807) pubblico un articolo [8] incui esponeva le proprie riserve circa l’argomento di Ruffini. In particolare egli costruıun esempio di equazione di quinto grado la cui risolvente di sesto grado possiede unaradice razionale e si domandava in qual modo fosse possibile escludere che una taleeventualita non si presentasse nelle risolventi di un’equazione di quinto grado generi-ca. A questa memoria, il cui punto saliente e proprio la costruzione della risolventedi sesto grado, nota oggi come risolvente di Malfatti, Ruffini rispose nel 1805 [9] perpoi dedicarsi ancora al problema nel 1806 con un lavoro non molto felice [10] in cui af-frontava la possibilita di risolvere le equazioni di grado superiore al quarto con metoditrascendenti. Infine giungiamo all’ultima redazione, quella del 1813 [11] che e certola piu sintetica e che, presa singolarmente, lascia in ombra il grande lavoro svolto daRuffini per gettare le basi della teoria dei gruppi.

Page 215: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

8.3. SCHEMA DELLA DIMOSTRAZIONE DEL 1813 215

8.3 Schema della dimostrazione del 1813

Cerchiamo di capire come Ruffini intende procedere discutendo un esempio particolare.Una formula risolutiva algebrica per l’equazione

xm + axm−1 + bxm−2 + · · ·+ u = 0 (8.1)

consiste nel trovare una funzione F (x1, x2, · · · , xn) delle radici di (8.1) che ne dipendain modo simmetrico, in modo da poter essere espressa in termini dei coefficienti di (8.1):F (x1, x2, · · · , xn) = f(a, b, c, · · ·u) e grazie alla quale sia possibile esprimere tutte leradici di (8.1). L’ambiguita in una tale formula, gia evidenziata da Vandermonde,risiede in questo: se

x1 = F ∗(x1, x2, · · · , xn),

dove F ∗ indica una determinazione particolare della F , allora permutando in ambo imembri x1 ed x2, si deve anche avere

x2 = F ∗(x2, x1, · · · , xn).

Ad esempio questa situazione si presenta nella formula risolutiva delle equazioni disecondo grado che, detta α = ±1 una radice quadrata dell’unita, si puo scrivere come

x =−b+ α

√b2 − 4c

2,

scelto α = +1 e ricordando che b = −(x1 + x2), c = x1x2 e che il radicando vaconsiderato in senso aritmetico, si ottiene

x1 =(x1 + x2) +

√(x1 + x2)2 − 4x1x2

2= F ∗(x1, x2).

D’altra parte, se si permutano tra loro x1 ed x2 ad ambo i membri, e si consideraancora il radicale in senso aritmetico, si ha

x2 = F ∗(x2, x1) :

tutti gli argomenti di Ruffini vogliono dimostrare come una formula risolutiva di questotipo sia contraddittoria quando m > 4.

La dimostrazione di Ruffini poggia su alcuni risultati preliminari, alcuni dei qualigia presenti nella prima versione del 1799.• Se

zn +mzn−1 + nzn−2 + · · ·+ v = 0 (8.2)

e l’equazione trasformata di (8.1), allora le radici zk di (8.2) saranno funzioni di quelledi (8.1):

zk = f(x1, x2, · · · , xn). (8.3)

• Per descrivere l’azione di una permutazione su un insieme di argomenti Ruffini, apartire dalla Teoria Generale, aveva proposto diversi esempi didatticamente efficaci.Cosı, ad esempio, se

f(x1, x2, x3) =x11

x2+

3x2x23

x1+ ax2

si ha anche

f(x2, x1, x3) =x22

x1+

3x1x23

x2+ ax1.

Page 216: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

216 CAPITOLO 8. IL TEOREMA DI RUFFINI-ABEL

• Se i coefficientim, n, ...., v della (8.2) sono ciascuno funzione razionale dei coefficientia, b,...., u della (8.1), allora permutando tra loro le x1, x2, · · · , xn nella (8.3) si otterrasempre una radice di (8.2) ed il numero di valori distinti assunto da f e un sottomultiplodi n!.

• Se la funzione (8.3) e di forma tale che uno dei suoi valori e inalterato per effettodi una permutazione che coinvolge le radici che figurano in certe posizioni, iterando lapermutazione, la (8.3) non cambia valore. Consideriamo la funzione

f(x1, x2, x3, x4) =√

x1x22 +

x2x23 +

x3x21 − x4

che rimane inalterata sotto l’azione della permutazione

σ =

(x1 x2 x3 x4

x2 x3 x1 x4

)

:

essa non cambiera valore anche sotto l’azione di

σ2 =

(x1 x2 x3 x4

x3 x1 x2 x4

)

e di σ3 = id, dove id e l’identita. In altre parole

f(x1, x2, x3, x4) = f(x2, x3, x1, x4) = f(x3, x1, x2, x4).

Allo stesso modo, se si considera l’azione di σ sull’arrangiamento (x4, x2, x3, x1) siotterra

f(x4, x2, x3, x1) = f(x2, x3, x4, x1) = f(x3, x4, x2, x1).

Come conseguenza, se applicando p volte su una certa funzione f(x1, x2, · · · , xn) unacerta permutazione σ, rispetto alla quale f e invariante, tale che σp = id, allora la fassumera tutti i suoi valori con molteplicita p.

Entriamo ora piu in dettaglio nel ragionamento di Ruffini servendoci della presen-tazione di Maracchia [12]. Punto chiave della dimostrazione e l’esame di espressionidel tipo

yp = Π := F (x1, x2, · · · , xn) (8.4)

dove x1, · · · , xn sono le radici di (8.1). Denotiamo con y1 = f(x1, x2, · · · , xn) unasoluzione di (8.4) che si potra sempre esprimere come

y1 = αp√Π, con αp = 1.

Ruffini dimostra il seguente

Teorema I. Se Π e invariante sotto l’azione di qualche permutazione σ delle x1, · · · , xn,allora operando con la stessa permutazione su f si ottiene un’altra radice di (8.4).

Dim. Consideriamo la permutazione

σ =

(x1 x2 x3 x4 x5 · · ·x2 x3 x4 x5 x1 · · ·

)

(8.5)

e supponiamo che lasci invariata Π. Cio significa che

Π = F (x1, x2, x3, x4, x5, · · · ) = F (x2, x3, x4, x5, x1, · · · ) = F (x3, x4, x5, x1, x2, · · · )F (x4, x5, x1, x2, x3, · · · ) = F (x5, x1, x2, x3, x4, · · · )

Page 217: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

8.3. SCHEMA DELLA DIMOSTRAZIONE DEL 1813 217

ed operando con σ su f si otterranno i valori

y1 = f(x1, x2, x3, x4, x5, · · · )y2 = f(x2, x3, x4, x5, x1, · · · )y3 = f(x3, x4, x5, x1, x2, · · · )y4 = f(x4, x5, x1, x2, x3, · · · )y5 = f(x5, x1, x2, x3, x4, · · · ).

Siccome y1 risolve (8.4), allora

[f(x1, x2, x3, x4, x5, · · · )]p = F (x1, x2, x3, x4, x5, · · · ) = Π

e questa uguaglianza deve conservarsi anche operando con σ su ambo i membri. Cosıfacendo pero il membro di destra non varia per ipotesi mentre a sinistra y1 vienemutata in uno degli altri valori y2, · · · , y5 che dunque sono anch’esse radici di (8.4).

In particolare, dovra esistere un’altra radice p-esima dell’unita γ tale che

y2 = γp√Π

oltre ad avere y1 = α p√Π. Dunque

y2y1

α

ma siccome αp = γp = 1, anche β := γ

αe una radice p-esima dell’unita e possiamo

cosı concludere che

y2 = βy1, con βp = 1.

Se ora agiamo ripetutamente con σ su ambo i membri di questa uguaglianza otteniamo

y2 = βy1, y3 = βy2, y4 = βy3, y5 = βy4, y1 = βy5

cioe

y1 = βy5 = β2y4 = β3y3 = β4y2 = β5y1

che impone che β sia una radice quinta dell’unita:

β5 = 1. (8.6)

Teorema II. Si supponga che Π sia anche invariante sotto l’azione della permutazione

σa :=

(x1 x2 x3 x4 x5 · · ·x2 x3 x1 x4 x5 · · ·

)

(8.7)

che dunque agisce solo sulle tre radici x1, x2, x3. Allora, i corrispondenti valori di ysono uguali tra loro.

Dim. Per ipotesi si ha

Π = F (x1, x2, x3, x4, x5, · · · ) = F (x2, x3, x1, x4, x5, · · · ) = F (x3, x1, x2, x4, x5, · · · ).

Siano ora

y1 = f(x1, x2, x3, x4, x5, · · · ) ya = f(x2, x3, x1, x4, x5, · · · ) ya+1 = f(x3, x1, x2, x4, x5, · · · )

Page 218: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

218 CAPITOLO 8. IL TEOREMA DI RUFFINI-ABEL

i corrispondenti valori di y: occorre mostrare che y1 = ya = ya+1. Infatti, ripetendol’analisi utilizzata per dimostrare il precedente teorema si ottiene l’esistenza di unaradice p-esima dell’unita γ tale che

ya = γy1, ya+1 = γya e y1 = γya+1.

e che dunque deve verificare

y1 = γya+1 = γ2ya = γ3y1

sicche deve essere una radice terza dell’unita:

γ3 = 1.

Permutiamo ora ciclicamente gli argomenti di ya, ottenendo

ya = f(x2, x3, x1, x4, x5, · · · ) 7→ yb = f(x3, x1, x4, x5, x2, · · · )

ed osserviamo che la relazione tra yb ed ya e la stessa di quella tra y2 ed y1. Conside-riamo la permutazione σb data da

σb :=

(x1 x2 x3 x4 x5 · · ·x3 x1 x4 x5 x2 · · ·

)

= σaσ (8.8)

ed applichiamola ripetutamente ad y1:

y1 = f(x1, x2, x3, x4, x5, · · · )yb = f(x3, x1, x4, x5, x2, · · · )yb+1 = f(x4, x3, x5, x2, x1, · · · )yb+2 = f(x5, x4, x2, x1, x3, · · · )yb+3 = f(x2, x5, x1, x3, x4, · · · )

yb+4 = f(x1, x2, x3, x4, x5, · · · ) = y1.

Siccome yb ed ya sono legate tra loro dalla stessa relazione che intercorre tra y2 ed y1del Teorema I, sappiamo che esiste una radice quinta dell’unita β tale che

yb = βya

e dunqueyb = βγy1.

Ripetendo l’analisi del Teorema I sui valori y1, yb, · · · yb+3 ricaviamo

yb = βγy1 yb+1 = βγyb yb+2 = βγyb+1 yb+3 = βγyb+2 y1 = βγyb+3

cosicche si hay1 = (βγ)5y1

per cui anche βγ e una radice quinta dell’unita. Poiche pero si ha β5 = γ3 = 1 si deveavere γ2 = 1 e dunque γ = 1, visto che il valore −1 non e una radice terza dell’unita.E dunque vero che y1 = ya = ya+1.

In modo del tutto analogo si dimostra ilTeorema III. Si supponga che valgano ancora le ipotesi del Teorema I e che inoltreΠ sia invariante sotto l’azione della permutazione

σc :=

(x1 x2 x3 x4 x5 · · ·x1 x2 x4 x5 x3 · · ·

)

: (8.9)

Page 219: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

8.3. SCHEMA DELLA DIMOSTRAZIONE DEL 1813 219

allora si ha che

y1 = f(x1, x2, x3, x4, x5, · · · ), yc = f(x1, x2, x4, x5, x3, · · · ) yc+1 = f(x1, x2, x5, x3, x4, · · · )

sono uguali tra loro.

Teorema IV. Supponiamo ora che Π sia invariante rispetto a tutte le permutazioniconsiderate nei Teoremi I-III. Allora

y1 = y2 = y3 = y4 = y5 = ya = ya+1 = yc = yc+1.

Dim. Se valgono i Teoremi II e III sappiamo che y1 = ya = ya+1 ed y1 = yc = yc+1.Ora, se applichiamo σc ad ya = y1 otteniamo

ya = f(x2, x3, x1, x4, x5, · · · ) 7→ f(x2, x3, x4, x5, x1, · · · ) = y2

e poiche l’applicazione di σc ad ya = y1 non altera il valore di y1, essa non altera ilvalore neppure di ya sicche

y1 = y2,

che chiude la dimostrazione.

Osservazione. E istruttivo far vedere, come in [12], perche questo argomento non econclusivo se n = 4. Infatti, se si considerano le permutazioni

τ :=

(x1 x2 x3 x4 · · ·x2 x3 x4 x1 · · ·

)

, τa :=

(x1 x2 x3 x4 · · ·x2 x3 x1 x4 · · ·

)

e

τc :=

(x1 x2 x3 x4 · · ·x1 x3 x4 x2 · · ·

)

,

rispetto alle quali si ha invarianza di Π si puo ancora dimostrare, analogamente aquanto visto prima, si ha che

y1 = f(x1, x2, x3, x4, · · · ) = ya = f(x2, x3, x1, x4, · · · ) = ya+1 = f(x3, x1, x2, x4, · · · )= yc = f(x1, x3, x4, x2, · · · ) = yc+1 = f(x1, x4, x2, x3, · · · ).

Se ora si applica τc ad ya si ottiene f(x2, x1, x4, x3) 6= y2 = f(x2, x3, x4, x1) e dunquenon si possono trarre le conseguenze del Teorema IV.

Completata questa minuziosa parte combinatoria, Ruffini puo ora dimostrare ilteorema di impossibilita:Teorema E impossibile risolvere algebricamente un’equazione generale come (8.1)quando n > 4.Dim. L’ipotetica formula risolutiva deve contenere funzioni algebriche dei coefficientidi (8.1). Queste funzioni si otterranno componendo estrazioni di radici di vari indicisu funzioni razionali dei coefficienti. Le operazioni piu interne, dice Ruffini, debbonoessere funzioni razionali dei coefficienti indicate con P ′, P ′′, P ′′′, ecc. L’operazione suc-cessiva (eventuale) sara un’estrazione di radice di un indice opportuno e si otterrannocosı espressioni del tipo

Q′ = α1p1√P ′ Q′′ = α2

p2√P ′′ Q

′′′

= α3p3√P ′′′ ...

dove αp11 = 1, αp2

2 = 1, αp33 = 1, ecc. Ora si formino tutte le possibili espressioni

razionali con le varie P (·) e Q(·) che si indicheranno con F ′1, F

′′1 , F

′′′1 , ecc. di cui poi si

potranno eventualmente formare ulteriori radici ottenendo

R′ = β1q1√

F ′1 R′′ = β2

q2√

F ′′1 R′′′ = β3

q3√

F ′′′1 , ...

Page 220: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

220 CAPITOLO 8. IL TEOREMA DI RUFFINI-ABEL

dove ora βq11 = 1, βq2

2 = 1, βq33 = 1, ecc. Si formano poi le funzioni algebriche

razionali F2 nelle varie P , Q, R e si ripete il procedimento che, se la formula esiste,dovra arrestarsi in un numero finito di passi. In definitiva, la formula risolutiva dovrapotersi esprimere come

x = G(P ′, · · · , Q′, · · · , R′ · · · )dove, a patto di cambiare la scelta delle radici dell’unita αi e βi presenti, si potrannoottenere tutte le radici di (8.1). Fatta una scelta in modo da avere

x1 = G(P , · · · , Q, · · · , R · · · ) (8.10)

dove P , Q, R, ecc. sono una particolare determinazione delle P ′, Q′, R′, ecc. Ora, sen > 4 la formula e contraddittoria. Infatti, siccome le P (·) dipendono dai coefficientidi (8.1), per esse valgono tutte le proprieta di invarianza contenute nei teoremi I−IIIe dunque le Q hanno le proprieta di invarianza stabilite per le yi negli stessi teoremiche permangono anche per le Fi, per costruzione: iterando il processo, si concludeche il secondo membro di (8.10) e invariante rispetto alle permutazioni considerate neiteoremi I-III. Al contrario, il membro di sinistra non soddisfa questa proprieta e ciomostra l’impossibilita dell’esistenza della formula risolutiva algebrica per (8.1).

La critica piu seria mossa alla dimostrazione di Ruffini gia da Burkhardt era quelladi esser partito solo da funzioni razionali delle radici dell’equazione (8.1) per costruiredelle risolventi di cui tentare la soluzione, sulla scorta di quanto fatto da Lagrange. Ineffetti, questa limitazione andava giustificata ed il merito di Abel fu quello di colmarequesta lacuna dimostrando il seguente teorema ([4], p. 75), noto come Lemma di Abel.Teorema. Se un’equazione e risolubile algebricamente, e sempre possibile dare allaradice una forma tale che tutte le funzioni algebriche di cui essa e composta si possonoesprimere tramite funzioni razionali delle radici dell’equazione proposta.

Per la dimostrazione di questo teorema rimando a [12]. Dunque, anche la dimo-strazione finale di Ruffini contiene un punto debole, colmato da Abel. Resta comunquea Ruffini il merito di aver affrontato un argomento spinoso con grande determinazionee di aver gettato le basi per la teoria dei gruppi.

Page 221: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] J.L. Lagrange: Reflexions sur la resolution algebrique des equations, NouveauxMem. de l’Acad. des Sciences et Belles-Lettres de Berlin, 1, 134–215, (1770); 2,138-253, (1771). In Œuvers Completes, vol. 3, J.A. Serret, Ed., Gauthier-Villars,Paris, (1869), 205-421.

[2] C.F. Gauss: Demonstratio nova theorematis omnem functionem algebraicam ra-tionalem integram unius variabilis in factores reales primi vel secundi gradusresolvi posse; in Gauss Werke, vol. 3, Gottingen, (1866), 1-30.

[3] P. Ruffini, Teoria generale delle Equazioni, in cui si dimostra impossibile la solu-zione algebraica delle equazioni generali di grado superiore al quarto. Bologna,Stamperia di S. Tommaso d’Aquino, (1799). In Opere Matematiche di PaoloRuffini a cura di E. Bortolotti, vol. 1, pp. 1–324, Cremonese, Roma, (1953).

[4] N. H. Abel: Demonstration de l’impossibilite de la resolution algebrique desequations generales qui passent le quatrieme degre. In Œuvres completes de NielsHenrik Abel, Nouvelle Edition publiee aux frais de l’ Etat Norvegien par MM.L. Sylow et S. Lie, Grondahl, Christiania, 1881, Tome I, pp.66-94.≡ Beweisder Unmoglichkeit algebraische Gleichungen hoheren Graden als dem viertenallgemein aufzulosen. J. fur die reine und angew. Math. (Crelle), 1, 65–84, (1826).

[5] H. Burkhardt: Die Anfange der Gruppentheorie und Paolo Ruffini. Abhand. zurGeschichte der Mathematik suppl. a Zeitschr. fur Math. und Phys., 37, 119-159,(1892). Trad. it. di E. Pascal: Paolo Ruffini e i primordii della teoria dei gruppi,Annali Mat. Pura ed Appl., 22 (S.2), (1892), 175-212.

[6] P. Ruffini: Della soluzione delle equazioni algebriche determinate particolari digrado superiore al quarto. Mem. Soc. It. Scienze, 9, 444-526, (1802). In Opere Ma-tematiche di Paolo Ruffini a cura di E. Bortolotti, vol. 1, pp. 345-406, Cremonese,Roma, (1953).

[7] P. Ruffini: Della insolubilita delle equazioni algebriche generali di grado superioreal quarto. Mem. Soc. It. Scienze, 10, 410-470, (1803). In Opere Matematiche diPaolo Ruffini a cura di E. Bortolotti, vol. 2, pp. 1–50, Cremonese, Roma, (1953).

[8] G. Malfatti: Dubbi proposti al socio Paolo Ruffini sulla sua dimostrazione Dellaimpossibilita di risolvere le equazioni superiori al quarto grado. Mem. Soc. It.Scienze, 11, 579-607, (1804).

[9] P. Ruffini: Risposta di P. Ruffini ai dubbi propostigli dal socio Gian-FrancescoMalfatti: Sopra la insolubilita algebrica dell’equazioni di grado superiore al quar-to. Mem. Soc. It. Scienze, 12, 213–267, (1805). In Opere Matematiche di PaoloRuffini a cura di E. Bortolotti, vol. 2, pp. 53–90, Cremonese, Roma, (1953).

221

Page 222: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

222 BIBLIOGRAFIA

[10] P. Ruffini: Della insolubilita delle equazioni algebriche generali di grado superioreal 4, qualunque metodo si adoperi, algebrico esso sia o trascendente. Mem. Istit.Naz. Ital. Cl. Scienze Fis. Mat., 1, 433-450, (1806). In Opere Matematiche diPaolo Ruffini a cura di E. Bortolotti, vol. 2, pp. 145–154, Cremonese, Roma,(1953).

[11] P. Ruffini: Riflessioni intorno alla soluzione delle equazioni algebriche generali.Modena, (1813). In Opere Matematiche di Paolo Ruffini a cura di E. Bortolotti,vol. 2, pp. 155-268, Cremonese, Roma, (1953).

[12] S. Maracchia: Storia dell’Algebra. Liguori, Napoli, (2005).

Page 223: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 9

L’opera di Evariste Galois

9.1 Galois tra realta e mito

Sulla vita di Evariste Galois (1811-1832) e stato scritto molto, forse per i risvolti ladrammatici delle vicende che lo hanno visto coinvolto. Nell’immaginario collettivo dimolti matematici Galois rappresenta il prototipo del genio incompreso da un sistemadi valutazione ottuso che premia la mediocrita servile piuttosto che le idee brillantiche rompono gli schemi. Questa visione di un Galois solo contro tutto e contro tutti estata diffusa soprattutto dal capitolo a lui dedicato nella monografia di E.T. Bell Menof Mathematics la cui attendibilita storica e stata impietosamente messa in discussioneda Tony Rothman in un articolo [2] dove—con il ricorso alle fonti e senza una mani-polazione finalizzata ad esaltare, esasperandoli, certi contrasti od incomprensioni cheGalois certamente ebbe con le istituzioni scolastiche prima e con l’Accademia poi—haridimensionato o annullato del tutto la verosimiglianza di aneddoti su Galois che, sen-za aggiunere nulla alle sue indiscutibili doti matematiche, ne alterano i connotati. Misembra opportuno allontanarmi un poco in questo capitolo dall’impostazione seguitasinora per dedicare spazio ad alcuni aspetti della vita di Galois che aiutano a valutarlomeglio.

Bisogna dire che Galois non visse in un contesto storico facile: la Parigi della pri-ma meta del XIX secolo era attraversata da profonde inquietudini. Una delle leggendesu Galois e quella secondo cui egli non avrebbe mai trovato insegnanti che lo abbia-no apprezzato o inoraggiato. Galois ebbe la sua formazione preuniversitaria a Parigipresso il Lycee Louis-le-Grand, che annovera altri studenti celebri come MaximilienRobespierre ed il romanziere Victor Hugo. Il suo rendimento scolastico non fu bassoma l’insegnante di matematica, Vernier, spronava Galois a lavorare in modo piu siste-matico: intelligente, sensibili miglioramenti ma metodo insufficiente e uno dei giudizisu Galois di Vernier. Galois, senza aver seguito classi preparatorie speciali ed un an-no prima del consueto, tento nel 1828 l’ammissione alla Ecole Polytechnique, senzasuccesso. Senza perdersi d’animo prese a seguire nello stesso anno le lezioni di un eccel-lente docente di matematica, Louis-Paul-Emile Richard (1795-1849), che sarebbe statoinsegnante di un altro grande matematico, Charles Hermite. Richard comprese subitol’enorme potenziale di Galois e lo incoraggio molto. La fiducia riposta in lui agı da sti-molo su Galois che proprio nel 1829 pubblico sugli Annales des Mathematiques direttida Joseph Diaz Gergonne il suo primo lavoro sulle frazioni continue periodiche. Nello

223

Page 224: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

224 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

stesso anno Galois stava gia lavorando alla teoria delle equazioni algebriche ed alla finedi maggio sottopose al giudizio dell’Academie le sue prime ricerche sulla risolubilitadelle equazioni di grado primo. Recensore del lavoro fu nominato Augustin-Louis Cau-chy il cui comportamento e stato deformato da diverse ricostruzioni secondo le qualiegli avrebbe perduto, dimenticato o addirittura deliberatamente distrutto i manoscrit-ti di Galois, finendo per avere sulla coscienza la fine di un grandissimo matematico.Sul ruolo di Cauchy e su una sua riabilitazione a dispetto delle tradizioni consolidatesi e pronunciato Rothman a partire da una lettera di Cauchy rinvenuta negli archividella Academie da Rene Taton che dimostra come Cauchy non avesse perduto il lavorodi Galois ma che al contrario, si stava preparando a presentarlo all’Accademia uni-tamente ad alcune sue note nel gennaio 1830. Nel frattempo Galois aveva fallito perla seconda volta l’ammissione all’Ecole Polytechnique nel luglio del 1829. L’episodiodella mancata ammissione di Galois all’Ecole Polytechnique, con tanto di lancio dicancellino in direzione di uno degli esaminatori, viene spesso utilizzato per avvalorarela tesi di Galois incompreso da insegnanti che non erano all’altezza. La tradizione dellareazione stizzita di Galois, gia riportata come non verificata da Dupuy in un primolavoro del 1896 dedicato alla vita di Galois [3] nasconde invece una verita molto piuamara, che avrebbe segnato il resto della breve vita di Galois. Il 2 luglio 1829, pochigiorni prima dell’esame di ammissione all’Ecole, il padre di Evariste, Nicholas Gabriel,si suicido nel suo appartamento parigino, a due passi dal liceo Louis-le-Grand. Non ecerto difficile immaginare come Galois non fosse nelle migliori condizioni per affrontareuna prova selettiva e questo tragico evento puo certo spiegare meglio il suo compor-tamento. La mancata ammissione alla Ecole Polytechique obbligo Galois a ripiegaresulla meno prestigiosa Ecole Normale cui si iscrisse all’inizio del 1830. Fu allora, il 18gennaio, che Cauchy scrisse la lettera cui alludevamo poc’anzi.

Proprio oggi avrei dovuto presentare all’Accademia prima un rapporto sul lavorodel giovane Galois e poi una mia memoria sulla determinazione analitica delle radiciprimitive nella quale dimostro come sia possibile ridurre tale determinazione alla ri-soluzione di equazioni numeriche dotate solo di radici intere e positive. Sono tuttaviaa casa, indisposto. Sono dispiaciuto di non poter partecipare alla sessione odiernae vorrei pregarla di iscrivermi a parlare per la prossima sessione sui due argomentiindicati. La prego di accettare i miei omaggi... A.-L. Cauchy ([5], p.134, [2], p. 88)

Questa lettera dimostra che, sei mesi dopo aver ricevuto i manoscritti di Galois,Cauchy ne era ancora in possesso, li aveva letti e, probabilmente, si era reso conto dellaloro importanza. Tuttavia il 25 gennaio Cauchy presenta all’Accademia solo la suamemoria ma non il lavoro di Galois. Perche? Non sembrano esservi documenti in gradodi spiegare il cambio di opinione di Cauchy ma Taton [4, 5] ha ipotizzato che nellasettimana tra il 18 ed il 25 gennaio Cauchy abbia convinto Galois a combinare i risultatidelle sue ricerche in un’unica memoria con cui concorrere al premio di matematicaindetto dall’Accademia, la cui scadenza era prevista per il 1 marzo. Benche non siapossibile provare che Cauchy abbia agito cosı, resta il fatto che Galois presento afebbraio una memoria a Fourier, segretario perpetuo dell’Accademia. A suffragare latesi di un Cauchy favorevolmente impressionato dal lavoro di Galois, Taton riportaun estratto del giornale Le Globe apparso il 15 giugno del 1831 ed in cui si chiedevala liberazione di Galois che nel frattempo era stato arrestato, come vedremo fra poco.Qui leggiamo:

L’anno scorso, prima del 1 marzo, il Sig. Galois consegno al Segretario dell’Isti-tuto una memoria sulla risoluzione delle equazioni numeriche. Tale memoria avrebbedovuto partecipare al Gran Premio di Matematica. Essa meritava il premio in quantopote risolvere alcune difficolta che Lagrange non era riuscito a superare. Il sig. Cauchy

Page 225: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.1. GALOIS TRA REALTA E MITO 225

attribuiva sommi elogi all’autore per quanto seppe fare. E cosa e successo? La memo-ria e andata perduta ed il premio viene assegnato senza la partecipazione del giovanestudioso. ([2], p. 89)

L’incidente cui si allude e la morte di Fourier, avvenuta nell’aprile del 1830: trale carte di Fourier non si trovo traccia del lavoro di Galois, su cui peraltro Fouriernon era l’unico a doversi pronunciare visto che la commissione era composta ancheda Legendre, Lacroix, Poinsot e Poisson. Questa fatalita certo contribuı ad inasprireil carattere non facile di Galois che pero riuscı a pubblicare tra aprile e giugno trelavori sul Bulletin des Sciences Mathematiques edito da Andre d’Audebard, barone diFerussac e che aveva Christian Sturm (1803-1855) nel comitato di redazione: Sturm eun altro matematico che credette nelle doti di Galois. La parte principale del lavorodi Galois sulle equazioni (la teoria di Galois) si puo considerare comunque pronta ameta del 1830 il che sfata un altro dei miti che circondano la figura di Galois, cioe cheegli abbia gettato le basi della teoria nella febbrile veglia notturna precedente il duelloin cui venne ucciso.

Le vicende del Galois matematico si intrecciano sempre piu con il suo impegnopolitico. Le tendenze liberali ereditate dai genitori si erano esasperate dopo la tragi-ca morte del padre avvenuta per lo scandalo suscitato da alcuni poemetti oltraggiosicircolati sotto il suo nome ma in realta scritti da un sacerdote conservatore. Inuti-le dire che il legame tra gesuiti e Borboni, unito alla parte che ebbe lo sconsideratouomo di chiesa nel suicidio del padre di Galois, contribuirono ad alimentare il suoodio verso la monarchia. Con la rivoluzione di luglio re Carlo X Borbone e costrettoad abbandonare la Francia ed al suo posto si insedia Luigi Filippo. Alla rivoluzio-ne parteciparono anche gli studenti dell’Ecole Polytechnique ma non quelli dell’EcoleNormale che furono chiusi dentro la scuola dal direttore, Guigniault, contro cui Galoispolemizzo a distanza rimediando l’espulsione dalla scuola. Galois cerco nel gennaio del1831 di organizzare un corso privato di matematica ma il suo impegno politico impedıla continuazione di questo esperimento. Sul fronte matematico, Galois invio una terzaversione all’Accademia della sua famosa memoria, su invito di Poisson. Nel maggio del1831 gli eventi precipitarono. Per festeggiare la liberazione di diciannove repubblicaniche si erano rifiutati di consegnare le armi quando la Guardia Nazionale, il corpo cuiappartenevano, fu disarmata su ordine di Luigi Filippo il 31 dicembre 1830, Galoissi ritrovo in un ristorante parigino il 9 maggio con circa duecento altri repubblicani.Ad un certo punto, tra un brindisi e l’altro, Galois ne propose uno “a Luigi Filippo!”brandendo un pugnale in una mano. Il gesto, forse mal compreso, costo un primoarresto a Galois: l’episodio fu anche riportato da Alexandre Dumas (padre), presentenel ristorante. Liberato dopo poco, fu arrestato nuovamente nel luglio 1831 perche ilgiorno della presa della Bastiglia fu sorpreso aggirarsi per le strade armato e vestitocon un’uniforme della Guardia Nazionale vietata perche utilizzata dai repubblicani ascopi politici e ritenuta oltraggiosa verso il regime. Concluso il processo, il 23 ottobreGalois fu condannato a sei mesi di reclusione che sconto nel carcere di S. Pelagia, dovesi trovava gia dopo l’arresto. Galois in carcere tento anche il suicidio ed ebbe l’ulterioreamarezza di ricevere dal segretario dell’Accademia, Francois Arago, il rapporto sullasua memoria che veniva nuovamente respinta in questi termini:

Caro sig. Galois,il vostro lavoro fu inviato al sig. Poisson per un parere. Egli lo ha restituito

allegando un rapporto che qui cito:“Abbiamo fatto ogni sforzo per capire le dimostrazioni del sig. Galois. I suoi

argomenti non sono ne abbastanza chiari ne sufficientemente sviluppati per permettercidi giudicarne il rigore; non ci e stato nemmeno possibile farci un’idea sul lavoro.

Page 226: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

226 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

L’autore afferma che le proposizioni contenute nel manoscritto sono parte di unateoria generale ricca di applicazioni. Spesso parti diverse di una teoria si chiarisconoa vicenda e possono essere comprese piu facilmente quando sono considerate insiemepiuttosto che isolate una dall’altra. Per formarsi un’opinione bisogna quindi attendereche l’autore pubblichi un resoconto piu completo di questo lavoro”.

Per questo motivo, vi restituiamo il manoscritto con la speranza che possiatetrovare utili per il lavoro futuro le osservazioni del sig. Poisson. ([2], p. 96)

A ben vedere il rapporto, negativo quanto all’esito, non e una stroncatura ma con-tiene un suggerimento migliorativo. Per apprezzare questo pero occorreva che Galoisfosse affiancato da una guida esperta che sapesse incoraggiarlo, togliendolo dallo sco-ramento che ogni bocciatura comunque comporta. Purtroppo Galois era nelle peggioricondizioni, trovandosi in prigione, completamente isolato dal mondo matematico. Efacile comprendere che l’esito del rapporto su Galois fu quello di un ulteriore inaspri-mento verso il mondo accademico. Sylvestre Lacroix, un altro dei commissari incari-cati di valutare il lavoro di Galois, nella sesta edizione dei Complements des Elementsd’Algebre ricorda l’impressione avuta dal lavoro di Galois:

Nel 1831 un giovane francese, Evariste Galois, morto l’anno seguente, aveva an-nunciato in una Memoria presentata all’Accademia delle Scienze che, affinche un’equa-zione irriducibile di grado primo fosse risolubile per radicali, era necessario e sufficienteche si potessero dedurre razionalmente tutte le radici, note che ne fossero due qual-siasi; tuttavia questa memoria sembro praticamente incomprensibile ai Commissariincaricati di esaminarla1 (cfr. [7], p.382, in nota).

Trasferito da Santa Pelagia per un’epidemia di colera, Galois torno libero il 29aprile ma un mese piu tardi, il 30 maggio, fu ferito gravemente allo stomaco, in unduello sulle cui motivazioni vi sono tre versioni difformi. Secondo alcuni [2] si sarebbetrattato di un duello per vendicare l’onore di una giovane, Stephanie-Felicie Poterindu Motel, con cui Galois aveva avuto una relazione. Secondo altri, l’uccisore di Galois(Pecheaux d’Herbinville) sarebbe stato un infiltrato che avrebbe avuto l’incarico diprovocare Galois in un duello per eliminarlo. La ricostruzione piu attendibile e quellapresentata da Laura Toti-Rigatelli in [6]. All’inizio del maggio 1832, la duchessa diBerry, vedova del figlio di Carlo X, Carlo Ferdinando, assassinato il 14 febbraio 1820con l’intento di sterminare la dinastia borbonica, era rientrata in Francia. Il figlioEnrico, conte di Chambord, partorito sette mesi dopo la tragica morte del marito e perquesto detto enfant du miracle, era considerato dall’ala piu reazionaria come sovranolegittimo al posto di Luigi Filippo e i repubblicani raccolti nella Societe des amis dupeuple intendevano sfruttare le difficolta del sovrano per organizzare una insurrezione.Per questo scopo occorreva trovare un’occasione per radunare una folla considerevoleed un motivo per catalizzarne gli umori contro il sovrano. Qualcuno dei convenuti allariunione della Societe tenutasi il 7 maggio 1832 osservo che un cadavere eccellente, lacui morte potesse essere utilizzata come pretesto per sollevare la folla, avrebbe facilitatoil compito. E a questo punto che Galois si sarebbe proposto come vittima sacrificale:la Francia era l’unico amore che gli restava, terminata la relazione con Stephanie eperdute le speranze del riconoscimento accademico. Egli seppe convincere le resistenzedegli astanti e fu convenuto che Galois si sarebbe lasciato uccidere in un duello. Peressere certo di morire, solo la pistola dello sfidante (L.D.) sarebbe stata carica. Alla

1En 1831, un jeune Francais, Evariste Galois, mort l’annee suivante, avait annonce dansun Memoire presente a l’Academie des Sciences, que, pour qu’une equation, irreductible dedegre premier soit soluble par radicaux, il faut et suffit que deux quelconques des racinesetant connue, les autres s’en deduissent rationnellement; mais ce Memoire parut a peu presinintelligible aux Commissaires charges de l’examiner.

Page 227: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.2. OPERE MINORI DI GALOIS 227

Societe restava il compito di organizzare un depistaggio, incolpando la polizia segreta diLuigi Filippo dell’assassinio di Galois. Egli, dal canto suo, per non scatenare le protestedel fratello, scrisse alcune lettere in cui si mostrava certo della morte imminente,attribuendola pero alla fine di una relazione amorosa. Galois, trasportato all’ospedaledopo la ferita riportata nel duello vi morı il giorno successivo ed il 1 giugno furonofissati i funerali. Al momento pero dell’inizio della cerimonia funebre si sparse lanotizia della morte del generale Jean-Maximilien Lamarque che non solo era statouno dei piu importanti militari che avevano servito sotto Napoleone Bonaparte ma,terminata l’avventura napoleonica, era stato un esponente di spicco dell’opposizioneparlamentare ai Borbone: un simbolo di valenza molto piu grande del povero Galois.La ragion politica imponeva di ritardare la manifestazione antigovernativa ai funeralidi Lamarque dove, era facile prevedere, sarebbe accorsa molta piu gente. I funeralidel generale, tenutisi il 3 giugno, sono ricordati come la piu imponente manifestazionepopolare contro il regime di Luigi Filippo. La morte di Galois era stata inutile ([6], p.132).

La notte del duello, Galois lascio all’amico August Chevalier una lunga lettera incui riassunse il contenuto delle sue ricerche e dove chiedeva di far pronunciare ufficial-mente matematici famosi come Gauss e Jacobi sull’importanza dei teoremi che avevadimostrato. Chevalier ed il fratello di Evariste, Alfred, ricopiarono i manoscritti e liinviarono a diversi celebri matematici ma fu solo nel 1843 che Joseph Liouville ne ven-ne in possesso e dedico il tempo necessario a comprenderne il contenuto per pubblicarli[7] nel 1846 sul Journal de Mathematiques Pures et Appliquees da lui diretto, essendosiconvinto della loro importanza. Dunque, perche il lavoro di Galois cominciasse anchesolo a circolare ufficialmente tra tutti i matematici, passarono piu di dieci anni dallasua morte. Nel presentare il lavoro di Galois, Liouville cosı si esprimeva a riguardo delsuo stile:

La causa di questo fallimento fu uno smodato desiderio di concisione che occorreinvece evitare sopratutto nel trattare gli argomenti astratti e misteriosi dell’algebrapura; La chiarezza e in effetti tanto piu necessaria se si ha in animo di condurre illettore piu in la delle strade battute, nelle regioni piu aride. “Quando si tratta diquestioni trascendenti, occorre essere chiari in modo trascendente, diceva Descartes.”Troppo spesso Galois ha trascurato questo precetto; e noi comprendiamo come degliillustri geometri abbiano ritenuto conveniente tentare di ricondure sulla retta via unesordiente ricco di talento ma inesperto, con la severita dei loro saggi consigli. Fossestato, attivo ed ardente, l’autore davanti ai suoi censori, avrebbe potuto approfittaredei loro avvertimenti.2 ([7], p. 382)

9.2 Opere minori di Galois

In questa sezione svolgiamo una panoramica sui lavori di Galois, escludendo laMemoireche verra esaminata in dettaglio nella prossima sezione. Galois pubblico due lavori sugli

2Un desir exagere de concision fut la cause de ce defaut que l’on doit surtout tacherd’eviter en traitant les matieres abstraites et mysterieuses de l’Algebre pure. La clarte est,en effet, d’autant plus necessaire, qu’on a dessein d’entraıner le lecteur plus loin des routesbattues et dans des contrees plus arides. “Quand il s’agit de questions transcendantes, soyez,disait Descartes, transcendentalement clairs.” Galois a trop souvent neglige ce precepte; etnous comprenons que d’illustres geometres aient juge convenable d’essayer de ramener au droitchemin, par la severite de leurs sages conseils, un debuttant plein de genie mais inexperimentee.L’auter qu’ils censuraient etait devant eux, ardent, actif, il pouvait profiter de leurs avis.

Page 228: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

228 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

Annales des Sciences Mathematiques editi da Gergonne. Il primo [10] si ricollega allavoro di Lagrange sulla rappresentazione delle soluzioni di equazioni di secondo gradoin frazioni continue periodiche. Lagrange (si veda il Traite [9]), considero un numeroreale x irrazionale rappresentato da una frazione continua periodica

x = p+1

q + 1

p+ 1

q+ 1

p+ 1

q+ 1

p+ 1q+...

,

con p e q numeri naturali. Siccome da questo sviluppo segue che

x = p+1

q + 1x

si vede anche che

qx2 − pqx− p = 0,

cioe che x risolve un’equazione di secondo grado a coefficienti razionali. Il risultatoimportante mostrato da Lagrange e l’inversione di questa osservazione e cioe che lesoluzioni irrazionali di un’equazione di secondo grado a coefficienti razionali hannouno sviluppo in frazione continua periodica. Le frazioni continue periodiche possonopresentare o meno un antiperiodo, cioe un certo numero finito di cifre che non seguonola legge periodica che si instaura da un certo punto in poi. Quando l’antiperiodo eassente, la frazione continua era detta da Galois immediatamente periodica. Ora ilteorema mostrato da Galois afferma che

Se una radice [reale] di un’equazione di grado qualsiasi e una frazione continuaimmediatamente periodica, allora l’equazione avra anche un’altra soluzione ancora pe-riodica che si ottiene dividendo l’unita negativa per la stessa frazione continua scrittanell’ordine inverso. ([7], p. 385)

In altre parole, limitandosi per semplicita come Galois ad un periodo composto daquattro cifre a, b, c e d, se

x1 = a+1

b+ 1

c+ 1

d+ 1

a+ 1

b+ 1

c+ 1d+...

e radice di un fattore quadratico di un’equazione di grado qualsiasi, allora anche

x2 = − 1

d+ 1

c+ 1

b+ 1

a+ 1

d+ 1

c+ 1

b+ 1a...

e radice dello stesso fattore quadratico.

Il secondo lavoro di Galois pubblicato sugli Annales e in realta composto da duebrevissime note tra loro scorrelate. Nella seconda, dal titolo Rayon de courbure descourbes dans l’espace egli fornı una interpretazione della curvatura per curve non pianema e sulla prima parte—Demonstration d’un theoreme d’analyse—che ora ci soffer-meremo. Il teorema “dimostrato” da Galois ma che in realta non e corretto viene cosıenunciato ([11], p. 392):

Page 229: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.2. OPERE MINORI DI GALOIS 229

Assegnate due funzioni F (x) ed f(x) si avra

F (x+ h) − F (x)

f(x+ h) − f(x) = ϕ(k)

per ogni valore di x ed h, con k ∈ [x, x+ h] e ϕ una funzione determinata.3

Una prima osservazione e che Galois assume tacitamente la continuita delle funzioniF ed f in tutto l’intervallo considerato. La sua dimostrazione erronea consta di pochipassaggi: posto

F (x+ h)− F (x)

f(x+ h)− f(x) = P

ne segue F (x+h)−Pf(x+h) = F (x)−Pf(x) per cui, se si esclude il caso particolarein cui F (x) − Pf(x) e costante, questa funzione avra punti di massimo e di minimoche sono assunti in [x, x + h]. Detto x = k uno dei punti in cui si ha un massimo odun minimo, on aura evidentement dice Galois,

k = ψ(P )

per una certa funzione ψ e quindi (donc) si avra anche P = ϕ(k) dove ϕ e un’altrafunzione.

La dimostrazione suona un po’ frettolosa, soprattutto quando Galois ne deduce uncorollario sorprendente:

Da questo di puo concludere, come corollario, che la quantita

limF (x+ h)− F (x)

h= ϕ(x),

per h = 0, cio che dimostra, a priori, l’esistenza delle funzioni derivate.4([11], p. 393)

Inutile dire che la fama di Galois (il cui nome fu storpiato in Galais sulla rivista)non e legato a questo risultato che piuttosto illustra lo stato di confusione che ancoraregnava nel comprendere il rapporto tra continuita e derivabilita di una funzione.D’altra parte, all’inizio del XIX secolo si riteneva come valida la dimostrazione diAmpere del “teorema” che deduceva la derivabilita dalla continuita salvo in un numerofinito di punti. Cio che sembrava inconcepibile era che una funzione continua potessenon essere monotona in un intervallo di ampiezza sufficientemente piccola: non e uncaso che fu grazie allo studio approfondito degli sviluppi in serie di Fourier e del mododi generare funzioni violentemente oscillanti che verranno trovati i primi esempi difunzioni continue in tutto un intervallo ma non derivabili in alcun punto. Il lavoro

3Soient Fx et fx deux fonctions quelconques donnees; on aura, quels que soient x et h,

F (x+ h)− F (x)

f(x+ h)− f(x)= ϕ(k)

ϕ etant une fonction determinee, et k une quantite intermediaire entre x et x+ h.4De la on peut conclure, comme corollaire, que la quantite

limF (x+ h)− F (x)

h= ϕ(x),

pour h = 0, est necessairement une fonction de x, ce qui demontre, a priori, l’existence des

fonctions derivees.

Page 230: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

230 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

di Galois, ironia della sorte, non passo inosservato ma venne criticato da un altromatematico dall’ingegno penetrante che, come Galois, sara apprezzato dopo la morte:il matematico boemo di origini italiane Bernhard Bolzano (1781-1848) che nel suoFunctionenlehre, pubblicato solo nel 1930, cosı commento il lavoro di Galois, riportatointegralmente nel §136:

Questa dimostrazione non mi soddisfa. Senza dubbio l’equazione F (x+h)−F (x)f(x+h)−f(x)

= Prichiede non solo che P venga considerato come un numero dipendente non solo dax e da h, ma anche dalla natura delle funzioni espresse attraverso i simboli F edf . Ora, e vero che l’espressione Fx − P · fx non cambia valore quando x diventax + h, da cui certamente segue (se si assume la continuita delle funzioni Fx ed fx)che l’espressione dovra avere uno o piu massimi o minimi tra x ed x+ h. Ma non mie affatto chiaro perche, se uno di questi venga indicato con K, K deve evidentementeessere una funzione di P . Cioe, cosı come nell’espressione Fx− P · fx compare nonsoltanto P ma anche i simboli F ed f , allo stesso modo potrebbe darsi, ed in effetti ecosı, che K non dipenda soltanto dal valore di P , ma anche dalla natura delle funzioniche noi indichiamo con F ed f ([12], pp. 509-510)

Bolzano nel Functionenelehre fu il primo a proporre un esempio di funzione con-tinua in un intervallo che non ammette derivata in un sottinsieme denso di questointervallo.

Passando ai lavori apparsi sul Bulletin des Sciences Mathematiques, troviamo unabreve nota [13] in cui Galois espone succintamente alcuni risultati ed idee che conflui-ranno nella Memoire. Osserviamo solo che nel commentare i risultati ottenuti, Galoisafferma che

Tutte queste proposizioni sono state ottenute ricorrendo alla teoria delle permuta-zioni.5 ([13], p. 396)

Questo lavoro illustra in modo esauriente come Galois avesse gia dimostrato oquanto meno intuito i risultati che confluiranno nella versione finale della Memoire unpaio d’anni prima di morire.

Sempre nel 1830, comparve un altro lavoro di Galois [14] dedicato alla risoluzionenumerica delle equazioni algebriche. Il lavoro si ispira ad un metodo di risoluzione pro-posto da Adrien-Marie Legendre nell’ultimo dei tre Supplements posti come appendicealla seconda edizione dell’Essai sur la Theorie des Nombres ([15]), cui anche Cauchyaveva dedicato spazio nella Nota III del primo volume del suo Cours d’Analyse del1821 [16]. Il metodo di Legendre viene modificato soprattutto nella formulazione che,invece di basarsi su argomenti geometrici, e tradotta in termini puramente analitici[17], evitando il ricorso ad alcun tipo di grafico. Nella sostanza, Galois come Legendreriscrive un’equazione algebrica F (x) = 0, con F polinomio di grado n, nella forma

ϕ(x) = x

considerandola cioe come un problema di punto fisso e si pone il problema di trovare leradici reali piu vicine ad un numero reale a fissato, una per difetto, l’altra per eccesso.Galois vuole eliminare il ricorso ad un’estrazione di radice n-esima che nel metodoesposto da Legendre occorre fare ad ogni passo. Per questo egli dapprima riscrivel’equazione proposta come

F (x) = X(x)− Y (x) = 0

5Toutes ces propositions ont ete deduites de la theorie des permutations.

Page 231: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.2. OPERE MINORI DI GALOIS 231

doveX ed Y contengono rispettivamente i termini aventi coefficienti positivi e negativi.In seguito egli cerca un numero k tale che la funzione

x+F (x)

kxn

sia monotona crescente nell’intervallo x > 1, limitazione che non mina la generalitadel metodo dal momento che le radici negative si possono ottenere studiando le radicipositive dell’equazione F (−x) = 0 mentre quelle eventualmente presenti nell’intervallo[0, 1] si riducono alle radici maggiori di 1 di F (1/x) = 0. Usando la scomposizio-ne F (x) = X(x) − Y (x), con calcoli diretti Galois conclude che la condizione sarasoddisfatta a patto che sia

1− nX − xX ′

kxn+1+nY − xY ′

kxn+1> 0

e, siccome sia nX − xX ′ come nY − xY ′ sono positive, e sufficiente richiedere che

nX − xX ′

kxn+1< 1

quando x > 1, che si puo verificare prendendo k > nX(1)−X ′(1). Similmente, Galoistrova un altro numero h tale che

x− F (x)

hxn

sia monotona crescente sempre in x > 1, il che e possibile prendendo h > nY (1)−Y ′(1).Con queste scelte dei parametri k ed h, l’equazione F (x) = 0 puo essere riscritta nellaforma

x = x+F (x)

kxn=: ϕ(x) oppure x = x− F (x)

hxn=: ψ(x)

per cui la soluzione e vista come intersezione tra la retta y = x ed una funzionemonotona crescente per x > 1. A questo punto si considera la successione di valori a,ϕ(a), ϕ(ϕ(a)) (a, ψ(a), ψ(ψ(a))) su cui vengono calcolati ambo i termini dell’equazionericavando una successione di valori che convergono alla radice reale dell’equazioneproposta piu vicina ad a: per dettagli sul metodo, si veda [17].

L’ultima nota da esaminare e in effetti la piu importante, quella che ebbe mag-giore attenzione nella seconda meta dell’Ottocento. Si tratta di un lavoro di teoriadei numeri, pubblicato ancora nel 1830 e dedicato allo studio delle congruenze moduloun numero p primo [14], cui Gauss aveva dato un contributo fondamentale nelle Di-squisitiones Arithmeticae, pubblicate nel 1801. Galois considera una congruenza deltipo

F (x) = 0 mod p (9.1)

dove F (x) e un polinomio di grado ν i cui coefficienti sono interi in Zp con p numeroprimo assegnato. Un polinomio F a coefficienti in Zp, e irriducibile se non esistonoaltri polinomi ϕ e ψ e χ a coefficienti in Zp tali che

F (x) = ϕ(x)ψ(x) + pχ(x).

Ora, se F e irriducibile, una congurenza come (9.1) non ammette soluzione in Zp eGalois si pone la domanda se sia possibile introdurre dei simboli immaginari (symbolesimaginaires) per rappresentare le radici di (9.1) che svolgano un ruolo analogo di

√−1

nell’algebra tradizionale. Un problema simile era stato affrontato pochi anni prima

Page 232: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

232 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

per una classe particolare di congruenze da Carl Gustav Jacob Jacobi (1804-1851) inun breve lavoro del 1827 [19] dove, considerando congruenze del tipo

xp+1 ≡ 1 mod p

dove p e un numero primo della forma 6n − 1, egli aveva dimostrato che, oltre allesoluzioni x = ±1, ve ne erano altre p− 1 della forma

x = a+ b√−3 con a2 + 3b2 ≡ 1 mod p.

Le soluzioni di Jacobi rendono il numero di soluzioni distinte della congruenza pari algrado della conguenza stessa, p+1, fornendo un’analogia con il teorema fondamentaledell’algebra. Anche se Galois non sembra essere a conoscenza del lavoro di Jacobi eglinota espressamente che

Il vantaggio principale della nuova teoria appena esposta e di ricondurre le con-gruenze a soddisfare la proprieta (tanto utile per le equazioni ordinarie) di ammetteretante radici quante sono le unita nell’ordine del loro grado.6([18], p. 405)

Indicata dunque con ι una di queste soluzioni immaginarie di (9.1), si osserva cheιν e tutte le potenze di ι con esponente superiore a ν sono vincolate da (9.1). Sipossono pero formare quantita del tipo

α := a0 + a1ι+ a2ι2 + · · ·+ aν−1ι

ν−1 (9.2)

dove tutti i coefficienti ai appartengono a Zp. Ora, le quantita distinte di questotipo che si possono formare sono pν ed e possibile mostrare che nel loro insieme esseformano un campo necessariamente finito, noto oggi come campo di Galois. Proprio ilfatto di essere in numero finito fa sı che, presa una qualsiasi quantita α 6= 0 del tipo(9.2), esistera un numero intero n tale αn ≡ 1 mod p. Infatti, calcolando α2, α3,ecc., si puo utilizzare il fatto che F (ι) ≡ 0 per eliminare tutte le potenze ιm con m ≥ νper cui si torna sempre ad un’espressione del tipo (9.2). Inoltre le n quantita

1 ≡ α0, α, α2, . . . , αn−1

con α 6= 0, non sono mai equivalenti e si possono incontrare due possibilita: o esseesauriscono la classe di espressioni (9.2), oppure ne esiste un’altra β non compresa traqueste per cui si possono formare nuove quantita

β, βα, βα2, ..., βαn−1

non equivalenti tra loro. Se non sono state ancora esaurite le espressioni del tipo (9.2),si itera il procedimento che dovra necessariamente avere un termine, essendo le α 6= 0in numero di pν − 1. In definitiva, si dimostra in questo modo che

αpν−1 ≡ 1 mod p,

generalizzando il classico teorema di Fermat. I campi di Galois saranno trattati davari matematici nell’Ottocento e tra questi ricordiamo Jean-Alfred Serret che dedicheraagli immaginari di Galois parte delle sue ricerche, confluite nella terza edizione (1866)del suo Traite d’Algebre Superieure che sara il testo di riferimento per generazioni distudenti in Francia.

6Le principal avantage de la nouvelle theorie que nous venons d’exposer est de ramenerles congruences a la propriete (si utile dans les equations ordinaires) d’admettre precisementautant des racines qu’il y a d’unites dans leur degre.

Page 233: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 233

9.3 Struttura della Memoire di Galois

Il lavoro principale contenuto in [7] e la Memoire sur les conditions de resolubilite desequations par radicaux [20] che rappresenta l’ultima versione inviata nel gennaio 1831all’Accademia delle Scienze e bocciata dai recensori Poisson e Lacroix. La versionepresente in [7] ha conservato una breve prefazione che funge anche da riassunto, bencheGalois l’avesse poi espunta, forse dopo aver ricevuto il manoscritto non approvato. Ecommovente un passo in cui egli dice Supplico i miei giudici almeno di leggere conattenzione queste poche pagine7 ([7], p. 417). Come riferito da Lacroix, Galois enunciasubito l’obiettivo del lavoro: trovare una condizione necessaria e sufficiente che deveessere soddisfatta da un’equazione algebrica affinche essa sia risolubile per radicali.Galois premette alcuni principı (Principes), quattro lemmi ed otto proposizioni, unadelle quali manca del tutto di dimostrazione. Ricordiamo due tappe fondamentalinella storia dell’algebra dell’inizio XIX secolo. Nelle Disquisitiones Arithmeticae del1801 Gauss era riuscito a dimostrare che tutte le equazioni ciclotomiche xp − 1 = 0sono risolubili per radicali, giustificando quanto era stato affermato da Vandermonde.Nel 1829 Abel pubblico [21] poi un notevole risultato:

Teorema. Se P e un polinomio dotato di n radici r1, · · · , rn e se esistono funzionirazionali θi, con i = 2, · · · , n tali che

ri = θi(r1), i = 2, 3. · · ·n

e se inoltre, ∀i, j = 2, · · ·nθiθj(r1) = θjθi(r1),

allora l’equazione P (x) = 0 e risolubile per radicali. Abel stava dedicandosi a trovarecondizioni necessarie e sufficienti perche un’equazione fosse risolubile per radicali manon pote portare a termine gli studi perche stroncato nello stesso anno, il 1829, datubercolosi. Proprio questo e il lavoro che intraprende Galois, portandolo a terminedue anni dopo, nel 1831.

I principı posti da Galois alla base della teoria sono, in termini moderni, l’amplia-mento di un campo con l’aggiunta di un elemento ed il concetto di gruppo, termineche compare per la prima volta in Galois. La prima definizione riguarda la riducibilitadelle equazioni (oggi diremmo: dei polinomi).

Def. Un’equazione e detta riducibile quando ammette divisori razionali, irriducibilein caso contrario.8([20], p. 418)

A parte qualche questione di nomenclatura, la definizione e quella che si trova ancoroggi. Galois attribuisce estrema importanza all’aggettivo razionale: se nelle equazioninumeriche, la riducibilita significa la scomposizione in fattori a coefficienti numerici erazionali, quando l’equazione e letterale la sua riducibilita consiste nell’avere essa undivisore i cui coefficienti si possono esprimere razionalmente in termini dei coefficientidell’equazione di partenza. A questo punto Galois inserisce una importante novita:

C’e di piu: si potra convenire di ritenere razionale ogni funzione razionale di un certonumero di quantita determinate, date come note a priori. Per esempio, si potrebbe sce-

7Je supplie mes juges de lire du moins avec attention ce peu de pages.8Une equation est dite reductible quand elle admet des diviseurs rationnels; irreductible

dans le cas contraire.

Page 234: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

234 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

gliere una certa radice di un numero intero e ritenere razionale ogni funzione razionaledi questa radice.9 ([20], p. 418)

Galois chiama aggiunzione (adjunction) questo processo di accrescimento del cam-po dei coefficienti di un’equazione data con l’aggiunta di un certo elemento. Questanozione viene fissata prima che si parlasse di campi, benche sia chiaro che Galois con-cepisce questo nuovo oggetto come una sorta di estensione del campo Q dei coefficientidell’equazione proposta. Galois e anche ben consapevole del fatto che l’aggiunzione diuno o piu elementi in un campo ha un effetto cruciale sulla difficolta della soluzionedi una certa equazione:

Per esempio, l’aggiunta di una quantita puo rendere riducibile un’equazione chenon lo era prima10 ([20], p. 418).

Arriviamo ora al concetto di gruppo, nome introdotto proprio da Galois. Ancorauna volta si parla di gruppi di sostituzioni, cioe in termini attuali, di permutazionimentre per Galois, come per Cauchy ed altri, le permutazioni erano gli arrangiamentidi un insieme di n oggetti. La definizione di sostituzione e sostanzialmente ripresa dauna memoria di Cauchy del 1815 [22]. Se si spera di trovare in Galois una definizioneassiomatica del concetto di gruppo, si restera delusi. Ecco il passo in cui l’idea digruppo e introdotta:

Quando vorremo raggruppare le sostituzioni, le faremo discendere tutte da unamedesima permutazione.

Siccome si tratta sempre di problemi nei quali la disposizione iniziale delle letterenon influisce per nulla nei gruppi che considereremo, occorrera avere le stesse sosti-tuzioni, qualunque sia la permutazione da cui si e partiti. Pertanto, se in un grupposiffatto vi sono le sostituzioni S e T , si e certi di avere anche la sostituzione ST .11

([20], p. 419).L’idea di gruppo e la sua proprieta di chiusura rispetto al prodotto di composizione

sono dunque modellate su un esempio preciso, quello delle sostituzioni e dunque sitratta di una formulazione lontana da quella moderna [23]. Nel seguito esporremo leidee di Galois seguendo l’approccio soprattutto di Camille Jordan (1838-1922), autoredi un articolo [27] di commento alla teoria di Galois, nonche di un fondamentale Traitedes Substitutions (1870).

Jordan fornisce all’inizio di [27] la definizione di gruppo:

Un sistema di sostituzioni forma un gruppo, se il prodotto di due sostituzioni qualsiasiappartenenti al sistema, appartiene ancora al sistema. ([27], p. 141).

Rilevante e la definizione di gruppo transitivo, gia data in sostanza da Ruffini:

Un gruppo di sostituzioni tra le lettere α, β, γ,... e detto transitivo se le sue sostituzioniconsentono di portare una qualsiasi di queste lettere nel posto occupato inizialmenteda α. ([27], p. 141)

9Il y a plus: on pourra convenir de regarder comme rationelle toute fonction rationelle d’uncertain nombre de quantites determinees, supposees connues a priori. Par example, on pourrachoisir une certaine racine d’un nombre entier, et regarder comme rationelle toute fontionrationnelle de ce radical.

10Par example, l’adjonction d’une quantite peut rendre reductible une equation irreductible.11Quand nous voudrons grouper des substitutions, nous les ferons toutes provenir d’une

meme permutation.Comme il s’agit toujours de questions ou la disposition primitive des lettres n’influe en rien

dans les groupes que nous considererons, on devra avoir lee memes substitutions, quelle quesoit la permutation d’ou l’on sera parti. Donc, si dans un pareil groupe on a les substitutionsS et T , on est sur d’avoir la substitution ST

Page 235: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 235

Centrale e la definizione di trasformazione di una sostituzione a da parte di un’altrasostituzione b, come la sostituzione12 bab−1.

Dato allora un gruppo a, a1, a2, ..., sottogruppo di un gruppo G, il suo gruppotrasformato da b ∈ G e il gruppo formato dagli elementi bab−1, ba1b

−1, ba2b−1, ... e

se quest’ultimo gruppo coincide con quello di partenza, allora esso e detto commu-tabile (permutable) con b: si tratta della nozione di sottogruppo normale in G, chetanta importanza ha nelle conclusioni della Memoire. Infine, Jordan introduce nelCommentaire la distinzione tra gruppo G composto o semplice a seconda che esso con-tenga o meno un qualche sottogruppo proprio, non banale, le cui sostituzioni sianocommutabili a G:

Un gruppo e semplice se non contiene alcun gruppo, eccettuato quello formato dallasola identita, col quale le sue sostituzioni siano permutabili; in caso contrario il grupposi dira composto. ([27], p. 142)

Tornando alla Memoire, Galois passa a discutere quattro lemmi.

Lemma I. Un’equazione irriducibile non puo avere alcuna radice in comune conun’equazione razionale, senza dividerla13 ([20], p. 419)

La dimostrazione e appena abbozzata, perche gia stata presentata da altri. Percompletezza, ne forniamo una in termini piu moderni, sostanzialmente equivalente aquella data da Jordan. Si tratta di considerare due polinomi p(x) e q(x) a coefficienti inun campo F a caratteristica nulla: per non allontanarci troppo da Galois, assumiamoF = Q. Sia p irriducibile e supponiamo che α sia una radice comune a p e q chedovra appartenere ad un campo che include strettamente Q. Se p non divide q, alloral’irriducibilita di p impone che p e q siano relativamente primi in Q. Debbono alloraesistere altri due polinomi u e v, sempre a coefficienti in Q, tali che

u(x)p(x) + v(x)q(x) = 1.

Posto x = α si ha p(α) = q(α) = 0 che porta all’assurdo 0 = 1, dimostrando il teorema.Senza soluzione di continuita si passa al Lemma II:

Lemma II. Assegnata un’equazione qualsiasi priva di radici coincidenti, le cui radicisono a, b, c, ... e sempre possibile formare una funzione V delle radici tale che duequalsiasi dei suoi valori, ottenuti permutando nella funzione le radici in tutti i modipossibili, non siano coincidenti.14 ([20], p.419)

Prima di dimostrare il Lemma, osserviamo che l’ipotesi di studiare una equazione aradici distinte non lede affatto la generalita della teoria di Galois. Infatti era ben notoun procedimento dovuto a Jan Hudde (1633-1704) e descritto in una lettera del 1657che apparve nella edizione latina della Geometrie curata da van Schooten [24] grazieal quale era sempre possibile ridursi a questo caso. Precisamente, il risultato di Huddesi puo formulare in questi termini [25]: sia a una radice di un polinomio P ∈ Q[x]15.Allora a e una radice multipla di P se e solo se P ′(a) = 0. Infatti, siccome a e radicedi P possiamo scrivere

P (x) = (x− a)Q(x)

12Avverto qui che seguo la convenzione in base al quale nel prodotto ab la sostituzione cheagisce per prima e collocata piu a destra: Jordan segue la convenzione opposta.

13Une equation irreductible ne peut avoir aucune racine commune avec une equationrationnelle, sans la diviser.

14Etant donnee une equation quelconque, qui n’a pas racines egales,, dont les racines sonta, b, c, ..., on peut toujours former une fonction V des racines, telle qu’aucune des valeurs quel’on obtien en permutant dans cette fonction les racines de toutes manieres, ne soient egales.

15Con Q[x] indico l’anello dei polinomi in una variabile, a coefficienti in Q.

Page 236: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

236 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

per cui, derivando, si ottiene

P ′(x) = Q(x) + (x− a)Q′(x)

da cui si conclude che P ′ e divisibile per (x − a) se e solo se Q lo e, cioe se e solo sex = a e radice multipla di P (x) = 0.

Fatta questa precisazione, mostriamo il Lemma II, osservando che Galois si limitaa dire

Per esempio, bastera prendere

V = Aa+Bb+ Cc+ · · ·

A, B, C essendo numeri interi scelti opportunamente.16 ([20], p. 419)

Dimostriamo questo asserto di Galois seguendo ancora Jordan [27]. Osserviamoche una dimostrazione di taglio diverso fu data qualche anno dopo da Georg Cantor inuna breve nota del 1872 [26]. Per coerenza con quanto fatto altrove indicheremo conr1, r2, · · · , rn le radici dell’equazione assegnata. Consideriamo una funzione del tiposuggerito da Galois

V =

n∑

i=1

miri

e consideriamo due permutazioni distinte σ e τ . Indichiamo con Vσ e Vτ i valori assuntida V quando sugli argomenti agiscono queste permutazioni, per cui

Vσ =

n∑

i=1

mirσ(i) Vτ =

n∑

i=1

mirτ(i) :

per verificare le richieste del Lemma occorre escludere tutti e soli quei valori di mi chesoddisfano alle equazioni

n∑

i=1

mi[rσ(i) − rτ(i)] = 0 (9.3)

qualunque sia la coppia di permutazioni σ e τ scelta. Come equazione nelle mi, la(9.3) rappresenta l’equazione di un iperpiano e, poiche abbiamo n radici distinte del-l’equazione proposta, e sufficiente evitare di prendere gli mi che appartengono agli12n!(n! − 1) iperpiani descritti da (9.3). La funzione V gioca un ruolo essenziale gia a

partire dal Lemma III che ne stabilisce la proprieta saliente:

Lemma III. Data una funzione V come indicato nell’articolo precedente, essa godradella proprieta che tutte le radici dell’equazione proposta si esprimeranno razionalmen-te in termini della V .17 ([20], p.420)

La dimostrazione di Galois e solo una traccia e proprio su questo punto Poisson,recensendo la memoria, annoto a margine del manoscritto come la dimostrazione fosseinsufficiente benche la validita del teorema seguisse dalle Reflexions di Lagrange, §100,

16Par example, on peut prendre

V = Aa+Bb + Cc+ · · ·

A, B, C etant des nombres entiers convenablement choisis.17La fonction V etant choisie comme il est indique dans l’article precedent, elle jouira de

cette propriete, que toutes les racines de l’equation proposee s’exprimeront rationnellementen fonction de V .

Page 237: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 237

dove questi aveva studiato il numero di valori distinti assunti da funzioni delle radicidi un’equazione algebrica, tra cui cadevano quelle del tipo proposte da Galois ([8],pp.374-379): questo dimostra che Poisson fece uno sforzo per comprendere il lavorodi Galois. Nella versione finale [20] della memoria, Galois annoto come questo lemmasia citato, senza dimostrazione, da Abel nella sua memoria postuma sulle funzioniellittiche.

Per la dimostrazione del Lemma III seguo ancora il Commentaire di Jordan cheviene anche riprodotto nella sostanza in [25].

Sia V := V (r1, r2, · · · , rn) il valore della funzione V trovata nel Lemma II ecalcolata sulle radici r1, r2, · · · , rn, in questo ordine, dell’equazione da risolvere

P (x) = xn + a1xn−1 + a2x

n−2 + · · · an = 0. (9.4)

Formiamo il polinomio in n variabili x1, · · · , xn

g(x1, x2, · · · , xn) :=∏

σ

[V − V (x1, σ(x2), σ(x3) · · · , σ(xn))] (9.5)

dove il prodotto e fatto sulle permutazioni di x1, x2, · · · , xn che lasciano x1 inal-terata. Per costruzione g e simmetrica nelle variabili x2, · · · , xn e dunque dipendesolamente dai polinomi elementari simmetrici in x2, · · · , xn, cioe a dire da

s1 = x2 + x3 + · · ·+ xn

s2 = x2x3 + x2x4 + · · ·· · · · · ·

sn−1 = x2x3 · · ·xn.

Ora, e possibile mostrare che le funzioni sk si possono esprimere in termini di x1 e deipolinomi simmetrici elementari sk nelle variabili x1, x2, · · · , xn. Ad esempio,

s1 = s1 − x1 s2 = s2 − x1s1 + x21..., ecc.

dunque possiamo scrivere

g(x1, x2 · · ·xn) = h(x1, s1, s2, · · · , sn−1).

Quando al posto delle variabili x1, x2, · · · , xn inseriamo gli n valori distinti r1, r2, · · · , rndelle radici di P (x) = 0 avremo

g(r1, r2 · · · , rn) = h(r1, a1, a2, · · · , an−1)

visto che i polinomi simmetrici elementari sono in questo caso i coefficienti di (9.4).D’altra parte, poiche l’identita compare tra le trasformazioni σ in (9.5) e visto il signi-ficato di V , possiamo concludere che h(r1, a1, a2, · · · , an−1) = 0. Non solo: siccomeV e stata costruita in modo che non possa assumere due valori coincidenti quando sipermutano tra loro le radici di (9.4), possiamo anche concludere che

g(ri, r1, r2 · · · ri−1, ri+1, · · · rn) 6= 0 i 6= 1

dal momento che le permutazioni (r1, r2 · · · rn) 7→ (ri, r1, r2 · · · ri−1, ri+1, · · · rn) sonodistinte dall’identita e, per definizione di V ,

V (ri, r1, r2 · · · ri−1, ri+1, · · · rn) 6= V.

Page 238: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

238 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

Dunque il polinomio h(x, a1, · · · , an−1) ∈ Q(V )[x]18 ha i coefficienti nel campo Q[V ]ottenuto aggiungendo V al campo Q dei coefficienti di (9.4) ed ha in comune conP (x) solo la radice x = r1. Poiche ogni radice di P (x) e semplice, il massimo comundivisore tra h e P e x − r1 che appartiene anch’esso a Q(V )[x] dal momento che leoperazioni coinvolte nella formazione del massimo comun divisore di due polinomi nonfanno uscire dal campo Q(V )[x]. Pertanto r1 ∈ Q[V ] e, ripetendo l’argomento per lealtre radici di (9.4), si conclude che esistono n funzioni razionali f1, · · · fn tali che

ri = fi(V ). (9.6)

Il Lemma IV e la chiave per introdurre il gruppo di Galois dell’equazione (9.4) econsente di provare una proprieta di chiusura delle radici di (9.4) quando vengonooperate delle opportune sostituzioni delle ri.Lemma IV. Supponiamo di aver formato l’equazione in V e di aver preso uno deisuoi fattori irriducibili, in modo che V sia radice di un’equazione irriducibile. SianoV , V ′, V ′′,... le radici di quest’equazione irriducibile. Se a = f(V ) e una delleradici dell’equazione proposta, f(V ′) sara ancora una radice della proposta.19 ([20],pp. 420–421)

Quella che Galois chiama equazione in V e l’equazione in una variabile ausiliaria tche ammette come radici V e tutti i valori ottenuti da V permutando tra loro le ri intutti i modi possibili:

(t− V )(t− σ2(V ))(t− σ3(V )) · · · (t− σn!(V )) =n!∏

i=1

(t− σi(V )) (9.7)

dove il prodotto e fatto su tutte le permutazioni σi delle n radici r1, · · · rn di (9.4),Vi := V (σi(x1), σi(x2), ..., σi(xn)) e σ1(V ) = V . Ora, l’equazione (9.7) e simmetricanelle Vi e quindi, per definizione di V ≡ V1, e simmetrica nei coefficienti di (9.4).Consideriamo il fattore irriducibile su Q della (9.7) cui appartiene V ed indichiamocon V2, ...., Vm le altre radici di questo fattore. Per procedere nella dimostrazioneoccorre ricordare un risultato che riguarda le funzioni razionali, cioe i quozienti dipolinomi, avvertendo che tali risultati non furono utilizzati da esplicitamente Galois.Dimostro questo risultato ausiliario servendomi dell’esposizione della teoria di Galoisfatta alla fine del XIX secolo dal matematico statunitense James Pierpont [28].

Risultato ausiliario. Assegnata l’equazione p(x) = xn + a1xn−1 + · · · + an = 0

con coefficienti nel campo F e dette r1, r2,...,rn le sue radici, ogni funzione razionaleψ(r1) di una di queste radici si puo scrivere come

ψ(r1) = β0 + β1r1 + · · ·+ βn−1rn−11

cioe come una funzione razionale intera (polinomio) di r1.Infatti, siccome r1 risolve un’equazione di grado n, le sue potenze ad esponen-

te superiore ad n − 1 si esprimono come funzioni razionali intere delle potenze finoall’esponente n− 1 compreso e dunque

ψ(r1) =g(r1)

h(r1)=α0 + α1r1 + · · ·+ αn−1r

n−11

β0 + β1r1 + · · ·+ βn−1rn−11

.

18Con Q(V )[x] indichiamo l’anello dei polinomi in x a coefficienti nel campo F [V ].19Supposons que l’on ait forme l’equation en V , et que l’on ait pris l’un des ses facteurs

irreductibles, en sorte que V soit racine d’une equation irreductible. Soient V, V ′, V ′′... lesracines de cette equation irreductible. Si a = f(V ) est une des racines de la proposee, f(V ′)de meme sera une racine de la proposee.

Page 239: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 239

Se moltiplichiamo numeratore e denominatore di quest’espressione per h(r2)·h(r3) · · ·h(rn),a denominatore otteniamo una funzione simmetrica delle ri che dunque puo esprimersiin termini dei coefficienti di p(x) e appartiene per questo ad F . Il numeratore e invecesimmetrico nelle radici r2, r3,...,rn e quindi si puo esprimere come polinomio di r1 edei coefficienti di p(x), dimostrando il lemma. Passiamo a dimostrare il Lemma IVdella Memoire.

Dim. Da (9.6) sappiamo che P (ri) = P (fi(V1)) = 0 (i = 1, ..., n) e quindi la funzionerazionale intera (cioe il polinomio) P fi e annullata dalla radice V1 di un polinomioirriducibile su F . Quindi, deve essere anche P (fi(Vj)) = 0, per j = 2, ...., m e questosignifica che fi(Vj) e ancora una radice dell’equazione (9.4). Ora, possiamo ancheescludere che fi(Vj) = fk(Vj) quando i 6= k. Infatti, se cosı fosse avremmo

(fi − fk)(Vj) = 0

e dunque Vj annullerebbe il fattore irriducibile di (9.7) contenente V1 ed il polinomiofi − fk. Ripetendo lo stesso argomento appena incontrato si otterrebbe anche che(fi − fk)(V1) = 0 e dunque che fi(V1) = fk(V1), cioe che ri = rk per qualche coppiadi indici i e k, contraddicendo il fatto che (9.4) debba avere tutte le radici distinte.

L’importanza di questo teorema sta nel fatto che le applicazioni

σj : ri 7→ fi(Vj)

sono, ∀j = 1, ..., m, permutazioni delle radici della proposta. L’insieme di queste per-mutazioni forma un gruppo che (oggi) e detto gruppo di Galois associato all’equazione(9.4). A questo proposito vi sono due domande cui occorrerebbe rispondere: dappri-ma se il gruppo di Galois di un’equazione dipende dalla scelta di V e che il gruppo diGalois sia effettivamente un gruppo. Galois non si pone il primo problema e sembradare per scontata la natura gruppale del sottoinsieme σi. Conformandoci ad un usoormai radicato, indichero con Gal(P/Q) il gruppo di Galois di P sul campo Q. Ter-minati i lemmi, Galois passa a dimostrare le proposizioni principali della sua teoria.Osserviamo ancora che le permutazioni di Gal(P/Q) sono quelle che mandano V1 inuna qualunque delle Vi, con i = 1, ..., m. Con la Proposizione I Galois caratterizza lepermutazioni che appartengono a Gal(P/Q).

Proposizione I. Sia assegnata un’equazione con n radici a, b, c, .... Esiste un gruppodi permutazioni delle lettere a, b, c, ... che gode della seguente proprieta: 1. che ognifunzione delle radici, invariante per le sostituzioni del gruppo, sia nota razionalmente;

2 Viceversa, che ogni funzione delle radici determinabile razionalmente, sia inva-riante sotto l’azione delle sostituzioni20 ([20], p. 421)

Siccome V = V1 e funzione razionale delle r1, ..., rn che a loro volta sono funzionirazionali di V , per il risultato ausiliario appena mostrato, ogni funzione razionaleϕ(r1, r2, ..., rn) si puo scrivere come

ϕ(r1, r2, ..., rn) = b0 + b1V1 + b2V21 + · · ·+ bm−1V

m−11 =: ψ(V1) (9.8)

20Soit une equation donnee, dont a, b, c, ..., sont les m racines. Il y aura toujours ungroupe de permutations des lettres a, b, c, ..., qui jouira de la propriete suivante: 1. Quetoute fonction des racines, invariable par les substitutions de ce groupe, soit rationnellementconnue;

2 Reciproquement, que toute fonction des racines, determinable rationnellement, soitinvariable par les substitutions.

Page 240: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

240 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

dove m e il grado del fattore irriducibile contenente V = V1. Mostriamo ora la primaimplicazione contenuta nella Proposizione I. Applicando a (9.8) una delle sostituzioniσ1 = id, σ2,...,σm di Gal(P/F ) otteniamo, per l’invarianza di ϕ

ϕ(r1, r2, ..., rn) = ψ(V1) = ψ(V2) = · · · = ψ(Vm)

per cui ϕ(r1, r2, ..., rn) =1m[ψ(V1)+· · ·+ψ(Vm)] e la funzione in parentesi e simmetrica

nelle radici di un fattore irriducibile di un polinomio a coefficienti in Q. Quindi icoefficienti di questo fattore irriducibile stanno in Q e cio dimostra l’implicazione. Perl’implicazione opposta, si suppone che una funzione ϕ(r1, r2, ..., rn) sia razionalmentenota, cioe appartenga ad Q, quale che sia l’ordine in cui compaiono i suoi argomenti.Allora l’equazione

bm−1tm−1 + bm−2t

m−2 + · · ·+ b1t+ b0 − ϕ = 0 (9.9)

ha coefficienti in Q ed ammette come radice t = V1, grazie a (9.8): siccome V1 e ancheradice di un’equazione irriducibile su Q, allora (9.9) ammette anche tutte le V2,...,Vm

come sue radici per cui

ϕ = ψ(V1) = ψ(V2) = · · · = ψ(Vm)

che mostra l’invarianza di ϕ.La natura gruppale di Gal(P/Q) discende dalle proprieta caratteristiche dell’insie-

me di sostituzioni σ1, σ2, ...σm. Infatti, siccome il fattore irriducibile G(t) di cui V1

e radice si puo scrivere come

G(t) = (t− V1)(t− Vσ2) · · · (t− Vσm)

ed ha coefficienti in Q, allora esso deve restare invariato sotto l’azione delle sostituzioniσi per cui

G(t) = (t− Vσi)(t− Vσ2σi) · · · (t− Vσmσi)

che mostra come le Vσkσi siano radici di G(t): siccome Vσj 6= Vσkquando j 6= k,

concludiamo che le sostituzioni σi,...,σjσi,...,σmσi non sono altro che quelle di partenza,al piu disposte in ordine diverso.

L’oggetto da studiare dunque non e l’intero gruppo delle sostituzioni anche perchele funzioni delle radici di (9.4) che sono invarianti rispetto a tale gruppo, essendofunzioni simmetriche non consentono di discriminare tra una radice ed un’altra: adesempio, conoscere la somma ed il prodotto (funzioni simmetriche) di due numeri x1

ed x2 non esime dal risolvere un’equazione di secondo grado completa per determinarei due numeri individualmente. Il gruppo Gal(P/Q) isola alcune permutazioni chelasciano invariate delle particolari relazioni tra le radici e l’obiettivo della teoria diGalois e proprio quello di cercare condizioni su questa struttura gruppale, verificatele quali si puo essere certi della risolubilita di un’equazione algebrica. Dimostrata laProposizione I Jordan stabilisce un corollario importante ([27], p. 147)

Corollario I. Se due funzioni ϕ1 e ψ1 delle radici dell’equazione proposta sono nu-mericamente uguali, la stessa uguaglianza sussistera anche tra le funzioni ϕa e ψa

ottenute effettuando su ciascuna di esse una qualsiasi delle sostituzioni di G21

Infatti, poiche ϕ1 − ψ1 = 0 e nota razionalmente (0 ∈ Q), per definizione dellesostituzioni a ∈ G, questa relazione resta valida per ϕa − ψa = 0.

21G indica il gruppo dell’equazione sul campo dei coefficienti dell’equazione proposta.

Page 241: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 241

Jordan fa seguire due teoremi che traspongono proprieta di un’equazione F (x) = 0in proprieta del suo gruppo G.

Teorema II. Ogni equazione irriducibile F (x) = 0 ha il suo gruppo transitivo, eviceversa.

Infatti, se G non e transitivo, isolata una radice x1 di F (x) = 0 si avrebbe che solole radici x1, x2, ..., xm potrebbero essere scambiate con x1 da una sostituzione di G,con m < n = degF . Le sostituzioni di G non possono che scambiare tra loro le radicidell’insieme x1, x2, ..., xm: infatti, se una sostituzione a rimpiazza xm con x, poicheesiste una sostituzione b che manda x1 7→ xm, la sostituzione ab sostituisce x1 con x

che dunque deve appartenere all’insieme x1, x2, ..., xm. Grazie a questa osservazioneJordan conclude che le sostituzioni diG non possono modificare le funzioni simmetrichedi x1, x2, ..., xm che pertanto sono razionali. Dunque l’equazione

(x− x1)(x− x2) · · · (x− xm) (9.10)

e divisore razionale di F (x) che e riducibile su Q. Al contrario, se G e transitivo F (x)non puo ammettere alcun divisore razionale come (9.10) perche, se xm+1 e una radicedi F (x) = 0 distinta da quelle di (9.10), dovendo esistere una trasformazione di Gche manda x1 in xm+1 per la ipotesi di transitivita del gruppo, (9.10) si trasformerasotto l’azione della stessa sostituzione in un prodotto distinto e pertanto, non essendoinvariante sotto l’azione del gruppo G, e irrazionale.

Il teorema successivo dimostrato da Jordan ([27], pp. 147-148) fornisce la con-dizione sotto la quale il gruppo di un’equazione irriducibile ha ordine pari al gradodell’equazione stessa:

Teorema III. L’ordine del gruppo di un’equazione irriducibile di grado ν, le cui radicisono funzioni razionali di una radice particolare x1, e pari a ν.

Infatti, la funzione V1(x1, ..., xν) che gode delle proprieta dei lemmi II e III mostratida Galois e in effetti esprimibile come funzione della sola radice x1: V1 = f(x1). Essae dunque radice dell’equazione di grado ν

[t− f(x1)] · · · [t− f(xν)] = 0 (9.11)

i cui coefficienti sono razionali, visto che sono simmetrici nelle quantita x1, ..., xν .Poiche l’ordine del gruppo G dell’equazione di partenza e il grado dell’equazione irri-ducibile di cui V1 e radice, esso non puo superare ν, in virtu del Lemma 1. Essendopero il gruppo G transitivo, esso deve contenere almeno ν sostituzioni: l’identita, ele ν − 1 che debbono sostituire x1 con una delle altre radici x2,..., xν . Dunque G ecomposto esattamente da ν sostituzioni.

Fatte queste precisazioni, Jordan non espone le proposizioni II e III della Memoirema la Proposizione IV che Galois aveva enunciato in questi termini:

Proposizione IV. Se si aggiunge ad un’equazione il valore numerico di una certafunzione delle sue radici, il gruppo dell’equazione si ridurra in modo tale da non averealtre permutazioni se si eccettuano quelle che lasciano invariante la funzione.22 ([20],p.425)

Jordan rende la Proposizione IV in questo modo:

22Si l’on adjont a une equation la valeur numerique d’une certaine fonction des ses racines,

le groupe de l’equation s’abaissera de maniere a n’avoir plus d’autres que celles par lesquelles

cette fonction est invariable.

Page 242: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

242 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

Teorema IV. Sia G il gruppo di un’equazione F (x) = 0, ϕ1 una funzione razionalequalsiasi delle sue radici: I. Le sostituzioni di G che non modificano il valore numericodi ϕ1 formano un gruppo H1: II L’aggiunta (adjonction) del valore di ϕ1 ridurra ilgruppo dell’equazione precisamente ad H1.

La riduzione del gruppo puo non esserci affatto: se ϕ1 e una funzione che assumeun valore razionale, il campo dei coefficienti non viene esteso affatto ed il gruppo nonsi riduce.Per la dimostrazione del Teorema IV, Jordan considera due sostituzioni a ed a1 di Gche non alterino il valore di ϕ1:

ϕa = ϕ1 ϕa1= ϕ1

per cui, applicando a1 ∈ G alla prima relazione, grazie al Corollario I si ha anche

ϕa1a = ϕa1= ϕ1

che mostra la chiusura delle sostituzioni che non alterano ϕ1: indichiamo con H1 ilsottogruppo di G che lascia inalterata ϕ1. Passando alla seconda parte del teorema,supponiamo di aver esteso il campo aggiungendo il valore di ϕ1 a Q. In questo modo,il valore di ϕ1 diventa razionalmente noto in Q′ := Q[ϕ1] e quindi il nuovo gruppoG′ dell’equazione, riferito a Q′, deve essere formato da sostituzioni che non alteranoil valore di ϕ1 sicche G′ ⊆ H1. Viceversa, se a ∈ H1 e ψ1 e una funzione delle radicir1,..., rn dell’equazione proposta che sia esprimibile razionalmente in Q′, possiamoporre in evidenza la dipendenza razionale da ϕ1 scrivendo ψ1 = χ(ϕ1), dove χ indicauna funzione razionale. Poiche dunque ψ1 − χ(ϕ1) = 0 e razionale, essendo nulla,quest’ultima relazione permane vera se si applica una qualunque sostituzione di G, inparticolare vale per a ∈ H1 e dunque concludiamo che

ψa − χ(ϕa) = 0

e dunque, essendo ϕa = ϕ1, si ottiene anche che ψ1 = ψa, per cui a appartiene ancheal gruppo ridotto G′: H1 ⊆ G′, che consente di ottenere G′ = H1, come occorrevadimostrare.

Il processo di riduzione si puo continuare, immaginando di aggiungere a Q non soloil valore di ϕ1 ma anche quello di altre funzioni ϕ′

1, ϕ′′1 ,... razionali delle radici che

ridurranno il gruppo dell’equazione al sottogruppo di G contenente le sostituzioni chenon alterano il valore numerico di tutte le funzioni introdotte ([27], p. 149). Un’altraconseguenza del teorema IV posta in luce da Jordan e che, se ϕ1 e ψ1 sono duefunzioni delle radici dell’equazione proposta che sono invarianti sotto l’azione dellostesso gruppo di sostituzioni in G, allora esse si esprimono razionalmente una tramitel’altra ([27], p. 149). Per chiarire come si modifichi la struttura gruppale di G dopola sua riduzione ad H1, Jordan dimostra il seguente

Teorema V. Ferme restando le ipotesi come nel teorema precedente23 , siano a0, a1,a2,... le sostituzioni di H1:

a0, a1, a2, ...; ba0, ba1, ba2, ...; ca0, ca1, ca2, ...; ...

quelle di G: l’equazione

(Y − ϕ1)(Y − ϕb)(Y − ϕc) · · · = 0 (9.12)

23Il teorema IV.

Page 243: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 243

il cui grado e pari al rapporto tra l’ordine di G e quello di H1, avra coefficienti razionalie sara irriducibile. ([27], p. 149)

Prima di esaminare la dimostrazione, osserviamo che l’irriducibilita di (9.12) eriferita a Q. Inoltre, con a0 Jordan indica l’identita di G. Jordan, che svolge l’abbozzodi dimostrazione contenuto nella Memoire di Galois, sta suddividendo le sostituzionidi G in un quadro

a0 a1 a2 · · · aνba0 ba1 ba2 · · · baνca0 ca1 ca2 · · · caν· · · · · · · · · · · · · · ·

(9.13)

in cui la prima riga ospita le sostituzioni del sottogruppo H1, con ai 6= aj se i 6= j;la seconda riga ospita le sostituzioni ottenute applicando b = ba0 ⊆ H1 a tutte lesostituzioni di H1 ottenendo permutazioni che non soltanto sono distinte tra loro masono anche distinte da tutte le sostituzioni di H1: se cosı non fosse ma si avessebaj = ak per una coppia di indici j, k, allora avrebbe b = aka

−1j ∈ H1, contrariamente

all’ipotesi. Similmente, se c non appartiene a nessuna delle sostituzioni precedenti,tutte le sostituzioni del tipo caj sono distinte tra loro e da tutte quelle contenute nellerighe precedenti. Procedendo, e chiaro che si esauriranno le sostituzioni di G in unnumero di righe pari al rapporto tra il numero di elementi di G e quello degli elementidi H1, cioe pari all’indice di H1 in G: in effetti questo quadro e del tutto analogo aquello che si utilizza ancora oggi per dimostrare il teorema di Lagrange sull’ordine deisottogruppi di un gruppo finito.

Per la dimostrazione del Teorema V, Jordan osserva che una sostituzione σ qualsiasiappartenente a G dovra anche ricadere in una delle righe del quadro (9.13) e lo stessodeve accadere per le sostituzioni σb, σc,... .Ora, se b e c stanno su righe diverse delloschema (9.13), lo stesso deve succedere per σb e σc perche, se fosse σb = dai e σc = daj ,allora avremmo

σ−1d = ba−1i = ca−1

j

da cui si potrebbe concludere che c = ba−1i aj , contrariamente all’ipotesi fatta. Os-

serviamo anche che la sostituzione σ = bai manda ϕ1 in ϕbai. Poiche la relazione

ϕ1 = ϕai deve restare invariata sotto l’azione di una sostituzione di G come b, si haϕσ = ϕb cosicche, in definitiva, σ trasforma ϕ1 in ϕb. Allo stesso modo si dimostrache, se σb e della forma caj , allora σ trasforma ϕb in ϕc e, proseguendo, si vede chel’effetto di una qualsiasi sostituzione di G e quello di permutare tra loro i valori diϕ1, ϕb, ϕc,... . Osserviamo ora che i coefficienti dell’equazione (9.12) sono funzionisimmetriche di ϕ1, ϕb, ϕc, ... e dunque una qualunque sostituzione σ ∈ G li develasciare inalterati, per quanto appena dimostrato. Per la proprieta caratteristica dellesostituzioni di G (Proposizione I), i coefficienti di (9.12) sono razionali. Quanto all’ir-riducibilita di (9.12) osserviamo che, se cio non fosse vero, allora potremmo isolare unfattore razionale come (Y −ϕ1)(Y −ϕb) i cui coefficienti, essendo razionali, dovrebberorestare inalterati sotto l’azione di una sostituzione c ∈ G. Poiche una tale sostituzionetrasforma

(Y − ϕ1)(Y − ϕb) 7→ (Y − ϕc)(Y − ϕcb)

occorrerebbe dunque che i fattori di questi due prodotti coincidessero, a meno del-l’ordine. Ora, se fosse ϕb = ϕc si avrebbe anche ϕb−1c = ϕ1 che mostrerebbe comeb−1c ∈ H1 e dunque c = baj , contrariamente all’ipotesi. Che il grado dell’equazionesia quello indicato nel teorema segue dalla formazione dello schema (9.13).

Notiamo che, a parte la prima riga di (9.13) che, per definizione, e un sottogruppo diG, nessuna delle altre righe ha struttura gruppale, mancando ad esempio in ciascuna

Page 244: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

244 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

di esse, l’identita. E pero possibile ottenere una ripartizione di G in sottogruppi,lasciandosi guidare dalle proprieta di invarianza della funzione ϕ1. Jordan osserva([27], §14, p. 150) che le sostituzioni che non alterano ϕb sono quelle del tipo bajb

−1,con aj ∈ H1; quelle che non alterano ϕc sono del tipo cajc

−1, con aj ∈ H1, e cosıvia. Infatti, se σ ∈ G e tale che ϕσb = ϕb, allora applicando b−1 ∈ G deve essereanche ϕb−1σb = ϕ1 per cui b−1σb = aj e quindi σ = bajb

−1. In modo analogo siottiene l’implicazione opposta: se σ = bajb

−1 allora σ non altera il valore di ϕb.Con questa osservazione, Jordan passa al Teorema VI che precisa la riduzione di Gquando si aggiungono tutti i valori ϕ1, ϕb, ϕc che ϕ1 puo assumere sotto l’azione dellesostituzioni di G.

Teorema VI. Ferme restando le ipotesi dei teoremi precedenti24, l’aggiunta si-multanea dei valori di ϕ1, ϕb, ϕc, ..., ridurra il gruppo dell’equazione proposta adI, essendo I il gruppo piu generale, tra quelli contenuti in H1, commutabili con lesostituzioni di G. ([27], p. 150)

In altri termini, I e il sottogruppo normale di G, massimale tra quelli inclusi in H1.Lo schema della dimostrazione ricalca quelli gia visti nei teoremi precedenti. An-

zitutto si osserva che il gruppo ridotto I dell’equazione di partenza, a seguito dell’ag-giunta di ϕ1, ϕb, ϕc, ... deve essere formato da sostituzioni che stanno nel gruppo

J := H1 ∩Hb ∩Hc · · ·

dove

Hb = bH1b−1, Hc = cH1c

−1, ...

visto che le sostituzioni di I debbono lasciare inalterati tutti i valori assunti dallafunzione ϕ1(r1, r2, ..., rn) sotto l’azione delle sostituzioni di G. Ora, presa s ∈ J eσ ∈ G, la sostituzione σsσ−1 deve stare in

σH1σ−1 ∩ σHbσ

−1 ∩ σHcσ−1 · · · .

Poiche pero σb = daj , per qualche sostituzione d e qualche aj ∈ H1, abbiamo chel’elemento generico di σHbσ

−1 e del tipo

σbakb−1σ−1 = dajaka

−1j d−1 ∈ Hd :

pertanto possiamo concludere che σsσ−1 appartiene ancora a J e quindi J ⊆ I . Vi-ceversa, poiche I ⊆ H1, le trasformazioni delle sue sostituzioni sotto l’azione di b,c, ..., appartengono ad Hb, Hc che, pero, non fanno altro che riprodurre sostituzioniappartenenti ad I : ne concludiamo che tutte le sostituzioni di I sono comuni ad H1,Hb, Hc,... e quindi I ⊆ J .

Emerge da questo teorema il ruolo giocato dai sottogruppi normali del gruppo Gdi un’equazione che diverra cruciale nel decidere se un’equazione assegnata sia o menorisolubile algebricamente.

Jordan osserva ora che, se H1 e normale in G, si avra H1 = Hb = Hc = · · · = Ie ϕ1, ϕb, ϕc, · · · , essendo invarianti sotto l’azione delle medesime sostituzioni di G, siesprimono razionalmente in funzione di una sola di esse. Viceversa, se ϕ1, ϕb, ϕc, · · ·si esprimono razionalmente in funzione di una sola di esse, saranno invarianti per lostesso insieme di sostituzioni di G cosicche H1 = Hb = Hc = · · · che risultera ungruppo normale in G.

24I teoremi IV e V.

Page 245: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 245

A questo punto Jordan ha gli elementi per aggiungere dettagli sul gruppo di Galoisdell’equazione (9.12):

Teorema VII. Sia N l’ordine di G, N ′ = Nν

l’ordine di I. L’ordine del gruppo G′

dell’equazione (9.12) sara ν.

Dunque l’equazione (9.12) ha grado uguale all’ordine del suo gruppo di Galois. Perdimostrarlo, occorre ripercorrere il procedimento che ha portato ad ottenere il gruppodi Galois per l’equazione assegnata, a partire questa volta da (9.12). Infatti, Jordanconsidera la funzione

W := M1ϕ1(r1, r2, · · · , rn)+Mbϕb(r1, r2, · · · , rn)+Mcϕc(r1, r2, · · · , rn)+ · · · (9.14)

dove i coefficienti Mi sono da scegliere in modo che W assuma sempre valori distinti,comunque si permutino tra loro le radici di (9.12). Per definizione, W e radice di un’e-quazione irriducibile su Q, di grado pari all’ordine del gruppo G′ dell’equazione (9.12).Possiamo pero considerare W come funzione delle radici r1, r2, · · · , rn dell’equazioneassegnata p(x) = 0: in questo senso, W non e modificata dalle trasformazioni di I ,mentre lo e da quelle di G \ I . Possiamo applicare a W le considerazioni fatte nelteorema V e concludere che essa dipende da un’equazione irriducibile di grado pari alrapporto tra gli ordini di G ed I .

Concludiamo questa analisi del Commentaire enunciando il Teorema IX che legala presenza di una successione di sottogruppi normali di G, inclusi successivamenteuno nell’altro, alla riduzione della risoluzione dell’equazione di partenza a quella diequazioni di gradi opportuni

Teorema IX. Sia F (x) un’equazione il cui gruppo G sia composto: G, I, I ′,...., unasuccessione di gruppi tali che: I. Ciascuno di essi e contenuto in quello che lo precedee commutabile con le sostituzioni di quet’ultimo; II. Ciascuno di essi sia il piu generaletra quelli che soddisfano alle due proprieta mensionate; Siano N , N

ν, N

νν′,... gli ordini

rispettivi di questi gruppi: la soluzione dell’equazione proposta dipendera da quella diequazioni successive i cui gruppi saranno semplici e conterranno, rispettivamente ν,ν′, ... sostituzioni. ([27], p. 152)

Con questo teorema entra in scena la serie di composizione di G, cioe una succes-sione di sottogruppi

G ≡ I0 ⊇ I1 ⊇ · · · ⊇ In = id

tali che Ii e il sottogruppo normale massimale contenuto in Ii−1. Ora, quando gliindici ν, ν′,..., di ciascuno di questi sottogruppi in quello che lo precede nella seriedi composizione sono tutti i numeri primi, allora l’equazione (9.12) corrispondente eabeliana e dunque risolubile algebricamente. L’approccio gruppale di Galois, perfezio-nato da Jordan, consiste dunque nel tradurre la richiesta di risolubilita algebrica diun’equazione in una richiesta sulla struttura del gruppo associato.

Come detto, Jordan non segue fedelmente l’ordine delle idee di Galois che, nel-la Proposizione II, aveva affrontato il problema del comportamento del gruppo diGalois di un’equazione quando al campo Q venga aggiunto un elemento, radice diun’equazione ausiliaria.

Proposizione II. Se si aggiunge ad un’equazione la radice r si un’equazione au-siliaria irriducibile, 1 di queste due eventualita se ne presentera una: o il gruppodell’equazione non cambiera, oppure si dividera in p gruppi ciascuno appartenenteall’equazione proposta quando gli si aggiunga ciascuna delle radici dell’equazione ausi-liaria; 2 questi gruppi godranno della proprieta notevole che e possibile passare da uno

Page 246: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

246 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

all’altro operando su tutte le permutazioni del primo con una medesima sostituzionedi lettere25 ([20], pp. 423-424)

La dimostrazione di Galois e anche in questo caso estremamente concisa.La successiva Proposizione III, priva di dimostrazione ma con l’aggiunta On trou-

vera la demonstration, tratta il caso in cui si aggiungano ad F tutte le radici dell’e-quazione (9.15).Proposizione III Se si aggiungono ad un’equazione tutte le radici di un’equazioneausiliaria, i gruppi oggetto del Teorema II godranno dell’ulteriore proprieta che lesostituzioni sono le stesse in ogni gruppo26. ([20], p.425)

Osserviamo che se u1 e una radice di un’equazione ausiliaria irriducibile su F

T (x) = 0 (9.15)

e se K := F [u1] ⊇ F e il campo ottenuto aggiungendo u1 ad F , il fattore irriducibilesu F di (9.7) cui appartiene V puo ancora essere irriducibile in K ed in questo casoGal(P/K) = Gal(P/F ); in caso contrario, tale fattore irriducibile si spezza in fattoridi grado minore (tutti dello stesso grado, come dimostra Galois) e dunque in questocaso Gal(P/K) ⊆ Gal(P/F ). Conseguenza non banale della fattorizzazione appenamenzionata e che, se t = deg T ,

|Gal(P/F )||Gal(P/K)| divide t. (9.16)

Aggiungo un’osservazione sul testo di Galois. Egli afferma che si passa da un sotto-gruppo ad un altro operando su tutte le permutazioni del primo con una medesimasostituzione di lettere. Ora, se Gal(P/K) = id, σ2, σ3, ..., σk e τ1, τ2,...,τℓ sono per-mutazioni di Gal(P/F ) che non stanno in Gal(P/K), allora le permutazioni ottenuteseguendo superficialmente la prescrizione di Galois sono, utilizzando τ1,

τ1, σ2τ1, ...., σkτ1 ... τℓ, σ2τℓ, ...., σkτℓ :

come visto in precedenza questi insiemi non sono gruppi, mancando dell’identia. Sipuo recuperare la struttura gruppale moltiplicando a sinistra per τ−1

i ed ottenere gliinsiemi

id, τ−11 σ2τ1, ...., τ

−11 σkτ1 ... id, τ−1

ℓ σ2τℓ, ...., τ−1ℓ σkτℓ

che invece sono dei gruppi, tutti dello stesso ordine, come afferma Galois. La partizionedel gruppo cui allude Galois si esprime dicendo che, aggiunte tutte le radici u1, u2, ...ut

di (9.15) ad F , Gal(P/F [u1, u2, ..., ut]) e un sottogruppo normale di Gal(P/F ), cioe adire che, se σ ∈ Gal(P/F ) e τ ∈ Gal(P/F [u1, u2, ..., ut]), allora

σ τ σ−1 ∈ Gal(P/F [u1, u2, ..., ut])

25Si l’on adjoint a une equation donnee la racine r d’une equation auxiliaire irreductible, 1

il arrivera de deux choses l’une: ou bien le groupe de l’equation ne sera pas change, ou bien ilse partagera en p groupes appartenant chacun a l’equation proposee respectivement quand onlui adjoint chacune des racines de l’equation auxiliaire; 2 ces groupes jouiront de la proprieteremarquable, que l’on passera de l’un a l’autre en operant dans toutes les permutations dupremier une meme substitutions des lettres

26Si l’on adjoint a une equation toutes les racines d’une equation auxiliaire, les groupes dontil est question dans le theoreme II jouiront de plus de cette propriete, que les substitutionssont les memes dans chaque groupe.

Page 247: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 247

Con le rimanenti Proposizioni, Galois si dedica alla risposta che aveva animatotutta la sua ricerca, fornire una condizione sotto la quale un’equazione risulta risolubileper radicali. Invece di darne una dimostrazione, per la quale rimando a [25], Cap. 14,procediamo ad illustrare il metodo di Galois operando su un’equazione di quarto grado.La Proposizione V e posta sotto forma di problema:

Proposizione VIn quali casi un’equazione [algebrica] e risolubile per radicali sempli-ci?27 ([20], p.426)

Galois non fornisce, al solito, una dimostrazione formale ma alcuni passi dellaproposizione sono importanti per chiarire lo scopo delle sue ricerche:

Osservo anzitutto che, per risolvere un’equazione, occorre ridurre successivamenteil suo gruppo finche esso non contenga che una sola permutazione. Infatti, quandoun’equazione e risolta, una qualunque funzione delle sue radici sara nota, cosı comesuccede quando essa non e invariante sotto alcuna permutazione28 ([20], p. 426).

Il gruppo di un’equazione misura il grado di indistinguibilita delle radici e fincheesso e composto da permutazioni diverse da quella identica non si ha che una co-noscenza imperfetta delle radici dell’equazione proposta, imperfezione che e massimaquando il gruppo coincide con l’intero gruppo delle permutazioni agenti su n elementie quindi sono note solo le funzioni simmetriche delle radici che non permettono didistinguere in alcun modo tra loro le radici. Precisato questo, Galois illustra la marciada intraprendere per tentare la riduzione del gruppo dell’equazione, aggiungendo degliopportuni radicali. Il primo passo e l’aggiunta del primo radicale che viene estratto nelcorso della soluzione. Se aggiungendo tale radicale al campo dei coefficienti dell’equa-zione proposta il gruppo puo non ridursi, nel qual caso si e trattata di una semplicepreparazione, oppure il gruppo si riduce. Affinche l’equazione sia risolubile occore chela riduzione del gruppo avvenga in un numero finito di passi. E possibile che ad uncerto punto la riduzione del gruppo sia operabile in modi diversi grazie ad estrazionidi radici. Galois considera il radicale di indice p piu basso possibile, osservando che pe primo: se fosse un numero composto, una riduzione si dovrebbe operare attraversol’aggiunta di una radice con indice pari ad uno dei suoi fattori primi. Galois chiamaradicali semplici quelli con indice primo. Osserva ora Galois che, ai fini della deter-minazione del gruppo di un’equazione e sempre possibile supporre nota una radicep-esima α dell’unita in quanto essa si ottiene attraverso estrazioni di radice con indiceinferiore a p e dunque, per l’ipotesi fatta su p, queste quantita radicali non possonoridurre il gruppo. Dunque, invocando le Proposizioni II e III, Galois conclude che ilgruppo dell’equazione si spezza in p (sotto)gruppi le cui relazioni sono quelle ricor-date nelle Proposizioni. Viceversa, Galois suppone che il gruppo Gal(P/F ) si spezziin p sottogruppi ciascuno dotato delle proprieta enunciate nella proposizione III edintende dedurre da ci ‘o che, aggiungendo una radice di indice p-esima il gruppo dipartenza si riduce ad uno, diciamo Gp dei p sottogruppi. Per questo Galois costruisceuna funzione θ(r1, r2, ..., rn) invariante rispetto alle permutazioni contenute in Gp, mavariabile quando invece agiscono le permutazioni che nno appartengono a Gp. Senzaavvertire la necessita di aggiungere qualche commento, Galois afferma che, operandosuccessivamente con permutazioni che stanno in Gal(P/F ) ma non in Gp, allora θ

27Dans quels cas une equation est-elle soluble par de simples radicaux?28J’observerai d’abord que, pour resoudre une equation, il faut successivement abaisser son

groupe jusqu’a ne contenir pluse qu’une seule permutation. Car, quand une equation estresolue, une fonction quelconque de ses racines est connue, meme quand elle n’est invariablepar aucune permutation.

Page 248: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

248 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

assumera, oltre a θ, altri p− 1 valori θ1, θ2, ..., θp−1 distinti tra loro e da θ cosicche

(θ + αθ1 + α2θ2 + ...+ αp−1θp−1)p

risultera invariante sotto l’azione di tutte le permutazioni in Gal(P/F ) e quindi, per lacaratterizzazione di Gal(P/F ) contenuta nella Proposizione I, razionalmente nota. Seora si aggiunge al campo F dei coefficienti dell’equazione di partenza, grazie alla Pro-posizione IV si conclude che il gruppo dell’equazione risultante da questa aggiunzionenon conterra altre permutazioni che quelle dei p sottogruppi, uno dei quali e Gp.

Il contenuto della Proposizione V si puo riformulare, con una buona dose di sennodel poi, come segue:Sia P (x) un polinomio a radici distinte. Allora P (x) = 0 e risolubile per radicali se esolo se Gal(P/F ) e un gruppo risolubile, cioe se esiste una catena di sottogruppi Gi,con i = 1, ..., t = degT , T essendo un polinomio ausiliario di cui sono note le radici,tali che

• Gal(P/F ) ≡ G0 ⊇ G1 ⊇ G2 ⊇ · · · ⊇ Gt = id,• per tutti gli i = 1, ...., t, Gi e sottogruppo normale di Gi−1 di indice primo.

Dopo aver illustrato come il gruppo delle permutazioni agenti su 4 elementi am-metta la giusta struttura per giungere alla riduzione di Gal(P/F ) all’identita, Galoisapplica la teoria generale alle equazioni irriducibili di grado pari ad un numero primo.Cosı, nella Proposizione VI, egli mostra il seguente lemma:

Lemma.Un’equazione irriducibile di grado primo non puo divenire riducibile con l’ag-giunta di un radicale avente indice diverso dal grado dell’equazione.29([20], p. 429)

Mentre nella Proposizione VII si pone la domanda

Proposizione VII. Qual e il gruppo di un’equazione irriducibile di grado primo n,risolubile per radicali?30 ([20], p. 429)

Il lemma oggetto della Proposizione VI permette di asserire che il piu piccologruppo ammissibile, dopo l’identita, deve essere formato da n elementi ed, operandotale gruppo su un insieme di n oggetti, non puo che essere un gruppo ciclico. Iterandoil ragionamento Galois conclude che condizione necessaria e sufficiente alla risolubilitaper radicali di un’equazione irriducibile di grado primo e che ogni funzione invariantesotto le permutazioni xk 7→ xak+b, dove a e b sono costanti (intere) sia razionalmentenota. In alternativa, il risultato qui ottenuto viene cosı enunciato nella ProposizioneVIII che chiude la Memoire

Proposizione VIII. Affinche un’equazione irriducibile di grado primo sia risolubileper radicali, occorre e basta che, note due qualsiasi delle sue radici, le altre si possanodedurre da queste solo con operazioni razionali.31 ([20], p. 432)

Nel corso della Memoire Galois menziona il fatto che la risolubilita delle equazionidi quarto grado sia dovuta al fatto che e possibile trovare ridurre il gruppo dell’equa-zione generale, il gruppo simmetrico agente su 4 elementi, in modo conforme a quantoprescritto nella proposizione V. In generale, egli osserva che il gruppo di un’equazio-ne generale (letterale) di grado n e il gruppo simmetrico su n elementi mentre perl’equazione ciclotomica

xn − 1

x− 1= 0

29Une equation irreductible du degre premierne peut devenir reductible par l’adjonctiond’un radical dont l’indice sera autre que le degre meme de l’equation.

30Quel est le groupe d’une equation irreductible d’un degre premier n, soluble par radicaux?31Pour qu’une equation irreductible de degre premier soit soluble par radicaux, il faut et il

suffit que deux quelconques des racines etant connues, les autres s’en deduisent rationellement.

Page 249: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

9.3. STRUTTURA DELLA MEMOIRE DI GALOIS 249

il gruppo si riduce a quello ciclico su n lettere, la cui cardinalita coincide con il gradodell’equazione da risolvere.

Sarebbe interessante seguire la storia della diffusione della teoria di Galois ad operadi matematici come Enrico Betti o Camille Jordan e seguire i cambiamenti che taleteoria ha subito fino al fondamentale libro di Emil Artin Foundations of Galois Theory,pubblicato nel 1938. Mi riservo di presentare in forma piu completa questi argomenti inuna prossima edizione, limitandomi per ora a rinviare il lettore interessato all’articolodi Kiernan [29] o al libro di Toti-Rigatelli [30].

Page 250: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

250 CAPITOLO 9. L’OPERA DI EVARISTE GALOIS

Page 251: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] E.T. Bell: Men of Mathematics. Simon and Schuster, New York (USA), 1950.Trad. It. I grandi matematici. Sansoni, Firenze, 1990.

[2] T. Rothman: Genius and biographers: the fictionalization of Evariste Galois.Amer. Math. Monthly, 89, 84–106, (1982).

[3] P. Dupuy: La vie d’Evariste Galois. Ann. Scient. Ec. Norm. Super., 13 (S. III),197-266, (1896).

[4] R. Taton: Les relations d’Evariste Galois avec les mathmaticiens de son temps.Revue d’Histoire des Sciences et de ses Applications 1, 114-130, (1947).

[5] R. Taton: Sur les relations scientifiques d’Augustin Cauchy et d’Evariste Galois.Revue d’Histoire des Sciences 24, 123-148, (1971).

[6] L. Toti Rigatelli: Matematica sulle barricate. Vita di Evariste Galois. Sansoni,Firenze, (1993).

[7] E. Galois: Œuvres mathematiques. J. Math. Pures Appl., 11 (S. 1), 381—444,(1846).

[8] J.L. Lagrange: Reflexions sur la resolution algebrique des equations, NouveauxMem. de l’Acad. des Sciences et Belles-Lettres de Berlin, 1, 134–215, (1770); 2,138-253, (1771). In Œuvers Completes, vol. 3, J.A. Serret, Ed., Gauthier-Villars,Paris, (1869), 205-421.

[9] J.L. Lagrange: Traite de la resolution des equations numeriques de tous les degres,avec des notes sur pluiseurs points de la Theorie des equations algebriques, Cour-cier, Paris, (1808). InŒuvers Completes, vol. 8, J.A. Serret, Ed., Gauthier-Villars,Paris, (1879), 11-370.

[10] E. Galois: Demonstration d’un theoreme sur les fractions continues periodiques.Annales des Sciences Mathematiques. 19, 294-301, (1828-1829). In [7], pp. 385-392.

[11] E. Galois: Notes sur quelques points d’Analyse. Annales des SciencesMathematiques. 21, 182-184, (1830-1831). In [7], pp. 392-394.

[12] B. Bolzano: Functionenlehre. In The mathematical work of Bernard Bolzano, acura di S. Russ. Oxford University Press, Oxford (U.K.), (2004).

[13] E. Galois: Analyse d’un Memoire sur la resolution algegbrique des equations.Bull. Sci. math., 13, 271- (1830).

[14] E. Galois: Note sur la resolution des equations numeriques. Bull. Sci. math., 13,413-414, (1830). In [7], pp. 397-398.

251

Page 252: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

252 BIBLIOGRAFIA

[15] A.-M. Legendre: Essai sur la theorie des nombres. Courcier, Paris, (1816).

[16] A.-L. Cauchy: Cours d’analyse de l’Ecole royale Polytechnique. Vol. I AnalyseAlgebrique, (1821).

[17] M. Galuzzi: Galois’ note on the approximative solution of numerical equations(1830). Arch. Hist. Exact Sci., 56, 29-37, (2001).

[18] E. Galois: Sur la theorie des nombres. Bull. Sci. math., 13, 428-, (1830). In [7],pp. 398-407.

[19] C.G.J. Jacobi: De residuis cubicis commentatio numerosa. Journ. fur die reineund angewandte Mathematik (1827)

[20] E. Galois: Memoire sur les conditions de resolubilite des equations par radicaux.In [7], pp. 417–433.

[21] N.H. Abel: Memoire sur une classe particuliere d’equations resolublesalgebriquement. J. fur die reine und angew. Math. (Crelle), 4, 131–156, (1829).

[22] A. Dahan: Les travaux de Cauchy sur les substitutions. Etude de son approchedu concept de groupe. Archive for History of Exact Sciences, 23, 279–319, (1980).

[23] I. Radloff: Evariste Galois: principles and applications. Historia Mathematica,29, 114–137, (2002).

[24] J. Hudde: Epistola Prima de Reductione Æquationum. In R. Des CartesGeometria, a cura di F. van Schooten, Knoch (Frankfurt an Mein) (1695).

[25] J.-P. Tignol: Galois’ Theory of Algebraic Equations. World Scientific, Singapore,(2001).

[26] G. Cantor: Algebraische Notiz. Math. Annalen 5, 133-134, (1872)

[27] C. Jordan: Commentaire sur Galois. Math. Annalen 1, 141–160, (1869)

[28] J. Pierpont: Galois’ theory al algebraic equations. I. Rational resolvents. AnnalsMath. 1 (S. II), 113–143, (1899-1900).

[29] B.M. Kiernan: The development of Galois theory from Lagrange to Artin. Archivefor History of Exact Sciences, 13, (1971), 40–154.

[30] L. Toti-Rigatelli: La mente algebrica: storia dello sviluppo della teoria di Galoisnel XIX secolo. Bramante, Busto Arsizio, (1989).

Page 253: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Capitolo 10

La trasformazione di Bring

e Jerrard

La trasformazione introdotta nel 1683 da Tschirnhaus ed analizzata nelle Reflexions diLagrange, anche se manco l’obiettivo per cui era stata concepita, si rivelo feconda perlo studio delle equazioni algebriche. In particolare, applicata all’equazione generica diquinto grado, fu il punto di partenza delle ricerche di Charles Hermite che condusseroalla risoluzione dell’equazione di quinto grado tramite il ricorso alle funzioni ellittiche.Diamo ora una esposizione della teoria della trasformazione di Tschirnhaus in generale,seguendo l’esposizione pedagogica di Otto Schlomilch [6], che venne pubblicata pocodopo i lavori di Hermite.

Il problema di Tschrirnhaus si puo formulare in questi termini: sia assegnataun’equazione di grado m

xm + A1xm−1 + A2x

m−2 + · · ·+ Am−1x+ Am = 0 : (10.1)

determinare i coefficienti a0, a1, ...., an, con n < m in modo che, posto

a0 + a1x+ a2x2 + · · ·+ anx

n = y (10.2)

in modo che, eliminando x da (10.1)-(10.2), si ottenga un’equazione dello stesso gradom

ym +B1ym−1 +B2y

m−2 + · · ·+Bm−1y +Bm = 0 (10.3)

per la quale si annullino un certo numero di coefficienti B1, B2, ..., Bn−1. Come gianotato durante l’esposizione del metodo offerta da Lagrange, i coefficienti dell’equazio-ne trasformata dipendono dai coefficienti incogniti della trasformazione (10.2) e, comevedremo, se non si presta sufficiente attenzione, il grado delle equazioni da risolvereper determinare gli ai puo crescere rapidamente al di sopra dim, vanificando il metodoin partenza. Esaminiamo due diversi metodi di eliminazione della variabile x, il primodei quali fa leva sui teoremi newtoniani. Se calcoliamo y2 a partire da (10.2), avremoun’espressione y2 = b0+b1x+b2x

2+ · · · bm−1xm−1 dove le potenze superiori di xm che

dovessero eventualmente comparire nel corso del calcolo, si possono ridurre ricorrendoall’equazione di partenza (10.1): per esempio

xm = −(A1xm−1 +A2x

m−2 + · · ·+Am−1x+Am), xm+1 == (A2

1 − A2)xm−1 + (A1A2 − A3)x

m−2 + (A1A3 − A4)xm−2 + · · ·

253

Page 254: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

254 CAPITOLO 10. LA TRASFORMAZIONE DI BRING E JERRARD

e cosı via per le potenze successive. Procedendo in maniera analoga si ottiene indefinitiva un sistema di relazioni del tipo

y2 = b0 + b1x+ b2x2 + · · · bm−1x

m−1

y3 = c0 + c1x+ c2x2 + · · · cm−1x

m−1

..............................ym = k0 + b1x+ k2x

2 + · · · km−1xm−1

(10.4)

in cui e cruciale osservare che

• le quantita bi = bi(a0, ..., an) sono funzioni lineari omogenee degli argomentia0, ..., an

• le quantita ci = ci(a0, ..., an) sono funzioni quadratiche omogenee degli argomentia0, ..., an

• ......................................

• le quantita bi = bi(a0, ..., an) sono funzioni omogenee di grado m − 1 degliargomenti a0, ..., an.

Siano ora x1, ..., xm le radici di (10.1); per ottenere l’equazione (10.3) in y dello stessogrado m, poniamo

yi = a0 + a1xi + a2x2i + · · ·+ anx

ni ∀i = 1, ..., m (10.5)

cosicche la (10.3) diventa

(y − y1)(y − y2) · · · (y − ym) = 0.

Indichiamo con

Sk :=m∑

i=1

xki e Tk :=

m∑

i=1

yki

la somma delle potenze k-esime delle radici di (10.1) e (10.3): essendo funzioni sim-metriche delle radici di queste equazioni si potranno esprimere, rispettivamente, at-traverso i coefficienti A1, ..., Am e B1, ..., Bm. Se sommiamo le (10.5) otteniamo

S1 = ma0 + a1S1 + a2S2 + · · ·+ anSn

mentre, agendo in maniera analoga sulle (10.4) otteniamo

T2 = mb0 + b1S1 + b2S2 + · · · bm−1Sm−1

T3 = mc0 + c1S1 + c2S2 + · · · cm−1Sm−1

..............................Tm = mk0 + b1S1 + k2S2 + · · · km−1Sm−1.

(10.6)

Come abbiamo visto, i teoremi newtoniani permettono di legare le somme delle potenzek-esime delle radici di un’equazione ai suoi coefficienti, precisamente

S1 + A1 = 0S2 + A1S1 + 2A2 = 0S3 + A1S2 + A2S1 + 3A3 = 0.................

(10.7)

e

T1 +B1 = 0T2 +B1T1 + 2B2 = 0T3 +B1T2 +B2T1 + 3B3 = 0..................

(10.8)

Page 255: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

255

Grazie a questi teoremi, possimo trovare gli Si attraverso le (10.7) e i Bi come funzionidelle ai e delle Si attraverso le (10.6), (10.8): le equazioni cui debbono soddisfare leai per annullare un certo numero di coefficienti di (10.3) possono ritenersi note. Unmetodo alternativo e in realta un metodo classico di eliminazione, proposto da Euleroe Bezout nel XVIII secolo. Moltiplichiamo successivamente (10.1) per x, x2,..., xn e(10.2), riscritta come

a0 − y + a1x+ a2x2 + · · ·+ anx

n = 0,

successivamente per x, x2..., xm: si otterranno cosı le seguenti n+m equazioni

Amx+Am−1x2 + Am−2x

3 + · · ·+ xm+1 = 0Amx

2 + Am−1x3 + · · · · · · · · · · · ·+ xm+2 = 0

+Amx3 + · · · · · · · · · · · · · · ·+ xm+3 = 0

...........................................+Amx

n + · · · · · · · · ·+ xm+n = 0(a0 − y)x+ a1x

2 + a2x3 + · · · · · · anxn+1 · · · · · · = 0

(a0 − y)x2 + a1x3 + · · · · · ·+ anx

n+2 · · · · · · · · · · · · = 0...........................................

(a0 − y)xm + · · · · · · · · · · · ·+ anxm+n = 0.

Se poniamoti := xi

possiamo trasformare il sistema precedente in un sistema lineare omogeneo di m + nequazioni in m + n incognite che certamente ammette la soluzione x = 0. Affinchene ammetta altre, occorre chiedere che sia nullo il determinante della matrice deicoefficienti:

det

Am Am−1 Am−2 · · · 1 0 0 · · ·0 Am Am−1 · · · · · · 1 0 · · ·0 0 Am · · · 1 0 0 · · ·· · · · · · · · · · · · · · · · · · · · · · · ·0 0 · · · Am · · · · · · · · · 1

a0 − y a1 a2 · · · an 0 0 · · ·0 a0 − y a1 · · · · · · an 0 · · ·0 0 a0 − y · · · · · · · · · an · · ·· · · · · · · · · · · · · · · · · · · · · · · ·0 0 · · · a0 − y · · · · · · · · · an

= 0.

Svolgendo i calcoli, che risultano semplificati dalla presenza di molti termini nulli, siottiene ancora l’equazione (10.3). Grazie ai teoremi newtoniani (10.8), l’annullamentodi un certo numero di coefficienti B1 = B2 = B3 · · · = Bn = 0 successivi in (10.3)equivale alla richiesta

T1 = T2 = T3 = · · · = Tn = 0.

Grazie alle proprieta dei coefficienti che compaiono (10.6), vediamo, ad esempio, che ilsistema T1 = 0, T2 = 0 e T3 = 0 e di sesto grado per cui, nel caso che ora consideriamodell’equazione di quinto grado, sembra che il passaggio da (10.1) a (10.3) non siaeffettuabile perche richiederebbe la soluzione di un’equazione di sesto grado. Il meritodi Bring e Jerrard fu quello di mostrare come in effetti l’eliminazione di dei primi tretermini B1, B2 e B3 sia possibile con la sola risoluzione di equazioni di grado nonsuperiore al terzo. Il procedimento di Jerrard si puo vedere come uno studio della

Page 256: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

256 CAPITOLO 10. LA TRASFORMAZIONE DI BRING E JERRARD

struttura di una forma quadratica Vk(z1, z2, ..., zk) in k variabili z1,..., zk. Anzitutto esempre possibile scrivere

Vk(z1, z2, ..., zk) = Pz2k + 2Qzk +R

dove P e una costante, Q = Q(z1, z2, ..., zk−1) e una funzione lineare omogenea nellek − 1 variabili z1,..., zk−1 mentre R = R(z1, z2, ..., zk−1) e una funzione quadraticaomogenea nelle stesse variabili diQ. Completando il quadrato e allora possibile scrivere

Vk(z1, z2, ..., zk) =

(√Pzk +

Q√P

)2

+R − Q2

P= L2

k + Vk−1

dove Lk e ancora una funzione lineare omogenea nelle variabili z1,..., zk mentre Vk−1

e una nuova forma quadratica nelle variabili z1,..., zk−1: iterando il procedimentopossiamo allora ottenere

Vk = L2k + L2

k−1 + · · ·+ L22 + L2

1 = 0

dove la funzione lineare omogenea Lj dipende j variabili soltanto. Possiamo allo-ra chiudere la trasformazione dell’equazione di partenza, annullando B1, B2, B3 epartendo per questo da una trasformazione del tipo

a0 + a1x+ a2x2 + a3x

3 + a4x4 = y.

La richiesta B1 = 0 permette di scrivere a0 come funzione lineare omogenea negli altriparametri a1, a2, a3, a4 della trasformazione. Se sostituiamo questa espressione inB2 = 0 e B3 = 0 otteniamo due nuove equazioni B′

2 = 0 e B′3 = 0 che sono nuove

funzioni omogenee, rispettivamente quadratica e cubica, nelle variabili residue a1, a2,a3, a4. Consideriamo B′

2. Essendo quadratica, potremo scriverla come

B′2 = L2

1 + L22 + L2

3 + L24

per opportune funzioni lineari Lj . La condizione B′2 = 0 e soddisfatta ponendo

L21 + L2

2 = 0 e L23 + L2

4 = 0

che sono verificate se valgono le seguenti relazioni lineari omogenee nelle a1, a2, a3, a4

L1 = iL2 L3 = iL4 :

ricaviamo a1 ed a2 come funzioni lineari delle variabili a3, a4; sostituendo questeespressioni nell’equazione B′

3 = 0, la si trasforma in un’altra equazione B′′3 = 0, con

B′′3 ancora una funzione cubica omogenea di a3, a4: se si pone a4 = 1, abbiamo infine

un’equazione di terzo grado per a3. Nel caso m = 5, l’equazione trasformata e la formacanonica di Bring-Jerrard

y5 + py + q = 0. (10.9)

Si puo ottenere un’altra forma normale richiedendo che B1 = B2 = B4 = 0 ed inquesto caso l’operazione richiede la risoluzione di equazioni fino al quarto grado. Laforma ottenuta e

y5 + py2 + q = 0 (10.10)

operando su (10.9) e (10.10) con una trasformazione del tipo y = 1z, si possono ottenere

forme normali del tipo

y5 + py4 + q = 0 y5 + py3 + q = 0 (10.11)

Page 257: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

257

che, in ogni caso, sono equazioni triomie.La forma canonica (10.9) fu ottenuta indipendentemente dallo svedese Erland Sa-

muel Bring (1736-1798) nel 1784 e, mezzo secolo piu tardi, da George Birch Jerrard(1804-1863), matematico inglese, in una raccolta di Mathematical Researches pubbli-cati in tre volumi dal 1832 al 1834 a Bristol. I risultati relativi alla riduzione in formacanonica (10.9) si trovano nel secondo volume, che vide la luce nel 1834, e furonoripresi in una monografia pubblicata nel 1858 [5], l’anno in cui Hermite pubblico isuoi risultati. Il piu importante diffusore dei risultati di Jerrard fu Hamilton che nepresento un rapporto entusiasta alla riunione annuale della British Association for theAdvancement of Science tenutasi a Bristol nel 1836 [3]. L’attenzione verso il lavorodimenticato di Bring fu invece richiamata subito dopo gli eventi del 1858, quandotre riviste internazionali (il Quarterly Journal of Applied Mathematics, gli Archiv derMathematik [2] e gli Annali di Scienze Matematiche e Fisiche [7]), tradussero o ri-pubblicarono ampi stralci dell’originale. E bene ricordare che mentre Bring scrisseprima della dimostrazione del teorema di Abel-Ruffini, la pubblicazione di Jerrard glie posteriore, il che come sappiamo, e un cambio di prospettiva non secondario. Il com-mento di Jerrard alla struttura delle equazioni (10.9)-(10.11) e piuttosto sorprendentee denota la difficolta ad accogliere il contenuto del teorema di Abel-Ruffini:

a result of such a character as may well shake our trust in the validity of the conclusioncome to by mathematicians of the present day,—that it is in general not possible tosolve algebraically equations of the fifth degree. ([5], p. 38)

Page 258: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

258 CAPITOLO 10. LA TRASFORMAZIONE DI BRING E JERRARD

Page 259: Indice - rosso/equazioni.pdf · Indice 1 Breve storia delle ... sp´eciaux pour les deux op´erations directes de l’addition e de la multiplication, et le moyenne de ... Bhaskara

Bibliografia

[1] E. Bring: Melemata quaedam mathematica circa transformationem aequationumalgebraicarum, Lund, (1786).

[2] J. A. Grunert: Miscellen. Archiv der Mathematik und Physik, 41, 105-112, (1864).

[3] W. R. Hamilton: Inquiry into the validity of a method recently proposed by Geor-ge B. Jerrard, Esq., for transforming and resolving equations of elevated degrees.Report of the Sixth Meeting of the British Association for the Advancement ofScience, held at Bristol in August 1836, 5, 295-348, (1837).

[4] C. Hermite: Sur la resolution de l’equation du cinquieme degre. Comptes Rendushebdomadaires des seances de l’Academie des Sciences, 46,508-... (1858). In C.Hermite: Oeuvres (vol. II), Paris, Gauthier-Villars, 5-12, (1908).

[5] G. B. Jerrard: An Essay on the Resolution of Equations, Taylor & Francis,London, (1858).

[6] O. Schlomilch: Die Transformation und Auflosung der Gleichungen funftenGrades. Zeitschrift fur Mathematik und Physik, 4, (1859), 77-90.

[7] B. Tortolini: Rivista Bibliografica. La trasformazione del Sig. Jerrard per l’e-quazioni di quinto grado. Annali di Scienze Fisiche e matematiche, 6, (1864),33-42.

259


Recommended