Post on 02-May-2015
transcript
Identificazione di funzionitramite algoritmi genetici
Identificazione di funzionitramite algoritmi genetici
Tesi di laurea di:
Relatore:
Gabriele Carcassi
625736
Andrea Bonarini
Descrizione del problemaDescrizione del problemaDati sperimentali
Interpolazione
Modello
Regressione statisticaRegressione statistica
Modello lineare
Modello non lineare
2
1
xcbxay 2
1
xcbxay
cxaxy b
1
cxaxy b
1
Modello scelto dal ricercatoreParametri stimati tramite la minimizzazione del residuo
Ricerca nello spazio dei parametriRicerca nello spazio dei parametri
a
b
Visualizzazione della funzione residuo
Programmazione geneticaProgrammazione genetica
x
x
1
23
Rappresentazione ad albero delle funzioni
*
/
+ -
xx
3
2 1
L’approccio propostoL’approccio proposto
+
*
x b
a
a
b
Ricerca separata di forma e parametri
Ricerca della formaRicerca della forma
+
*
x b
a
+
*
x *
x b
*
x a
La complessità aumenta con la profondità dell’albero
Ricerca dei parametriRicerca dei parametri
b
a Crossover
Mutazione
Risultati nel caso monovariabileRisultati nel caso monovariabileFunzione
Numero di punti
Intervallo
Taglio
Mean generation
Mean n functions
Success
Mean time
Max time
Min time
xx 22
6
100
-10..10
0.0028
13.8
335190
20/20
82.037
141.44
16.7
x
2
100
-10..10
0.000005
2.7
65472
20/20
14.6895
57.34
4.78
x
x
2
100
-10..10
0.000005
17.2
416946
20/20
83.621
230.36
24
1sin x
100
-10..10
0.76
26.4
642085
15/20
158.545
301.05
15.71
xx exp
100
0..10
0.15
19.0556
460664
18/20
126.457
269.91
4.83
Risultati nel caso multivariabileRisultati nel caso multivariabileFunzione
Numero di punti
Intervallo
Taglio
Mean generation
Mean n functions
Success
Mean time
Max time
Min time
yx 2
10
0..100
0.00025
14.05
340975
20/20
14.964
46.24
0.99
xx 22
10
0..10
0.00005
15.8421
385038
19/20
17.1221
54
0.99
x
1
10
0..10
0.00005
4.25
102937
20/20
3.993
11.48
0.93
yzx
10
0..100
0.00005
19.1176
464574
17/20
20.5229
50.53
1.92
)sin( yx
10
0..100
0.00005
9.5
231076
20/20
10.084
34.55
0.88
Accuratezza e semplicitàAccuratezza e semplicità
Ulteriori sorgenti di errore sono:
Ipotesi semplificative
Interferenza di fenomeni non controllabili
Necessità di comprendere l’importanzadi diversi fattori dello stesso fenomeno
Funzione di valutazione completaFunzione di valutazione completa
Funzioni valutate sia per aderenza ai dati, sia per loro complessità
L’introduzione di ogni operatore deve spiegareuna parte rilevante del segnale
+ - * / ^k sin cos exp
1% 1.1% 1.25% 1.35% 1.5% 1.75% 1.75% 2%
)()( fCfRFitness )()( fCfRFitness
r
F
r
F
Legge di Coulomb
rrF
*
41868.9
rrF
*
40151.8+14.1037
Applicazione a esperimenti di fisicaApplicazione a esperimenti di fisica
d
T
Terza Legge di Keplero
1.49998)(0.549297dT
1.5kdT
P
V
Legge di Boyle
VP
29.2962
kPV
Diagramma temporale
Serie caoticheSerie caotiche
Serie caoticheSerie caotiche
xn
xn-1
)( 1 nn xfx )( 1 nn xfx
Funzione generatrice
Henon map 22
1 3,04,11 nnn xxx 22
1 3,04,11 nnn xxx
Quadratic map )1(4 11 nnn xxx )1(4 11 nnn xxx
Serie caotiche riconosciuteSerie caotiche riconosciute
Serie dei test IQSerie dei test IQ
Continuare le seguenti serie numeriche
7 10 9 12 11 ...
2 5 9 19 37 ...
1 4 9 16 …
2,1, nxnxnfnxSupponiamo il modello
2 5 8 11 ...
Esempio di esecuzioneEsempio di esecuzione
Dimmi la serie: 2 5 9 19 37Vediamo un po'... Ecco! La continuerei cosi': 75 149 299 ...La funzione che ho trovato e' ( x1 + ( 2 * x2 ) ) in cui:x1 e' il campione precedentex2 e' il campione due passi prima
Soluzioni delle serieSoluzioni delle serie
7 10 9 12 11 ... 14 13 16
2 5 9 19 37 ... 75 149 299
1 4 9 16 … 25 36 49
221 nxnxnx
2 5 8 11 ... 14 17 20
2nnx
22 nxnx
31 nxnx
Conclusioni
L’approccio di separazione tra forma e parametri risulta proficuo
Si riescono a ricavare modelli corretti anche in presenza di pochivalori sperimentali
Si riesce a contenere l’impatto del rumore
I limiti riscontrati dipendono dagli algoritmi di ricerca di formae parametri
Esistono molte direzioni in cui il lavoro può essere migliorato