Tecniche fuzzy per l'elaborazione del linguaggio naturale

Post on 10-Apr-2015

184 views 0 download

description

Idea vincitrice del Working Capital 2010 (Bari). Telecom Italia ha finanziato questa ricerca con una borsa di studio.

transcript

Michele FilanninoUniversità degli Studi di Bari “A.Moro”Dipartimento di Informatica

Research: http://www.di.uniba.it/~swap/Twitter: @bronko85

Working Capital - BarCampBari, 13 luglio 2010

/15

• Età: 24 anni;

• Laureato in Informatica e tecnologie per la produzione del software in meno di 3 anni, cum laude;

• Laureando magistrale in Informatica;

• Membro del SWAP Research Group (Semantic Web Access & Personalization);

• Blogger per melablog.it.

Chi sonoInformazioni

2

/15

MotivazioniQuantità di dati in Internet

155 milioni di siti web

5 milioni di Tb* di dati

Un uomo impiegherebbe 57000 anni per leggerli.

1,8 miliardi di utenti (crescita esponenziale)

* Google ne ha indicizzato solo lo 0,004% ;)Dati forniti da Eric Shmidt, CEO di Google, durante una conferenza del 2005 | Fonte: SoftPedia 3

“It’s not information overload.It’s filter failure”

Clay Shirky (al Web2.0 Expo del 2008)

/15

Information filteringMotori di ricerca

• non differenziano i risultati in base agli utenti;

• richiedono all’utente una parziale conoscenza dei documenti cercati;

• offrono risultati errati o banali* poiché non

comprendono il linguaggio naturale.

* L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino, and P. Molino. Introducing Serendipity in a Content-based Recommender System. In F. Xhafa, F. Herrera, A. Abraham, M. Koppen, and J. M. Benitez, editors, Proceedings of the Eighth International Conference on Hybrid Intelligent Systems HIS-2008 , pages 168-173. IEEE Computer Society Press, Los Alamitos, California, 2008. ISBN 978-0-7695-3326-1. 5

/15

Il presenteSemantica, Web3.0, etc...

• Ontologie -> Logiche descrittive;

• Realizzazione from scratch molto onerosa;

• Utilizzo limitato a domini molto specifici;

• bassa precisione, risultati poco pertinenti, complessità computazionale elevata.

6

“Nella misura in cui le leggi della matematica si riferiscono alla realtà non sono certe.

E nella misura in cui sono certe, non si riferiscono alla realtà.”

Albert Einstein

/15

Idea!

• Utilizzare logica fuzzy per restituire

risultati più intelligenti.• Ridimensionare l’uso di algoritmi basati su

logica classica;

• Rifiutare di formalizzare i meccanismi sottesi al linguaggio naturale umano;

8

/15

Logica fuzzyLotfi Zadeh, 1965*

• Logica del ragionamento approssimato;

• Esprime incertezza;

• Estende la classica teoria degli insiemi;

• Consente di profilare le interpretazioni degli utenti.

• Fuzzy-relazioni tra concetti ontologici

L. A. Zadeh. Fuzzy sets. Information and Control, 8(3):338–353, June 19659

/15

Il sistema softwareCapacità

• Interpreterà il linguaggio naturale (italiano ed inglese);

• Eliciterà i concetti ontologici presenti nel testo;

• Sarà facilmente integrabile in sistemi terzi.

10

/15

FunzionamentoInput, output

Testo semplice

Pagina social network

Pagina web

INPUT

Concetti ontologicipertinenti (anche nascosti)

Concetti ontologici significativi per il profilo

Concetti ontologici correlati(anche nascosti)

OUTPUT

11

/15

Scenario applicativoIntegrazione in un motore di ricerca classico

Query Query

Queryarricchita

Utente

<<

Motore diricerca

Documenti pertinentirestituiti

Documenti restituitida un sistema classico

12

/15

Scenario applicativoIntegrazione in un sistema di raccomandazioni

Profilo, Posizione

geografica, Data

Concettipertinenti

UtenteSistema di

raccomandazioni

Prodotti/servizi pertinentirestituiti

13

/15

• Studio sui concetti di gradualità e vaghezza nella ingegneria della conoscenza;

• Membro del progetto SWOP (Semantic Web-service Opened Platform);

• Realizzazione di un algoritmo per il calcolo della similarità semantica tra frasi (SAWA);

• Sogno di diventare un ricercatore.

ProgettiIn corso...

14

/15

Grazie per l’attenzione

15