Date post: | 08-Jun-2015 |
Category: |
Technology |
Upload: | gianni-amato |
View: | 1,368 times |
Download: | 3 times |
Hashbot.com - Acquisizione e Validazione Scientifica dei Documenti Web
Gianni Amato
Working Capital Catania
29 Aprile 2009
Università di Catania
Hashbot.com – Flow Chart
Hashbot.com – Home Page
Acquire – Il processo di acquisizione
Url Indirizzo esatto del documento web, esempio:
http://www.webpage.com/image.jpg http://www.webpage.com/page.html
User Agent Presentarsi al server remoto come un qualsiasi browser.
Il contenuto del documento acquisito potrebbe cambiare in funzione dello user agent ricevuto dal server e processato dal linguaggio di scripting che crea il documento.
Status – Fine del processo di acquisizione
Header: la risposta del server alla richiesta di hashbot
From IP: l'indirizzo IP dell'utente che ha richiesto il processo di acquisizione
URL: il collegamento al documento acquisito.
Date: data di acquisizione
Time: ora di acquisizione
Hash File: i codici hash MD5 e SHA1 del file acquisito. Ovvero l'impronta digitale univoca del file calcolata su due algoritmi.
Hash Header: i codici hash MD5 e SHA1 delle informazioni di header salvate in apposito file.
File Type: il tipo di documento scaricato dal processo di acquisizione.
CODE: codice alfanumerico creato da hashbot che deve considerarsi come ID univoco del processo di acquisizione.
MD5: il calcolo dell'impronta digitale del file in base all'algoritmo MD5.
SHA1: il calcolo dell'impronta digitale del file in base all'algoritmo SHA1.
Download – Contenuto dell'archivio ZIP
<keycode>code.txt file di testo contenente le informazioni di validazione ed i dati relativi al processo di acquisizione. Quindi le
sottosezioni “Validate Info” e “File Info” della sezione Status.
<keycode>headers.txt file di testo contenente la risposta di header del server remoto. Quindi la sottosezione “Headers Info” della
sezione Status.
<keycode>.<ext> il file scaricato dal processo di acquisizione. Questo verrà rinominato con il codice alfanumerico
identificativo del processo di acquisizione e manterrà la sua estenzione se riconosciuta dal hashbot. Nel caso in cui il tipo di file non viene riconosciuto sarà usata l'estensione arbitraria unk.
Al fine di mantenere valido nel tempo il processo di acquisizione è importante che nessun file dell'archivio compresso – e quindi l'archivio stesso – subiscano modifiche di ogni genere.
Validate – Il processo di validazione
Il file <keycode>code.txt contiene le informazioni necessarie per la validazione
Code codice alfanumerico di cui al rigo tre del file
<keycode>code.txt
Hash File HASH del file acquisito. MD5 o SHA1 indistintamente.
Righe 4 e 5 del file <keycode>code.txt
Status – Le informazioni di validazione
Le informazioni riportate sono la prova che hashtbot è stato usato precedentemente per acquisire il documento di cui si sta richiedendo la validazione.
Tutte le informazioni di validazione mostrate da hashbot devono corrispondere a quanto riportato nella sezione “Download Info” del file <keycode>code.txt.
Conclusioni – $AUTHORS
Hashbot.Com is developed and loved by Gianni Amato and Davide Baglieri.
...è un servizio gratuito, che non richiede registrazione, rilasiato as is.
Gianni Amato http://www.gianniamato.it
http://www.securityside.it
Davide Baglieri http://www.davidonzo.com
http://www.digitalside.it