Feb 172011
 

nutch
Oggi vi presento questo ottimo e completo articolo su uno dei moroti di ricerca open source più potenti: Nutch, potete trovare l’articolo originale insieme al codice con gli esempi a questo indirizzo.

Dopo aver letto questo articolo si dovrebbe avere una certa familiarità con i concetti base sul crawling ed i lavori di MapReduce in Nutch.

Che cosa è un web crawler?

Un web crawler è un programma che scopre e scarica contenuti dal web tramite un protocollo HTTP. Il processo di scoperta di un crawler di solito è semplice e lineare. Ad un crawler è prima dato un insieme di URL, spesso chiamato seeds (semi). Dopo di che il crawler parte e scarica il contenuto di tali URL e vengono poi estratti i collegamenti ipertestuali o URL dal contenuto scaricato. Questa è esattamente la stessa cosa che accade nel mondo reale quando un essere umano sta utilizzando  un browser web e clicca sui link di un sito e nelle pagine che seguono, uno dopo l’altro.

Continue reading »

Flattr this!

Feb 162011
 

escherStufi dei “soliti” screensaver presenti sui maggiori Windows Manager ?

Oggi vedremo alcuni programmi alternativi che possono essere utilizzati sul nostro linux per avere nuovi ed originali effetti.

Matrixgl

Matrixgl è uno screensaver 3D liberoed open source basato su The Matrix Reloaded. Supporta configurazioni widescreen, e può essere eseguito su Windows, Mac OSX, Linux, BSD, e molti altri sistemi operativi basati su Unix. Continue reading »

Flattr this!

Feb 072011
 

scale9xHo ricevuto una mail su questa conferenza, e così volentieri la propongo ai lettori di Linuxaria. SCaLE sta perl South California Linux Expo ed è tenuta presso l’ Hilton dell’aeroporto di Los Angeles dal 25 al 27 Febbraio 2011.

E per i lettori di Linuxaria c’e’ uno speciale codice promozionale, per avere uno sconto sulal registrazione.

Continue reading »

Flattr this!

Feb 062011
 

squeezeLa notizia del giorno non può che essere che finalmente è stata rilasciata la nuova versione stabile di Debian, la versione 6 nome in codice Squeeze.

Questa è la notizia ufficiale dal sito Debian.

Dopo 24 mesi di sviluppo costante, il Progetto Debian è lieto dipresentare la sua nuova versione stabile 6.0 (nome in codice”Squeeze”). Debian 6.0 è un sistema operativo libero, venendo per la prima volta in due gusti. Accanto a Debian GNU/Linux, Debian GNU/kFreeBSD è introdotto con questa versione come una “technology preview”.

Debian 6.0 include KDE Plasma desktop  e le applicazioni , GNOME, Xfce e ambienti desktop LXDE come pure tutti i tipi di applicazioni per i server. Offre altresì compatibilità con FHS v2.3 e programmi sviluppati per la versione 3.2 di LSB.

Continue reading »

Flattr this!

Feb 052011
 

tux
Piccolo consiglio del giorno: A volte è necessario eseguire un programma tramite riga di cron o comando, ma l’importante è che il programma non deve partire se un altra istanza dello stesso è già attiva.

O forse avete un processo che ogni X minuti o ore va in crash e quindi avete bisogno di un wrapper che controlli se è presente tra i processi attivi ed in caso non lo sia lo riavvii.
Continue reading »

Flattr this!