Jan 062011
 

recoll
Articolo scritto da: Francesco Di Leo
A dir la verità, li ho provati tutti, dal mitico Beagle a Tracker. Beagle oramai è a tutti gli effetti un progetto morto. Era abbastanza interessante, capace di eseguire ricerche in molti tipi di file e di informazioni varie, ma personalmente non ero disposto a tenere occupate inutilmente molte risorse per Mono. Pazienza, l’avessero sviluppato sin dall’inizio con le librerie standard forse sarebbe su tutti i computer. Ho provato anche altri minori, Catfish, Pinot e qualche altro che mi sfugge, maledetta memoria, fino ad approdare a Tracker, programma di file (e information) searching di Gnome. Fino alla versione 0.6 sembrava che finalmente qualcuno si fosse deciso di impegnarsi seriamente nella realizzazione di un programma che mi consentisse di non ricorrere sempre alla memoria per ricordarmi quale file o email contenesse l’informazione cercata. Puntualmente sono stato smentito (e tradito).


Non solo con le versioni successive è leggermente regredito, ma i bug sono talmente tanti in ogni nuova release che lo sconsiglio per un uso “serio”. Avevo segnalato un bug tempo fa relativo alla non corretta indicizzazione di file il cui nome o contenuto fosse formato da lettere e numeri variamente disposti. Il problema parzialmente esiste ancora, anche se non ho ancora provato le versioni più recenti (e non so quando lo farò a causa delle dipendenze). Anche Google Desktop soffre dello stesso problema. Sconfortato dalla esistenza di tanti programmi di file searching che promettevano molto ma che si dimostravano solo programmi “demo”, approdai a Recoll, con la sua interfaccia spartana. Ma non mi importava, volevo un programma che mi indicizzasse tutti i miei file senza sbattermi sui motivi del suo fallimento. Feci il solito giro di prova “su strada” e notai che mi indicizzava anche i file sui quali gli altri fallivano. La mia ricerca era terminata.

Il Programma.

Recoll si compone principalmente del programma/client “recoll” e del programma/demone recollindex. Quest’ultimo si occupa della indicizzazione dei file e può essere lanciato anche come demone per una indicizzazione dei file in real time. A seconda della distribuzione potreste trovare anche “recollq”, che è il client a linea di comando. Appena lanciato, il client Recoll ti avvisa di procedere con la sua configurazione prima di partire con la indicizzazione. Cliccate su “cancel” altrimenti indicizza tutta la vostra cartella personale. Nella finestra che comparirà inserite le cartelle, e le relative sottocartelle, che volete indicizzare selezionandole con il tasto “+” (ricordatevi di eliminare “~” con il tasto “-”). Cliccate su “ok” e Recoll parte con la indicizzazione dei file in esse contenuti. Al termine provate a ricercare uno o più file che contengono una determinata parola o frase e in un attimo avrete il risultato della ricerca. Per future indicizzazioni a mano semplicemente scegliete la voce “Update Index” dal menu “File”.

recoll-2

(Figura 1 – esempio di ricerca)

Come potete notare in figura 1 recoll indicizza il contenuto di diversi tipi di file insieme ad eventuali metadata. Inoltre, fornisce una preview in solo testo del contenuto e dei metadata indicizzati come pure la percentuale di rilevanza, un estratto del contenuto e altre informazioni.

In conclusione, se siete alla ricerca di un programma abbastanza completo che aiuti la vostra memoria, Recoll merita di essere provato seriamente. Per quanto mi riguarda lo uso già da tempo e soddisfa pienamente le mie necessità. È dotato anche di un manuale completo, cosa da non sottovalutare.

Annotazioni e osservazioni:

Recoll ha bisogno di diversi programmi di supporto. Sotto la voce “Aiuto” selezionate “Show missing helpers” e se la risposta sarà “No helpers found missing” allora vuol dire che nella vostra macchina Linux avete già installato tutto il necessario.

Recoll indicizza anche le email ed i suoi allegati ma dovete indicare l’indirizzo completo della cartella in cui vengono memorizzate le email (personalmente uso il fomato mbox).

Si possono incontrare problemi con file doc di Microsoft se il contenuto è formato da due, tre parole. In realtà Recoll fallisce a causa del programma utilizzato per la conversione. Un filtro migliore risolverebbe il problemino.

Possibilità di utilizzare gli attributi estesi (funzione che ho testato personalmente insieme all’autore).

L’autore risolve seriamente i pochi bug che si manifestano.

Il client recoll si basa sulle librerie Qt vers. 4 (personalmente lo uso tranquillamente con Xfce ) mentre i programmi recollindex e recollq si basano su poche librerie standard. I filtri utilizzati possono richiedere altre librerie (python, ecc.).

Recoll è altamente configurabile e personalizzabile, anche se ciò non è una priorità.

Francesco Di Leo

Popular Posts:

Flattr this!

  11 Responses to “Recoll, a volte i ricordi non bastano.”

  1. Francesco, I could not agree more with you! I too searched for ages and ages to find a replacement for “Sleuthhound” which ran under Windows and was not too bad (although it could not handle indexes over networks with 200,000 files or so).

    I tried all the programs you wrote about.

    Finally Recoll came along and for me it does everything I want and need at the present time.

    regards from CH
    Martin

  2. Ottimo articolo.
    Ho installato immediatamente recoll ma mi dava alcuni missing helpers (che ho provveduto ad installare tramite terminale).
    Tuttavia recoll non li vede ancora.
    Devo riavviare il sistema o cos’altro?

  3. Very interesting. Would the deamon be able to run on a Synology disk station (which uses a Linux kernel:

    Linux SynologyDisk 2.6.32.12 #1372 SMP Tue Nov 2 17:57:51 CST 2010 x86_64 GNU/Linux synology_x86_1010+

    and then query it from remote?

    • I’ve no experience with Synology, which distribution it can run ? a debian like ? if so perhaps you could be able to install Recoll on it.

      And (if possible) call the recoll client via ssh with X forward.
      So you can cann the remote client on your desktop and check for files/contents ailable on your NAS.

      Let us know if this is doable i think that can interest many persons.

  4. @Stephan
    I guess that as the Synology seems to run with X86 Linux you should be able to get recolld running. Does the Synology allow you to ssh into it? Is there a package management system for it (deb, rpm, etc)? Can you compile programs on it (is there a developer build package installed with make etc)?
    Once recolld is running, could you not mount (either as a Samba share or with sshfs) the xapiandb folder on your local machine and query the database “locally” using the recoll gui? In order for Preview and Open to work you would need to have the document tree loaded in a similar location locally as on the server I suppose. I would be interested to hear your results.
    regards
    Martin

  5. Risposta a Adso72
    Per quanto mi riguarda, ho installato i missing helpers tramite i pacchetti ufficiali della distribuzione che uso. Come ho accennato nell’articolo, alcuni di questi possono richiedere altre dipendenze e quindi bisogna controllare che tutte le dipendenze siano soddisfatte.

    Francesco Di Leo

  6. @Linuxari, @Martin:
    I think it is Gentoo based, but not sure. You can SSH into the device. I haven’t checked if it does support X. I can mount a share and make it seamless (using sshfs), so qeurying would work if there’s no X.
    Synology has a packet management system, but it’s not deb or rpm. They do have a developer sections and actively encourage 3rd party add-ons: http://www.synology.com/enu/apps/3rd-party_application_integration.php including the offer to list the app on their site.
    I can lend moral support for a port but my C is worse than my Chinese.

  7. Ho installato anche io i missing helpers tramite apt-get (catdoc, antidoc, unrtf) su due pc (casa e ufficio), entrambi con Kubuntu 64bit 10.10.

    Uno va benissimo, l’altro mi continua a dire che non trova i missing helpers 🙁

  8. Quali sono i missing helpers che non riesce a trovare?
    Se non hai indicizzato alcunchè cancella la directory nascosta .recoll nella tua directory personale.

  9. I use it, it’s a private google on your computer, very powerful, i love it. You will rediscover thing that you totally forget. A must have

Leave a Reply to guill Cancel reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(required)

(required)

*