Salta gli elementi di navigazione
banner
logo ridotto
logo-salomone
SIAF - Sistema Informatico dell'Ateneo Fiorentino

Marsilius - Suggerimenti per la ricerca

In questo documento vengono illustrati i concetti di base relativi alla ricerca e descritte tecniche avanzate per generare risultati di ricerca più efficienti.

Sommario

Che cosa contiene Marsilius

Introduzione alla ricerca

Estensione della ricerca

Ottimizzazione della ricerca

Operatori di ricerca avanzata


Che cosa contiene Marsilius

Il motore di ricerca Marsilius indicizza tutti i siti web che appartengono all'Università degli Studi di Firenze e hanno estensione unifi.it.

Per facilitare il reperimento delle informazioni sono state create delle aree (dette "raccolte") che raggruppano i siti in base ad aree di interesse identificate dalle scuole e da alcuni servizi. Al momento sono disponibili le seguenti raccolte:

  • Ateneo (cioè il solo sito www.unifi.it)
  • Agraria
  • Architettura
  • Economia e management
  • Giurisprudenza
  • Ingegneria
  • Medicina
  • Psicologia
  • Scienze della salute umana
  • Scienze matematiche fisiche e naturali
  • Scienze politiche
  • Studi umanistici e della formazione
  • Sistema Bibliotecario
  • Servizi Informatici

Alcuni siti, per l'argomento trattato possono ricadere sotto più di una raccolta.

Il box di ricerca presente sul sito principale dell'Ateneo (www.unifi.it) opera sulla sola raccolta "Ateneo". Analogamente i box presenti sui siti di Scuola operano ciascuno sulla propria area. Infine i box presenti sugli altri siti operano solo su se stessi.
In ogni box è presente un link "Cerca in tutti i siti dell'Ateneo" che conduce alla pagina generale di Marsilius (marsilius.unifi.it) che permette di ricercare su tutti i siti dell'Ateneo o - di nuovo - restringere la ricerca a una particolare raccolta.

Introduzione alla ricerca

Per cercare un documento, inserisci alcune parole descrittive nella casella di ricerca, quindi premi il tasto Invio oppure fai clic sul pulsante di ricerca. Viene restituita una pagina di risultati contenente un elenco di documenti e pagine web correlate ai termini di ricerca, in cui quelli maggiormente pertinenti vengono visualizzati nelle prime posizioni. Per impostazione predefinita, vengono restituite solo le pagine che contengono tutti i termini cercati utilizzati. Pertanto, per ampliare o circoscrivere ulteriormente la ricerca, è sufficiente ridurre o aumentare il numero di termini. Non devi aggiungere l'operatore "and" tra un termine e l'altro. Ad esempio, per cercare le specifiche tecniche di un prodotto, inserisci i seguenti termini:

Marsilius utilizza tecniche di corrispondenza testuale molto sofisticate per trovare pagine importanti e pertinenti ai fini della ricerca. Ad esempio, non si limita ad analizzare una pagina, ma esamina anche il contenuto delle pagine ad essa collegate, dando la precedenza a quelle in cui i termini di ricerca sono vicini l'uno all'altro. Tutti i risultati contengono uno o più snippet o estratti del documento che mostrano il contesto in cui vengono utilizzati i termini di ricerca. Nello snippet, i termini di ricerca sono evidenziati in grassetto, in modo che sia più facile stabilire se il risultato provenga da una pagina o documento che vale la pena consultare.

Nota. I documenti PDF crittografati visualizzabili vengono convertiti in formato HTML per l'indicizzazione, ma il documento HTML non viene reso disponibile.

Ortografia

Per le ricerche in inglese americano, se il correttore ortografico rileva un possibile errore ortografico, viene proposto un suggerimento insieme ai risultati di ricerca. La funzione di controllo dell'ortografia prende in considerazione anche il contesto in cui si presenta una parola.

Lettere maiuscole

Marsilius non fa distinzione tra lettere maiuscole e minuscole. Tutte le lettere vengono considerate come minuscole, indipendentemente da come vengono inserite nella casella di ricerca. Ad esempio, inserendo "cristoforo colombo", "Cristoforo Colombo" e "Cristoforo colombo" si ottengono sempre gli stessi risultati.

Parole di uso comune

Marsilius ignora parole e caratteri di uso comune quali "dove" e "come" e determinate cifre e lettere, in quanto tendono a rallentare la ricerca senza migliorarne i risultati. Marsilius indica nella pagina dei risultati se un termine di uso comune è stato escluso.

Se una parola di uso comune è essenziale per ottenere i risultati desiderati, è possibile utilizzarla anteponendo ad essa il segno di addizione ("+"). Includi uno spazio prima del segno "+", ma non dopo. Ad esempio, se desideri cercare documenti su Fisica I, inserisci:

In alternativa, puoi racchiudere tra virgolette una serie di parole ed eseguire una ricerca per frase.

Ordinamento per data

Per impostazione predefinita, i risultati di ricerca sono ordinati in base alla pertinenza, con il risultato maggiormente pertinente posizionato in alto nella pagina. Se desideri ordinare i documenti in base alla data, fai clic sul link Ordina per data. Il documento più recente viene visualizzato nella parte superiore della pagina e nei risultati viene indicata la data di ciascun file. I risultati che non contengono date vengono ordinati in base alla pertinenza in coda all'elenco.

Numeri

Quando cerchi dei numeri, non utilizzare numeri esponenziali, quali "1e10" oppure numeri interi negativi, quali "-12".

I numeri separati da virgole, vengono interpretati come singole cifre, non come numeri frazionari; la virgola viene infatti interpretata come un separatore di termini e non come un separatore decimale. Ad esempio, se digiti "3,75", vengono cercati due termini distinti," 3" e "75", non la frazione decimale "tre e tre quarti". Le virgole che separano gruppi di tre cifre vengono ignorate e non sono necessarie. Ad esempio, "10,000" e "10000" vengono trattati nello stesso modo.

Estensione della ricerca

È possibile estendere la ricerca utilizzando l'operatore OR. Per visualizzare le pagine che contengono la parola A o la parola B, aggiungi OR (maiuscolo) tra i due termini. Ad esempio, per cercare un corso di fisica o uncorso di chimica, inserisci:

Ottimizzazione della ricerca

Poiché Marsilius restituisce solo le pagine web che contengono tutte le parole specificate, per ottimizzare o circoscrivere una ricerca è sufficiente aggiungere altre parole a quelle già inserite. La query così ottimizzata produrrà un sottoinsieme delle pagine trovate con la prima ricerca generica. Se in tal modo non ottieni i risultati desiderati, puoi provare a escludere parole, a cercare frasi esatte o a circoscrivere la ricerca a un intervallo di numeri. Queste tecniche sono illustrate nelle sottosezioni riportate di seguito.

Esclusione di parole

Se il termine di ricerca ha più di un significato, puoi circoscrivere la ricerca aggiungendo il segno meno ("-") davanti alle parole correlate al significato che desideri escludere. Ricordati di inserire uno spazio prima del segno meno. Puoi concatenare un elenco di parole da escludere.

Ad esempio, per cercare il pianeta Saturno ed escludere i risultati di ricerca relativi al dio romano o all'omonimo film, digita la seguente query:

Marsilius proporrà le pagine su Saturno che non contengono le parole "film" o "dio".

Ricerca per frase

La ricerca per frase è particolarmente utile per trovare espressioni famose o nomi specifici. Per cercare un nome o una frase esatta puoi:

  • Racchiudere la frase tra virgolette. Marsilius mostra solo i documenti che contengono la frase esatta inserita.
  • Utilizzare elementi di unione di frasi, quali trattini, barre, punti, segni di uguale e apostrofi, tra una parola e l'altra della query.

Gli elementi di unione di frasi e le virgolette uniscono i termini di ricerca in una sola unità. Ad esempio, se inserisci la seguente query, Marsilius la tratterà come una ricerca per frase anche se i termini di ricerca non sono indicati tra virgolette.

Ricerca per intervallo

Puoi circoscrivere la query entro un determinato intervallo. Puoi impostare intervalli di date, pesi, prezzi, metatag e così via. Le seguenti sottosezioni illustrano come perfezionare le ricerche utilizzando gli intervalli.

Intervalli di numeri

Per cercare documenti o elementi che contengono numeri in un determinato intervallo, inserisci il termine di ricerca e l'intervallo di numeri separato da due punti (".."). Puoi impostare intervalli di pesi ("forcella in carbonio 250..500 g"), dimensioni ("fusto 90..100 mm"), anni ("tour de france 2000..2006"), prezzi esclusivamente in dollari ("luci bicicletta $10..$30") e così via. Accertati di specificare un'unità di misura o un indicatore di altro tipo rappresentativo dell'intervallo di numeri.

Ad esempio, se desideri cercare delle matite del costo compreso tra 1,50 $ e 2,50 $, inserisci:

Ciascun numero nell'intervallo non deve includere più di 6 cifre significative. Ad esempio, se digiti la query "1..1234567 tonnellate camion", solamente le prime sei cifre significative della sequenza "1234567" verranno incluse nell'intervallo di ricerca, ovvero come se avessi digitato solamente, "1..1234560 tonnellate camion".

Intervalli di date

Puoi cercare documenti contenenti date che rientrano in un determinato periodo di tempo. Per eseguire una ricerca per intervallo di date, inserisci i seguenti elementi:

  • Il termine di ricerca
  • L'operatore daterange:
  • La data di inizio
  • Il separatore di intervallo, che è due punti se utilizzi il formato AAAA-MM-GG, un trattino se utilizzi il formato giuliano.
  • La data di fine

Non aggiungere spazi tra l'operatore di ricerca e l'intervallo di date. Le date possono essere indicate in uno dei seguenti formati:

  • AAAA-MM-GG (ISO 8601): gli intervalli di date in questo formato devono essere separati da due punti (..).
  • Giuliano: la data in formato giuliano indica il numero di giorni che intercorrono dall'1 gennaio 4713 AC. Ad esempio, la data in formato giuliano per il 1° agosto 2001 è 2452122. Gli intervalli di date in questo formato devono essere separati da un trattino ("-").

Ad esempio, per cercare un documento su Harry Potter modificato entro un periodo specifico di due anni, inserisci:

La prima data utilizzabile nella ricerca per intervallo date è il 1 gennaio 1990. L'ultima data disponibile è il 9 novembre 2034.

Intervalli di metadati e metatag

Puoi inoltre effettuare una ricerca dei soli documenti che includono metadati o metatag contenenti numeri compresi nell'intervallo specificato. Per eseguire una ricerca per intervallo di metadati, inserisci i seguenti elementi:

  • Il termine di ricerca
  • L'operatore inmeta:
  • Il nome dei metadati o del meta-tag
  • L'intervallo di numeri separato da due punti ("..")

Per effettuare con precisione una ricerca per intervallo di date con inmeta, i metatag devono contenere solo la data e nessun altro dato. Supponiamo che i tuoi documenti contengano il metadato "modified" che indica la data dell'ultima modifica apportata. Per cercare un documento sui rischi creato nel 2006, puoi inserire la query:

Oltre a cercare documenti con metadati che includono intervalli di date o numeri, l'operatore inmeta può servire ad altri scopi. Per ulteriori informazioni sull'operatore inmeta, consulta la sezione Search Protocol Reference, disponibile online nella pagina di documentazione pubblica dell'appliance di ricerca con cui è costruito Marsilius.

Operatori di ricerca avanzata

Marsilius supporta numerosi operatori di ricerca avanzata, i quali non sono altro che parole che circoscrivono la ricerca a un insieme più ridotto di documenti. Quando inserisci una query, non aggiungere spazi tra l'operatore di ricerca e i termini di ricerca.

Operatore di ricerca Descrizione Esempio

allinanchor:

Circoscrive la ricerca alle pagine contenenti tutti i termini di ricerca nel testo di ancoraggio. Il seguente esempio illustra un tag anchor:

Vai a Foo

allinanchor: prende in considerazione il testo compreso tra > e . allinanchor: prende in considerazione solo i tag anchor

Un ancoraggio è un indicatore inserito in una sezione specifica di una pagina. L'autore del documento può creare link a tale ancoraggio, il quale porta rapidamente il lettore alla sezione specificata. L'indice nella parte superiore di questo documento, ad esempio, fa uso di link ipertestuali agli ancoraggi del documento.

Non utilizzare altri operatori di ricerca insieme all'operatore allinanchor:.

Se inserisci allinanchor:libri economici nella casella di ricerca, vengono visualizzate solo le pagine contenenti testo di ancoraggio che comprende le parole "economici" e "libri" tra > e .

allintitle:

Circoscrive la ricerca ai documenti contenenti i termini di ricerca nel titolo HTML.

Consulta anche la sezione sull'operatore di ricerca intitle:.

Se inserisci allintitle:ricerca google nella casella di ricerca, vengono visualizzati solo i documenti che contengono sia la parola "google", sia la parola "ricerca" nel titolo HTML.

allinurl:

Circoscrive la ricerca ai documenti contenenti i termini di ricerca nell'URL. Non è necessario che i termini di ricerca siano adiacenti l'uno all'altro e che compaiano in un ordine particolare nel documento.

L'operatore di ricerca funziona per le parole dell'URL e non per i componenti dell'URL come la punteggiatura. Le barre ("/"), ad esempio, vengono ignorate.

Consulta anche la sezione sull'operatore di ricerca inurl: .

Se inserisci allinurl:ricerca google nella casella di ricerca, vengono visualizzati solo i documenti che contengono sia la parola "google", sia la parola "ricerca" nell'URL.

Se inserisci allinurl:ricerca/google nella casella di ricerca, vengono visualizzati gli stessi documenti dell'esempio precedente. La barra nel termine di ricerca viene completamente ignorata.

cache:

Il motore di ricerca archivia il testo dei vari documenti scansionati in un formato di back-up noto come "cache". Una versione cache di una pagina web può essere visualizzata nel caso in cui la pagina originale non sia disponibile, ad esempio quando il server della pagina è fuori servizio. La versione cache della pagina web rappresenta il documento scansionato l'ultima volta dal crawler, con un messaggio posizionato in alto indicante che si tratta di una versione cache.

Se nella query, oltre all'indirizzo web, vengono specificati termini di ricerca, essi verranno evidenziati nella versione cache del documento.

Se inserisci cache:www.google.it nella casella di ricerca, viene visualizzata la versione cache della home page di Google.

Se inserisci cache:www.google.it comunicati stampa nella casella di ricerca, verrà visualizzata la versione cache della pagina web, in cui le parole "stampa" e "comunicati" sono evidenziate.

daterange:

Circoscrive la ricerca ai documenti che contengono date comprese in un determinato intervallo di tempo oppure precedenti o successive a una data specificata. È possibile cercare date comprese tra il 01-01-1990 e il 09-11- 2034. Le date possono essere indicate in qualunque formato, tranne il giuliano che attiva una ricerca per intervallo numerico. Quando si specificano date nel formato ISO 8601 (AAAA-MM-GG), occorre separarle con due punti (..).

Se inserisci
elezioni daterange:2004-01-13..2006-01-13

nella casella di ricerca vengono restituiti risultati relativi al termine di ricerca "elezioni" con date che rientrano nell'intervallo di tempo specificato.

filetype:

Circoscrive la ricerca a tipi di file specifici, quali fogli di calcolo Excel, file PDF o documenti Word. Immetti l'operatore filetype: seguito dall'estensione del file.

Se inserisci auto filetype:pdf nella casella di ricerca, vengono visualizzati solo i file PDF relativi alle auto.

info:

Restituisce le seguenti informazioni per l'URL in questione:

  • La copia cache della pagina
  • Siti web simili alla pagina
  • Siti web contenenti link ipertestuali alla pagina
  • Pagine web impostate come collegamento ipertestuale nella pagina
  • Pagine web contenenti l'URL nel testo

Se inserisci info:www.google.it nella casella di ricerca, vengono visualizzate le seguenti informazioni sulla home page di Google:

  • Copia cache di www.google.it
  • Siti web simili a www.google.it
  • Pagine web contenenti link ipertestuali a www.google.it
  • Link ipertestuali a pagine web in www.google.it
  • Pagine web contenenti www.google.it nel testo

inmeta:

È possibile filtrare i risultati in base ai metatag e al loro valore con l'operatore inmeta. In associazione ai caratteri ~ o =, inmeta circoscrive i risultati ai valori dei metatag esatti o parzialmente esatti proprio come i parametri di ricerca requiredfields e partialfields.

Se inserisci inmeta:department=Risorse umane vengono restituiti documenti con il metatag department=Risorse umane.

intitle:

Circoscrive la ricerca ai documenti che contengono il termine di ricerca nel titolo HTML.

Inserire intitle: prima di ogni termine di ricerca equivale ad anteporre allintitle: all'intera serie di termini di ricerca.

Se inserisci intitle:ricerca google, verranno visualizzati i documenti che contengono la parola "google" nel titolo HTML e la parola "ricerca" nel titolo, nel testo, nell'ancoraggio o in qualsiasi altro punto.

Inserire intitle:google intitle:ricerca nella casella di ricerca equivale a inserire allintitle:ricerca google.

inurl:

Circoscrive la ricerca ai documenti che contengono il termine di ricerca nell'URL. Questo operatore funziona per le parole e non per i componenti dell'URL come la punteggiatura. Le barre ("/"), ad esempio, vengono ignorate.

Inserire l'operatore inurl: prima di ogni termine di ricerca equivale ad anteporre allinurl: all'intera serie di termini di ricerca.

Se inserisci inurl:ricerca google nella casella di ricerca, verranno visualizzati i documenti che contengono la parola "google" nell'URL e la parola "ricerca" nell'URL, nel testo, nel titolo o in qualsiasi altro punto.

Se inserisci inurl:ricerca/google nella casella di ricerca, vengono visualizzati gli stessi documenti dell'esempio precedente. La barra nel termine di ricerca viene completamente ignorata.

Se inserisci google inurl:google inurl:ricerca nella casella di ricerca, vengono visualizzati i documenti che contengono sia la parola "google", sia la parola "ricerca" nell'URL. Vengono visualizzati gli stessi documenti restituiti con la query allinurl:ricerca google.

link:

Circoscrive la ricerca a tutte le pagine contenenti link al sito web indicato nella query.

A questo operatore di ricerca e al sito web specificato non può essere aggiunto nessun altro termine di ricerca.

Se inserisci link:www.berkeley.edu nella casella di ricerca, vengono visualizzate tutte le pagine che contengono link a tale pagina.

site:

Circoscrive la ricerca ai documenti contenuti in un sito web. Se non specifichi il sito web e digiti solo il dominio generico di primo livello, come .com, .edu o .org, il motore di ricerca restituisce tutti i documenti presenti in tale dominio.

L'operatore site: consente di circoscrivere la ricerca fino a livello di directory.

Se inserisci guida site:www.google.it nella casella di ricerca, vengono visualizzate le pagine della guida o della documentazione utente presenti in www.google.it.

Se inserisci guida site:com nella casella di ricerca, vengono visualizzate le pagine della la guida o della documentazione presenti in tutti i siti web con estensione .com.

Se inserisci site:www.google.com/enterprise/, la ricerca verrà circoscritta agli elementi contenuti a livello della directory enterprise. Se non includi la barra inclinata, come in www.google.com/enterprise, la ricerca viene estesa anche a tutte le sottodirectory.

 
ultimo aggiornamento: 12-Mag-2015
Unifi Home Page

Inizio pagina