Iniziamo il corso seo online partendo da un livello molto basso, mi farebbe molto piacere essere utile anche per chi è completamente a digiuno di concetti seo e dinamiche di raccolta ed indicizzazione dei contenuti sul web, quindi parto dal principio, dai motori di ricerca.
Un motore di ricerca è un sistema automatico che analizza un insieme di dati (Pagine web, documenti, immagini) e restituisce un indice dei contenuti disponibili classificandoli in base a formule matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca.
Il motore di ricerca più utilizzato su scala mondiale (con un indice che supera i 23 miliardi di pagine), è Google; molto usati anche Bing (motore di ricerca della Microsoft) e Yahoo!
Fra i motori di ricerca nati in Italia quelli maggiormente utilizzati sono Libero e Virgilio che tuttavia non sono veri motori di ricerca giacché si limitano a riutilizzare servizi di ricerca preesistenti.

Il lavoro dei motori di ricerca si divide principalmente in tre fasi:

  1. Analisi del campo d’azione (tramite l’uso di crawler appositi)
  2. Catalogazione del materiale ottenuto
  3. Risposta alle richieste dell’utente

Analisi
Per analizzare il web i motori di ricerca utilizzano dei programmi detti crawler (o spider o robot), che si occupano di visitare automaticamente gli URI contenuti nel database e seguire i successivi URI che trovano all’interno dei documenti analizzati, inserendo di volta in volta nel database tutte le informazioni “sensibili” della pagina (il contenuto testuale, varie informazioni su di essa come la data di ultimo aggiornamento, e altro).

Catalogazione
Dopo l’analisi delle pagine, a seconda di criteri che variano da motore a motore, alcune di esse vengono inserite nel database e nell’indice del motore di ricerca.
La parte testuale archiviata durante la fase di analisi verrà in seguito analizzata per fornire le risposte alle ricerche degli utenti. Molti motori di ricerca sul web rendono anche disponibile una copia dei dati testuali di ogni pagina archiviata per quando la risorsa originale sia irraggiungibile: questa funzione è detta Copia cache.

Risposta
Rispondere alle richieste degli utenti implica la necessità di elencare i siti in ordine di rilevanza rispetto alla richiesta ricevuta.
Per stabilire la rilevanza di un sito vengono cercate nel database quei documenti che contengono la parola chiave inserita dall’utente, dopodiché ogni motore di ricerca sfrutta propri algoritmi per classificare le pagine, controllando, per esempio, quante volte le parole chiave vengono ripetute, quanti link riceve quel documento, in quali punti della pagine sono poste le parole chiave (concetto di prominenza) , quanti siti del database contengono link verso quella pagina, o quante volte un utente ha visitato quel sito dopo una ricerca.