L’arrivo di Google Panda in Italia potrebbe essere imminente e molti dei miei clienti sono preoccupatissimi per ciò che potrebbe accadere ai propri siti web. Mi capita sempre più spesso di dover motivare le mie strategie di ottimizzazione o di link building proprio perchè il cliente è terrorizzato da qualsiasi “manovra” possa essere fatta onsite o offsite, si teme sempre di cadere tra le grinfie di questo malefico e cattivissimo panda.
Anche se non amo scrivere di cose di cui non posso dare testimonianza della mia esperienza personale (dobbiamo aspettare google panda),  è doveroso dedicare un post per spiegare in dettaglio a tutti i miei clienti a cosa potrebbero andare incontro con l’imminente aggiornamento dell’algoritmo di Google.

Qual’è lo scopo di Google Panda?

Sul blog ufficiale di Google, Matt Cutts e Amit Singhal, anche se con il dovuto riserbo, hanno dichiarato che lo scopo di Google Panda è quello di migliorare la qualità dei contenuti offerti dai siti web che google mostra ai primi posti delle ricerche. Google Panda farà in modo che i siti di scarsa qualità non siano più presenti in prima pagina. Sul termine “scarsa qualità” sono nate numerose diatribe negli USA quando portali abbastanza famosi sono crollati dalle SERP ed i proprietari si sono molto risentiti per l’attribuzione del termine “scarsa qualità”. Quello che non è chiaro a molti è che per “scarsa qualità” Google intende siti web che non hanno abbastanza contenuti originali e tanti testi ed immagini copiate parzialmente o totalmente da altri siti. Per capire in dettaglio cosa intende google potete approfondire qui su panda

Quali sono i fattori per capire se un sito può essere penalizzato da google panda?

  1. Un’alta percentuale di contenuti duplicati. Tale controllo sarà effettuato a livello di singola pagina e di intero sito web.
  2. Poche pagine di contenuto originale ed unico
  3. Molte pagine con una bassa percentuale di testo originale (e tanto testo copiato)
  4. Un’alta percentuale di contenuti fuori tema,soprattutto ad inizio pagina, non pertinenti alla ricerca per cui google ha raggiunto la pagina stessa.
  5. Utilizzo innaturale di un termine (keyword) all’interno di una pagina web. Questo è un argomento che mi gratifica tanto dato che l’ho affrontato più di un anno fa, quando panda non esisteva, ed ho realizzato dei software per ottimizzare l’uso della keyowd nei testi a seconda dell’utilizzo naturale rilevato algoritmicamente in documenti di testo simili tramite algoritmi LSI (Semantici)
  6. Una forte frequenza di rimbalzo delle pagine web, praticamente sarà utilizzato google analytics come strumento per valutare la qualità di un sito web. Anche in questo caso sono contento di aver anticipato l’idea qualche anno fa parlando con il mio socio e forse in qualche post sul mio blog, era ovvio che analytics fosse anche un modo per controllare la qualità dei siti web visti dall’utente finale. A dire il vero ho anche l’impressione che le oscillazioni di parole chiave siano un “test drive” di google che porta siti web in prima pagina per un po di tempo per “vedere se piace agli utenti”, poi si comporta di conseguenza.
  7. Poco tempo di permanenza sulle pagine, sempre tramite analytics
  8. Pochi utenti di ritorno (analytics)
  9. Pochi click dalla pagina di ricerca (SERP) verso il sito in questione
  10. Una grande quantità di contenuto fisso in tutte le pagine web del sito (la nota boilerplate)
  11. Pochi link in entrata verso il sito web e/o pochi link di qualità
  12. Assenza di mensioni al sito in siti social

Se il vostro sito web pecca in più punti potrebbe superare la “soglia” di tolleranza del nervosissimo google panda e perdere una bella fetta di visite. Sempre voci da Google dicono che un sito web può essere considerato di scarsa qualità anche solo a causa di una sola sezione contenente testi copiati da altri siti web. Stando a quanto detto fin’ora siti web come Liquida e Wikio dovrebbero praticamente scomparire dal web come qualsiasi altro aggregatore di blog o notizie, sono curiosissimo di vedere come si comporterà google con siti del genere.

Quali sono le tipologie di sito web che potrebbero essere penalizzate da google panda?

A mio avviso i siti web che potrebbero subire un grande danno con l’avvento dell’imminente aggiornamento di google sono i seguenti:

  • Aggregatori di notizie come Liquida, Wikio e tanti altri
  • Siti di e-commerce in dropshipment (con testi di articoli identici a quelli di migliaia di altri affiliati)
  • Siti di prenotazione alberghiera affiliati ai vai Channel Manager, anche in questo caso hanno tutti gli stessi testi
  • Siti comparatori di shopping, anch’essi mostrano testi provenienti da feed come altri migliaia di siti web
  • Siti di notizie flash che ripubblicano snippets di ANSA o altre fonti

Come si può evitare di cadere nelle grinfie di google panda se si ha uno dei siti elencati sopra?

L’unica soluzione a mio avviso è il valore aggiunto dell’intervento redazionale, ossia recensire tutti gli articoli provenienti dai vari feed o csv aggregati. In questo modo è possibile abbassare la percentuale di testi “copiati” (per forza di cose, non per pigrizia) ed arricchire l’html del sito con molto testo descrittivo,recensioni, opinioni, aprirsi al commento pubblico, aggregare i commenti ai prodotti, hotel o altro mixando i risultati di più feed diversi. Le soluzioni sono tante, l’mportante è evitare di avere pagine composte da soli testi copiati, direi che un 50/50 potrebbe tenervi al di sotto della soglia del malefico panda.

E se google panda penalizza il vostro sito web ma ritenete che sia stato un errore di Google?

A dire il vero credo che ci sia ben poco da fare, anche se esiste questo thread nel forum di google dove potete protestare, ma non disperate, il nuovo aggiornamento di google non è una penalizzazione ma un cambio di algoritmo, quindi anche se il vostro sito dovesse crollare non siete stati penalizzati, semplicemente piacete di meno a google. Cosa si può fare? Un’ottimizzazione SEO antipanda ed una revisione totale dei contenuti scopiazzati, bisognerà alzare la qualità del sito web o rinunciare agli articoli “incriminati” e cancellarli del tutto dal sito se sono totalmente copiati… vedremo sul campo a breve, potrebbero crollare dei pilastri del web italiano sotto il peso di google panda.