Da un bel po di tempo non mi dedico al blog, è un peccato perchè per me è stato un periodo veramente meraviglioso sia dal punto di vista lavorativo che personale (ho avuto una bellissima bimba, Elisa), e mi avrebbe fatto piacere scrivere qualcosa riguardante tutto quello a cui sto lavorando. Scrivere su questo blog a volte è per me una sorta di sfogo, diciamo che il blog lo vedo un po come un amico esperto di SEO che non si rompe mostruosamente le “BEEP” di starti ad ascoltare, cosa che invece accade puntualmente con mia moglie che giustamente non può fregarsene di meno 🙂

Prima di questo periodo di lunga assenza avevo predetto una caduta a picco di un paio di siti non appena sarebbe arrivato Google Panda, parlo di Liquida e Wikio, non è che li volessi gufare, la mia era una semplice e normalissima deduzione alla Mister Spock (con le orecchie ci siamo quasi) basandomi su quelli che sarebbero stati i punti fondamentali del Panda Update. A quanto pare, dando un’occhiata ad uno studio di marketing pare che sia avvenuto realmente e che i due siti abbiamo avuto un totale crollo delle visite, tant’è vero che liquida lo vedo molto di rado nelle SERP mentre prima era ovunque con i contenuti prelevati dai siti dei blogger.

Nell’attesa di vedere come si sarebbe comportato Panda in Italia ho lavorato alle dovute contromisure, anche se non ho mai avuto contenuti duplicati su nessuno dei miei siti o su quelli dei clienti. Ho provato a trovare varie soluzioni sopratutto per quanto riguarda i siti di commercio elettronico e vi spiego anche il perchè.

I siti di e-commerce sono quasi sempre privi di contenuti unici, si tratta di prodotti che vendono in tanti e quasi sempre presentati in pagine di prodotto standard con Nome, breve introduzione,prezzo,disponibilità e prodotti correlati, quindi pagine decisamente duplicate per qualsiasi store online che venda quel determinato prodotto.

Il problema dei testi duplicati può verificarsi per molteplici tipologie di sito web, nello specifico per:

  • Comparatori di prezzi
  • Siti turistici che vendono offerte/hotel di terzi da Channel Managers
  • Siti di comunicati stampa (chi pubblica è pigro e non scrive articoli diversi)
  • Siti di notizie (molti usano plugin per aggregare notizie via RSS)
  • Aggregatori di Feed

Ecco come ho pensato di risolvere il problema:

  1. Utilizzare un aspetto delle tecniche Black Hat (Text Spinning) per creare strumenti da utilizzare in maniera pulita WHITE HAT
  2. Creazione di un archivio di frasi, modi di dire, varianti di testo per cambiare automaticamente frasi note ad ogni pubblicazione (evitando duplicati)
  3. Scrittura di un plugin wordpress in grado di fondersi con i feed aggregators ma cambiando i testi in maniera sensata e corretta

Il database è molto corposo e mi rendo conto che potrebbe sembrare impossibile individuare tutte le frasi “utili” da tradurre ma vi spiego perchè ci sono riuscito:

Prima di lavorare al database ho fatto alcune considerazioni, sulle quali ho poi preso le decisioni operative:

  1. Prevedere tutte le possibili frasi è impossibile come lo è tradurle in una vita intera
  2. I miei clienti operano in settori specifici quindi sono partito da quelli
  3. Per individuare le frasi più utilizzate bisognerebbe leggersi tutti i siti dei competitors e contare le frasi

La soluzione è stata quella di creare un software che avendo in INPUT una keyword, analizza le SERP, preleva i primi 100 siti web, li naviga dalla Home page fino a 50 sottopagine e crea un archivio di frasi utilizzate globalmente per quella parola chiave. Durante l’analisi dei contenuti, il software conta il numero di occorrenze di ogni frase e le ordina dalla più usata a scendere. La lista delle frasi “di settore” viene poi fornita ai copywriter che provvedono alla creazione di un codice intermedio che io chiamo forse erroneamente METACODICE (mi piace così).

Volendo fare un esempio, prendiamo la seguente frase:

“possibilità di arrivare in prima pagina”, i copywriter produrranno un codice tipo;

{possibilità di arrivare in prima pagina|probabilità di arrivare al top|possibilità di scalare le serp|probabilità di arrivare primi|possibilità di entrare nella top ten}

tutte frasi che esprimono lo stesso concetto e che sono corrette sia per il lettore che per Google.

Il plugin wordpress che ho realizzato, quando incontra una delle varianti la traduce con una a caso tra quelle elencate, in questo modo, considerando le infinite combinazioni delle varie parti del documento, avremo sempre testi sensati, univoci, leggibili.

Molti spammer utilizzano questa tecnica per produrre migliaia di pagine web e guadagnare con le pubblicità, tecnica che ormai con l’arrivo di Panda andrà a morire perchè viene utilizzata grossolanamente senza un database ben strutturato alle spalle. Generalmente gli spammer utilizzano una semplice sostituzione di parole basandosi sul dizionario dei sinonimi di Open Office, quindi con regole tipo {casa|immobile|abitazione}, correndo ovviamente il rischio di problemi di ambiguità dei termini. Immaginate una frase del tipo “Ed io rimasi immobile a guardare” tradotta in “Ed io rimasi abitazione a guardare”, simpatico no? 🙂

Oltre a quest’ultima creazione ho realizzato altri 5 o 6 software che mi aiutano nel mio lavoro, diciamo che ora posso lavorare da solo per 30 persone 🙂 mi sono dedicato molto all’automazione dei processi ripetitivi del mio lavoro in modo da poter eliminare quelle attività dispendiose in termini di tempo.

Grazie a tutti questi tool di lavoro ho ottenuto delle belle soddisfazioni proprio di recente ed ho aumentato le collaborazioni con aziende straniere che investono in Italia, cosa che mi fa veramente piacere dato che all’estero sono più esperti in materia e non stanno li a pressarti per ottenere la prima pagina di google in 2 mesi per parole chiave da milioni e milioni di risultati.

Ultimissima cosa… Ho ripreso lo sviluppo di SEOMax WEB, sto riscrivendo tutto da capo perchè mi sono venute delle nuove idee e voglio fare qualcosa di veramente unico, ci sarà une feature che farà impazzire chiunque 🙂