Il giorno 13 Aprile ho scritto un articolo riguardante il Semantic Web e la mia sensazione (nata da varie letture) che Google stesse operando per fare in modo di rimuovere sporcizia dalle pagine web escludendo concetti non di centrale importanza per l’argomento trattato nell’articolo.

Sappiamo tutti che riguardo questo argomento specifico ci sono varie correnti di pensiero e dopo il mio articolo del 13 aprile mi hanno accusato ferocemente di averlo scritto solo per il gusto di sfatare le teorie formulate da chi affronta la SEO in modo diverso dal mio dedicandosi maggiormente alla cura del testo piuttosto che a fattori tecnici che invece io prediligo.

Sono stato accusato di aver preso fonti non attendibili (Ray Kurzweil, Google’s Director of Engineering) e di aver basato le mie opinioni solo leggendo un articolo su SEJ di Roger Monti , altra fonte che hanno ritenuto poco attendibile e che mi avrebbe spinto a prendere una cantonata.

Bene, queste persone invece di apprezzare la mia condivisione di informazioni, pur di non mettere in discussione quello in cui credono, non hanno nemmeno preso in considerazione l’ipotesi che Google avesse veramente voglia di filtrare entità latenti dalla propria valutazione, e di creare un entity graph pulito per ogni sorgente in cui ci siano solo le entity centrali e vitali per l’argomento trattato.

Fortunatamente, anche se chi mi conosce sa bene che scrivo e parlo solo se so esattamente quello di cui sto parlando e soprattutto se ho avuto modo di fare qualche test/esperimento o almeno dopo essermi confrontato con altri esperti, mi fa piacere che ad avvalorare le mie tesi sia arrivato un “personaggio” dal trust veramente elevatissimo, se parla lui i dubbi svaniscono, parlo di Google stesso!

Ebbene proprio il giorno dopo il mio articolo, il 14 aprile 2015, Google ha acquistato un brevetto per identificare le entity principali di un documento e filtrare quelle che ritiene latenti, irrilevanti, secondarie e marginali.

Questo cosa vuol dire?

Ve lo dico volgarmente, vuol dire che Google non se frega nulla che andiate a farcire i vostri testi con argomenti che siete andati a scovare attentamente facendo ricerche varie. Sia chiaro, da quendo sono uscite fuori queste teorie mi sono sempre opposto perchè da analista programmatore le vedo un nonsense, un motore che acquisisce dati so bene come funziona e come cataloga i dati e se trova un argomento “infilato” per fare la differenza non la farà.

Volendo fare una metafora, immaginate il documento come un uovo, Google vuole solo il tuorlo in cui si trova l’informazione centrale, potete aggiungere tutto l’albume che volete non cambierà nulla. Google saprà sempre separare il tuorlo dall’albume.

entity-principali

 

Vi cito i primi due punti evidenziati come vantaggi dell’algoritmo acquistato da Google

Advantages described in the patent from this approach include:

  • Entities representing main topics of a resource can be identified
  • Entities representing more peripheral topics can be discarded

Bene è palese che Google non vuole assolutamente topic latenti/periferici chiaro?

Più chiaro di così si muore, non è una cosa personale con chi la pensa diversamente ma se Google investe milioni per acquistare un brevetto che faccia esattamente quello che supponevo, deve essere chiaro quale sia il suo pensiero e la sua volontà.

Una frase precisa dell’abstract del brevetto dice:

Filtering a first entity graph whose nodes represent different entities found in a plurality of resources to remove nodes that do not correspond to a candidate entity

Questo dice esattamente quello che ho affermato nel mio articolo del giorno prima che Google acquistasse il brevetto (vi giuro che Google non mi aveva fatto la soffiata).

Questo è quello che avevo scritto io nell’articolo Semantic Web:

Vi spiego per quale motivo questo è totalmente errato:

  1. Un sistema informatico basato sui dati che acquisisce (Google), riterrà vero/valido/attendibile un documento i cui contenuti trovano riscontro in tanti altri documenti dello stesso tipo
  2. Un argomento “latente” inserito in un documento, quando il motore di ricerca va a confrontarlo con “i parametri di settore”, lo vedrà come irrilevante e da filtrare e non porta alcun valore

A questo punto non affronterò più quest’argomento, inizierò a parlarvi di Branded Entities e su come stiano facendo riflettere molti personaggi eccelsi del mondo SEO.
Proprio qualche giorno fa Rand Fishkin ha notato che stranamente mentre cercava delle informazioni ha avuto come suggerimento da Google Instant un Brand e non una keyword! Google ha associato prodotti/servizi a branded entities in maniera molto più evidente negli USA ma il cambiamento lo vedremo anche qui e fortunatamente nel nostro team ci lavoriamo già da quasi due anni in questa direzione  come ho illustrato al BeWizard (il video prima o poi arriverà).

 

Eccovi i riferimenti del brevetto di cui vi parlavo

Identifying central entities
Invented by Tomer Shmiel, Ziv Bar-Yossef, Alexander Sobol, Eran Ofek, Haran Pilpel, Eldad Barkai, Yossi Matias
Assigned to Google
US Patent 9,009,192
Granted April 14, 2015
Filed: June 3, 2011