Progetto 50PDA Studiare il Comportamento di un Bot SEO

Simulazione di un programma Bot SEO che imita il comportamento umano

Il progetto 50PDA è uno studio per confrontare la macchina SEO con il comportamento umano. Per fare questo si può usare il “Reverse Engineering” con un’ipotesi da sviluppare sui dati forniti dal 50PDA stesso

 

Da wikipedia:

L’ingegneria inversa in informatica è, per definizione,

“Il processo di analisi di un sistema software esistente, eseguito al fine di crearne una rappresentazione ad alto livello di astrazione.”

Sono parole difficili per indicare una volontà determinata a capire il funzionamento di qualcosa che ci interessa particolarmente o che ci riguarda molto da vicino.

L’influencer che più mi ha ispirato in questo progetto è stata Cinzia Di Martino, una informatica, che dice: “Studia, sperimenta, personalizza, sbaglia”.

Scrivo questo articolo mentre si parla e si scrive molto della Singolarità tecnologica, cioè del momento in cui un software molto evoluto avrà a disposizione una quantità enorme di dati (Big Data) memorizzati su sistemi informatici in rete, tale da poter elaborare un ragionamento completo e autonomo dall’essere umano.

Si, no e forse.

Per il momento mi limito ad affermare che un programma ha delle difficoltà a comprendere la semantica di un linguaggio e interpretare correttamente una frase come: “dalla parte dei bottoni”. Oppure, potrà elencare una serie di significati possibili, ma avrà comunque dei problemi ad individuare quello giusto. Le ricerche e le aspettative degli utenti si sono evolute nel corso degli anni, introducendo i termini intento, contesto ed entità, come ha chiaramente illustrato il blog Tagliaerbe con l’articolo sulla Google Semantic Search.

Mi pongo più concretamente, ora, la stessa domanda sull’effettiva “intelligenza” e autonomia del Robot o Bot SEO nel preparare le risposte per gli utenti.

 

L’importanza del Menu principale

Il progetto 50PDA fondamentalmente riguarda i contenuti dei siti web e la loro effettiva fruibilità da parte dell’utente che come già sappiamo è il principale obiettivo della SEO.

In questo articolo non si parla di tecniche per condizionare Google (giammai oserei provarci!) o di una densità ideale e precisa delle keyword contenute nelle pagine, ma d’immaginare su quali elementi necessariamente numerici “ragiona” un programma SEO (spider, crawler) che cerca sul web informazioni utili per gli utenti.

L’ipotesi sulla quale intendo procedere è questa:

Il Bot SEO esamina un sito web e cerca una chiara e veloce corrispondenza tra l’interfaccia utente, ovvero il Menu principale, e le keyword dichiarate e quantificate con le relative tecniche utilizzate a livello di programmazione, quindi non visibili dall’utente.

Il nome “50 Persone Da Ascoltare” a prima vista può sembrare un plagio del film “50 sfumature di grigio”, anche se “ascoltare” è un verbo, un’azione, mentre “grigio” è soltanto un colore.

Il 50PDA è osservazione di un fenomeno per estrapolare un principio di funzionamento.

Per dare, possibilmente, un valore scientifico al progetto ho rispolverato la statistica inferenziale, cercando di definire un campione abbastanza ampio e significativo. 50 influencer che seguo mi è sembrato un numero giusto per individuare una frequenza numerica, un comportamento statistico, un processo da ribaltare sul Bot SEO.

Il procedimento prevede un accesso via browser alla home page di ogni sito per individuare quali sono gli argomenti rivolti all’utente, da individuare e memorizzare su di uno schema entro un tempo massimo di 10 secondi.

Ecco un esempio di schema:

Nome Cognome Spec. 1 Spec. 2 Sito 1 Sito 2 Sito 3 Menu sito 1
Alpha Bravo Specializzazione https://alphabravo.com/ Alpha + Bravo + Charlie

Può sembrare una semplificazione eccessiva, ma gli argomenti trascritti nella colonna Menu sito 1 devono essere necessariamente brevi e sintetici, come si addice ad un programma…

Ed ecco che entra in gioco la Soggettività umana di chi compie il processo per determinare il risultato, l’Indice S 50PDA.

 

La corrispondenza e la quantificazione delle keyword

Contestualmente, immaginiamo che il Bot SEO passa ad esaminare la parte nascosta all’utente (Page title, Meta keywords, Meta description), per trovare corrispondenza con quanto rilevato nel Menu principale;

in questa fase per ognuna delle home page dei siti si utilizza un tool gratuito per rilevare le keyword presenti con relativa quantità e densità

Per ogni sito web quindi si estrapolano le keyword a parola singola, a due e a tre parole combinate, con relativo conteggio delle ricorrenze e densità. Siccome i dati sono veramente tanti, è utile averli in ordine discendente (dal più grande al più piccolo) di conteggio e quindi di densità.

Nell’ipotesi di questo articolo, si limita l’attenzione alle prime 10 righe di ogni elenco o colonna di risultati (parola singola, a due e a tre parole) e per ognuna delle tre colonne si sceglie solo una keyword, quella più significativa pensando allo schema precedente ottenuto dall’esame del menu principale.

Anche in questa fase, la Soggettività di chi compie il processo è determinante. Il nuovo schema si presenta come segue:

K1 nr K1 % K1 K2 nr K2 % K2 K3 nr K3 % K3
 alpha 11 3,20 alpha bravo 6 3,49 charlie delta echo 2 1,74

 

La base dati per il calcolo dell’indice S 50PDA

Le 150 combinazioni di keyword-conteggio-densità ottenute, tre per ogni sito web, sono un numero troppo elevato di dati.

Nell’ipotesi del progetto 50PDA per il Bot SEO occorre un elemento numerico ulteriore, ottenuto per calcolo da questi primi risultati, che ho chiamato grezzi di primo livello, per trovare una frequenza valida ai fini statistici.

Nel prossimo articolo sono stati illustrati i passaggi successivi per l’elaborazione dell’Indice S 50PDA.

I dati ispirano la direzione della creatività.

Luca Cavalli
Luca Cavalli

Immagine in evidenza: Tosy Topio 3.0 – A Ping-Pong-Playing Terminator

Condividi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *