BASI PER UN DESIGN SITO WEB E UNO SVILUPPO CHE SIA AMICO DEI MOTORI DI RICERCA
Uno dei principali limiti dei motori di ricerca risiede nel modo in cui analizzano il web e ne interpretano i contenuti. Un motore di ricerca non sempre vede una pagina web come la vediamo noi. In questa sezione ci concentreremo sugli aspetti tecnici del design sito web per creare un sito web (e modificare) in modo che la visione sia univoca per l’occhio umano quanto per gli algoritmi.
“Ho un problema di invisibilità. Ho creato un sito in Flash su panda che fanno i giocolieri, ma non riesco a trovarlo da nessuna parte cercando su Google. Perché?”
Design sito web: contenuti indicizzabili
Se vuoi posizionarti meglio nei motori di ricerca e migliorare l’ indicizzazione sito web, sarebbe meglio se i contenuti più importanti fossero in HTML. Immagini, file Flash, applet Java e ogni altro contenuto senza testo spesso viene ignorato e svalorizzato dai crawler, a dispetto dei continui miglioramenti alla tecnologia. Il modo più facile per assicurarti che le parole e le frasi che pubblichi siano visibili nei motori di ricerca è metterle in HTML. D’altra parte, esistono anche metodi più avanzati per coloro che intendono migliorare la formattazione o aggiungere contenuti visivi:
- Aggiungere testo alle immagini. Dai a tutte le immagini, a prescindere dal formato, un attributo alt in HTML, al fine di offrire ai motori di ricerca una descrizione del tuo contenuto;
- Integra la casella di ricerca con link facili da analizzare e a cui rimandare;
- Aggiungi plug-in Flash e Java con testo sulla pagina;
- Offri una trascrizione dei contenuti audiovisivi se le parole e le frasi usate in essi possono essere indicizzate.
Guardare il tuo sito con gli occhi dei motori di ricerca
Molti siti web incontrato spesso problemi nella scelta dei contenuti indicizzabili, quindi controllare due volte non può fare male. Usando strumenti come la cache di Google, puoi vedere quali elementi sono visibili e dunque indicizzabili. Guarda la cache di questa pagina. Quanto ti sembra diversa? Usando lo strumento cache di Google, possiamo vedere che, agli occhi di un motore di ricerca, la homepage di un sito può non contiene le informazioni che vediamo. Questo fa sì che i motori di ricerca abbiano più difficoltà a valutarne la rilevanza. Senza un testo HTML, questa pagina troverebbe molte difficoltà a posizionarsi nei risultati della ricerca. Vale la pena non solo controllare che i contenuti contengano effettivamente del testo, ma anche usare strumenti SEO (Search Engine Optimization) per controllare che le pagine che stai creando siano visibili ai motori di ricerca. Questa strategia si applica alle immagini, ma anche ai link.
Design sito web: gerarchia dei link
I motori di ricerca hanno bisogno di vedere i contenuti per poter indicizzare le pagine nei loro enormi database, questo è assodato. Per un corretto design sito web è altrettanto importante, una gerarchia dei link – una struttura ben definita che permetta ai crawler di individuare vie d’accesso al sito. Centinai di migliaia di siti commettono il banale errore di strutturare i loro backlink in un modo che i motori di ricerca non riescono a capire, il che gli impedisce di essere indicizzati.
I tag dei link contengono immagini, testo, o altri oggetti. Tutti questi rappresentano punti della pagina su cui è possibile cliccare, spingendo l’utente ad andare oltre. Questi link sono la pietra miliare della navigazione in Intenet, e sono meglio conosciuti come collegamenti ipertestuali.
Design sito web: moduli da compilare online
Se richiedi agli utenti di compilare un modulo online prima di accedere alcuni contenuti, è probabile che i motori di ricerca non vedranno mai quelle pagine protette. I moduli possono includere un accesso protetto da password o la richiesta di completare un sondaggio. In entrambi i casi, i crawler generalmente cercheranno di non offrire moduli come risultati, quindi qualsiasi contenuto o link che sarebbe accessibile tramite un modulo risulterebbe invisibile ai motori di ricerca.
Link contenuti in JavaScript che non possono essere analizzati
Se usi JavaScript per i link, potresti scoprire che i motori di ricerca o non analizzano o danno ben poco spazio ai link incorporati. Link HTML standard dovrebbero rimpiazzare JavaScript (o se non altro affiancarlo) su ogni pagina che vuoi venga visualizzata sui motori di ricerca.
Design sito web: i robot non usano i moduli di ricerca
Anche se questo fa direttamente riferimento al suddetto avviso sui moduli, è un problema così comune che vale la pena menzionarlo. Alcuni webmaster credono che se aggiungono una casella di ricerca al loro sito, i motori di ricerca saranno in grado di trovare tutto ciò che gli utenti cercano. Purtroppo, i crawler non eseguono ricerche per trovare contenuti, il che rende milioni di pagine inaccessibili e condannate all’anonimato fino a quando una pagina scansionata si collega a loro.
Collegamenti che puntano a pagine bloccate da tag Meta Robots o robots.txt
Sia il tag Meta Robots che il file robots.txt consentono al proprietario di un sito di limitare l’accesso dei crawler a una pagina. Fa attenzione, però: molti webmaster che hanno usato questa strategia per bloccare l’accesso ai robot rogue, hanno finito per scoprire che a quel punto il crawler non fa nemmeno più attenzione alla pagina.
Frame o iframe
Tecnicamente, i link in frame e iframe sono scansionabili, ma entrambi presentano problemi strutturali per i motori in termini di organizzazione e seguito. A meno che tu non sia un utente avanzato con una buona conoscenza tecnica di come i motori di ricerca indicizzano e seguono i link in frame, è meglio starne alla larga.
Collegamenti su pagine con molte centinaia o migliaia di link
I motori di ricerca eseguono la scansione di un numero determinato di link su una determinata pagina. Questa restrizione è necessaria per ridurre lo spam e mantenere i posizionamenti. Pagine con centinaia di link sono a rischio: non tutti i link presenti verranno analizzati e indicizzati.
I link possono avere molti attributi. I motori di ricerca li ignorano quasi tutti, fatta eccezione per l’attributo rel = “nofollow”. Aggiungere l’attributo rel = “nofollow” al tag link informa i motori di ricerca che i proprietari del sito non vogliono che questo link sia interpretato come approvazione della pagina a cui rimanda.
Nofollow, preso alla lettera, ordina ai motori di ricerca di non seguire un link (anche se alcuni lo fanno). Il tag nofollow è nato come metodo per aiutare a bloccare commenti automatici di un blog, guest book, e link spam, ma si è trasformato nel tempo in un modo per dire ai motori di screditare qualsiasi valore di collegamento che normalmente sarebbe passato per importante. I link taggati con nofollow sono interpretati in modo leggermente diverso da ciascuno dei motori, ma è chiaro non hanno lo stesso peso di quelli normali.
Design sito web: i link nofollow sono cattivi?
Sebbene non abbiano lo stesso valore dei loro cugini più seguiti, i link nofollow sono parte naturale di un profilo di collegamento diverso. Un sito web con molti link in entrata accumulerà molti link nofollow, e non è una brutta cosa.
Google afferma che nella maggior parte dei casi, loro non seguono i link nofollow, né gli lasciano valore legato a PageRank o all’anchor text. In sostanza, usare link nofollow fa ignorare a Google il link di destinazione quasi del tutto. I link nofollow non hanno peso e sono interpretati come testo HTML (come se il collegamento non esistesse). Detto questo, molti webmaster credono che anche un link nofollow proveniente da un sito particolarmente autorevole, come ad esempio Wikipedia, potrebbe essere interpretato come un segno di fiducia.
Bing, che alimenta i risultati di Yahoo, ha anche affermato che non includono link nofollow nel quadro generale del sito, anche se i loro crawler possono comunque sfruttare i collegamenti nofollow come un modo per scoprire nuove pagine. Così anche se magari seguono questi link, non ne tengono conto nei calcoli per il posizionamento.