Tutto sulle sitemap

Se ho un sito mi serve una sitemap?

La risposta breve è: probabilmente no, forse sì.

Che strumenti ci sono per produrla senza spenderci tempo? Tutto quello che c’è da sapere per cinque minuti del tuo tempo, leggi di seguito…

Che cos’è una sitemap?

In parole semplici, una sitemap è un file che elenca tutte le pagine del vostro sito.

Questo sistema è stato inventato per consentire ai motori di ricerca come Google quali sono le pagine del vostro sito che vanno indicizzate, ovvero che vorreste apparissero nei risultati di ricerca.

Quando serve una sitemap?

Se il tuo sito è strutturato in modo corretto e non ha contenuti accessibili solo in modo indiretto ovvero tramite script, moduli di ricerca, o pagine interne difficilmente raggiungibili, allora una sitemap in realtà non ti serve, anche se ti può dare qualche vantaggio.

Vediamo, però, quando serve davvero.

Prendiamo come esempio questo sito che genera contenuti dinamicamente, qui la pagina che mostra le offerte per acquistare telefoni cellulari NOKIA si può raggiungere soltanto facendo una ricerca per parola chiave, ad esempio:

In questo caso come farà mai Google a “vedere” tutte le pagine che il sito offre? Non può certo escogitare tutte le possibili marche, modelli e varianti di cellulari… Google non può nemmeno “cliccare” sul pulsante di ricerca! Ecco, in questo caso può venire in aiuto la Sitemap.

Attenzione però, questo è un caso limite ipotetico, presentato qui per chiarire il concetto:se in un sito tutti i contenuti si raggiungono tramite link interni. La sitemap è comunque utile se questi link interni si trovano in pagine interne non immediatamente raggiungibili (è un caso molto frequente).

[ad name=”728×90″]

Come è fatta una sitemap

La sitemap andrebbe scritta in un file secondo regole ben precise (Sitemap Protocol) e ha più o meno quest’aspetto:

 

Ovviamente nessuno si vorrebbe mettere a scrivere a mano un file del genere. Più sotto vediamo come produrla in automatico. Vediamo prima però quali vantaggi offre.

I vantaggi

  • Per i siti che offrono contenuti dinamici (per esempio, un catalogo di prodotti generato grazia a un database), se questi non sono direttamente accessibili da link interni, grazie alla sitemap i motori di ricerca potranno “vederli” e quindi indicizzarli. Ne risulta che poi questi contenuti appariranno nei risultati delle ricerche, che è quello che normalmente si vuole.
  • Per i siti in cui i contenuti dinamici sono comunque raggiungibili da link interni la sitemap non è necessaria. Tuttavia, essa garantisce in qualche modo che tutte le pagine siano immediatamente visibili al motore di ricerca, il quale normalmente inizia a visitare e indicizzare il sito da una pagina, e poi procede nelle visite successive visitando i link uno dopo l’altro e aggiungendo le pagine al suo database. In pratica, si può raggiungere prima il risultato e avere il massimo numero di pagine indicizzate in minor tempo.
  • Infine (non da ultimo), se indichi la tua sitemap al servizio Google Webmaster Tools, puoi sapere istantaneamente e esattamente quante pagine ha il tuo sito e soprattutto quante di queste sono state indicizzate ovvero quante possono essere effettivamente trovate dal pubblico nelle ricerche su Google:

Ora che abbiamo capito a che serve, vediamo come ottenerla senza impazzire.

[ad name=”468×60″]

Strumenti per produrre la sitemap

Partiamo dallo strumento che ritengo da evitare, giusto perchè nelle pagine guida di Google viene indicato a volte con troppa insistenza, facendo pensare a torto che sia lo strumento migliore:

  • Google Sitemap Generator – Questo strumento si basa sull’assunto (tutto da verificare) che il vostro sito sia composto esclusivamente da file statici contenuti in una cartella (e relative sottocartelle). Ora, sarà dal 1995 che non vedo più un sito fatto in questo modo. Consiglio di evitarlo.
  • Google XML Sitemaps plugin for WordPress – Solo per chi usa WordPress, è secondo me la soluzione migliore. Va benissimo se non avete pagine dinamiche generate da plugin particolari. Esistono plugin (es. Global Translator) in grado di integrarsi con questo, segno che è ritenuto uno strumento di riferimento.
  • Sitemap Generator (Pyton) di Vladimir Toncar – Se hai possibilità di eseguire script sul server (molti web provider di qualità, come questi, offrono questa possibilità) allora la sitemap può essere generata con questo script scritto nel linguaggio Python. Esso esegue una visita sistematica del sito, proprio come farebbe Google, e annota nella sitemap tutte le pagine che trova.

Ovviamente questo non risolve il caso dei contenuti non accessibili tramite link interni, ma come si diceva più sopra, questo rappresenta un caso limite.

Puoi programmare questo script in modo che generi la sitemap ogni notte (usando Cron) e così sarà sempre aggiornata.

Il comando da usare per lanciare lo script è qualcosa del tipo:

Non è necessario che lo script sia installato sullo stesso server che ospita il sito: si può usare un altro server e poi trasferire la sitemap, ovviamente quest’ultimo passo rappresenta una fatica in più.

  • phpSitemapNG di Enarion – Se non hai possibilità di eseguire script dalla shell del server, puoi ripiegare su questa applicazione web realizzata interamente in PHP. Si attiva dunque via web, per usarlo è sufficiente caricare il tutto sul tuo spazio web e aprirlo con il link, qualcosa del tipo http://www.miosito.it/phpSitemapNG/. Infine, segui le istruzioni a video e lasciare aperto il browser fino a che non ha finito. Raccomando di fare attenzione con siti molto grossi, mi è capitato di vederlo andare in ciclo infinito. Per questa ragione evito di usarlo quando posso.
  • Xenu link Sleuth – Per chi non può usare altri sistemi, consiglio questo programma per Windows alla portata di tutti. E’ gratuito, e oltre a controllare la presenza di link non funzionanti (cosa utilissima, andrebbe fatto regolarmente) vi produce la sitemap che poi andrà trasferita.

[ad name=”728×90″]

Tutti questi strumenti, a parte il primo, si basano sul metodo della visita sistematica delle pagine del sito. Se il sito produce contenuti dinamici non accessibili direttamente rimane, come unica alternativa, la generazione della sitemap con un programma sviluppato appositamente, che si baserà sulla logica con cui il sito costruisce i contenuti dinamici e i vari URL.

Conclusioni

Abbiamo visto che cos’è una sitemap, che è utile nella quasi maggioranza dei casi ma che spesso non è indispensabile averla, e che esistono numerosi strumenti per produrla senza fatica, possibilmente in automatico ogni notte.

Link utili

Pagina Google Strumenti per la generazione di Sitemap – Ciò che riporta Google a riguardo, vale sempre la pena di dare un’occhiata, per completezza.