Que son los sitemaps y el porqué de su importancia

Como ya sabéis Google es el indiscutible rey de internet y muchas veces habréis oído eso de si no estás en google no estás en internet o si no existes en para google no existes en internet.

Pues bien para remediar estas situaciones y / o aumentar nuestra visibilidad en la web podemos realizar algunas acciones que al final lo que buscan es que los crawlers o arañas de los buscadores, accedan a nuestro sitio con una periocidad adecuada e indexen todas nuestras urls de forma eficiente y correcta.

Una de las acciones que podemos realizar es crear un sitemap ya que con un pequeño esfuerzo vamos a obtener una gran ganancia.

Qué son los sitemaps y para que se usan

Los sitemaps son unos archivos donde se listan todas las urls de nuestro sitio y su función es ayudar a los usuarios a encontrar la información que buscan.

Aunque estemos hablando de google, la finalidad real del sitemap es que nuestros posibles usuarios accedan a la información de forma sencilla, y para conseguir esto, vamos a depender de la correcta indexación de las páginas de nuestro sitio, así que la otra función que nos aporta el sitemap es garantizar que los buscadores conocen todas las páginas de tu sitio, incluyendo urls que quizás no se podrían cubrir, por medio de los procesos de rastreo habituales.

Cuando tenemos que utilizar un sitemap (como acción SEO)

Los sitemaps son útiles si no encontramos con:

  • Un sitio web con contenido dinámico.
  • Su sitio contiene páginas que los crawlers o arañas no pueden descubrir fácilmente durante el proceso de rastreo como, por ejemplo, las páginas que presenten AJAX o Flash enriquecido.
  • Su sitio es nuevo y pocos enlaces llevan a él. Los crawlers o arañas rastrean la Web siguiendo los enlaces de una página a otra, de modo que si los enlaces de su sitio no funcionan correctamente, podemos tener problemas para descubrirlo.
  • Tenemos una gran cantidad de páginas que no se linkan entre sí.

Además, el sitemap, puede proporcionarle información adicional a los buscadores como:

  • Frecuencia con la que se modifican las páginas del sitio. Por ejemplo, una página de noticias, puede modificarse todos los días, sin embargo, el quienes somos o acerca de, es mucho menos tendente a estas modificaciones.
  • Fecha de última modificación de cada página.
  • La importancia de una página dentro del sitio en función de la url de la página.

Tener un sitemap no te va a garantizar que salgas en primera página ni siquiera que se indexen tus páginas (aunque lo normal es que esto siempre ocurra), pero sí que es verdad que le vas a facilitar el trabajo a los robots y además tu sitio no se va a ver penalizado por contener uno.

Como crear un sitemap

Como os podéis imaginar, hay varios tipos de sitemaps, aunque ahora vamos a explicar en que se basa el de formato XML ya que seguramente es el más eficiente.

Yahoo, Google y Microsoft, llegaron a un acuerdo y definieron como formato estándar el 0.90 así veamos cómo podemos construir un sitemap XML que respete este formato.

El formato del protocolo Sitemap consta de etiquetas XML. Todos los valores de datos de un Sitemap deben incluir caracteres de escape. El propio archivo debe estar codificado en UTF-8.

El Sitemap debe:

  • Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>.
  • Especificar el espacio de nombres (protocolo estándar) en la etiqueta urlset.
  • Incluir una entrada <url> para cada dirección URL como una etiqueta XML principal.
  • Incluir una entrada secundaria <loc> para cada etiqueta principal <url>.

Veamos un ejemplo:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://adeshoras.wordpress.com/</loc&gt;
</url>
<url>
<loc>https://adeshoras.wordpress.com/acercade.htm</loc&gt;
</url>
</urlset>

A parte de estos contenidos obligatorios, existen unos contenidos opcionales (como hijos del nodo url) que van a aportar información para que la indexación se realice de forma más eficiente.

Los nodos opcionales más importantes son:

<lastmod>fecha</lastmod>

Indica la fecha  (en formato AAAA-MM-DD) de la última modificación de la página que figura en el loc.

<changefrec>Frec</changefrec>

Indica la frecuencia de actualización de la página. Con este parámetro, le podemos indicar a los crawlers o arañas cada cuanto tienen que pasar por nuestro sitio, y además aunque es bueno cumplirlo, tampoco nos obliga a hacerlo.
Los valores que puede adoptar son:

  • Always: páginas dinámicas que cambian cada vez que se muestran.
  • Hourly: páginas que cambian cada hora.
  • Daily: páginas que cambian diariamente.
  • Weekly: páginas que cambian semanalmente.
  • Monthly: páginas que cambian mensualmente.
  • Yearly: páginas que cambian anualmente.
  • Never: páginas que nunca cambian.

<priority>Valor</priority>

Importancia que tiene la página respecto a las demás que componen el sitio web.

Ahora volvamos a ver el ejemplo de antes pero más completo:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://adeshoras.wordpress.com/</loc&gt;
<lastmod>2008-06-21</lastmod>
<changefrec>weekly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>https://adeshoras.wordpress.com/acercade.htm</loc&gt;
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>

Vuestro sitemap, lo podéis validar con el esquema que proporciona sitemaps.org y lo tenéis aquí.

Y para terminar, un detalle, Google, cumple con el estándar nombrado anteriormente, pero aun así también soporta el uso de sitemaps especializados para determinados contenidos. Estos formatos no los utiliza ningún otro motor de búsqueda y resultan de gran utilidad para indicarle a Google información detallada para contenidos específicos. Mi opinión es que siempre nos deberíamos ceñir a los estándares.

Enlaces relacionados

Un pensamiento en “Que son los sitemaps y el porqué de su importancia

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s