Posted by: César on: Junio 21, 2008
Como ya sabéis Google es el indiscutible rey de internet y muchas veces habréis oído eso de si no estás en google no estás en internet o si no existes en para google no existes en internet.
Pues bien para remediar estas situaciones y / o aumentar nuestra visibilidad en la web podemos realizar algunas acciones que al final lo que buscan es que los crawlers o arañas de los buscadores, accedan a nuestro sitio con una periocidad adecuada e indexen todas nuestras urls de forma eficiente y correcta.
Una de las acciones que podemos realizar es crear un sitemap ya que con un pequeño esfuerzo vamos a obtener una gran ganancia.
Los sitemaps son unos archivos donde se listan todas las urls de nuestro sitio y su función es ayudar a los usuarios a encontrar la información que buscan.
Aunque estemos hablando de google, la finalidad real del sitemap es que nuestros posibles usuarios accedan a la información de forma sencilla, y para conseguir esto, vamos a depender de la correcta indexación de las páginas de nuestro sitio, así que la otra función que nos aporta el sitemap es garantizar que los buscadores conocen todas las páginas de tu sitio, incluyendo urls que quizás no se podrían cubrir, por medio de los procesos de rastreo habituales.
Los sitemaps son útiles si no encontramos con:
Además, el sitemap, puede proporcionarle información adicional a los buscadores como:
Tener un sitemap no te va a garantizar que salgas en primera página ni siquiera que se indexen tus páginas (aunque lo normal es que esto siempre ocurra), pero sí que es verdad que le vas a facilitar el trabajo a los robots y además tu sitio no se va a ver penalizado por contener uno.
Como os podéis imaginar, hay varios tipos de sitemaps, aunque ahora vamos a explicar en que se basa el de formato XML ya que seguramente es el más eficiente.
Yahoo, Google y Microsoft, llegaron a un acuerdo y definieron como formato estándar el 0.90 así veamos cómo podemos construir un sitemap XML que respete este formato.
El formato del protocolo Sitemap consta de etiquetas XML. Todos los valores de datos de un Sitemap deben incluir caracteres de escape. El propio archivo debe estar codificado en UTF-8.
El Sitemap debe:
Veamos un ejemplo:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://adeshoras.wordpress.com/</loc>
</url>
<url>
<loc>http://adeshoras.wordpress.com/acercade.htm</loc>
</url>
</urlset>
A parte de estos contenidos obligatorios, existen unos contenidos opcionales (como hijos del nodo url) que van a aportar información para que la indexación se realice de forma más eficiente.
Los nodos opcionales más importantes son:
Indica la fecha (en formato AAAA-MM-DD) de la última modificación de la página que figura en el loc.
Indica la frecuencia de actualización de la página. Con este parámetro, le podemos indicar a los crawlers o arañas cada cuanto tienen que pasar por nuestro sitio, y además aunque es bueno cumplirlo, tampoco nos obliga a hacerlo.
Los valores que puede adoptar son:
Importancia que tiene la página respecto a las demás que componen el sitio web.
Ahora volvamos a ver el ejemplo de antes pero más completo:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://adeshoras.wordpress.com/</loc>
<lastmod>2008-06-21</lastmod>
<changefrec>weekly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>http://adeshoras.wordpress.com/acercade.htm</loc>
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>
Vuestro sitemap, lo podéis validar con el esquema que proporciona sitemaps.org y lo tenéis aquí.
Y para terminar, un detalle, Google, cumple con el estándar nombrado anteriormente, pero aun así también soporta el uso de sitemaps especializados para determinados contenidos. Estos formatos no los utiliza ningún otro motor de búsqueda y resultan de gran utilidad para indicarle a Google información detallada para contenidos específicos. Mi opinión es que siempre nos deberíamos ceñir a los estándares.
Enlaces relacionados
Julio 4, 2008 a 12:38 pm
Tras un comentario de uno de mis compañeros de trabajo, aqui os dejo el link del sitemap de este blog.
sitemap de adeshoras