Lenguaje de los hombres mapa del sitio htm. Una guía detallada del archivo Sitemap. Complemento de WordPress para mapas de sitios XML de Google

El archivo sitemap.xml es una herramienta que permite a los webmasters informar a los motores de búsqueda sobre las páginas del sitio que están disponibles para indexación. Además, en el mapa XML puede especificar parámetros de página adicionales: fecha última actualización, frecuencia de actualización y prioridad en relación con otras páginas. La información contenida en sitemap.xml puede influir en el comportamiento del rastreador de búsqueda y, en general, en el proceso de indexación de nuevos documentos. El mapa del sitio contiene directivas para incluir páginas en la cola de rastreo y complementa el archivo robots.txt, que contiene directivas para excluir páginas.

En esta guía encontrará respuestas a todas las preguntas relacionadas con el uso de sitemap.xml.

¿Necesito sitemap.xml?

Los motores de búsqueda utilizan el mapa del sitio para encontrar nuevos documentos en el sitio (pueden ser documentos html o contenido multimedia) a los que no se puede acceder mediante la navegación, pero que deben rastrearse. Tener un enlace a un documento en sitemap.xml no garantiza que será rastreado o indexado, pero en la mayoría de los casos el archivo ayudará a que los sitios grandes se indexen mejor. Además, datos de mapas XML se utilizan al definir páginas canónicas, a menos que se indique específicamente en la etiqueta rel=canonical.

Sitemap.xml es importante para sitios donde:

  • Algunas secciones no son accesibles a través del menú de navegación.
  • Hay muchas páginas aisladas o páginas mal conectadas.
  • Se utilizan tecnologías poco soportadas por los motores de búsqueda (por ejemplo, Ajax, Flash o Silverlight).
  • Hay muchas páginas y existe la posibilidad de que el rastreador de búsqueda pierda contenido nuevo.

Si este no es su caso, lo más probable es que no necesite sitemap.xml. Para sitios donde cada página importante para la indexación está disponible con 2 clics, donde no se utilizan para mostrar contenido Tecnologías JavaScript o Flash, donde se utilizan etiquetas canónicas y regionales si es necesario, y el contenido nuevo no aparece con más frecuencia de la que un robot visita el sitio, no es necesario un archivo sitemap.xml.

Para proyectos pequeños si solo hay un problema alto nivel anidamiento de documentos, se puede solucionar fácilmente con usando HTML mapas del sitio sin recurrir a usando XML tarjetas. Pero si decide que aún necesita sitemap.xml, lea esta guía en su totalidad.

Información técnica

  • Sitemap.xml es un archivo de texto en formato XML. Sin embargo, los motores de búsqueda también admiten el formato de texto (consulte la siguiente sección).
  • Cada mapa del sitio puede contener un máximo 50.000 direcciones y no pesar más 50MB(10 MB para Yandex).
  • Puede utilizar la compresión gzip para reducir el tamaño del archivo sitemap.xml y aumentar su velocidad de transferencia. En este caso, utilice la extensión gz (sitemap.xml.gz). Al mismo tiempo, se mantienen restricciones de peso para los mapas de sitio sin comprimir.
  • La ubicación del mapa del sitio determina el conjunto de URL que se pueden incluir en el mapa del sitio. El mapa que contiene las direcciones de las páginas de todo el sitio debe ubicarse en la raíz. Si el mapa del sitio está ubicado en una carpeta, entonces todas las URL de este mapa del sitio deben ubicarse en esta carpeta o más profundamente ().
  • Las direcciones en sitemap.xml deben ser absolutas.
  • La longitud máxima de la URL es de 2048 caracteres (1024 caracteres para Yandex).
  • Los caracteres especiales de la URL (como el signo "&" o las comillas) deben estar enmascarados en la entidad HTML.
  • Las páginas especificadas en el mapa deben mostrar un código de estado http 200.
  • Las direcciones que aparecen en el mapa no deben cerrarse en el archivo robots.txt ni en meta-robots.
  • El mapa del sitio no debe cerrarse en robots.txt; de lo contrario, el motor de búsqueda no lo rastreará. El archivo en sí puede estar en el índice, esto es normal.

Formatos de mapas XML

Los motores de búsqueda admiten un formato de mapa de sitio de texto simple, que simplemente enumera las URL de las páginas sin parámetros adicionales. En este caso, el archivo debe estar codificado en UTF-8 y tener la extensión .TXT.

Los motores de búsqueda también admiten el protocolo XML estándar. Google también admite mapas de sitio para imágenes, vídeos y noticias.

Un mapa del sitio de ejemplo que contiene solo una dirección.

https://сайт/ 2018-06-14 daily 0.9

etiquetas XML
conjunto de direcciones URL
URL(obligatorio): la etiqueta principal de cada URL.
loc(obligatorio) - URL del documento, debe ser absoluta.
última modificación- fecha de la última modificación del documento en formato Fechahora.
frecuencia de cambio- frecuencia de cambios de página (siempre, cada hora, diario, semanal, mensual, anual, nunca). El significado de esta etiqueta es una recomendación. motores de búsqueda, no como un equipo.
prioridad- Prioridad de URL relativa a otras direcciones (de 0 a 1) para el orden de escaneo. Si no se especifica, el valor predeterminado es 0,5.

Mapa XML para imágenes

Algunos optimizadores insertan enlaces a imágenes en sitemap.xml de la misma manera que enlaces a documentos HTML. Esto se puede hacer, pero es mejor que Google use una extensión. protocolo estándar y enviar junto con las URL información adicional sobre imágenes. La creación de mapas de imágenes XML es útil si es necesario escanear e indexar imágenes y, al mismo tiempo, el bot no puede acceder directamente a ellas (por ejemplo, se utiliza JavaScript).

Un ejemplo de un mapa del sitio que contiene una página y sus imágenes asociadas.

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

etiquetas XML
imagen:imagen(obligatorio): información sobre una imagen. Se puede utilizar un máximo de 1000 imágenes.
imagen:loc(obligatorio): ruta al archivo de imagen. Si se utiliza una CDN, entonces es aceptable vincular a otro dominio si se verifica en el panel para webmasters.
imagen: título- título de la imagen (puede contener texto extenso).
imagen: título- imagen del título (normalmente texto breve).
imagen: geo_ubicación- lugar de rodaje.
imagen: licencia- URL de licencia de imagen. Se utiliza para la búsqueda avanzada de imágenes.

Mapa XML para vídeo

De manera similar al mapa de imágenes, Google también tiene una extensión de mapa de sitio de videos donde puede especificar información detallada sobre el contenido de vídeo, que afecta la visualización en la búsqueda de vídeos. Un mapa del sitio de videos es necesario cuando el sitio utiliza videos alojados localmente y cuando la indexación de estos videos es difícil debido a las tecnologías utilizadas. Si está insertando un vídeo de YouTube en su sitio web, entonces no es necesario un mapa del sitio de vídeo.

Noticias Mapa del sitio

Si tiene contenido de noticias en su sitio y participa en Google News, es útil utilizar un mapa del sitio para las noticias, de modo que Google encuentre rápidamente sus materiales más recientes e indexe todos los artículos de noticias. En este caso, el mapa del sitio debe contener solo direcciones de páginas publicadas en los últimos 2 días y no más de 1000 URL.

Usando varias tarjetas

Si es necesario, puede utilizar varios mapas de sitio, combinándolos en un mapa de sitio índice. Se utilizan varios sitemap.xml en los casos en que:

  • El sitio utiliza varios motores (CMS).
  • El sitio tiene más de 50.000 páginas.
  • Es necesario configurar un seguimiento de errores conveniente en secciones.

En este último caso, todos sección grande El sitio tiene su propio sitemap.xml y todos se agregan al panel para webmasters, donde es conveniente ver qué sección tiene más errores (consulte la sección para encontrar errores en el mapa del sitio).

Si tiene 2 o más mapas de sitio, deben combinarse en un mapa de sitio de índice, que tiene el mismo aspecto que un mapa de sitio normal (excepto por la presencia de sitemapindex y etiquetas de mapa de sitio en lugar de urlset y url), tiene restricciones similares y solo puede vincular. a mapas XML normales (no a mapas de índice).

Ejemplo de índice de mapa del sitio:

http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

mapa del sitio índice(obligatorio): especifica el estándar de protocolo actual.
mapa del sitio(obligatorio): contiene información sobre un mapa del sitio independiente.
loc(obligatorio): ubicación del mapa del sitio (en formato xml, txt o rss para Google).
última modificación- hora del cambio del mapa del sitio. Permite a los motores de búsqueda descubrir rápidamente nuevas URL en sitios grandes.

Cómo crear un mapa del sitio.xml

Métodos de creación Mapa del sitio XML:

  • Herramientas CMS internas. Muchos CMS ya admiten la creación de mapas de sitios. Para averiguarlo, lea la documentación de su CMS, consulte los elementos del menú en el panel de administración o comuníquese con el soporte técnico del motor. Cargue el archivo https://yoursite.com/sitemap.xml en su sitio; es posible que ya exista y se esté generando dinámicamente.
  • Complementos externos. Si el CMS no tiene funcionalidad para generar un mapa del sitio y admite complementos, busque en Google qué complemento cubre la pregunta sitemap.xml para su motor e instálelo. En algunos casos, deberá ponerse en contacto con programadores para que le escriban un complemento similar.
  • Guión separado en el sitio. Conociendo el protocolo de mapas XML y las limitaciones técnicas, puede crear usted mismo sitemap.xml agregando un script de generación a CRON. Si no es programador, utilice los demás elementos de esta lista.
  • Generadores de mapas de sitio. Hay muchos generadores de sitemap.xml que escanean su sitio y le permiten descargar mapa listo. La desventaja aquí es que cada vez que se actualiza el sitio, es necesario generar manualmente un mapa del sitio.
  • Analizadores. Programas de escritorio diseñados para análisis técnico sitio, generalmente brindan la oportunidad de descargar sitemap.xml, generado en función de las páginas rastreadas. Funciona de manera similar a los generadores de mapas de sitios, solo que se ejecuta localmente en su máquina.

Generadores de mapas de sitios en línea populares

XML-Sitemaps.com

Le permite obtener sitemap.xml con unos pocos clics. Admite formatos XML, HTML, TXT y GZ. Cómodo de usar para sitios pequeños (hasta 500 páginas).

Un generador similar, pero tiene un poco más de configuración y te permite crear un mapa de hasta 2000 páginas de forma gratuita.

Tiene muchas configuraciones, le permite importar URL desde un archivo CSV. Escanea hasta 500 URL de forma gratuita.

No hay límites en la cantidad de páginas para escanear. Pero para sitios grandes, el proceso de generación puede congelarse durante varias decenas de minutos.

Programas locales para generar mapas de sitio XML.

Generador de mapas de sitio G-Mapper

Versión de escritorio gratuita del generador de mapas de sitio para Windows.

Araña SEO Rana Gritona

Herramienta flexible de generación de mapas de sitio con muchas configuraciones. Conveniente si ya usas Screamin Frog para otras tareas de SEO. Después de escanear el sitio, utilice el elemento del menú Mapas del sitio -> Crear mapa del sitio XML.

Araña pico de red

Menos flexible, pero aún solución conveniente para una generación rápida de sitemap.xml. Después de escanear el sitio, debe utilizar el elemento del menú Herramientas -> Generar mapa del sitio.

Archivo Sitemap.xml, igual que tarjeta normal El sitio es un conjunto de páginas formateadas en etiquetas XML. Al utilizar este archivo, los motores de búsqueda comprenden qué páginas de su sitio deben indexarse ​​primero.

Mapa del sitio en formato XML:

Cada opción tiene sus pros y sus contras. Ventaja clave mapas del sitio en formato XML: eliminando la posibilidad de difuminar el peso estático de las páginas dentro del sitio.

En este artículo te diré cómo componer. archivo correcto Mapa del sitio.xml.

Si ya sabe todo sobre la creación de un mapa del sitio, vaya directamente a último capítulo, que se llama "Chips".

1. Directivas del archivo Sitemap.xml

Hay 3 directivas obligatorias que se deben completar en cualquier caso, estas son etiquetas:

Y también 3 etiquetas opcionales:

Aquí hay un recordatorio sobre cómo decodificar cada etiqueta del sitio web oficial http://www.sitemaps.org/ru/protocol.html:

Atributo

Estado

Descripción

requerido

Encapsula este archivo y especifica el estándar de protocolo actual.

requerido

La etiqueta principal para cada URL. Otras etiquetas están subordinadas a esta etiqueta.

requerido

La URL de la propia página. Siempre comienza con un prefijo (por ejemplo, HTTP) y termina con una barra (si el servidor de su sitio lo requiere).

Tenga en cuenta: la longitud de la URL no debe exceder los 2048 caracteres.

opcional

Fecha en que se modificó el archivo por última vez. Especificado estrictamente en formato de fecha y hora W3C. Permite, si es necesario, ignorar el segmento horario y utilizar el formato AAAA-MM-DD.

opcional

Le permite especificar con qué frecuencia cambia la información de la página.

Este valor es aproximado.

Valores válidos:

  • siempre
  • cada hora
  • a diario
  • semanalmente
  • mensual
  • anual
  • nunca

Si la página cambia cada vez que se abre, utilice el valor "siempre". Si esta es una página de archivo, ponga nunca.

Tenga en cuenta que este atributo sirve como una pista para el robot de búsqueda, no como una regla. Por lo tanto, la relación entre este y la frecuencia real de visitas a la página por parte de un robot de búsqueda no es lineal.

opcional

Le permite especificar la prioridad de algunas páginas de su sitio sobre otras.

El rango de valores es de 0,0 a 1,0.

De forma predeterminada, a cada página se le asigna una prioridad de 0,5.

El valor del atributo funciona para comparar la prioridad de las páginas dentro de su sitio únicamente. Es decir, no afecta la comparación de su sitio con los sitios de la competencia en red de búsqueda. Además, establecer todas las páginas con la máxima prioridad tampoco tiene sentido. Porque entonces los valores serán los mismos para el robot y el atributo simplemente no funcionará. Así que no busque lagunas, sino indique prioridades objetivas para las páginas.

Guarde este recordatorio. Definitivamente te resultará útil al principio. Vale la pena señalar otra ventaja de un mapa de sitio XML: es flexible. La flexibilidad reside en la combinación de diferentes directivas opcionales.

Ahora que tiene claro qué es un mapa de sitio XML y conoce las directivas básicas de este archivo, puede continuar con su compilación.

2. Compilando el archivo sitemap.xml

Hay 3 formas de crear un mapa del sitio:

  • A mano;
  • Automáticamente, utilizando servicios especiales;
  • Automáticamente, utilizando soluciones listas para usar en forma de complementos para CMS, etc.

El proceso para preparar un mapa del sitio es el siguiente:

  • Creamos un mapa del sitio utilizando uno de los métodos enumerados anteriormente;
  • Comprobamos la validez mediante los servicios de un motor de búsqueda (https://webmaster.yandex.ru/sitemaptest.xml);
  • Colocamos el archivo en el sitio web;
  • Indicamos la ruta al mapa del sitio para los robots de búsqueda en el archivo robots.txt (por cierto, hay un artículo aparte sobre esto);
  • Indicamos el mapa del sitio en los paneles para webmasters de Yandex y Google.

Entonces, ¿cómo se crea un archivo de mapa del sitio?

Veamos un ejemplo de cómo compilar un archivo manualmente. Si desea agregar 5 páginas de su sitio al mapa del sitio:

Así es como debería verse el mapa del sitio en formato XML:

El código anterior indica al motor de búsqueda que la página es http://site.ru/

V último tiempo modificado el 1 de enero de 2005. Actualizado una vez al mes. Y la prioridad de esta página es 0,8 (el máximo posible es 1).

La funcionalidad de resaltar etiquetas emparejadas es especialmente conveniente.

Servicios para generar Sitemap

En caso de que su sitio tenga mucho paginas utiles y no quiere perder tiempo compilando un archivo manualmente, los siguientes servicios le ayudarán:

Hay muchos de estos servicios. Estoy usando https://www.xml-sitemaps.com/.

Permítanme explicarles brevemente todas las configuraciones:

motor de búsqueda sistema de google recomienda utilizar https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki

Complementos para CMS

Existe una gran cantidad de complementos y soluciones listas para usar para sistemas de administración de sitios web. Por ejemplo:

Complemento

Validez

Después de crear un mapa del sitio, debe verificar si hay errores. Para comprobarlo, utilice el servicio https://webmaster.yandex.ru/sitemaptest.xml

Después de una verificación exitosa, cargamos nuestro archivo en el sitio.

Ubicación del archivo

A diferencia del archivo robots.txt, el archivo sitemap.xml se puede ubicar en cualquier lugar de su sitio. Por ejemplo, en la carpeta raíz del sitio el archivo estará disponible en la siguiente dirección:

Si colocó el archivo en la carpeta /files/, estará disponible en esta dirección:

Después de descargar exitosamente un archivo, asegúrese de decirle a los robots de búsqueda cómo encontrarlo. Esto se hace de forma muy sencilla. En el archivo robots.txt() en la directiva Sitemap escriba dirección completa al archivo. Por ejemplo, un archivo robots.txt podría tener este aspecto:

¡Importante! A diferencia de robots.txt, puede haber varios archivos de mapa del sitio. En este caso, deberá indicar la dirección completa a todos los archivos de Sitemap en robots y webmasters.

Panel de Search Console y Yandex.Webmaster

Queda la última etapa. Especifique la ruta al mapa del sitio en los paneles para webmasters de los motores de búsqueda.

  • Configurar la indexación
  • Mapas del sitio
  • "Verificar" y "Agregar"

Hay limitaciones a tener en cuenta en el mapa del sitio XML:

  • Puede especificar un máximo de 50.000 URL en un archivo
  • El peso del archivo no supera los 10 megabytes (los motores de búsqueda no indexan documentos de más de 10 megabytes). Si es necesario, el archivo se puede comprimir utilizando el archivador .gzip.
  • La codificación de archivos es solo UTF-8

En este punto se completan las etapas principales. Sigue todo lo descrito reglas simples y no tendrás ningún error. La segunda parte del artículo está dedicada a más configuraciones detalladas, sutilezas y características de sitemap.xml, necesitará este conocimiento para compilarlo tarjeta profesional Sitio web para tiendas online.

3. Agrupación de mapas de sitio

Si supera el límite de 50.000 URL, deberá utilizar una estructura anidada y crear un grupo de varios Sitemaps. Es decir, ¡cree mapas de sitio dentro de un mapa de sitio!

Para un sitio web normal (no un portal grande o una tienda en línea), tal volumen de páginas es raro, por lo que la mayoría de los especialistas en SEO utilizan la agrupación de mapas de sitios por conveniencia, por ejemplo, para agrupar páginas o secciones de productos.

La sintaxis es la siguiente:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

Definición de etiquetas XML:

Atributo


Descripción

requerido

Encapsula información sobre todos los mapas del sitio en este archivo.

requerido

Encapsula información sobre un único archivo de mapa del sitio.

requerido

Especifica la ubicación del archivo del mapa del sitio.

opcional

Indica la hora de modificación del archivo Sitemap correspondiente. El robot utiliza esta información para comprender qué archivos de Sitemap han cambiado. Indirectamente, esta etiqueta permite al robot descubrir rápidamente nuevas páginas en el sitio.

Esto crea un mapa del sitio agrupado. Todos los demás procedimientos son los mismos que los descritos anteriormente. No olvides indicar en el archivo robots.txt, en la directiva Sitemap, el enlace correcto a tu archivo.

4. Investigación

A finales de 2014 realicé un pequeño estudio para analizar la efectividad de tener un archivo sitemap.xml en un sitio web.

Hubo un problema al indexar un grupo de productos en el sitio web de una tienda en línea (alrededor de 10.000 productos). Al mismo tiempo, nada impidió su indexación. Se compiló un archivo de mapa del sitio, que consta únicamente de enlaces a los productos del sitio. El mapa del sitio se actualizó automáticamente. En 2 meses, más del 70% de las URL se incluyeron en la base de datos indexada del motor de búsqueda Yandex. Una gran proporción de las páginas incluidas en el índice son páginas del mapa del sitio. Noto que en este periodo no se tomaron otras medidas para acelerar la indexación del sitio (por ejemplo, vinculación).

Aquí están los resultados en sí:

Conclusión: el mapa del sitio aún afecta la indexación de su sitio. Es necesario actualizar y actualizar periódicamente este archivo.

5. patatas fritas

Para que este artículo no resulte aburrido para los especialistas en SEO experimentados, le sugiero que se familiarice con los siguientes "trucos".

Mapa del sitio de imágenes

para atraer tráfico adicional desde los motores de búsqueda (quizás no convirtiendo completamente), puede crear un mapa del sitio adicional para imágenes.

La sintaxis de un mapa del sitio de imágenes se ve así:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://ejemplo.com/primer.html

http://ejemplo.com/kartinka.jpg

http://ejemplo.com/foto.jpg

Recordatorio sobre etiquetas XML:

¿Necesariamente?

Descripción

Contiene toda la información sobre una imagen. Cada URL (etiqueta) puede incluir hasta 1000 etiquetas.

URL de la imagen.

En algunos casos, el dominio de la URL de la imagen puede ser diferente del dominio utilizado por el sitio principal. Si ambos dominios están verificados en Search Console, no habrá problema. Pero si las imágenes se publican mediante un sistema de gestión de contenidos, p. servicio de google Sitios, debe verificar su sitio de alojamiento en Search Console. Además, el archivo robots.txt no debería impedir el rastreo del contenido que debe indexarse.

Pie de imagen.

Lugar de rodaje. Por ejemplo, Poronaysk, aproximadamente. Sajalín.

Título de la imagen.

URL de licencia de imagen.

Truco de vida para aquellos que terminaron de leer.

Muchos especialistas en SEO generan archivos de mapas del sitio una vez al inicio de un proyecto. Luego se olvidan del mapa del sitio. Las páginas estaban indexadas, bien. No, pero ¿qué puedes hacer? Generalmente se olvidan de agregar nuevas páginas al mapa del sitio.

En mi investigación, encontré que la mayoría de una manera conveniente la solución a este problema es archivo separado sitemap.xml, que contendrá solo aquellas páginas del sitio que aún no se han incluido en el índice.

Y esto es lo que permitió que más del 70% de las nuevas URL se incluyeran en el índice Yandex.

Se necesita un mapa del sitio exclusivamente para los motores de búsqueda. Al acceder a un sitio, el robot de indexación carga sitemap.xml y recibe una lista de páginas que deben agregarse a la base de datos. Para que al rastreador le resulte más fácil encontrar el mapa, se agrega un enlace al archivo robots.txt en las instrucciones. "Mapa del sitio:".

Además de la lista de páginas, el robot también recibe información sobre último cambio y prioridad. Esto le permite reducir el tiempo de escaneo y prácticamente eliminar errores.

EN últimas versiones Yandex Webmaster presta atención al mapa del sitio atención especial. Si está ausente o hay algún error, aparece un aviso.

Cree el sitemap.xml correcto

Hay tres opciones creando un mapa del sitio.xml - a mano, usando generador en línea y automáticamente usando complemento.

    Creación manual.

    El método más antiguo. El mapa se crea de la forma habitual. editor de texto y luego se guarda en formato xml. Todas las páginas, fechas y prioridades se seleccionan de forma independiente.

    Ventajas: Agregando al mapa solo lo que consideres necesario. “Confianza en cada línea”;

    Contras: Mucho trabajo. Existe la posibilidad de olvidar algo. Riesgo de errores de sintaxis;

    Usamos un generador en línea.

    Hay generadores en línea, que crean un mapa automáticamente. Son algo similares a un robot de indexación que rastrea el sitio y recopila páginas. Esto tiene en cuenta todas las instrucciones del archivo robots.txt. Como resultado, recibirá un archivo en formato .xml con todas las secciones cuya indexación no está prohibida.

    En este caso, las prioridades se establecen en función del anidamiento de la página. La fecha de cambio suele ser la misma para todos y corresponde a la hora de creación del mapa.

    A servicios similares Estos incluyen sitios como: www.mysitemapgenerator.com, www.cy-pr.com/tools/sitemap.

    Ventajas: Ahorra tiempo. Elimina errores de sintaxis;

    Contras: A menudo recoge mucha “basura” que no debería estar en el índice. Debe publicarse manualmente en el sitio;

    Usamos un complemento.

    Probablemente la forma más cómoda y técnicamente correcta. Su significado es que se instala un complemento/widget/módulo en el sistema de gestión, que genera automáticamente sitemap.xml.

    Ventajas: No es necesario descargar el mapa, se actualiza automáticamente cuando se crean nuevas secciones. Puede establecer manualmente la prioridad de cada página durante su creación. Fecha de modificación de página correcta;

    Contras: Los complementos no están disponibles para todos los CMS;

    Complementos similares incluyen mapas del sitio XML y feeds de Google News. (para WordPress)

Ahora echemos un vistazo más de cerca al proceso de creación de un mapa.

¡Presta especial atención! Si el sitio tiene una conexión segura, entonces la URL en el mapa del sitio debe ser https.

¿En qué consiste sitemap.xml?

Un mapa del sitio consta de datos xml estructurados y contiene varios parámetros.

  1. URL de la sección;

    Contiene etiquetas y es obligatorio para cualquier tarjeta.

  2. Fecha de última modificación;

    Contiene etiquetas y es un parámetro opcional.

  3. Frecuencia probable de cambio;

    Contiene etiquetas y es un parámetro opcional. Tiene varios significados: siempre, cada hora, a diario, semanalmente, mensual, anual Y nunca. Si traduce los significados del inglés, inmediatamente quedará claro cuál necesita.

  4. Prioridad;

    Contiene etiquetas y es un parámetro opcional. Toma valores de 1.0 a 0.1 .

Todos estos datos deben estar dentro de la etiqueta encapsuladora. , que indica el estándar de protocolo.

Después de que llegue la etiqueta anterior . Él es elemento padre para cada URL.

Se parece a esto:

https://сайт/ 2016-12-23 daily 1.0 https://сайт/perevod-na-https/ 2017-04-08 monthly 0.9

En el ejemplo, especificamos datos para dos URL específicas.

Que paginas agregar

Sólo necesitas añadir al mapa aquellas páginas que quieras ver en el índice. No se debe permitir que golpeen:

    URL duplicadas;

    páginas en blanco;

    secciones en desarrollo;

    otra "basura".

Si tiene dudas sobre si una página debería aparecer en la búsqueda, es mejor no colocarla en sitemap.xml.

¿Qué prioridades debo establecer?

Las prioridades se establecen según la "importancia" de las páginas dentro del sitio. Generalmente, páginas de destino tener la máxima prioridad (0,9-0,8). Las categorías se valoran más bajo porque no llevan información única. Su valor suele variar entre 0,7 y 0,5. Algo menos se da a archivos o registros que han perdido su relevancia.

No le dé a todas las páginas la misma prioridad. Esto no ayudará de ninguna manera a la indexación y no afectará las posiciones. Pero puedes "confundir" un poco al robot.

Lo que necesitas saber sobre la fecha de modificación de la página

La fecha en que se modificó la página es muy importante para el motor de búsqueda. En muchos sentidos, es por esto que se evalúa la relevancia del material. No debe ingresar la misma fecha para todas las páginas, como puede hacer un servicio en línea.

Incluya siempre la fecha real en que se actualizó el material.

El mapa del sitio o mapa del sitio es archivo especial(normalmente tiene la extensión XML), que contiene información sobre todas las páginas existentes en el sitio. Con este archivo, es posible dejar claro al motor de búsqueda qué páginas del sitio es recomendable indexar primero, con qué frecuencia se actualizan los datos de las páginas y la importancia de la indexación. páginas individuales sitio. Esto simplifica enormemente la indexación para los robots de búsqueda. Debe haber un archivo SiteMap en todos los sitios que consten de cincuenta páginas o más.

Cómo crear un archivo SiteMap en línea y agregarlo a su sitio

Dado que el mapa del sitio es un archivo xml, puede crearlo en formato de texto, usando cualquier editor y guardar con extensión xml. Sin embargo, los esfuerzos independientes no son en absoluto necesarios; servicios especiales, con la ayuda del cual puede generar de forma gratuita: cree automáticamente un archivo sitemap.xml en línea y agréguelo a cualquier sitio. Puedes ver el vídeo con más detalle sobre el proceso de creación de un archivo sitemap.xml:

Para creación automática mapa del sitio debe ingresar la dirección del sitio deseado en el campo correspondiente, seleccionar el formato de archivo apropiado, determinar la secuencia de indexación de las páginas en el sitio, indicar la frecuencia de actualización de las páginas y establecer otros parámetros que le interesen. Después de todas estas operaciones, debe hacer clic en el botón "ejecutar" y, después de un corto tiempo, el código para el mapa del sitio creado aparecerá en la ventana a continuación. Sólo necesitas copiar y pegar este código en el archivo que creaste en el editor. mapa del sitio.xml, guárdalo y cárgalo en directorio raíz su sitio.

Pero para que este archivo tenga el efecto esperado, no basta con crear y añadir un SiteMap a su sitio web, también es necesario transmitir información sobre su disponibilidad al robot de búsqueda. Para hacer esto, debe escribir la ruta en el archivo, agregando la línea:

Mapa del sitio: http://YASH_SITE.ru/sitemap.xml

Después de esto, se completan todas las operaciones y su mapa del sitio está listo para realizar sus funciones. Solo hay que recordar que en uno creado archivo xml no debe tener más de 50.000 páginas y su volumen no debe superar los 10 megabytes. De lo contrario, deberá crear otro archivo similar.

La presencia de este archivo indica a los robots de búsqueda exactamente cómo está organizada la estructura del sitio. En consecuencia, Yandex, Google, Bing y otros motores de búsqueda pueden indexar mejor el proyecto de Internet.

¿Por qué necesitas un mapa del sitio?

En la mayoría de los casos, expertos externos y enlace interno suficientes páginas para robots de búsqueda Conocí todos los contenidos del sitio. Al mismo tiempo, el uso de un mapa del sitio puede acelerar significativamente el proceso de indexación completa, especialmente si:

  • El recurso de Internet se creó hace relativamente poco tiempo y aún no puede presumir de un rico perfil de enlaces externos;
  • la estructura del sitio contiene numerosos archivos de documentos web que no están relacionados entre sí;
  • el proyecto tiene un gran número páginas, secciones, subsecciones;
  • En la estructura del recurso predominan las páginas dinámicas.

En todos estos casos, la indexación completa del sitio por parte de los motores de búsqueda puede estar en duda si el archivo Sitemap no se gestiona a tiempo.

Criterios básicos para crear un mapa del sitio

Existen varios requisitos básicos para crear un mapa del sitio que un webmaster siempre debe tener en cuenta.

En primer lugar , la cantidad de URL en el archivo del mapa del sitio no debe exceder las 50 mil unidades. Si hay más, entonces necesita crear varios Tarjetas individuales sitio, que están registrados en el archivo de índice del mapa del sitio.

En segundo lugar , tamaño máximo archivo – 10 MB. Si archivo sin comprimir excede este tamaño, se puede reducir usando un archivador zip .

En tercer lugar , el archivo Sitemap debe estar en el mismo dominio que el sitio web para el que se creó.

Cuatro , compilar un mapa del sitio requiere el uso de codificación UTF-8, así como letras latinas y números.

En quinto lugar , la respuesta del servidor a una solicitud del archivo de mapa del sitio debe ser un estado HTTP con el código 200 OK.

Formatos de mapa del sitio aceptables

Existe un requisito especial para el formato de archivo del mapa del sitio. Por lo tanto, se puede crear un mapa del sitio como un archivo XML, archivo de texto o vía RSS, mRSS y Atom 1.0. Al mismo tiempo, el formato más común reconocido por todos los motores de búsqueda es un archivo XML. Con su ayuda, puede informar a los motores de búsqueda no solo sobre la ubicación correcta de la página en la jerarquía del sitio, sino también:

  • sobre la frecuencia de actualización de un documento web en principio (atributo – frecuencia de cambio );
  • sobre la fecha de la última actualización de la página (atributo – última modificación );
  • sobre la diferente importancia de ciertas páginas de recursos (atributo - prioridad ).

Un ejemplo de mapa de sitio XML para un sitio, si constara de una página y contuviera las etiquetas mencionadas, podría verse así:

http://www.сайт/ 2016-03-21 daily 0.8

¿Cómo crear y dónde colocar un archivo de mapa del sitio?

Si lo desea, puede crear un mapa del sitio usted mismo (manualmente), lo que, sin embargo, parece una tarea que requiere mucha mano de obra. Por lo tanto, es mejor crear un archivo de mapa del sitio automáticamente recurriendo a los servicios. servicios gratuitos en línea como este o este.

Una vez que el mapa del sitio esté listo, el archivo debe colocarse en el directorio raíz. En este caso, el enlace que indica la ruta al archivo Sitemap a los buscadores podría ser el siguiente: http://www..xml

Agregar un mapa del sitio a los motores de búsqueda

Para que los robots de búsqueda conozcan el nuevo archivo del mapa del sitio lo más rápido posible, el webmaster debe realizar cambios en , agregando una directiva especial que indique la ruta exacta al mapa del sitio:

Mapa del sitio: http://www..xml

Además, archivo listo El mapa del sitio se verifica en busca de errores y se agrega a Yandex o Google usando Yandex.Webmaster o Consola de búsqueda de Google.

En resumen, cabe señalar que la presencia de un mapa del sitio correctamente compilado para un recurso web no es una garantía del 100% de que absolutamente todas sus páginas serán indexadas. este archivo– sólo una pista seria para los motores de búsqueda sobre cómo escanear más cuidadosamente su sitio.




Arriba