Página duplicada sin la etiqueta canónica. Configuración canónica: qué es, por qué y cómo. Con diferente clasificación de productos en el catálogo.

Enlace rel=canonical - atributo de etiqueta , que se utiliza para denotar páginas canónicas en el sitio web. ¿Qué son las páginas canónicas? Una página canónica es una página de un sitio cuya dirección es canónica (preferida), en un grupo de páginas con contenido similar. En pocas palabras, canónico URL de la página es la dirección que se indexará si está disponible.

Cuándo utilizar enlaces canónicos

  1. Para evitar la aparición de varios duplicados. Por ejemplo:
    • ordenar páginas: /*sort, asc, desc, list=*;
    • duplicados debido a etiquetas UTM: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
    • otras páginas con parámetros GET en la URL;
    • duplicados debido a características trabajo de cms(motor).

    En este caso es necesario agregar atributo rel=“canonical” a todas las páginas estáticas del sitio. Por ejemplo, para la página https://site.ru/category-1/page-2, rel=“canonical” se verá así: <relación de enlace= “canónico” href="https://site.ru/category-1/page-2" />

  2. Para páginas con contenido muy similar disponibles en diferentes URL. Por ejemplo, podrían ser páginas de una serie de un producto que se diferencia solo en el color, o páginas de un producto que se encuentra en varias categorías a la vez. En este caso, debe especificar rel=“canonical” en todas las páginas. la página principal y prioritaria.
  3. En páginas de paginación, si hay páginas "Mostrar todo" en las categorías del sitio. En este caso, en cada una de las páginas de paginación debe especificar la página "Mostrar todo" como página canónica. Por ejemplo, para la página https://site.ru/category-1/page-2 debe especificar. la URL canónica: ru/categoría-1/mostrar-todo” />

¿Cómo configurar direcciones canónicas rel=“canonical”?

Regístrate entre etiquetas de cualquier página HTML

Ésta es la forma principal. Para indicar un enlace canónico, escriba entre las etiquetas. en la página la URL completa de la página que debería estar en el índice.

Por ejemplo, para la página https://site.ru/*utm_content= https://site.ru/ será canónico.

Para obtener este resultado, en la página https://site.ru/*utm_content= especificamos la etiqueta:

ru/” />

Para reducir la probabilidad de errores en los elementos del enlace, utilice enlaces absolutos en lugar de relativos después del atributo rel="canonical".

En el archivo del mapa del sitio

En el mapa del sitio XML, puede ingresar la URL canónica (principal) de cualquier página.

En el encabezado HTTP

Se utiliza mejor para documentos que no son HTML. Por ejemplo, para archivos PDF.

En este caso, el servidor, al solicitar un archivo duplicado, deberá proporcionar un enlace al archivo original:

Enlace: ; rel=“canónico”

Este método es adecuado si tiene acceso a la configuración del servidor. No recomendado para documentos HTML.

Usando un complemento

Existen varios complementos para CMS que le permiten configurar una URL canónica. Por ejemplo:

  • para WordPress puedes configurar canonical usando Yoast SEO;
  • en OpenCart: implementado en la configuración de CMS (debe ir a la configuración del producto y configurar el parámetro URL de SEO);
  • Para configurar el atributo canónico en Joomla (versiones 3.x y superiores), debe habilitar la función SEF en la configuración del CMS. Después de encender paginas tecnicas como /index.php?option se añadirá el atributo rel=“canonical” (indicando la URL de la página con el CNC configurado).

Redirección 301 o rel=canónico

Si no hay factores que impidan la implementación, entonces usa esta opción. Recuerde que la instrucción enlace canónico es una recomendación para los motores de búsqueda. A menudo en resultados de google Puede encontrar clasificaciones de páginas no canónicas y el código de la página contendrá un enlace a la fuente.
El algoritmo del motor de búsqueda se basa no sólo en la búsqueda de un enlace canónico en el código de la página, sino también en muchos otros factores: la presencia de enlaces externos e internos, la relevancia para el usuario, etc. Por lo tanto, Google puede tener una opinión diferente sobre cuál de las páginas duplicadas debe considerarse original.
Si necesita dejar páginas accesibles para los usuarios o existen dificultades técnicas para implementar redireccionamientos 301 en el sitio, utilizar rel = canónico.

Errores comunes al usar rel=canonical

Las URL canónicas son compatibles con los motores de búsqueda más populares: Google, Yandex, Yahoo, Bing. Pero, ¿sigues viendo páginas no canónicas de tu sitio en el índice? Lo primero que debe hacer es verificar si se cometió un error al configurar rel=canonical. A continuación se muestra una lista de los errores más comunes:

Página canónica no indexable

Compruebe si el robot del motor de búsqueda puede indexar la página a la que está enlazando como canónica. Asegurar que:

  • la página devuelve la respuesta del servidor 200;
  • la página no tiene la metaetiqueta robots configurada en noindex;
  • la página no está bloqueada para que no pueda indexarse ​​en el archivo robots.txt.

Diferentes URL canónicas para una página

Muy a menudo, los módulos instalados en un sitio web añaden enlaces canónicos al código. Esto puede provocar que aparezcan varios rel=canonicals en una página. Si los enlaces en las etiquetas apuntan a URL diferentes, lo más probable es que Google y otros motores de búsqueda simplemente ignoren sus recomendaciones.
Por lo tanto, todos los esfuerzos por instalar páginas canónicas pueden quedar anulados. Vuelve a consultar con frecuencia código fuente de sus páginas para garantizar que solo haya un enlace canónico.

Uso incorrecto de referencias absolutas

Un error común es especificando un enlace canónico sin protocolo http:// o https://, como se muestra en el siguiente ejemplo:

< link rel = «canonical» href = «ururu.com/ololo.html» / >

< link rel = «canonical» href = «/ololo.html» / >

ya sea lleno camino absoluto con protocolo:

< link rel = «canonical» href = "http://ururu.com/ololo.html"/ >

Usando una etiqueta fuera del bloque principal

Para una correcta percepción por parte de los motores de búsqueda, especialmente Google, la etiqueta rel=canonical debe estar dentro del alcance jefe de código tu página. Además, esta etiqueta debe colocarse tan cerca de HTML superior código tanto como sea posible.

Enlaces canónicos desde las páginas de paginación a la primera página.

Esta solución es bastante capaz de combatir duplicados. Sin embargo, esto puede afectar negativamente a la indexación de páginas cuyos enlaces se encuentran en las páginas de paginación. Por ejemplo en la pagina http://ejemplo.com/vestidos.html?page=3 Hay enlaces a 20 productos; el robot de búsqueda no los indexará directamente a través de los enlaces de esta página.

La etiqueta canónica al usar hreflang

Si estás implementando hreflang en su proyecto, asegúrese de que todos los enlaces canónicos apunten a páginas en la misma versión de idioma. El incumplimiento de esta regla puede provocar problemas con la clasificación de las versiones lingüísticas y malentendidos por parte de los motores de búsqueda sobre las páginas duplicadas que tienen prioridad para la clasificación.

Enlaces no canónicos en sitemap.xml

Ayuda al robot de búsqueda a comprender qué páginas de su sitio deben indexarse ​​y clasificarse resultados de búsqueda. Es por eso que no debe agregar a su mapa del sitio ninguna página que esté cerrada a la indexación o que no sea canónica.

Usando rel=canonical para páginas no idénticas

Este atributo fue diseñado específicamente para indicar la página de prioridad entre las páginas duplicadas. Al parecer, los motores de búsqueda permiten cierto grado de discrepancia en el contenido de la página. Pero esto no significa en absoluto que pueda colocar un enlace canónico a una página que sea simplemente similar en tema.
Si Google te nota en uso correcto enlaces canónicos, esto puede afectar su relación con rel=canonical para todo su dominio y luego incluso las páginas configuradas correctamente se verán afectadas.

Enlaces canónicos (atributo etiqueta de enlace rel canonical) le permite especificar qué página de un grupo de similares o páginas idénticas necesita ser indexado. Utilidad de este instrumento difícil de sobreestimar y estúpido de ignorar. Después de todo, el SEO de un sitio web se reduce en gran medida a la interpretación correcta de las páginas del sitio web por parte de los motores de búsqueda. Además, los enlaces canónicos son compatibles con casi cualquier CMS moderno como Joomla o WordPress.

¡No dupliques contenido y pon los enlaces correctos!

El atributo rel="canonical" es una de las formas de combatir el contenido duplicado. Se coloca en cualquier página HTML entre etiquetas. . robots de búsqueda comenzar a considerar la página especificada en el atributo rel="canonical" como prioridad (canónica). La página canónica se mostrará en la búsqueda, se le transferirán enlaces y otras características de páginas con el mismo contenido.

Por lo tanto, si su sitio tiene contenido idéntico o muy similar disponible en diferentes URL, puede usar el atributo rel="canonical" para especificar la URL preferida para la indexación.

Cuándo utilizar enlaces canónicos

1. Prevenir la aparición de varios duplicados. Por ejemplo:

  • ordenar páginas: /*sort, asc, desc, list=*;
  • duplicados debido a etiquetas UTM: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
  • otras páginas con parámetros GET en la URL;
  • duplicados como resultado de las peculiaridades del CMS (motor).

En este caso, debe agregar el atributo rel="canonical" a todas las páginas estáticas del sitio. Por ejemplo, para la página https://site.ru/category-1/page-2, rel=“canonical” se verá así:

href="https://site.ru/category-1/page-2" />

2. Para páginas con contenido muy similar disponible en diferentes URL.

Por ejemplo, podrían ser páginas de una serie de un producto que se diferencia solo en el color, o páginas de un producto que se ubica en varias categorías a la vez.

En este caso, debe apuntar rel="canonical" de todas las páginas a la página principal prioritaria.

En este caso, en cada una de las páginas de paginación debe especificar la página "Mostrar todo" como página canónica.

Por ejemplo, para la página https://site.ru/category-1/page-2 debe ingresar la URL canónica:

ru /categoría-1/mostrar-todo” />

¿Cómo especificar la URL principal usando el atributo rel="canonical"?

Regístrate entre etiquetas de cualquier página HTML

Ésta es la forma principal. Para indicar un enlace canónico, escriba entre las etiquetas. en la página la URL completa de la página que debería estar en el índice.

Por ejemplo, para la página https://site.ru/*utm_content= https://site.ru/ será canónico.

Para obtener este resultado, en la página https://site.ru/*utm_content= especificamos la etiqueta:

ru /” />

¡Importante!
Para reducir la probabilidad de errores en los elementos del enlace, utilice enlaces absolutos en lugar de relativos después del atributo rel="canonical".

En el archivo del mapa del sitio

En el mapa del sitio XML, puede ingresar la URL canónica (principal) de cualquier página.

¡Importante!
El atributo rel="canonical" es una recomendación del motor de búsqueda, no una regla. En este caso, el PS podrá ignorarlos.

En el encabezado HTTP

Se utiliza mejor para documentos que no son HTML. Por ejemplo, para archivos PDF.

En este caso, el servidor, al solicitar un archivo duplicado, deberá proporcionar un enlace al archivo original:

Enlace: ; rel=“canónico”

¡Importante!
Este método es adecuado si tiene acceso a la configuración del servidor. No recomendado para documentos HTML.

Usando un complemento

Existen varios complementos para CMS que le permiten configurar una URL canónica. Por ejemplo:
— para WordPress puedes configurar canonical usando Yoast SEO;
— en OpenCart: implementado en la configuración del CMS (debe ir a la configuración del producto y configurar el parámetro URL de SEO);
— para configurar el atributo canónico en Joomla (versiones 3.x y superiores), debe habilitar la función SEF en la configuración del CMS. Una vez habilitado, el atributo rel=“canonical” se agregará a las páginas técnicas del formato /index.php?option (indicando la URL de la página con el CNC configurado).

¿Cómo comprobar si rel="canonical" está configurado correctamente?

Puedes realizar el análisis. programa especial para análisis de sitios SEO - .

Con este programa podrás ver:
— qué páginas del sitio no tienen el atributo rel=“canonical”;
— qué páginas tienen el atributo rel=“canonical” y qué páginas son canónicas para ellas;

Errores comunes al usar rel=“canonical”

— La URL canónica da un error 404.
— La URL canónica especificada está en otro dominio o subdominio.
- El enlace canónico no es indexable.
— Usar rel="canonical" desde las páginas de paginación hasta la primera página.

Para todas las páginas de paginación, es incorrecto designar la primera página como canónica. Esto hace que sea imposible indexar todas las páginas paginadas.

Para las páginas de paginación, debe especificar las mismas páginas que las canónicas.

Por ejemplo, la página https://site.ru/category-1/page-2 debe contener un enlace canónico:

.

— Varios enlaces rel=“canonical” desde una página.

Debe haber una página canónica por página, de lo contrario solo se tendrá en cuenta la primera URL.

- Diferentes URL canónicas.

Especifique las mismas páginas canónicas cuando de diferentes maneras implementación de atributos (por ejemplo, a través de un mapa del sitio XML y a través de rel="canonical" en la propia página).

Conclusión

El atributo rel="canonical" es conveniente y herramienta útil Para promoción en buscadores. Cuando se usa correctamente, aumentará la eficiencia del trabajo y acelerará la indexación del sitio, lo que, a su vez, afectará significativamente su clasificación.

No te pierdas los últimos artículos

Suscríbete a nuestro boletín

Más sobre el tema:

Natalia Bondarenko

optimizador SEO

He estado optimizando sitios web desde 2009. Me encantan los casos complejos que eran demasiado difíciles para los especialistas de otras empresas. Hago auditorías muy detalladas.

Escribo artículos instructivos para el blog de SiteClinic sobre herramientas y análisis de SEO.

Frase favorita: Para tener éxito, debes amar verdaderamente lo que haces.

Lo ideal sería que hubiera una versión para cada página. Pero, en realidad, a menudo sucede que el mismo contenido está presente en varios lugares de un sitio, así como en otros recursos. Para resolver el problema del contenido duplicado, se desarrolló una solución llamada “elemento de enlace canónico”, más conocido como atributo rel=”canonical”.

¿Cómo puede ayudar rel="canonical" a su promoción?

Este atributo elimina problemas relacionados con contenido duplicado. Establece la versión preferida de la página y envía señales, como enlaces, a esa versión de la página. Combina contenido duplicado que puede aparecer por los siguientes motivos:

  • HTTP y HTTPS
  • los mismos materiales en el subdominio www y en direcciones http habituales
  • opciones y navegación multiaspecto
  • ID de sesión
  • barra diagonal
  • índice/páginas predeterminadas
  • versiones pagina alternativa, como m. o páginas AMP o versiones impresas

Dónde agregar el atributo rel=canonical

La mayoría de los webmasters saben que el atributo se agrega a la etiqueta principal:

Pero no todo el mundo sabe que canonical también se puede enviar en el encabezado HTTP:

HTTP/1.1 200 OKEnlace: ; rel="canónico"

Se sabe que Google prefiere las páginas HTTPS como páginas canónicas a sus contrapartes HTTP; La excepción son los casos en los que hay señales contradictorias, según la ayuda de Search Console:

  • La página HTTPS tiene un certificado SSL no válido.
  • La página HTTPS contiene dependencias inseguras.
  • El acceso a la página HTTPS está denegado en el archivo robots.txt, pero no el acceso a la página HTTP.
  • La página HTTPS redirige a página HTTP.
  • Una página HTTPS apunta a una página HTTP utilizando el atributo rel="canonical".
  • La página HTTPS contiene la metaetiqueta noindex para robots.

Es un caso raro, pero aún posible, que debido a errores en el código, la sección del encabezado finalice antes de lo debido. Al mismo tiempo, canonical puede estar en el cuerpo del contenido, donde el motor de búsqueda no espera encontrarlo. Es aún peor cuando la mayoría de las herramientas (como Screaming Frog o Deep Crawl) no detectan este error. El problema sólo puede identificarse utilizando interfaz de software DOM ( modelo de objeto documento), por ejemplo, cuando se utiliza Inspect para Chrome Dev Tools

consideremos atributo canónico en Home Depot en la captura de pantalla a continuación. Puede ver que la sección del encabezado ha finalizado y parte del contenido que está en el encabezado cuando mira la fuente termina en el cuerpo cuando mira el DOM.

Cómo interactúa el atributo canónico con otros

El atributo canónico puede confundirse fácilmente. Permitir, por ejemplo, error gramatical, agregue una barra diagonal, especialmente cuando también hay paginación y . Si se indexa una página distinta a la que figura en la etiqueta, las páginas no se combinarán correctamente. Por ejemplo, el elemento canónico se establece en la segunda página de una lista numerada para la URL de la primera página. El atributo canónico no debe usarse con noindex.

Otros usos de canónico

El atributo canónico se puede utilizar para versiones alternativas sitio web (versión móvil y AMP). No es necesario cambiar específicamente estos atributos.

A menudo sucede que hay páginas duplicadas en el sitio que no se pueden eliminar ni redirigir 301 por diversos motivos.

Usando el atributo canónico rel en SEO

Comencé esta publicación con una situación de tarjetas de productos duplicadas en el sitio de uno de mis clientes. Este está lejos de ser el único caso de uso de canonical real en SEO. Muy a menudo se utiliza el atributo canónico rel para .

También suelen surgir diversas disputas y conceptos erróneos en los círculos de SEO con respecto a usando canónico sobre ella misma. Esto es lo que dijo Matt Cutts en una de sus entrevistas:

Es absolutamente normal que una página se vincule a sí misma con rel=canonical, y es absolutamente normal, al menos para Google, que rel=canonical aparezca en todas las páginas del sitio. La gente piensa que se puede utilizar de forma esporádica, pero no es así. Consideramos específicamente la situación en la que cada página del sitio contiene rel=canonical. Mientras te importe que te señalen paginas correctas, no habrá ningún problema.

Es decir, no hay nada terrible en esto, en muchos sitios de WordPress (incluido el mío) el rel canonical está configurado en sí mismo y las páginas se clasifican normalmente.

Redireccionamiento 301 o atributo canónico rel

La redirección 301 es una directiva OBLIGATORIA para ser tenida en cuenta por los motores de búsqueda, sin excepciones. Y lo canónico es una especie de "pista" sobre cómo comportarse el robot.

Por lo tanto, ¡es preferible utilizar una redirección 301!

Pero como en mi caso al principio del post, la plataforma SaaS no te permite cambiar Direcciones URL y configuré una redirección 301 en consecuencia, por lo que tuve que recurrir a la ayuda de canonical.

Es decir, canonical debe usarse en los casos en los que no existe viabilidad técnica hacer una redirección 301. Por cierto, Matt Cutts también habla de esto en la misma entrevista.

Finalmente, también quiero decir que se mostrarán todas las páginas, incluidos todos los duplicados, pero las páginas no canónicas se excluirán de la búsqueda.

PD Y para aquellos que no sepan quién es Matt Cutts, les aconsejo que vean este breve vídeo.

La etiqueta canónica (rel="canonical") es una herramienta bastante importante optimización de motores de búsqueda. A menudo es incluso mejor que una redirección 301 cuando se trata de contenido duplicado.

Veamos esta etiqueta con más detalle.

¿Qué hay de malo en el contenido duplicado?

El contenido duplicado son dos documentos que son idénticos en contenido. Cuando Google ve un duplicado, intenta excluirlo del índice porque En teoría, el usuario no querrá ver el mismo documento en los resultados de búsqueda varias veces. Y además, el propio motor de búsqueda no quiere procesar constantemente miles e incluso millones de páginas duplicadas, desperdiciando en ello su capacidad de producción.

El problema para el webmaster es que si la misma información está en diferentes paginas, entonces solo una de estas páginas aparecerá en los resultados. Pero la URL que elige Google no siempre es la más óptima para el usuario, ni siempre es la fuente original.

Hasta que el motor de búsqueda determine la fuente original, los resultados de la búsqueda no satisfarán los objetivos del autor original del contenido. EN en este caso etiqueta canónica tiene una utilidad limitada ya que aquellos que roban su contenido probablemente no lo etiqueten.

Por otro lado, si se produce una duplicación en su sitio, la etiqueta le resultará útil. Incluso si hay enlaces a contenido duplicado en su sitio, sólo la página fuente original será valiosa. Por lo tanto, incluso si hay enlaces a varios duplicados, Google sólo considerará importante una de estas páginas. Y no saldrá lastimado.

Naturalmente esto no es mejor solución desde el punto de vista SEO. Pero esto no dará lugar a ninguna sanción por parte de Google.

¿Qué es la etiqueta rel="canonical"?

La etiqueta tiene la siguiente sintaxis: De esta forma, Google y Bing entenderán que todos los duplicados enlazan a la dirección canónica especificada en la etiqueta. Google tiene una comprensión clara del uso de esta etiqueta:

Sí, rel="canonical" solo debe usarse para seleccionar la página preferida al duplicar (se aceptan pequeñas diferencias en el contenido).

En otras palabras, utilícelo únicamente para combatir el contenido duplicado. Si lo utiliza para otros fines, es posible que quede atrapado en búsquedas de spam.

Problemas de contenido duplicado

Implemente etiquetas adecuadamente en su sitio. Esto le evitará problemas de contenido duplicado, algunos de los cuales están relacionados con los sistemas de gestión de contenidos (CMS):

  1. Códigos de seguimiento. Algunos sistemas requieren que agregue variables al final de la URL para los vínculos de retroceso a su sitio. El formato podría ser: www.example.com?variable-de-seguimiento o este: www.example.com/example.htm?código-de-seguimiento. El problema es que motores de búsqueda direcciones separadas, incluso si difieren en un solo carácter. Aunque Google y Bing cuentan con tecnologías que ayudan a identificar este tipo de direcciones, todavía se producen muchos errores al procesarlas. Será interesante observar que algunas personas se vinculan a su sitio para recibir comentarios recíprocos. vínculo de retroceso usando este método. La etiqueta canónica te protegerá de esto.
  2. Prefijos de URL. Como ya hemos aclarado, dos direcciones cualesquiera que difieran en al menos un carácter se consideran páginas separadas. Y hay varios casos en los que los prefijos de direcciones pueden generar contenido duplicado. Estos incluyen, por ejemplo, idioma adicional sitio (ruso y versión en inglés páginas) o creación por el motor páginas adicionales(pronunciado en WordPress).
  3. Paginación. Esto es cuando el sitio se divide automáticamente en varias páginas con el mismo contenido. Por ejemplo, si tienes una tienda online y los productos se pueden ordenar por el color del producto o por su precio (en este caso, para el resultado de la clasificación, pagina separada con las mismas descripciones de producto).
  4. www. En general esto no es un problema porque... Google suele identificar correctamente las direcciones con y sin www. Pero todavía sucede que el motor de búsqueda indexa dos versiones del sitio (ejemplo.com y www.ejemplo.com). Como resultado, la mitad de su contenido está indexado con www y la otra mitad está indexada sin www. Por lo general, este asunto está escrito en robot.txt, pero la etiqueta canónica también puede ayudar aquí.
  5. Si es imposible implementar una redirección 301. Curiosamente, en algunos casos el webmaster no tiene la oportunidad de implementar una redirección 301, por ejemplo, debido a acceso limitado al servidor. La etiqueta canónica en este caso es una alternativa, con la única diferencia de que pagina de inicio seguirá existiendo.

Pero aún así, de acuerdo con la política de Google, la etiqueta canónica es una recomendación, no una regla obligatoria. Esta opción ayudará a los propietarios de sitios a indicar de forma independiente qué página Google debería considerar canónica. Esto facilitará que Google determine qué página incluir en el índice cuando se produzca contenido duplicado.




Arriba