¿Qué es una etiqueta canónica? El atributo rel="canonical" es una guía completa para utilizar enlaces canónicos. Uso incorrecto de enlaces relativos

A menudo sucede que hay páginas duplicadas en el sitio que no se pueden eliminar ni redirigir 301 por diversos motivos.

Usando el atributo canónico rel en SEO

Comencé esta publicación con una situación de tarjetas de productos duplicadas en el sitio de uno de mis clientes. Este está lejos de ser el único caso de uso de canonical real en SEO. Muy a menudo atributo rel canónico se solicita.

También suelen surgir diversas disputas y conceptos erróneos en los círculos de SEO con respecto a usando canónico sobre ella misma. Esto es lo que dijo Matt Cutts en una de sus entrevistas:

Es absolutamente normal que una página se vincule a sí misma con rel=canonical, y es absolutamente normal, al menos para Google, que rel=canonical aparezca en todas las páginas del sitio. La gente piensa que se puede utilizar de forma esporádica, pero no es así. Consideramos específicamente la situación en la que cada página del sitio contiene rel=canonical. Mientras te importe que te señalen paginas correctas, no habrá ningún problema.

Es decir, no hay nada terrible en esto, en muchos sitios de WordPress (incluido el mío) el rel canonical está configurado en sí mismo y las páginas se clasifican normalmente.

Redireccionamiento 301 o atributo canónico rel

La redirección 301 es una directiva OBLIGATORIA para ser tenida en cuenta por los motores de búsqueda, sin excepciones. Y lo canónico es una especie de "pista" sobre cómo comportarse el robot.

Por lo tanto, ¡es preferible utilizar una redirección 301!

Pero como en mi caso al principio del post, la plataforma SaaS no permite cambiar la URL y en consecuencia configurar una redirección 301, por lo que tuve que recurrir a la ayuda de canonical.

Es decir, canonical debe usarse en los casos en los que no existe viabilidad técnica hacer una redirección 301. Por cierto, Matt Cutts también habla de esto en la misma entrevista.

Finalmente, también me gustaría decir que se mostrarán todas las páginas, incluidos todos los duplicados, pero las páginas no canónicas se excluirán de la búsqueda.

PD Y para aquellos que no sepan quién es Matt Cutts, les aconsejo que vean este breve vídeo.

Muy a menudo, puedes ver en diferentes sitios que los visitantes llegan al mismo contenido desde diferentes direcciones(URL). La razón de este fenómeno es la duplicación de contenido en el sitio. Cómo hacerlo correctamente: esto sucede cuando se usa varios sistemas Gestión de contenidos (cms) en el sitio. Para evitar el problema, por google allá por 2009, se propuso el uso de la etiqueta rel=”canónico”, para la página con URL específica, que participará en los resultados de los motores de búsqueda. Un poco más tarde, todos los motores de búsqueda apoyaron la idea.

atributo rel="canónico"

Cómo utilizar el atributo rel="canonical".

Supongamos que encontró una página donde los visitantes provienen de diferentes URL y desean resolver el problema utilizando un atributo. Para hacer esto, seleccione la URL principal, por ejemplo: https://site/kak-samomu-raskrutit/page-one-1/ y ahora, para informar al motor de búsqueda sobre esto, debe:

  • registrar el atributo rel=”canónico” para la página principal y agregar una etiqueta a la página en cuerpo , aquí tienes un ejemplo:

El motor de búsqueda resaltará esta dirección como principal y se utilizará en los resultados de búsqueda. Para evitar problemas indique enlaces absolutos, no relativo.

Necesitará usar:

https://sitio/kak-samomu-raskrutit/page-one-1/

No utilice:

/kak-samomu-raskrutit/página-uno-1/

Ahora puede aparecer ante nosotros. pregunta principal, pero ¿se transfieren características como link Juice a la página canónica? Puedo decir con seguridad que todas las características de la página, como el link jugo, etc., se transmiten y se prueban en la práctica.

Para hacer la vida más fácil a los webmasters y SEO, recomiendo utilizar complementos y módulos para CMS que rastrearán enlaces con contenido duplicado y asignarán automáticamente atributos canónicos. Puedo recomendar el complemento para WordPress, hace el trabajo perfectamente. Simplemente marque la casilla "URL canónicas" y las páginas canónicas se generarán automáticamente.


Todo lo que tienes que hacer es comprobarlo correctamente y ajustar el funcionamiento del complemento.

Ejemplos donde es necesario utilizarrel="canónico".

1. Espectáculos del servidor mismo contenido para protocolo https y subdominio www, ejemplo:

http://lonbo.com/page-one
https://loknbol.com/page-one
http://www.lonbo.com/page-one

Entonces, para este caso puedes usar .

2. Para sitios que usar motores, al guardar contenido en diferentes secciones(categorías).

https://sitio/categoría-1/página-uno1/
https://sitio/categoría-2/página-uno1/

3. URL dinámicas. Como regla general, es típico de los productos de las tiendas en línea que se crean en diferentes sesiones o por diferentes consultas de búsqueda. Ejemplo:

https://sitio/productos?category=shapka&color=grey
https://sitio/head/grey?gclid=ABCD
https://site/shapka/grey/shapkaGrey.html

4. Distribución del contenido del sitio (recursos) en otros sitios, total o parcialmente.

Reglas generales al utilizar el atributo rel="canonical".

  1. No utilice el atributo más de una vez en la misma página. Es posible que el motor de búsqueda simplemente ignore sus instrucciones.
  2. Recuerde incluir rel="canonical" en la sección de código HTML. Verifique especialmente cuando utilice complementos o módulos.
  3. Asegúrese de que la página canónica esté abierta para la indexación; de lo contrario, será inútil.
  4. paginas

Ejercitar promoción adecuada páginas del sitio en los motores de búsqueda, es necesario decirle a los robots qué URL son más preferibles para ingresar al índice. Esto se establece mediante etiquetas especiales.

¿Qué es rel canónico?

Echemos un vistazo más de cerca a la etiqueta rel="canonical". Su objetivo principal es combatir las páginas duplicadas y las páginas no informativas (por ejemplo, páginas de paginación), así como mejorar la calidad de la indexación especificando una dirección prioritaria.

Tenía un sitio web con un presupuesto de rastreo limitado. Es decir, de hecho, había 10 mil páginas, pero solo podía haber 2 mil en el índice (porque el sitio era joven y no era confiable). Como resultado, las páginas que necesitaba en el índice a menudo no llegaban allí. Canonical ayudó: agregar paginación canónica a las URL principales hizo posible que los motores de búsqueda supieran claramente qué páginas deberían estar en el índice.

¿Qué es un enlace canónico?

La etiqueta canónica será extremadamente útil si su sitio tiene páginas duplicadas a las que se puede acceder a través de diferentes direcciones. Al usarlo, debe registrar una URL canónica prioritaria para que los motores de búsqueda la comprendan.

Lo importante es que también se transmitirán los enlaces y otras características de la página (PageRank, etc.).

Este atributo se especifica dentro de la etiqueta. en URL duplicadas que indican la URL preferida. Está formateado de esta manera:

¿Para qué sirve el canónico?

En la presencia de paginas similares Todos ellos participan al mismo tiempo en la indexación de los motores de búsqueda. Como resultado, ninguno de ellos se promociona completamente debido al hecho de que existen enlaces internos a ambas páginas. El buscador no sabe a cuál darle prioridad.

Lo mismo se aplica a los enlaces externos: no se promociona una URL, sino varias, y el peso también se distribuye entre ellas. Y el sitio está en posiciones más bajas de lo que podría estar.

Gracias a canonical, los motores de búsqueda tendrán la URL canónica preferida en su índice.

Ejemplos de uso

Por ejemplo, tiene una versión impresa de una página en su sitio web. O una URL separada para version móvil. Y pones lo canónico de ellos en la página principal, como resultado, esta página principal recibe más peso y una ventaja en la clasificación, y se elimina mucha basura del índice.

Cómo se usa canonical para la paginación

Debe colocar rel canonical desde las páginas de paginación (site.ru/category/page/2) en la primera de ellas (site.ru/category).

Las opiniones sobre la configuración de la paginación varían: algunos expertos dicen que es necesario bloquear todas las páginas de paginación de los motores de búsqueda, otros dicen que es mejor dejarlas accesibles a los robots de los motores de búsqueda.

Yandex recomienda configurar un enlace canónico a la primera página de todas las páginas de paginación. Como resultado, el robot Yandex percibirá que es la primera página que debe indexarse. En cuanto a la indexación de bienes, se aclara que Yandex seguirá siguiendo otros enlaces.

Los expertos de Google se inclinan por las siguientes opciones:

  1. deja todo igual: el motor de búsqueda lo reconoce y lo percibe de forma diferente diferentes tipos páginas;
  2. cree una URL separada para "Mostrar todo" y configúrela como canónica, especialmente recomendada para artículos de varias páginas;
  3. ingrese los atributos rel=”prev” y rel=”next” en la etiqueta del enlace para corregir la relación entre las URL; el motor de búsqueda devolverá el primero.

Y aquí está el vídeo de Devaki, donde explica en detalle sobre la paginación:

Atributos rel="siguiente" y rel="anterior"

También hay otra opinión: que las páginas de paginación no necesitan cerrarse, al contrario, deberían recibir tráfico adicional. Y aquí dos puntos son importantes:

  • Todas las URL deben tener un parámetro único. Etiqueta de título, texto único y metaetiquetas;
  • Si está más centrado en Google, entonces se recomienda uso obligatorio atributos rel="next" y rel="prev", que deben configurarse para que cada Pagina anterior referido a lo siguiente. En la dirección raíz se especifica la URL de la siguiente, en las siguientes, las URL de la anterior y la siguiente, en la última, solo la anterior.

Puede configurar la paginación con estas etiquetas y establecer el enlace canónico a la primera o a pagina de inicio- dependiendo de las características del recurso.

Tema con paginador SEO

Digamos que uno de los blogs (Sawynih o algo así, no recuerdo) escribió sobre un caso en el que las páginas de paginación proporcionaron tráfico adicional.

si está encendido diferentes URL Se presenta un producto similar, la navegación se puede configurar de las siguientes maneras:

  1. Registre valores de parámetros únicos automáticamente, recopilando encabezados de partes individuales, Por ejemplo:

    (comprar|pedir|comprar) faldas en (Saratov|Rostov|Astrakhan) (a bajo precio|rentable|barato) con descuento (en la tienda|en la tienda online)

    Se crearán valores de metaetiquetas únicos.

  2. La forma más eficaz y que requiere más tiempo es introducir estos parámetros usted mismo manualmente. Todos los títulos serán únicos y muy diferentes entre sí, incluido su significado. Esto le permitirá promocionar cada URL con baja frecuencia y baja competencia. consultas clave en los resultados TOP del motor de búsqueda. Gracias al uso de este método se ampliará núcleo semántico. Otra ventaja es que no resulta práctico escribir muchos artículos para una tienda online.

Es importante realizar este trabajo una vez individualmente para cada URL. Los parámetros serán registrados por los motores de búsqueda.

Configurando Canonical para WordPress

Muchos complementos de WordPress funcionan muy bien con esta etiqueta.

La mayoría de ellos son fáciles de usar: activamos el complemento y los enlaces canónicos se registran automáticamente. En otros complementos de SEO, simplemente marque la casilla junto a esta opción en la configuración. Si un artículo pertenece a diferentes categorías al mismo tiempo, el enlace canónico se fija de forma independiente.

Al usar el complemento Yoast SEO y la ubicación de la publicación en diferentes categorías, el motor de búsqueda verá solo una página.

¿Qué más es útil saber sobre canónico?

Es importante enfatizar los siguientes puntos:

  1. La etiqueta canónica no es una directiva, sino una pista que debe tenerse en cuenta y analizarse, destacando la URL más adecuada para los resultados de búsqueda.
  2. En cuanto al diseño de enlaces canónicos, no existe ningún punto prohibitivo en forma de camino relativo. Incluso si ingresas una etiqueta con un enlace al documento, caminos relativos se percibirá como escrito en la URL base.
  3. Es posible que las páginas canónicas no contengan exactamente el mismo contenido, y esto es lógico. Pueden existir diferencias menores.
  4. Incluso si hay un error 404, el contenido será indexado. Pero se recomienda configurar las URL de trabajo como canónicas.
  5. Si la URL canónica aún no se ha indexado, todo lo que tienes que hacer es esperar, normalmente no mucho. Cuando se reconozca, se revisará la pista.
  6. Puede utilizar una redirección: el motor de búsqueda aceptará la redirección y tendrá en cuenta una dirección diferente.
  7. Se recomienda configurar idénticos etiqueta rel canónico para que el resultado de la canonización sea óptimo.
  8. La URL canónica sólo se puede registrar desde el dominio actual. Para especificar una URL de otro dominio, debes utilizar una redirección 301.
  9. Puedes estudiar cómo se diseñan las URL canónicas usando el ejemplo del sitio wikia.com abriendo fuente páginas http://starwars.wikia.com/wiki/Nelvana_Limited, que contienen la URL canónica http://starwars.wikia.com/wiki/Nelvana
    Ambos enlaces son casi iguales, pero el primero contiene el atributo canónico y Google mostrará la versión especificada en este parámetro.
  10. Se pueden hacer preguntas sobre el uso de canónicos en blog oficial para webmasters del motor de búsqueda de Google.

EN en este caso lo canónico está marcado en la oveja negra

Beneficios asociados con la capacidad de configurar correctamente la indexación utilizando la etiqueta canónica:

  • deshacerse de contenido similar relacionado con las deficiencias del motor, así como creado artificialmente por acciones específicas de los competidores;
  • no es necesario utilizar robots.txt para prohibir la indexación páginas individuales y complacer a todos los motores de búsqueda.

Hola amigos. Es hora de que lleve el tema de la gestión de la indexación de sitios a su conclusión lógica. Permítanme recordarles qué métodos de gestión de indexación existen generalmente: el archivo robots.txt, la metaetiqueta robots, el encabezado X-Robots-Tag y la redirección 301 se pueden mencionar aquí como un método para tratar duplicados, que también es un parte integral de la indexación de la calidad. Y ya os hablé de todo esto, pero hay uno más. muy importante y manera interesante combatir duplicados, en cierto modo una alternativa a una redirección, este es el atributo rel="canonical", que está asignado a la etiqueta de enlace y ubicado en la parte cualquier página html.

Se parece a esto:

Lo que no es menos importante - esta etiqueta soportado por todos los motores de búsqueda, incluidos nuestros queridos Yandex y Google.

Así que hoy te lo diré cómo y por qué necesitas usar la etiqueta canónica rel, en qué situaciones es realmente eficaz y, al mismo tiempo, comprobaremos esta eficacia en un experimento real. Prepárate :)

Primero, déjame recordarte los posts que mencioné al principio:

Primero, vale la pena repasar la teoría para entender por qué este atributo se creó en general, qué objetivos se persiguieron y averiguar qué recomiendan los motores de búsqueda.

Teoría y ayuda de los buscadores.

Proporciono enlaces a posición oficial los motores de búsqueda: Google sobre el atributo rel="canonical" y Yandex sobre el atributo de etiqueta rel="canonical" . Por supuesto, mail.ru tiene razón, sobre el significado de canónico en la etiqueta, no podían quedarse atrás de Yandex, pero eso es bueno, todo es una copia al carbón, es más fácil para nosotros.

¿Qué es una página canónica? Esta es una copia recomendada de un conjunto de páginas con contenido muy similar.

¿Por qué es necesario especificar una página canónica? Si sistema de búsqueda ve que las páginas son muy similares o idénticas, entonces, según los algoritmos, solo aparecerá en los resultados de búsqueda una página preferida que, en opinión del motor de búsqueda, responda mejor a la consulta del usuario.

Y como sabemos, el buscador no siempre adivina nuestros deseos, por eso es mejor ir a lo seguro e indicar página deseada por propia cuenta. Puedes hacer esto agregando el enlace rel="canonical" a la sección Versiones no canónicas de todas las páginas HTML.

También resulta puedes especificar un enlace canónico para contenido que no sea HTML y, por ejemplo, para archivos pdf, doc u otros archivos que utilizan encabezados. Algo así como el encabezado HTTP X-Robots-Tag, solo que aquí habrá un encabezado HTTP Link. Pero esto es completamente para maníacos geek, así que no hablaré de eso.

¿Qué sucede si el atributo rel="canonical" apunta a pagina inexistente? ¿Qué pasa si varias páginas de un conjunto se designan como canónicas? En este caso, el motor de búsqueda simplemente ignorará estas reglas y actuará como antes: calculará una instancia adecuada a partir de un conjunto de páginas según los algoritmos.

¿Es posible utilizar el atributo rel="canonical" para especificar una URL canónica en otro dominio? Es posible, pero no necesario. Es importante comprender que el atributo canónico es solo una sugerencia o recomendación, y no una regla estricta, a diferencia de una redirección, que debería usarse en este caso.

Con base en todo lo anterior, así como información de otros fuentes oficiales(blogs de buscadores y blogs de sus empleados) podemos concluir que etiqueta de enlace rel="canónico":

  • Esta es una recomendación, no una regla, y por lo tanto puede ignorarse en los siguientes casos:
    • El documento en la dirección canónica no existe, devuelve una respuesta 404;
    • La página canónica no puede ser indexada en robots.txt o una metaetiqueta;
    • El código html de la página contiene varios atributos canónicos rel;
    • La dirección del documento canónico apunta a otro dominio o subdominio;
    • Hay una cadena de asignaciones rel="canonical", es decir para el documento A, el documento B se indica como canónico, y en este momento, para el documento B, el documento C se indica como canónico;
  • Sólo debe especificarse para páginas duplicadas o muy similares, y no para fusionar dos diferentes paginas o transferencia de peso;
  • La dirección de la página canónica puede apuntar a sí misma;
  • Compatible con todos los motores de búsqueda: en Yandex desde el 23 de mayo de 2011, en Google desde el 12 de febrero de 2009.

Aplicación práctica y experimento.

Eso es todo, se acabó la teoría, ahora te contaré por qué y por qué uso la etiqueta rel="canonical" en mis sitios. Lo principal y más importante es combatir y prevenir la aparición de duplicados. En su mayoría son duplicados relacionados con parámetros o etiquetas en la URL. No siempre es apropiado luchar contra estos problemas. Las etiquetas a veces son muy importantes, por ejemplo, cuando una campaña se ejecuta en contexto y en las etiquetas se transmite información estadística importante, y muchas otras cosas se pueden rastrear con etiquetas. No me gusta cerrar este tipo de direcciones en robots.txt; el uso de meta robots no funcionará y una redirección destruirá todos los datos.

Un ejemplo clásico del uso de direcciones canónicas son las tiendas en línea con varios tipos en una pila aún mayor. varios parámetros bienes: me parece que por eso se inventó este atributo.

Todo esto está claro. Pero en ninguna parte se dice lo más importante para nosotros, los SEO: ¿cómo van las cosas con la transferencia de link Juice? ¿Qué pasa si hay enlaces a una dirección no canónica? ¿Qué pasará con la página canónica? ¿Recibirá bonificaciones por esto? ¿Qué pasa si el enlace aparece primero y rel="canonical" se especifica más tarde? ¿Qué pasa si todo es al revés?

Hay muchas preguntas, pero ningún comentario oficial. A las preguntas de quién tiene la culpa y qué hacer, solo hay una respuesta: ¡necesitamos experimentar! Quería realizar un experimento así, pero resultó que no hace mucho lo realizó Igor, el autor del blog bakalov.info, por lo que muchas gracias.

Aquí hay una cita de su blog sobre cuál es el objetivo, cuáles son las opciones y el resultado esperado:

El propósito del experimento: averiguar si el "peso del enlace" se transferirá de la página A a la página C, si la página A enlaza con la página B y la página B tiene rel="canonical", lo que indica que la página canónica es la página CON.

Opción 1. La página A enlaza con la página B y este enlace está indexado por los motores de búsqueda. Después de un tiempo, rel="canonical" se establece en la página B, lo que indica que la página C es canónica, lo que finalmente conduce a la exclusión de la página B del índice.

Opcion 2. En la página B, se establece rel="canonical", lo que indica que la página C es canónica, lo que da como resultado que la página B se excluya del índice. Algún tiempo después de esto, se establece un enlace de la página A a la página B.

Es necesario averiguar en cuál de las dos opciones se transferirá el "peso del enlace" de la página A a la página C. Por "peso del enlace" me refiero al llamado "peso del anclaje", es decir. si se busca en la página del aceptador por el texto del enlace, entonces consideramos que se transmite el "peso del enlace"; si no se busca, entonces no se transmite;

Descripción completa y progreso del experimento.

Informaré los resultados del experimento y las conclusiones:

Para Yandex, no importa lo que vino primero: rel="canonical", o referencia externa– en cualquier caso, el “peso del enlace” se transferirá de la URL no canónica a la canónica.

Para Google, de hecho, todo es similar, aunque la publicación de Igor dice lo contrario: si se especificó la dirección canónica y las páginas ya estaban pegadas, y luego apareció un enlace externo, entonces el peso se transfiere, y si el enlace externo apareció antes. que el canónico, entonces el peso no fluye.
Es solo que el peso "fluyó" en el segundo caso tomó un poco más de tiempo, porque según el comentario en el blog se dice que la página canónica todavía se busca mediante el texto ancla.

En resumen, ¡todo funciona!

Una vez más resumiendo toda la información presentada en el post, Quiero decir que necesitas usar la etiqueta link rel="canonical". Primero que todo esto gran manera evitar la duplicación de contenidos (especialmente en lo que respecta a errores y deficiencias de la mayoría de los CMS) y la imposición de sanciones por ello por parte de los motores de búsqueda.

¡Buena suerte amigos! Deja comentarios y haz preguntas.

Saludos cordiales, Alexander Alaev

Lo ideal sería que hubiera una versión para cada página. Pero, en realidad, a menudo sucede que el mismo contenido está presente en varios lugares de un sitio, así como en otros recursos. Para resolver el problema del contenido duplicado, se desarrolló una solución llamada “elemento de enlace canónico”, más conocido como atributo rel=”canonical”.

¿Cómo puede ayudar rel="canonical" a su promoción?

Este atributo elimina problemas relacionados con contenido duplicado. Establece la versión preferida de la página y envía señales, como enlaces, a esa versión de la página. Combina contenido duplicado que puede aparecer por los siguientes motivos:

  • HTTP y HTTPS
  • los mismos materiales en el subdominio www y en direcciones http habituales
  • opciones y navegación multiaspecto
  • ID de sesión
  • barra diagonal
  • índice/páginas predeterminadas
  • versiones pagina alternativa, como m. o páginas AMP o versiones impresas

Dónde agregar el atributo rel=canonical

La mayoría de los webmasters saben que el atributo se agrega a la etiqueta principal:

Pero no todo el mundo sabe que canonical también se puede enviar en el encabezado HTTP:

HTTP/1.1 200 OKEnlace: ; rel=”canónico”

Se sabe que Google prefiere las páginas HTTPS como páginas canónicas a sus contrapartes HTTP; La excepción son los casos en los que hay señales contradictorias, según la ayuda de Search Console:

  • La página HTTPS tiene un certificado SSL no válido.
  • La página HTTPS contiene dependencias inseguras.
  • El acceso a la página HTTPS está denegado en el archivo robots.txt, pero no el acceso a la página HTTP.
  • La página HTTPS redirige a página HTTP.
  • Una página HTTPS apunta a una página HTTP utilizando el atributo rel="canonical".
  • La página HTTPS contiene la metaetiqueta noindex para robots.

Es un caso raro, pero aún posible, que debido a errores en el código, la sección del encabezado finalice antes de lo debido. Al mismo tiempo, canonical puede estar en el cuerpo del contenido, donde el motor de búsqueda no espera encontrarlo. Es aún peor cuando la mayoría de las herramientas (como Screaming Frog o Deep Crawl) no detectan este error. El problema sólo puede identificarse utilizando interfaz de software DOM ( modelo de objeto documento), por ejemplo, cuando se utiliza Inspect para Chrome Dev Tools

Consideremos atributo canónico en Home Depot en la captura de pantalla a continuación. Puede ver que la sección del encabezado ha finalizado y parte del contenido que está en el encabezado cuando mira la fuente termina en el cuerpo cuando mira el DOM.

Cómo interactúa el atributo canónico con otros

El atributo canónico puede confundirse fácilmente. Permitir, por ejemplo, error gramatical, agregue una barra diagonal, especialmente cuando también hay paginación y . Si se indexa una página distinta a la que figura en la etiqueta, las páginas no se combinarán correctamente. Por ejemplo, el elemento canónico se establece en la segunda página de una lista numerada para la URL de la primera página. El atributo canónico no debe usarse con noindex.

Otros usos de canónico

El atributo canónico se puede utilizar para versiones alternativas sitio web (versión móvil y AMP). No es necesario cambiar específicamente estos atributos.




Arriba