Nos guste o no, Google es el líder indiscutible del mercado en motores de búsqueda. Y si sabes lo más mínimo sobre SEO , sabes que Google es más que un motor de búsqueda. A medida que más y más usuarios encuentran el contenido que buscan a través de los motores de búsqueda, Google proporciona más y más herramientas de análisis y optimización de búsqueda. Google Search Console , una herramienta que comenzó su vida como Google Webmaster Tools, es una de ellas. Y en este artículo, le mostraremos cómo usar Google Search Console para deshacerse de los errores de rastreo.
Pero, ¿qué son los errores de rastreo? ¿Cómo y por qué ocurren? ¿Cómo afectan a tu sitio web? Estas preguntas, y más, serán respondidas en este artículo. Esto es de lo que nos gustaría hablar:
-
¿Qué es un error de rastreo?
-
Tipos de errores de rastreo y cómo afectan los errores de rastreo a su sitio web
-
Errores del sitio y cómo solucionarlos
-
Errores de URL y cómo solucionarlos
Tabla de contenido:
¿Qué es un error de rastreo?
Como te habrás dado cuenta, los errores de rastreo tienen que ver con la mecánica básica de los motores de búsqueda . Puede consultar el artículo vinculado para obtener una vista más detallada, pero la esencia es esta: los motores de búsqueda no buscan en Internet. Eso tomaría demasiado tiempo.
En su lugar, los motores de búsqueda utilizan piezas de software llamadas bots, robots o rastreadores para buscar sitios web y crear un índice, y buscar en el índice en su lugar. El proceso de creación de un índice se denomina rastreo. Un bot rastrea una página, la agrega al índice y agrega todos los enlaces de una página a la lista de enlaces que aún tiene que rastrear. Idealmente, todos y cada uno de los enlaces en un sitio web conducirán a una página.
En consecuencia, un error de rastreo es una situación en la que un motor de búsqueda intenta rastrear una página web pero no lo consigue. Un bot intenta llegar a una página en un sitio, pero no puede.
Tipos de errores de rastreo y cómo afectan los errores de rastreo a su sitio web
A los efectos de las funcionalidades de Google, existen dos tipos de errores de rastreo: errores de sitio y errores de URL .
Si tiene un error de sitio , significa que no se puede rastrear todo su sitio web. Esto se conoce en el argot de SEO como una cosa muy mala. Si su sitio web no se puede rastrear, significa que no se puede indexar: todo su sitio web, incluido todo su contenido, será invisible para los usuarios de los motores de búsqueda. Es posible que aún se pueda acceder a él escribiendo la URL en el campo URL de su navegador, pero ¿cuándo lo hizo por última vez?
Si, por el contrario, su sitio web tiene un error de URL , significa que los bots no pueden rastrear una página específica de su sitio web. Este no es un problema importante (o al menos no tan importante como un error del sitio), y generalmente es su culpa: muchos errores de URL provienen de enlaces internos.
Puede ver si su sitio web tiene algún error navegando a su Google Search Console y seleccionando Cobertura/Errores en el menú del lado izquierdo.
Errores del sitio y cómo solucionarlos
Hay tres tipos de errores de sitio: errores de DNS, errores de servidor y errores de falla de robots. Discutiremos cada uno en breve.
Errores de DNS
DNS significa Sistema de nombres de dominio , y es lo que le permite navegar por Internet sin conocer la dirección IP de cada sitio web. Si Google Search Console arroja este error, significa que no se puede acceder a su sitio web . Puede ser temporal, en cuyo caso los bots de Google intentarán rastrearlo más tarde, pero si el error persiste, significa que Google ha intentado localizarlo varias veces.
Para probar este problema, use una herramienta como downforeveryoneorjustme.com para probar si el sitio web está caído y comuníquese con su proveedor de dominio de inmediato, ya que es probable que el problema se deba a ellos. Puede ser un problema temporal, pero es poco probable que usted solo haya causado un error de DNS e igualmente improbable que pueda solucionarlo, a menos que sea su propio proveedor de dominio.
Errores del servidor
Es probable que un error del servidor signifique que se agotó el tiempo de espera de la solicitud: su servidor está tardando demasiado en responder . Un rastreador está intentando visitar e indexar su sitio web, pero la cantidad de tiempo que tarda en cargarse es demasiado grande para que sea práctico. A diferencia de un error de DNS, un error del servidor significa que Google puede acceder a su sitio web, pero la página tarda demasiado en cargarse. Alternativamente, puede significar que su sitio web está abrumado con solicitudes, ya sea a través de una gran cantidad de visitantes o un ataque DDOS.
La herramienta Inspeccionar URL se utiliza para verificar cómo los bots de Google acceden a un sitio web. Se encuentra en el lado derecho de la consola.
La herramienta de bloqueo Test Robots.txt se utiliza para comprobar la configuración de su archivo robots.txt , que trataremos en la siguiente sección.
Si tiene un error del servidor, use la herramienta Inspeccionar URL para averiguar exactamente cuál de estos problemas ha ocurrido:
-
tiempo de espera: el servidor tardó demasiado en responder a los bots de Google;
-
encabezado truncado: el servidor cerró la conexión antes de que Google pudiera recibir el encabezado completo;
-
restablecimiento de la conexión: la conexión se restableció a mitad de la respuesta;
-
respuesta truncada: la conexión finalizó antes de que Google pudiera recibir una respuesta completa;
-
conexión rechazada: el servidor se negó a conectarse con los bots de Google;
-
conexión fallida: el servidor estaba inactivo o inaccesible;
-
tiempo de espera de conexión: la conexión tardó demasiado en procesarse;
-
sin respuesta: la conexión finalizó antes de que se enviara ninguna respuesta.
Estos pueden ser temporales o pueden derivarse de problemas internos del sitio web. Explicar cada uno de ellos en detalle está más allá del alcance de este artículo, pero lo remitiremos a la ayuda de Google Search Console una vez que tenga suficientes datos para continuar.
Fracaso de los robots
Una falla de robots significa que los bots de Google no pueden acceder al archivo robots.txt de su sitio web . No continuaremos con el archivo robots.txt (consulte el artículo vinculado para obtener más información), pero le daremos la esencia: se usa para controlar el comportamiento de los robots de los motores de búsqueda por varias razones. Sin embargo, no lo necesita para tener un sitio web en pleno funcionamiento. Google lo interpretará como que desea que todo su sitio web sea rastreado e indexado.
Aún así, si tiene un archivo robots.txt , debe asegurarse de que esté configurado correctamente. Asegúrese de que el archivo no contenga esta línea:
disallow: /
Esta línea hace que todo su sitio web no esté disponible para los bots de Google. Si desea que su sitio web sea indexado, debe borrar esta línea. Sin embargo, cambiar el código de su sitio web es mejor dejarlo en manos de desarrolladores profesionales. Le sugerimos que busque ayuda si no se siente seguro. Recuerde, es mejor no tener ningún archivo robots.txt que tener uno mal configurado.
Errores de URL y cómo solucionarlos
Los errores de URL vienen en muchos sabores. Los discutiremos en términos generales.
404 errores
Un error 404 significa que no se puede encontrar el contenido de una página . Discutir las formas de corregir un error 404 merece su propio artículo, y puede consultar el enlace para obtener una descripción detallada. Sin embargo, en términos generales, los errores 404 no afectan su clasificación con Google. Si las páginas que arrojan el 404 no son esenciales, no se trata de un asunto urgente, pero aún debe solucionarlas cuando pueda encontrar el tiempo. Si las páginas esenciales de su sitio web se ven afectadas, debe corregirlo utilizando los métodos descritos en el artículo vinculado o configurar una redirección 301 si corresponde.
Errores suaves 404
Los errores 404 leves ocurren cuando una página se parece a una página 404 pero no lo es. ¿A quién le parece una página 404? A Google, en este caso. Google es muy bueno para adivinar cuál es el contenido de una página. Si una URL no tiene mucho «contenido principal (es decir, contenido que no sea enlaces, encabezados, menús y similares)», tiene un estado HTTP de 200 (encontrado), pero no mucho en lo que Google denomina contenido útil.
Si desea evitar estos errores, complete sus páginas 404 blandas con contenido real o proporcióneles redireccionamientos 301 cuando corresponda. Alternativamente, si la página desaparece permanentemente, permita 410 para la respuesta del encabezado del servidor.
Acceso denegado
En el caso de un error 404, los bots de Google no pueden encontrar una página. Un error de acceso denegado significa que no pueden. Esto generalmente significa que está bloqueado por su proveedor de alojamiento, su archivo robots.txt o usted mismo requirió que el usuario iniciara sesión para ver la página.
Ahora, en el caso de los dos primeros, puede ser justo lo que pretendía: si no desea que se rastree una página, su archivo robots.txt debe contener la configuración adecuada. Del mismo modo, si ha configurado un muro de pago o una barrera de inicio de sesión similar, no desea que su contenido esté disponible para ningún usuario ocasional del motor de búsqueda. Sin embargo, si su proveedor de alojamiento ha bloqueado su contenido, debe retomarlo con ellos.
Errores específicos de dispositivos móviles
Suelen ocurrir en sitios web que no responden y, en su mayoría, implican redireccionamientos defectuosos a un sitio web móvil independiente. Para corregirlos, verifique sus redireccionamientos y su archivo robots.txt como se describe en la sección de fallas de robots .
Errores de noticias de Google
Si su sitio web está en Google News, es posible que obtenga errores de rastreo si su contenido no está formateado para Google News (fallas en la estructura de los encabezados, por ejemplo), o pueden ocurrir cuando Google piensa que su contenido no es un artículo de noticias. Debe resolverlos caso por caso.
Errores de malware
Un error de malware significa que Google ha encontrado software malicioso en una página . Nuevamente, la protección contra el malware debe resolverse caso por caso.
Errores del servidor y errores de DNS
Los errores del servidor y los errores de DNS pueden aparecer en el informe de errores de URL en su informe de Google Search Console. Esto significa que son lo mismo que los errores de todo el sitio, excepto por el hecho de que afectan URL específicas. Debe tratarlos de la misma manera que trataría los errores del mismo tipo en todo el sitio.
Marcar errores de URL como corregidos
Hazlo. Hazlo.
Si sospecha que el problema es temporal o que se deriva de un archivo robots.txt o de un muro de pago que se configuró de la manera que usted desea, puede marcar todos los errores de URL como corregidos . No afectará el rendimiento de su sitio web.
En conclusión
Como puede ver, Google Search Console es una importante herramienta de diagnóstico. Para mantener su sitio web funcional y sus visitantes contentos, verifique si hay errores regularmente. Gran parte del trabajo de solución de problemas es un trabajo duro, pero algunas de las cosas importantes también son urgentes. Con Google Search Console y esta práctica guía, sabrá cuál es cuál.