Saltar al contenido

Cómo saber si están indexadas unas urls

Última actualización el 7 agosto, 2022 por Jaime Lujan García

Si no quieres que tu trabajo quede en nada, tienes que saber si tus urls están indexada o no lo están. Para ello solo tienes que ver el siguiente artículo y sabrás exactamente como hacerlo sin ningún tipo de duda o problema.

Tabla de Contenido

¿Cómo puedo saber si Google ha indexado mi sitio en vivo?

Hay dos formas sencillas de averiguarlo:

Utilice el operador de consulta site:
Busca tu dominio en Google de la siguiente manera: site:tuweb.com

A continuación te dejamos unos ejemplos de como hacerlo. Por ejemplo si tenemos estas urls.

https://configurarmidispositivo.com/supermercados-cerca-de-mi/

Las tenemos que dejar asi y verlas en google a ver si estan indexadas.

site:https://configurarmidispositivo.com/supermercados-cerca-de-mi/

Puedes ver estos ejemplos para ver si se indexan o no se indexan.

https://blogs.harvard.edu/factual/having-an-online-business/#comment-10922

https://articulosdeperiodicopuntero.mystrikingly.com/blog/que-es-configurar-mi-dispositivo-cercano

https://articulosdeperiodicopuntero.mystrikingly.com/blog/que-es-mi-actividad-de-google

https://articulosdeperiodicopuntero.mystrikingly.com/blog/que-son-los-bancos-de-imagenes

https://articulosdeperiodicopuntero.mystrikingly.com/blog/que-es-la-banca-electronica-u-online

https://unsplash.com/@bancodeimagenes

https://unsplash.com/@miactividad

https://www.flickr.com/people/195034449@N07/

https://www.flickr.com/people/195015800@N05/

https://sites.google.com/view/deopiniones/tecnolog%C3%ADa/para-qu%C3%A9-sirve-ok-google-configurar-mi-dispositivo?authuser=0

https://sites.google.com/view/deopiniones/tecnolog%C3%ADa/mi-actividad-de-google?authuser=0

Si tu sitio está indexado, verás una lista de páginas:

Si no se obtienen resultados, es posible que tenga problemas:

Nota: en los sitios más grandes, aunque verá una aproximación de cuántas páginas están indexadas, sólo podrá ver realmente unas 300 de ellas en las SERP.

Compruebe la sección de cobertura de Google Search Console

Todos los sitios web deberían tener una cuenta en GSC. En mi opinión, es la mejor herramienta que puede utilizar el propietario de un sitio web o un SEO, y ofrece una gran cantidad de información sobre la visibilidad orgánica y el rendimiento de su sitio. Si no tienes una, dirígete a la página oficial de GSC, si la tienes, ve a la sección Cobertura donde puedes ver un desglose de:

Errores encontrados durante el rastreo de páginas
Páginas bloqueadas
Páginas indexadas válidas
Páginas excluidas
Informe de cobertura de GSC
Si su sitio tiene problemas, éstos serán reportados bajo «error» o «excluido» – y usted puede encontrar las razones por las que no están siendo incluidas en la búsqueda, tales como

Página alternativa con etiqueta canónica adecuada
Rastreada – actualmente no indexada
Duplicado sin etiqueta canónica seleccionada por el usuario
Excluida por la etiqueta ‘noindex’
Anomalía de rastreo
No encontrado (404)
Si las páginas de su sitio no aparecen en la sección «válida», es posible que tenga problemas.

Utilice la función de inspección de URL en GSC
Si algunas páginas están indexadas y otras no, también puede utilizar la herramienta de inspección de URL para ver si Google puede rastrear e indexar una página específica, o si hay otros problemas que impiden que aparezca en la búsqueda; esta herramienta se encuentra en el menú superior y le permitirá comprobar una URL cada vez:

Si su página está indexada, le dará los siguientes detalles:

Datos de la página indexada de GSC
Si no lo está, obtendrá este estado que muestra cuándo ha intentado Google rastrear la página y algunos datos sobre por qué no está indexada:

Te puede interesar también.

https://calendario366.com/bicis-popularidad/

https://calendario366.com/monitores-de-frecuencia-cardiaca/

¿Por qué Google no rastrea ni indexa mis páginas?

Por lo general, existen dos motivos por los que una página no puede ser rastreada ni indexada. Estas razones son especialmente comunes cuando se ha lanzado o migrado un nuevo sitio y se ha trasladado la configuración del entorno de desarrollo.

La directiva Disallow de robots.txt

Aquí es donde el sitio, un directorio o una página se bloquean para que no sean rastreados por el archivo robots.txt.

Todos los sitios deberían tener un archivo robots.txt, que se utiliza para dar directivas a los motores de búsqueda sobre qué secciones de su sitio deben ser rastreadas y cuáles no.

Si tiene uno, lo encontrará en su directorio raíz con el nombre de robots.txt

https://calendario366.com/robots.txt

Las directivas que impedirían el rastreo de un sitio, directorio o página serían las siguientes

Disallow: /
Disallow: /directorio/
Disallow: /página_específica.html
También puede utilizar Screaming Frog para intentar rastrear su sitio. Si no puede hacerlo, verá los siguientes datos de rastreo:

Problema con los robots de Screaming Frog
Hay muchas razones válidas para bloquear los motores de búsqueda utilizando esta directiva, pero si ve algo parecido a lo anterior, debe modificarlas para permitir el rastreo de su sitio.

Toda la información que buscabas, actual y diferente la encontrarás en esta web, no lo dudes navega y disfrutarás.