En este ClinicSEO estuvimos hablando de crawling y logs. Como Google rastrea tu web, la importancia de analizar los logs para mejorar la indexación y hacer más eficáz tu web, casos de uso. La importancia de la segmentación de un crawling.etc.
5. Qué son los logs...#clinicseo
Información que guarda nuestro servidor de cualquier
interacción que se realiza en él.
¿Dónde y cómo se guardan?
● Se guardan en ficheros .tar.gz
● Se suelen borrar cada X días
● Pregúntale a tu proveedor de hosting cómo obtenerlos
● Pideselo a tus técnicos
6. ¿por qué son importantes?#clinicseo
Son sus
● Rastrean los sites
● Leen el contenido y lo guardan
● Sigue buscando enlaces para
continuar
Transmiten al “cerebro” lo que ven
7. ¿por qué son importantes?#clinicseo
Si a través de sus ojos recibe
información confusa, errónea o le
engañamos su comportamiento será
peor en nuestro site.
8. ¿Qué es el crawl Budget?#clinicseo
Según Google
“Representa el número de conexiones
paralelas y simultáneas que utiliza el
robot de Google para rastrear el sitio
web, así como el tiempo de espera
entre cada obtención.”
9. ¿Queé es el crawl Budget?#clinicseo
Definición personal
“Google incluirá un determinado
número de urls en su índice, y NO
necesariamente las mejores”
10. ¿Importancia crawl Budget?#clinicseo
Filtros de un site de clasificados
● ciudad (100)
● marca (9)
● modelo (90)
● particular o concesionario (2)
● color (3)
¿Cuántas urls posibles hay?
36. Mitos Vs Realidad#clinicseo
● No saldrá en las serps
● Reduce el rastreo de Google
● Evitar ser penalizado
Usado en thin content o urls de poco valor
como filtros
NoIndex
<meta name="robots"
content="noindex" />
38. Mitos Vs Realidad#clinicseo
NoIndex
<meta name="robots"
content="noindex" />
● No saldrá en las serps
● Reduce el rastreo de Google
● Evitar ser penalizado
Thin content o urls de poco valor como filtros
43. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
Caídas del servidor
Tipos de contenido más utilizado
Bots que más vienen y su comportamiento
Tener una información más granulada que la que nos da
GSC
¿Como crawlea google el JS? ¿Lo hace?
Expedientes X
Ventaja competitiva en como google valora o no
nuestras páginas
45. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
¿Top páginas crawleadas?
¿Que enlaces tienen?
¿Que nos interesa enlazar desde esas páginas
para potenciarlo?
¿Que efecto tiene hacerlo?
¿Nuestras top páginas de tráfico son las más
crawleadas?
¿Cómo podemos optimizar esto?
¿Tenemos páginas huérfanas?
46. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
¿Thin content?
¿Que tenemos que no genera tráfico?
¿Se crawlea? ¿Cada cuando? ¿más o menos que el resto?
¿Canonical, noindex, redirect, enriquecer, robots.txt...?
¿Qué porcentaje de mi site está crawleando Googlebot?
47. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
Análisis del crawling por tipología de página
¿Cuánto tarda en descubrir nuestro contenido en cada tipo de página?
¿Cuánto tiempo pasa entre que lo descubre y rankea?
¿Qué podemos hacer para cambiar eso?
¿Cuánto tardamos en empezar a recuperar nuestra inversión en ese contenido?
¿Qué comportamiento sigue el Google en las páginas AMP?
Ahora que hemos lanzado AMP que ocurre? Crawlea igual que la versión mobile?
¿Qué relación existe entre mejorar el ratio de crawling de una tipología y el tráfico que recibe?
¿Qué tipologías reciben más tráfico por parte del bot? Esas priorizaré para arreglar los errores
48. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
URLs con enlaces, importante
Status 200
Enlaces que además nos aportan tráfico
Importancia para Google de ese link →
cuántos más accesos del bot más importante
la url de origen
49. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
URLs con enlaces, importante
Redirecciones 30x
Backlinks a urls con 302 →
desperdiciamos autoridad
Backlinks a urls con Dobles, triples, redirecciones
50. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
URLs con enlaces, importante
Errores 4xx
Backlinks a urls que dan error a Google,
desperdiciamos autoridad
Backlinks a urls que dan error
y antes tenían visitas y autoridad
51. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
Migración HTTPS
¿Como podemos auditar el estado?
¿Qué páginas ha rastreado ya google?
¿Qué status code tienen las antiguas?
¿Qué status code tienen las nuevas?
¿Comparativa de logs de las urls nuevas y antiguas?
Podemos priorizar los esfuerzos centrándonos en urls que:
- Tienen más tráfico
- Tienen mejores rankings
- Han sido las más crawleadas
En la nueva URL:
- Se crawlean con la misma frecuencia?
- Responden con el status code correcto?
- Las antiguas dan un 301?
- Sigue Google crawleando alguna URL antigua? A qué se debe?
53. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
Mobile First Index
¿Nuestro site está ya siendo más crawleado por el user agent de mobile?
¿Qué páginas mobile se llevan la mayor parte del rastreo?
¿Tenemos los mismos enlaces que en desktop?
¿Están estas páginas optimizadas igual que en desktop?
¿Comparativa de logs de las urls desktop vs mobile?
¿Siguen los mismo patrones?
54. Recuerda nuestro hashtag!
#CLINICSEO
Casos de uso logs#clinicseo
Mobile Speed Update
Identificación de las páginas que:
- Cargan más lentas
- Tienen un mayor tamaño
Verificación de las
implementaciones y su impacto
62. Recuerda nuestro hashtag!
#CLINICSEO
Webmasters Tools#clinicseo
Son gratis y hay que usarlas
pero no son “on demand” ni rastrean el
100% de URLs y tipologías de errores
como las diferentes soluciones de pago
66. Recuerda nuestro hashtag!
#CLINICSEO
Ventajas#clinicseo
- Mucho más fácil de configurar & te olvidas del “mantenimiento”
- “Sin límite” de URLs (algunos hablan de 200.000.000 URLs)
- Fácil integración con otras fuentes de datos y herramientas
- Fácil filtrado de URLs con desplegables drag & drop
- Velocidad a la hora de cruzar entre segmentos y grupos de URLs
- Comparación con rastreos anteriores de todo el histórico.
- Informes preconfigurados; schema, OGP, AMP, mobile sites, etc.
- Si dominas regex & xpath, puedes personalizar todo bastante.
- Extensiones para los principales navegadores & APIs para geeks
- ...
76. Recuerda nuestro hashtag!
#CLINICSEO
2 tipos de grupos#clinicseo
● En base a elementos de la URL
○ Compatible con LOGs
○ Puedes hacer grupos de URLs a posteriori
● En base al HTML (custom fields) > Terminan siendo URLs
○ No son compatibles con el análisis de LOGs
○ Debes definir muy bien qué quieres buscar antes del rastreo
○ Tras un rastreo sólo puedes hacer grupos configurando custom fields PRErastreados
77. Recuerda nuestro hashtag!
#CLINICSEO
Ej en Wordpress#clinicseo
● En base a elementos de una URL de WP con /%postname%/ tendríamos:
○ URL contains /tag/
○ URL contains /page/
○ URL contains /author/
○ URL contains /amp/
○ Poco más… puesto las categorías serían URLs “iguales” que la de un post.
● En base al HTML las posibilidades son infinitas.
○ Podemos buscar en el HTML si existe:
■ <meta property="article:section" content="Actualidad" />
■ <meta property="article:published_time" content="2018
■ <body class="archive category...
79. Recuerda nuestro hashtag!
#CLINICSEO
de regalo...#clinicseo
● Lista de categorías: string(//meta[@property="article:section"]/@content)
● Lista de tags: string(//meta[@property="article:tag"]/@content)
● Publicación: string(//meta[@property="article:published_time"]/@content)
● Modificación: string(//meta[@property="article:modified_time"]/@content)
● ¿qué más se te ocurre…?