Si en tus informes de Google Analytics (GA) has observado tráfico un poco distinto al habitual como son visitas desde países que no son tu público objetivo (Rusia, Croacia, Polonia,etc), fuentes que desconoces (free-share-buttons.com, 4webmasters.org, simple-share-buttons.com, www.Get-Free-Traffic-Now.com, etc), visitas con un porcentaje de rebote del 100% y una duración media de la sesión de 00:00, etc. entonces probablemente tengas tráfico no real, es decir, tráfico spam.
Te interesa eliminar este tráfico spam de tus informes de analítica web ya que no son datos reales y por lo tanto alteran la información en la que te tienes que basar para tomar decisiones.
Nosotros te vamos a contar en este post cómo identificar el tráfico spam y en una segunda parte cómo eliminarlo de tus informes. En ambos casos, nos vamos a centrar en el spam del tráfico de referencia.
¿Qué tipos de tráfico de referencia podemos encontrar en los informes de Google Analytics?
Os recordamos que el tráfico de referencia llega a tu web por medio de otra fuente, es decir como si fuese un enlace en un dominio distinto al de tu sitio web. El tráfico de referencia podemos categorizarlo como:
- Natural, procede de los enlaces que de manera natural otras personas ponen en otros sitios web. Este tráfico es bueno, genera datos de calidad y el analista de Google Analytics los tiene que analizar para obtener conclusiones. Ejemplo: enlaces a nuestro sitio web que se han especificado en otro blog o sitio web conocido, en una red social, en una campaña de emailing, etc.
- Bots, procede de la actividad de los bots y arañas buenos en la red. Este tráfico es bueno porque no tiene como objetivo hacer daño. Pero nosotros lo tenemos que considerar como spam porque en realidad no es tráfico de usuarios reales y no nos interesa tenerlo en los informes de nuestra analítica. Ejemplo: google para indexar tu sitio web.
- Rastreador, es tráfico spam maligno que tenemos que evitar. El rastreador accede al sitio web y suele dejar reflejado en la dimensión «fuente» (fuentes que han remitido tráfico a nuestro sitio web) una url de un sitio web externo, el analista por curiosidad lo consulta a través del navegador y esto puede provocar que se instalen malwares en su navegador. Ejemplo: Semalt.com.
- Fantasma, este también es tráfico spam maligno que a diferencia del anterior nunca ha accedido a nuestro sitio web. Suelen incluir en la dimensión «nombre del host» (nombre que han utilizado los usuarios para acceder a nuestro sitio web) o en la dimensión «fuente» datos de urls que hacen despertar la curiosidad del analista que terminan accediendo a estas urls. A los fantasmas les beneficia las peticiones a las urls, o bien por que obtienen beneficio económico por visita de publicidad display o porque instalan cookies de terceros obteniendo información.
El rastreador busca hacer daño mediante la instalación de virus en el navegador o incluso en tu pc y el fantasma busca obtener beneficios mediante las plataformas de afiliación, atrayendo tráfico a su página web y de allí enviar el tráfico a otra web.
¿Cómo identifico el tráfico Fantasma Spam Google Analytics?
El fantasma, al no visitar el sitio web, deja en el informe de GA un valor de la dimensión «nombre del host» que no coincide con nuestro sitio, esto ocurre ahora, pero en un futuro puede que sean capaces de cambiarlo.
Por lo tanto, para identificarlo actualmente, hay que analizar el tráfico según la dimensión «nombre del host«. Para ello accede al informe de GA de «Audiencia», luego en «Tecnología» y dentro de «Red» selecciona la dimensión primaria «Nombre del host».
- Son datos buenos aquellos que tienen como «nombre del host» la url de tu sitio web (ejemplo: inventtatte.com) o la caché de google (webcache.googleusercontent.com) o también google al traducir tu página (translate.googleusercontent.com) o si estás utilizando campañas de emailing (ejemplo:inventtatte.us9.list-manage.com)
- Desconfía de «nombres de host» que no corresponden con tu dominio, por ejemplo valores de (not set), forum.topic50854726.darodar.com, etc.
El tráfico SPAM que tiene «nombre de host» sospechoso es un tráfico denominado “Fantasma” ya que nunca ha llegado realmente a visitar tu sitio web.
¿Cómo identifico el tráfico Rastreador Spam Google Analytics?
El rastreador sí accede a nuestro sitio web, por lo tanto el «nombre del host» es correcto en el informe de GA, en este caso tenemos que analizar la dimensión «fuente«. Para ello accede al informe de Google Analytics de «Adquisición«, luego en «Todo el Tráfico» y selecciona el informe «Referencias«. Este informe te muestra todo el tráfico que tienes de la dimensión «medio» como referral.
- Son datos buenos los de las redes sociales (facebook.com, linkedin.com, etc.), los de otros blogs o sitios webs que conozcas y en los que se han incluido de forma natural tus enlaces.
- Desconfía de fuentes que no conoces social-buttons.com, get-free-traffic, 4webmasters.org, etc que en muchos casos tienen un porcentaje de rebote del 100% y una duración media de la sesión de 00:00.
Los generadores de tráfico spam google analytics hacen uso de los protocolos de Google Analytics con el parámetro del identificador de la propiedad UA (Universal Analytics) de los sitios web, este UA lo buscan de forma aleatoria.
Es importante eliminar el tráfico spam para tener datos de calidad sobre los que tomar decisiones, ya os lo adelantábamos en otro post “Analítica web, antes de medir piensa”. En el próximo post os indicaremos cómo eliminar este tráfico de tus informes para tener estos datos de calidad.
Como consejo final no visites el sitio web que deja reflejado el tráfico spam, corres el riesgo de que se instalen virus en tu navegador o pc, si quieres puedes buscarlo en google que seguro que hay opiniones al respecto.
¿Tienes tráfico spam en tus informes de Google Analytics? ¿Qué fantasmas o rastreadores son los que te aparecen? ¿Sabes cómo eliminarlos?
Hola, muy interesante este artículo. Realmente el tráfico spam puede «ensuciar» mucho la analítica de un sitio web y puedes creer que estás logrando muchas más sesiones de las que realmente tienes. Yo suelo eliminarlas utilizando dimensiones personalizadas. Espero el próximo artículo para ver qué método utilizas tú.
¡Muchas gracias Alejandro! Puedes leer cómo aconsejamos eliminar el tráfico spam en este post: https://inventtatte.com/como-eliminar-trafico-spam-google-analytics/ Espero que te ayude. ¡Saludos! 🙂
Vaya, no leí la fecha y creí que era un artículo reciente. Si lo sé busco antes la solución que proponéis.
Yo la implementación que hago es distinta. Creo que es más completa, ya que no es necesario identificar todos los “nombre de host” buenos.
La idea es distinguir visitas reales de spam o fantasma, mediante la asignación de una dimensión personalizada. Las visitas reales serán las que tengan la dimensión asignada. En este artículo lo explico detalladamente.
http://amonasterio.com/como-eliminar-referrer-spam-google-analytics/
Muchas gracias por tu aportación Alejandro. La solución de la dimensión personalizada es también otra opción, como tú bien dices, más técnica que la presentada en este post. ¡Saludos!