Junio 19, 2011
De la democracia del enlace al despotismo tecnológico de los algoritmos
Es curioso observar como la compañía que se propuso ordenar la información en la red a través de algoritmos, democracia y bondad ha terminado por desordenarla tanto que estamos llegando a una auténtica metamorfosis en su misión, propuesta y valores. Para Google la calidad del contenido no venía marcada por el autor, la historia o demás factores “sentimentaloides” trasnochados, sino por la valoración que el usuario hacía de ella en Internet. Una fórmula realmente exótica, idílica y que el tiempo ha terminado por confirmar como utópica. Convirtieron la calidad en una mera cuestión cuantitativa, con el número de enlaces y la tipificación de los mismos como moneda más importante de valoración, acompañado de 200 criterios que hicieran las veces de factores de corrección. La exposición del contenido en el mayor quiosco del mundo se democratizada, hasta el punto de que el pequeño era capaz de competir con el grande en la batalla por la generación de contenidos y la obtención de ingresos publicitarios.

La reconversión industrial estaba servida. Google armonizaba el caos y aparecieron las teorías sobre la relatividad de las marcas. Según algunos pensadores, profesionales y autores las marcas de toda la vida perderían su fuerza ante las nacidas en la nueva era, como consecuencia de la manera en la que la gente se informaba en la red. El valor de las búsquedas fue, durante casi 10 años, un auténtico delimitador del éxito o el fracaso de miles de sites creadores o copiadores de contenido. Con estructuras más pequeñas, ágiles y dinamismo en las nuevas narrativas se adueñaron de audiencias masivas capaces de presentar cierto atractivo publicitario en volumen de audiencia. Por un lado, los lucrativos ingresos de Adsense (por aquél entonces) y, por el otro, sirviendo publicidad propia en espacios concretos. La calidad del contenido? Eso lo marcaban los enlaces y gente capaz de pelear con la máquina, ponerla a prueba y demostrar fracturas o inconsistencias en el algoritmo.
Google se convirtió en un cómplice de los crawlers, ya sean manuales, automáticos o mixtos. Más directa que indirectamente al buscador le interesan los crawlers en materia pecuniaria. Le daban ingresos y salida publicitaria en dimensión contextual. Más que los agregadores puros le gustaban los que alternaban contenido propio con copias de agencia o terceros, porque eran sites más preocupados por el ingreso de Adsense. Todos conocemos a gente capaz de ganar un buen dinero de Adsense trabajando desde casa 3 ó 4 horas al día copiando contenido y cuadrar la publi de Google en tipografías o posiciones visuales que incentivaran el click. Google se ponía en contacto contigo y te decía… “eso está mal, tienes que quitarlo…vamos, Don´t be evil” pero te pagaba y, de paso, daba salida a sus anuncios en sites con buenas tasas de CTR y cumplimiento de objetivos para sus anunciantes. Tú ganabas, él ganaba, ellos ganaban...
El mundo se transformaba, pero a costa del valor del contenido. Pasaron los años y esto dejó de ser una batalla entre nativos y tradicionales, ya que muchos nacidos para la red generaban buen contenido sin caer en prácticas censurables. Contaban las cosas de otra manera, más cercana y con más velocidad. Ese acierto, sin embargo, se enfrentaba al sistema. La apuesta por la calidad del contenido no siempre obtenía sus recompensa en buscadores, pues sufrían los mismos riesgos que los demás:
La lógica del algoritmo:
La realidad de la exposición del contenido:
Bien. Así las cosas, el liderato en audiencia de una determinada categoría no necesariamente lo determina el contenido, sino las prestaciones de éste en buscadores, independientemente de criterios cualitativos. Los procesos de control del buscador son imposibles de articular y gestionar sin la intervención de la mano humana. Necesitan tomar una decisión ante prácticas ilícitas o encaminadas a robar posicionamiento de contenidos de terceros. De igual manera, el otro problema está en la calidad del resultado que ofrece Google sobre una búsqueda concreta. El objetivo de Google es que encuentres lo que demandas y no regreses. Que la operación sea rápida y la experiencia de usuario inmejorable. Cuenta, de este modo, con factores de corrección del objeto posicionado: bounce rate, tiempos medios, históricos, valoraciones y comparación con otros resultados. Ahora, además, tiene componentes sociales para conocer su atractivo en la recomendación, más allá de los enlaces recibidos y la calidad de los mismos. Pero, ¿cómo determinar si el contenido es de calidad? ¿Quién determina la calidad? La autoría no implica calidad. Elimina crawlers y copiadores, pero también es difícil de determinar la fuente original y fácilmente alterable.
Google es una máquina responsable. No va a montar un descosido y dejarnos en la estacada. No porque sea más bueno que los demás, sino porque también le van sus ingresos en eso. Con eso no juegan. Y buscan limpiar resultados para diferenciar "el grano de la paja" en una nueva misión algorítmica de implicaciones también bíblicas. Como dice Julio Alonso hay sites que son bambú para el "Panda" de Google les fagocite hasta digerirlos. No baneándolos, sino mandándolos a los intestinos de las tripas del nuevo "osito" capaz de engullirse 10 de cada 100 búsquedas. Un asunto de extrema preocupación para muchos sites que operaron en la red sin tener presentes los cuadros de mando de entrada de usuario razonablemente comprendidos.
¿Qué composición de dependencias de tráfico son las deseables?
A lo largo de mi carrera profesional me han hecho esta pregunta al menos 100 veces. Ya sea internamente o en conferencias. No tengo la respuesta, pero siempre he sido un defensor del tráfico directo y el brand de buscadores. Siempre he creído que hay que hacer marca y lo que te diferenciará es tu contenido. Incluso antes de esta joya de post: Make Love To Your Direct Traffic.
En 2008 ya propuse un cuadro de mando que te sirviera de control exacto para el cumplimiento de tus objetivos de tráfico directo y captación masiva de usuarios fieles.
Si conseguiste aminorar dependencias de SEO orgánico a favor de directos y brading, entonces Panda será una anécdota. Si por el contrario sigues anclado en dependencias elevadas de palabras clave ajenas a tu marca: debes urgentemente revisar tu long tail.

Realmente se trata de ordenar el Long Tail a la vez que nos vamos despejando 3 incógnitas:
¿Cuánto tráfico le debo realmente a Google?
¿Cuánto de mi tráfico depende de palabras histórocicas: "comodines"?
¿Cuánto tráfico depende de los cambios del algoritmo de Google?
En 2010 y lo que llevo de 2011 al menos habré participado como ponente, asistente o blogger en al menos 50 eventos nacionales e internacionales. Puedo decir que el que más me gustó, en el que más aprendí (y eso que solo pude estar un día) fue el Congreso de SEO Profesional. Fue espectacular el nivel. En aquella ocasión presenté las Palabras Clave Comodines:
¿Qué son los comodines?
"Aquellas palabras clave que, en apariencia de orgánicas, deberían ser brand por temporalidad, acontecimiento planificado o estacionalidad".
Una palabra clave o la acumulación de muchas no es ninguna tontería. Puede condicionar un ranking por el que luego se invertirá publicidad. Puede mostrar en apariencia algo que no se corresponde del todo con la fortaleza real de un determinado site. Puede, incluso, disimular la calidad real del contenido de una web.
En este mismo blog lo he experimentado. El peor post del mundo fue el que más tráfico me generó. Tras 906 post en aquella época, un juego de palabras clave, EGM 2010, me marca el pico de audiencia. Obviamente la calidad del mismo era inexistente. La táctica era sencilla. Las página de la AIMC era malísima. Cada vez que salía el EGM (3 olas al año) estaba el primero. Publicaba un post absurdo y ganaba cantidades de tráfico ingentes. Dejé de hacerlo en 2011, porque Google me bloqueó. pensé que me pillarían por Cloaking evidente, o por duplicado. En realidad, mi planteamiento fue el siguiente: si la gente no es capaz de llegar al informe público del EGM, voy a crear una página intermedia que lo enlace o permita la descarga automática del documento, posicionando por EGM + descriptor temporal. Empecé a hacerlo en 2009. Y seguí en 2010. Y fueron mis keywords comodines hasta el punto de elevar mi dependencia a un 12% del total del tráfico anual del site. Un auténtica locura... Ah sí?? analizad vuetsros "comodines"? Y luego ser sinceros. El 12% de mi audeincia total no dependía de mí. Sino de un equilibrio. Podía haber aportado contenido y crear menos enlaces artificiales, pero los atajos siempre son menos costosos.

Luego ya cree una categoría, que aún pervive y a Google le gusta más. Pero si fuesen lógicos con Panda, me mandarían al ostracismo de la 24 página de resultado. Y me confesé en el post: tráfico inservible.
Por eso cuando veo una categoría me da exactamente igual el resultado. Solo me interesa analizar la calidad de ese contenido. No porque lo diga yo, sino por la manera en la que su público interactúa. Por ejemplo, esta:

Soy un adicto a blogs de tecnología. Por eso me sorprende ver de líder a uno que no conozco. Puede ser, no soy más que un observador de la red. Y la analítica en medios es mirar internet por un agujero tan pequeño como el de un alfiler. Lo que alcanzas a ver es lo que sabes, el resto lo intuyes y lo demás nunca lo sabrás. Por eso, es bueno intuir lo que pasa en determinadas webs.
Kioskea.net tiene unos "comodines" significativos, por ejemplo. Cómo verlo?


En un mes, el peso de una noticia es tan elevado como el de su Home. Google informa de que se le relaciona altamente con esa palabra clave... Y tanto! No entro en la calidad de la pieza ni en la constancia del asunto o lo esporádico del volumen de búsquedas sobre esa composición de palabras clave. Pero si Panda busca calidad en su conjunto, podría haber rotación en los resultados de búsqueda sobre cosas similares. Y no digamos del que toma esta noticia y la agrega, la copia o "la hace suya".
En definitiva... cosas que pasan con los comodines:

¿Qué pretende Google?
Realmente es una incógnita. Podemos despejar dudas: necesita adaptarse cada vez más al nuevo ecosistema social que ha encontrado la ruptura del anonimato. Buscan etiquetas de autor; relacionar búsquedas con resultados recomendados por tus seguidores en Twitter; introducir un botón social, +1, accionable sobre el usuario logado; aligerar la carga de páginas para darle velocidad a Instant (y preview); al fin y al cabo, ponderar su matemática con el valor de cada usuario que recomienda algo.

INSUFICIENTE!
Ranking de usuarios, enlaces y autorías originales conviviendo por una mejor posición. Yo no veo que se pueda hacer con matemáticas. Sí a dedo. Y viene una hermosa batalla de comercio electrónico en dónde Google sabe que el 65% de las compras físicas tienen una prescripción de información en Internet. Si el social ecommerce consigue superar a las búsquedas en esta sugestión de compra física, Google tendrá problemas. Por eso creo que algunos comercios verán alteradas sus posiciones, pero con nuevas y atractivas mejoras en Adwords… :-)
Las caídas de Panda creo que serán aquellas que puedan reconocer de manera evidente. Agregadores sin comunidad, ni pactos de lectura sobre los enlaces cargados de páginas intermedias, copias de contenidos evidentes cuya autoría se reconozca o contenedores de enlaces y contenidos. OJO porque algunos suponen que Google reconozca menor salida de Adsense en algunas plazas rentables por prácticas medio ilícitas sobre la presentación de la publi. En cualquier caso, en cuanto Panda hable español nos iremos enterando y sorprendiendo de como va aprendiendo no la semántica, sino la lingüística de nuestro idioma.
