Entendiendo el funcionamiento de los sistemas de búsqueda en la web (Parte I)

Cuando uno es pequeña piensa que el hombre más inteligente del mundo es nuestro padre y que como él no hay otro, y eso es verdad!.. Pero la vida me obsequió la oportunidad de conocer a un profesional que si me tocara describirlo tendría que usar tantos adjetivos que tu pensarías que estaría exagerando. Por lo tanto a diferencia de las presentaciones de mis otros invitados, con el de hoy voy hacer una excepción; voy a dejar que tú mismo a través de este su primer artículo para Magenta IG (donde te prometo no será el último) te vayas formando una idea del nivel de profesional que es. Con el mayor de los orgullos le doy la bienvenida a este blog a mi socio… Juan Roberto Barham

             juan-roberto-barham-lopez

                              @juanbarham

El funcionamiento de los motores de búsqueda es un tema que por supuesto no es ninguna novedad, y acerca de cuál puedes encontrar muchísima información en la web, con muy diferentes grados de confiabilidad.  Sabemos que uno de los problemas de la web es precisamente los diversos niveles de calidad de la información que podemos conseguir en ella.

Una buena cantidad de los artículos que nos encontramos en la web explica el funcionamiento de los motores de búsqueda con un enfoque para “dummies”;. Este enfoque, sin ninguna duda, puede ser adecuado para introducir en el tema a quienes solo quieran (o necesiten) obtener algunas nociones básicas del tema.  Sin embargo, estas explicaciones simplistas no son suficientes para entender desde el punto de vista de un gerente cómo funcionan los motores de búsqueda.

Si quieres entender realmente tu situación actual y tener una excelente visión de los aspectos a mejorar para el SEO de tu sitio web, debes entender realmente cómo funcionan los motores de búsqueda. Considerando que la teoría general de sistemas es una de las favoritas de los gerentes, apelaremos a ella para que en nuestro rol directivo podamos entender de qué va el funcionamiento de los motores de búsqueda en la web, y posteriormente poder hablar de SEO con seguridad y propiedad.

El motor de búsqueda es un sistema

Lo dicho: para entender cómo funcionan los sistemas de búsqueda en la web, podemos adoptar un enfoque sistémico. Tomemos la definición de Wikipedia de lo que es un sistema: “Es todo organismo con un número de subsistemas o componentes en interacción. Está formado por componentes, que son entidades del sistema que en combinación con otros componentes se combina, separa o compara las causas para producir las consecuencias (entradas y salidas)”.

Específicamente, un motor de búsqueda web es un sistema de búsqueda  y recuperación de información (SRI) muy particular y de muy altas prestaciones. La Búsqueda y Recuperación de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos mismos, búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos relacionales, ya sea a través de internet, una intranet, y como objetivo realiza la recuperación en textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante”.

Los SRI tradicionales trabajan con una colección de documentos homogéneos (como pudieran ser las fichas bibliográficas de cada libro en una biblioteca), y gracias a esta homogeneidad su representación es relativamente sencilla: permitiendo que el ordenamiento de documentos relevantes a la consulta o necesidad del usuario sea también relativamente sencillo y óptimo de cara al usuario.

El diagrama a continuación resume la composición de un SRI típico:

          SRI

                                    

El gran desafío de los primeros desarrolladores de SRI´s para la web era el proceso de colección de documentos: considerando la heterogeneidad como la norma en la worldwide web. De acuerdo con lo explicado por Larry Paige y Sergey Brin en el paper original de presentación de Google, el reto principal que enfrentaron en el periodo de 1995 a 1997 era la heterogeneidad: “la web es una vasta colección de documentos heterogéneos totalmente incontrolados. Los documentos en la web tienen variaciones extremas en cuanto a su estructura interna, y también en la meta información que presentan al usuario”.

Sistemas de Búsqueda y Recuperación de Información

Una vez que te he convencido que un motor de búsqueda es un SRI analizamos cuáles son sus entradas y salidas:

  • Entradas: consultas de los usuarios,  todos los sitios web.
  • Salidas: resultados de búsqueda de usuario

Ya se va simplificando la cosa…tenemos entonces solo tres tipos de entradas y salidas:

  1. Consultas: generadas por los usuarios con palabras clave.
  2. Resultados de búsqueda: generados en respuesta a cada consulta de usuario, caso por caso.
  3. Sitios web: información de todas las páginas publicadas en la web.

Sistema

Comparando el diagrama de un SRI con el diagrama del sistema de búsqueda en la web, vemos que:

  • Las consultas de usuario se corresponden de manera directa.
  • Los documentos recuperados ordenados se corresponden con la página de resultados del motor de búsqueda, también conocida como SERP (Search Engine Results Page).
  • La colección de documentos equivale a todos los sitios web.

Los SRI son sistemas cerrados, que no pueden ser manipulados por otras personas que no sean su desarrollador y sus administradores. Los usuarios o los dueños de los documentos no pueden de modo alguno manipular al SRI para que su documento aparezca en un lugar preferente de acuerdo a la consulta del usuario. Si el SRI está correctamente estructurado y programado los resultados de búsqueda serán relevantes y de gran valor para responder  a la consulta del usuario.

Los motores de búsqueda en la web, en cambio, comenzaron a ser manipulados con tácticas de engaño por los primeros profesionales del SEO (hoy conocidos como practicantes del SEO de sombrero negro), aprovechando la inmadurez de esos SRI en sus etapas iniciales. El objetivo de los SEO manipulativos era colocar como documentos relevantes de cara a las consultas de los usuarios a páginas que en muchos casos no tenían nada que ver con las consultas.

Llegados a este punto del artículo, espero hayas entendido la causa raíz de porque Google tiene esas políticas tan criticadas por los amigos del SEO de sombrero negro. Me atrevo a afirmar que el objetivo de Google es el que se plantearon Page y Brin siendo estudiantes en la Universidad de Stanford: quieren que Google sea un SRI totalmente cerrado, no manipulable y de gran utilidad para el usuario; devolviéndole como resultados una colección de documentos web de alta relevancia en relación con su consulta y necesidad.

El enfoque sistémico del funcionamiento de los motores de búsqueda nos permite entender que es lo más importante para Google y los otros motores de búsqueda: los sitios web de alta calidad equivalen a un documento de biblioteca bien estructurado y con contenido relevante a la búsqueda y necesidad de un usuario.

En una próxima entrega te explicaré con mayor detalle los subsistemas que componen a un motor de búsqueda…


Nuevamente bienvenido socio, y ya sabes ésta también es tu casa jajaja.

APROBADO

By | 2017-02-21T06:06:56+00:00 21 Octubre , 2015|Marketing, Mi invitado de honor de la Semana|