2003-05-07 15:15
Tratad de buscar un hotel de Madrid en Google, como por ejemplo el
hotel Praga (donde tantos viajes de estudios han ido a parar) o el
hotel Conde Duque. En el primer caso la
web del hotel aparece la quinta. En el segundo, la
verdadera web ni siquiera aparece en las dos primeras páginas.
El resto son sitios de reserva de hoteles, de nombres muy parecidos, que, de alguna forma, han engañado a Google y le han hecho creer que son la legítima fuente de información sobre ese hotel en particular. Mirando alguna de esas páginas, se ve que han usado diferentes trucos para conseguirlo: tienen muchísimos autoenlaces, incluyen el nombre del hotel en el nombre del fichero y del directorio, y por supuesto en etiquetas relevantes. Y, por supuesto, no incluyen por ningún enlado un enlace ni al hotel ni a la cadena correspondiente.
No sé si pasará en otro campo, pero en los hoteles es descaradísimo; es a veces imposible encontrar la web legítima de un hotel con su teléfono, y hacer una reserva directamente. Aquí precisamente se ve lo vulnerable que está empezando a ser Google, como buscador, a un ataque sistemático por parte de una página o grupo de páginas.
Supongo que las mentes pensantes en Google ya estarán pensando algo para evitarlo, pero lo difícil va a ser arreglar este tipo de cosas sin estropear el resto. Yo creo que la única solución es usar metadatos "externos", y hacer menos caso a los enlaces; por ejemplo, usar datos de WhoIs, darle más importancia al nombre de dominio (por ejemplo, si una página es HotelPosaDelPeine.com debería tener más importancia que hotelesquetecagas.com/posadelpeine). Porque al fin y al cabo,
google es el que posee la verdad y la verdad hay que cuidarla.