27 juillet 2005

Google : le grand détournement

Je ne sais pas vous, mais depuis quelques jours j'ai vraiment l'impression que google est en train de se faire pourrir d'une manière incroyable par des spammeurs vraiment ambitieux.

En effet celà fait quelques jours qu'en effectuant des recherches dans google, je remarque, très bien placés, des liens vers une URL contenant les termes exacts de ma requête, ayant pour titre les termes de ma requête, et contenant dans la page ma requête en plus d'un tas de mots en vrac. Les urls sont du genre origami-cocotte.duim.sejny.pl, ou origami-cocotte.brazil-travelclub.nl, et plus généralement avec une extension en *l. Je ne suis pas allé voir ce vers quoi elles mènent, n'ayant que IE au boulot, mais ça sent mauvais. Les pseudo-sites en question contiennent apparement un nombre incroyable de mots et d'expressions couramment recherchées par les internautes, afin de se placer tranquillement en première page de toute recherche.
Pour cela je suppose que ce parasite utilise le page ranking de google, qui attribue leur pertinence aux pages web principalement en fonction du nombre de pages pointant vers elles.
En créant un réseau bien lié de pseudo-pages, et de plus en générant des pseudo-url correspondant aux mots clés, ils sont ainsi arrivés à placer 2 ou 3 résultats en première page...on imagine les gains énormes potentiels.

Pourtant cette technique de création de pseudo-pages à génération automatique ayant pour seul but de berner google est loin d'être nouvelle...comment ces gens sont-ils arrivés mettre en place un projet d'une telle ampleur ?

Les mots clé fréquemment recherchés par les internautes, par exemple, ne tombent pas du ciel. Impossible a priori de savoir ce que les gens recherchent sans posséder soi-même un moteur de recherche populaire...ou de les espionner !
Pas mal de spywares installent en effet des barres de recherches ou mettent en page de démarrage des sites (totalement nuls) de recherche. On comprend peut-être un peu mieux pourquoi...

A mon avis, l'opération nécessite de posséder soi-même un/des serveur dns, en plus d'une quantité honorable de serveurs http et d'une très bonne bande passante, pour que les serveurs ou la connection ne s'écroulent pas quelques minutes après le référencement par google.
Il semble donc y avoir derrière des moyens, et pas très légaux par dessus le marché.

Espèrons que google agira rapidement comme il a l'habitude le faire dans ces cas là : faire baisser à la main et de manière abyssale le page ranking des pages référencées concernées. Toutefois, rien n'empêche qu'un ou des autres prennent la place, et ainsi de suite.
Et imaginez que parmi les liens de ces pages à la con, les créateurs s'amusent à mettre de vraies urls...comment distinguer les bonnes des mauvaises ?

Je pense qu'il y a vraiment danger, et je ne vois pas vraiment de solution (mais heureusement les milliers d'ingénieurs de google sont peut-être un peu meilleurs que moi, du moins rassemblés), alors affaire à suivre...

1 commentaire:

Anonyme a dit…

Je n'aurais qu'une url à dire :
http://www.tututu.net/blog/index.php/2005/07/27/35-google-n-est-pas-infaillible