|
|||||||||||||||||||||||||||||||||||||||||||
|
Comment rechercher sur le Web En deux ans, le World Wide Web a sorti définitivement Internet de l'anonymat. La croissance d'informations disponibles dans cet espace de documents hypertextes est exponentielle. Rapidement, des moteurs de recherche ont été créés pour assister l'internaute dans ses investigations. Il en existe des dizaines, certains très prisés, d'autres spécialisés. Choisir le moteur de recherche le plus adéquat est un véritable gain de temps et surtout augmente la qualité du résultat des recherches. Cerner vos besoins Supposons que vous cherchiez à connaître la façon dont un moteur de recherche fonctionne. L'un des premiers mots qui vient à l'esprit est "moteur". Vous trouverez en utilisant celui-ci des documents sur la robotique, sur les voitures, sur la réparation de petits moteurs, sur l'électromécanique, sur les moteurs de la croissance économique, etc. Il faut affiner votre pensée pour éviter de dépouiller des dizaines de documents sans objet. Pour obtenir un maximum d'informations, utilisez le ou les mots équivalents en anglais. Les équivalences sont contextuelles et pas syntaxiques. Dans notre exemple, ce n'est donc pas le mot "motor" qu'il faut utiliser mais "crawler" qui désigne un rampant. En effet, le WWW étant assimilé à une toile mondiale, il est tout à fait normal d'y trouver des rampants chargés de l'explorer. :-) Si vous voulez conserver le mot "moteur", associez-le à d'autres mots comme "recherche" ou "web". Que choisir ? Si vous désirez faire une recherche géographique car le lieu du serveur susceptible d'héberger des documents intéressants est important, vous utiliserez une carte géographique. Vous pouvez faire une approche par thème : vous précisez de plus en plus le domaine de recherche. Pour notre exemple, cela donne computers, WWW puis crawler. Cette méthode à l'avantage d'être beaucoup plus rapide que si vous aviez simplement cherché avec le mot crawler car vous réduisez le champ des possibilités. D'autres moteurs de recherche sont spécialisés pour explorer uniquement des serveurs francophones afin de proposer seulement des documents en français. D'autres sont simplement indexés, c'est-à-dire qu'ils classent uniquement les documents avec des mots-clés et vous donnent ceux qui concordent avec votre voeu. Beaucoup de moteurs de recherche ne se contentent pas d'explorer le WWW. Vous pouvez ainsi obtenir des documents d'archives Usenet, FTP, Wais, Gopher. Mais utilisez plutôt les outils de recherche adéquats pour chacun d'entre eux. Préférez Archie pour FTP, Véronica pour Gopher ou des clients Wais pour Wais. En conclusion, en utilisant un moteur de recherche WWW, vous obtiendrez essentiellement des documents HTML (ou hypertextes). Fonctionnement N'allez surtout pas croire qu'un moteur de recherche explore le Web sur votre demande, les temps de réponse seraient faramineux. En fait, vous interrogez simplement une base de données qui contient des milliers d'adresses classées par thèmes, mots-clés, etc. avec parfois un descriptif ou simplement les trois ou quatre premières lignes des documents. Elle est mise à jour et augmente de taille de deux façons : d'une part tout internaute qui désire y faire figurer ses documents remplit un formulaire et, d'autre part, des robots à tout instant (ou "spiders") explorent le Web et renvoient le contenu de leurs recherches. Ces robots lancent des requêtes d'interrogations sur un serveur hôte. Lorsqu'ils trouvent un document, ils le cataloguent avec les liens hypertextes éventuels inclus. Les robots sont l'objet d'une étude collective parce qu'ils peuvent, dans certains cas, être facteur de ralentissement sur les serveurs explorés. Si l'idée d'en écrire un vous tente, n'oubliez pas de rejoindre la communauté des auteurs de robots. Ne pensez pas y croiser Isaac Asimov, votre robot n'aura jamais de cerveau positronite. :-) Moteurs de recherche [C] Carte géographique. [T] Thème. [F] Francophonie. [I] Documents indexés. [U] Usenet. [W] WWW. [A] Amiga. [UI] DejaNews, www.dejanews.com. [WIT] Yahoo, www.yahoo.com. [WC] UREC, www.urec.fr/France/web_monde.html. [WFTI] Lokace, lokace.iplus.fr/. [WFI] Ecila, ecila.ceic.com. [AIT] AmiCrawler, www.melizo.com/area52/amicrawler/search.cgi (un moteur dédié à la recherche de documents, logiciels, informations, etc. sur Amiga). WWW Robots, Wanderers, and Spiders, info.webcrawler.com/mak/projects/robots/robots.html (pour tout savoir sur le fonctionnement des robots WWW).
|