Savoir évaluer l’information sur Internet

1.1.1     Quelques questions clés à se poser

 

Vérifier ses sources

 

Web bibliographie :

Information Quality Resources on the Internet, Marcus P. Zillman, Published on December 2, 2011 sur LLRX http://www.llrx.com/features/informationqualityresources.htm (Legal Librarians Ressources eXchange)

 

1.1.2     Comment évaluer un site web ?

L’évaluation de l’information sur Internet devient un enjeu important pour les professionnels. Il s’agit d’un acte d’expertise pour estimer la qualité des différentes ressources disponibles :le portail, le site web, la page web, l’article sur la page, la base de donnée accessible depuis la page, mais aussi le forum, la liste de discussion, le message posté sur une liste ou un forum, etc.

 

Les critères d’évaluation

Différentes catégories de critères sont à prendre en compte, sachant qu’il convient de croiser une évaluation de la source avec une évaluation du contenu :

ü  Crédibilité : Organisation émettrice, type d’émetteur, auteurs des documents, source de financement ou sponsoring, webmaster, cibles et objectifs du site, type d’accès, etc.

ü  Fraîcheur : Date de création et de mise à jour

ü  Exhaustivité et l’exactitude : Type de document, citations des sources, bibliographie, contextualisation de l’information, qualité de la langue, etc.

ü  Adéquation : pertinence et utilité par rapport à la recherche ou à la veille menées.

ü  Ergonomie : arborescence, navigation, orientation, frames, etc.

ü  Design : présentation visuelle, conception graphique.

 

Les grilles d’évaluation existantes

La plus aboutie sur le Web (mais très lourde) dans le domaine de l’information santé http://www.chu-rouen.fr/netscoring

Voir aussi

Université Laval www.fse.ulaval.ca/fac/href/grille/grille.gif

Il est intéressant de consulter le cours en ligne « L’évaluation de l’information sur Internet » et les textes déposés sur les archives institutionnelles à l’adresse http://urfistreseau.wordpress.com/les-intervenants/alexandre-serres/ , élaboré par Alexandre Serres, responsable URFIST Bretagne

 

 

Astuces pour l’évaluation des pages en cours de navigation

ü  Chercher des informations sur l’éditeur sur le site. En cas de difficulté, chercher le copyright en bas de page. On peut aussi repérer sur le plan du site la page Contact qui va fournir un email. Voir alors la seconde partie de l’adresse mail (après le @) qui peut renvoyer à un domaine particulier que l’on cherchera alors sur le web.

ü  Chercher des informations sur la société indiquée. On utilisera alors des bases de données d’informations sur les sociétés (R5CS, organismes de régulation boursiers).

ü  Pour rechercher le propriétaire d’un nom de domaine (noms des responsables techniques et administratifs). Attention, les informations sont loin d’être toujours mises à jour, donc il y a des risques d’erreur, et parfois besoin de recoupements.

o    Pour les noms de domaine se terminant par un « .fr » on utilisera le moteur proposé par l’AFNIC, centre d’information et de gestion des noms de domaine pour la France (et pour l’île de la Réunion .re) : www.afnic.fr

o    Pour les noms de domaine « gTLD » (generic Top Level domains), c’est à dire les .com, .net, .org, et plus récemment les .biz et les .info, c’est plus difficile car les bases de données ne sont plus unifiées (auparavant, la base Whois gérée par l’Internic). On utilisera donc un méta-moteur comme Betterwhois, qui permet d’interroger les bases des « régistrants » (prestataires assurant la gestion administrative et technique du nom de domaine) les plus importants : www.betterwhois.com.

o    Pour les autres noms de domaine par pays, on peut passer par un service générique http://www.generic-nic.net/dyn/whois, ou bien chercher préalablement l’organisme national pays par pays sur Yahoo :
http://dir.yahoo.com/computers_and_internet/internet/domain_name_registration/top_level_domains__tlds_/registry_operators/International_Country_Codes/

ü  Pour trouver des informations générales sur la page, on peut utiliser le moteur Alexa www.alexa.com, propriété de Amazon.com. On obtient les coordonnées du « régistrant », mais aussi des statistiques sur le trafic du site, des témoignages d’internautes, le temps de chargement de la page, le nombre de liens vers cette page, etc. De plus, des sites/pages « similaires » sont proposés.

ü  Utiliser également le « URL info » de Fagan Finder : http://www.faganfinder.com/urlinfo

ü  Ne pas oublier non plus de faire des recherches sur le web en prenant le nom du site comme mot-clé, et avec la fonction link : (recherche par popularité : qui a un lien sur cette page).

ü  On peut aussi utiliser l’interface de recherche développé par un journaliste Jean-Marc Manack pour se simplifier la vie dans la validation des informations : Plus de 200 outils classés par rubriques (moteurs de recherche, administratif – URL, dictionnaires, référence, actualités, blogs, etc.) sont disponibles à partir d’un seul formulaire, les résultats apparaissant dans la partie gauche de la page. La différence avec un méta-moteur classique, est que l’on peut mettre soit un mot-clé, soit une url. (utilisable aussi en mode « sidebar » dans le navigateur : http://manhack.net

 

 

1.1.3     Quelques outils pratiques

 

1.1.3.1     WHOIS

http://whois.sc/ suivi d’un nom de domaine. Les informations les plus importantes sont gratuites. Une option freemium permet d’approfondir

1.1.3.2     Où trouver des archives du web ?

Rien n’est exhaustif dans le monde du web, mais le service proposé par l’association The Internet Archive (qui reçoit des donations et soutiens de différents acteurs, dont Alexa)  est très impressionnant : on peut ainsi visualiser un site tel qu’il était à différentes dates depuis 1996, et même suivre des liens sur ces archives.

The way back machine : www.archive.org

Depuis la fin 2003, un service en beta permettait d’aller beaucoup plus loin, en permettant une recherche plein texte, par date, sur plus de 11 milliards de pages archivées. Différentes fonctionnalités étaient accessibles à partir des résultats des sites répondant le mieux à la recherche : graphique permettant de voir la fréquence d’apparition du mot-clé sur la période, thèmes traités par le site,  concepts proches, etc. : http://recall.archive.org

1.1.3.3     Comment trouver des bookmarklets ?

Les bookmarklets sont des programmes contenus dans des liens, c’est à dire des éléments de code java qui se mettent dans les favoris comme des URL classiques, mais qui déclenchent quand on les appelle une action particulières. Ils déclenchent souvent  ouverture de fenêtre pop-up (ce qui pose d’ailleurs un problème quand on utilise un « anti pop-up » : obtenir le premier résultat du moteur Google directement, faire un lien direct vers un paragraphe de page html, traduire, éditer les urls présents sur une page à la fin de celle-ci, intégrer un nouveau bookmark si l’on est sur un service en ligne de gestion de favoris, etc.

Pour en trouver, et pour démarrer votre recherche : –     http://www.outilsfroids.net/texts/OutilsBookmarklets   www.bookmarklets.com

1.1.3.4      Comment gérer les problèmes fréquents avec les outils ?

ü  Erreurs 404, liens non valables : remonter dans la hiérarchie du site. Si l’adresse de l’host est bonne, revenir à cette adresse et « tatonner » à l’intérieur du site pour retrouver la page cherchée et sa nouvelle URL. On peut aussi utiliser le lien « cached » sur Google  ou les archives de Alexa.

ü  Signification des principaux messages d’erreurs :

Erreur Message Signification
400 Bad Request Erreur dans l’adresse
401 Access Denied La consultation nécessite un nom d’utilisateur et un mot de passe
403 Forbidden L’accès est réservé et vous n’avez pas les privilèges correspondants
404 Not found La page correspondant à cette URL n’a pas été trouvée sur le serveur
500 Internal Problème de serveur. Contacter l’administrateur du site
503 Read time out Le temps alloué à la connexion est écoulé

 

ü  Réponses hors sujet : reformuler sa question, rajouter des mots clés…

ü  La page proposée ne contient pas votre terme de recherche .

Il peut y avoir plusieurs explications, mais la plus vraisemblable est que ce mot se trouvait dans la page lorsque celle-ci a été sauvegardée par le robot du moteur. Puis elle a été modifiée et le mot a disparu de la page. Mais par contre il est resté dans l’index de la base de données.  Il se peut aussi que votre terme apparaisse dans un formulaire déroulant, ou enfin en méta-données.

Une solution pour être certain d’obtenir des résultats contenant les mots-clés de votre question consiste à utiliser un méta-moteur « off-line » avec la fonction « raffiner » ou « filtrer ».

ü  Non élimination des doublons : les moteurs utilisent maintenant à peu près tous les techniques de clustering pour la présentation des résultats (une réponse = un site et non une réponse = une page) ou le proposent en option. Mais cela n’empêche pas toujours les doublons.

ü  Problème d’accès à de l’information très récente : attention, un moteur peut mettre plusieurs jours ou mêmes semaines avant d’indexer un nouveau site… Voir du côté des serveurs d’actualité, par exemple.

1.1.3.5     Peut-on circuler de façon anonyme sur le web ?

On le sait, la navigation sur le web laisse des traces (voir notamment à ce sujet le site de la CNIL www.cnil.fr). Il existe néanmoins des services permettant de masquer les adresses IP d’origine et d’empêcher les cookies et autres techniques de marquage de fonctionner, c’est à dire de garantir une meilleure confidentialité de surf sur internet

Anonymiser http://www.anonymizer.com/ (payant)

Voir le TOR Project Anonymity online https://www.torproject.org/

Voir enfin le portail Stay Invisible qui propose définitions, actualités, tests, un forum de discussion sur le sujet ainsi qu’une liste d’outils : http://www.stayinvisible.com

Voir aussi l’outil Tails (distribution Linux) https://tails.boum.org/index.fr.html

1.1.3.6     Peut-on effectuer des traductions de textes sur le web ?

Des outils gratuits sont disponibles en ligne pour traduire des textes, voire des pages web. Les résultats sont certes souvent discutables, mais pour une première approche, ces technologies peuvent être d’une aide réelle à la recherche.

Sur Voila (technologie Systran)              http://tr.voila.fr

Sur Google (technologie Systran)           http://www.google.fr/language_tools?hl=fr

Sur Alta Vista (technologie Systran)       http://babelfish.altavista.com/   / http://fr.babelfish.yahoo.com/

Sur Reverso (technologie Reverso)         http://www.reverso.net