Question d'origine :
Bonjour,
Je voudrais savoir quels sont les sites ou les moyens à utiiser pour pouvoir consulter le web profond. Merci d'avance pour votre réponse.
Réponse du Guichet
bml_sci
- Département : Sciences et Techniques
Le 25/04/2014 à 13h35
Bonjour,
Le "web invisible" (deep web, hidden web) désigne la partie du web non accessible aux moteurs de recherche classiques.
Le web invisible comprend des bases, banques de données et bibliothèques en ligne gratuites ou payantes...
Le métamoteur britannique, utilise des moteurs de recherches spécialisés permettant de rechercher dans des bases de données ou des documents du "web profond" dans des domaines spécialisés. Turbo10 offre en effet la possibilité de se connecter à plus de 1000 moteurs spécialisés ou généralistes. Turbo10 interroge par défaut altavista.com, dogpile.com, google.com, hotbot.com, lycos.com, metacrawler.com, search.msn.com et yahoo.com, donc des moteurs plutôt anglophones.
Vous pouvez choisir de rajouter, grâce au module "My Collection", les moteurs figurant dans une liste assez impressionnante (1170 à ce jour). Vous pouvez choisir un moteur généraliste comme voila.fr ou des moteurs spécialisés. Ce qui permet à Turbo10 d'explorer (un peu) le "web invisible" ou "web profond" (l'équipe a même déposé la marque Deep Net !). Car cette liste propose des moteurs internes de portails, de vastes bases de données universitaires ou sites de e-commerce : zdnet.com, amazon.com, europages.net (annuaire de sociétés), imdb.com (cinéma), dictionary.com (dicos et thésauri), eea (european environment agency), encyclopedia.com, findarticles.com (archives d'articles depuis 1998), etc…Une fois constituée votre collection de moteurs, celle-ci apparaîtra dans un menu déroulant à droite de votre boite de requête.
Encore lui ? Google, moteur étonnant, à part, indexe des formats de documents de plus en plus nombreux et même certaines pages "confidentielles" oubliées par les webmasters sur le net
Parmi les formats de documents indexés par Google : le PDF, les documents Words, Excel.
Pour une requête sur un format précis, tapez filetype: suivi de l'extension du type de document recherché. Exemple : pour rechercher des documents au format Excel contenant le mot "bilan", tapez : filetype:xls bilan. Plus d'infos dans Astuces et Fonctions Google.
Moteur de recherche britannique spécialisé dans les ouvrages de référence : encyclopédies, dictionnaires, thesauri & recueils de citations. Thèmes : art, santé, langues, philosophie, musique, sciences, technologies, géographie et littérature anglaise...
Le métamoteur Profusion (d'Intelliseek) propose notamment de rechercher des résultats dans le "web invisible" c'est à dire des bases de données de texte, sons, images, articles, magazines, livres…). Profusion propose de sélectionner les sources d'information et moteurs parmi des thématiques verticales (gouvernement, emploi, science, santé, juridique, enseignement, technologies, voyages, finance, art, business…). Ainsi, par exemple, vous pouvez choisir d'effectuer une recherche au sein d'encyclopédies (Encarta, Encyclopedia.com, InfoPlease, Internet Public Library, References) ou de bases de données et publications dédiées à la biologie (BioLinks, Discover Magazine, NBII …).
Permet de rechercher parmi plus d'1 million de documents au format Adobe PDF (Portable Document Format)
Wondir associe les possibilités d'un métamoteur et d'un service de recherche humain. Wondir est différent des autres outils de recherche. D'abord parce qu'il est géré par une organisation à but non lucratif. Le but de cette fondation est de fournir de l'information de haute qualité à tous.
Ensuite parce que Wondir combine la technologie d'un métamoteur à des technologies propriétaires qui permettent d'utiliser les ressources du web invisible.
Lorsque l'on tape une requête, la page de résultats se divise en plusieurs parties :
- les résultats web
- les résultats issus des newsgroups (forums de discussion) et mailing lists (listes de diffusion)
- les propositions de service d'experts de la communauté Wondir pouvant potentiellement répondre à votre question
- des questions et leurs réponses en relation avec la requête
- des dépêches d'actualités liées au domaine de la requête.
Wondir dispose en effet d'une communauté de volontaires qui répondent aux questions trop complexe pour le moteur de recherche.
C'est pour cela que Wondir a besoin de votre aide. Vous pouvez mettre votre savoir et vos connaissances à disposition en répondant aux différentes questions qui défilent sur le bandeau "question ticker". Ce bandeau déroulant permet de montrer à tous les visiteurs quelles sont les questions posées par les internautes. On peut y répondre par messagerie instantanée, par mail ou sur un forum. En répondant à une question, vous pouvez gagner des prix.
Les possibilités et la puissance de Wondir augmenteront donc avec le nombre d'internautes utlisateurs.
Incy Wincy de la société LOOP improvments utilise l'Open Directory Project. En crawlant à l'intérieur des sites de cet annuaire, le moteur Incy Wincy construit un index de milliers de moteurs de recherche internes rencontrés. Exemple : Une requête sur la "CIA" permettra de détecter, sur les sites proposés par l'ODP, le moteur de l'United States Intelligence Community. Une recherche sur "Chimie" affichera, parmi les résultats les moteurs internes du Bottin de la Chimie et de l'Ecole Nationale Supérieure de Chimie de Rennes. On peut ensuite réutiliser ces moteurs par un simple click pour préciser la recherche. Une démarche originale.
(Extrait de Web invisible Web caché Web profond)
Vous pouvez également consulter les documents suivants :
- Recherche éveillée sur Internet : mode d'emploi, par Béatrice Foenix-Riou.
- Organiser sa veille sur Internet : au delà de Google..., par Xavier Delengaigne.
DANS NOS COLLECTIONS :
Ça pourrait vous intéresser :
Qui est le créateur de la marque de pâtes Hartaut-Ghiglione...
Commentaires 0
Connectez-vous pour pouvoir commenter.
Se connecter