Question d'origine :
Bonjour,
1 - quelles sont les données stockées par la société de Google, un des moteurs de recherche de l'internet ?
2 - Quels sont les risques de ne voir subsiter qu'un seul moteur ?
3 - La France et/ou l'Europe sont elles en train de financer leur propre moteur ?
Si non, l'envisagent elles ?
Merci d'avance pour vos éléments de réponse.
Réponse du Guichet
bml_sci
- Département : Sciences et Techniques
Le 15/02/2005 à 13h44
Afin d'offrir une recherche rapide sur le web, trois étapes sont nécessaires :
- le parcours du Web, appelé "crawl"
- l'indexation
- la recherche
Pour construire l'index, les ordinateurs Google commencent par télécharger les pages susceptibles d'intéresser les utilisateurs. Le robot Google doit arpenter la totalité du web.
Pour déterminer les pages éventuellement intéressantes, Google prend en compte plusieurs critères, et tout particulièrement le nombre de liens vers une page précise. De plus il arpente les pages générées automatiquement comme les archives d'anciens groupes de discussions du Web. ...
Les ordinateurs qui arpentent le web sont connus sous le nom de GoogleBot...Google utilise deux techniques pour arpenter le web : le deep crawl (analyse en profondeur) et le fresh crawl (mise à jour)...
L'index est en fait une liste de mots auxquels sont liées les adresses de pages web ainsi que l'emplacement de ces mots dans les pages...
En réponse à une requête... pour chacune des pages sélectionnées, Google calcule une note en fonction de différents critères : dans quelle zone apparait le mot recherché : en-tête, titre, page...
In : Tout réussir avec Google
Voici quelques chiffres donnés par Google sur le site
Nombre de pages explorées : plus de
Images : plus de 880 millions
Messages Usenet : plus de 845 millions
Nombre de langues dans lesquelles l'interface de Google a été traduite : plus de 100
Nombre de langues dans lesquelles Google offre des résultats : 35
Nombre de domaines : plus de 100
Salariés : plus de 2 500 dans le monde
Pour avoir plus de connaissances sur l'ensemble des moteurs de recherche nous vous conseillons
- la lecture des revues Bases et Netsources
- de consulter le site Abondance qui fait référence en la matière, qui donne un aperçu des principaux moteurs et annuaires de recherche, qui donne également un classement (déjà ancien ) des moteurs de recherche.
Google vient de créer
Dans le cadre du projet Google Print, Google a annoncé qu’il allait numériser plus de 15 millions de volumes provenant des bibliothèques des universités de Harvard, de Stanford, du Michigan, d’Oxford, ainsi que de la Bibliothèque publique de New York.
Une fois numérisés, les livres pourront être consultés sur Internet. Si ceux-ci sont tombés dans le domaine public, le texte intégral sera disponible gratuitement. Sinon, seuls des extraits et les références seront proposés.
Les 8 millions d’ouvrages de Stanford seront scannés, ainsi que les 7 millions de l’université du Michigan. On y trouvera également les livres d’Oxford datant d’avant 1900. Des livres exceptionnels seront mis à disposition comme la première édition des "Principes" d’Isaac Netwon qui date de 1687 ou "De la descendance de l’homme" de Charles Darwin publié en 1871.
Voici une bibliographie sur l'actualité Google faite à partir du journal Le Monde en ligne.
Voici enfin un nouveau moteur de recherche développé en France : Exalead par une entreprise privée.
DANS NOS COLLECTIONS :
Ça pourrait vous intéresser :
Commentaires 0
Connectez-vous pour pouvoir commenter.
Se connecter