Google Dataset Search est un nouveau moteur de recherche permettant de rechercher des ensembles de données ouvertes. Cet outil se destine aux chercheurs, aux scientifiques, aux journalistes, ou à toute autre personne ayant besoin d’accéder aux Open Data sur une thématique spécifique.
Le mouvement » open-data « cherche à ouvrir l’accès aux données pour permettre à tout un chacun de les utiliser ou de les réutiliser. Des agences gouvernementales, des scientifiques, des institutions de recherche ou même des particuliers contribuent à ce mouvement en maintenant des milliers de bases de données ouvertes autour du monde. Au total, on compte des millions d’ensembles de données ouvertes.
Cependant, jusqu’à présent, il était difficile de savoir quels types de données sont disponibles. Même en sachant qu’un ensemble de données ouvertes existe, il était difficile de le localiser. A peu de choses près, la seule solution était le bouche-à-oreille.
Cette restriction est particulièrement problématique pour les jeunes chercheurs qui n’ont pas encore beaucoup de connexions professionnelles. C’est également un problème pour les chercheurs d’un domaine qui ont ponctuellement besoin de données en provenance d’un autre domaine. Par exemple, un épidémiologue qui aurait besoin d’accéder à des données climatiques pour comprendre la propagation d’un virus.
Google Dataset Search permet de chercher des données ouvertes sur une thématique spécifique
Announcing the launch of Dataset Search, a new way for researchers to find the datasets they need, wherever they’re hosted, whether it’s a publisher’s site, a digital library, or an author’s personal web page. Learn more at https://t.co/tpdOkjAVgW pic.twitter.com/kvlmDOHSO1
— Google AI (@GoogleAI) September 5, 2018
Afin de remédier à ce problème, Google vient de lancer le Dataset Search : un nouveau moteur de recherche permettant d’exporter les données ouvertes. Ce moteur de recherche gratuit vise à aider les scientifiques, journalistes, ou toute autre personne qui a besoin d’accéder à des données ouvertes.
Plutôt que de lire le contenu des fichiers, à la manière d’un moteur de recherche web comme Google, Dataset Search localise les fichiers et les bases de données en fonction de la façon dont leurs propriétaires les ont classifiés à l’aide du vocabulaire standardisé Schema.org. Google a également développé un algorithme pour trier les ensembles de données.
Google Dataset Search est disponible depuis le 5 septembre 2018. Il rejoint la liste des différents moteurs de recherche spécialisés de Google, tels que Google News, Google Images, Google Scholar et Google Books.
- Partager l'article :