En ce moment même, la Silicon Valley entreprend de miner les données du monde entier. Toutefois, le Big Data ne couvre pas le monde dans sa globalité. L’Afrique en particulier est absente de la plupart des ensembles de données.
L’Afrique délaissée par les réseaux sociaux et les médias traditionnels
Sur les réseaux sociaux, principale source du Big Data, l’Afrique brille par son absence. Le fil originel de sujets tendances de Facebook est dépourvu de sources d’actualités africaines. De même, sur Twitter, les informations sur l’Afrique et le Moyen-Orient font cruellement défaut.
En termes de recherches web, une simple analyse de Google Trends démontre à quel point les internautes américains négligent l’Afrique. Ce continent fait l’objet d’un nombre de recherches largement inférieur aux autres.
Même la communauté de l’US intelligence, en dépit de ses vastes ressources, accorde peu d’importance à l’Afrique. De 1994 à 2004, les agences de l’US OSINT, responsables de la surveillance des actualités mondiales, ont principalement observé l’Afrique à travers le regard des médias européens comme l’AFP.
C’est l’une des raisons pour laquelle les programmes de surveillance gouvernementaux américains ont manqué la première vague épidémique d’Ebola. En effet, les premiers signes alarmants ont été annoncés par des médias francophones, plus difficile à surveiller que les actualités anglophones agrégées par Google News.
À la télévision aussi, les journaux télévisés mentionnent rarement l’Afrique, surtout aux États-Unis. Pour résumer, l’Occident n’est pas intéressé par l’actualité africaine. Reste à savoir si ce sont les médias internationaux qui ne couvrent pas suffisamment l’actualité du continent, ou si cette actualité n’intéresse tout simplement pas les citoyens.
Une actualité riche, mais négligée
On pourrait penser qu’il n’y a tout simplement pas suffisamment d’actualité à couvrir en Afrique. La carte ci-dessous montre les lieux dont l’actualité a été couverte par le projet open data GDELT Project entre février et juillet 2015, classés par principal langage de couverture.
En dehors du désert du Sahara, très peu peuplé, on constate que de nombreux événements survenus en Afrique n’ont pas été couverts par les médias anglais. Le principal langage utilisé pour couvrir l’actualité africaine semble être le Français, suivi par le Portugais.
Combinés, tous ces constats démontrent que l’Afrique est bel et bien délaissée par le Big Data, absente des ensembles de données, et laissée de côté lors des analyses d’ensembles de données traditionnels.
Toutefois, en se focalisant particulièrement sur l’Afrique, et en utilisant les technologies nouvelles comme la Machine Translation, il est possible de ramener le continent dans le paysage des analyses Big Data. Il est simplement nécessaire que la communauté des sciences de données fasse des efforts pour s’assurer que les ensembles de données couvrent réellement le monde entier.
- Partager l'article :