Accueil > Analytics > Data Analytics > Présidentielle : Emmanuel Macron plus fort que le Big Data ?
présidentielle macron plus fort que le big data

Présidentielle : Emmanuel Macron plus fort que le Big Data ?

Ce dimanche 23 avril 2017, le Big Data s’est trompé. Alors que beaucoup estimaient les technologies analytiques plus fiables que les sondages traditionnels, aucun algorithme ou presque n’avait prédit la présence d’Emmanuel Macron au second tour de l’élection présidentielle. Que s’est-il passé ? Comment expliquer cet échec ? Faut-il renoncer aux analyses prédictives dans le domaine politique ? Telles sont les questions auxquelles nous allons tenter de répondre.

Il y a quelques mois, dans le cadre de l’élection présidentielle américaine, la victoire de Donald Trump face à Hilary Clinton a surpris tout le monde. Ou presque. Alors que les instituts de sondage sont tombés des nues, le Big Data était parvenu à prédire ce coup de théâtre. Depuis lors, les entreprises spécialisées dans les analyses prédictives jouissent d’une crédibilité accrue par rapport aux instituts de sondage traditionnels, notamment auprès des militants.

Aucun algorithme n’a prédit la victoire d’Emmanuel Macron au premier tour

Toutefois, tout comme le Big Data n’avait pas réussi à anticiper le Brexit, il n’a pas été en mesure de prévoir le triomphe d’Emmanuel Macron au premier tour de l’élection présidentielle. Le Canadien Filteris, proche de François Fillon, envisageait un duel entre ce dernier et Marine Le Pen au second tour, au même titre que les étudiants de Telecom Paris Tech. Il en va de même pour la startup Vigiglobe, qui prédisait une victoire de François Fillon.

De son côté, l’agence suisse Enigma escomptait un second tour entre Jean-Luc Mélenchon et François Fillon. Au final, seul le fonds d’investissement Leonie Hill Capital est parvenu à prévoir l’accès de Marine Le Pen et Emmanuel Macron au second tour. Là encore toutefois, la prédiction était imprécise puisque la firme estimait que la candidate FN arriverait en tête avec 28% de voix contre à peine 20% pour le fondateur du parti En Marche !. En somme, aucun algorithme n’a réussi à prédire la victoire d’Emmanuel Macron au premier tour.

Présidentielle : le Big Data s’est trompé, car internet ne reflète pas la société française

Mise à part la  « dimension christique » d’Emmanuel Macron, plusieurs facteurs permettent d’expliquer cet échec du Big Data. Contrairement aux instituts de sondage, les modèles prédictifs prennent en compte de nombreuses données démographiques, électorales, sociologiques, et se basent surtout sur les tendances qui se dessinent sur internet.

Ainsi, la startup Vigiglobe se base sur le buzz des candidats sur les divers réseaux sociaux, Filteris analyse les positionnements des internautes sur divers sujets politiques, et Enigma passe en revue les recherches effectuées sur Google. Cette prise en compte des données générées par l’activité des internautes est censée être le principal point fort du Big Data face aux sondages traditionnels.

Force est de constater que cette façon de procéder est encore loin d’être infaillible. La raison est évidente : internet est encore loin de refléter la société française dans son ensemble. Par exemple, la majorité des utilisateurs des réseaux sociaux sont des jeunes. Or, chez les 18-24 ans, Jean-Luc Mélenchon a réussi à capter 30% des voix. Le décalage avec le reste de la société est donc tout bonnement gargantuesque.

De même, les tendances relevées par Google Trends indiquent une forte hausse des recherches sur Emmanuel Macron et Jean-Luc Mélenchon au cours des dernières semaines. Pour autant, rien n’indique que ces recherches traduisent une intention de vote. Enfin, de manière générale, les candidats les plus actifs sur les réseaux sociaux sont aussi les plus présents sur la toile. Grâce à la popularité de sa chaîne YouTube, Jean-Luc Mélenchon bénéficie là encore d’un avantage sur la toile.

Combiner sondages et Big Data pour des prédictions plus précises

Bien sûr, les résultats indiqués par ces données collectées sont ensuite tempérés par des algorithmes, pour tenter de les adapter aux nuances du monde réel. Cependant, les données étant biaisées dès le départ, aucune intelligence artificielle n’est suffisamment avancée pour rectifier le tir efficacement. En conclusion, le Big Data n’est pas (encore) l’alternative idéale aux sondages traditionnels.

Dans les années à venir, l’augmentation du pourcentage de citoyens connectés, et l’amélioration des technologies de Machine Learning et de Big Data devraient toutefois renforcer la précision de ces analyses prédictives. Plus le monde réel convergera avec le virtuel, plus le Big Data sera en mesure d’anticiper les résultats de l’élection présidentielle.

En attendant, il est probable que les sondages traditionnels et les analyses Big Data se complètent pour proposer des prédictions plus précises. Les instituts de sondage s’intéressent de plus en plus à ces technologies nouvelles. Depuis 2016, BVA tend à prendre en compte les réseaux sociaux pour étoffer ses enquêtes. De même Opinion Way a ouvert un département dédié à l’analyse des réseaux sociaux en 2014. La combinaison de ces deux approches prédictives pourrait permettre de mieux comprendre la société française dans son ensemble, avec toutes les nuances démographiques qui la fragmentent, et ainsi donner naissance à des prévisions plus fiables pour l’élection présidentielle.

A lire également

amazon whole foods

Amazon : le rachat de Whole Foods va permettre à la firme d’utiliser le Big Data en magasin

La semaine dernière, Amazon annonçait le rachat de Whole Foods Markets pour la somme colossale …

Send this to friend