Chaque jour nous vaut son lot de sondages sur l’élection présidentielle. Et voilà que Nicolas Sarkozy croise la courbe de François Hollande, et voilà que Jean-Luc Mélenchon dépasse François Bayrou et Marine Le Pen, atteignant le seuil symbolique des 15%.
Bien sûr, chaque publication se fait fort de reproduire l’avertissement de la Commission des sondages : « les sondages ne sont qu’un instrument d’analyse de l’opinion publique et non pas un outil de prévision des résultats électoraux. » Il n’empêche que les politologues en tirent des conclusions hâtives.
Or ces sondages sont entachés de nombreux biais et approximations qui mettent en cause leur « vérité » présentée comme scientifique voire comme parole d’Évangile.
Premier biais : les fameux « redressements ». Les chiffres bruts sont corrigés à la hausse ou à la baisse, sous prétexte que des électeurs auraient honte de déclarer leur vote pour tel ou tel. En 2002 et 2007, les scores de Jean-Marie Le Pen étaient multipliés par deux voire par trois. On sait que cette correction fut insuffisante en 2002, et comme pour se rattraper, les sondeurs ont poussé le balancier trop loin dans l’autre sens en 2007. Et qu’en est-il pour Marine Le Pen en 2012 ? Mystère total, puisque les chiffres bruts sont soigneusement cachés au public.
Ces redressements relèvent donc plus de cuisine interne et opaque que d’une démarche scientifique. On dit qu’il se baseraient sur les déclarations de vote des sondés quand on les interroge sur leurs votes précédents. Encore faudrait-il qu’ils s’en souviennent, et qu’ils ne mentent pas… par honte ! Les nombreux déçus du sarkozysme diraient-ils tous qu’ils ont voté pour l’actuel président-candidat en 2007 ? Et si les vieux « frontistes » ne se gênent plus de dire vouloir voter pour Marine Le Pen, qu’en est-il de nouveaux électorats qu’elle pourrait conquérir, comme les fonctionnaires ou les personnes âgées, qui pourraient craindre le « qu’en dira-t-on » ? Et les jeunes, sont-ils plus francs et moins soucieux de la famée que leurs parents par franchise et bravoure, ou sont-ils encore plus soumis au « politiquement correct » de leurs aînés ? (1)Bref, les « redressements », c’est du doigt mouillé soumis à des vents contraires et qui peuvent donc aller dans tous les sens.
Second biais connexe aux redressements : les sondés peuvent tout simplement mentir. Voilà qu’on m’appelle au téléphone pour me demander pour qui je vais voter. La dame au bout du fil se présente de la part de tel ou tel institut, mais je n’ai aucun moyen de vérifier. Vais-je livrer mes opinions politiques (et parfois d’autres plus intimes parce que le sondage politique est noyé parmi d’autre pour limiter les frais) à une parfaite inconnue qui connaît donc mon numéro de téléphone et peut ainsi avoir mon identité ? Alors oui, je serai tenté de lui mentir, de lui dire que je ne pratique pas la sodomie, que j’ai tout ce qu’il me faut en équipement internet et téléphonique, et que je ne soutiens pas l’ultra-gauche.
Second biais : les refus de répondre. Dans une interview de 2011 Brice Teinturier, grand sondeur devant l’Éternel et les caméras, nous apprenait que pour constituer le classique panel de 1000 votants, les instituts de sondage réalisaient 7000 appels. Alain Garrigou, spécialiste du sujet qui donne moult conférence, parle quant à lui de 13 000 appels pour obtenir 1000 réponses. Soit un rapport moyen de 1 à 10 !
Quand est-ce que les sondeurs tombent sur « des becs » ? Quand ils appellent en pleine journée des gens qui sont au boulot et qui se lèvent tôt et non des chômeurs ou bénéficiaires du RSA, ou des gens ronchons qui refusent de répondre et qui raccrochent au nez, ou des personnes âgées qui se méfient de tout ou qui sont un peu sourdes, etc. Bref des « catégories » de citoyens qui par leur sociologies spécifiques pourraient faire pencher la balance dans tel ou tel sens, et qui pourtant iront voter le 22 avril. Quel énorme biais ! (2)
Il y a un autre « redressement » effectué par les sondeurs, pour respecter les « quotas » : il faut telle proportion de femmes, d’ouvriers, de personnes de 18 à 24 ans, de ruraux, etc. Or malgré les milliers d’appels réalisés, on n’a évidemment pas les quotas nécessaires. On aura davantage de femmes au foyer que d’hommes au travail en appelant en pleine journée. On va donc augmenter les résultats des catégories sous-représentées et diminuer ceux des autres. Jusqu’à quel point ? Mystère là aussi ! Sur 1000 personnes, si on ne tombe que sur 50 ouvriers alors qu’ils représentent le tiers des électeurs, on risque de multiplier les erreurs parce qu’on n’a pas du tout un échantillon représentatif.
Il y a aussi les « tricheurs », qui donnent des réponses d’une affligeante banalité pour ne pas paraître extrémiste ou… pour piéger les sondeurs et leur réserver une bonne surprise le 22 avril. D’autant plus que les sondeurs sont classés dans la caste médiatico-politique qui est… leur commanditaire ! Il faut tout de même savoir que si le journal qui commande un sondage décide de ne pas le publier parce que le résultat ne lui convient pas, les chiffres sont mis au pilon, interdits de publication et le grand public n’en saura rien. Quand on sait qu’instituts de sondages et grands médias sont aux mains de la même oligarchie financière des banques, des grands industriels et du CAC 40, ça laisse rêveur.
Il y a enfin ces écarts assez importants entre deux sondages effectués les mêmes jours. On nous explique cela par la « marge d’erreur » qu’on chiffre à 2 ou 3%. C’est déjà une approximation très douteuse mathématiquement : il n’y a pas de marge d’erreur brute, mais une marge en fonction d’un « intervalle de confiance ». Sans entrer dans les détails, il faudrait dire qu’en interrogeant par exemple 1000 personnes, il y a 95% de « chance » que le résultat sur l’ensemble des Français votants se situe dans la fourchette indiquée, dans ce qu’on appelle « intervalle de confiance », qui n’a rien à voir avec une « marge d’erreur » telle qu’on la détermine par exemple en physique ou en chimie. Et si on met la barre à 99% au lieu de 95%, la fourchette est plus large, et inversement. Donc les marges d’erreur désormais communiquées par les sondeurs sont totalement sujettes à caution, puisque basée sur un « intervalle de confiance » à 95%, chiffre admis par les statisticiens mais lui-même arbitraire. Pourquoi 95% et non 96% ou 90% ?
Sur les plateaux de télévision, les sondeurs ne vous disent pas ça, mais vous expliquent les écarts entre les résultats de leurs instituts respectifs par cette « marge d’erreur »… sans vous expliquer qu’elle est basée sur une probabilité totalement arbitraire de 95%. Donc les marges d’erreur sont également arbitraire, puisque basées sur une probabilité arbitraire !
Mais pire encore, quand deux sondages du même jour (3 mars 2012), CSA et Ifop vous donnent respectivement 15 et 12,5% pour Jean-Luc Mélenchon et 13 et 15,5% pour Marine Le Pen, nous sommes dans les limites des marges d’erreur (de l’ordre de 2%, puisque la marge diminue quand on s’éloigne des 50%), marge d’erreur qu’il faut là encore rapporter à la probabilité arbitraire de 95%. Et si on calculait la probabilité de « recoupement » des chiffres annoncés par CSA et Ifop, c’est-à-dire la probabilité de trouver une valeur moyenne fiable, nous tomberions à 4 à 7% de « chance » que les choses se passent comme on nous le présente ! (Je vous passe les calculs détaillés, j’ai juste fait une estimation par un graphique simpliste mais qui donne un bon ordre de grandeur).
Veuillez me pardonner ces explications techniques un peu sommaires et assommantes, mais je ne veux pas vous abreuver de formules et de graphiques indigestes. Tout ce que je voulais dire, c’est que si les sondages nous donnent de bons ordres de grandeur à coup de grandes louches pifométriques, en tirer des conclusions comme « Sarkozy dépasse Hollande » ou « Mélenchon devient le troisième homme » est aussi abusif que de prévoir le prochain résultat du tiercé.
Djamila GERARD
(1) Le cas de la difficulté du « redressement » du score de Marine Le Pen est bien plus problématique que celui de son père. Pour celui-ci, qui se présentait à toutes les présidentielles (sauf celle où il n’a pas obtenu ses signatures), la correction était plus aisée que pour sa fille, « novice » et dont on mesure encore mal l’importance de la « dédiabolisation ». Des sondeurs exagèrent tellement celle-ci qu’ils « redresseraient » Marine Le Pen à la baisse, et Sarkozy à la hausse parce qu’il paraîtrait que le vote Sarkozy serait le nouveau « vote honteux ». Va savoir ! Tout cela ressemble à du pifomètre.
(2) On voit souvent fleurir sur le net des rumeurs de « sondages des RG » qui donneraient des scores en contradiction avec les sondages « officiels ». C’est à prendre avec des pincettes, puisqu’il s’agit la plupart du temps d’intox de la part de militants. Cependant il faut savoir que même s’ils ne donnaient pas leurs résultats sur la place publique, les Renseignements généraux avaient des méthodes de « sondage » qui éliminaient de nombreux biais. Par tout un réseau d’informateurs, ils enquêtaient d’une manière très proche des gens. Par exemple, un « infiltré » laissait traîner ses oreilles en salle des profs, dans un bar, dans une usine, là où les gens parlaient plus franchement de gré à gré à un collègue qui les avait mis en confiance qu’avec qu’à un sondeur anonyme par téléphone ou de vive voix.
On dira plus facilement : « Marine, elle ne dit pas que des conneries », « Sarkozy, je vais revoter pour lui », « Il est bon, Hollande » ou « Mélenchon, c’est le meilleur » à un collègue qui vous met en confiance qu’à une personne que vous ne connaissez pas et qui vous dérange au téléphone. Tout cela était décortiqué, analysé et regroupé en haut lieu à partir de dizaines de milliers de « sondés », bien plus que pour un sondage officiel. Mais il paraît que les RG, désormais regroupés au sein de la DCRI, ne font plus d’enquêtes « politiques »…