TNS Sofres Elections : 20 heures, la France attend...Client de longue date de SAS, TNS Sofres utilise depuis deux ans le module d'optimisation SAS/OR®. « Le meilleur outil du marché » dans ce domaine, selon le Directeur scientifique de l’institut de sondages. Pour quelles problématiques spécifiques avez-vous décidé de faire appel à SAS/OR ? TNS Sofres: Nous avons adopté le module SAS/OR pour différentes applications. Il est notamment utilisé depuis plus de deux ans pour élaborer l'échantillonnage des sondages politiques de Sofres Opinion. Il s'agit d'une tâche complexe, avec des contraintes multiples : il faut en effet que l'échantillon soit représentatif de la couleur politique des circonscriptions françaises, de la taille des agglomérations et de la population selon l'âge, le sexe, la CSP. SAS/OR est par ailleurs employé pour réaliser des échantillonnages aléatoires sous contrainte lors de certaines études ou enquêtes qui doivent par exemple représenter X % de femmes, Y % d'hommes, Z % de moins de 20 ans… Nous l'utilisons également pour les fusions d'enquêtes d'audience et de panels de consommateurs. Il s'agit alors de fusionner ces fichiers avec des variables communes en limitant le risque d'erreur. Enfin, nous déployons actuellement ce module afin d'optimiser les tournées de nos enquêteurs, tant en termes de coûts que de délais. Pourquoi avoir choisi SAS ? TNS Sofres : TNS Sofres utilise depuis longtemps le module statistique de SAS et ses outils de stockage de données issues des fichiers d'enquête. C'était donc un prolongement naturel. Nous aurions pu opter pour des logiciels de spécialistes. Mais cela nous aurait obligés à transférer nos données vers ces solutions. De plus, le module SAS/OR est, à mon avis, ce qui se fait de mieux sur le marché. L'expérience montre selon moi qu'il est bien meilleur que les logiciels spécialisés qui ne disposent d'ailleurs pas de l'étape Data. La qualité des algorithmes est surprenante. SAS a vraiment son mot à dire dans le domaine de l'optimisation. La valeur ajoutée de SAS/OR est encore trop mal connue. Concrètement, quels sont les bénéfices apportés par cette solution ? TNS Sofres : Ils sont multiples. Concernant l'utilisation pour le plan de sondage Sofres Opinion, nous pouvons tirer un échantillonnage en une vingtaine de minutes. Cela nécessitait auparavant plusieurs jours de travail ! Le gain de temps est identique pour la fusion des fichiers. Cette rapidité de réponse réduit bien sûr le coût des opérations et améliore le fonctionnement des équipes qui peuvent se consacrer à d'autres tâches. Au-delà, nous gagnons aussi en rigueur avec une solution scientifique, reproductible et simple d'utilisation. L'application ne nécessite pas de serveurs et de PC ultraperformants. Le logiciel peut fonctionner sur un simple ordinateur portable, sans l'intervention de spécialistes de l'allocation de ressources ou de l'échantillonnage. Une révolution ! 22 avril 2007, 20h00 ...Dans les villes les bureaux de vote viennent à peine de fermer mais déjà sur TF1 dix-neuf millions de téléspectateurs attendent les premières estimations de TNS Sofres. Comment sont calculés ces chiffres si proches de la réalité finale ? Grâce à des outils décisionnels d'analyse prédictive, nous explique le Directeur scientifique de TNS Sofres. Quel est l'enjeu d'une soirée présidentielle pour TNS Sofres ?
C'est un enjeu d'image majeur : devant 19 millions de téléspectateurs et pour une échéance aussi importante, nous n'avons pas le droit à l'erreur ! Dans un contexte concurrentiel, où trois instituts proposent une estimation, l'objectif est clair : il s'agit d'être, dès 20 heures, aussi proche que possible des résultats qui seront donnés à 23 heures par le Ministère de l'Intérieur. Et chaque décimale est importante : cette année par exemple, nous étions le seul institut à donner Nicolas Sarkozy à plus 30 % dès 20 heures. Nos confrères d'Ipsos le donnaient à 29,7 %. Une différence minime, mais très importante sur le plan psychologique ! Quel dispositif mettez-vous en place le jour de l'élection ?
Tout commence sur le terrain, avec des enquêteurs présents dans 219 bureaux de vote. Ils transmettent les résultats par téléphone, en trois appels : un premier pour le chiffre de la participation, un deuxième pour des résultats partiels après dépouillement des 200 premiers bulletins (vers 18h50 pour les bureaux fermant à 18 heures), un dernier pour les résultats définitifs. Dans notre centre de Montrouge, des opérateurs entrent les résultats dans une base de données. Après un premier contrôle de vraisemblance des données (pour éviter toute erreur), nos statisticiens entrent dans la base et extrapolent un résultat national. A chaque nouvelle remontée du terrain, le résultat s'affine. En bout de chaîne, les experts politologues de TNS Sofres et du CEVIPOF (le centre de recherches politiques de Sciences Po) croisent les données et livrent à TF1 l'estimation finale. Les résultats donnés à 20 heures sont issus de bureaux fermant à 18 heures et essentiellement ruraux... Comment faites-vous pour tenir compte des villes, dont les bureaux de vote ferment à 20 heures ? C'est là qu'entrent en jeu les outils d'analyse prédictive. Les données brutes que nous faisons remonter des premiers bureaux sont retraitées selon notre expérience des élections passées. Nous savons par exemple que les campagnes votent plus à droite que les villes : ainsi, le 22 avril, les données brutes collectées à 20 heures donnaient 33 % pour Nicolas Sarkozy ; les calculs d'analyse prédictive nous ont permis de livrer une estimation à 31 %, très proche du résultat réel (31,18 %). Quel est le secret d'une bonne estimation ?
Notre estimation le soir du second tour a été très proche du résultat réel. Tout d'abord, la composition de l'échantillon. Ce dernier, pris dans son ensemble, doit être proche des résultats des élections de référence (présidentielles et législatives 2002, régionales 2004). Pour autant, nous ne cherchons pas des bureaux qui « votent comme la France ». Au contraire, nous privilégions des bureaux très « typés » (untel très marqué à gauche, l'autre très UMP, un bureau où les chasseurs ont fait un gros score en 2002...), et relativement stables dans leur comportement. Cette stabilité de nos bureaux est importante. En effet, lorsque les résultats remontent, nous les comparons avec la base historique : en cas de variation trop importante, on estime qu'un enjeu local a pu fausser la donne et nous retirons le bureau de l'échantillon. L'autre secret, c'est la rapidité du calcul. Car tout se joue très vite - surtout entre 19h30 et 19h50 ! Pour la première fois cette année, vous avez intégré des outils décisionnels dans votre système. Quel a été leur apport ?
Au cœur du dispositif, il y a les outils d'analyse prédictive dont nous avons parlé plus haut. Mais les outils ont permis d'aller au-delà du calcul. En amont, les logiciels d'analyse (en lisant directement dans la base) ont su détecter les invraisemblances et corriger automatiquement les erreurs. Et en aval, les rapports SAS ont été fournis dans un format directement utilisable par les politologues, ce qui nous a permis de faire l'économie d'un logiciel spécifique de reporting. La solution s'avère également plus pérenne : parce que les statisticiens peuvent entrer directement dans le code SAS, ils peuvent savoir ce qui se passe sur l'ensemble de la chaîne, facilitant les éventuelles interventions de maintenance. Dernier atout, enfin : la souplesse. Au final, nous avons pu tourner avec 2 PC qui actualisaient les données toutes les 15 secondes : important dans un contexte de pression comme celui d'une présidentielle ! Et pour les élections suivantes ?
Notre modèle est transversal à toutes les élections. Reste à le paramétrer en fonction du type de scrutin. Pour les Législatives (plus complexes parce que locales), nous avons travaillé sur un échantillon stratifié de 317 bureaux - avec des strates de 30 à 40 bureaux relativement homogènes dans leur comportement historique. Pour les projections en siège, nos estimations sont le produit d'un double travail d'analyse statistique (par nos outils informatiques) et d'analyse politique de nos experts. Au final, notre première estimation le soir du second tour a été très proche du résultat réel. TNS Sofres, leader français des études marketing et d'opinion
Créé en 1963, TNS Sofres est le No 1 français et deuxième groupe mondial des études marketing et d'opinion. L'institut de sondage emploie 600 collaborateurs permanents et dispose d'un réseau de 1 550 enquêteurs. Pour assurer la pertinence maximale de ses interventions, TNS Sofres est structuré autour de 12 centres d'expertise spécialisés par secteur d'activité. Il fait partie du groupe international TNS, présent dans plus de 70 pays à travers le monde et capable, grâce à son réseau de partenaires, de réaliser des études dans 110 pays. Copyright © SAS Institute Inc. All Rights Reserved. |