Comments on Matrice de report des voix : mes résultats

ooten (2012-05-23T21:29:53Z)

Je suis tombé sur un article intéressant et concernant la prédiction des prochaines élections législatives : <URL: http://www.huffingtonpost.fr/2012/05/23/sondage-legislatives-ps-ump_n_1538457.html?ref=france >

JML (2012-05-18T17:00:17Z)

Ah, j'arrive un peu tard et tu en as déjà assez du sujet…
Tant pis ! Je vais commenter quand même.

Je voulais te faire remarquer qu'il n'y a pas de raison de s'intéresser plus à la matrice R du report de voix qu'à celle de la régression. Appelons-là T (matrice de transfert ?) : le coefficient (i,j) répond à la question « Une voix i au premier tour se transforme en combien de voix j au second ? », et, pour les raisons que tu as exposées, il n'est pas limité à [0,1], les électeurs de i ont le droit d'influencer d'autres électeurs dans un sens ou un autre, et ainsi multiplier ou effacer certains votes. C'est le domaine naturel de la matrice que l'on cherche, R n'ayant pas vocation à mieux comprendre les résultats du second tour puisque justement elle ignore de tels effets. Ce que dit, ou devrait dire, un petit candidat à l'élu pour sa négociation, c'est « je t'ai apporté x voix », pas « x de mes voix se sont reportées sur toi ».

Ce que l'on regrette que tu n'aies pas eu le courage d'évaluer, c'est une notion de marge d'erreur pour chaque coefficient de T. Intuitivement on voudrait regarder pour chaque coefficient son domaine dans toutes les matrices qui approchent l'optimum selon une certaine mesure, ou peut-être introduire un bruit dans les données et recalculer la matrice de régression de nombreuses fois, j'imagine qu'il y a des méthodes standards ; en tout cas il faudrait au minimum une manière de détecter des chiffres peu significatifs et ne pas les exposer dans le tableau final.

La régression fournit naturellement un T, tu cherches R : pourquoi penser que R est obtenue par une régression contrainte ? Il me semble que, si c'est le cas, il faudrait modéliser la relation entre R et T pour l'établir.
Je vais expliquer ce que j'entends par modèle.
Dans une commune donnée, avec son vecteur de votes au premier tour, R permet de répartir la population en nx4 cases selon le couple de votes au premier et au second tour. En fait, T le permet aussi, sauf qu'on a des cases avec un nombre négatif de gens (et trop de gens dans les cases positives) ; mais on a envie d'interpréter ce nombre négatif comme une influence négative sur un autre vote. Par exemple, d'après ta matrice T, on a envie de dire qu'1 voix Voynet au premier tour convainc 0.5476 voix absentionniste de voter plutôt comme les électeurs Voynet au second tour : on a envie de corriger la répartition de la population par T pour obtenir celle de R en ramenant la population (Voynet, abst.) à 0, en diminuant proportionnellement les (Voynet, Y) positifs pour en purger les abstentionnistes subvertis, idem pour les (X, abst.) positifs, et en reportant ces derniers votes dans les (X,Y) proportionnellement aux votes voynettistes. On répète pour toutes les cases négatives, on obtient une répartition que l'on somme pour toutes les communes. Dans ce modèle (1) chaque voynettiste convainc uniformément les futurs abstentionnistes (peu importe leur premier vote) (2) aucun voynettiste ne s'abstient (on ramène arbitrairement le négatif à 0) (3) le résultat dépend de l'ordre choisi sur les cases négatives, donc c'est pas terrible… Mais j'espère qu'il peut faire passer l'idée qu'on devrait avoir un mécanisme compréhensible (interprétable) pour passer de T, que l'on mesure, à R. Et si on trouve le même résultat qu'avec une régression contrainte, ça serait un résultat intrigant.

Tu parlais des résultats des sondages ou des analyses des politologues, mais le Canard enchaîné a rappelé très récemment à quel point cela peut être bidon (avec des résultats contradictoires d'un institut à l'autre etc.), et c'est cela qui m'a vivement intéressé dans cette série d'entrées : l'idée qu'il y a sans doute manière d'extraire des informations fiables (mais lesquelles ?) à partir de la masse des données des votes, adjointe éventuellement de données socio-éco.
N'hésite surtout pas à revenir sur le sujet !

ooten (2012-05-14T10:14:29Z)

Tu as pensé, quelles projections on pourrait tirer de cette élection présidentielle pour anticiper les résultats des législatives. Ca ne devrait pas être triste.
En gros les instituts de sondage ne prévoient, pour l'instant (tient ils n'utilisent pas seulement les résultats de la présidentielle, ça doit être encore moins triste à calculer), pas de cohabitation notamment grâce à une alliance généralisée des partis de gauche alors qu'à droite le FN et l'UMP ou assimilés se combattrons sans merci, c'est du moins le propos de leurs leaders après sur le terrain ?

régis (2012-05-14T08:10:58Z)

Salut Ruxor,
Tu prends des risques en présentant la Corse comme une collectivité ultramarine… même si politiquement parlant elle bleuit pas mal!

Vicnent (2012-05-14T07:45:09Z)

+1 avec Sondator.

Je pense que le modèle de report de voix proposé est trop simpliste. (Je n'ai pas de modèle plus compliqué à proposer, il faudrait en discuter avec des sociologues, des sondologues et des statisticiens : probablement que l'âge ou les CSP influent plus qu'il n'y parait.)

Je ne relève pas ta remarque "oui on peut calculer une moyenne" car l'argument m'échappe et il est le même ici : oui on peut calculer une matrice et donc "so what ?".

Good job q̶u̶a̶n̶d̶ ̶m̶e̶m̶e̶ bien sûr pour ces 4 billets.

Sondator (2012-05-14T01:46:55Z)

Pour 2012, les reports de voix de Joly sont complètement fumés : un quart des électeurs de Joly du 1er tour aurait voté Sarko au 2nd !

Pour le reste (hormis Méluche, que tu commentes toi-même), je vois beaucoup de chiffres qui ne me paraissent pas vraisemblables mais ne sont pas complètement impossibles : je pense par exemple que les abstentionnistes se sont plus reportés vers Sarkozy, que les partisans de M. Blanc sont moins allés vers Hollande, que le report des voix de Le Pen sur Hollande est bien supérieur à 6% et que les électeurs de Bayrou se sont un peu plus reportés vers Hollande que ce que ton algorithme donne.

Bref, je ne suis pas convaincu par cette méthode (et je le déplore car l'idée me paraissait intéressante de prime abord).

P.S. (pas au sens politique) : remplacer "ont fusionner" dans le 4e § par "ont fusionné".


You can post a comment using the following fields:
Name or nick (mandatory):
Web site URL (optional):
Email address (optional, will not appear):
Identifier phrase (optional, see below):
Attempt to remember the values above?
The comment itself (mandatory):

Optional message for moderator (hidden to others):

Spam protection: please enter below the following signs in reverse order: 65afea


Recent comments