David Madore's WebLog: Du danger des chiffres trop précis

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #0768 [older| permalink|newer] / ↓Entrée #0768 [précédente| permalien|suivante] ↓

(jeudi)

Du danger des chiffres trop précis

Si quelqu'un vous dit 34% de mes foobars sont bleutés, on peut en déduire qu'il possède au moins 29 foobars. Pourquoi ? Parce que toute fraction dont le dénominateur est inférieur à 29 est à une distance de 34/100 supérieure à 1/200, donc ne s'approche pas en 34%. Je laisse la démonstration de ce fait en exercice aux matheux (qui connaissent bien les propriétés de l'approximation diophantienne et l'algorithme d'Euclide). C'est là un des risques à donner des chiffres trop précis dans le calcul d'un rapport : il y a moyen de minorer le dénominateur de ce rapport. C'est assez évident pour pratiquement tout le monde quand on parle d'une proportion de 1% : cela implique qu'il y a au moins 67 objets mis en jeu (car 1/66 s'approche en 2% et non en 1%), mais tout rapport dans ce genre donne une minoration (sauf que dans beaucoup de cas elle n'est pas très intéressante : si on dit 17%, ça ne minore que par 6 le nombre de foobars). De même, si quelqu'un vous parle d'une proportion de 33.4%, on peut en déduire que cette proportion est prise sur au moins 287 objets ; une proportion indiquée de 42.85% implique forcément au moins 1181 objets ; et ainsi de suite (enfin, mon ainsi de suite est abusif : ce ne sont que quelques exemples, et la logique n'est pas forcément complètement évidente ; cependant, cela se calcule très facilement avec un ordinateur).

Il m'est arrivé au moins une fois de prendre quelqu'un en flagrant délit d'invention de statistiques pour une raison de ce genre (la donnée annoncée impliquait un nombre d'objets pour la statistique plus grand que ce qui pouvait exister, du style il n'y a que 24.8% de filles dans ma classe — bizarre, ça veut dire qu'il y a une centaine de personnes, c'est assez énorme ; je précise que je ne fais pas ça de tête !). Malheureusement, il est rare que les données s'y prêtent (les gens ont quand même tendance à diminuer la précision de leurs statistiques — et ils ont scientifiquement tout à fait raison de le faire, d'ailleurs), mais quand ça marche, c'est tellement rigolo.

C'est un exemple humoristique de statistique (démontrablement fausse, toujours pour la même raison) qui m'a rappelé cette histoire.

↑Entry #0768 [older| permalink|newer] / ↑Entrée #0768 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]