Si quelqu'un vous dit 34% de mes foobars sont
bleutés
, on peut en déduire qu'il possède au moins 29
foobars. Pourquoi ? Parce que toute fraction dont le
dénominateur est inférieur à 29 est à une distance de 34/100
supérieure à 1/200, donc ne s'approche pas en 34%. Je laisse la
démonstration de ce fait en exercice aux matheux (qui connaissent bien
les propriétés de l'approximation diophantienne et l'algorithme
d'Euclide). C'est là un des risques à donner des chiffres trop précis
dans le calcul d'un rapport : il y a moyen de minorer le dénominateur
de ce rapport. C'est assez évident pour pratiquement tout le monde
quand on parle d'une proportion de 1% : cela implique qu'il y a au
moins 67 objets mis en jeu (car 1/66 s'approche en 2% et non en 1%),
mais tout rapport dans ce genre donne une minoration (sauf que dans
beaucoup de cas elle n'est pas très intéressante : si on dit 17%, ça
ne minore que par 6 le nombre de foobars). De même, si
quelqu'un vous parle d'une proportion de 33.4%, on peut en déduire que
cette proportion est prise sur au moins 287 objets ; une proportion
indiquée de 42.85% implique forcément au moins 1181 objets ; et ainsi
de suite (enfin, mon ainsi de suite
est abusif : ce ne sont que
quelques exemples, et la logique n'est pas forcément complètement
évidente ; cependant, cela se calcule très facilement avec un
ordinateur).
Il m'est arrivé au moins une fois de prendre quelqu'un en flagrant
délit d'invention de statistiques pour une raison de ce genre (la
donnée annoncée impliquait un nombre d'objets pour la statistique plus
grand que ce qui pouvait exister, du style il n'y a que 24.8% de
filles dans ma classe — bizarre, ça veut dire qu'il y a une
centaine de personnes, c'est assez énorme
; je précise que je ne
fais pas ça de tête !). Malheureusement, il est rare que les données
s'y prêtent (les gens ont quand même tendance à diminuer la précision
de leurs statistiques — et ils ont scientifiquement tout à fait
raison de le faire, d'ailleurs), mais quand ça marche, c'est tellement
rigolo.
C'est un exemple humoristique de statistique (démontrablement fausse, toujours pour la même raison) qui m'a rappelé cette histoire.