Comments on Fighting spam (again and again)

Ruxor (2006-09-25T15:58:19Z)

mt-i → Si, la solution que tu me proposes me semble très bien, il faut juste que je me farcisse la doc appropriée de postfix pour comprendre un peu les détails (j'avais initialement conclu que ce que tu proposes n'était pas possible, mais c'est parce que Postfix a cinquante façons différentes de faire la même chose, avec des techniques variées).

mt-i (2006-09-25T15:25:59Z)

Et donc, la solution que je suggérais à base de smtpd_recipient_restrictions ne te paraît pas préférable à un milter ou quelque chose comme ça? L'inconvénient éventuel, c'est que postmap applique à david+something@ la même règle qu'à david@ (cf. man 5 access) s'il n'y a pas une règle spécifique qui fait autre chose, donc il faut une ligne OK pour chaque extension que tu utilises. Mais ça devient très facile de changer le OK en REJECT ou autre si tu dois prendre des mesures.

Koko90 (2006-09-25T13:07:11Z)

La plus part des spam que je reçoit dans ma mailbox sont constitués d'un texte généré aléatoirement et constitué de phrases piochées ci et là (et dans le même domaine, pareque une simple matrice de co-occurrence serait trop facile à mettre en oeuvre) et d'une image bichrome en PNG ou en GIF contenant le spam proprement dit (et ne pesant pas tellement plus lourd que des données textuelles, c'est que PNG est vraiment très fort sur les images bichromes).

Alors en attendant qu'on ne mette de l'OCR dans les filtres anti-spam on est embêté.

Ruxor (2006-09-25T10:27:25Z)

Nick → Pour afficher le nombre de commentaires, j'utilise une extension propre à Mozilla, appelée XBL (cf. <URL: http://books.mozdev.org/html/mozilla-chp-7.html >), qui est pratiquement la seule façon que je connaisse d'inclure du HTML dans du HTML de façon transparente et complètement “inline” (c'est-à-dire sans faire une grosse boîte autour ou quelque chose comme ça).

Bon, en fait, XBL me permettait aussi de contourner une restriction de sécurité sur Mozilla qui m'embêtait du temps où le blog et ses commentaires étaient sur des sites différents, maintenant que ce n'est plus le cas je devrais pouvoir m'en tirer avec du JavaScript à la place (faire charger un petit script JavaScript généré dynamiquement qui rajoute les numéros là où il faut), ce qui marcherait sur tous les navigateurs… faudrait que j'essaie ça un jour.

Nick (2006-09-25T08:52:23Z)

Question technique: Comment codes-tu le nombre de commentaires deja postes (que l'on voit a cote de "commentaire" a la fin de chaque entree)? Sur Firefox ce nombre s'affiche bien mais pas sous Safari 1.3.2/Mac OS X 10.3.9.

phi (2006-09-24T21:09:18Z)

Une solution: tu crées une adresse spam@madore.org que tu diffuses au maximum; si on t'envoie un spam sur david@madore.org, tu réponds avec spam@madore.org. Enfin, tu élimines tout message envoyé à quelque adresse en même temps qu'à spam@madore.org.

Une autre solution: avant d'appliquer le filtre bayésien, tu normalises le texte: suppression des espaces, des lettres doublées, des flexions, etc. mise en minuscules… et redécoupage des mots suivant le dictionnaire avec tolérance d'erreur.

Une autre solution: tu publies tout ton courrier sur le web et attends que tes lecteurs indiens éliminent le spam.

delek (2006-09-24T19:16:30Z)

just to try.
je suis inondée quotidiennemnt de la letter"désir d'avenir', le comble, l'inondation par le vide abyssal de Mme Royal; une solution?

Fr. (2006-09-24T17:16:54Z)

Pourquoi ne pas switcher vers WordPress, qui possède un filtre antispam (Spam Karma) terriblement efficace ?

Ruxor (2006-09-24T16:12:25Z)

Je ne serai pas si pessimiste… car le but n'est pas d'empêcher *tous* les courriers indésirables, mais uniquement ceux qui sont envoyés en masse, et cet envoi en masse leur donne justement des caractéristiques sur lesquelles il est possible de les repérer. Évidemment, si on est une vedette et qu'on a des millions de fans qui chacun écrit avec ses petites mains potelées un mail très personnel qu'on ne veut pas lire, ce sera difficile à filtrer (encore que…), mais si on est un mouton parmi des millions d'autres auxquels les mails sont envoyés en bloc, ce n'est plus un problème AI-complet. Surtout qu'on ne veut pas 100% de réussite (si on élimine 99% du spam en ne produisant que 0.01% de faux positifs, c'est tout à fait satisfaisant, et ce sont des chiffres atteignables).

Anonymous Coward (2006-09-24T16:01:40Z)

Imaginer pourvoir éliminer les importuns avec un algorithme de 100 lignes basé sur des mathématiques de niveau terminale fut quelque peu naïf de notre part…

Il va désormais falloir _vraiment_ s'investir dans un système qui sans aller jusqu'à la compréhension du texte, du moins parvienne à en faire une analyse syntaxique et lexicale en fonction de laquelle on pourra trier avec plus d'à propos.

Les autres methodes certes astucieuses ne vont fonctionner qu'un moment car in fine, c'est quand même à son contenu sémantique que l'on reconnaît un spam d'un courrier normal.

Fred le marin (2006-09-23T21:48:41Z)

By the way, have you ever noticed that all of my comments are spam-spirit oriented ?
I must apologize for it. Jacobson's stereotypes over and over again. When I look back, it's always with a sense of shame.
But sometimes, those blog entries are so attrative. *Snort*

"It is a tale, told by an idiot, full of sound and fury…"