Comments on Quelques questions techniques sur le contenu Web

Apokrif (2017-11-05T17:03:19Z)

@Immae: "À quand un flux rss des commentaires, aussi ? ;)"

Je serais moi aussi intéressé :-)

sdefresne (2011-09-07T22:15:25Z)

En ce qui concerne le flux RSS, des nombreux (trop, une centaine, échantillon large mais probablement pas représentatif) sites auxquels je suis abonnés, la majorité intègrent la totalité de l'article dans le flux. Quelques uns n'offrent que le début, mais en général ce sont des sites qui vivent par la publicité et ont donc besoin de forcer l'utilisateur à venir sur leur site.

En ce qui concerne le formatage CSS, effectivement, il y a de la perte en lisant dans un aggrégateur plutôt qu'en allant sur le site d'origine. Toutefois, avec les sites que je suis cela semble arriver assez rarement, et lorsque c'est le cas, je suis le lien vers le site d'origine.

Personnellement, je pense que je préfèrerais un flux RSS ne contenant que les deux ou trois derniers articles (ce qui correspond à peu près au nombre de post maximum d'articles postés sur ce site dans une même journée) mais en totalité plutôt que la situation actuelle (qui est déjà une très nette amélioration par rapport à l'ancien flux qui ne contenait que le titre de l'article). Cela vient probablement du fait que j'utilise Google Reader comme aggrégateur et qu'il peut faire sa collecte même lorsque je ne suis pas connecté (et je crois qu'il ne fait la collecte qu'une fois pour l'ensemble des utilisateurs suivant un même flux RSS).

Oh, et avoir le contenu des articles dans le flux RSS résoudrait le problème d'Instapaper / Read it Later / … qui savent extraire un article en particulier d'un flux RSS.

Thomas (2011-09-07T18:24:04Z)

A vrai dire je peux comprendre qu'on n'ait pas envie de faire du PHP quand on a débuté par des langages de bas niveau.

Pour citer un exemple, l'absence de typage en PHP est assez handicapant:
<?php
echo 1=="1" . "\n";
echo 0==false;
?>

Affiche deux fois 1 par exemple.

En PHP5 l'aspect objet a été implémenté de façon correcte mais l'absence de typage fait que la surcharge d'opérateurs est impossible sans passer par une bidouille qui consiste à considérer les arguments d'entrée comme un tableau, à les compter et à faire une disjonction de cas.

Néanmoins, si on maitrise toutes ces "subtilités" mises en place pour que quelqu'un qui n'a aucune connaissance en programmation puisse facilement faire du PHP, on peut faire des choses.

Quitte à apprendre un langage de scripts, je pense qu'il est préférable de suggérer Python ou Ruby à quelqu'un qui veut faire du web rapidement.

Au passage, je me demande pourquoi Facebook est en PHP. Idem pour Wikipedia ou plein d'autres sites très consultés.

Pensez-vous que ces sites utilisent PHP comme surcouche de programmes compilés, auxquels ils passeraient quelques arguments via PHP ?

tartaglia bovin (2011-09-07T05:48:24Z)

Eh oui, Rôdeur, en toute humilité je suis un gros ruminant égaré dans ce cénacle de l'immarcescible Intelligence. Je me complais dans le gras, dans le lourd, dans l'épais. Pas très loin du porc. Je suis un boeuf (LE boeuf?). Nous devrions mieux nous connaître: vu ton orthographe, nous avons dû nous croiser auprès de la Sainte Famille.

Le Rôdeur (2011-09-06T20:02:22Z)

Alors merci à David pour ces réponses, je comprends qu’il soit plus fun de coder soit même et que le fond d’un blog scientifique prime sur la forme.
Effectivement mon commentaire n'a pas toujours de sens! … il est évident que son ton est volontairement provocateur, tu l'as compris et même aux limites de la politesse, à un epsilon prés.
J'aime taquiner et je me suis demandé jusqu'à quel point tu publiais les commentaires décalés: bravo. Je pense qu’il est sympa de "secouer le cocotier" de temps en temps, je te titille pour dérider le coté un peu sérieux de ce blog (tout à fait apprécié de ceux à qui je l'ai fait connaître) …

Seul "tartaglia" n'a pas compris, en m'envoyant une tarta - la créme en pleine figure, merci, et même en souhaitant me Kärcheriser pour reprendre le bon mot de notre président, mais je comprends et lui adresse mes salutations …

@/2 (2011-09-06T17:18:28Z)

Pour ce qui est de l'accès NNTP, Gwene <URL: http://gwene.org/ > est au moins un début. Et pour parser de la soupe de tags, j'ai cru comprendre que xsltproc ne s'en sortait pas mal.

Ruxor (2011-09-06T16:24:22Z)

Fractal → Quand je parle de servir du XHTML avec le type text/html, s'agissant du HTML5, il s'agit de comprendre « produire un document qui se trouve être également valide, et avoir exactement le même sens, qu'il soit servi avec le type text/html ou application/xhtml+xml ». C'est évidemment ça que je veux faire, et je peste que ce soit non-trivial.

W (2011-09-06T15:54:30Z)

Premières idées :
* réduire l'espace entre (le texte d')une citation et la réponse (plus bas) par rapport à celui entre un bout de réponse et la citation suivante ;
* que cet espace soit fait de rgb(224,224,192), réduire la marge verticale de fond gris en haut et bas de citation ;
* réduire un peu la marge à gauche du cadre de la citation ? Je ne sais pas si ça clarifierait, mais je trouve ça un peu bizarre en l'état.

Fractal (2011-09-06T15:40:32Z)

Quelques précisions sur le XHTML 5 :
Servir ses pages web avec le type MIME application/xhtml+xml n’exclut pas tous les utilisateur d’Internet Explorer, IE9 supporte officiellement ce type MIME et le parse correctement. Pour IE < 9, il paraît que ça ne marche pas, mais j’ai fait quelques essais sur mon site avec IE 8 et il me semble que cela fonctionne quand même (je n’ai pas testé beaucoup vu que je n’ai pas accès facilement à un Windows, donc peut-être que je me trompe).
Par ailleurs, la présence d’un DOCTYPE est optionnelle (surtout si on sert les pages avec le type MIME application/xhtml+xml) mais si on préfère on peut mettre le même doctype que pour du HTML5 (<!DOCTYPE html>). Contrairement au XHTML 1.0 où le doctype le différenciait du HTML 4, la seule chose qui permet de différencier réellement le HTML 5 du XHTML 5 est le type MIME. En d’autres termes, servir du XHTML 5 avec le type MIME text/html est un non-sens, si on utilise text/html ça ne peut pas (par définition) être du XHTML5.

Ruxor (2011-09-06T15:31:38Z)

W → C'est édité à la main avec mes super-pouvoirs sur les commentaires. Mais ça fait partie des choses que je veux rendre possible un jour, oui, clairement. Et je suis d'accord que c'est confusant que les deux conventions existent (l'imbriqué répond à l'imbriquant ou le contraire), je ne vois pas bien comment éviter le problème.

Ruxor (2011-09-06T15:10:56Z)

Sinon, je vois que le µformat hAtom, <URL: http://microformats.org/wiki/hatom >, devrait permettre de faire en sorte que la page HTML elle-même soit un flux Atom utilisable. Ça a l'air séduisant, comme idée.

W (2011-09-06T15:09:49Z)

J'ai un doute : c'est nouveau la citation du commentaire auquel tu réponds ? En tout cas c'est une bonne idée, par contre visuellement, au premier coup d'oeil, j'ai pensé un instant que le texte class="comment" était la réponse point par point au texte class="comment-ruxor", comme sur Wikipédia ou LinuxFr vs. un e-mail ou un forum. Je ne sais pas si c'est la couleur de fond, l'indentation ou la bordure de la citation… Suis-je fou ?

Ruxor (2011-09-06T14:12:16Z)

Le Rodeur → Bon, essayons de répondre point par point à tout ça

ok tu es excité comme une puce, et on se doutait que tu mijotais une annonce de ce genre vu que ton dernier post est vieux de dix jours: très rare … ta façon d'entretenir le suspense,

Perdu, ce n'était pas du tout pour « entretenir le suspens », mais simplement parce que le temps que je consacre à mon blog était consacré, justement, à finir ce nouveau moteur. À partir du moment où je commence la migration, il est évident que je ne veux pas en parallèle publier des entrées sous l'ancien moteur. Si j'avais voulu entretenir le suspens, j'aurais publié auparavant une entrée annonçant la venue de ce nouveau moteur pour les heures prochaines !

tu sais comme moi qu'un moteur standard avec PHP aurait été plus simple que toute cette quincaillerie d’usine à gaz …,

Je ne veux pas apprendre le PHP (de ce que j'en ai vu, c'est un langage ignoble), et je ne veux pas de PHP sur mon serveur Web (une mise à jour de sécurité chaque semaine, non merci — et le nombre de requêtes de bots qui essaient d'attaquer dans la minute tous les trous de sécurité connus de tous les outils PHP standards me conforte dans ma réticence). Mais je reconnais tout à fait que la principale raison est que j'ai envie de coder moi-même des trucs, parce que ça me plaît : je ne vois pas en quoi cette attitude est critiquable ou incohérente.

et quelle idée de séparer moteur de blog et de commentaire, je n’en rajouterai pas.

Ce serait intéressant d'en rajouter, pourtant. Moi j'aime beaucoup l'idée de pouvoir commenter n'importe quelle page Web, et en tout cas n'importe quelle page de mon site (pas seulement les entrés de blog), dans l'esprit des idées autour du système d'annotations développé au W3C.

Mais visiblement nous ne parlons pas le même langage : tu veux que mon blog soit comme tous les autres, il faut que j'utilise les mêmes outils PHP, que je fasse les mêmes choix techniques que tout le monde, sinon je perds mon temps. Moi je préfère faire joujou avec les technologies Web et hacker les choses moi-même, c'est aussi à ça que me sert mon blog.

Incidemment, on ne sait toujours pas où et comment tu sauvegardes tes entrées.

J'édite moi-même des fichiers qui sont du XML dont la plupart des éléments sont dans le namespace XHTML, et certains sont dans un namespace personnel, et c'est sur ces derniers que travaille mon moteur. On peut en avoir un exemple en remplaçant "html" par "daml" sur à peu près n'importe quelle page traitée par ce moteur (pour celles qui font partie du blog, prendre les pages mensuelles). Pour le blog, les entrées sont ensuite insérées dans une base de données PostgreSQL pour pouvoir extraire facilement celles qui répondent à une catégorie donnée, ou faire des recherches par date ou ce genre de choses ; le HTML est produit à partir de cette base de données.

Tu vas rougir, mais quel dommage que l'on ne puisse toujours pas envoyer les commentaires en police/couleur personnalisée WYSIWYG: très sexy ces lignes grises …

Je ne suis pas sûr d'avoir envie qu'on puisse taper des commentaires en couleur, justement, encore moins qu'on puisse inclure des images. Comme on s'en apercevra sur mon blog lui-même, je fais un usage assez modéré des décorations stylistiques de ce genre, et j'ai tendance à préférer que le fond prime sur la forme, et on s'exprime bien avec des mots plutôt qu'avec des couleurs. En revanche, ce serait bien de pouvoir mettre du em, strong, cite, q, code et quelques autres balises de ce genre, et certainement de faire des liens.

Je ne réponds pas au reste, qui est du rant dans lequel je ne trouve aucun sens.


Goran →

je lui ai déjà demandé s'il pouvait récupérer les adresses IP des commentaires

Hein ? Où ça ? Parmi les commentaires que je vois de toi, il y a le 16626 (sur l'entrée <URL: http://www.madore.org/~david/weblog/2011-02.html#d.2011-02-28.1853 >) dans lequel tu demandes des informations sur l'audience et le nombre de consultations, ce à quoi j'ai répondu de façon assez détaillée dans l'entrée suivante, ensuite tu as demandé (commentaire 16635) quelle proportion de commentaires je publiais, j'ai aussi répondu à ça en commentaire, et les deux autres commentaires de toi que je vois, ils concernent les commentaires sur les journaux en ligne (16767) et les restaurants à Paris (17238), outre évidemment celui auquel je réponds. En tout cas, c'est injuste de dire que je ne réponds pas aux questions qu'on me pose.

Par ailleurs, en l'occurrence, je ne comprends pas la question. Oui, bien sûr que mon serveur Web voit les adresses IP des gens qui commentent, je vois mal comment il pourrait en être autrement.

W (2011-09-06T12:40:07Z)

Je dois être abonné à 20 ou 30 flux RSS/Atom, dont LinuxFr, Maître Eolas et quelques webcomics, et la plupart mettent les articles complet dans le flux. De ce que je peux voir, ça me semble être la norme (de fait).

Pas de problème si je veux lire ton blog depuis mon smartphone par contre : dans Firefox et Opera Mobile, il est très facile de faire un zooom.

En réponse à yogsototh sur le format des commentaires, je crois qu'un format wiki (genre MediaWiki ou WikiCreole) serait plus connu que le Markdown, mais peut-être que je me trompe.

xavier (2011-09-06T11:52:01Z)

Quel bordel. Je hais les techno web et les idiots qui ont permis aux navigateurs d'afficher qqch sans rien dire face à une soupe de tag.

Un fichier txt décrivant un arbre avec des balises…quoi de plus trivial??

Pour ce qui est de ton blog :
En quoi tapes tu tes messages? en xml? en soupe de tag html ou je ne sais quoi? en txt avec un système de balises maison?

Je ne comprends pas trop pourquoi il y a besoin de 3000 linges de java pour traiter ca…vraiment pas.

yogsototh (2011-09-06T11:43:34Z)

Question 1 : Comment servir du XHTML ?

Si nous vivions dans un monde merveilleux nous devrions utiliser application/xhtml+xml

MAIS

ça ne marche pas avec ie, alors plusieurs solutions sont possibles.

1. Tant pis pour les utilisateurs d'ie, ils n'ont qu'à télécharger un navigateur correct. Mouais…

2. Sur le serveur, vérifier si c'est si c'est ie. Dans ce cas, envoyer application/xml (au lieu d'application/xhtml+xml). Inclure un XSL et le bon entête. Ici en détails (merci google) <URL http://www.nealgrosskopf.com/tech/thread.php?pid=1 >

En gros, HTML5 est la réponse à "la saleté du web". Les gens continuent d'éditer leur HTML à la main, la majorité préfère avoir une page non valide qui s'affiche à peu près correctement qu'une page qui ne s'affiche pas si elle est non valide. En fait, je ne pense pas qu'il y ait une façon vraiment propre de servir des pages web aujourd'hui. C'est forcément un mélange de "bonne pratiques".

Deuxième question concernant le flux RSS.

En ce qui concerne le contenu, je préférerai aussi avoir les 20 dernier articles entiers que les 10000 résumés des derniers. Pourquoi ?

La raison en image :

voilà en RSS <URL: http://i.imgur.com/yrzyb.jpg >

voilà en HTML <URL: http://i.imgur.com/XMQxk.jpg >

Et clairement sur un petit écran, il n'y a pas, photo, la deuxième version est quasi illisible.

Troisième question les commentaires.

Il me semble qu'autoriser l'écriture de commentaire au format markdown est le plus pratique. La plupart des gens connaissent ce format, en faisant un peu attention on peut interdire les balises dangereuses (comme script).

Mais il est maintenant courant d'utiliser _texte_, *texte* ainsi que

- item 1
- item 2
- item 3

et aussi [un lien](http://une_url), etc…

Je suis persuadé qu'il existe une librairie Java pour ça.

Goran (2011-09-06T11:25:41Z)

Rôdeur --> même si tu as un peu forçé sur le café noir cette nuit, sache que le Ruxor, ne fait pas les choses par utilité, mais uniquement par plaisir. Il peut très bien se relever la nuit pour recoder son moteur de blog en Perl, même si ça ne sert à rien, c'est tout. Après tout Enstein était comme cela, et alors… Il ne s'oblige pas non plus à répondre, je lui ai déjà demandé s'il pouvait récupérer les adresses IP des commentaires: aucune réponse, rien, nada… Alors que ça peut intéresser tout le monde ici…

tartaglia sécuritaire (2011-09-06T09:42:22Z)

Eh ben voilà, ton blog est devenu un lieu de non-droit avec des gens qui disent le roder mais qui, sans l'éroder, rôdent pour de bon.
Bon, je ne fais pas de pub pour les nettoyeurs à haute pression, mais quand même!

Immae (2011-09-06T09:16:02Z)

Ah et pour répondre à la demande du Rodeur sur le formattage des commentaires (personnellement ça m'est égal mais bon), il y a une librairie (basée sur jQuery) qui permet de rendre ça assez facile au moins pour la partie client :
http://markitup.jaysalvat.com/home/

Immae (2011-09-06T09:11:17Z)

Ce que tu demandes à propos du flux rss (un fichier et des liens pour aller chercher les infos automatiquement sur le site) m'existe pas, le flux rss est uniquement dans un seul fichier et à ma connaissance atom ne permet pas plus de le faire. Le seul moyen serait d'avoir un lecteur intelligent qui le fasse de lui-même…
Personnellement je suis pas mal de flux, et quand le texte n'est pas complet ça m'engage moins à aller le lire, car il faut cliquer sur un lien pour aller sur le site. Ton site étant facilement lisible dans w3m ce n'est pas gênant, mais c'est loin d'être le cas de tous les sites (du coup parfois j'abandonne la lecture d'un article qui semble intéressant car je ne veux/peux pas l'ouvrir dans un vrai navigateur)
Certains utilisent aussi un lecteur de flux rss sur leur propre ordi, et peuvent vouloir lire l'article "plus tard" en étant hors ligne, ce qui n'est pas possible si le texte n'est pas complet.

À quand un flux rss des commentaires, aussi ? ;)

J.Chalons (2011-09-06T08:13:43Z)

@Le rodeur. Remarques pertinentes, peut-être as tu un peu bu en tapant ça, mais "ne chipotons pas", très amusant. Tu aurais pu aussi demander pourquoi la mise en page des posts n’est pas conservée, c’est ce qui m’agace.
Je pense juste que David ne va pas te répondre, tout comme il ne répond jamais aux questions "délicates", tout simplement car il n'aime pas être pris en défaut, ou à contre pied; sorte de fierté naturelle finalement, ne casses pas son joujou.
Tant pis s'il a le droit de joindre une image à ses posts et pas toi, privilège du prince ;-).

Vincent Bernat (2011-09-06T06:58:55Z)

Je fais partie de ceux qui préfèrent lire dans un lecteur RSS. En ce qui concerne la taille, c'est rarement un problème. Pour mitiger le problème, il est toujours possible d'activer la compression (ce qui n'est pas le cas sur ton flux RSS). Mieux vaut obtenir les 5 derniers articles au complet que les 20 derniers articles tronqués à 160 caractères d'ailleurs.

Quant à obtenir les articles au complet, c'est extrêmement pratique quand on lit sur un périphérique dont la connexion est lente ou intermittente. Il met en cache les flux RSS et on lit quand on veut, sans dépendre d'une resource externe.

Le Rodeur (2011-09-06T00:03:14Z)

… roulement de tambours … Ruxor vient de pondre le moteur nouveau!,

ok tu es excité comme une puce, et on se doutait que tu mijotais une annonce de ce genre vu que ton dernier post est vieux de dix jours: très rare … ta façon d'entretenir le suspense,

Aaah le nouveau moteur … l'Arlésienne depuis toujours: on commençait même à ne plus y croire, vu que tu finis rarement ce que tu entreprends (*).
Jusqu'à prendre la technique comme prétexte pour toujours repousser les choses!, ce qui peut amuser, d'ailleurs … De plus, tu t'arraches les cheveux pour des broutilles (**) : que de maux de têtes … Java ou C: la cause de tes insomnies ? peu importe garçon! détends-toi, tu sais comme moi qu'un moteur standard avec PHP aurait été plus simple que toute cette quincaillerie d’usine à gaz …,
et quelle idée de séparer moteur de blog et de commentaire, je n’en rajouterai pas. Incidemment, on ne sait toujours pas où et comment tu sauvegardes tes entrées.

Alors la cerise c'est quand tu reconnais que tout ce boulot c'est pour … pas grand-chose. Le flux ? je veux bien, même vu le peu de tes lecteurs l'utilisent (autant faire de R&D pour un dentifrice pour chien, mais ne chipotons pas …).
Tu vas rougir, mais quel dommage que l'on ne puisse toujours pas envoyer les commentaires en police/couleur personnalisée WYSIWYG: très sexy ces lignes grises …
(et la police bookman/palatino ça fait huit ans que ça dure, on commence à connaître).

Alors Ruxor, c'est pour quand tout ça ?… Tu devines que c'était le secret espoir de bien de tes admirateurs, mais à présent je suis sûr que l'ENST aura déménagé depuis belle lurette … et ne me parles pas encore d'excuses techniques car c'est implémenté sur la plupart des forums basiques qui traînent sur le web.
Je n'ose même pas évoquer la possibilité de joindre une image aux commentaires
(pourtant si nécessaire pour un blog scientifique … ), ou autres spoilers, ok, sans doute trop demandé.

Bon, ne me réponds pas si tu le souhaites, mais c'est que j'avais à dire, et à présent je vais me recoucher.

(*) je sais que ton cerveau est une sorte de marmite en perpétuelle ébullition, d'où jaillit une idée par minute, mais il suffit qu'elle soit intéressante pour qu'elle s'évanouisse comme Cendrillon à minuit. Et n'est-ce pas un de tes collègues qui me disait « quel dommage qu'un esprit si brillant soit si fouillis ».

(**) puisque tu parles cheveux, d'ailleurs, oui il parait que tu en as moins que sur photos. Ceci dit, avec tes lunettes en ellipses métalliques ça fait plus intello et tu gagnes quand même au change, don’t worry… je suis même sûr que poussinet adore …


You can post a comment using the following fields:
Name or nick (mandatory):
Web site URL (optional):
Email address (optional, will not appear):
Identifier phrase (optional, see below):
Attempt to remember the values above?
The comment itself (mandatory):

Optional message for moderator (hidden to others):

Spam protection: please enter below the following signs in reverse order: 3c7f8f


Recent comments