Comments on Où je décide de jouer avec Twitter

Ruxor (2019-11-18T11:03:31Z)

@jonas: Good catch! The Twitter API (here GET statuses/user_timeline) has various limits on the number of items it will return in one call (to get more, one is supposed to perform several calls with increasing max_id values). I fixed what I could and recovered, as far as I can tell, what had been lost (at least in the last few months).

jonas (2019-11-17T14:34:55Z)

I'd like to report a bug. <URL: https://twitter.com/gro_tsen/status/1192886203382677505 > is not in your twitter archive, even though it's apparently posted by you and old enough that it should be there.

tituscapulet (2018-11-05T19:22:58Z)

@Ruxor:

merci pour ta réponse (je croyais d'ailleurs t'avoir répondu dès hier soir, mais j'ai dû bugger lorsque j'ai cru envoyer ma réponse).

Du coup, pour répéter rapidement ce que j'avais écrit, je suis d'accord avec toi la coût de compréhension sans doute supérieur à celui de réécriture. C'est plus par curiosité intellectuelle que dans l'optique de reprendre ton script tel quel que j'ai effectué ma demande.

Cela fait deux mois que j'essaie de mettre en place un script similaire, sans succès. En dépit de ma lecture attentive des sites sur l'API Twitter et Perl (que tu cites notamment dans ce billet), j'ai vraiment du mal, mais je suis il est vrai un piètre programmeur. J'espérais donc qu'en jetant un œil à ton script, ça pourrait un peu m'éclairer sur les erreurs que je commets. En tout cas, tant que je n'arriverai pas à bout de ce script, je m'interdis de vraiment plonger dans Twitter (en mode écriture du moins) :-)

tituscapulet (2018-11-04T18:19:27Z)

@Ruxor : merci pour ton retour.

Je crois en effet que tu as amplement raison sur le coût compréhension vs réécriture ! Je t'avoue que c'était plus par curiosité intellectuelle que par volonté de m'en servir tel quel.

Je souhaiterais pourtant mettre un tel script en place sur ma page web (et commencer à utiliser Twitter par la même occasion à ce moment-là!), mais aussi bien ce que j'ai pu lire sur l'API twitter que ce que j'ai pu glaner par ailleurs sur le net (notamment la page Perl) m'ont perdu et le mini-script que j'avais commencé à écrire ne fonctionne toujours pas deux mois plus tard…
Bon, je suis un piètre "programmeur", ça c'est une évidence, mais perdu pour perdu, je me suis dit que je pouvais essayer de voir comment tu avais mis en place ton script.

Merci beaucoup en tout cas !

Ruxor (2018-11-04T17:33:05Z)

@tituscapulet: <URL: ftp://ftp.madore.org/pub/madore/misc/twitposts.pl >. Je le mets dans le domaine public.

Mais bon, je ne comprends pas bien ce que tu peux espérer d'un script pareil : il sera beaucoup plus long et douloureux d'arriver à comprendre comment s'en servir (parce qu'il a besoin que plein de fichiers soient initialisés d'une manière bien précise pour fonctionner, et au final il écrit sa sortie dans des formats très particuliers pour mon usage à moi) que de le réécrire à partir de zéro.

(Ce n'est pas la première fois qu'on me demande de publier le programme qui a servi à faire X ou Y : je suis toujours prêt à faire ça, mais je ne comprends vraiment pas l'intérêt, parce que c'est toujours la même chose, c'est super compliqué de trouver comment compiler et utiliser le programme en question, et je doute qu'il y ait pu y avoir un seul exemple où le programme que j'ai fourni a pu servir à celui qui l'a demandé. Même les programmes pour lesquels je fais l'effort d'écrire un mode d'emploi, <URL: http://www.madore.org/~david/programs/ >, j'ai beaucoup de doutes. Et c'est vraiment ça la limite du logiciel libre : sauf projet vraiment gros, ça demande toujours beaucoup beaucoup beaucoup plus d'efforts de rendre un programme utilisable par d'autres que de l'écrire pour soi-même.)

tituscapulet (2018-11-04T15:01:52Z)

David,
est-il possible d'avoir accès d'une manière ou d'une autre au script que tu as réussi à produire pour l'archivage de tes tweets ?
En naviguant dans le code source de ta page d'archives, je crois comprendre qu'il s'agit du script Perl suivant : twitposts.pl ?
Merci !

Ruxor (2018-10-01T20:18:32Z)

@jonas: Those are "retweets", meaning that I am reposting something someone else wrote. Historically this was achieved by writing "RT" at the start; now it's fully integrated in the API, but Twitter still returns them in that way (and truncated to what was, I suppose, the former character count limit).

jonas (2018-10-01T19:43:57Z)

It seems that in your twitter archive, the text of some entries is truncated at around 140 characters, eg. <URL: http://www.madore.org/~david/tweets.html#tweet-1043835314949763072 >, <URL: http://www.madore.org/~david/tweets.html#tweet-1032239573793992704 >.

a3nm (2018-07-21T07:44:42Z)

> Je n'aime pas trop le fait que Twitter soit une plate-forme propriétaire[#2], mais en fait, j'utilise beaucoup MathOverflow (une instance de StackExchange), qui n'est pas spécialement moins propriétaire que Twitter.

Il y a quand même une différence, je trouve : certes MO et Twitter sont toutes deux propriétaires et ont toutes deux une API, mais les données de MO sont sous licence libre et ils fournissent régulièrement des dumps <URL: https://archive.org/details/stackexchange > ce qui rend cela vraiment facile de récupérer toutes les données de la plateforme pour en faire autre chose. Twitter ne fournit pas de dumps et leur API a des rate limits.

Il y a aussi le fait que Twitter est essentiellement inutilisable pour les visiteurs qui n'ont pas de compte : l'interface est pourrie, avec des bandeaux qui réclament qu'on se crée un compte, et ce n'est pas possible d'accéder à certaines informations alors même qu'elles sont publiques pour tous les gens qui ont un compte, par exemple la liste des abonnements et des followers d'un compte. Du coup, poster du contenu sur Twitter soutient vraiment l'hégémonie de Twitter. Au contraire, sur MO tout peut être lu publiquement sans problème.

Apokrif (2018-07-19T00:36:19Z)

@Geo: https://twitter.com/_castille/status/1019649631901405185

Apokrif (2018-07-17T00:48:29Z)

"il n'y a aucun mécanisme d'authentification, pas de notion de compte ou quoi que ce soit de ce genre"

"Aucun" est un peu abusif car est prévu une sorte de mot de passe ("“identifier phrase").

"donc je ne peux pas proposer à quelqu'un de récupérer toutes ses données"

Un bon début serait de proposer un flux RSS des commentaires (éventuellement filtrable par pseudonyme ou par "Web site URL").

Apokrif (2018-07-16T22:50:59Z)

"il y a une API qui permet a minima de récupérer toutes les informations disponibles"

Il existe aussi une fonction de récupération d'une "archive" (peut-être moins complète ? sous forme d'un fichier CSV), qui ne semble pas exister dans Mastodon qui devrait pourtant être plus ouvert.

Ruxor (2018-07-16T19:57:19Z)

@Mich: Parce que je n'exclus pas de tweeter en anglais, et qu'il y a plus de francophones comprenant l'anglais que d'anglophones comprenant le français. Et parce que la description m'est venue plus naturellement en anglais.

jonas (2018-07-16T19:45:48Z)

Did I mention yet that if I don't download your entire blog, then its interface is already more usable than most blog websites on the internet, simply on account of having a page that lists all posts with their titles and links <URL: http://www.madore.org/~david/weblog/weblog-index.html >? This lets me find specific old posts I remember half of the time just by searching that index page for a snippet of their title.

Currently most blogs use either Wordpress or Google Blogger as their software. The default setting for those makes it difficult for readerse to access or find old posts, because there is no single index page with a link to all posts. For Wordpress, there exists an extension for this, but very few blogs have it installed, and for Google Blogger it's probably simply impossible. These software seem to assume that old posts no longer have any value, everyone only wants to read the new posts, but that's certainly not true for most blogs that are worth to read.

Régis (2018-07-16T19:30:47Z)

Il semble que l'invention littéraire ait supplanté le résumé-discussion en 2000.

Mich (2018-07-16T19:12:30Z)

Pourquoi des tweets (pour l'instant) 100% en français, et une présentation du compte en anglais ? (Eclectic mathematician…)

Alan (2018-07-16T17:58:42Z)

C'est dommage pour Mastodon, je vous y aurais suivi avec intérêt.

Ruxor (2018-07-16T14:15:20Z)

@Bob, @Cigaes: Mes souvenirs sont un peu flous, mais je crois bien que (pour le bac C en 1994, quand je l'ai passé) c'était le choix entre résumé-discussion, commentaire composé ou pure dissertation. En tout cas je suis sûr qu'il y avait un résumé quelque part.

@jonas: Thanks for reminding me my Web site is a mess… 😧 I just added a number links to the site map, but quickly ran out of patience. If you decide to harvest my site, please do so, but leave a resonable amount of time (like, one second) between requests. I think I can fairly easily provide a mammoth HTML page with all of my blog's contents, and one with all of my blog's comments.

@Geo: Il est possible de tout utiliser de façon intelligente. 😜 De ce que je vois de la pratique qu'en a mon poussinet, c'est par exemple très utile pour avoir des infos en temps réel sur quelque chose comme une perturbation des transports en commun (le bon fil Twitter sera beaucoup plus précis et fiable que le site officiel du transporteur).

GLaG (2018-07-16T12:35:56Z)

Geo : oui, c'est indiscutablement intéressant pour avoir rapidement des infos, infos "générales" (fil d'actualité des médias), infos d'un domaine plus ou moins confidentiel, tout ça concentré en un seul lieu (éventuellement en séparant en listes thématiques), nouvelles amis et connaissances…

Avec en prime la possibilité de discuter (mais la limite des 280 caractères + la diffusion "publique" qui attire les trolls fait que ce n'est pas le lieu optimal), la possibilité d'interpeller des "célébrités" (exemple très récent, Claire Mathieu la conceptrice de Parcoursup est venu défendre son truc récemment)…

Nicolas C. (2018-07-16T08:21:13Z)

@Bob: Gro-Tsen a passé le bac en 1994, la dernière année où les bacs généraux s'appelaient A, B, C, D, E. À cette époque, l'un des trois sujets au choix en français était un « résumé-discussion » et il n'y avait pas le sujet d'invention. Je ne sais pas quand ça a changé.

Régis (2018-07-15T17:50:26Z)

Ce qui m’ennuie avec Twitter c’est que j’aurais tendance à m’enflammer et à intervenir trop vite dans l’urgence. Je me contrôle mieux avec Facebook où je peux d’ailleurs modifier mon commentaire si nécessaire. En outre j’aime savoir à qui je m’adresse et sur Twitter le public est presque infini. Or j’ai besoin de me sentir dans mon petit monde pour m’exprimer librement.

Geo (2018-07-15T17:40:51Z)

> c'est une source d'information indubitablement utile,

Je me suis toujours tenu à l'écart de twitter partant du principe qu'il ne devait pas y avoir grand chose d'intéressant dessus. De loin, ça ressemble plus à un abrutissement généralisé qu'à quelque chose d'utile. Est-ce qu'il est possible de l'utiliser de manière intelligente ?

jonas (2018-07-15T12:28:59Z)

I have downloaded entire webpages for the purpose of archiving and searching. I might at some point do that with your website. As such a person, I'd like to reassure you that your default HTML interface is good enough for downloading the entries and comments. You even have a handy dynamic page <URL: http://www.madore.org/cgi-bin/numcomments.pl/x.js > to query the number of comments on multiple old entries in a single HTTP query, which could come handy if I want to do an incremental download and the last comment I've seen has scrolled off from the recent comments list page <URL: http://www.madore.org/cgi-bin/comment.pl/lscomments >.

There is no need for a separate "API". That concept is useful only on websites that are so heavy with client-side scripts that users can't figure out how to access them without such a separate simplified interface.

The only difficulty your website presents is that you have some hidden pages that aren't blog entries or comments but that are still worth to download. Many of the older ones are listed on the site map page <URL: http://www.madore.org/~david/sitemap.html >, but some are missing. The missing ones include the non-dire hydra game <URL: http://www.madore.org/~david/math/hydra0.xhtml >; the dialog that taught me that you can draw any countable ordinal, a lemma whose proof is easy enough but the statement itself is hard to guess <URL: http://www.madore.org/~david/misc/VIRUS/ordinals/ordinals.html >; the lecture notes of your formal languages course linked from <URL: http://www.madore.org/~david/weblog/d.2017-11-10.2477.html >; the 2010 ordinals text <URL: http://www.madore.org/~david/math/infinity.pdf >; the zoo of ordinals <URL: http://www.madore.org/~david/math/ordinal-zoo.pdf >; the 2010 hypercomputation text <URL: http://www.madore.org/~david/math/calculabilite.pdf >. Most of these pages are probably directly linked from a blog entry, so it should be possible to find them, but you should still add them to the site map for completeness.

And as for <URL: http://www.madore.org/~david/weblog/d.2003-09-17.0234.html#d.2003-09-17.0234 > the scanned Tarot cards, someone should just upload them to Wikimedia Commons, which is a good place to store such images, but hadn't yet existed when you published these.

Cigaes (2018-07-15T11:10:42Z)

Au tout début des filières S-ES-L, l'épreuve de français, au moins en S, proposait au choix : résumé-questions-rédaction sur un texte, commentaire composé d'un (autre) texte, dissertation. La rédaction du premier sujet était une mini-dissertation, il n'y avait pas de sujet d'invention.

Apparemment la forme a changé très rapidement. Je pensais que ça avait tenu plus longtemps comme ça. Et je ne sais pas quelle forme ça prenait pour le bac C, plus pertinent ici.

Bob (2018-07-15T08:50:31Z)

Il y avait vraiment un résumé au bac de français ? Tu ne confonds pas avec les épreuves des concours ?


You can post a comment using the following fields:
Name or nick (mandatory):
Web site URL (optional):
Email address (optional, will not appear):
Identifier phrase (optional, see below):
Attempt to remember the values above?
The comment itself (mandatory):

Optional message for moderator (hidden to others):

Spam protection: please enter below the following signs in reverse order: b2bc1b


Recent comments