<foo>
simply produces <foo>in the text).
<URL: http://somewhere.tld/ >
,
and it will be automatically made into a link.
(Do not try any other way or it might count as an attempt to spam.)mailto:
URI,
e.g. mailto:my.email@somewhere.tld
,
if you do not have a genuine Web site).
Ruxor (2005-01-21T20:20:20Z)
Disons en tout cas que tout est fait pour décourager l'utilisation de la Private Use Area (en gros, on nous dit, n'échangez jamais des données publiques avec des caractères dans la Private Use Area — on se demande à quoi elle sert si c'est pour ne pas qu'on échange des données dedans). Et ce n'est pas qu'une question de police, il faut aussi informer le système de la directionalité des caractères et autres propriétés Unicode les concernant. Enfin, c'est mieux que rien, certes.
Thomas Linard (2005-01-21T19:45:31Z)
Bonjour,
J'ai été invité par David à participer, excusez-moi de débarquer seulement maintenant…
> Oui, je sais bien que trouver des fontes du Tengwar ou du Cirth n'est pas trop difficile. Il y en a plein. Mais on ne peut pas en mettre dans une page Web, par exemple, parce que ce n'est pas dans Unicode.
Hum, pas tout à fait vrai :
http://www.evertype.com/standards/csur/
et une police implémentant cette proposition :
http://home.att.net/~jameskass/code2001.htm
Ruxor (2005-01-21T19:12:49Z)
Je ne l'ai pas, tout simplement. Je n'ai pas non plus la nouvelle traduction Bayard.
denis f (2005-01-21T18:24:34Z)
Au fait, tu ne mentionnes pas la traduction d'André Chouraqui ; tu ne l'aimes pas, ou tu la troves artificielle, ou quoi ?
Ruxor (2005-01-21T17:19:12Z)
Non.
pavel-florensky (2005-01-21T16:13:35Z)
tu ne trouves pas que la langue francaise se prete mal à la taduction des textes comme la Bible?
Ruxor (2005-01-21T16:04:38Z)
pavel-florensky → Le fait que ça ait été traduit d'énormément de façons en énormément de langues, justement, et que chaque mot ait été décortiqué à l'infini. Du coup, ça fait une source inépuisable de citations, de références, d'images classiques qui sous-tendent toute notre culture. Je trouve ça fascinant. Le contenu lui-même, en revanche, ne m'intéresse pas du tout.
pavel-florensky (2005-01-21T15:45:45Z)
Que t'attire dans La Bible et dans la Genèse plus précisement ???
David Latapie (2005-01-20T19:55:21Z)
Ruxor sur Thomas Linard >
Je lui ai envoyé un message. En attendant, tu peux lire sa prose.
<URL:http://www.macdigit.com/index.php/weblog/comments/tasman_le_survivant/>
<URL:http://www.macdigit.com/index.php/weblog/more/le_format_opentype_macdigit_thomas_linard_episode_2/>
<URL:http://www.macdigit.com/index.php/weblog/more/le_format_opentype_macdigit_thomas_linard_episode_1/>
phi (2005-01-19T22:48:12Z)
oui, oui… je suis bien d'accord mais je pensais en particulier à l'alphabet phonétique (encore plus mal fichu que UNICODE) où l'on triture les caractères et leur affecte un sens sans rapport avec le sens initial. je ne préconise quand même pas de définir la parenthèse fermante comme parenthèse ouvrante opposée, encore que ce serait bien pratique…
Ce qui n'est pas normal est que l'alphabet latin soit dupliqué 10 sinon 20 fois, en particulier dans la série des lettres de math. Certes, on peut vouloir distinguer le 'a' variable du 'a' de 'avoir' en italique mais alors pourquoi ne pas non plus le distinguer ausi de l'article indéfini anglais, du préfixe 'atto' (ou, en majuscules, du symbole de l'Ampère), etc.? Et pourquoi pas aussi distinguer les caractères italiques qui servent à citer un titre, puisque cela change le sens de base de la phrase (ce n'est pas simplement décoratif).
Même chose avec les exposants où ça devient absurde: ^n est un caractère spécial mais non ^p. Je ne veux pas faire du signe degré un 'o' en exposant, mais quand même!
Deux critères suffisants pour que deux caractères soient distincts :
- ils appartiennent à des séries (alphabets) inconciliables
- l'application d'un style (italique..) conduit à des glyphes inconciliables
et 'inconciliables' est assez subjectif.
Dans le cas précédent, il faudrait à la rigueur distinguer les lettres qui peuvent être mises en italiques, celles qui doivent l'être quel que soit le style, etc. Et même cela me semble davantage relever du style. De ce côté, les éditeurs de texte sont assez limités: on ne peut pas spécifier "non italiques même si le paragraphe est en italiques". Dans Word™, "italiques" est en fait "inverser le style italiques par rapport au style contenant".
Justement, pourquoi '™' n'est-il pas plutôt <exp>T<glue><exp>M? c'est là que l'exposant UNICODE se justifierait, à la rigueur, en tant qu'effet diacritique. Et encore car on ne distingue pas, *en tant qu'indices*, les indices variables (t indice la variable i) des indices relationnels (t indice i, température d'ignition). Et l'italique du 'i' du premier type relève-t-elle du style?
etc.
Ruxor (2005-01-19T19:52:32Z)
Unicode n'est pas censé être un répertoire de glyphes mais un répertoire de caractères. Si tu utilises un 'R' à l'envers et que c'est quand même un 'R', c'est un 'R', ce n'est pas un 'Я', par exemple — le fait d'être inversé doit être considéré comme une variation locale pas différente du fait d'être mis en gras ou dans une police bizarre ou en grand ou en petit ou en exposant ou que sais-je encore. De même, le 'O' (le O latin majuscule), le 'О' (le O cyrillique majuscule), le 'Ο' (le omicron majuscule), le 'Օ' (le O arménien majuscule) et quelques autres sont considérés comme des entités bien différentes parce que ce sont des caractères différents, alors que c'est le même glyphe (enfin, potentiellement). Évidemment, tout cela est obscurci par la difficulté à définir au juste ce qui est un caractère et ce qui n'en est pas, et par la nécessité de faire de la compatibilité avec des jeux de caractères pré-Unicode, mais c'est l'idée.
Ceci étant, je suis d'accord qu'Unicode a ses limitations. C'est mieux que rien (en tout cas, largement mieux que le bordel antérieur) mais ce n'est clairement pas parfait. L'ennui, c'est que, maintenant, toutes les pages Web doivent être écrites en Unicode (quel que soit l'encodage utilisé pour la représentation précise), donc exit toute possibilité de mettre des hiéroglyphes ou des tengwar ou autres caractères de ce genre. Dommage.
phi (2005-01-19T19:16:06Z)
ruxor -> je croyais que c'était une proposition non (encore) validée
d'ailleurs, je trouve que tu fais la part trop belle à UNICODE: il est sans doute moins mauvais que d'autres codages, mais il s'y trouve beaucoup de choses critiquables: caractères accentués (ou diacritiqués) gérés comme caractère unique ou double ou les deux sans qu'on sache trop pourquoi, formes variables menant à variation ici et dédoublement là, lettres graphiquement identiques tantôt unifiées tantôt distinguées, séquences de caractères incomplètes…
je comprends cela pour la page de base mais c'est vraiment mal fichu dans la suite.
Enfin, j'aurais apprécié qu'on inclue systématiquement des effets sur les caractères individuels: symétries, rotations, enlignements et autres diacritiques, superposition, soudure, ligature spéciale… tout cela pouvait être fait de façon générique en spécifiant mieux les glyphes.
Ruxor (2005-01-19T17:55:33Z)
Oui, je sais bien que trouver des fontes du Tengwar ou du Cirth n'est pas trop difficile. Il y en a plein. Mais on ne peut pas en mettre dans une page Web, par exemple, parce que ce n'est pas dans Unicode.
koxinga (2005-01-19T17:22:51Z)
il y a quand même ca : <URL:http://www.travelphrases.info/gallery/Fonts_Tengwar.html > pour les gens qui voudraient écrire en tengwar…
sinon le testris est pas mal. Un peu trop sobre mais l'idée est intéressante. Et après ca on dit que les jeux libres ne font pas le poids ;)
Ruxor (2005-01-19T16:15:14Z)
xilun → En fait, je mets plutôt le -O6 pour que tous les warnings du -Wall soient bien générés (les variables non initialisées, par exemple, il ne les détecte pas en -O0). Le nombre 6 est complètement arbitraire. Par ailleurs, la doc de gcc se contredit sur la question de savoir si -O implique -fomit-frame-pointer (un passage dit que oui, un passage dit que oui seulement sur certaines architectures où ça ne gêne pas le debugging, et un passage ne dit rien).
David → Je veux bien qu'on me présente un autre fan d'Unicode, oui. :-)
phi → Comme je disais, normalement personne ne peut visualiser le truc en ancien hébreu, vu que ça ne fait pas encore partie d'Unicode. Ceci dit, écrire une police phénicienne, ce n'est vraiment pas difficile (à la limite, le plus problématique c'est qu'on n'a pas, a priori, les propriétés Unicode qui disent que ces caractères s'écrivent de droite à gauche).
phi (2005-01-19T15:00:07Z)
heu, ya qqn qui parvient à visualiser le "Original (Ancient Hebrew) " ?
sinon, je note "face de la terre"… eske la version originale, plus proche sans doute de la véritable Parole divine, tient compte de la sphéricité de la Terre?
Ardamon (2005-01-19T12:51:12Z)
Est-ce que je suis vraiment vraiment parano ou est-ce que quand on reçoit enfin la barre, il n'y a pas moyen de la placer au bon endroit (ou peut-être qu'on est tellement énervé d'avoir attendu si longtemps qu'il n'y a pas moyen de la gérer)
David Latapie (2005-01-19T01:30:43Z)
Depuis le temps que j'entends parler de Tetris anti-optimisé…
David, tu est vraiment un vicieux pour Unicode. Va falloir que je te présente Thomas Linard :-)
xilun qui est un psyco en ce qui concerne les options de compilation (2005-01-19T01:08:05Z)
Tu compiles avec
gcc -Wall -O6 -std=c99 -pedantic -W -Wwrite-strings -Wcast-qual -Wpointer-arith -Wstrict-prototypes -Wno-unused pentris.c -o pentris `pkg-config --cflags gtk+-2.0` `pkg-config --libs gtk+-2.0`
-O6 indique la volonté d'optimiser à fond (bien que gcc ne monte qu'en O3), et implique une grande difficulté de débuggage, de toute façon ici -g n'est pas spécifié
Or -fomit-frame-pointer n'est pas indiqué. C'est une option ne dépendant pas du processeur mais très utile dans le cas de processeurs ayant un faible nombre de registres généraux (petit exemple au "pif" : IA32 :), car elle libère un registre qui est utilisé quand on ne spécifie pas l'option pour simplifier les calculs d'adresses des variables et paramètres sur la pile.
Je recommande donc d'utiliser -fomit-frame-pointer si -O x est spécifié et que -g n'est pas spécifié.
Dans un autre domaine -s permet de réduire la taille de l'executable en retirant les informations de symboles.
Ruxor (2005-01-19T00:31:00Z)
Oui, bien sûr, c'est plus emmerdant si la pièce suivante est tirée au dernier moment (ce comportement s'obtient en compilant mon programme avec -DADVERTIZE_NEXT=0 — ce qui modifie l'évaluateur en conséquence), mais c'est de la triche. Le but est de faire quelque chose qui se comporte comme un Tétris où on n'a pas de chance.
Diminuer STATS_PENALTY (par exemple compiler avec -DSTATS_PENALTY=1 voire -DSTATS_PENALTY=0) le rend encore plus méchant, d'ailleurs (car en l'état il s'efforce de maintenir un certain équilibre entre le nombre de formes de chaque sorte qu'il fait tomber).
jko (2005-01-19T00:23:20Z)
mon score: 41, qui dit mieux ?
est ce qu'on ne pourrait pas faire encore plus emmerdant en décidant de la pièce suivante uniquement après que celle qu'on joue soit posée ?
Ruxor (2005-01-18T23:53:57Z)
J'ai un copain qui a programmé un Contris, qui ne te donne que des carrés 2×2… dans un terrain de largeur impaire.
Ghalys qui lui aussi a programmé un Tétris (2005-01-18T23:48:41Z)
Puisque tu l'as programmé, tu peux aussi faire un tetris qui ne donne que des barres, ou plus rusé un tétris qui donne deux fois plus de barre qu'un tétris normal.
Ruxor (2005-01-18T23:27:08Z)
Ben oui, c'est bien ce que je dis : tout le monde a cette impression, et l'avantage de Testris, c'est que, pour changer, ce n'est pas qu'une impression.
zazie (2005-01-18T22:59:48Z)
Mais ?! Tetris ne nous emmerde pas normalement ?
C'est encore un effet de ma psychologie débloquée, ça, alors… j'ai toujours l'impression que ce messant refuse de me donner les barres juste quand j'ai besoin :-)